RU2571405C1 - Method for preliminary conversion of structured data array - Google Patents

Method for preliminary conversion of structured data array Download PDF

Info

Publication number
RU2571405C1
RU2571405C1 RU2014126197/08A RU2014126197A RU2571405C1 RU 2571405 C1 RU2571405 C1 RU 2571405C1 RU 2014126197/08 A RU2014126197/08 A RU 2014126197/08A RU 2014126197 A RU2014126197 A RU 2014126197A RU 2571405 C1 RU2571405 C1 RU 2571405C1
Authority
RU
Russia
Prior art keywords
logical
data structure
elements
semantic
sections
Prior art date
Application number
RU2014126197/08A
Other languages
Russian (ru)
Inventor
Игорь Петрович Рогачев
Original Assignee
Игорь Петрович Рогачев
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Игорь Петрович Рогачев filed Critical Игорь Петрович Рогачев
Priority to RU2014126197/08A priority Critical patent/RU2571405C1/en
Priority to PCT/RU2015/000392 priority patent/WO2015199581A2/en
Priority to EA201700031A priority patent/EA201700031A1/en
Application granted granted Critical
Publication of RU2571405C1 publication Critical patent/RU2571405C1/en

Links

Images

Abstract

FIELD: information technologies.
SUBSTANCE: in the method of conversion of a structured data array they generate initial structure of data of the initial data array. Context terms are identified in initial elements, and the data base of context terms is formed. Using information contained in the generated data base, in the initial data structure they identify structural-complex language structures, containing context terms, structural-complex language structures, not containing context terms, structural-simple language structures, containing context terms, and structural-simple language structures, not containing context terms. Conversions of language structures are performed, and the final data structure of the structured initial data array is formed.
EFFECT: increased accuracy and speed of navigation by elements of data array due to provision of preliminary conversion of a structured data array and further generation of logically, grammatically and orthographically correct data structure.
19 cl, 19 dwg, 6 tbl

Description

Группа изобретений относится к решениям в области обработки массивов данных, в частности, к решениям в области обработки структурированных массивов данных, содержащих текст на естественном языке, и может быть использовано для предварительного преобразования структурированного массива данных, содержащего текст на естественном языке, для удобства его последующей обработки.The group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of processing structured data arrays containing natural language text, and can be used for preliminary conversion of a structured data array containing natural language text, for the convenience of its subsequent processing.

УРОВЕНЬ ТЕХНИКИBACKGROUND

Из патента ЕА 002016 B1, G06F 17/30, 22.10.2001 (МАТВЕЕВ ЛЕВ ЛАЗАРЕВИЧ И ДР.) известен способ поиска похожих по текстовому и/или смысловому содержимому фрагментов в электронных документах, хранимых на устройствах хранения данных, заключающийся в индексировании каждого сохраняемого в архиве документа, разбиении упомянутых документов на фрагменты и формировании тематик из одного и более фрагмента, определении параметров поиска, проведении поиска, ранжировании полученного в результате поиска списка фрагментов документов, причем в качестве параметров поиска определяют множество входящих в выбранный фрагмент документа уникальных блоков информации, и расширяют его посредством предварительной обработки каждого из упомянутых уникальных блоков информации, где под уникальным блоком информации понимают блок информации, встретившийся в выбранном фрагменте документа один и более раз, где в качестве предварительной обработки используют операцию получения, по меньшей мере, из одного уникального блока информации, одного или нескольких блоков информации, связанных с уникальным блоком информации заданным соотношением.From patent EA 002016 B1, G06F 17/30, 10.22.2001 (MATVEEV LEV LAZAREVICH AND OTHERS) a method is known for searching for fragments similar in text and / or semantic content in electronic documents stored on data storage devices, which consists in indexing each stored in document archive, dividing the mentioned documents into fragments and forming topics from one or more fragments, determining search parameters, conducting a search, ranking the list of document fragments obtained as a result of a search, moreover, as parameters claims are determined by the set of unique blocks of information included in the selected fragment of the document, and are expanded by preliminary processing of each of the mentioned unique blocks of information, where a unique block of information means the block of information that occurs one or more times in the selected fragment of the document, where they are used as preliminary processing the operation of obtaining at least one unique block of information, one or more blocks of information associated with a unique block of information tion by a given ratio.

Из патента RU 2476927 С2, G06F 17/30, 27.02.2013 (АНШУКОВ СЕРГЕЙ АЛЕКСАНДРОВИЧ И ДР.) известен способ позиционирования текстов в пространстве знаний, заключающийся в том, что из входных данных выделяют элементы, соответствующие паттернам, входящим в таксоны, образующие таксономии, объединенные в онтологии; определяют значимые таксоны, которые взвешивают с учетом условий, приписанных паттернам; составляют набор взвешенных векторов, позиционирующих входной документ в пространстве знаний, отличающийся тем, что в нем для позиционирования используют множество онтологии, а также тем, что при составлении наборов векторов рассматривают только те элементы, которые соответствуют паттернам, входящим в один таксой или в таксоны, имеющие общие родительские таксоны.From patent RU 2476927 C2, G06F 17/30, 02.27.2013 (ANSHUKOV SERGEY ALEXANDROVICH AND OTHERS), a method for positioning texts in the knowledge space is known, which consists in distinguishing elements from the input data that correspond to patterns that are included in taxa forming taxonomies combined in ontology; significant taxa are determined that are weighted based on the conditions assigned to the patterns; make up a set of weighted vectors that position the input document in the knowledge space, characterized in that it uses a lot of ontologies for positioning, and also in that when compiling sets of vectors, only those elements that correspond to patterns included in one tax or in taxa are considered, having common parent taxa.

Из патента RU 2210809 С2, G06F 17/28, 20.08.2003 (ОТКРЫТОЕ АКЦИОНЕРНОЕ ОБЩЕСТВО «МОСКОВСКАЯ ТЕЛЕКОММУНИКАЦИОННАЯ КОРПОРАЦИЯ») известен способ автоматического преобразования исходного текста в совокупность взаимосвязанных объектов на основе таблицы настроек, содержащей знания о структуре исследуемой системы в виде совокупности образующих ее классов, включающих определенный набор атрибутов (в том числе взаимосвязи и отношения между объектами заданных классов) и установленные для каждого атрибута правила распознавания атрибута в тексте. Предусматривается возможность определения формата исходного текста и автоматического перевода его фрагментов в ходе формирования объектов.From patent RU 2210809 C2, G06F 17/28, 08/20/2003 (OPEN JOINT-STOCK COMPANY “MOSCOW TELECOMMUNICATION CORPORATION”), a method is known for automatically converting the source text into a set of interconnected objects based on a settings table containing knowledge about the structure of the system under study in the form of the set forming it classes that include a specific set of attributes (including relationships and relationships between objects of given classes) and rules for recognizing an attribute in the text established for each attribute. It is possible to determine the format of the source text and automatically translate its fragments during the formation of objects.

Из патента RU 2292078 С1, G06F 17/30, 20.01.2007 (ЗАКРЫТОЕ АКЦИОНЕРНОЕ ОБЩЕСТВО «МЕДИАЛИНГВА») известен способ поиска, разметки и отображения информации, включающий ввод искомых объектов данных исходных электронных документов, подлежащих поиску по информационным сетям с терминала абонента сети, осуществляющего функцию источника запроса искомых объектов данных, сравнение искомых объектов данных исходных электронных документов с контрольными объектами данных ассоциированной информации в информационной сети, а при совпадении искомых объектов с контрольными преобразование объектов данных исходных электронных документов посредством разметки объектов данных исходных электронных документов гиперссылками, визуализацию на терминале абонента сети электронных документов с гиперссылками и вызов на терминал абонента сети данных ассоциированной информации информационной сети, отличающийся тем, что перед разметкой создают, по меньшей мере, две области данных, по меньшей мере, одна из которых является резидентной областью для источника запроса искомых объектов данных и обеспечивает привязку к объектам данных первичных гиперссылок, содержащих дополнительные параметры, для адресации, по меньшей мере, к одной другой области, а, по меньшей мере, одна другая область является нерезидентной для источника запроса искомых объектов данных и обеспечивает привязку к объектам данных вторичных гиперссылок для адресации, по меньшей мере, к одному ресурсу данных ассоциированной информации для доступа к ней с терминалов абонентов, по меньшей мере, одной резидентной области являющейся источником первичной гиперссылки, при этом в резидентной области создают массив контрольных объектов данных с соответствующими каждому указанному объекту первичными гиперссылками в качестве связанных данных, а в нерезидентной области создают массив контрольных объектов данных ассоциированной информации с соответствующей каждому указанному объекту, по меньшей мере, одной вторичной гиперссылкой в качестве связанных данных ассоциированной информации информационной сети.From patent RU 2292078 C1, G06F 17/30, 20.01.2007 (MEDIA LINGUA CLOSED JOINT-STOCK COMPANY), a method for searching, marking and displaying information is known, including entering the desired data objects of the source electronic documents to be searched on information networks from a network subscriber terminal, performing the function of the request source of the desired data objects, comparing the desired data objects of the source electronic documents with the control data objects of the associated information in the information network, and if the desired objects coincide with the control transformation of data objects of source electronic documents by marking data objects with hyperlinks, visualization of electronic documents with hyperlinks at the subscriber terminal of the network and calling to the subscriber terminal of the data network of associated information of the information network, characterized in that at least two are created before marking data areas, at least one of which is a resident area for the request source of the desired data objects and provides access to data objects of primary hyperlinks containing additional parameters for addressing at least one other region, and at least one other region is non-resident for the query source of the desired data objects and provides binding to data objects of secondary hyperlinks for addressing at least one data resource of associated information for access to it from subscriber terminals of at least one resident area that is the source of the primary hyperlink, while in the res In this area, an array of control data objects is created with primary hyperlinks corresponding to each specified object as related data, and in a non-resident area, an array of control data objects of associated information is created with at least one secondary hyperlink corresponding to each specified object as information associated information network.

Из патента RU 2386166 С2, G06F 17/30, 10.04.2010 (ОТКРЫТОЕ АКЦИОНЕРНОЕ ОБЩЕСТВО ТАГАНРОГСКИЙ АВИАЦИОННЫЙ НАУЧНО-ТЕХНИЧЕСКИЙ КОМПЛЕКС ИМ. Г.М. БЕРИЕВА) известен способ формирования базы знаний, которую формируют в виде трехмерного информационного пространства, в котором данные о документе или его части определяют в кластер или кластеры, образованные единичными отрезками (ортами) характеристических признаков. Полный идентификационный номер документа формируют из кодов орт составляющих характеристических признаков и идентификационного номера документа. Производят анализ каждого кластера на полноту определения ограниченной им сферы деятельности содержащимися в кластере документами. Результат анализа заносят в этот же кластер. Поиск и анализ данных производят как с помощью формирования и обработки запроса, так и в обратном направлении с помощью подготовки базы данных для ожидаемого пользователя. В системе также предусмотрены средства для работы с базой данных, для поиска, контроля и анализа информации, документов, областей деятельности, для создания и корректировки документов системными администраторами, экспертами и пользователями в соответствии с правами доступа.From patent RU 2386166 C2, G06F 17/30, 04/10/2010 (OPEN JOINT STOCK COMPANY TAGANROG AVIATION SCIENTIFIC AND TECHNICAL COMPLEX NAMED AFTER G.M. BERIEV), a method for generating a knowledge base is known which is formed in the form of a three-dimensional information space in which data about a document or its parts are defined in a cluster or clusters formed by single segments (orts) of characteristic features. The full identification number of the document is formed from the codes orth component characteristic features and the identification number of the document. Each cluster is analyzed for the completeness of the definition of the limited scope of activity contained in the documents contained in the cluster. The result of the analysis is recorded in the same cluster. Search and analysis of data is carried out both by means of the formation and processing of the request, and in the opposite direction by preparing the database for the expected user. The system also provides tools for working with the database, for searching, controlling and analyzing information, documents, areas of activity, for creating and updating documents by system administrators, experts and users in accordance with access rights.

Из патента RU 2253893 С2, G06F 17/27, 10.06.2005 (ЧЕРНИКОВ БОРИС ВАСИЛЬЕВИЧ) известен способ автоматизированного лексикологического синтеза документов, включающий создание и сохранение унифицированной формы документа, классификацию содержания документа путем выделения унифицированной постоянной информации и переменной информации, сохранения постоянной информации в базах данных, внесения постоянной информации в унифицированную форму документа и введения переменной информации в документ, при котором в переменной информации выделяют переменную унифицированную информацию, связанную с устойчивыми формулировками, переменную вводимую информацию, представляющую собой конкретизирующие сведения, и переменную неунифицированную информацию, содержащую свободные формулировки, причем переменную унифицированную информацию выделяют путем формирования совокупности опорных слов, однозначно определяющих конкретные формулировки в документе и составляющих лексикологический скелет документа, и сохраняют в машинной базе данных с избытком по отношению к отдельно взятому экземпляру документа, формируют лексикологическое дерево документа путем определения взаимозависимости отдельных опорных слов и затем формируют информационный контур управления документом путем установления способа внедрения формулировок переменной унифицированной и неунифицированной информации в зависимости от характера связи опорного слова с фрагментом документа.From patent RU 2253893 C2, G06F 17/27, 06/10/2005 (CHERNIKOV BORIS VASILIEVICH) a method for automated lexicological synthesis of documents is known, including the creation and preservation of a unified form of a document, classification of the contents of a document by highlighting unified constant information and variable information, storing constant information in databases, entering constant information into a unified form of the document and introducing variable information into the document, in which the variable un fictitious information associated with stable formulations, variable input information representing concretizing information, and variable non-standardized information containing free formulations, the variable unified information being distinguished by forming a set of support words that uniquely identify specific formulations in the document and constitute the lexicological skeleton of the document, and save the document in excess with respect to a single copy in a machine database a, the lexicological tree of the document is formed by determining the interdependence of the individual supporting words and then the information management loop of the document is formed by establishing a method for introducing formulations of the variable of unified and unified information depending on the nature of the relationship between the supporting word and the document fragment.

Из заявки WO 2013043160 A1, G06F 17/21, 28.03.2013 (HEWLETT PACKARD DEVELOPMENT CO ET AL.) известен способ обработки текстового массива данных, который заключается в построении графа, представляющему микромодель сущностей, образующих тело обрабатываемого документа. Разбиение такого текста на узлы графа, причем каждый узел относится к своей особенности выделенного фрагмента из текста, причем упомянутые узлы графа связываются между собой отношениями, аналогично связи фрагментов текста, соответствующего упомянутым узлам. В дальнейшем выстроенные узлы графа ранжируются для определения релевантных данных относительно запроса пользователя.From WO 2013043160 A1, G06F 17/21, 03/28/2013 (HEWLETT PACKARD DEVELOPMENT CO ET AL.), A method for processing a text data array is known, which consists in constructing a graph representing a micromodel of entities that form the body of the processed document. The division of such text into nodes of the graph, with each node referring to its own particulars of the selected fragment from the text, and the said nodes of the graph are interconnected by relations, similar to the connection of fragments of text corresponding to the said nodes. Subsequently, the constructed nodes of the graph are ranked to determine the relevant data regarding the user's request.

Из заявки WO 2001001289 A1, G06F 17/27, 04.01.2001 (INV MACHINE CORP INC) известен способ, который заключается в семантической обработке данных, представленных на естественном языке, причем способ включает ввод и хранение пользовательских условий, которые в дальнейшем используются для поиска в массивах данных, содержащих данные на естественном языке, представлений текста, содержащих релевантную пользовательскому вводу информацию, форматирование упомянутых представлений, извлечение из отформатированных представлений текста отношений типа субъект-действие-объект (СДО) и их сохранение в удаленном месте хранения, например, базе данных, реструктуризация выявленных СДО в нормализованный вид, назначение частей СДО, таких как действие-объект (ДО) в качестве наименования папок, в которых содержаться части СДО и назначение с указанными папками одного или более идентичных ассоциированных частей субъекта (S1, S2 … Sn), которые ассоциированы с соответствующими ДО частями. Способ позволяет также ассоциировать предложения, содержащие соответствующие элементы субъектов S1, S2 … Sn, и выделять в них релевантные СДО с их последующей маркировкой на фоне общего массива данных.From the application WO 2001001289 A1, G06F 17/27, 01/04/2001 (INV MACHINE CORP INC) a method is known which consists in semantic processing of data presented in a natural language, the method including entering and storing user conditions, which are then used for searching in data arrays containing natural language data, text representations containing information relevant to user input, formatting the aforementioned representations, extracting subject-action-object relationships from formatted text representations CT (LMS) and their storage in a remote storage location, for example, a database, restructuring the identified LMS into a normalized form, assigning parts of the LMS, such as an action-object (BO), as the name of the folders that contain parts of the LMS and the destination with the indicated folders of one or more identical associated parts of the subject (S1, S2 ... Sn), which are associated with the corresponding TO parts. The method also allows you to associate sentences containing the corresponding elements of the subjects S1, S2 ... Sn, and select relevant SDOs in them with their subsequent labeling against the background of a common data array.

Из патента US 8229730 В2, G06F 17/30, 24.07.2012 (MICROSOFT CORP ET AL.) известен способ поиска данных по запросу пользователя, представленного на естественном языке, причем способ заключается в том, что производят парсинг текстового массива данных с назначением грамматических ролей терминам и их последующей индексацией, которые находятся в семантической связи с терминами поискового запроса, причем упомянутые роли содержат доминантную и второстепенные роли, которые выявляются при анализе пользовательского запроса. Данный способ позволяет определять релевантные части документа, содержащие термины с ролями, совпадающими с ролями текста запроса пользователя.From the patent US 8229730 B2, G06F 17/30, 24.07.2012 (MICROSOFT CORP ET AL.) A method is known for searching data at the request of a user presented in natural language, the method being that the text data array is parsed with assignment of grammatical roles terms and their subsequent indexation, which are in semantic connection with the terms of the search query, and the mentioned roles contain dominant and secondary roles that are identified in the analysis of the user query. This method allows you to determine the relevant parts of the document containing terms with roles that match the roles of the text of the user’s request.

Из заявки ЕР 2400400 A1, G06F 17/27, 28.12.2011 (INBENTA PROFESSIONAL SERVICES S L) известен способ семантического поиска релевантной информации, заключающийся в том, что с помощью лексических функций и критерия значения текста в массиве данных, представленных на естественном языке, формируют фразы или выражения, полученные из базы данных содержания, и выбирают ответ, обладающий нависшим показателем семантического соответствия, причем способ заключается в трансформации контентов и запроса самостоятельных слов или групп слов с присвоенными им токенами, которые преобразовываются в семантические представления, тем самым применяя правила критерия значения текста посредством лексических функций, причем каждое из таких семантических представлений состоит из леммы и семантической категории.From the application EP 2400400 A1, G06F 17/27, 12.28.2011 (INBENTA PROFESSIONAL SERVICES SL), a method for semantic search for relevant information is known, which consists in the fact that using lexical functions and a criterion, the values of the text in the data array presented in natural language are formed phrases or expressions obtained from the content database, and select an answer that has an impending indicator of semantic correspondence, and the method consists in transforming the content and requesting independent words or groups of words with the tokens assigned to them that prevail azovyvayutsya in semantic representations, thereby applying the rules of the meaning of the text by means of the criterion of lexical functions, each of these semantic representations consists of a lemma and a semantic category.

Из заявки WO 2010105216 А2, G06F 17/20, 16.09.2010 (INVENTION MACHINE CORP) известен способ маркировки текстовых данных документа, заключающийся в том, что осуществляют лингвистический анализ документа, сравнивают документ после его анализа с шаблоном требуемых семантических отношений между объектами, формируют семантически размеченный текст с помощью применения семантических связей основанный на лингвистическом анализе текста и сравнения с шаблоном семантических связей, причем семантические метки ассоциированы со словами или фразами предложений текста, и идентифицируют компоненты определенных семантических отношений с последующим сохранением в базе данных семантически размеченного текста для последующего поиска релевантной информации по полученной структуре данных.From the application WO 2010105216 A2, G06F 17/20, 09/16/2010 (INVENTION MACHINE CORP), a method for marking text data of a document is known, which consists in linguistically analyzing a document, comparing the document after its analysis with a template of the required semantic relations between objects, forming semantically marked-up text using semantic links based on linguistic analysis of the text and comparison with the template of semantic links, with semantic labels associated with words or phrases of text sentences, and ide components of certain semantic relations are identified, with the subsequent storage of semantically marked-up text in the database for the subsequent search for relevant information on the obtained data structure.

Из заявки ЕР 2105847 A1, G06F 17/30, 30.09.2009 (ALCATEL LUCENT) известен способ автоматического формирования онтологии, заключающийся в том, что принимают термин, для которого необходимо сформировать онтологию, определяют значение упомянутого термина с помощью словаря, извлекают подходящие определения для упомянутого термина, определяют значение каждого из извлеченных определений с помощью упомянутого словаря, выполняют построение для каждого из определенных значений термина и каждого подходящего термина для термина начального запроса на создание онтологии, по меньшей мере, один логический пункт, описывающий взаимоотношение между парой упомянутых подходящих терминов, причем упомянутые логические пункты определяют онтологию термина ввода.From the application EP 2105847 A1, G06F 17/30, 09/30/2009 (ALCATEL LUCENT), a method for automatically generating an ontology is known, which consists in accepting a term for which it is necessary to form an ontology, determining the meaning of the term using a dictionary, and extracting suitable definitions for the said term, determine the meaning of each of the extracted definitions using the aforementioned dictionary, build for each of the defined meanings of the term and each suitable term for the term of the initial ontol creation request ogy, at least one logical paragraph describing the relationship between said pair of suitable terms, said logic input points define the ontology term.

Все указанные выше решения не позволяют формировать семантически и логически верно структурированный массив данных из исходного массива данных, содержащего текст, представленный на естественном языке, путем разбиения упомянутого массива на логические разделы, которые подвергаются семантическому разбиению конструкций самих разделов и элементов, входящих в упомянутые разделы, последующий их орфографический и грамматический анализ, и последующую оценку их взаимосвязанности в исходном массиве данных.All of the above solutions do not allow the formation of a semantically and logically correctly structured data array from the original data array containing text presented in natural language by splitting the said array into logical sections, which are subjected to semantic decomposition of the structures of the sections themselves and the elements included in the sections mentioned, their subsequent spelling and grammatical analysis, and the subsequent assessment of their interconnectedness in the original data array.

Ближайшим аналогом (прототипом) заявленного решения принят способ автоматизированной обработки текста на естественном языке путем его семантической индексации, описанный в патенте RU 2399959 С2, G09B 19/00, 20.09.2010 (ЗАКРЫТОЕ АКЦИОНЕРНОЕ ОБЩЕСТВО «АВИКОМП СЕРВИСЕЗ»). Известный способ представляет собой способ, при котором текст сегментируют в электронной форме на элементарные единицы, выявляют устойчивые словосочетания, формируют предложения, выявляют семантически значимые объекты и семантически значимые отношения между ними, формируют для каждого семантически значимого отношения множество триад, в которых единственная триада первого типа соответствует связи, устанавливаемой семантически значимым отношением между двумя семантически значимыми объектами, причем каждая из триад второго типа соответствует значению конкретного атрибута одного из этих семантически значимых объектов, каждая из триад третьего типа соответствует значению конкретного атрибута самого семантически значимого отношения, индексируют на множестве сформированных триад все связанные семантически значимыми отношениями семантически значимые объекты по отдельности, запоминают в базе данных сформированные триады и полученные индексы вместе со ссылкой на исходный текст, из которого сформированы эти триады.The closest analogue (prototype) of the claimed solution is a method for automated processing of natural language text by means of its semantic indexing, described in patent RU 2399959 C2, G09B 19/00, 09/20/2010 (CLOSED JOINT STOCK COMPANY "AVIKOMP SERVISES"). The known method is a method in which text is segmented in electronic form into elementary units, identifies stable phrases, form sentences, identifies semantically significant objects and semantically significant relationships between them, form many triads for each semantically significant relationship, in which a single triad of the first type corresponds to a relationship established by a semantically significant relationship between two semantically significant objects, each of the triads of the second type of co corresponds to the value of a specific attribute of one of these semantically significant objects, each of the triads of the third type corresponds to the value of a specific attribute of the semantically significant relation, index all related semantically meaningful relations separately from the set of triads, store the generated triads and obtained indices in the database together with a link to the source text from which these triads are formed.

Недостатком данного способа является то, что при формировании упомянутых триад, текст сегментируется непосредственно на элементарные единицы, т.е. слова, а не на логические разделы, при этом данный способ не предусматривает формирования промежуточной структуры исходного текстового массива для ее последующего грамматического и орфографического анализа и не обеспечивает формирование конечной логически, грамматически и орфографически верной структуры данных, пригодной для быстрой и удобной навигации по элементам структуры.The disadvantage of this method is that when forming the mentioned triads, the text is segmented directly into elementary units, i.e. words, and not into logical sections, while this method does not provide for the formation of an intermediate structure of the original text array for its subsequent grammatical and spelling analysis and does not provide the formation of a final logical, grammatical and spelling correct data structure suitable for quick and convenient navigation through structure elements .

РАСКРЫТИЕ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION

Исходя из этого, задачей, на решение которой направлено заявленное изобретение, является обеспечение такой предварительной обработки структурированного массива данных, содержащего текст на естественном языке, которая позволяла бы в дальнейшем осуществлять последующие преобразования и генерировать логически, грамматически и орфографически верную результирующую структуру, содержащую логические конструкции элементов массива и обеспечивающую быструю и удобную навигацию по элементам массива.Based on this, the task to which the claimed invention is directed is to provide such preliminary processing of a structured data array containing natural language text that would allow further transformations to be carried out and generate a logical, grammatical and spelling correct resulting structure containing logical constructions array elements and provides quick and convenient navigation through array elements.

Техническим результатом является обеспечение предварительного преобразования структурированного массива данных, пригодного для дальнейшего формирования логически, грамматически и орфографически верной структуры данных.The technical result is the preliminary conversion of a structured data array suitable for the further formation of a logical, grammatically and spelling-correct data structure.

Заявленный технический результат достигается за счет того, что выполняют способ преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, причем упомянутый способ содержит, по меньшей мере, этапы, на которых:The claimed technical result is achieved due to the fact that they perform a method of converting a structured source data array containing at least natural language text, said method comprising at least the steps of:

А) формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой:A) form the initial data structure of a structured source data array containing the source elements of the original data structure, and the said source elements are:

структурно-сложные языковые конструкции, представляющие собой структурно-сложные языковые конструкции, содержащие контекстные термины и структурно-сложные языковые конструкции, не содержащие контекстные термины; иstructurally complex linguistic constructions, which are structurally complex linguistic constructions containing contextual terms and structurally complex linguistic constructions that do not contain contextual terms; and

структурно-простые языковые конструкции, представляющие собой структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;structurally simple language constructs, which are structurally simple language constructs containing contextual terms, and structurally simple language constructs that do not contain contextual terms;

Б) идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины;B) identify context terms in said source elements and form a database of context terms containing said identified context terms;

В) используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;C) using the information contained in said generated database of contextual terms, structurally complex linguistic constructs containing contextual terms, structurally complex linguistic constructs not containing contextual terms, structurally simple linguistic constructs containing contextual terms are identified in said initial data structure , and structurally simple language constructs that do not contain contextual terms;

Г) осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;D) carry out the conversion of the first type on the above-mentioned structurally complex language constructs that do not contain contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;

Д) осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the second type over the mentioned structurally simple language constructs containing contextual terms, to obtain grammatically and spelling correct structurally simple language constructs that do not contain contextual terms;

Е) осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the third type over the above-mentioned structurally complex language constructs containing contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;

Ж) формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины.G) form the final data structure of the structured initial data array containing the elements of the final data structure, and the elements of the final data structure are structurally simple language constructs that do not contain contextual terms and obtained grammatically and spelling structurally correct due to transformations of the first, second and third types -simple language constructs that do not contain contextual terms.

Варианты осуществления настоящего изобретения относятся к, способу, устройству, системе и машиночитаемому носителю для обеспечения эффективного преобразования структурированного массива данных, содержащего, по меньшей мере, текст на естественном языке.Embodiments of the present invention relate to a method, apparatus, system, and computer-readable medium for efficiently converting a structured data array containing at least natural language text.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

Иллюстративные варианты осуществления настоящего изобретения описываются далее подробно со ссылкой на прилагаемые чертежи, которые включены в данный документ посредством ссылки, и на которых:Illustrative embodiments of the present invention are described below in detail with reference to the accompanying drawings, which are incorporated herein by reference, and in which:

На фиг. 1 изображена общая схема выполнения этапов заявленного способа преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, в соответствии с первым вариантом осуществления настоящего изобретения.In FIG. 1 depicts a general flowchart of the inventive method for converting a structured source data array containing at least natural language text in accordance with a first embodiment of the present invention.

На фиг. 2 изображена общая схема выполнения этапов заявленного способа преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, в соответствии с третьим вариантом осуществления настоящего изобретения.In FIG. 2 depicts a general flowchart for the steps of the claimed method for converting a structured source data array containing at least natural language text in accordance with a third embodiment of the present invention.

На фиг. 3 изображена общая схема этапа формирования первой структуры данных.In FIG. 3 shows a general diagram of the step of generating the first data structure.

На фиг. 4 изображена общая структура исходной структуры данных, из которой сформирована первая структура данных.In FIG. 4 shows the general structure of the original data structure from which the first data structure is formed.

На фиг. 5 изображена общая схема этапа формирования базы данных логических связей логических разделов.In FIG. 5 shows a general diagram of the stage of forming a database of logical connections of logical partitions.

На фиг. 6 изображен общий принцип формирования базы данных логических связей логических разделов.In FIG. 6 shows the general principle of forming a database of logical connections of logical partitions.

На фиг. 7 изображена общая схема этапа формирования второй структуры данных.In FIG. 7 shows a general diagram of a step for generating a second data structure.

На фиг. 8 изображена общая структура второй структуры данных.In FIG. 8 shows the general structure of a second data structure.

На фиг. 9 изображена общая схема этапа формирования базы данных семантических частей.In FIG. 9 shows the general scheme of the stage of formation of the database of semantic parts.

На фиг. 10 изображен общий принцип формирования базы данных семантических частей.In FIG. 10 depicts the general principle of forming a database of semantic parts.

На фиг. 11 изображена общая схема этапа формирования грамматически и орфографически верных семантических частей.In FIG. 11 shows a general diagram of the stage of formation of grammatically and spelling-correct semantic parts.

На фиг. 12 изображена общая схема второй структуры данных, полученной после выполнения этапа формирования грамматически и орфографически верных семантических частей.In FIG. 12 shows a general diagram of a second data structure obtained after the step of forming grammatically and spelling-correct semantic parts.

На фиг. 13 изображена общая схема этапа формирования результирующей структуры данных.In FIG. 13 shows a general diagram of the step of generating the resulting data structure.

На фиг. 14 изображена общая схема результирующей структуры данных.In FIG. 14 shows a general diagram of the resulting data structure.

На фиг. 15 изображена общая структура элементов результирующей структуры данных.In FIG. 15 shows the general structure of the elements of the resulting data structure.

На фиг. 16 изображена общая схема выполнения этапов заявленного способа формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных.In FIG. 16 depicts a general flowchart of the steps of the claimed method of forming a map of links of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array.

На фиг. 17-18 изображена общая схема выполнения этапов заявленного способа поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций.In FIG. 17-18 depict a general diagram of the steps of the claimed method for searching for relevant information in a transformed structured source data array containing at least logical constructions containing grammatically and spelling-correct semantic parts of logical sections of logical constructions.

На фиг. 19 изображена общая схема системы, содержащей устройство, предназначенной для реализации заявленных способов преобразования структурированного исходного массива данных, способов формирования карты связей компонентов преобразованного структурированного исходного массива данных и способов поиска релевантной информации в преобразованном структурированном исходном массиве данных.In FIG. 19 shows a general diagram of a system containing a device for implementing the claimed methods for converting a structured source data array, methods for generating a map of the components of a transformed structured source data array, and methods for finding relevant information in a converted structured source data array.

ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯMODES FOR CARRYING OUT THE INVENTION

Далее приводятся варианты осуществления настоящего изобретения, раскрывающие примеры его реализации в частных исполнениях. Тем не менее, само описание не предназначено для ограничения объема прав, предоставляемых данным патентом. Скорее, следует исходить из того, что заявленное изобретение также может быть осуществлено другими способами таким образом, что будет включать в себя отличающиеся этапы или комбинации этапов, аналогичных этапам, описанным в данном документе, в сочетании с другими существующими и будущими технологиями.The following are embodiments of the present invention, revealing examples of its implementation in private versions. However, the description itself is not intended to limit the scope of the rights granted by this patent. Rather, it should be assumed that the claimed invention can also be carried out in other ways in such a way that it will include different steps or combinations of steps similar to the steps described herein, in combination with other existing and future technologies.

Заявленный способ будет рассмотрен на примере обработки структурированного массива данных, содержащего текст на естественном языке, представляющего собой, не ограничиваясь, нормативные правовые акты (НПА). Для специалиста должно быть очевидно, что, несмотря на то, что в данном конкретном примере реализации настоящего изобретения, осуществляется преобразование НПА, такой способ преобразования может быть применен в отношении любого структурированного массива данных, схожего с НПА.The claimed method will be considered on the example of processing a structured data array containing natural language text, which is, without limitation, regulatory legal acts (NPA). It should be obvious to a person skilled in the art that despite the fact that in this particular implementation example of the present invention, the conversion of NLA is carried out, such a conversion method can be applied to any structured data array similar to NLA.

НПА - это документ, характеризующийся следующими признаками:NLA is a document characterized by the following features:

1) НПА имеют правотворческий характер: в них нормы права либо устанавливаются, либо изменяются, либо отменяются. Нормативные правовые акты - это носители правовых норм;1) NLAs are of a law-making nature: in them, the rules of law are either established, changed or canceled. Normative legal acts are carriers of legal norms;

2) НПА содержит правовые инструменты, с помощью которых осуществляется правовое регулирующее воздействие.2) the regulatory legal act contains legal instruments with the help of which the legal regulatory influence is implemented.

3) НПА издается только в пределах компетенции правотворческого органа;3) NPA is published only within the competence of the law-making body;

4) НПА облекается в документальную форму и имеет следующие реквизиты: вид нормативного акта, его наименование, орган, его принявший, дату, место принятия акта, номер;4) NPA is clothed in documentary form and has the following details: type of regulatory act, its name, authority that adopted it, date, place of adoption of the act, number;

5) НПА не является хаотичным набором положений (предложений), а имеет определенную структуру;5) NPA is not a chaotic set of provisions (proposals), but has a certain structure;

6) НПА должен соответствовать конституции или иному вышестоящему НПА, имеющему большую юридическую силу.6) The NLA must be consistent with the constitution or another higher NLA, which has greater legal force.

7) НПА обязательно подлежит доведению до сведения граждан и организаций, т.е. опубликованию, и лишь только после этого государство имеет право требовать его неукоснительного исполнения, исходя из презумпции знания закона, и налагать санкции за его неисполнение.7) NPA must be brought to the attention of citizens and organizations, i.e. publication, and only after that, the state has the right to demand its rigorous execution, based on the presumption of knowledge of the law, and impose sanctions for its failure.

Необходимо отметить, что под термином «структурированный массив данных» в рамках заявленного изобретения может рассматриваться не только совокупность НПА, но и отдельный самостоятельный НПА, представляющий собой, например: Конституцию, закон, указ, постановление и т.п. Отдельный НПА может состоять, например, из частей, глав, разделов, статей. При этом инструментом правового регулирующего воздействия НПА является юридическое правило, обличенное в структуру нормативного предписания, которое в свою очередь является элементом (частью) нормы права (правовой нормы).It should be noted that the term “structured data array” within the framework of the claimed invention can be considered not only a set of legal acts, but also a separate independent legal acts, which is, for example: the Constitution, law, decree, regulation, etc. A separate LA can, for example, consist of parts, chapters, sections, articles. At the same time, the instrument of the legal regulatory impact of the legal acts is the legal rule, denounced in the structure of the regulatory requirement, which in turn is an element (part) of the rule of law (legal norm).

Структурированным исходным массивом данных, содержащем, по меньшей мере, текст на естественном языке является, в частности, НПА, который представляет собой текст, состоящий из структурно-простых и структурно-сложных языковых конструкций.A structured source data array containing at least natural language text is, in particular, a legal entity, which is a text consisting of structurally simple and structurally complex language constructs.

Под языковой конструкцией для целей настоящего изобретения понимается синтаксически связанное сочетание слов, словесное построение.Under the language construct for the purposes of the present invention refers to a syntactically related combination of words, verbal construction.

Для целей настоящего изобретения под структурно-простой языковой конструкцией понимаются завершенные фрагменты текста - грамматически организованные соединения слов, т.е. предложения. При этом каждое предложение обязательно характеризуется смысловой законченностью.For the purposes of the present invention, a structurally simple linguistic construction is understood to mean complete text fragments — grammatically organized word combinations, i.e. offers. Moreover, each sentence is necessarily characterized by semantic completeness.

Для целей настоящего изобретения под структурно-сложной языковой конструкцией понимаются конструкции типа «рубрики перечисления».For the purposes of the present invention, structurally complex linguistic construction is understood as constructions of the “listing category” type.

Примером языковой конструкции, относящейся к «рубрикам перечисления» является следующая языковая конструкция:An example of a language construct related to “listing headings” is the following language construct:

«Потребитель в случае обнаружения в товаре недостатков, если они не были оговорены продавцом, по своему выбору вправе:“The consumer, if defects are found in the product, if they have not been agreed upon by the seller, have the right to choose:

- потребовать замены на товар этой же марки (этих же модели и (или) артикула);- require replacement of goods of the same brand (of the same model and (or) article);

- потребовать замены на такой же товар другой марки (модели, артикула) с соответствующим перерасчетом покупной цены;- require replacement for the same product of another brand (model, article) with the corresponding recalculation of the purchase price;

- потребовать соразмерного уменьшения покупной цены;- demand a commensurate reduction in the purchase price;

- потребовать незамедлительного безвозмездного устранения недостатков товара или возмещения расходов на их исправление потребителем или третьим лицом;- require immediate gratuitous elimination of defects in the goods or reimbursement of expenses for their correction by the consumer or a third party;

- отказаться от исполнения договора купли-продажи и потребовать возврата уплаченной за товар суммы.».- refuse to fulfill the contract of sale and demand the return of the amount paid for the goods. ”.

Главной целью предварительного преобразования структурированного исходного массива данных является формирование структурированного массива данных, состоящего только из предложений. Эта цель реализуется за счет преобразования структурно-сложных языковых конструкций в структурно-простые языковые конструкции - предложения.The main goal of the preliminary transformation of a structured source data array is the formation of a structured data array consisting only of sentences. This goal is realized by converting structurally complex linguistic constructions into structurally simple linguistic constructions - sentences.

Другой целью предварительного преобразования является прояснение контекстных терминов и упрощение предложений, содержащих контекстные термины.Another purpose of the preliminary conversion is to clarify contextual terms and simplify sentences containing contextual terms.

Для целей настоящего изобретения под контекстными терминами понимаются условные именования таких терминов, которые либо не имеют самостоятельного смыслового значения вне контекста, либо имеют множество смысловых значений в контексте.For the purposes of the present invention, contextual terms are understood to mean the conditional naming of such terms that either do not have an independent semantic meaning outside the context, or have many semantic meanings in the context.

При этом для целей настоящего изобретения под контекстом понимается относительно законченный по смыслу отрывок текста, в пределах которого наиболее точно и ясно выявлен смысл и значение отдельного входящего в него слова, словосочетания или совокупности словосочетаний, а также группа из минимум двух предложений, в двух различных отрывках текста, при условии наличия в одном из предложений ссылки на другое предложение.Moreover, for the purposes of the present invention, the context refers to a relatively finished meaningful passage of text within which the meaning and meaning of a single word, phrase or combination of phrases, as well as a group of at least two sentences, in two different passages are most accurately and clearly identified. text, provided that in one of the sentences there is a link to another sentence.

В первом варианте осуществления настоящего изобретения обеспечивается способ преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, причем упомянутый способ содержит, по меньшей мере, этапы, на которых:In a first embodiment of the present invention, there is provided a method for converting a structured source data array containing at least natural language text, said method comprising at least the steps of:

А) формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой:A) form the initial data structure of a structured source data array containing the source elements of the original data structure, and the said source elements are:

структурно-сложные языковые конструкции, представляющие собой структурно-сложные языковые конструкции, содержащие контекстные термины и структурно-сложные языковые конструкции, не содержащие контекстные термины; иstructurally complex linguistic constructions, which are structurally complex linguistic constructions containing contextual terms and structurally complex linguistic constructions that do not contain contextual terms; and

структурно-простые языковые конструкции, представляющие собой структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;structurally simple language constructs, which are structurally simple language constructs containing contextual terms, and structurally simple language constructs that do not contain contextual terms;

Б) идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины;B) identify context terms in said source elements and form a database of context terms containing said identified context terms;

В) используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;C) using the information contained in said generated database of contextual terms, structurally complex linguistic constructs containing contextual terms, structurally complex linguistic constructs not containing contextual terms, structurally simple linguistic constructs containing contextual terms are identified in said initial data structure , and structurally simple language constructs that do not contain contextual terms;

Г) осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;D) carry out the conversion of the first type on the above-mentioned structurally complex language constructs that do not contain contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;

Д) осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the second type over the mentioned structurally simple language constructs containing contextual terms, to obtain grammatically and spelling correct structurally simple language constructs that do not contain contextual terms;

Е) осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the third type over the above-mentioned structurally complex language constructs containing contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;

Ж) формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины.G) form the final data structure of the structured initial data array containing the elements of the final data structure, and the elements of the final data structure are structurally simple language constructs that do not contain contextual terms and obtained grammatically and spelling structurally correct due to transformations of the first, second and third types -simple language constructs that do not contain contextual terms.

Во втором варианте осуществления настоящего изобретения обеспечивается способ преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, причем упомянутый способ содержит, по меньшей мере, этапы, на которых:In a second embodiment of the present invention, there is provided a method for converting a structured source data array containing at least natural language text, said method comprising at least the steps of:

А) формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой:A) form the initial data structure of a structured source data array containing the source elements of the original data structure, and the said source elements are:

структурно-сложные языковые конструкции, представляющие собой структурно-сложные языковые конструкции, содержащие контекстные термины и структурно-сложные языковые конструкции, не содержащие контекстные термины; иstructurally complex linguistic constructions, which are structurally complex linguistic constructions containing contextual terms and structurally complex linguistic constructions that do not contain contextual terms; and

структурно-простые языковые конструкции, представляющие собой структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;structurally simple language constructs, which are structurally simple language constructs containing contextual terms, and structurally simple language constructs that do not contain contextual terms;

Б) идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины;B) identify context terms in said source elements and form a database of context terms containing said identified context terms;

В) используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;C) using the information contained in said generated database of contextual terms, structurally complex linguistic constructs containing contextual terms, structurally complex linguistic constructs not containing contextual terms, structurally simple linguistic constructs containing contextual terms are identified in said initial data structure , and structurally simple language constructs that do not contain contextual terms;

Г) осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;D) carry out the conversion of the first type on the above-mentioned structurally complex language constructs that do not contain contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;

Д) осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the second type over the mentioned structurally simple language constructs containing contextual terms, to obtain grammatically and spelling correct structurally simple language constructs that do not contain contextual terms;

Е) осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the third type over the above-mentioned structurally complex language constructs containing contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;

Ж) формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины; причемG) form the final data structure of the structured initial data array containing the elements of the final data structure, and the elements of the final data structure are structurally simple language constructs that do not contain contextual terms and obtained grammatically and spelling structurally correct due to transformations of the first, second and third types -simple language constructs that do not contain contextual terms; moreover

преобразование первого типа включает форматное преобразование и лингвистическое преобразование;the first type conversion includes format conversion and linguistic conversion;

преобразование второго типа включает контекстное преобразование и лингвистическое преобразование;a second type conversion includes contextual conversion and linguistic conversion;

преобразование третьего типа включает форматное преобразование, контекстное преобразование и лингвистическое преобразование.a third type conversion includes format conversion, contextual conversion, and linguistic conversion.

В третьем варианте осуществления настоящего изобретения, обеспечивается способ по любому из первого или второго вариантов осуществления настоящего изобретения, дополнительно содержащий, по меньшей мере, этапы на которых:In a third embodiment of the present invention, there is provided a method according to any one of the first or second embodiments of the present invention, further comprising at least the steps of:

З) на основании полученной итоговой структуры данных формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы;C) on the basis of the resulting final data structure form the first data structure of the structured source data array containing the elements of the said first data structure, said elements of the first data structure containing the first logical partitions and second logical partitions;

И) формируют базу данных логических связей логических разделов упомянутых элементов первой структуры данных;I) form a database of logical connections of logical sections of the mentioned elements of the first data structure;

К) формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных содержат логические конструкции логических разделов упомянутых элементов первой структуры данных, сформированные с использованием информации из упомянутой базы данных логических связей логических разделов, причем упомянутые логические разделы содержат первые семантические части и вторые семантические части;K) form a second data structure of a structured source data array containing the elements of said second data structure, said elements of the second data structure containing logical structures of logical partitions of said elements of the first data structure formed using information from said logical linking database of logical partitions, said logical sections contain the first semantic parts and the second semantic parts;

Л) формируют базу данных семантических частей логических разделов из упомянутых вторых семантических частей, причем упомянутые вторые семантические части исключаются из соответствующих упомянутых логических разделов;K) form a database of semantic parts of logical sections from said second semantic parts, wherein said second semantic parts are excluded from the corresponding mentioned logical sections;

М) формируют грамматически и орфографически верные семантические части упомянутых логических разделов путем лингвистических преобразований над упомянутыми семантическими частями;M) form grammatically and orthographically correct semantic parts of the mentioned logical sections by linguistic transformations over the mentioned semantic parts;

Н) формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой результирующей структуры данных, причем упомянутые элементы результирующей структуры данных содержат логические конструкции, содержащие, по меньшей мере, упомянутые грамматически и орфографически верные семантические части логических разделов.H) form the resulting data structure of the structured source data array containing the elements of the said resulting data structure, said elements of the resulting data structure containing logical constructs containing at least the grammatically and spelling-correct semantic parts of logical sections.

В четвертом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе 3) осуществляют, по меньшей мере, этапы, на которых:In a fourth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that, in step 3), at least the steps are carried out in which:

идентифицируют итоговую структуру данных структурированного исходного массива данных;identify the final data structure of the structured source data array;

идентифицируют элементы итоговой структуры данных;identify elements of the resulting data structure;

идентифицируют первые логические разделы упомянутых элементов итоговой структуры данных и вторые логические разделы упомянутых элементов итоговой структуры данных; иidentifying the first logical sections of said elements of the resulting data structure and the second logical sections of said elements of the resulting data structure; and

формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы.form the first data structure of the structured source data array containing the elements of said first data structure, said elements of the first data structure containing first logical partitions and second logical partitions.

В пятом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе И) осуществляют, по меньшей мере, этапы, на которых:In a fifth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that in step I), at least the steps are carried out in which:

идентифицируют элементы первой структуры данных, содержащие один упомянутый первый логический раздел, и элементы первой структуры данных, содержащие один упомянутый второй логический раздел;identifying elements of a first data structure containing one of said first logical partitions and elements of a first data structure containing one of said second logical partition;

идентифицируют элементы первой структуры данных, содержащие более одного упомянутого первого логического раздела, и элементы первой структуры данных, содержащие более одного упомянутого второго логического раздела;identifying elements of a first data structure containing more than one of said first logical partitions, and elements of a first data structure containing more than one of said second logical partition;

среди элементов первой структуры данных, содержащих более одного упомянутого первого логического раздела и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют логические связи между упомянутыми первыми логическими разделами или между упомянутыми вторыми логическими разделами;among the elements of the first data structure containing more than one of said first logical partitions and in the elements of the first data structure containing more than one of said second logical partitions, logical relationships between said first logical partitions or between said second logical partitions are identified;

среди элементов первой структуры данных, содержащих более одного упомянутого первого логического раздела и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела идентифицируют элементы первой структуры данных, не имеющие логической связи между логическими разделами; иamong the elements of the first data structure containing more than one of said first logical partitions and in the elements of the first data structure containing more than one of said second logical partitions, elements of the first data structure that do not have a logical connection between logical partitions are identified; and

формируют базу данных логических связей логических разделов элементов первой структуры данных.form a database of logical relationships of logical sections of the elements of the first data structure.

В шестом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе К) осуществляют, по меньшей мере, этапы, на которых:In a sixth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that, in step K), at least the steps are carried out in which:

формируют логические конструкции логических разделов элементов первой структуры данных, используя информацию из базы данных логических связей логических разделов элементов первой структуры данных и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый первый логический раздел, и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый второй логический раздел; иform logical constructions of logical partitions of elements of the first data structure using information from a database of logical relationships of logical partitions of elements of the first data structure and logical partitions of said elements of the first data structure containing one of the first logical partitions and logical partitions of said elements of the first data structure containing one said second logical section; and

формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой сформированные логические конструкции логических разделов первой структуры данных.form a second data structure of a structured source data array containing elements of a second data structure, said elements of the second data structure being formed logical structures of logical partitions of the first data structure.

В седьмом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе Л) осуществляют, по меньшей мере, этапы, на которых:In a seventh embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that at step A), at least the steps are carried out in which:

идентифицируют первые логические разделы элементов второй структуры данных и вторые логические разделы элементов второй структуры данных;identify the first logical partitions of the elements of the second data structure and the second logical partitions of the elements of the second data structure;

в упомянутых первых логических разделах и вторых логических разделах элементов второй структуры данных идентифицируют первые семантические части и вторые семантические части; иin said first logical sections and second logical sections of the elements of the second data structure, the first semantic parts and the second semantic parts are identified; and

в упомянутых первых и вторых логических разделах элементов второй структуры данных идентифицируют, по меньшей мере, особые семантические части первых логических разделов элементов второй структуры данных и особые семантические части вторых логических разделов элементов второй структуры данных и формируют базу данных особых семантических частей логических разделов элементов второй структуры данных путем перемещения упомянутых особых семантических частей в упомянутую формируемую базу данных особых семантических частей логических разделов элементов второй структуры данных.in said first and second logical sections of the elements of the second data structure, at least the special semantic parts of the first logical sections of the elements of the second data structure and the special semantic parts of the second logical sections of the elements of the second data structure are identified and form a database of special semantic parts of the logical sections of the elements of the second structure data by moving said special semantic parts to said generated database of special semantic logical parts sections of the elements of the second data structure.

В восьмом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе М) осуществляют, по меньшей мере, этапы, на которых:In an eighth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that at step M), at least the steps are carried out in which:

в упомянутых вторых семантических частях, упомянутых вторых логических разделов элементов второй структуры данных идентифицируют, по меньшей мере, уточняющие структуры вторых семантических частей вторых логических разделов; иin said second semantic parts, said second logical sections of the elements of the second data structure, at least clarifying structures of the second semantic parts of the second logical sections are identified; and

осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей упомянутых первых и вторых логических разделов, для формирования грамматически и орфографически верных семантических частей логических разделов элементов второй структуры данных.carry out linguistic transformations over all semantic parts, with the exception of the mentioned special semantic parts of the mentioned first and second logical sections, to form grammatically and spelling-correct semantic parts of logical sections of the elements of the second data structure.

В девятом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе Н) осуществляют, по меньшей мере, этапы, на которых:In a ninth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that, in step H), at least the steps are carried out in which:

формируют из первых грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и упомянутых грамматически и орфографически верных уточняющих структур вторых семантических частей вторых логических разделов элементов второй структуры данных смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных; иform semantic combinations of grammatically and spelling-correct semantic parts of the second logical sections of the elements of the second data structure from the first grammatically and spelling-correct semantic parts of the second logical sections of the elements of the second data structure; and the grammatically and orthographically correct semantic parts of the second logical sections of the elements of the second data structure; and

формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы результирующей структуры данных, причем упомянутые элементы результирующей структуры данных представляют собой логические конструкции, содержащие упомянутые грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных.form the resulting data structure of the structured source data array containing the elements of the resulting data structure, and said elements of the resulting data structure are logical constructs containing the grammatically and spelling-correct semantic parts of the logical sections of the elements of the second data structure.

В десятом варианте осуществления настоящего изобретения обеспечивается способ по девятому варианту осуществления настоящего изобретения, характеризующийся тем, что упомянутые логические конструкции из упомянутой результирующей структуры данных дополнительно могут содержать упомянутые сформированные смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных.In a tenth embodiment of the present invention, there is provided a method according to the ninth embodiment of the present invention, characterized in that said logical structures from said resultant data structure may further comprise said semantic combinations of grammatically and spelling-correct semantic parts of second logical sections of elements of the second data structure.

В одиннадцатом варианте осуществления настоящего изобретения обеспечивается способ по любому из первого или второго вариантов осуществления настоящего изобретения, характеризующийся тем, что дополнительно содержит, по меньшей мере, этапы, на которых:In an eleventh embodiment of the present invention, there is provided a method according to any one of the first or second embodiments of the present invention, characterized in that it further comprises at least the steps of:

З) идентифицируют исходную структуру данных исходного структурированного массива данных; идентифицируют элементы исходной структуры данных; идентифицируют первые логические разделы упомянутых элементов исходной структуры данных и вторые логические разделы упомянутых элементов исходной структуры данных; и формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы;H) identify the original data structure of the original structured data array; identify elements of the original data structure; identifying the first logical partitions of said elements of the original data structure and the second logical partitions of said elements of the original data structure; and form the first data structure of the structured source data array containing the elements of said first data structure, said elements of the first data structure containing first logical partitions and second logical partitions;

И) идентифицируют элементы первой структуры данных, содержащие один упомянутый первый логический раздел, и элементы первой структуры данных, содержащие один упомянутый второй логический раздел; идентифицируют элементы первой структуры данных, содержащие более одного упомянутого первого логического раздела, и элементы первой структуры данных, содержащие более одного упомянутого второго логического раздела; в элементах первой структуры данных, содержащих более одного упомянутого первого логического раздела и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют логические связи между упомянутыми первыми логическими разделами или между упомянутыми вторыми логическими разделами; в элементах первой структуры данных, содержащих более одного упомянутого первого логического раздела и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела идентифицируют элементы первой структуры данных, не имеющие логической связи между логическими разделами; и формируют базу данных логических связей логических разделов элементов первой структуры данных;I) identify elements of the first data structure containing one mentioned first logical partition, and elements of the first data structure containing one mentioned second logical partition; identifying elements of a first data structure containing more than one of said first logical partitions, and elements of a first data structure containing more than one of said second logical partition; in the elements of the first data structure containing more than one of said first logical partitions and in the elements of the first data structure containing more than one of said second logical partitions, logical relationships between said first logical partitions or between said second logical partitions are identified; in the elements of the first data structure containing more than one of the first logical partitions and in the elements of the first data structure containing more than one of the second logical partitions, elements of the first data structure that do not have a logical connection between logical partitions are identified; and form a database of logical relationships of logical partitions of the elements of the first data structure;

К) формируют логические конструкции логических разделов элементов первой структуры данных, используя информацию из базы данных логических связей логических разделов элементов первой структуры данных и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый первый логический раздел, и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый второй логический раздел; и формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой сформированные логические конструкции логических разделов первой структуры данных;K) form logical structures of logical partitions of elements of the first data structure using information from a database of logical connections of logical partitions of elements of the first data structure and logical partitions of said elements of the first data structure containing one of the first logical partitions and logical partitions of said elements of the first data structure, containing one said second logical partition; and form a second data structure of the structured source data array containing elements of the second data structure, said elements of the second data structure being formed logical structures of logical partitions of the first data structure;

Л) идентифицируют первые логические разделы элементов второй структуры данных и вторые логические разделы элементов второй структуры данных; в упомянутых первых логических разделах и вторых логических разделах элементов второй структуры данных идентифицируют первые семантические части и вторые семантические части; и в упомянутых первых и вторых логических разделах элементов второй структуры данных идентифицируют, по меньшей мере, особые семантические части первых логических разделов элементов второй структуры данных и особые семантические части вторых логических разделов элементов второй структуры данных и формируют базу данных особых семантических частей логических разделов элементов второй структуры данных путем перемещения упомянутых особых семантических частей в упомянутую формируемую базу данных особых семантических частей логических разделов элементов второй структуры данных;K) identify the first logical partitions of the elements of the second data structure and the second logical partitions of the elements of the second data structure; in said first logical sections and second logical sections of the elements of the second data structure, the first semantic parts and the second semantic parts are identified; and in said first and second logical partitions of the elements of the second data structure, at least special semantic parts of the first logical partitions of the elements of the second data structure and the special semantic parts of the second logical partitions of the elements of the second data structure are identified and form a database of special semantic parts of the logical partitions of the elements of the second data structures by moving said special semantic parts to said logically generated database of special semantic parts x sections of the elements of the second data structure;

М) в упомянутых вторых семантических частях упомянутых вторых логических разделов элементов второй структуры данных идентифицируют, по меньшей мере, уточняющие структуры вторых семантических частей вторых логических разделов; и осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей упомянутых первых и вторых логических разделов, для формирования грамматически и орфографически верных семантических частей логических разделов элементов второй структуры данных;M) in said second semantic parts of said second logical sections of the elements of the second data structure, at least the refinement structures of the second semantic parts of the second logical sections are identified; and carry out linguistic transformations over all semantic parts, with the exception of the mentioned special semantic parts of the mentioned first and second logical sections, to form grammatically and spelling-correct semantic parts of logical sections of the elements of the second data structure;

Н) формируют из первых грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и упомянутых грамматически и орфографически верных уточняющих структур вторых семантических частей вторых логических разделов элементов второй структуры данных смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов третьей структуры данных; и формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы результирующей структуры данных, причем упомянутые элементы результирующей структуры данных представляют собой логические конструкции, содержащие упомянутые грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных.H) form semantic combinations of grammatically and spelling-correct semantic parts of the second logical sections of the elements of the third structure from the first grammatically and spelling-correct semantic parts of the second logical sections of the elements of the second data structure and the grammatically and spelling-correcting refining structures of the second semantic parts of the second logical sections of the elements of the second data structure data; and form the resulting data structure of the structured source data array containing the elements of the resulting data structure, said elements of the resulting data structure being logical constructs containing the grammatically and spelling-correct semantic parts of the logical sections of the elements of the second data structure.

В двенадцатом варианте осуществления настоящего изобретения обеспечивается способ по одиннадцатому варианту осуществления настоящего изобретения, характеризующийся тем, что упомянутые логические конструкции из упомянутой результирующей структуры данных дополнительно могут содержать упомянутые сформированные смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных.In a twelfth embodiment of the present invention, there is provided a method according to the eleventh embodiment of the present invention, characterized in that said logical constructs from said resultant data structure may further comprise said semantic combinations of grammatically and spelling-correct semantic parts of second logical sections of elements of the second data structure.

При этом для специалиста в области техники, к которой относится настоящее изобретение, должно быть очевидным, что варианты осуществления изобретения со второго по двенадцатый характеризуют уточненные этапы способа, охарактеризованного первым вариантом осуществления изобретения, и иные варианты осуществления изобретения могут быть реализованы, причем такие иные варианты осуществления изобретения будут включать различные комбинации уточненных этапов способа.In this case, for a person skilled in the technical field to which the present invention relates, it should be obvious that the second to twelfth embodiments describe the specified steps of the method described by the first embodiment of the invention, and other embodiments of the invention can be implemented, and such other options embodiments of the invention will include various combinations of the specified process steps.

В тринадцатом варианте осуществления настоящего изобретения обеспечивается устройство преобразования структурированного исходного массива данных, содержащее, по меньшей мере:In a thirteenth embodiment of the present invention, there is provided a device for converting a structured source data array, comprising at least:

один или более процессоров;one or more processors;

один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and

память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый, и содержащую подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any one of the first to twelfth embodiments of the present invention and containing one or more structured ones to be converted source data arrays containing at least natural language text.

В четырнадцатом варианте осуществления настоящего изобретения обеспечивается устройство преобразования исходного структурированного массива данных, содержащее, по меньшей мере:In a fourteenth embodiment of the present invention, there is provided a device for converting an initial structured data array, comprising at least:

один или более процессоров;one or more processors;

один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and

память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый, и содержащую подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке, причем упомянутые подлежащие преобразованию один или несколько структурированных исходных массивов данных являются загружаемыми, а упомянутое устройство выполнено с возможностью соединения с базой данных, в которой хранятся упомянутые загружаемые подлежащие преобразованию один или несколько структурированных исходных массивов данных, для осуществления загрузки в упомянутую память устройства, по меньшей мере, одного загружаемого подлежащего преобразованию структурированного исходного массива данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any one of the first to twelfth embodiments of the present invention and containing one or more structured ones to be converted source data arrays containing at least natural language text, said one or more structured ones to be converted the source data arrays are downloadable, and said device is configured to connect to a database in which said downloadable one or more structured source data arrays to be converted are stored to load at least one loadable structured source transformable an array of data.

В пятнадцатом варианте осуществления настоящего изобретения обеспечивается система преобразования структурированного исходного массива данных, содержащая, по меньшей мере:In a fifteenth embodiment of the present invention, there is provided a system for converting a structured source data array comprising at least:

одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с тринадцатого по четырнадцатый;one or more devices made in the form of devices according to any one of the thirteenth to fourteenth embodiments of the present invention;

один или несколько серверов, обеспечивающих регулирование обменом данных в упомянутой системе;one or more servers providing regulation of data exchange in said system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.one or more data transmission networks through which said devices, servers and databases interact.

В шестнадцатом варианте осуществления настоящего изобретения обеспечивается система преобразования структурированного исходного массива данных, содержащая, по меньшей мере:In a sixteenth embodiment of the present invention, there is provided a system for converting a structured source data array comprising at least:

одно или более устройств, выполненных в виде устройств по любому из тринадцатого или четырнадцатого вариантов осуществления настоящего изобретения;one or more devices made in the form of devices according to any one of the thirteenth or fourteenth embodiments of the present invention;

один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover

способ по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент.the method according to any one of the first to twelfth embodiments of the present invention is carried out by one or more of said servers, and said devices are a thin client.

В семнадцатом варианте осуществления настоящего изобретения обеспечивается система преобразования структурированного исходного массива данных, содержащая, по меньшей мере:In a seventeenth embodiment of the present invention, there is provided a system for converting a structured source data array comprising at least:

одно или более устройств, выполненных в виде устройств по любому из тринадцатого или четырнадцатого вариантов осуществления настоящего изобретения;one or more devices made in the form of devices according to any one of the thirteenth or fourteenth embodiments of the present invention;

один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover

способ по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент; причемthe method according to any one of the first to twelfth embodiments of the present invention is carried out by one or more of said servers, and said devices are a thin client; moreover

упомянутая база данных служит для хранения данных, представляющих собой, по меньшей мере, одно из: код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый, подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке.said database is used to store data representing at least one of: a program code, which upon execution causes said one or more processors of said device and / or device associated with said device, to perform the actions of the method according to any one of the embodiments first to twelfth of the present invention, one or more structured source data arrays to be converted containing at least natural language text to be converted.

В восемнадцатом варианте осуществления настоящего изобретения обеспечивается система по любому из вариантов осуществления настоящего изобретения с пятнадцатого по семнадцатый, причем упомянутая сеть передачи данных представляет собой одно из локальная сеть (LAN), глобальная сеть (WAN), информационно-телекоммуникационная сеть Интернет, виртуальная частная сеть (VPN).In an eighteenth embodiment of the present invention, there is provided a system according to any one of the fifteenth to seventeenth embodiments of the present invention, said data network being one of a local area network (LAN), wide area network (WAN), telecommunications network Internet, virtual private network (VPN).

В девятнадцатом варианте осуществления настоящего изобретения обеспечивается машиночитаемый носитель данных, содержащий код программы, который при выполнении побуждает процессор или процессоры устройства, с которым взаимодействует машиночитаемый носитель данных, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый.In a nineteenth embodiment of the present invention, there is provided a computer-readable storage medium comprising program code that, upon execution, causes a processor or processors of a device with which the computer-readable storage medium interacts to perform the steps of a method as in any of the first to twelfth embodiments of the present invention.

В двадцатом варианте осуществления настоящего изобретения обеспечивается способ формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, причем упомянутый способ включает, по меньшей мере, этапы, на которых:In a twentieth embodiment of the present invention, there is provided a method of forming a map of links of components of grammatically and orthographically correct semantic parts of logical sections of logical structures of a converted structured source data array, said method comprising at least the steps of:

идентифицируют компоненты грамматически и орфографически верных семантических частей логических разделов логических конструкций из упомянутого преобразованного структурированного исходного массива данных, причем каждая упомянутая грамматически и орфографически верная семантическая часть, содержащая упомянутые компоненты, содержит, по меньшей мере, один упомянутый компонент, причем упомянутый компонент содержит не более одного значения компонента, и формируют таблицу компонентов, содержащую, по меньшей мере, упомянутые идентифицированные компоненты и их значения;the components of the grammatically and spelling-correct semantic parts of the logical sections of the logical constructs from said transformed structured source data array are identified, each grammatically and spelling-correct semantic part containing said components containing at least one said component, said component containing no more than one component value, and form a component table containing at least the mentioned identifiers ized components and their meanings;

идентифицируют грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащие упомянутые идентифицированные компоненты, и грамматически и орфографически верные семантические части логических разделов логических конструкций, не содержащие упомянутые идентифицированные компоненты;identify grammatically and orthographically correct semantic parts of logical sections of logical constructions containing said identified components, and grammatically and spelling correct semantic parts of logical sections of logical constructions that do not contain said identified components;

идентифицируют компоненты, содержащиеся в количестве более одного в упомянутых грамматически и орфографически верных семантических частях, и идентифицируют сочетания компонентов, содержащихся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и формируют карту сочетаний компонентов, содержащую, по меньшей мере, упомянутые компоненты, содержащиеся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и их сочетания;identify components contained in an amount of more than one in the aforementioned grammatically and spelling correct semantic parts, and identify combinations of components contained in an amount of more than one in each of the aforementioned grammatically and spelling correct semantic parts, and form a map of combinations of components containing at least said components contained in an amount of more than one in each separate grammatically and spelling-correct semantic part, and their etaniya;

идентифицируют значения компонентов, содержащихся в упомянутой карте сочетаний компонентов;identifying the values of the components contained in said combination map of the components;

в грамматически и орфографически верных семантических частях логических разделов логических конструкций, не содержащих упомянутых идентифицированных компонентов, идентифицируют понятия, семантически совпадающие с упомянутыми значениями компонентов, содержащихся в упомянутой карте сочетаний компонентов, и формируют таблицу семантически совпадающих понятий, содержащую, по меньшей мере, значения компонентов, содержащихся в упомянутой карте сочетаний компонентов, и семантически совпадающие с ними понятия;in the grammatically and spelling-correct semantic parts of the logical sections of logical constructions that do not contain the identified components identified, the concepts are identified that semantically coincide with the mentioned component values contained in the component combination map, and a table of semantically matching concepts containing at least the component values is formed contained in the aforementioned map of combinations of components, and semantically coinciding concepts with them;

идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логического раздела логической конструкции, не содержащую упомянутые идентифицированные компоненты, и содержащую более одного упомянутого понятия;identify at least one grammatically and orthographically correct semantic part of the logical section of the logical structure that does not contain the identified components and contains more than one of the mentioned concepts;

идентифицируют грамматически и орфографически верную семантическую часть логического раздела логической конструкции, содержащую более одного упомянутого идентифицированного компонента, значения которых семантически совпадают с упомянутыми понятиями, содержащимися в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов и содержащей более одного упомянутого понятия;identify the grammatically and orthographically correct semantic part of the logical section of the logical structure, containing more than one identified component mentioned, the values of which semantically coincide with the mentioned concepts, contained in one grammatically and spelling correct semantic part of the logical section of the logical structure, not containing the identified identified components and containing more than one the mentioned concept;

формируют карту сочетаний семантически совпадающих понятий, содержащую, по меньшей мере, упомянутые понятия, содержащиеся в количестве более одного в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов, семантически совпадающие со значениями упомянутых идентифицированных компонентов, содержащихся в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, содержащей более одного упомянутого идентифицированного компонента;form a map of combinations of semantically matching concepts, containing at least the mentioned concepts, containing more than one in one grammatically and spelling correct semantic part of the logical section of the logical structure that does not contain the identified components, semantically matching the values of the identified components contained in one grammatically and spelling-correct semantic part of a logical section of a logical construction containing olee one of said identified component;

формируют карту связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую карту сочетаний компонентов и упомянутую карту сочетаний семантически совпадающих понятий.form a map of the relationships of the components of the grammatically and spelling-correct semantic parts of the logical sections of the logical constructions of the transformed structured source data array containing at least the said map of combinations of components and the mentioned map of combinations of semantically identical concepts.

В двадцать первом варианте осуществления настоящего изобретения обеспечивается способ формирования карты связей компонентов по двадцатому варианту осуществления настоящего изобретения, дополнительно содержащий этап, на котором формируют отчет, демонстрирующий, по меньшей мере, количество связей и значения упомянутых компонентов, содержащихся в карте сочетаний компонентов.In a twenty-first embodiment of the present invention, there is provided a method for generating a component link map according to the twentieth embodiment of the present invention, further comprising a step of generating a report showing at least the number of links and values of said components contained in the component combination map.

В двадцать втором варианте осуществления настоящего изобретения обеспечивается устройство формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащее, по меньшей мере:In a twenty-second embodiment of the present invention, there is provided a device for generating a map of links of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:

один или более процессоров;one or more processors;

один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and

память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый, и содержащую один или несколько преобразованных структурированных исходных массивов данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any of the embodiments of the present invention from twenty to twenty-first, and containing one or more transformed structured source data arrays.

В двадцать третьем варианте осуществления настоящего изобретения обеспечивается устройство формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащее, по меньшей мере:In a twenty-third embodiment of the present invention, there is provided a device for generating a map of links of components of grammatically and spelling correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:

один или более процессоров;one or more processors;

один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and

память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый, и содержащую один или несколько преобразованных структурированных исходных массивов данных, причем упомянутые один или несколько преобразованных структурированных исходных массивов данных являются загружаемыми, а упомянутое устройство выполнено с возможностью соединения с базой данных, в которой хранятся упомянутые загружаемые один или несколько преобразованных структурированных исходных массивов данных, для осуществления загрузки в упомянутую память устройства, по меньшей мере, одного загружаемого преобразованного структурированного исходного массива данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any of the embodiments of the present invention from twenty to twenty-first, and containing one or more transformed structured source data arrays, wherein said one or more transformed structured source data arrays are downloadable, and said device in is configured to connect to a database in which said downloadable one or more transformed structured source data arrays are stored to load at least one loadable converted structured source data array into said device memory.

В двадцать четвертом варианте осуществления настоящего изобретения обеспечивается система формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащая, по меньшей мере:In a twenty-fourth embodiment of the present invention, there is provided a system for generating a map of links of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:

одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с двадцать второго по двадцать третий;one or more devices made in the form of devices according to any one of the embodiments of the present invention from twenty-second to twenty-third;

один или несколько серверов, обеспечивающих регулирование обменом данных в упомянутой системе;one or more servers providing regulation of data exchange in said system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.one or more data transmission networks through which said devices, servers and databases interact.

В двадцать пятом варианте осуществления настоящего изобретения обеспечивается система формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащая, по меньшей мере:In a twenty-fifth embodiment of the present invention, there is provided a system for generating a map of relationships of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:

одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с двадцать второго по двадцать третий;one or more devices made in the form of devices according to any one of the embodiments of the present invention from twenty-second to twenty-third;

один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover

способ по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент.the method according to any one of the twenty to twenty first embodiments of the present invention is carried out by one or more of said servers, and said devices are a thin client.

В двадцать шестом варианте осуществления настоящего изобретения обеспечивается система формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащая, по меньшей мере:In a twenty-sixth embodiment of the present invention, there is provided a system for generating a map of links of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:

одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с двадцать второго по двадцать третий;one or more devices made in the form of devices according to any one of the embodiments of the present invention from twenty-second to twenty-third;

один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover

способ по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент; причемthe method according to any one of the twenty to twenty first embodiments of the present invention is carried out by one or more of said servers, and said devices are a thin client; moreover

упомянутая база данных служит для хранения данных, представляющих собой, по меньшей мере, одно из: код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый, один или несколько преобразованных структурированных исходных массивов данных.said database is used to store data representing at least one of: a program code, which upon execution causes said one or more processors of said device and / or device associated with said device, to perform the actions of the method according to any one of the embodiments twenty to twenty first, one or more transformed structured source data arrays of the present invention.

В двадцать седьмом варианте осуществления настоящего изобретения обеспечивается система по любому из вариантов осуществления настоящего изобретения с двадцать четвертого по двадцать шестой, причем упомянутая сеть передачи данных представляет собой одно из локальная сеть (LAN), глобальная сеть (WAN), информационно-телекоммуникационная сеть, Интернет, виртуальная частная сеть (VPN).In a twenty-seventh embodiment of the present invention, there is provided a system according to any one of the embodiments of the present invention from the twenty-fourth to the twenty-sixth, said data network being one of a local area network (LAN), wide area network (WAN), information telecommunication network, Internet virtual private network (VPN).

В двадцать восьмом варианте осуществления настоящего изобретения обеспечивается машиночитаемый носитель данных, содержащий код программы, который при выполнении побуждает процессор или процессоры устройства, с которым взаимодействует машиночитаемый носитель данных, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый.In a twenty-eighth embodiment of the present invention, there is provided a computer-readable storage medium comprising program code that, upon execution, causes a processor or processors of a device with which the computer-readable storage medium interacts to perform method steps according to any one of embodiments twenty to twenty-first.

В двадцать девятом варианте осуществления настоящего изобретения обеспечивается способ поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, причем упомянутый способ включает, по меньшей мере, этапы, на которых:In a twenty-ninth embodiment of the present invention, there is provided a method of searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs, said method comprising at least the steps , where:

формируют поисковый запрос, содержащий, по меньшей мере, один поисковый термин;form a search query containing at least one search term;

идентифицируют массив данных в упомянутом преобразованном структурированном исходном массиве данных, соответствующий упомянутому поисковому термину;identifying the data array in said transformed structured source data array corresponding to said search term;

идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логических разделов логических конструкций упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутый поисковый термин;identifying at least one grammatically and spelling-correct semantic part of the logical sections of the logical constructs of said transformed structured source data array containing at least said search term;

идентифицируют, по меньшей мере, одну логическую конструкцию упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть;at least one logical construction of said transformed structured source data array is identified, comprising at least said grammatically and spelling-correct semantic part;

демонстрируют, по меньшей мере, упомянутую идентифицированную логическую конструкцию упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть.demonstrate at least said identified logical construction of said transformed structured source data array containing at least said identified grammatically and spelling-correct semantic part.

В тридцатом варианте осуществления настоящего изобретения обеспечивается способ поиска по двадцать девятому варианту осуществления настоящего изобретения, дополнительно содержащий этап назначения, по меньшей мере, одного критерия поиска.In a thirtieth embodiment of the present invention, there is provided a search method according to a twenty-ninth embodiment of the present invention, further comprising the step of assigning at least one search criterion.

В тридцать первом варианте осуществления настоящего изобретения обеспечивается способ поиска по тридцатому варианту осуществления настоящего изобретения, характеризующийся тем, что критерием поиска является, по меньшей мере, одно из: поиск по первым и вторым семантическим частям первых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций; поиск по первым семантическим частям вторых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций.In the thirty-first embodiment of the present invention, there is provided a search method according to the thirtieth embodiment of the present invention, characterized in that the search criterion is at least one of: search in the first and second semantic parts of the first logical sections of logical structures and the second semantic parts of the second logical sections of logical constructions; search in the first semantic parts of the second logical sections of logical constructions and the second semantic parts of the second logical sections of logical constructions.

В тридцать втором варианте осуществления настоящего изобретения обеспечивается способ поиска по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать первый, характеризующийся тем, что формируемый поисковый запрос представляет собой, по меньшей мере, одно из: терминологический поисковый запрос; компонентный поисковый запрос; компонентно-терминологический поисковый запрос.In the thirty-second embodiment of the present invention, there is provided a search method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-first, characterized in that the generated search query is at least one of: a terminological search query; component search query; component terminological search query.

В тридцать третьем варианте осуществления настоящего изобретения обеспечивается способ поиска по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать первый, дополнительно содержащий, по меньшей мере, этапы, на которых:In a thirty-third embodiment of the present invention, there is provided a search method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-first, further comprising at least the steps of:

выбирают, по меньшей мере, одну из упомянутых идентифицированных логических конструкций, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть;selecting at least one of said identified logical constructs comprising at least said identified grammatically and spelling-correct semantic part;

идентифицируют, по меньшей мере, связанные с упомянутой грамматически и орфографически верной семантической частью грамматически и орфографически верные семантические части, содержащиеся в других логических конструкциях преобразованного структурированного массива данных, причем упомянутая идентификация осуществляется на основании сведений из карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций;at least grammatically and spelling-correct semantic parts associated with said grammatically and spelling-correct semantic parts are contained in other logical constructions of the transformed structured data array, said identification being carried out on the basis of information from the communications map of components of grammatically and spelling-correct semantic logical parts sections of logical constructions;

идентифицируют, по меньшей мере, одну или более логические конструкции, содержащие упомянутые идентифицированные связанные грамматически и орфографически верные семантические части или идентифицируют отсутствие логических конструкций, содержащих упомянутые идентифицированные связанные грамматически и орфографически верные семантические части;identify at least one or more logical constructs containing said identified grammatically and spelling-related semantic parts; or identify the absence of logical constructs containing said identified grammatically and spelling-related semantic parts;

демонстрируют, по меньшей мере, одну или более логические конструкции, содержащие упомянутые идентифицированные связанные грамматически и орфографически верные семантические части или демонстрируют отсутствие логических конструкций, содержащих упомянутые идентифицированные связанные грамматически и орфографически верные семантические части.demonstrate at least one or more logical constructs containing said identified grammatically and spelling-related correct semantic parts or demonstrate no logical constructs containing said identified grammatically and spelling-related semantic parts.

В тридцать четвертом варианте осуществления настоящего изобретения обеспечивается способ поиска по тридцать третьему варианту осуществления настоящего изобретения, характеризующийся тем, что формируемый поисковый запрос представляет собой, по меньшей мере, одно из: терминологический поисковый запрос; компонентный поисковый запрос; компонентно-терминологический поисковый запрос.In a thirty-fourth embodiment of the present invention, there is provided a search method according to a thirty-third embodiment of the present invention, characterized in that the generated search query is at least one of: a terminological search query; component search query; component terminological search query.

В тридцать пятом варианте осуществления настоящего изобретения обеспечивается устройство поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащее, по меньшей мере:In a thirty-fifth embodiment of the present invention, there is provided a device for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:

один или более процессоров;one or more processors;

один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and

память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый, и содержащую один или несколько преобразованных структурированных исходных массивов данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-fourth, and containing one or more converted structured source data arrays.

В тридцать шестом варианте осуществления настоящего изобретения обеспечивается устройство поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащее, по меньшей мере:In a thirty-sixth embodiment of the present invention, there is provided a device for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:

один или более процессоров;one or more processors;

один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and

память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый, и содержащую один или несколько преобразованных структурированных исходных массивов данных, причем упомянутые один или несколько преобразованных структурированных исходных массивов данных являются загружаемыми, а упомянутое устройство выполнено с возможностью соединения с базой данных, в которой хранятся упомянутые загружаемые один или несколько преобразованных структурированных исходных массивов данных, для осуществления загрузки в упомянутую память устройства, по меньшей мере, одного загружаемого преобразованного структурированного исходного массива данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-fourth, and containing one or more converted structured source data arrays, said one or more converted structured source data arrays being downloadable, and said The e device is configured to connect to a database in which said downloadable one or more transformed structured source data arrays are stored for loading at least one loadable transformed structured source data array into said device memory.

В тридцать седьмом варианте осуществления настоящего изобретения обеспечивается система поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащая, по меньшей мере:In a thirty-seventh embodiment of the present invention, there is provided a system for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:

одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с тридцать пятого по тридцать шестой;one or more devices made in the form of devices according to any one of the embodiments of the present invention from thirty-fifth to thirty-sixth;

один или несколько серверов, обеспечивающих регулирование обменом данных в упомянутой системе;one or more servers providing regulation of data exchange in said system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.one or more data transmission networks through which said devices, servers and databases interact.

В тридцать восьмом варианте осуществления настоящего изобретения обеспечивается система поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащая, по меньшей мере:In a thirty-eighth embodiment of the present invention, there is provided a system for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:

одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с тридцать пятого по тридцать шестой;one or more devices made in the form of devices according to any one of the embodiments of the present invention from thirty-fifth to thirty-sixth;

один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover

способ по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент.the method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-fourth is carried out by one or more of said servers, and said devices are a thin client.

В тридцать девятом варианте осуществления настоящего изобретения обеспечивается система поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащая, по меньшей мере:In a thirty-ninth embodiment of the present invention, there is provided a system for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:

одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с тридцать пятого по тридцать шестой;one or more devices made in the form of devices according to any one of the embodiments of the present invention from thirty-fifth to thirty-sixth;

один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;

одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;

одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover

способ по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент; причемthe method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-fourth is carried out by one or more of said servers, and said devices are a thin client; moreover

упомянутая база данных служит для хранения данных, представляющих собой, по меньшей мере, одно из: код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый, один или несколько преобразованных структурированных исходных массивов данных.said database is used to store data representing at least one of: a program code, which upon execution causes said one or more processors of said device and / or device associated with said device, to perform the actions of the method according to any one of the embodiments twenty-ninth to thirty-fourth of the present invention, one or more transformed structured source data arrays.

В сороковом варианте осуществления настоящего изобретения обеспечивается система по любому из вариантов осуществления настоящего изобретения с тридцать седьмого по тридцать девятый, причем упомянутая сеть передачи данных представляет собой одно из локальная сеть (LAN), глобальная сеть (WAN), информационно-телекоммуникационная сеть Интернет, виртуальная частная сеть (VPN).In the fortieth embodiment of the present invention, there is provided a system according to any one of the embodiments of the present invention from thirty-seventh to thirty-ninth, said data network being one of a local area network (LAN), wide area network (WAN), information and telecommunication network Internet, virtual private network (VPN).

В сорок первом варианте осуществления настоящего изобретения обеспечивается машиночитаемый носитель данных, содержащий код программы, который при выполнении побуждает процессор или процессоры устройства, с которым взаимодействует машиночитаемый носитель данных, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый.In a forty-first embodiment of the present invention, there is provided a computer-readable storage medium comprising program code that, upon execution, causes a processor or processors of a device with which the computer-readable storage medium is interacting to perform method steps according to any one of embodiments of the present invention from twenty-ninth to thirty-fourth.

ДЕТАЛЬНОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙDETAILED DESCRIPTION OF THE DRAWINGS

Описанные в данном разделе возможные осуществления вариантов настоящего изобретения представлены на неограничивающих объем правовой охраны примерах, применительно к конкретным вариантам осуществления настоящего изобретения, которые во всех их аспектах предполагаются иллюстративными и не накладывающими ограничения. Альтернативные варианты реализации настоящего изобретения, не выходящие за пределы объема его правовой охраны, являются очевидными специалистам в данной области, имеющим обычную квалификацию, на которых это изобретение рассчитано.The possible implementations of the embodiments of the present invention described in this section are presented in non-limiting examples, with reference to specific embodiments of the present invention, which in all their aspects are assumed to be illustrative and not limiting. Alternative embodiments of the present invention, not beyond the scope of its legal protection, are obvious to experts in this field with the usual qualifications on which this invention is intended.

На фиг. 1 в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 100 преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке. Заявленный способ 100 преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке характеризуется выполнением этапа 101 формирования исходной структуры данных структурированного исходного массива данных, на котором формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой структурно-сложные языковые конструкции, состоящие из структурно-сложных языковых конструкций, содержащих контекстные термины, и структурно-сложных языковых конструкций, не содержащих контекстные термины, и структурно-простые языковые конструкции, содержащие структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины. На этапе 101 формирования исходной структуры данных структурированного исходного массива данных осуществляют анализ элементов структурированного исходного массива данных для выявления наличия в нем исходных элементов исходной структуры данных структурированного исходного массива данных. В результате проведенного анализа осуществляется формирование исходной структуры данных структурированного исходного массива данных, состоящей из структурно-сложных и структурно-простых языковых конструкций - предложений и рубрик перечисления. Идентификация структурно-сложных языковых конструкций осуществляется в соответствии с первым критерием идентификации, который представляет собой критерий идентификации по первому типу комбинации знаков препинания. Первый тип комбинации знаков препинания характеризуется наличием следующих признаков структурно-сложной языковой конструкции:In FIG. 1, by way of example, but not limitation, a general flowchart of the steps of the claimed method 100 for transforming a structured source data array containing at least natural language text is depicted. The claimed method 100 for converting a structured source data array containing at least natural language text is characterized by performing step 101 of generating an initial data structure of a structured source data array, on which an initial data structure of a structured source data array containing the original elements of the original data structure is formed, moreover, the said initial elements are structurally complex linguistic constructions consisting of structurally complex linguistic constructs containing contextual terms, and structurally complex linguistic constructs not containing contextual terms, and structurally simple linguistic constructs containing structurally simple linguistic constructs containing contextual terms, and structurally simple linguistic constructs that do not contain contextual terms. In step 101 of generating the initial data structure of the structured source data array, an analysis of the elements of the structured source data array is performed to determine if it contains the source elements of the original data structure of the structured source data array. As a result of the analysis, the initial data structure of the structured initial data array is formed, which consists of structurally complex and structurally simple language structures - sentences and enumeration headings. The identification of structurally complex language structures is carried out in accordance with the first identification criterion, which is an identification criterion for the first type of combination of punctuation marks. The first type of combination of punctuation marks is characterized by the presence of the following features of a structurally complex language structure:

а) структурно-сложная языковая конструкция состоит из нескольких текстовых фрагментов;a) structurally complex linguistic construction consists of several text fragments;

б) в первом текстовом фрагменте имеется последний символ первого текстового фрагмента - знак пунктуации «:» («двоеточие»);b) in the first text fragment there is the last character of the first text fragment - the punctuation mark “:” (“colon”);

в) после знака пунктуации «:» расположен знак форматирования (знак типографики) - «¶» («абзац»);c) after the punctuation mark “:” there is a formatting character (typographic character) - “¶” (“paragraph”);

г) после знака пунктуации «:» первого текстового фрагмента расположены вторые текстовые фрагменты, каждый из которых расположен на новой строке - красной строке абзаца;d) after the punctuation mark “:” of the first text fragment, the second text fragments are located, each of which is located on a new line - the red line of the paragraph;

д) каждый из вторых текстовых фрагментов начинается с прописной буквы;e) each of the second text fragments begins with a capital letter;

ж) каждый из вторых текстовых фрагментов может начинаться с маркера списка - знака форматирования (знака типографики), используемого для выделения элементов списка (рубрик перечисления);g) each of the second text fragments can begin with a list marker - a formatting character (typographic sign) used to highlight list items (listing headings);

з) каждый из вторых текстовых фрагментов может начинаться с маркера нумерации - цифры или буквы, с круглой скобкой или точкой;h) each of the second text fragments may begin with a numbering marker - numbers or letters, with a parenthesis or period;

и) количество вторых текстовых фрагментов, располагающихся на красных строках абзацев, должно быть не менее двух.i) the number of second text fragments located on the red lines of paragraphs must be at least two.

При этом структурно-простыми языковыми конструкциями являются такие элементы исходной структуры данных, в которых комбинация знаков препинания не соответствует первому критерию, т.е. такие элементы исходной структуры данных удовлетворяют критерию идентификации по второму типу комбинации знаков препинания, причем второй тип комбинации знаков препинания представляет собой все комбинации знаков препинания, за исключением комбинаций знаков препинания первого типа. Идентификация структурно-простых языковых конструкций производится путем выявления в тексте на естественном языке признаков окончания предложения - знаков препинания «.» («точка»), «…» («многоточие») и т.п., - в совокупности с признаками начала следующего предложения - заглавной буквы, цифры и т.п., учитывая также наличие и определенные сочетания знаков препинаний, а именно - знаков пунктуации («.» («точка»), «;» («точка с запятой»), «…» («многоточие»), «,» («запятая»), «(» («открывающая скобка»), «)» («закрывающая скобка»), «:» («двоеточие») и т.п.), словоразделителей (« » («пробел»), «-» («тире»), и т.п.) и типографики («¶» («абзац»), номер, «°» («градус») и т.п.).At the same time, structurally simple language constructs are those elements of the initial data structure in which the combination of punctuation marks does not meet the first criterion, i.e. such elements of the original data structure satisfy the identification criterion for the second type of punctuation mark combination, the second type of punctuation mark combination being all punctuation mark combinations, except for punctuation mark combinations of the first type. The identification of structurally simple linguistic constructions is carried out by identifying in the natural language text the signs of the end of the sentence - punctuation marks “.” (“Dot”), “...” (“ellipsis”), etc., in conjunction with the signs of the beginning of the next sentences - capital letters, numbers, etc., taking into account the presence and certain combinations of punctuation marks, namely punctuation marks (“.” (“dot”), “;” (“semicolon”), “...” (“Ellipsis”), “,” (“comma”), “(” (“opening bracket”), “)” (“closing bracket”), “:” (“colon”), etc.), from water separators (“” (“space”), “-” (“dash”), etc.) and typography (“¶” (“paragraph”), number, “°” (“degree”), etc. P.).

Так же способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 102 идентификации контекстных терминов и формирования базы данных контекстных терминов, на котором идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины. На данном этапе идентифицируется комбинации контекстных терминов первого типа, контекстных терминов второго типа, контекстных терминов третьего типа, которые в результате идентифицируются как контекстные понятия, контекстно-обобщенные понятия и контекстные ссылки. Идентификация по критерию комбинации контекстных терминов первого типа позволяет идентифицировать контекстные понятия. Контекстные понятия - это однословный или многословный термин, не имеющий самостоятельного смыслового значения, истинный смысл которого проясняется с помощью другого, синонимичного или ассоциативного термина (группы терминов), находящегося в том же предложении, что и контекстное понятие, или в предыдущих предложениях. Идентификация по критерию комбинации контекстных терминов второго типа позволяет идентифицировать контекстно-обобщенные понятия. Контекстно-обобщенные понятия - это однословные или многословные термины, один из которых является обобщающим словом, а другие - обобщенными словами, - при этом термин, являющийся обобщающим словом, включает в себя лексическое значение ряда однородных членов (обобщенных слов) и отвечающих на тот же вопрос, что и однородные члены. Идентификация по критерию комбинации контекстных терминов третьего типа позволяет идентифицировать контекстные ссылки. Контекстные ссылки - это многословный термин, не имеющий самостоятельного смыслового значения, который явно или неявно ссылается на другие предложения, в которых содержатся смысловое значение данного термина. При этом явной контекстной ссылкой считается ссылка, в которой указано точное местонахождение смыслового значения (например - требования, указанные в Статье 12 п. 2 Закона РФ от 07.02.1992 г. N 2300-1 «О защите прав потребителей» - «Продавец (исполнитель), не предоставивший покупателю полной и достоверной информации о товаре (работе, услуге), несет ответственность, предусмотренную пунктами 1-4 статьи 18 или пунктом 1 статьи 29 настоящего Закона, за недостатки товара (работы, услуги), возникшие после его передачи потребителю вследствие отсутствия у него такой информации.»). Если в контекстной ссылке нет точного указания места нахождения смыслового значения, то такая ссылка является неявной контекстной ссылкой, причем «степень неявности» неявной контекстной ссылки является величиной обратно пропорциональной величине «степени точности» указания на место нахождения смыслового значения. Примером неявной контекстной ссылки, обладающей «максимальной степенью неявности» может служить контекстная ссылка вида «указанные требования». В результате идентификации контекстных терминов выявляются, собственно, контекстные термины и термины, проясняющие их смысловое значение. Между контекстными терминами и терминами, проясняющими их смысловое значение, регистрируется контекстная связь, которая является причиной формирования соответствующих записей в базе данных контекстных терминов. На основании информации, содержащейся в базе данных контекстных терминов, становится возможным осуществление специальных преобразований (лингвистических и иных преобразований) над предложениями, содержащими контекстные термины, с целью обеспечения ясности и однозначности понимания контекстных терминов. Контекстные термины, идентифицированные в предложениях, при этом не обязательно удаляются из предложений и могут остаться в них, но при этом их смысловое значение будет ясным и однозначным, т.к. это значение будет прояснено в соответствующих контекстных справочниках (справочнике контекстных понятий, справочнике контекстно-обобщенных понятий, справочнике контекстных ссылок).Also, the method 100 for converting a structured source data array is characterized by performing a step 102 of identifying context terms and forming a database of context terms, where context terms are identified in said source elements and forming a context terms database containing said identified context terms. At this stage, combinations of contextual terms of the first type, contextual terms of the second type, contextual terms of the third type, which as a result are identified as contextual concepts, contextually generalized concepts and contextual links, are identified. Identification by the criterion of a combination of contextual terms of the first type allows the identification of contextual concepts. Contextual concepts are a one-word or verbose term that does not have an independent semantic meaning, the true meaning of which is clarified with the help of another, synonymous or associative term (group of terms), located in the same sentence as the contextual concept, or in previous sentences. Identification by the criterion of a combination of contextual terms of the second type allows the identification of contextually generalized concepts. Contextually generalized concepts are single-word or verbose terms, one of which is a generalizing word, and the other is generalized words, while the term being a generalizing word includes the lexical meaning of a number of homogeneous members (generalized words) and responding to the same the question is that of homogeneous members. Identification by the criterion of a combination of contextual terms of the third type allows the identification of contextual links. Contextual links are a verbose term that does not have an independent semantic meaning, which explicitly or implicitly refers to other sentences that contain the semantic meaning of this term. In this case, the link in which the exact location of the semantic meaning is indicated (for example, the requirements specified in Article 12, paragraph 2 of the Law of the Russian Federation of 07.02.1992 N 2300-1 “On Protection of Consumer Rights” - “Seller (executor ), which did not provide the buyer with complete and reliable information about the product (work, service), is liable under paragraphs 1-4 of article 18 or paragraph 1 of article 29 of this Law for defects in the goods (work, service) that arose after its transfer to the consumer due to his lack of it oh information. ”). If the contextual link does not indicate the exact location of the meaning, then such a link is an implicit contextual link, and the “degree of implicitness” of the implicit contextual link is inversely proportional to the value of the “degree of accuracy” of the location of the meaning. An example of an implicit contextual link with a “maximum degree of implicitity” is a contextual link of the form “specified requirements”. The identification of contextual terms reveals, in fact, contextual terms and terms that clarify their semantic meaning. Between contextual terms and terms that clarify their semantic meaning, a contextual relationship is recorded, which is the reason for the formation of the corresponding entries in the database of contextual terms. Based on the information contained in the database of contextual terms, it becomes possible to carry out special transformations (linguistic and other transformations) over sentences containing contextual terms in order to ensure clarity and unambiguity of understanding of contextual terms. Contextual terms identified in sentences are not necessarily removed from sentences and may remain in them, but their meaning will be clear and unambiguous, as this meaning will be clarified in the relevant contextual reference books (reference book of contextual concepts, reference book of contextually generalized concepts, reference book of contextual links).

Так же способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 103 идентификации элементов исходной структуры данных, на котором, используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины и структурно-простые языковые конструкции, не содержащие контекстные термины. На основании информации, содержащейся в базе данных контекстных терминов, идентифицируются исходные элементы исходной структуры данных структурированного исходного массива данных. На данном этапе, осуществляется однозначная идентификация исходных элементов и их группировка по признакам наличия или отсутствия в них контекстных терминов и типу исходного элемента. Таким образом, однозначно идентифицируются структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины.Also, the method 100 for converting a structured source data array is characterized by performing a step 103 of identifying the elements of the original data structure, in which, using the information contained in said generated database of context terms, structurally complex language constructs containing context terms are identified in said initial data structure, structurally complex linguistic constructions that do not contain contextual terms, structurally simple linguistic constructions containing conte stnye terms and structurally simple language constructs that do not contain contextual terms. Based on the information contained in the database of contextual terms, the initial elements of the initial data structure of the structured initial data array are identified. At this stage, an unambiguous identification of the source elements and their grouping is carried out according to the signs of the presence or absence of contextual terms in them and the type of the source element. Thus, structurally complex linguistic constructs containing contextual terms, structurally complex linguistic constructs not containing contextual terms, structurally simple linguistic constructs containing contextual terms, and structurally simple linguistic constructs not containing contextual terms are uniquely identified.

Так же способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 104 преобразования первого типа, на котором осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины. Структурно-сложные языковые конструкции, не содержащие контекстные термины, подвергаются преобразованиям с целью преобразования рубрик перечисления в предложения. В процессе таких преобразований осуществляется преобразование структурно-сложных языковых конструкций, не содержащих контекстные термины, в структурно-простые языковые конструкции, являющиеся предложениями в обычном понимании этого термина. Данное преобразование носит изначально форматный характер, т.е. неформатный текст структурно-сложной языковой конструкции преобразуется в форматный, т.е. соответствующий грамматическому понятию предложения. Для устранения грамматических и орфографических ошибок, связанных с преобразованием структурно-сложных языковых конструкций, не содержащих контекстные термины, в структурно-простые языковые конструкции, осуществляются лингвистические преобразования. Лингвистические преобразования над созданными структурно-простыми языковыми конструкциями связаны с восстановлением правильной грамматики и орфографии. Под указанными лингвистическими преобразованиями понимается: а) согласование родов, чисел, падежей; б) правка (замена и удаление) несоответствующих знаков препинания. Все вышеуказанные преобразования, производимые над структурно-сложными языковыми конструкциями, не содержащими контекстные термины, являются преобразованиями первого типа.Also, the method 100 for converting a structured source data array is characterized by performing a first type conversion step 104, where the first type is converted over said structurally complex language constructs that do not contain contextual terms to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms. Structurally complex linguistic constructions that do not contain contextual terms are subjected to transformations with the aim of transforming enumeration headings into sentences. In the process of such transformations, structurally complex linguistic constructions that do not contain contextual terms are converted into structurally simple linguistic constructions that are sentences in the usual sense of the term. This conversion is initially formatted in nature, i.e. non-formatted text of a structurally complex linguistic structure is converted into formatted, i.e. corresponding to the grammatical concept of the sentence. To eliminate grammatical and spelling errors associated with the conversion of structurally complex language structures that do not contain contextual terms into structurally simple language structures, linguistic transformations are carried out. Linguistic transformations over created structurally simple linguistic constructions are associated with the restoration of correct grammar and spelling. The indicated linguistic transformations are understood as: a) the coordination of sorts, numbers, cases; b) editing (replacement and removal) of inappropriate punctuation marks. All the above transformations performed on structurally complex language constructs that do not contain contextual terms are transformations of the first type.

Так же способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 105 преобразования второго типа, на котором осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины. Структурно-простые языковые конструкции, содержащие контекстные термины, подвергаются преобразованиям с целью структурирования и прояснения смыслового содержания контекстных терминов. В процессе таких преобразований осуществляется преобразование структурно-простых языковых конструкций, содержащих контекстные термины, в грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины. Данное преобразование носит структурно-лингвистический характер, т.е. оно связано с фактической заменой или удалением из текста структурно-простой языковой конструкции, содержащей контекстные термины, всех или части контекстных терминов и фактической заменой удаленных терминов другими терминами, которые являются смысловым содержанием контекстных терминов. Кроме этого упомянутое преобразование может быть связано с дополнением текста структурно-простой языковой конструкции, содержащей контекстные термины, формированием новой записи в соответствующем контекстном справочнике. Для каждого типа контекстных терминов применяется свой тип преобразования. Так для контекстных понятий применяется первое преобразование второго типа, для контекстно-обобщенных понятий - второе преобразование второго типа, для контекстных ссылок - третье преобразование второго типа. По результатам преобразований контекстных терминов осуществляется лингвистическое преобразование для устранения грамматических и орфографических ошибок, связанных с преобразованием структурно-простых языковых конструкций, содержащих контекстные термины, в структурно-простые языковые конструкции, не содержащие контекстных терминов. Лингвистические преобразования над созданными структурно-простыми языковыми конструкциями, не содержащими контекстные термины, связаны с восстановлением правильной грамматики и орфографии. Под указанными лингвистическими преобразованиями понимается: а) согласование родов, чисел, падежей; б) правка (замена и удаление) несоответствующих знаков препинания. Все вышеуказанные преобразования являются преобразованиями второго типа. Первые преобразования второго типа осуществляются над контекстными понятиями и выявленными терминами, проясняющими смысловое значение контекстных понятий. Указанные выявленные термины могут являться либо контекстными синонимами, либо контекстными ассоциациями. Контекстный синоним - это синоним, который может употребляться как синоним только в данном контексте. Например, в предложении: «Изготовитель - это организация независимо от ее организационно-правовой формы», - контекстный термин «ее» является, собственно, контекстным понятием, а выявленный термин «организация» является его контекстным синонимом. Первое преобразование второго типа обеспечивает формирование справочника контекстных понятий, который, в свою очередь, обеспечивает ясность смыслового значения контекстных понятий. Так же за счет первого преобразования второго типа обеспечивается лингвистическая корректировка текста путем замещения контекстных понятий контекстным синонимом или контекстной ассоциацией. Например, предложение: «Изготовитель - это организация независимо от ее организационно-правовой формы», - посредством осуществления над ним первого преобразования второго типа будет преобразовано в предложение: «Изготовитель - это организация независимо от организационно-правовой формы организации». Контекстные ассоциации отличаются от контекстных синонимов тем, что они, как правило, представляют собой более сложную текстовую конструкцию, состоят из нескольких терминов и редко встречаются в одном предложении с контекстным понятием, но чаще в других предложениях. Вторые преобразования второго типа осуществляются над контекстно-обобщенными понятиями. При этом под контекстно-обобщенными понятиями понимают обобщающее слово (обобщающий термин) и однородные слова (однородные термины), а также группу однородных слов (группу слов без обобщающего слова). Обобщающее слово - это слово или словосочетание, которое является общим для расположенных вблизи обобщающего слова однородных слов или словосочетаний. При этом однородными словами (словосочетаниями) в контексте настоящего изобретения называются такие члены предложения, которые зависят от одного и того же слова и отвечают на один и тот же вопрос (т.е. являются однородными членами предложения). При этом обобщающее слово является тем же типом членов предложения, что и однородные с ним слова или словосочетания. Значительная часть предложений, осложненных однородными членами, может быть представлена как результат «сочинительного сокращения» ряда самостоятельных предложений. Второе преобразование второго типа обеспечивает удаление всех однородных с обобщающим словом терминов из анализируемого предложения, за счет чего в предложении остается только тот термин, который является обобщающим термином. При этом формируется справочник контекстно-обобщенных понятий, который содержит выявленный обобщающий термин и все соответствующие ему однородные слова - обобщенные слова (обобщенные понятия). Помимо этого, второе преобразование второго типа обеспечивает лингвистическую корректировку предложения путем создания новых предложений, в которых используются обобщенные понятия вместо обобщающего термина. Например, в предложении: «Исполнитель - это организация, выполняющая работы или оказывающая услуги потребителям по возмездному договору», - присутствуют однородные слова (однородные термины) - термин «выполняющая работы» и термин «оказывающая услуги». В данном примере, за счет второго преобразования второго типа обеспечится формирование записи в справочнике контекстно-обобщенных понятий, содержащей указание на то, что термин «выполняющая работы» является обобщающим термином, и термин «оказывающая услуги» является «обобщенным понятием». При этом из предложения будет удалено обобщенное понятие, т.е. термин «оказывающая услуги». Таким образом, преобразуемое предложение будет упрощено и преобразовано в предложение: «Исполнитель - это организация, выполняющая работы потребителям по возмездному договору». Посредством второго преобразования второго типа формируется дополнительное предложение, в котором вместо термина «выполняющая работы» присутствует термин «оказывающая услуги». Таким образом, вместо одного предложения с контекстно-обобщенными терминами формируется два предложения без контекстных терминов, а именно - предложение «Исполнитель - это организация, выполняющая работы потребителям по возмездному договору» и предложение «Исполнитель - это организация, оказывающая услуги потребителям по возмездному договору». Третье преобразование второго типа осуществляется над контекстными ссылками. Методологически третье преобразование второго типа аналогично первому преобразованию второго типа, осуществляемому над контекстными понятиями. Однако при этом, смысловое значение контекстной ссылки определяется иным образом. Принципиальная разница между первым преобразованием второго типа и третьим преобразованием второго типа заключается в том, что в предложении, в котором содержится контекстная ссылка, как правило, очевидно, что именно является предметом контекстной ссылки. Например, для предложения с неявной контекстной ссылкой - «указанные требования», - очевидно, что предметом контекстной ссылки являются, некоторые «требования». При этом зачастую предложения содержат и более подробную информацию о предмете контекстной ссылки (смысловом значении). Посредством третьего преобразования второго типа, как и в случае с первым преобразованием второго типа, обеспечивается формирование справочника контекстных ссылок, который позволяет уяснить смысловое значение контекстной ссылки. Однако в отличие от первого преобразования второго типа посредством третьего преобразования второго типа не может быть осуществлена лингвистическая корректировка предложения путем замещения контекстной ссылки ее смысловым значением главным образом по причине того, что смысловое значение по объему символов существенно превышает контекстную ссылку.Also, the method 100 for converting a structured source data array is characterized by performing a second type conversion step 105, in which the second type is converted over said structurally simple language constructs containing contextual terms to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms. Structurally simple language constructs containing contextual terms are transformed in order to structure and clarify the semantic content of contextual terms. In the process of such transformations, structurally simple linguistic constructions containing contextual terms are transformed into grammatically and spelling-correct structurally simple linguistic constructions that do not contain contextual terms. This transformation is structurally linguistic in nature, i.e. it is associated with the actual replacement or removal from the text of a structurally simple language construct containing contextual terms, all or part of contextual terms and the actual replacement of deleted terms with other terms that are the semantic content of contextual terms. In addition, the mentioned transformation may be associated with the addition of the text of a structurally simple language construct containing contextual terms, the formation of a new entry in the corresponding contextual reference. Each type of contextual term applies its own type of transformation. So for contextual concepts, the first transformation of the second type is used, for contextually generalized concepts - the second transformation of the second type, for contextual references - the third transformation of the second type. According to the results of transformations of contextual terms, a linguistic conversion is carried out to eliminate grammatical and spelling errors associated with the conversion of structurally simple language constructs containing contextual terms into structurally simple language constructs that do not contain contextual terms. Linguistic transformations over created structurally simple language constructs that do not contain contextual terms are associated with the restoration of correct grammar and spelling. The indicated linguistic transformations are understood as: a) the coordination of sorts, numbers, cases; b) editing (replacement and removal) of inappropriate punctuation marks. All of the above transformations are transformations of the second type. The first transformations of the second type are carried out over contextual concepts and revealed terms that clarify the semantic meaning of contextual concepts. These identified terms can be either contextual synonyms or contextual associations. A context synonym is a synonym that can be used as a synonym only in this context. For example, in the sentence: “A manufacturer is an organization regardless of its legal form,” the contextual term “her” is, in fact, a contextual concept, and the identified term “organization” is its contextual synonym. The first transformation of the second type provides the formation of a directory of contextual concepts, which, in turn, provides clarity of the semantic meaning of contextual concepts. Also, due to the first transformation of the second type, linguistic text correction is provided by replacing contextual concepts with a contextual synonym or contextual association. For example, the sentence: “A manufacturer is an organization regardless of its legal form”, through the implementation of the first transformation of the second type on it will be transformed into a sentence: “A manufacturer is an organization regardless of the legal form of organization”. Contextual associations differ from contextual synonyms in that they, as a rule, represent a more complex text structure, consist of several terms and are rarely found in one sentence with a contextual concept, but more often in other sentences. The second transformations of the second type are carried out over contextually generalized concepts. Moreover, context-generalized concepts mean a generalizing word (generalizing term) and homogeneous words (homogeneous terms), as well as a group of homogeneous words (a group of words without a generalizing word). A generalizing word is a word or phrase that is common to homogeneous words or phrases located near the generalizing word. In this case, homogeneous words (phrases) in the context of the present invention are those members of the sentence that depend on the same word and answer the same question (i.e. they are homogeneous members of the sentence). Moreover, a generalizing word is the same type of sentence members as words or phrases homogeneous with it. A significant part of the proposals complicated by homogeneous members can be presented as a result of the “compositional reduction” of a number of independent proposals. The second transformation of the second type removes all terms that are homogeneous with the generalizing word from the analyzed sentence, due to which only the term that is the generalizing term remains in the sentence. In this case, a directory of contextually generalized concepts is formed, which contains the identified generalizing term and all the homogeneous words corresponding to it - generalized words (generalized concepts). In addition, the second transformation of the second type provides a linguistic adjustment of the sentence by creating new sentences that use generalized concepts instead of a generalizing term. For example, in the sentence: “The Contractor is an organization that performs work or provides services to consumers under a reimbursable contract”, there are homogeneous words (homogeneous terms) - the term “performing work” and the term “providing services”. In this example, due to the second transformation of the second type, an entry will be generated in the directory of contextually generalized concepts containing an indication that the term “performing work” is a generalizing term, and the term “providing services” is a “generalized concept”. In this case, the generalized concept, i.e. the term "providing services". Thus, the converted proposal will be simplified and converted into a proposal: “The Contractor is an organization that performs work for consumers under a reimbursable contract.” By means of the second conversion of the second type, an additional sentence is formed in which, instead of the term “performing work”, the term “providing services” is present. Thus, instead of a single sentence with contextually generalized terms, two sentences are formed without contextual terms, namely, the sentence “Contractor is an organization that performs work for consumers under a reimbursable contract” and the sentence “Contractor is an organization that provides services to consumers under a reimbursable contract” . The third conversion of the second type is performed on contextual links. Methodologically, the third transformation of the second type is similar to the first transformation of the second type carried out on contextual concepts. However, in this case, the semantic meaning of the contextual link is determined differently. The fundamental difference between the first conversion of the second type and the third conversion of the second type is that in a sentence that contains a contextual link, as a rule, it is obvious what exactly is the subject of the contextual link. For example, for a proposal with an implicit contextual link - “specified requirements”, it is obvious that the subject of the contextual link is some “requirements”. Moreover, often offers contain more detailed information about the subject of a contextual link (meaning). By means of the third conversion of the second type, as in the case of the first conversion of the second type, the formation of a contextual reference guide is provided, which allows one to understand the semantic meaning of the contextual link. However, unlike the first conversion of the second type, by means of the third conversion of the second type, a linguistic correction of the sentence by replacing the contextual link with its semantic value cannot be carried out mainly because the semantic value significantly exceeds the contextual link in terms of character size.

Так же способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 106 преобразования третьего типа, на котором осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины. Преобразование третьего типа - это совокупность преобразований первого типа и преобразований второго типа, применяемая к структурно-сложным языковым конструкциям, содержащим контекстные термины. Преобразование третьего типа при этом является двухэтапным преобразованием. На первом этапе над структурно-сложными языковыми конструкциями, содержащими контекстные термины, осуществляется преобразование первого типа, за счет которого осуществляется преобразование структурно-сложной языковой конструкции, содержащей контекстные термины, в структурно-простую языковую конструкцию, содержащую контекстные термины. На втором этапе над структурно-простыми языковыми конструкциями, содержащими контекстные термины, осуществляется соответствующее преобразование второго типа. В результате двухэтапного преобразования структурно-сложные языковые конструкции, содержащие контекстные термины, преобразуются в грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины.Also, the method 100 for converting a structured source data array is characterized by performing a third type conversion step 106, in which the third type is converted over said structurally complex language constructs containing contextual terms to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms. A transformation of the third type is a combination of transformations of the first type and transformations of the second type, applied to structurally complex language constructs containing contextual terms. The conversion of the third type is a two-stage conversion. At the first stage, structurally complex linguistic constructions containing contextual terms are converted to the first type, due to which the structurally complex linguistic construct containing contextual terms is converted to a structurally simple linguistic construct containing contextual terms. At the second stage, structurally simple linguistic constructions containing contextual terms are subjected to the corresponding transformation of the second type. As a result of a two-stage transformation, structurally complex linguistic constructions containing contextual terms are converted into grammatically and spelling-correct structurally simple linguistic constructions that do not contain contextual terms.

Так же способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 107 формирования итоговой структуры данных структурированного исходного массива данных, на котором формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины. Итоговая структура данных формируется из: структурно-простых языковых конструкций, не содержащих контекстные термины; структурно-простых языковых конструкций, не содержащих контекстные термины, полученных путем преобразования структурно-сложных языковых конструкций, не содержащих контекстные термины; структурно-простых языковых конструкций, не содержащих контекстные термины, полученных путем преобразования структурно-простых языковых конструкций, содержащих контекстные термины; структурно-простых языковых конструкций, не содержащих контекстные термины, полученных путем преобразования структурно-сложных языковых конструкций, содержащих контекстные термины. Фактически итоговая структура данных состоит из элементов - грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины, которые с лингвистической точки зрения являются предложениями, не содержащими контекстные термины.Also, the method 100 for converting a structured source data array is characterized by performing step 107 of generating the final data structure of the structured source data array, which forms the final data structure of the structured source data array containing elements of the final data structure, the elements of the final data structure being structurally simple language constructions that do not contain contextual terms and obtained through transformations of the first, second, and third of the types of grammatically and spelling correct structurally simple language constructs that do not contain contextual terms. The final data structure is formed from: structurally simple language constructs that do not contain contextual terms; structurally simple language constructs that do not contain contextual terms obtained by converting structurally complex language constructs that do not contain contextual terms; structurally simple language constructs that do not contain contextual terms obtained by converting structurally simple language constructs containing contextual terms; structurally simple language constructs that do not contain contextual terms, obtained by converting structurally complex language constructs containing contextual terms. In fact, the final data structure consists of elements — grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms, which from a linguistic point of view are sentences that do not contain contextual terms.

На фиг. 2 в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 200 преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке. Заявленный способ 200 преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, в отличие от способа 100 преобразования структурированного исходного массива данных, дополнительно характеризуется выполнением этапа 201 формирования первой структуры данных, на котором на основании полученной на этапе 107 формирования итоговой структуры данных структурированного исходного массива данных формируют первую структуру данных структурированного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных, представляющие собой элементы итоговой структуры данных структурированного исходного массива данных, содержат первые логические разделы и вторые логические разделы; выполнением этапа 202 формирования базы данных логических связей логических разделов, на котором формируют базу данных логических связей логических разделов упомянутых элементов первой структуры данных; выполнением этапа 203 формирования второй структуры данных, на котором формируют вторую структуру данных структурированного массива данных, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных содержат логические конструкции логических разделов упомянутых элементов первой структуры данных, сформированные с использованием информации из упомянутой базы данных логических связей логических разделов, причем упомянутые логические разделы содержат первые семантические части и вторые семантические части; выполнением этапа 204 формирования базы данных семантических частей логических разделов, на котором формируют базу данных семантических частей логических разделов из упомянутых вторых семантических частей, причем упомянутые вторые семантические части исключаются из соответствующих упомянутых логических разделов; выполнением этапа 205 формирования грамматически и орфографически верных семантических частей, на котором формируют грамматически и орфографически верные семантические части упомянутых логических разделов путем лингвистических преобразований над упомянутыми семантическими частями; и выполнением этапа 206 формирования результирующей структуры данных, на котором формируют результирующую структуру данных структурированного массива данных, содержащую элементы упомянутой результирующей структуры данных, причем упомянутые элементы результирующей структуры данных содержат логические конструкции, содержащие, по меньшей мере, упомянутые грамматически и орфографически верные семантические части логических разделов.In FIG. 2 as an example, but not limitation, depicts a General diagram of the steps of the claimed method 200 for converting a structured source data array containing at least natural language text. The claimed method 200 for converting a structured source data array containing at least natural language text, in contrast to the method 100 for converting a structured source data array, is further characterized by the execution of step 201 of generating the first data structure, based on which obtained on the basis of formation 107 the final data structure of the structured source data array form the first data structure of the structured data array containing the elements yanutoy first data structure, said elements of the first data structures representing the final elements of the data structure of a structured data source array comprise first and second logical partitions are logical partitions; performing step 202 of forming a database of logical connections of logical partitions, on which a database of logical connections of logical partitions of said elements of the first data structure is formed; performing step 203 of generating a second data structure, which forms a second data structure of a structured data array containing elements of said second data structure, said elements of the second data structure containing logical structures of logical partitions of said elements of the first data structure generated using information from said database logical connections of logical sections, moreover, the mentioned logical sections contain the first semantic parts and second semantic part; performing step 204 of forming a database of semantic parts of logical partitions, on which a database of semantic parts of logical partitions from said second semantic parts is formed, said second semantic parts being excluded from corresponding logical partitions; performing step 205 of forming grammatically and spelling correct semantic parts, in which grammatically and spelling correct semantic parts of said logical sections are formed by linguistic transformations over said semantic parts; and performing step 206 of generating the resulting data structure, which forms the resulting data structure of the structured data array containing the elements of said resultant data structure, said elements of the resulting data structure containing logical constructs containing at least the grammatically and spelling-correct semantic parts of the logical sections.

На фиг. 3 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 201 формирования первой структуры данных. Этап 201 характеризуется выполнением этапа 2011 идентификации исходной структуры, на котором идентифицируют итоговую структуру данных 1 структурированного массива данных; выполнением этапа 2012 идентификации элементов, на котором идентифицируют элементы 11 итоговой структуры данных 1; выполнением этапа 2013 идентификации логических разделов, на котором идентифицируют первые логические разделы 111 элементов 11 итоговой структуры данных 1 и вторые логические разделы 112 элементов 11 итоговой структуры данных 1; и выполнением этапа 2013 формирования первой структуры данных, на котором формируют первую структуру данных 2 структурированного исходного массива данных, содержащую элементы 21 первой структуры данных, которые являются элементами 11 итоговой структуры данных 1, причем элементы 21 первой структуры данных 2 содержат первые логические разделы 111 элементов 11 итоговой структуры данных 1, и содержащую элементы 22 первой структуры данных, причем элементы 22 первой структуры данных 2 содержат вторые логические разделы 112, элементов 11 итоговой структуры данных 1.In FIG. 3, by way of example, but not limitation, a general flowchart of the steps of step 201 of generating the first data structure is shown. Step 201 is characterized by performing step 2011 of identifying the source structure, in which the resulting data structure 1 of the structured data array is identified; performing element identifying step 2012, wherein elements 11 of the final data structure 1 are identified; the implementation of the stage 2013 identification of logical partitions, which identify the first logical partitions 111 of the elements 11 of the final data structure 1 and the second logical sections 112 of the elements 11 of the final data structure 1; and the implementation of the stage 2013 of the formation of the first data structure, which forms the first data structure 2 of the structured source data array containing the elements 21 of the first data structure, which are elements 11 of the final data structure 1, the elements 21 of the first data structure 2 containing the first logical sections 111 elements 11 of the final data structure 1, and containing elements 22 of the first data structure, and elements 22 of the first data structure 2 contain second logical sections 112, elements 11 of the final structure 1 data.

На фиг. 4 в качестве примера, но не ограничения, изображена общая структура итоговой структуры данных 1, из которой формируется первая структура данных 2. Итоговая структура данных 1 представляет собой полученную на этапе 107 итоговую структуру данных, которая, в свою очередь, представляет собой структуру данных структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке. Как уже упоминалось выше, такой массив данных может представлять собой, в частности, нормативный правовой акт (НПА). Итоговая структура данных 1 содержит элементы 11, которые представляют собой положения, являющиеся предложениями - грамматически организованными соединениями слов. При этом каждое предложение характеризуется смысловой законченностью, т.к. является элементом итоговой структуры данных, полученной на этапе 107. Идентификация предложений на этапе 2012 идентификации элементов производится путем выявления в тексте на естественном языке признаков окончания предложения. Признаками окончания предложения при этом являются: точка, точка с запятой, многоточие и т.п.Идентификация предложений осуществляется в совокупности с выявлением признаков начала предложения. Признаками начала предложения являются: заглавная буква, цифра, цифра с закрывающей скобкой, цифра с точкой и т.п. При этом при идентификации также учитывается наличие определенных сочетаний знаков препинаний, а именно знаков пунктуации - точки, запятой, скобки, двоеточия и т.п., - словоразделителей, а именно - пробела и т.п., - и типографики - абзаца, номера, градуса и т.п. На этапе 2012 идентификации элементов осуществляется выявление элементарных смысловых единиц -предложений, являющихся суждениями. Простое суждение - это суждение, никакая часть которого не является суждением. Языковой формой выражения суждения являются повествовательные предложения. Идентификация элементов 11 итоговой структуры данных 1 осуществляется путем выявления и дефрагментации предложения на первичные составляющие предложения, а именно - на слова, частицы, союзы, предлоги и т.п., и знаки препинания. После чего из первичных элементов формируются понятия, выраженные в отдельных словах и/или словосочетаниях на основании различных справочников и словарей. Затем из сформированных понятий формируются простые суждения, которые представляют собой группы взаимосвязанных понятий, при этом взаимосвязанность понятий определяется на основании синтаксических или иных связей между понятиями. Для формирования простых суждений осуществляется лингвистическо-семантический анализ элементов 11 итоговой структуры данных 1, посредством чего в элементах 11 осуществляется выявление структурных элементов простых суждений. Под структурными элементами простых суждений понимаются субъект суждения, предикат суждения, связка и кванторное слово. Субъектом суждения (S) является понятие, выражающее предмет суждения, т.е. то, о чем говорится в данном суждении. Предикатом суждения (Р) является понятие, выражающее ту или иную информацию о предмете суждения. Субъект суждения и предикат суждения - основные структурные элементы суждения, являющиеся терминами суждения. Связь между субъектом суждения и предикатом суждения, отражающая реальные отношения между мыслимыми в понятиях объектами, раскрывается посредством логической связки. В русском языке связка выражается словами: «есть» («не есть»), «является» («не является»), «имеется» («не имеется») и т.д., обозначается тире, двоеточием, а также может подразумеваться, выражаясь согласованием слов («Идет дождь», «Собака лает»). Связка - это логическая постоянная, поскольку в ней заключено неизменное содержание - она всякий раз служит показателем наличия или отсутствия чего-либо у предмета мысли. Кванторное слово (например, «каждый», «все», «ни один», «некоторый» и т.д.) указывает, относится ли информация о предикате суждения ко всему объему понятия, выражающему субъект суждения, или к его части. Например, в суждении «Всякое преступление - противоправное деяние» субъектом суждения является понятие «преступление», предикатом суждения - «противоправное деяние», - связка выражена знаком тире, а кванторное слово «всякое» указывает, на то, что характеристика «противоправное деяние» относится ко всему объему (к каждому элементу) понятия «преступление». В самом общем виде простое суждение можно выразить формулой: «S есть (не есть) Р». Таким образом, в результате идентификации итоговой структуры данных 1 элементы 11 разделяются на то количество суждений, которое в них заложено, т.е. число суждений равно количеству логических разделов в предложении. Далее осуществляется идентификация первых логических разделов 111 и вторых логических разделов 112 элементов 11 итоговой структуры данных 1. Идентификация осуществляется на основании результатов идентификации выявленных суждений, определенных как сложные суждения. Сложные суждения - это группа простых суждений, в которых присутствует связь между отдельными суждениями, установленная с помощью логических союзов «и», «или», «если…, то…», «тогда и только тогда…, когда», «неверно, что…». Виды связей между отдельными суждениями выражаются соответствующими логическими связками и приведены в Таблице 1.In FIG. 4, by way of example, but not limitation, the general structure of the final data structure 1 is shown, from which the first data structure 2 is formed. The final data structure 1 is the final data structure obtained at step 107, which, in turn, is a structured data structure An initial data array containing at least natural language text. As mentioned above, such an array of data may constitute, in particular, a regulatory legal act (NLA). The resulting data structure 1 contains elements 11, which are positions that are sentences - grammatically organized word combinations. Moreover, each sentence is characterized by semantic completeness, because is an element of the final data structure obtained at step 107. The identification of proposals at the stage of 2012 identification of elements is carried out by identifying in the natural language text signs of the end of the sentence. Signs of the end of the sentence are: period, semicolon, ellipsis, etc. Identification of proposals is carried out in conjunction with the identification of signs of the beginning of the proposal. Signs of the beginning of a sentence are: a capital letter, a number, a number with a closing bracket, a number with a period, etc. Moreover, the identification also takes into account the presence of certain combinations of punctuation marks, namely punctuation marks - periods, semicolons, brackets, colons, etc., - word separators, namely space, etc., and typography - paragraph, number , degrees, etc. At the stage 2012 of the identification of elements, the identification of elementary semantic units of sentences, which are judgments, is carried out. A simple judgment is a judgment, no part of which is a judgment. The linguistic form of expression of judgment is narrative sentences. The identification of elements 11 of the final data structure 1 is carried out by identifying and defragmenting the sentence into the primary components of the sentence, namely into words, particles, conjunctions, prepositions, etc., and punctuation marks. After that, concepts expressed in separate words and / or phrases based on various directories and dictionaries are formed from the primary elements. Then, simple judgments are formed from the formed concepts, which are groups of interconnected concepts, while the interconnectedness of concepts is determined on the basis of syntactic or other relationships between the concepts. To form simple judgments, a linguistic-semantic analysis of elements 11 of the final data structure 1 is carried out, whereby elements 11 of simple judgments are identified in elements 11. The structural elements of simple judgments are understood as the subject of judgment, the predicate of judgment, the connective and the quantifier word. The subject of judgment (S) is the concept expressing the subject of judgment, i.e. what is said in this statement. The predicate of judgment (P) is a concept that expresses this or that information about the subject of judgment. The subject of judgment and the predicate of judgment are the basic structural elements of judgment, which are terms of judgment. The connection between the subject of judgment and the predicate of judgment, which reflects the real relationship between objects conceivable in concepts, is revealed through a logical connective. In Russian, the connective is expressed by the words: “is” (“is not”), “is” (“is not”), “is” (“is not available”), etc., is indicated by a dash, a colon, and can also be implied by the agreement of words (“It is raining”, “The dog barks”). A connective is a logical constant, because it contains unchanged content - it always serves as an indicator of the presence or absence of something in the subject of thought. A quantifier word (for example, “everyone”, “all”, “none”, “some”, etc.) indicates whether the information on the predicate of a judgment applies to the entire volume of a concept expressing a subject of a judgment, or to its part. For example, in the proposition “Every crime is an unlawful act”, the subject of the judgment is the concept of “crime”, the predicate of the judgment is “unlawful act”, the connective is expressed by a dash, and the quantifier word “any” indicates that the characteristic “unlawful act” refers to the entire volume (to each element) of the concept of “crime”. In its most general form, a simple proposition can be expressed by the formula: “S is (not is) P”. Thus, as a result of the identification of the final data structure 1, the elements 11 are divided into the number of judgments that are embedded in them, i.e. the number of judgments is equal to the number of logical sections in the sentence. Next, the identification of the first logical sections 111 and the second logical sections 112 of the elements 11 of the final data structure 1. The identification is based on the results of the identification of the identified judgments, defined as complex judgments. Complex judgments are a group of simple judgments in which there is a connection between separate judgments, established using logical conjunctions "and", "or", "if ... then ...", "if and only if ... when", "it’s wrong, what…". Types of relationships between individual judgments are expressed by the corresponding logical connectives and are shown in Table 1.

Figure 00000001
Figure 00000001

Характер связи определяется смыслом логических союзов, который состоит в ответе на вопрос: «При каких условиях сложное суждение будет истинно, а при каких - ложно?». Иначе говоря - при каких сочетаниях истинности и ложности простых суждений, из которых состоит сложное суждение, логический союз определяет истинную связь, а при каких - ложную. Суждение рассматривается как истинное, если даваемое им описание соответствует действительности (реальной ситуации), и как ложное, если не соответствует ей. «Истина» и «ложь» называются истинностными значениями суждения и являются основной логической характеристикой суждений. Смысл логических союзов можно определить с помощью истинностной таблицы (Таблица 2), в которой в столбцах 1 и 2 содержатся все возможные комбинации истинностных значений простых суждений, а в столбцах 3-9 содержатся значения сложного суждения, образованного из простых суждений с помощью соответствующего логического союза. При этом исходные простые суждения обозначают буквами «А», «В», а значения истинности символами: «и» - истинно, «л» - ложно.The nature of the connection is determined by the meaning of logical alliances, which consists in answering the question: “Under what conditions will a complex judgment be true, and under which it will be false?” In other words, under what combinations of truth and falsity of simple judgments that make up a complex proposition, a logical union determines the true connection, and in which - the false one. A judgment is considered true if the description it gives is true (a real situation), and false if it does not. “Truth” and “false” are called truth values of judgment and are the main logical characteristic of judgments. The meaning of logical alliances can be determined using the truth table (Table 2), in which columns 1 and 2 contain all possible combinations of truth values of simple judgments, and columns 3-9 contain the values of a complex proposition formed from simple judgments using the corresponding logical union . In this case, the initial simple judgments are denoted by the letters "A", "B", and the truth values by the symbols: "and" - true, "l" - false.

Figure 00000002
Figure 00000002

Для выявления первых логических разделов 111 и вторых логических разделов 112 элементов 11 упомянутой итоговой структуры данных 1 необходимо в предложениях текста выявить простые суждения, имеющие между собой импликативную (условную) логическую связь и взаимную (двойную) импликативную (условную) связь. Условное суждение (импликативное суждение) - это сложное суждение, в котором простые суждения объединяются логическим союзом «если…, то…». Например:In order to identify the first logical sections 111 and the second logical sections 112 of the elements 11 of the mentioned final data structure 1, it is necessary to identify simple propositions in the text sentences that have an implicative (conditional) logical connection and mutual (double) implicative (conditional) connection. A conditional proposition (implicative proposition) is a complex proposition in which simple propositions are united by the logical union “if ... then ...”. For example:

«Если гражданин нарушает закон, то это порождает ответственность за нарушение» или «Если число делится на 2 без остатка, то оно четное». Условное суждение состоит из двух составляющих его видов суждений. Суждение, записанное после слова «если» называется основанием (предыдущим). Суждение, записанное после слова «то» называется следствием (последующим). Формула условного суждения может быть представлена как «А→В», где А - основание, В - следствие. При этом, основания и следствия, сами по себе могут быть как простыми суждениями, так и сложными суждениями. Образованное из предыдущего и последующего суждений условное суждение, прежде всего, подразумевает, что не может быть так, чтобы то, о чем говорится в основании, имело место, а то, о чем говорится в следствии - отсутствовало. Иными словами, если основание будет истинным, а следствие - ложным, то такое условное суждение будет ложным. Это условие определяет то, что условное суждение истинно во всех случаях, кроме одного: когда предшествующее есть, а последующего нет, т.е. - суждение по формуле «А→В» - ложно только в одном случае, когда А - истинно, а В - ложно (см. таблицу 2, столбец 6). В форме условных суждений могут быть выражены как объективные зависимости одних объектов от других, так и права и обязанности субъектов правоотношений, связанные с теми или иными условиями. Эквивалентное суждение (двойная импликация) - это сложное суждение, в котором объединяются суждения с взаимной условной зависимостью. Эквивалентные суждения образуются с помощью логического союза «если и только если…, то…», который обозначается символом «↔». Формула эквивалентности: «А↔В», где А, В - суждения, из которых образуется эквивалентное суждение, например: «Человек имеет право на пенсию по возрасту, если и только если он достиг пенсионного возраста». В естественном языке, в том числе, в экономических и юридических текстах, для выражения эквивалентных суждений используются грамматические союзы: «лишь при условии, что…, то…», «только тогда, когда…, то…», «в том и только в том случае, когда…, тогда…». Условия истинности эквивалентных суждений представлены в столбце 7 таблицы 2. Эквивалентное суждение истинно в двух случаях - когда оба составляющих его суждения истинны или, когда оба ложны. Иными словами, связь между элементами эквивалентного суждения можно охарактеризовать как необходимую: «истинность А достаточна для признания истинности В и наоборот» и «ложность А служит показателем ложности В и наоборот». По причине того, что в двойных импликативных суждениях отсутствуют четко выраженные основания и следствия, главным фактором в идентификации первых и вторых логических разделов 111, 112 является наличие в суждениях, находящихся во взаимной импликативной зависимости признаков юридического факта. На примере упомянутого импликативного суждения «Человек имеет право на пенсию по возрасту, если и только если он достиг пенсионного возраста» можно установить, что суждение «Человек имеет право на пенсию по возрасту» не содержит таких признаков, а суждение «если и только если он достиг пенсионного возраста» имеет признак юридического факта, которым является событие - «достижение пенсионного возраста». Таким образом, именно суждение, содержащее признаки юридического факта признается для целей идентификации основанием (А). Другое суждение признается следствием (В). Термин «юридический факт» означает определенное жизненное обстоятельство, с которым норма права связывает возникновение, изменение или прекращение правоотношения или правоотношений. Если предложение содержит одно простое суждение (или несколько простых суждений) или одно сложное суждение (или несколько сложных суждений), которое не идентифицировано как условное суждение, то в результате лингвистическо-семантического анализа текста, «окружающего» такое предложение, может быть выявлен фактический контекстный вид данного простого суждения - первый логический раздел 111 или второй логический раздел 112. Формируемая на этапе 201 первая структура данных 2 содержит такие элементы, как предложения (элемент 11 исходной структуры данных 1) и суждения (логические разделы 111 или 112 элементов 11 исходной структуры данных 1). При этом суждения дополнительно идентифицированы по упомянутой логической связи как основания, т.е. как первый логический раздел 111 элемента исходной структуры данных 11, имеющий логическую связь 1-го типа и являющийся суждением «А», и как следствия, т.е. как второй логический раздел 112 элемента 11 исходной структуры данных 1, имеющий логическую связь 1-го типа и являющийся суждением «В». В первой структуре данных 2 все элементы исходной структуры данных 1 сепарированы по признаку наличия в них упомянутых первых логических разделов 111 или вторых логических разделов 112 исходной структуры данных 1, за счет чего сформированы элементы 21 первой структуры данных 2, имеющие первые логические разделы 111 и элементы 22 первой структуры данных 2, имеющие вторые логические разделы 112.“If a citizen violates the law, this creates liability for the violation” or “If the number is divisible by 2 without a remainder, then it is even.” A conditional proposition consists of two types of judgments that comprise it. The judgment written after the word “if” is called the basis (previous). The judgment written after the word "that" is called the consequence (subsequent). The conditional propositional formula can be represented as “A → B”, where A is the basis, B is the consequence. At the same time, the foundations and consequences, in themselves, can be both simple judgments and complex judgments. The conditional proposition formed from the previous and subsequent judgments, first of all, implies that it cannot be that what is said in the basis takes place, but what is said in the investigation is absent. In other words, if the ground is true and the effect is false, then such a conditional proposition will be false. This condition determines that a conditional proposition is true in all cases except one: when the previous one is, and the next is not, i.e. - a judgment by the formula “A → B” is false only in one case, when A is true and B is false (see table 2, column 6). In the form of conditional judgments can be expressed as the objective dependence of some objects on others, as well as the rights and obligations of subjects of legal relations related to certain conditions. Equivalent judgment (double implication) is a complex proposition in which propositions with mutual conditional dependence are combined. Equivalent judgments are formed using the logical union “if and only if ... then ...”, which is indicated by the symbol “↔”. Equivalence formula: “A↔B”, where A, B are the judgments from which the equivalent judgment is formed, for example: “A person has the right to an old-age pension if and only if he has reached retirement age”. In the natural language, including economic and legal texts, grammatical unions are used to express equivalent judgments: “only if ..., then ...”, “only when ..., then ...”, “and only in the case when ... then ... ". The truth conditions for equivalent judgments are presented in column 7 of table 2. An equivalent proposition is true in two cases - when both components of its judgments are true or when both are false. In other words, the connection between the elements of an equivalent judgment can be described as necessary: "the truth of A is sufficient to recognize the truth of B and vice versa" and "the falsity of A serves as an indicator of falsity of B and vice versa." Due to the fact that double implicative judgments do not have clear grounds and consequences, the main factor in identifying the first and second logical sections 111, 112 is the presence in judgments that are in the mutual implicative dependence of the signs of a legal fact. On the example of the mentioned implicative judgment “A person has the right to an old-age pension if and only if he has reached retirement age”, it can be established that the judgment “A person has a right to an old-age pension” does not contain such signs, and a judgment “if and only if he has reached retirement age ”has a sign of legal fact, which is the event -“ reaching retirement age ”. Thus, it is a judgment containing signs of a legal fact that is recognized for identification purposes by reason (A). A different judgment is recognized by consequence (B). The term "legal fact" means a specific circumstance of life with which a rule of law relates the occurrence, change or termination of a legal relationship or legal relationship. If a sentence contains one simple proposition (or several simple propositions) or one complex proposition (or several complex propositions) that is not identified as a conditional proposition, then a linguistic-semantic analysis of the text “surrounding” such an proposition may reveal the actual contextual the form of this simple proposition is the first logical section 111 or the second logical section 112. The first data structure 2 formed in step 201 contains elements such as sentences (element 11 of the original structure data 1) and the judgment (logical partitions 111 or 112 elements of source data structures 11 1). Moreover, judgments are additionally identified by the mentioned logical connection as grounds, i.e. as the first logical section 111 of the element of the initial data structure 11, which has a logical connection of the 1st type and is the judgment “A”, and as a consequence, i.e. as the second logical section 112 of element 11 of the original data structure 1, having a logical connection of the 1st type and which is the judgment “B”. In the first data structure 2, all elements of the original data structure 1 are separated by the presence of the aforementioned first logical partitions 111 or second logical partitions 112 of the original data structure 1, whereby the elements 21 of the first data structure 2 are formed having the first logical partitions 111 and elements 22 of the first data structure 2 having second logical partitions 112.

На фиг. 5 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 202 формирования базы данных 3 логических связей логических разделов. Этап 202 формирования базы данных 3 логических связей логических разделов характеризуется выполнением этапа 2021 идентификации элементов первой структуры данных 2, на котором идентифицируют элементы 21 первой структуры данных 2, содержащие один упомянутый первый логический раздел 111, представляющие собой элементы 31 первой структуры данных 2, и элементы 22 первой структуры данных 2, содержащие один упомянутый второй логический раздел 112, представляющие собой элементы 32 первой структуры данных 2; выполнением этапа 2022 идентификации элементов первой структуры данных 2, на котором идентифицируют элементы 21 первой структуры данных, содержащие более одного упомянутого первого логического раздела 111, представляющие собой элементы 33 первой структуры данных 2 и элементы 22 первой структуры данных, содержащие более одного упомянутого второго логического раздела, представляющие собой элементы 34 первой структуры данных 2; выполнением этапа 2023 идентификации логических связей, на котором среди элементов 33 первой структуры данных 2, содержащих более одного упомянутого первого логического раздела 111 и элементов 34 первой структуры данных 2, содержащих более одного упомянутого второго логического раздела 112, идентифицируют логические связи между упомянутыми первыми логическими разделами 111 или логические связи между упомянутыми вторыми логическими разделами 112; выполнением этапа 2024 идентификации отсутствия логических связей, на котором среди элементов 33 первой структуры данных 2, содержащих более одного упомянутого первого логического раздела 111 и среди элементов 34 первой структуры данных 2, содержащих более одного упомянутого второго логического раздела 112, идентифицируют элементы 35 первой структуры данных *, не имеющие логических связей между своими логическими разделами; и выполнением этапа 2025 формирования базы данных, на котором формируют базу данных 3 логических связей логических разделов элементов первой структуры данных. Для уточнения всех дополнительных (не только импликативных) имеющихся логических связей между логическими разделами (суждениями) все элементы первой структуры данных 2, а именно массивы элементов 21 предложений, содержащих первые логические разделы 111 и элементов 22 предложений, содержащих вторые логические разделы 112 необходимо сепарировать на группы элементов 31, 33 и 32, 34, содержащих либо только первые логические разделы 111, либо только вторые логические разделы 112, соответственно. При этом каждый элемент, входящий в массивы элементов 31, 33, содержащий первый логический раздел 111 идентифицируется как элемент 31. имеющий только один логический раздел 111, или как элемент 33, имеющий более одного логического раздела 111. При этом в случае наличия в идентифицированных элементах 31, 33 вторых логических разделов 112, вторые логические разделы 112 удаляются из идентифицированных элементов 31, 33. Полученные в итоге массивы элементов 31, 33 по-прежнему связаны с тем элементом, из которого они выделены и по этому основанию идентифицированы как отдельные элементы данного массива элементов. В свою очередь, каждый элемент, входящий в массивы элементов 32. 34, содержащий второй логический раздел 112 идентифицируется как элемент 32, имеющий только один логический раздел 112, или как элемент 34, имеющий более одного логического раздела 112. При этом в случае наличия в идентифицированных элементах 32, 34 первых логических разделов 111, первые логические разделы 111 удаляются из идентифицированных элементов 32, 34. Полученные в итоге массивы элементов 32, 34 так же по-прежнему связаны с тем элементом, из которого они выделены и по этому основанию идентифицированы как отдельные элементы данного массива элементов. Далее устанавливается характер логических связей между однотипными суждениями в элементах двух созданных массивов элементов 31, 33 и элементов 32, 34. В однотипных элементах массивов элементов 33, 34 выявляются логические связи между суждениями, указанные в таблицах 1 и 2, а именно - соединительные связи (конъюнкция), разделительные связи (дизъюнкция, строгая дизъюнкция), эквивалентные связи (эквиваленция). Конъюнктивное (соединительное) суждение - это сложное суждение, образованное из исходных суждений посредством логического союза «и», обозначаемого символом «^». Например, суждение: «Сегодня я пойду на лекцию по логике и в кино», - является «конъюнктивным суждением», состоящим из двух простых суждений (обозначим их А и В, соответственно) - «Сегодня я пойду на лекцию по логике» (А), «Сегодня я пойду в кино» (В). Данное сложное суждение можно представить формулой: «А^B», где А, В - элементы конъюнкции; «^» - символ логического союза - конъюнкция. В русском языке конъюнктивный логический союз выражается многими грамматическими союзами: «и», «а», «но», «да», «хотя», «однако», «а также…». Нередко подобные грамматические союзы заменяются знаками препинания - запятой, двоеточием, точкой с запятой. Дизъюнктивное (разделительное) суждение - это сложное суждение, образованное из «исходных». суждений посредством логического союза «или», обозначаемого символом «V». Например, суждение: «Право может способствовать экономическому развитию или препятствовать ему», - является дизъюнктивным суждением, состоящим из двух простых суждений: «Право может способствовать экономическому развитию» и «Право может препятствовать экономическому развитию». Соответственно, обозначив их через буквы А, В, такое суждение можно представить через формулу: «А V В». Поскольку связка «или» употребляется в двух разных значениях - неисключающем и исключающем, то различают слабую и сильную (строгую) дизъюнкции. Слабая дизъюнкция является истинной в тех случаях, когда истинно, по крайней мере, одно из составляющих ее суждений (или оба вместе) и ложна, когда оба составляющих ее суждения ложны (см. таблицу 2, столбец 4). Сильная дизъюнкция (символ «VV») отличается от слабой дизъюнкции тем, что ее составляющие исключают друг друга. Например, «Преступление может быть умышленным или по неосторожности». Для того, чтобы подчеркнуть строго разделительный, исключающий характер связи, в естественном языке используется усиленная двойная форма разделения: «…либо…, либо…», «…или…, или…», например: «Либо я найду путь, либо я проложу его». Строгая дизъюнкция истинна лишь тогда, когда одно из составляющих ее суждений истинно, а другое - ложно (см. таблицу 2, столбец 5). В результате выявляются все логические связи между элементами (суждениями) массивов элементов 33, 34. При этом допускается, что часть элементов данных массивов может не иметь логических связей друг с другом. Далее для уточнения вида суждений, которые не были до сих пор идентифицированы как сложные суждения, элементы массивов элементов должны быть подвергнуты идентификации на их соответствие отрицаемому суждению. Этому анализу должны быть подвергнуты массивы элементов 31, 32 и, частично, массивы элементов 33, 34, в которых остались суждения, не имеющие логических связей с другими суждениями. Отрицаемое суждение - это сложное суждение, образованное с помощью логического союза «неверно, что…» (или просто «не»), который, как правило, представлен знаком отрицания (символ «~»). В отличие от упомянутых выше бинарных союзов, такой союз относится к одному суждению. Прибавление этого союза к какому-либо суждению означает образование нового суждения, которое находится в определенной зависимости от исходного суждения - отрицаемое суждение истинно, если исходное суждение ложно, и наоборот (см. таблицу 2, столбцы 8, 9). Например, если исходное суждение: «Все свидетели правдивы», - то отрицаемое: «Неверно, что все свидетели правдивы». Если отдельный логический раздел (простое суждение) остается не идентифицированным с точки зрения логического характера суждения, то в результате лингвистическо-семантического анализа текста, окружающего предложения, в котором содержится такой раздел, может быть выявлен фактический контекстный вид данного простого суждения. Таким образом, первая структура данных содержит логические разделы предложений, формирующих исходную структуру данных. По итогам идентификации всех элементов первой структуры данных выявляются все логические разделы предложений (суждения), с точки зрения их наличия и характера связей суждений, формирующих сложные суждения. На основании выявленных характеров связей суждений (в том числе, их отсутствия) формируется база данных 3 логических связей логических разделов (фиг. 6).In FIG. 5, by way of example, but not limitation, a general flowchart of the steps of step 202 of forming a database 3 of logical connections of logical partitions is shown. The step 202 of creating a database 3 of logical connections of logical partitions is characterized by the execution of step 2021 of identifying the elements of the first data structure 2, which identifies the elements 21 of the first data structure 2 containing one of the first logical partitions 111, which are the elements 31 of the first data structure 2, and the elements 22 of a first data structure 2, comprising one of said second logical partitions 112, which are elements 32 of a first data structure 2; performing step 2022 of identifying the elements of the first data structure 2, which identifies the elements 21 of the first data structure containing more than one of the first logical partitions 111, which are the elements 33 of the first data structure 2 and the elements 22 of the first data structure containing more than one of the second logical partitions representing the elements 34 of the first data structure 2; by performing step 2023 of identifying logical connections, where among the elements 33 of the first data structure 2 containing more than one of the first logical partitions 111 and the elements 34 of the first data structure 2 containing more than one of the second logical part 112, the logical relationships between the first logical partitions are identified 111 or logical connections between said second logical partitions 112; by performing step 2024 of identifying the absence of logical connections, where among the elements 33 of the first data structure 2 containing more than one of the first logical partitions 111 and among the elements 34 of the first data structure 2 containing more than one of the second logical partitions 112, the elements 35 of the first data structure are identified * having no logical connections between their logical partitions; and the implementation of step 2025 of the formation of the database, which form the database 3 logical relationships of logical sections of the elements of the first data structure. To clarify all additional (not only implicative) logical connections between logical partitions (judgments), all elements of the first data structure 2, namely arrays of elements of 21 sentences containing the first logical sections 111 and elements of 22 sentences containing the second logical sections 112, must be separated into groups of elements 31, 33 and 32, 34, containing either only the first logical partitions 111, or only the second logical partitions 112, respectively. In this case, each element included in the arrays of elements 31, 33 containing the first logical partition 111 is identified as element 31. having only one logical partition 111, or as element 33 having more than one logical partition 111. In this case, if the identified elements are present 31, 33 of the second logical partitions 112, the second logical partitions 112 are deleted from the identified elements 31, 33. The resulting arrays of elements 31, 33 are still associated with the element from which they are selected and identified on this basis ak individual elements of the array elements. In turn, each element in the arrays of elements 32. 34 containing the second logical partition 112 is identified as element 32, which has only one logical partition 112, or as element 34, having more than one logical partition 112. Moreover, if identified elements 32, 34 of the first logical partitions 111, the first logical partitions 111 are deleted from the identified elements 32, 34. The resulting arrays of elements 32, 34 are also still associated with the element from which they are selected and based on this are identified as separate elements of a given array of elements. Next, the nature of the logical relationships between the same judgments in the elements of two created arrays of elements 31, 33 and the elements 32, 34 is established. In the same elements of the arrays of elements 33, 34, logical relationships between the judgments shown in tables 1 and 2 are revealed, namely, connecting connections ( conjunction), separation bonds (disjunction, strict disjunction), equivalent bonds (equivalent). A conjunctive (connecting) proposition is a complex proposition formed from the initial propositions by means of a logical union “and”, denoted by the symbol “^”. For example, the proposition: “Today I will go to a lecture on logic and in cinema,” is a “conjunctive proposition” consisting of two simple propositions (we denote them by A and B, respectively) - “Today I will go to a lecture on logic” (A ), “Today I will go to the cinema” (B). This complex proposition can be represented by the formula: “A ^ B”, where A, B are the elements of the conjunction; "^" - a symbol of logical union - conjunction. In Russian, the conjunctive logical union is expressed by many grammatical unions: “and”, “a”, “but”, “yes”, “although”, “however”, “as well as ...”. Often such grammatical unions are replaced by punctuation marks - a comma, a colon, a semicolon. A disjunctive (dividing) proposition is a complex proposition formed from the “source” ones. judgments through the logical union “or”, denoted by the symbol “V”. For example, the proposition: “The law can contribute to economic development or hinder it,” is a disjunctive proposition consisting of two simple judgments: “The law can contribute to economic development” and “The law can impede economic development”. Accordingly, having designated them through the letters A, B, such a judgment can be represented through the formula: “A V B”. Since the connective "or" is used in two different meanings - non-exclusive and exclusive, they distinguish between weak and strong (strict) disjunctions. A weak disjunction is true when at least one of its component judgments (or both together) is true and false when both its judgments are false (see table 2, column 4). A strong disjunction (the symbol “VV”) differs from a weak disjunction in that its components are mutually exclusive. For example, “Crime may be intentional or negligent.” In order to emphasize the strictly dividing, excluding the nature of the connection, a reinforced double form of separation is used in the natural language: "... either ..., or ...", "... or ..., or ...", for example: "Either I will find the way, or I will pave him". A strict disjunction is true only when one of its component judgments is true and the other is false (see table 2, column 5). As a result, all logical connections between the elements (judgments) of the arrays of elements 33, 34 are revealed. It is assumed that some of the elements of these arrays may not have logical connections with each other. Further, to clarify the type of judgments that have not yet been identified as complex judgments, the elements of the arrays of elements must be identified for their conformity to the denied judgment. Arrays of elements 31, 32 and, in part, arrays of elements 33, 34, in which there are judgments that have no logical connections with other judgments, should be subjected to this analysis. A denied proposition is a complex proposition formed by the logical union “it is not true that ...” (or simply “not”), which is usually represented by a negative sign (“~” symbol). Unlike the binary unions mentioned above, such an alliance refers to one proposition. Adding this union to a proposition means the formation of a new proposition, which depends on the original proposition - the denied proposition is true if the original proposition is false, and vice versa (see table 2, columns 8, 9). For example, if the initial judgment is: “All witnesses are truthful,” then the denied: “It is not true that all witnesses are truthful.” If a separate logical section (simple proposition) remains unidentified from the point of view of the logical nature of the proposition, then as a result of linguistic-semantic analysis of the text surrounding the sentence containing such a section, the actual contextual form of this simple proposition can be revealed. Thus, the first data structure contains logical sections of sentences that form the original data structure. According to the results of identification of all elements of the first data structure, all logical sections of sentences (judgments) are identified, in terms of their presence and the nature of the relationships of judgments forming complex judgments. Based on the identified nature of the relationships of judgments (including their absence), a database of 3 logical relationships of logical sections is formed (Fig. 6).

На фиг. 7 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 203 формирования второй структуры данных 4. Этап 203 формирования второй структуры данных 4 характеризуется выполнением этапа 2031 формирования логических конструкций, на котором формируют логические конструкции 41 логических разделов 111, 112 элементов 31, 32, 33, 34 первой структуры данных 2, используя информацию из базы данных 3 логических связей логических разделов элементов 31, 32, 33, 34 первой структуры данных 2 и логические разделы упомянутых элементов 31 первой структуры данных 2, содержащих один упомянутый первый логический раздел 111, и логические разделы упомянутых элементов 32 первой структуры данных 2, содержащих один упомянутый второй логический раздел 112; и выполнением этапа 2032 формирования второй структуры данных 4, на котором формируют вторую структуру данных 4, содержащую элементы 41 второй структуры данных 4, причем упомянутые элементы второй структуры данных 4 представляют собой сформированные логические конструкции 41 логических разделов 111, 112 элементов 31, 32, 33, 34 первой структуры данных 2. Логические конструкции 41 - это результат преобразования данных преобразуемого структурированного массива данных. Логические конструкции 41 формируются в соответствии со спецификой преобразуемого текста на естественном языке, в частности НПА. Специфика НПА состоит в том, что он содержит нормы права (правовые нормы). Так же специфика НПА состоит в том, что в теории нормы права существуют понятия логической нормы права и юридической нормы права. Эти понятия не тождественны. Разница заключается в том, что логическая норма права включает в себя содержание всех элементов нормы права, установленных в юридической науке, включая гипотезу, диспозицию и санкцию, а юридическая норма права отражает конкретные нормативные предписания, содержащиеся в конкретных предложениях конкретных НПА. Фактически разница состоит в том, что одна конкретная логическая норма права может содержаться в конкретном множестве юридических норм права, т.е. в множестве нормативных предписаний. Логическая конструкция - это основа (каркас) основного нормативного предписания, содержащая два основных элемента конструкции, - «ситуацию» и «правило». Основное нормативное предписание (далее - нормативное предписание) является инструментом правового регулирования и включает в себя регулятивные и охранительные нормативные предписания. При этом под ситуацией в нормативных предписаниях понимается любая обусловленность правила, а под правилом понимаются любые правила, включая правила (модель) поведения субъектов правоотношений. Иными словами, ситуация - это суждения, имеющие логическую импликативную связь и являющиеся основаниями, а правила - это суждения, имеющие логическую импликативную связь и являющиеся следствиями. При формировании логических конструкций 41, т.е. нормативных предписаний также необходимо учитывать, что каждый из элементов этой конструкции (и ситуация и правило) могут состоять как из одного суждения, так и из группы суждений. Для формирования логических конструкций необходимо использовать Базу данных логических связей логических разделов. Кроме выявленных логических связей между логическими разделами для формирования логической конструкции необходимо обратиться к правилам формирования логических конструкций. Правила формирования логических конструкций отражают требования юридической науки и юридической практики в отношении состава и структуры нормативного предписания (предписания). Например, условие того, что одно предписание не может содержать двух разных правил, приводит к тому, что в правилах устанавливается, что если в одном предложении содержатся два следствия, которые имеют логически слабую дизъюнктивную связь, то это значит, что эти суждения входят в разные правила и соответственно разные предписания. При этом если эти же два следствия имеют логически сильную дизъюнктивную связь, то это их объединяет в рамках одного сложного правила в рамках одного предписания. По существу, правила формирования логических конструкций 41 сводятся к допустимым сочетаниям логических связей между однотипными суждениями в рамках одного нормативного предписания.In FIG. 7, by way of example, but not limitation, a general flowchart is shown of the steps of step 203 of generating the second data structure 4. Step 203 of the formation of the second data structure 4 is characterized by the execution of logic construction step 2031, in which logical structures 41 of logical partitions 111, 112 of elements 31 are formed , 32, 33, 34 of the first data structure 2, using information from the database 3 of logical connections of the logical partitions of the elements 31, 32, 33, 34 of the first data structure 2 and the logical partitions of the mentioned elements 31 of the first page data structures 2 containing one of said first logical partitions 111 and logical partitions of said elements 32 of a first data structure 2 containing one of said second logical partitions 112; and performing step 2032 of generating a second data structure 4, wherein a second data structure 4 is formed comprising elements 41 of the second data structure 4, said elements of the second data structure 4 being formed logical structures 41 of logical sections 111, 112 of elements 31, 32, 33 , 34 of the first data structure 2. Logical constructions 41 are the result of transforming the data of the converted structured data array. Logical constructions 41 are formed in accordance with the specifics of the converted text in natural language, in particular, normative documents. The specificity of the legal acts is that it contains the rule of law (legal norms). Also, the specificity of the legal acts is that in the theory of the rule of law there are concepts of a logical rule of law and a legal rule of law. These concepts are not identical. The difference lies in the fact that the logical rule of law includes the content of all elements of the rule of law established in legal science, including hypothesis, disposition and sanction, and the legal rule of law reflects the specific regulatory requirements contained in specific proposals of specific legal acts. In fact, the difference lies in the fact that one particular logical rule of law can be contained in a specific set of legal rules of law, i.e. in a multitude of regulatory requirements. The logical design is the basis (framework) of the main regulatory requirement, containing two basic structural elements - “situation” and “rule”. The main regulatory requirement (hereinafter referred to as the regulatory requirement) is an instrument of legal regulation and includes regulatory and protective regulatory requirements. In this case, the situation in the regulatory requirements means any conditionality of the rule, and the rule means any rules, including the rules (model) of behavior of subjects of legal relations. In other words, a situation is a judgment having a logical implicative connection and being a basis, and a rule is a judgment having a logical implicative connection and being a consequence. In the formation of logical structures 41, i.e. It is also necessary to take into account regulatory requirements that each of the elements of this design (both the situation and the rule) can consist of both a single judgment and a group of judgments. For the formation of logical constructions, it is necessary to use the database of logical connections of logical partitions. In addition to the identified logical connections between logical sections for the formation of a logical structure, you must refer to the rules for the formation of logical structures. The rules for the formation of logical constructions reflect the requirements of legal science and legal practice in relation to the composition and structure of a normative prescription (prescription). For example, the condition that one prescription cannot contain two different rules leads to the fact that the rules establish that if one sentence contains two consequences that have a logically weak disjunctive connection, this means that these judgments are different rules and accordingly different regulations. Moreover, if the same two consequences have a logically strong disjunctive connection, then this unites them in the framework of one complex rule within the framework of one prescription. In essence, the rules for the formation of logical constructions 41 are reduced to permissible combinations of logical connections between the same type of judgments within the framework of a single normative prescription.

Figure 00000003
Figure 00000003

При этом если в предложении имеются несколько ситуаций, объединенных логикой «ИЛИ» (слабая дизъюнктивная связь), то это означает, что каждая из таких ситуаций формирует собственные отдельные предписания с те ми же правилами, которые использовались в первом предписании. Это означает, что несколько ситуаций с такой логикой «ИЛИ» не могут быть в одном предписании. Кроме того, в предложении имеются несколько правил, объединенных логикой «ИЛИ» (слабая дизъюнктивная связь). Это означает, что каждое из таких правил формирует собственные отдельные предписания с те ми же ситуациями, которые использовались в первом предписании. Это означает, что несколько «правил» с такой логикой «ИЛИ» не могут быть в одном предписании. Сформированная вышеуказанным образом вторая структура данных содержит такие элементы как суждения (логический раздел элемента исходной структуры данных) и нормативные предписания (логическая конструкция 41 логических разделов элемента исходной структуры данных) (фиг. 8). При этом суждения идентифицированы по наличию импликативной логической связи на как два основных логических раздела:Moreover, if a sentence contains several situations united by the logic “OR” (weak disjunctive connection), then this means that each of these situations forms its own separate prescriptions with the same rules that were used in the first prescription. This means that several situations with such “OR” logic cannot be in the same prescription. In addition, the proposal has several rules, united by the logic “OR” (weak disjunctive connection). This means that each of these rules forms its own separate prescriptions with the same situations that were used in the first prescription. This means that several “rules” with such “OR” logic cannot be in one prescription. The second data structure formed in the above manner contains such elements as judgments (logical section of the element of the original data structure) and regulatory requirements (logical structure 41 of logical sections of the element of the original data structure) (Fig. 8). In this case, judgments are identified by the presence of an implicative logical connection into two main logical sections:

1) основания (первый логический раздел элемента исходной структуры данных, содержащий логическую импликативную связь, связь 1-го типа, вида А);1) foundations (the first logical section of the element of the original data structure containing a logical implicative connection, a connection of the 1st type, type A);

2) следствия (второй логический раздел элемента исходной структуры данных, содержащий логическую импликативную связь, связь 1-го типа, вида В);2) consequences (the second logical section of the element of the original data structure, containing a logical implicative connection, a connection of the 1st type, type B);

При этом основания и следствия дополнительно идентифицированы также по факту выявления иных логических связей между однотипными импликативными суждениями в рамках одного предложения как дополнительные логические разделы:In this case, the grounds and consequences are additionally identified also by the fact of identifying other logical connections between the same implicative judgments within the framework of one sentence as additional logical sections:

1) суждения «И» (логический раздел элемента исходной структуры данных, содержащий логическую конъюнктивную (соединительную) связь, связь 2-го типа);1) judgments “AND” (the logical section of the element of the original data structure containing the logical conjunctive (connecting) connection, the connection of the 2nd type);

2) суждения «ИЛИ» (логический раздел элемента исходной структуры данных, содержащий логическую слабую дизъюнктивную (разделительную) связь, связь 3-го типа);2) “OR” judgments (the logical section of the element of the original data structure containing the logical weak disjunctive (dividing) connection, type 3 communication);

3) суждения «ИЛИ*» (логический раздел элемента исходной структуры данных, содержащий логическую сильную дизъюнктивную (разделительную) связь, связь 4-го типа);3) “OR *” judgments (a logical section of an element of the original data structure containing a logical strong disjunctive (separation) connection, a type 4 connection);

Кроме того, вышеуказанные разделы могут быть отдельно идентифицированы как «отрицаемые суждения» (логический раздел элемента исходной структуры данных, содержащий отрицаемую логическую связь, связь 5-го типа).In addition, the above sections can be separately identified as “denied judgments” (a logical section of an element of the original data structure containing a denied logical link, a type 5 link).

На фиг. 9 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 204 формирования базы данных 5 семантических частей. Этап 204 формирования базы данных 5 семантических частей характеризуется выполнением этапа 2041 идентификации логических разделов, на котором идентифицируют первые логические разделы 411 элементов 41 второй структуры данных 4 и вторые логические разделы 412 элементов второй структуры данных 4; выполнением этапа 2042 идентификации семантических частей, на котором в упомянутых первых логических разделах 411 и вторых логических разделах 412 элементов второй структуры данных 4 идентифицируют первые семантические части 4110 и вторые семантические части 4120; и выполнением этапа 2043 идентификации особых семантических частей, на котором в упомянутых первых и вторых логических разделах 411, 412 элементов 41 второй структуры данных 4 идентифицируют, по меньшей мере, особые семантические части 4111 первых логических разделов 411 элементов 41 второй структуры данных 4 и особые семантические части 4121 вторых логических разделов 412 элементов 41 второй структуры данных 4 и формируют базу данных 5 особых семантических частей логических разделов элементов 41 второй структуры данных 4 путем перемещения упомянутых особых семантических частей 4111, 4121 в упомянутую формируемую базу данных 5 особых семантических частей логических разделов элементов 41 второй структуры данных 4 (фиг. 10). Сформированные во второй структуре данных логические конструкции 41 являются каркасом и основой нормативного предписания, но по-прежнему не соответствуют ему полностью. Для достижения максимального соответствия структуры логических конструкций 41 структуре нормативного предписания необходимо провести комплексный семантический анализ логических разделов 411, 412, включающий как минимум синтаксический и логический разборы терминов и понятий, выявление взаимосвязей между понятиями суждения и между терминами сложных понятий. Целью данного семантического анализа является выявление и идентификация в логических разделах 411, 412 логических конструкций 41 второй структуры данных 4 ряда специфических частей (вторых частей) логических разделов, которые приводят к:In FIG. 9 as an example, but not limitation, depicts a General diagram of the steps of step 204 of the formation of the database 5 semantic parts. Stage 204 of the formation of the database of 5 semantic parts is characterized by the execution of step 2041 identification of logical partitions, which identify the first logical partitions 411 elements 41 of the second data structure 4 and the second logical partitions 412 elements of the second data structure 4; by performing a semantic part identification step 2042, wherein in the first logical partitions 411 and second logical partitions 412 of the elements of the second data structure 4, the first semantic parts 4110 and the second semantic parts 4120 are identified; and by performing step 2043 of identifying specific semantic parts, in which at least the specific semantic parts 4111 of the first logical sections 411 of elements 41 of the second data structure 4 and special semantic are identified in the first and second logical sections 411, 412 of the elements 41 of the second data structure parts 4121 of the second logical partitions 412 of the elements 41 of the second data structure 4 and form a database 5 of special semantic parts of the logical partitions of the elements 41 of the second data structure 4 by moving the of the general semantic parts 4111, 4121 to said forming database 5 of special semantic parts of logical sections of the elements 41 of the second data structure 4 (FIG. 10). The logical structures 41 formed in the second data structure are the framework and the basis of the normative prescription, but still do not fully comply with it. To achieve maximum compliance with the structure of logical constructions 41 to the structure of a normative prescription, it is necessary to conduct a comprehensive semantic analysis of logical sections 411, 412, including at least syntactic and logical analysis of terms and concepts, identifying the relationships between concepts of judgment and between terms of complex concepts. The purpose of this semantic analysis is to identify and identify in logical sections 411, 412 logical structures 41 of the second data structure 4 rows of specific parts (second parts) of logical sections that lead to:

1) смешению основных понятий правовой нормы - к смешению ситуаций и правил путем включения в суждение различных обусловленностей;1) a mixture of the basic concepts of a legal norm - to a mixture of situations and rules by including various conditions in the judgment;

2) размытию - расфокусированию смысла суждений путем включения в суждение различных качественных и количественных уточнений и детализаций.2) blurring - defocusing the meaning of judgments by including various qualitative and quantitative refinements and details into the judgment.

На данном этапе осуществляется выявление специфических частей, т.е. выявление в логических разделах 411, 412 логических конструкций 41 второй структуры данных первых и вторых семантических частей 4110, 4120 логических разделов 411, 412. Причем первые семантические части !110 формируются путем удаления из логических разделов 411, 412 вторых семантических частей 4120 (специфических частей). Первая семантическая часть 4110 логического раздела - это смысловое ядро суждения, т.е. суждение, очищенное от специфических частей. Смысловым ядром суждения являются основные элементы суждения такие, как субъект суждения, предикат суждения и связка. Особенность связки состоит в том, что связки является частью смыслового ядра суждения только тогда, когда она не может быть истолкована в «объемном плане», в случаях, когда связка раскрывает включение (или исключение) подкласса в класс объектов или принадлежность (непринадлежность) элемента классу. Например, в суждении: «Преступление есть противоправное деяние», - субъектом суждения является слово «преступление», предикатом суждения словосочетание - «противоправное деяние», а связкой - слово «есть». Вторые семантические части 4120 логического раздела - это понятия суждения, которые идентифицированы как признаки субъекта суждения, предиката суждения, а также термины суждения - связка (когда она может быть истолкована в «объемном плане») и кванторное слово, а также иные, особые части. Например, понятие (субъект суждения) «преступление, предусмотренное Уголовным Кодексом», содержит понятие - слово «преступление» и признак понятия - словосочетание «предусмотренное Уголовным Кодексом». Признаки понятия - это содержание понятия, указывающее на наличие или отсутствие у него того или иного свойства, состояния или отношения. Иначе говоря, признаком понятия является все то, в чем понятия могут быть сходны или отличны друг от друга. Все признаки понятия, образующие содержание понятий идентифицируются как существенные и несущественные по принципу утраты своего качества (невозможности быть самим собой) без данного признака. Например, в суждении: «Преступление есть противоправное деяние», - предикатом суждения является понятие «противоправное деяние» (В), являющееся сложным понятием или «отношением», в котором «деяние» является субъектом суждения (А), а понятие «противоправное» - является признаком А. На примере «отношения» «противоправное деяние» видно, что в нем находятся «понятия», у которых объем одного полностью входит в объем другого, но не исчерпывает его. Иначе говоря, все элементы объема (В) являются элементами объема (А), но не наоборот. Вид таких отношений -«подчинение», т.е. родовидовое отношение, где более общее «понятие» выступает родом, а менее общее - видом. Кванторное слово указывает, относится ли информация о предикате суждения ко всему объему понятия, выражающему субъект суждения, или к его части. Например, в суждении: «Всякое преступление есть противоправное деяние», - кванторное слово «всякое» указывает, что информация о предмете суждения (словосочетание «противоправное деяние») относится ко всему объему (к каждому элементу объема) предмета суждения - слова «преступление». Под иными, особыми частями понимаются такие отдельные понятия и группы понятий суждения, которые также уточняют значение понятий, составляющих первую семантическую часть 4110 логических разделов 41, но формально не относятся к признакам понятия, связке или кванторному слову. Например, в суждении: «Преступление (в т.ч. мошенничество, кража, убийство) есть противоправное деяние», - понятия, указанные в круглых скобках («мошенничество», «кража», «убийство») являются реальными (жизненными) примерами понятия «преступление». Признак понятия «противоправное» является существенным для понятия «деяние», поскольку без него понятие «противоправное деяние» утрачивает свое качество, перестает быть самим собой. Объем понятия - это класс (множество) мыслимых в понятии сущностей. Признаки понятия и объем понятия взаимосвязаны в рамках каждого понятия. Эта взаимосвязь позволяет установить реальный объем понятия, т.е. то, что реально подразумевается в смысловом содержании понятия. Для достижения максимального соответствия структуры логических конструкций 41 структуре нормативного предписания необходимо сепарировать виды вторых семантических частей 4120. С технической точки зрения, идентифицированные в процессе комплексного семантического анализа иные, особые части не являются элементом основного (регулятивного или охранительного) нормативного предписания. В связи с этим они удаляются из логических разделов и формируют базу данных 5 особых семантических частей, представляющую собой нормативный справочник или иной нормативный справочный материал, представляющий собой множество особых нормативных предписаний. Информация из такого справочника является доступной и актуальной, но структурно и методологически она находится за рамками основных (регулятивных и охранительных) нормативных предписаний (фиг. 10). С точки зрения юридической науки особые нормативные предписания представляют собой предписания, устанавливающие основные принципы, механизмы, порядок и цели правового регулирования общественных отношений, закрепляют правовые категории и понятия (например, дефинитивные предписания - предписания, закрепляющие в обобщенном виде признаки того или иного юридического понятия).At this stage, the identification of specific parts, i.e. the identification in logical sections 411, 412 of logical structures 41 of the second data structure of the first and second semantic parts 4110, 4120 of logical sections 411, 412. Moreover, the first semantic parts! 110 are formed by removing from the logical sections 411, 412 second semantic parts 4120 (specific parts) . The first semantic part 4110 of the logical section is the semantic core of judgment, i.e. judgment cleared of specific parts. The semantic core of judgment is the basic elements of judgment, such as the subject of the judgment, the predicate of the proposition, and the connective. The peculiarity of the connective is that the connective is only part of the semantic core of the judgment when it cannot be interpreted in a “three-dimensional plan”, in cases where the connective discloses the inclusion (or exclusion) of a subclass in the class of objects or the belonging (non-affiliation) of an element to the class . For example, in the judgment: “Crime is an unlawful act”, the subject of the judgment is the word “crime”, the predicate of the judgment is the phrase “unlawful act”, and the link is the word “is”. The second semantic parts of the 4120 logical section are the concepts of judgment, which are identified as signs of the subject of the judgment, the predicate of judgment, as well as the terms of the judgment — a connective (when it can be interpreted in the “three-dimensional plane”) and a quantifier word, as well as other, special parts. For example, the concept (subject of judgment) “crime provided for by the Criminal Code” contains the concept - the word “crime” and the sign of the concept - the phrase “provided for by the Criminal Code”. Signs of a concept - this is the content of a concept indicating the presence or absence of one or another property, state or relationship. In other words, a sign of a concept is all that in which the concepts can be similar or different from each other. All signs of a concept that form the content of concepts are identified as significant and non-essential by the principle of loss of one's quality (inability to be oneself) without this attribute. For example, in a judgment: “Crime is an unlawful act”, the predicate of a judgment is the concept of “unlawful act” (B), which is a complex concept or “attitude” in which “act” is the subject of judgment (A), and the concept of “unlawful” - is a sign of A. On the example of “relationship”, “illegal act” shows that it contains “concepts” in which the volume of one is fully included in the volume of the other, but does not exhaust it. In other words, all elements of volume (B) are elements of volume (A), but not vice versa. The type of such relations is “submission”, i.e. generic relation, where the more general “concept” acts as a genus, and the less general - as a species. A quantifier word indicates whether information about a predicate of a judgment applies to the whole volume of a concept expressing a subject of a judgment, or to a part of it. For example, in the judgment: “Every crime is an unlawful act”, the quantifier word “any” indicates that information about the subject of the judgment (the phrase “unlawful act”) refers to the entire volume (to each element of the volume) of the subject of the judgment - the word “crime” . Other, special parts are understood to mean such separate concepts and groups of concepts of judgment, which also clarify the meaning of concepts that make up the first semantic part 4110 of logical sections 41, but do not formally relate to the features of a concept, a bunch, or a quantifier word. For example, in the judgment: “Crime (including fraud, theft, murder) is an unlawful act”, the terms indicated in parentheses (“fraud”, “theft”, “murder”) are real (life) examples concepts of "crime". The sign of the concept of “unlawful” is essential for the concept of “act”, since without it the concept of “unlawful act” loses its quality, ceases to be itself. The scope of a concept is a class (set) of entities conceivable in a concept. The signs of the concept and the scope of the concept are interconnected within each concept. This relationship allows us to establish the real scope of the concept, i.e. what is really implied in the semantic content of the concept. In order to achieve maximum conformity of the structure of logical constructions 41 to the structure of the normative prescription, it is necessary to separate the types of the second semantic parts 4120. From a technical point of view, other, special parts identified in the process of complex semantic analysis are not an element of the main (regulatory or protective) normative prescription. In this regard, they are removed from the logical sections and form a database of 5 special semantic parts, which is a regulatory reference or other regulatory reference material, which represents a lot of special regulatory requirements. Information from such a reference is accessible and relevant, but structurally and methodologically it is beyond the scope of the basic (regulatory and protective) regulatory requirements (Fig. 10). From the point of view of legal science, special regulatory prescriptions are prescriptions that establish the basic principles, mechanisms, order and goals of the legal regulation of public relations, consolidate legal categories and concepts (for example, definitive prescriptions - prescriptions that consolidate in a generalized form the attributes of a legal concept) .

На фиг. 11 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 205 формирования грамматически и орфографически верных семантических частей, на котором формируют грамматически и орфографически верные семантические части упомянутых логических разделов 41 путем лингвистических преобразований над упомянутыми семантическими частями. Этап 205 включает выполнение этапа 2051 идентификации уточняющих структур, на котором в упомянутых вторых семантических частях 4120 упомянутых вторых логических разделов 412 элементов 41 второй структуры данных 4 идентифицируют, по меньшей мере, уточняющие структуры вторых семантических 4122 частей вторых логических разделов 412; и выполнением этапа 2052 лингвистических преобразований, на котором осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей 4111, 4121 упомянутых первых и вторых логических разделов 411, 412, для формирования грамматически и орфографически верных семантических частей 4123 и уточняющих структур 4122 логических разделов элементов 41 второй структуры данных 4. Общая схема полученной второй структуры данных 4 представлена на фиг. 12. Для достижения максимального соответствия структуры логических конструкций 41 структуре нормативного предписания необходимо дополнительно идентифицировать оставшиеся виды вторых семантических частей. Дополнительная идентификация также производится в рамках комплексного семантического анализа. Предметом анализа будет являться массив значений, выявленных указанных видов вторых семантических частей 4120, т.е. массив понятий, содержащихся в логических разделах и идентифицированных в качестве соответствующих видов. Каждое понятие данных массивов должно быть идентифицировано с точки зрения его принадлежности к уточнениям 4124 или к зависимостям 4125. При этом уточнением является такая характеристика понятия, которая осуществляет переход от более широкого понятию к более узкому, а зависимости содержат признаки юридического факта, т.е. некого события, при наличие (отсутствии) которого понятие, к которому относится зависимость, актуализируется или наоборот становится неактуальным. Лингвистические преобразования над всеми семантическими частями логических разделов связаны с восстановлением правильной грамматики и орфографии отдельных семантических частей, которое потребуется в связи с фактическим разделением текста предложений на отдельные части - семантические части 4110, 4120 логических разделов, и с учетом удаления особых семантических разделов 4111, 4121 из указанного текста. Под указанными лингвистическими преобразованиями понимается, в частности, согласование родов, чисел, падежей, правка (замена и удаление) несоответствующих знаков препинания.In FIG. 11, by way of example, but not limitation, a general flowchart is shown of the steps of step 205 of forming grammatically and spelling-correct semantic parts, on which grammatically and spelling-correct semantic parts of said logical sections 41 are formed by linguistic transformations over said semantic parts. Step 205 includes performing a refinement structure identification step 2051, wherein at least second refinement structures of the second semantic 4122 parts of the second logical partitions 412 are identified in said second semantic parts 4120 of said second logical partitions 412 of elements of the second data structure 4; and performing a step 2052 of linguistic transformations, where linguistic transformations are performed on all semantic parts, with the exception of the mentioned special semantic parts 4111, 4121 of the first and second logical sections 411, 412, to form grammatically and spelling-correct semantic parts 4123 and qualifying logical structures 4122 sections of elements 41 of the second data structure 4. A general diagram of the obtained second data structure 4 is shown in FIG. 12. To achieve maximum compliance with the structure of logical constructions 41 to the structure of a normative prescription, it is necessary to additionally identify the remaining types of second semantic parts. Additional identification is also carried out as part of a comprehensive semantic analysis. The subject of analysis will be an array of values identified by the indicated types of the second semantic parts 4120, i.e. an array of concepts contained in logical sections and identified as corresponding species. Each concept of these arrays should be identified from the point of view of its belonging to refinements 4124 or to dependencies 4125. The refinement is such a characteristic of the concept that carries out the transition from a broader concept to a narrower one, and the dependencies contain signs of a legal fact, i.e. a certain event, in the presence (absence) of which the concept to which the dependence refers is actualized, or vice versa becomes irrelevant. Linguistic transformations over all semantic parts of logical sections are associated with the restoration of the correct grammar and spelling of individual semantic parts, which will be required in connection with the actual division of the text of sentences into separate parts - semantic parts 4110, 4120 of logical sections, and taking into account the removal of special semantic sections 4111, 4121 from the specified text. By the indicated linguistic transformations we mean, in particular, the coordination of childbirth, numbers, cases, editing (replacement and removal) of inappropriate punctuation marks.

На фиг. 13 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 206 формирования итоговой структуры данных 6, на котором формируют результирующую структуру данных 6 структурированного исходного массива данных, содержащую элементы 61 упомянутой результирующей структуры данных 6, причем упомянутые элементы 61 итоговой структуры данных содержат логические конструкции 61, содержащие, по меньшей мере, упомянутые грамматически и орфографически верные семантические части 4123 логических разделов. Этап 206 характеризуется выполнением этапа 2061 формирования смысловых сочетаний, на котором формируют из первых грамматически и орфографически верных семантических частей 4123 вторых логических разделов 412 элементов 41 второй структуры данных 4 и упомянутых грамматически и орфографически верных уточняющих структур 4122 вторых семантических частей 4120 вторых логических разделов 412 элементов 41 второй структуры данных 4 смысловые сочетания 611 грамматически и орфографически верных семантических частей 4122, 4123 вторых логических разделов 412 элементов 41 второй структуры данных 4; и выполнением этапа 2062 формирования результирующей структуры данных 6, на котором формируют результирующую структуру данных 6, содержащую элементы 61 результирующей структуры данных 6, причем упомянутые элементы 61 результирующей структуры данных 6 представляют собой логические конструкции 61, содержащие упомянутые грамматически и орфографически верные семантические части 4122, 4123 логических разделов элементов 41 второй структуры данных 4. Возможна так же ситуация, когда логические конструкции 61 из упомянутой результирующей структуры данных 6 дополнительно содержат упомянутые сформированные смысловые сочетания 611 грамматически и орфографически верных семантических частей 4122, 4123 вторых логических разделов 412 элементов 41 второй структуры данных 4 (фиг. 14). Итоговая общая структура элемента 61 результирующей структуры данных 6 представлена на фиг. 15. Основой нормативного предписания является юридическое правило (правило), которое может быть максимально корректно сформировано в результате проведения комплексного семантического анализа логических разделов логических конструкций. На этапе формирования логических конструкций большая часть обусловленностей была отделена от правила (второго логического раздела 412) и выделена в отдельный раздел - первый логический раздел 411. По результатам комплексного семантического анализа было выявлено смысловое ядро правила (второго логического раздела 412) и остатки обусловленностей были так же выделены во вторые семантические части 4120, в которых некоторые из указанных частей идентифицированы как уточнение 4124. В результате всех преобразований стало возможным в структуре логических конструкций 61 создать смысловые сочетания 611, т.е. сочетания из первых семантических частей 4110 вторых логических разделов 412 и вторых семантических частей 4120 вторых логических разделов 412, идентифицированных как уточнение 4124. Данные смысловые сочетания являются юридическими правилами. Результирующая структура данных представляет собой структурированную конструкцию, элементы которой максимально соответствуют структуре нормативного предписания. Результирующая структура данных сформирована в таком виде с целью упрощения и регламентации профессиональной работы по созданию и корректировке НПА. Результирующая структура данных представляет собой конструкцию, которая позволяет буквально визуализировать нормативные предписания, увидеть все фактические элементы смысловой конструкции, что позволяет проводить их многосторонний полноценный анализ с целью проведения точечных корректировок, как существующих нормативных предписаний, так и проектов предписаний на разных стадиях их создания.In FIG. 13, by way of example, but not limitation, a general flowchart of the steps of step 206 of generating the final data structure 6 is shown, in which the resulting data structure 6 of the structured source data array is formed comprising the elements 61 of the resulting resultant data structure 6, the aforementioned elements 61 of the final data structure contain logical constructions 61 containing at least the grammatically and spelling-correct semantic parts 4123 of logical sections. Step 206 is characterized by the execution of a semantic combination step 2061, in which 4123 second logical partitions 4 of the second data structure 4 and 4 grammatical and spelling correcting structures 4122 of the second semantic parts 4120 of the second logical partitions 412 of the elements are formed from the first grammatically and spelling-correct semantic parts 4123 41 second data structures 4 semantic combinations 611 grammatically and spelling-correct semantic parts 4122, 4123 second logical sections 412 element s 41 of the second data structure 4; and by performing step 2062 of generating the resulting data structure 6, wherein the resulting data structure 6 is formed comprising the elements 61 of the resulting data structure 6, said elements 61 of the resulting data structure 6 being logical structures 61 containing the grammatically and spelling-correct semantic parts 4122, 4123 logical partitions of the elements 41 of the second data structure 4. A situation is also possible when the logical structures 61 of the resulting data structure are given x 6 additionally contain the mentioned generated semantic combinations 611 of grammatically and spelling correct semantic parts 4122, 4123 of the second logical sections 412 of the elements 41 of the second data structure 4 (Fig. 14). The final overall structure of element 61 of the resulting data structure 6 is shown in FIG. 15. The basis of a normative prescription is a legal rule (rule), which can be formed as correctly as possible as a result of a comprehensive semantic analysis of logical sections of logical structures. At the stage of formation of logical constructions, most of the conditions were separated from the rule (second logical section 412) and separated into a separate section - the first logical section 411. Based on the results of complex semantic analysis, the semantic core of the rule (second logical section 412) was revealed and the rest of the conditions were 4120, in which some of the indicated parts are identified as refinement 4124, are highlighted in the second semantic parts. As a result of all the transformations, it became possible in the logical structure FIR 61 structures create a semantic coupling 611, i.e. combinations of the first semantic parts 4110 of the second logical sections 412 and the second semantic parts 4120 of the second logical sections 412, identified as refinement 4124. These semantic combinations are legal rules. The resulting data structure is a structured structure, the elements of which are most consistent with the structure of the regulatory prescription. The resulting data structure is formed in this form in order to simplify and regulate the professional work on the creation and adjustment of regulatory documents. The resulting data structure is a design that allows you to literally visualize regulatory requirements, see all the actual elements of the semantic design, which allows them to be comprehensively analyzed in order to make precise adjustments to both existing regulatory requirements and draft regulations at different stages of their creation.

На фиг. 16 в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 300 формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных. Заявленный способ 300 формирования карты связей компонентов характеризуется выполнением этапа 301 идентификации компонентов и значений, на котором идентифицируют компоненты грамматически и орфографически верных семантических частей логических разделов логических конструкций из упомянутого преобразованного структурированного исходного массива данных, причем каждая упомянутая грамматически и орфографически верная семантическая часть, содержащая упомянутые компоненты, содержит, по меньшей мере, один упомянутый компонент, причем упомянутый компонент содержит не более одного значения компонента, и формируют таблицу компонентов, содержащую, по меньшей мере, упомянутые идентифицированные компоненты и их значения; этапа 302 идентификации семантических частей, на котором идентифицируют грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащие упомянутые идентифицированные компоненты, и грамматически и орфографически верные семантические части логических разделов логических конструкций, не содержащие упомянутые идентифицированные компоненты; этапа 303 идентификации компонентов, на котором идентифицируют компоненты, содержащиеся в количестве более одного в упомянутых грамматически и орфографически верных семантических частях, и идентифицируют сочетания компонентов, содержащихся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и формируют карту сочетаний компонентов, содержащую, по меньшей мере, упомянутые компоненты, содержащиеся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и их сочетания; этапа 304 идентификации значений компонентов, на котором идентифицируют значения компонентов, содержащихся в упомянутой карте сочетаний компонентов; этапа 305 идентификации понятий, на котором в грамматически и орфографически верных семантических частях логических разделов логических конструкций, не содержащих упомянутых идентифицированных компонентов, идентифицируют понятия, семантически совпадающие с упомянутыми значениями компонентов, содержащихся в упомянутой карте сочетаний компонентов, и формируют таблицу семантически совпадающих понятий, содержащую, по меньшей мере, значения компонентов, содержащихся в упомянутой карте сочетаний компонентов, и семантически совпадающие с ними понятия; этапа 306 идентификации семантических частей, не содержащих компонентов, и содержащих понятия, на котором идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логического раздела логической конструкции, не содержащую упомянутые идентифицированные компоненты, и содержащую более одного упомянутого понятия; этапа 307 идентификации семантических частей, содержащих компоненты, значения которых совпадают с понятиями, идентифицируют грамматически и орфографически верную семантическую часть логического раздела логической конструкции, содержащую более одного упомянутого идентифицированного компонента, значения которых семантически совпадают с упомянутыми понятиями, содержащимися в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов и содержащей более одного упомянутого понятия; этапа 308 формирования карты сочетаний семантически совпадающих понятий, на котором формируют карту сочетаний семантически совпадающих понятий, содержащую, по меньшей мере, упомянутые понятия, содержащиеся в количестве более одного в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов, семантически совпадающие со значениями упомянутых идентифицированных компонентов, содержащихся в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, содержащей более одного упомянутого идентифицированного компонента; и этапа 309 формирования карты связей компонентов, на котором формируют карту связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую карту сочетаний компонентов и упомянутую карту сочетаний семантически совпадающих понятий. Дополнительно, способ 300 формирования карты связей компонентов может содержать этап 310 формирования отчета, на котором формируют отчет, демонстрирующий, по меньшей мере, количество связей и значения упомянутых компонентов, содержащихся в карте сочетаний компонентов. Компонент представляет собой атрибут юридического правила. Юридическое правило - это часть нормативного предписания. Целью компонентного структурирования правил является формирование некоего стандарта конструирования и системной технической оценки конструкции юридического правила, а также поиск и выявление связанных предписаний, формирующих конструкцию логической нормы права. Все компоненты правила, упомянутые в настоящем описании являются примерами, используемыми для целей пояснения настоящего изобретения. Иные компоненты без ограничений могут быть выявлены в соответствии с настоящим способом в других юридических правилах. Первым компонентом юридического правила, в качестве примера, но не ограничения, являются субъекты правоотношений -это правомочные лица, установленные в предписании, отношения между которыми регулируются предписанием. Кроме этого в предписании может быть использована одна из сторон, для которой устанавливается определенное правило. Стороны правоотношений именуются как субъект предписания и контрсубъект. При этом субъект предписания является причиной и источником регулирующего воздействия, а контрсубъект - стороной правоотношений, с которой связано это воздействие. Вторым компонентом юридического правила в качестве примера, но не ограничения, является регулирующее воздействие - некое действие, бездействие, требование, принцип и т.п. В случае наличия в предписании субъекта правоотношений, регулирующим воздействием будет являться содержание правоотношения - т.е. возможность определенных действий, необходимость определенных действий или необходимость воздержания от запрещенных действий. В случае если предписание не содержит субъекта правоотношений, то регулирующим воздействием будет являться содержание требований относящихся к объектам правоотношений. Третьим компонентом юридического правила в качестве примера, но не ограничения, является объект правоотношений - это объекты, явления и их производные (далее - объекты), это те предметы окружающего мира, на которые направлено регулирующее воздействие. В случае если правило не содержит субъекта правоотношений, то объектом правоотношений являются те объекты, на которые распространяется регулирующее воздействие в виде содержания требований к данным объектам. Четвертым компонентом юридического правила в качестве примера, но не ограничения, являются связанные объекты - это объекты, явления и их производные, которые присутствуют в правиле, но не являются объектами правоотношений. Связанные объекты используются в правиле либо для детализации и уточнения регулирующего воздействия, либо как объект регулирующего воздействия, либо как объект регулирования.In FIG. 16 as an example, but not limitation, depicts a General diagram of the steps of the claimed method 300 of forming a map of the relations of the components of the grammatically and spelling correct semantic parts of the logical sections of the logical structures of the converted structured source data array. The claimed method 300 for generating a map of component relationships is characterized by performing a step 301 of identifying components and values, which identify the components of the grammatically and spelling correct semantic parts of logical sections of logical constructions from said transformed structured source data array, each grammatically and spelling-correct semantic part containing said components, contains at least one of the aforementioned component, moreover, yanuty component comprises no more than one component value, and generating a table of components comprising at least said identified components and their values; step 302 of identification of semantic parts, which identify grammatically and spelling correct semantic parts of logical sections of logical structures containing said identified components, and grammatically and spelling correct semantic parts of logical sections of logical structures that do not contain said identified components; component identification step 303, in which components containing more than one in said grammatically and spelling correct semantic parts are identified and combinations of components contained in more than one in each separate grammatically and spelling correct semantic parts are identified, and a map of component combinations containing at least the aforementioned components contained in an amount of more than one in each separate grammatically and ortho graphically true semantic part, and their combination; step 304 identifying the values of the components, which identify the values of the components contained in the aforementioned map of combinations of components; concept identification step 305, in which, in the grammatically and spelling-correct semantic parts of the logical sections of logical constructions that do not contain the identified components identified, concepts are identified that are semantically the same as the values of the components contained in the component combination map, and a table of semantically matching concepts containing at least the values of the components contained in the said map of combinations of components and semantically matching these concepts; step 306 of identifying semantic parts that do not contain components and containing a concept, which identifies at least one grammatically and spelling-correct semantic part of a logical section of a logical construction that does not contain the identified components and contains more than one of the aforementioned concepts; stage 307 identification of semantic parts containing components whose values coincide with the concepts, identify the grammatically and spelling-correct semantic part of the logical section of the logical construction, containing more than one identified component, the values of which semantically coincide with the above-mentioned concepts, contained in one grammatically and spelling-correct semantic parts of a logical partition of a logical construct that does not contain the identified identified computers nents and comprising more than one of said concept; step 308 of forming a map of combinations of semantically matching concepts, which form a map of combinations of semantically matching concepts, containing at least the mentioned concepts, containing more than one in one grammatically and spelling-correct semantic part of the logical section of the logical construction that does not contain the identified components semantically coinciding with the values of the identified identified components contained in one grammatically and spelling in the black semantic part of the logical section of the logical structure containing more than one of the identified components; and step 309 of forming a map of component relationships, where a map of component relationships of grammatically and orthographically correct semantic parts of logical sections of the logical constructs of the transformed structured source data array containing at least said combination map of components and said map of combinations of semantically matching concepts is formed. Additionally, the method 300 of generating a map of the connections of the components may include a step 310 of generating a report on which a report is generated showing at least the number of links and the values of said components contained in the map of combinations of components. A component is an attribute of a legal rule. A legal rule is part of a regulatory enactment. The purpose of the component structuring of rules is the formation of a certain design standard and systematic technical assessment of the construction of a legal rule, as well as the search and identification of related requirements that form the construction of a logical rule of law. All components of the rule mentioned in the present description are examples used for the purpose of explaining the present invention. Other components without restrictions may be identified in accordance with this method in other legal rules. The first component of a legal rule, as an example, but not a limitation, is the subjects of legal relations - these are authorized persons established in the precept, the relations between which are governed by the precept. In addition, one of the parties may be used in the order for which a certain rule is established. Parties to legal relations are referred to as the subject of the order and the counter-subject. In this case, the subject of the prescription is the cause and source of regulatory influence, and the counter-subject is the party to the legal relationship with which this effect is associated. The second component of a legal rule, as an example, but not a limitation, is the regulatory impact - an action, inaction, requirement, principle, etc. If the prescription of the subject of legal relations, the regulatory impact will be the content of the legal relationship - i.e. the possibility of certain actions, the need for certain actions or the need to refrain from prohibited actions. If the order does not contain the subject of legal relations, then the regulatory impact will be the content of the requirements relating to the objects of legal relations. The third component of a legal rule, as an example, but not a limitation, is the object of legal relations - these are objects, phenomena and their derivatives (hereinafter referred to as objects), these are objects of the world around which the regulatory influence is directed. If the rule does not contain the subject of legal relations, then the objects of legal relations are those objects that are subject to regulatory influence in the form of the content of requirements for these objects. The fourth component of a legal rule as an example, but not limitation, is related objects - these are objects, phenomena and their derivatives that are present in the rule, but are not objects of legal relations. Related objects are used in the rule either to detail and clarify the regulatory impact, or as an object of regulatory impact, or as an object of regulation.

Figure 00000004
Figure 00000004

Каждый компонент (вид компонента), установленный в компонентной структуре (см. таблицу 5), описывается с помощью различных лингвистических инструментов, таких как синтаксические функции и связи, части речи, члены предложения и т.п. Лингвистические инструменты описывают отдельные термины (понятия) и группы терминов (понятий), входящие в семантические части. Такие описания формируются в виде логических формул, в которых элементами выступают упомянутые лингвистические инструменты, связанные друг с другом логическими связками - конъюнкцией («и»), дизъюнкцией («или»), строгой дизъюнкцией («либо, …либо»), импликацией («если…, то»). Логические формулы по каждому компоненту (виду компонента) формирует база данных описаний компонентов. База данных описаний компонентов - это набор инструментов для поиска компонентов в грамматически и орфографически верных семантических частях логических разделов логических конструкций преобразованного структурированного исходного массива данных. Карта связей компонентов при этом состоит из внутренних и внешних связей компонентов. Внутренние связи компонентов указывают на сочетания компонентов внутри одного правила (внутри семантической части, содержащей компоненты). Внешние связи компонентов указывают на связь между отдельными нормативными предписаниями, основанными на наличии семантических связей между компонентами и отдельными словами, и словосочетаниями в семантических частях, не содержащих компоненты. Для идентификации компонентов в грамматически и орфографически верных семантических частях логических разделов логических конструкций из упомянутого преобразованного структурированного исходного массива данных необходимо предварительно выявить среди всех семантических частей только те семантически части, которые содержат компоненты. Это первая семантическая часть второго логического раздела логической конструкции. После выявления семантических частей, содержащих компоненты, с помощью инструментов для поиска компонентов, содержащихся в базе данных описаний компонентов, идентифицируются сами компоненты. Под идентификацией компонентов понимается выявление в каждой отдельной семантической части, содержащей компоненты следующей информации: а) наименование компонента; б) вид компонента; в) значение компонента. Наименование компонента - это элемент юридического правила, отражающий признаки правовых отношений в конкретном правиле, являющийся основной частью лингвистической формулы. Вид компонента - это основная и дополнительная части лингвистической формулы, т.е. отдельные подгруппы наименований компонентов, выявленные на основании различий в дополнительной части лингвистической формулы. Значение компонента - это термин или группа терминов, содержащихся в семантической части, которые соответствуют основной и дополнительной частям лингвистической формулы. В качестве примера, но не ограничения, будет произведена идентификация компонентов в юридическом правиле:Each component (type of component) installed in the component structure (see table 5) is described using various linguistic tools, such as syntactic functions and relationships, parts of speech, sentence members, etc. Linguistic tools describe individual terms (concepts) and groups of terms (concepts) included in the semantic parts. Such descriptions are formed in the form of logical formulas in which the elements are the mentioned linguistic tools connected with each other by logical connectives - conjunction ("and"), disjunction ("or"), strict disjunction ("either, ... or"), implication ( "If ... then"). Logical formulas for each component (type of component) form a database of descriptions of components. Component descriptions database is a set of tools for finding components in grammatically and spelling-correct semantic parts of logical sections of logical constructions of a transformed structured source data array. The map of component relationships in this case consists of internal and external component relationships. The internal relationships of components indicate combinations of components within one rule (within the semantic part containing components). External relations of components indicate the relationship between individual regulatory requirements based on the presence of semantic relations between components and individual words, and phrases in semantic parts that do not contain components. To identify components in the grammatically and spelling-correct semantic parts of logical sections of logical constructions from the aforementioned transformed structured source data array, it is necessary to first identify among all semantic parts only those semantically parts that contain components. This is the first semantic part of the second logical section of the logical construction. After identifying the semantic parts containing the components, using the tools to search for the components contained in the component descriptions database, the components themselves are identified. By the identification of components is meant the identification in each separate semantic part containing the components of the following information: a) the name of the component; b) the type of component; c) the value of the component. The name of the component is an element of a legal rule, reflecting the signs of legal relations in a particular rule, which is the main part of the linguistic formula. The type of component is the main and additional parts of the linguistic formula, i.e. separate subgroups of component names identified on the basis of differences in the additional part of the linguistic formula. The meaning of a component is a term or group of terms contained in the semantic part that correspond to the main and additional parts of the linguistic formula. As an example, but not limitation, the components will be identified in the legal rule:

«Уполномоченный орган обязан принять меры по отзыву такого товара с внутреннего рынка от потребителя». В данном примере идентифицируются все пять компонентов правила (см. таблицу 6).“The authorized body is obliged to take measures to recall such goods from the domestic market from the consumer.” In this example, all five components of the rule are identified (see table 6).

Figure 00000005
Figure 00000005

В юридическом правиле, смысловое ядро которого соответствует первой семантической части второго логического раздела, у каждого компонента может быть одно значение. По результатам идентификации компонентов в первых семантических частях второго логического раздела логической конструкции формируется таблица компонентов. Таблица компонентов содержит следующую информацию: наименование компонента; вид компонента; значение компонента; уникальный номер семантической части; уникальный номер логического раздела; уникальный номер логической конструкции. Основываясь на информации, содержащейся в таблице компонентов, из массива семантических частей, содержащих компоненты выявляются семантические части, содержащие более одного компонента и семантические части, содержащие один компонент. Причина такого разделения семантических частей, содержащих компоненты, в том, что карта сочетаний компонентов - это массив фактических сочетаний компонентов в каждом отдельном правиле, т.е. в каждой отдельной семантической части, содержащей компоненты. Поскольку для любого сочетания необходимо минимум два элемента, то карта сочетаний компонентов может быть сформирована на основе семантических частей, содержащих более одного компонента. При этом каждая семантическая часть, содержащая более одного компонента, формирует группу компонентов одного правила. Сочетания компонентов внутри каждой отдельной группы компонентов формируют карту сочетаний компонентов. Карта сочетаний компонентов содержит следующую информацию: наименование сочетаемых компонентов; виды сочетаемых компонентов; значение сочетаемых компонентов; уникальный номер семантической части; уникальный номер логического раздела; уникальный номер логической конструкции. В качестве примера, но не ограничения, будет произведено карты сочетаний компонентов в юридическом правиле:In a legal rule, the semantic core of which corresponds to the first semantic part of the second logical section, each component can have one value. Based on the results of the identification of components in the first semantic parts of the second logical section of the logical structure, a table of components is formed. The table of components contains the following information: name of the component; type of component; component value unique semantic part number; Unique logical partition number unique logical design number. Based on the information contained in the component table, semantic parts containing more than one component and semantic parts containing one component are identified from the array of semantic parts containing components. The reason for this separation of semantic parts containing components is that the component combination map is an array of actual component combinations in each individual rule, i.e. in each separate semantic part containing the components. Since any combination requires at least two elements, a map of component combinations can be formed on the basis of semantic parts containing more than one component. Moreover, each semantic part containing more than one component forms a group of components of one rule. Component combinations within each individual component group form a map of component combinations. The component combination map contains the following information: name of the combined components; types of components to be combined; the value of the combined components; unique semantic part number; Unique logical partition number unique logical design number. As an example, but not limitation, maps of combinations of components in a legal rule will be produced:

«Уполномоченный орган обязан принять меры по отзыву такого товара с внутреннего рынка от потребителя».“The authorized body is obliged to take measures to recall such goods from the domestic market from the consumer.”

Figure 00000006
Figure 00000006

Указанное в примере сочетание компонентов и их видов позволяет отображать в отчете полностью или частично совпадающие между собой группы предписаний. Полное совпадение подразумевает наличие в выборке предписаний, имеющих один и тот же набор компонентов или видов компонентов, или значений компонентов. Частичное совпадение подразумевает наличие в выборке предписаний совпадающих сочетаний отдельных компонентов, или видов компонентов, или значений компонентов. В качестве примера полного совпадения можно привести выборку предписаний, в которой все предписания содержат, например, такой же состав компонентов, как и состав компонентов, приведенный в таблице 7, а именно К1-К1-К2-К3-К4, или состав указанных там же видов компонентов, или указанных значений. В качестве примера неполного совпадения можно привести выборку предписаний, в которой все предписания содержат часть указанных пользователем компонентов из установленного сочетания - например, только сочетание К1-К3. В такую выборку попадают не только предписания с установленным сочетанием К1-К3, но и с другими сочетаниями компонентов (например К1-К2-К3), в которых наряду с указанными в сочетании К1-К3 компонентами содержатся другие компоненты (например, К2). Карта сочетаний компонентов представляет собой первую часть карты связей компонентов. Внешние связи компонентов, составляющие вторую часть карты связей компонентов, основываются на наличии семантических связей между компонентами и отдельными словами, и словосочетаниями в семантических частях, не содержащих компоненты. Под семантической связью понимается наличие между значениями компонентов и отдельными словами, и словосочетаниями смыслового совпадения, т.е. совпадения значений отдельных компонентов и слов по смыслу. В качестве примера, но не ограничения, может быть рассмотрено одно правило (семантическая часть, содержащая компоненты) - «Продавец обязан передать товар потребителю», - и одна семантическую часть, не содержащая компоненты (ситуация, юридический факт) - «Если товар не передан потребителю». В первую очередь необходимо идентифицировать внешние связи компонентов, т.е. наличие семантической связи между значениями компонентов и понятиями, семантически совпадающими с ними. В результате, для данного примера будет выявлено три связи между следующими значениями компонентов и словами в семантической части «ситуация»: а) товар - товар; б) обязан передать - не передан; в) потребителю - потребителю. Для идентификации второй части карты связей компонентов используются только компоненты, зарегистрированные в карте сочетаний компонентов - т.е. компоненты, содержащиеся в одном юридическом правиле в количестве более одного. При этом в семантической части, не содержащей компоненты (в ситуациях), в которой выявлены понятия, семантически совпадающие со значениями упомянутых компонентов, должно быть выявлено не менее двух таких понятий. При этом семантически совпадающими понятиями могут быть не только полностью совпадающие или однокоренные слова (термины), но и их синонимы и ассоциации, выявленные в специальных подключаемых словарях и справочниках. Все понятия, семантически совпадающие со значениями компонентов, идентифицированные таким образом, регистрируются в специальной таблице - карте сочетаний семантически совпадающих понятий. Карта сочетаний семантически совпадающих понятий устанавливает связи между отдельными семантическими частями, содержащими компоненты и семантическими частями, не содержащими компоненты. Эта связь основана на выявленных связях между компонентами и соответствующими понятиями. В итоге выявляются связанные предписания. Карта сочетаний семантически совпадающих понятий содержит следующую информацию по каждой паре связанных предписаний: наименование компонентов; виды сочетаемых компонентов; значение сочетаемых компонентов; уникальный номер семантической части, содержащей компоненты; уникальный номер логического раздела, содержащего упомянутую семантическую часть; уникальный номер логической конструкции, содержащей упомянутый логический раздел; наименование понятий, семантически совпадающих со значениями упомянутых компонентов; уникальный номер семантической части, содержащей упомянутые понятия; уникальный номер логического раздела, содержащего упомянутую семантическую часть с понятиями; уникальный номер логической конструкции, содержащей упомянутый логический раздел и упомянутую семантическую часть с понятиями. Карта связей компонентов состоит из двух частей - из карты сочетаний компонентов и карты сочетаний семантически совпадающих понятий. Карта сочетаний компонентов может применяться при комплексном правовом анализе некоего правового контента, например, отраслевой или тематической группы НПА, или отдельного НПА или отдельного проекта НПА. По информации, зарегистрированной в Карте сочетаний компонентов можно моментально получить различные «системно-структурные срезы» НПА (проекта НПА или группы НПА) отражающие, по меньшей мере: компонентную структуру правил (как на уровне наименований, использованных в НПА компонентов, так и на уровне видов и значений компонентов); наличие отдельных сочетаний компонентов в правилах НПА (также на трех уровнях - наименование, вид и значение). Первая часть карты связей может быть сформирована и представлена в виде отчета. Этот отчет может быть сформирован по схеме и формату, который будет задан пользователем заранее и будет содержать выборочную и системно подобранную информацию, проясняющую важные для пользователя срезы НПА (проекта НПА, группы НПА). Карта сочетаний семантически совпадающих понятий может применятся как при правовом анализе некоего правового контента, например, отраслевой или тематической группы НПА, или отдельного НПА или отдельного проекта НПА, так и для поиска связанных предписаний в любом правовом контенте. Самым простым практическим результатом идентификации связей между предписаниями является решение задач по автоматическому выявлению предписаний, устанавливающих санкции за нарушение правила, указанного в исходном предписании и наоборот - выявление связи исходного предписания с правилом на основании предписания, содержащего санкции за нарушение данного правила. Выявленные таким образом связанные предписания формируют норму права, в которой присутствует регулятивная и охранительная части.The combination of components and their types indicated in the example allows displaying completely or partially matching prescription groups in the report. Full coincidence implies the presence of prescriptions in the sample that have the same set of components or types of components or component values. Partial coincidence implies the presence in the sample of prescriptions of matching combinations of individual components, or types of components, or values of components. As an example of complete coincidence, we can cite a selection of requirements in which all the requirements contain, for example, the same composition of components as the composition of the components shown in table 7, namely K1-K1-K2-K3-K4, or the composition indicated there types of components, or specified values. An example of an incomplete coincidence is a selection of prescriptions in which all prescriptions contain a part of the components specified by the user from the set combination - for example, only combination K1-K3. Such a selection includes not only the requirements with the established combination of K1-K3, but also with other combinations of components (for example K1-K2-K3), which contain other components (for example, K2) along with the components indicated in the combination K1-K3. The component combination map is the first part of the component association map. The external relations of the components that make up the second part of the map of component relationships are based on the presence of semantic relationships between components and individual words, and phrases in semantic parts that do not contain components. The semantic connection is understood as the presence between the meanings of the components and individual words, and phrases of semantic coincidence, i.e. coincidence of the meanings of the individual components and words within the meaning. As an example, but not limitation, one rule can be considered (the semantic part containing the components) - “The seller must transfer the goods to the consumer”, and one semantic part not containing the components (situation, legal fact) - “If the goods are not transferred to the consumer. " First of all, it is necessary to identify the external relations of the components, i.e. the presence of a semantic connection between the meanings of components and concepts that semantically coincide with them. As a result, for this example, three relationships will be revealed between the following meanings of the components and the words in the semantic part “situation”: a) product - product; b) must transfer - not transferred; c) to the consumer - to the consumer. To identify the second part of the component association map, only the components registered in the component combination map are used - i.e. components contained in one legal rule in an amount of more than one. At the same time, in the semantic part that does not contain components (in situations), in which concepts are identified that semantically coincide with the meanings of the components mentioned, at least two such concepts should be revealed. In this case, semantically coinciding concepts can be not only completely matching or one-root words (terms), but also their synonyms and associations identified in special connected dictionaries and reference books. All concepts that semantically coincide with the values of the components identified in this way are recorded in a special table - a map of combinations of semantically coinciding concepts. A map of combinations of semantically coinciding concepts establishes relationships between individual semantic parts containing components and semantic parts that do not contain components. This relationship is based on identified relationships between components and related concepts. As a result, related requirements are identified. A map of combinations of semantically matching concepts contains the following information for each pair of related prescriptions: name of components; types of components to be combined; the value of the combined components; unique number of the semantic part containing the components; unique number of the logical section containing the mentioned semantic part; a unique logical construction number containing the logical partition; the name of concepts that semantically coincide with the meanings of the mentioned components; unique number of the semantic part containing the mentioned concepts; unique number of the logical section containing the mentioned semantic part with concepts; a unique number of the logical construct containing the mentioned logical section and the mentioned semantic part with concepts. The map of component relationships consists of two parts - from a map of combinations of components and a map of combinations of semantically identical concepts. A combination of components map can be used in a comprehensive legal analysis of some legal content, for example, an industry or thematic group of legal acts, or a separate legal act or a separate draft legal act. According to the information registered in the Component Combination Map, you can instantly get various “system-structural sections” of the legal acts (draft legal acts or group of legal acts) reflecting at least: the component structure of the rules (both at the level of the names used in the legal acts of the components and at the level types and values of components); the presence of separate combinations of components in the rules of the regulatory legal acts (also at three levels - name, type and value). The first part of the communication map can be generated and presented in the form of a report. This report can be generated according to the scheme and format, which will be set by the user in advance and will contain selective and system-selected information clarifying the sections of the regulatory acts that are important for the user (draft legal acts, group of legal acts). A map of combinations of semantically coinciding concepts can be used both in the legal analysis of certain legal content, for example, an industry or thematic group of legal acts, or a separate legal act or a separate draft legal act, and to search for related provisions in any legal content. The simplest practical result of identifying relationships between prescriptions is to solve the problem of automatically identifying prescriptions establishing sanctions for violation of a rule specified in the original prescription and vice versa - to identify the relationship of the original prescription with the rule on the basis of the prescription containing sanctions for violation of this rule. The related prescriptions identified in this way form a rule of law in which there are regulatory and protective parts.

На фиг. 17 в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 400 поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций. Заявленный способ 400 поиска релевантной информации характеризуется выполнением этапа 401 формирования поискового запроса, на котором формируют поисковый запрос, содержащий, по меньшей мере, один поисковый термин и, при необходимости, дополнительно назначают, по меньшей мере, один критерий поиска, который может представлять собой одно из: поиск по первым и вторым семантическим частям первых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций; поиск по первым семантическим частям вторых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций; при этом поисковый запрос может представлять собой одно из: по меньшей мере, одно из: терминологический поисковый запрос; компонентный поисковый запрос; компонентно-терминологический поисковый запрос; этапа 402 идентификации массива поиска, на котором идентифицируют массив данных в упомянутом преобразованном структурированном исходном массиве данных, соответствующий упомянутому поисковому термину; этапа 403 идентификации семантических частей, на котором идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логических разделов логических конструкций упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутый поисковый термин; этапа 404 идентификации логических конструкций, на котором идентифицируют, по меньшей мере, одну логическую конструкцию упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть; и этапа 405 демонстрирования семантических частей, на котором демонстрируют, по меньшей мере, упомянутую идентифицированную логическую конструкцию упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть, которая является искомой релевантной информацией. Дополнительно (фиг. 18) заявленный способ 400 поиска релевантной информации может быть дополнен вторым уровнем поиска, заключающимся в выполнении этапа 406 выбора логической конструкции, на котором выбирают, по меньшей мере, одну из упомянутых идентифицированных логических конструкций, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть; этапа 407 идентификации связанных семантических частей, на котором идентифицируют, по меньшей мере, связанные с упомянутой грамматически и орфографически верной семантической частью грамматически и орфографически верные семантические части, содержащиеся в других логических конструкциях преобразованного структурированного массива данных, причем упомянутая идентификация осуществляется на основании сведений из карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций; этапа 408 идентификации логических конструкций, на котором идентифицируют, по меньшей мере, одну или более логические конструкции, содержащие упомянутые идентифицированные связанные грамматически и орфографически верные семантические части или идентифицируют отсутствие логических конструкций, содержащих упомянутые идентифицированные связанные грамматически и орфографически верные семантические части; и этапом 409 демонстрирования логических конструкций, на котором демонстрируют, по меньшей мере, одну или более логические конструкции, содержащие упомянутые идентифицированные связанные грамматически и орфографически верные семантические части или демонстрируют отсутствие логических конструкций, содержащих упомянутые идентифицированные связанные грамматически и орфографически верные семантические части. Изначально, массивом поиска является преобразованный структурированный исходный массив данных - т.е. нормативные правовые акты в виде логических конструкций, состоящих из множества субмассивов данных, в которых взаимозависимости существуют, как на уровне субмассивов, так и между отдельными значениями субмассивов. Субмассивы преобразованного структурированного исходного массива данных - это грамматически и орфографически верные семантические части логических разделов логических конструкций. Релевантность поиска - это выявление в тексте нормативного правового акта логических конструкций, являющихся нормативными предписаниями, соответствующими, по меньшей мере, поисковому запросу. Для достижения требуемого уровня релевантности поиска дополнительно может быть назначен один из возможных критериев поиска, которые предназначены для уточнения области поиска. Для достижения первого уровня релевантности поиска назначают критерий поиска по первым и вторым семантическим частям первых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций. Этот критерий поиска позволяет проводить поиск в массивах, относящихся к разделам ситуаций. Посредством назначения этого критерия поиска обеспечится выбор соответствующего субмассива (субмассива ситуаций), в котором в соответствии с поисковым запросом будет произведен поиск релевантной информации. Поисковый запрос при использовании такого критерия поиска может быть только терминологическим. Терминологический запрос - это запрос на поиск совпадений с установленным в запросе термином (понятием) в соответствующих критерию поиска субмассивах. Для достижения второго уровня релевантности поиска может быть применен критерий поиска по первым семантическим частям вторых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций. Этот критерий поиска позволяет проводить поиск в массивах, относящихся к разделам правил. Посредством назначения этого критерия поиска обеспечится выбор соответствующего субмассива (субмассива правил), в котором в соответствии с поисковым запросом будет произведен поиск релевантной информации. Поисковый запрос при этом может быть простым и сложным. Простыми запросами являются терминологический запрос и компонентный запрос. Компонентный запрос - это запрос на поиск совпадений, как по наличию компонентов юридического правила, так и по их видам, а также по их значениям. Компонентный запрос может быть трехуровневым - поиск по названию компонента юридического правила (первый уровень компонентного запроса), поиск по виду компонента юридического правила (второй уровень компонентного запроса), значение вида компонента (третий уровень компонентного запроса). При этом первые два уровня - это поиск по структуре компонентов юридического правила. Третий уровень - поиск по терминам из текста НПА, индексированным в соответствующих субмассивах как значение вида компонента юридического правила. Сложный поисковый запрос представляет собой объединение двух простых запросов - компонентного и терминологического. Компонентно-терминологический запрос представляет собой компонентный запрос, дополненный четвертым уровнем поиска - поиском по термину или терминам, содержащихся в выявленных по результатам компонентного запроса юридических правилах. Выполнение поискового запроса при этом может быть многоэтапным. В частности, на первом этапе поиска, критерии поиска и поисковый запрос применяются ко всей базе НПА. На втором и последующих этапах при этом может осуществляться применение критериев поиска и поисковых запросов к результатам поиска, полученным при выполнении первого этапа поиска. После назначения критерия поиска и выполнения поискового запроса в соответствующих критерию поиска субмассивах преобразованного структурированного исходного массива данных выявляются совпадения индексов и значений с установленными значениями поискового запроса. Результатом выполнения поискового запроса является идентификация перечня отдельных значений субмассивов, которые соответствуют значениям поискового запроса. Выявленные в результате анализа преобразованного структурированного исходного массива в соответствии с критериями поиска и поисковым запросом значения субмассивов ассоциируются с теми семантическими частями логических разделов логических конструкций, в которых они зарегистрированы. В итоге выявляются те логические конструкции, которые содержат семантические части, в которых выявлены значения, соответствующие поисковому запросу в субмассивах, соответствующих критериям поиска. В результате поиска релевантной информации в преобразованном структурированном исходном массиве данных будут продемонстрированы выявленные логические конструкции - нормативные предписания. Формат логических конструкций соответствует формату элементов преобразованного структурированного исходного массива данных и содержит юридическое правило и обусловленность правила (условно - «ситуации»). При этом юридическое правило состоит из смыслового ядра юридического правила и уточнений понятий смыслового ядра правила, а обусловленность правила состоит из смыслового ядра ситуации, уточнений понятий смыслового ядра ситуации, зависимостей понятий смыслового ядра ситуации и зависимостей понятий смыслового ядра правила. Соответственно, в случае назначения более одного значения поискового запроса (т.е. формирование нескольких запросов одновременно), дополнительно необходимо выявить логическую связь между назначенными значениями. Выявление логической связи необходимо для назначения дополнительного критерия поиска, позволяющего согласовать несколько поисковых запросов и корректной идентификации соответствующих логических конструкций. Несколько поисковых запросов при этом могут быть согласованы по логической связи «и» (конъюнкция) или логической связи или» (дизъюнкция). Назначение конъюнктивной логической связи позволяет выявлять нормативные предписания, полностью соответствующие всем запросам, т.е. нормативные предписания, которые содержат в соответствующих критериям поиска частях текста нормативного предписания, как значение первого запроса, так и значения остальных, связанных с первым запросов. Назначение дизъюнктивной логической связи позволяет выявлять нормативные предписания, полностью соответствующие только отдельным поисковым запросам, т.е. нормативные предписания, которые содержат в соответствующих критериям поиска частях текста нормативного предписания или значение первого запроса, или значения других запросов. Далее способ поиска может быть дополнен вторым уровнем поиска релевантной информации. Для реализации этого способа поиска, результатом которого является выявление логической нормы права, необходимо выбрать одну из выявленных логических конструкций (одно нормативное предписание), которая будет являться исходной для выявления всей связанной с выбранной логической конструкцией совокупности логических конструкций, образующих логическую норму права. Идентификация связей семантической части выбранной логической конструкции с семантическими частями данной и других логических конструкций основана на сведениях из второй части карты связей компонентов (из карты сочетаний семантически совпадающих понятий). Самой минимальной задачей по выявлению логической нормы права является задача идентификации нормативного предписания, устанавливающего санкции за нарушение юридического правила, указанного в исходной логической конструкции (в исходном нормативном предписании) или наоборот - идентификация нормативного предписания на основании исходной логической конструкции, содержащей санкции. В виде поискового запроса могут быть использованы либо значения компонентов, либо понятия (термины), семантически совпадающие со значениями компонентов. Это зависит от того, какая задача ставится при выявлении логической нормы права и этим определяется, в каких массивах будет производиться поиск. При поиске санкций за нарушение юридического правила поисковым запросом являются значения компонентов правила, а поисковым массивом - массивы всех семантических частей, относящиеся к обусловленностям правила. При поиске самого юридического правила по известным, ранее выявленным, санкциям, поисковым запросом являются термины, семантически совпадающие со значениями компонентов правила, а поисковым массивом - массивы всех семантических частей, относящиеся к юридическому правилу. В результате двухуровневого поиска релевантной информации в преобразованном структурированном исходном массиве данных идентифицируются логические конструкции, содержащие семантические части, которые содержат термины или компоненты, соответствующие поисковому запросу второго уровня и которые связаны с исходной логической конструкцией в рамках логической нормы права. Для идентификации таких связей используются внешние связи компонентов, составляющие вторую часть карты связей компонентов (карту сочетаний семантически совпадающих понятий), основывающиеся на наличии семантических связей между компонентами и отдельными словами, и словосочетаниями в семантических частях, не содержащих компоненты. Под семантической связью понимается наличие между значениями компонентов и отдельными словами, и словосочетаниями смыслового (семантического) совпадения, т.е. совпадения значения отдельных компонентов и отдельных слов по смыслу. В качестве примера, но не ограничения, можно рассмотреть одно юридическое правило (семантическую часть, содержащую компоненты) - «Продавец обязан передать товар потребителю» и одну семантическую часть, не содержащую компоненты (обусловленность правила, ситуацию, юридический факт) - «Если товар не передан потребителю». Осуществляется идентификация внешних связей компонентов, т.е. наличия семантической связи между значениями компонентов и понятиями, семантически совпадающими с ними. В результате для данного примера выявлено три связи между следующими значениями компонентов и словами в семантической части «ситуация»: а) товар - товар; б) обязан передать - не передан; в) потребителю - потребителю. Для идентификации связанных семантических частей используются только компоненты, зарегистрированные в карте связей компонентов - т.е. компоненты, содержащиеся в одном юридическом правиле в количестве более одного. При этом в семантической части, не содержащей компоненты («ситуации»), в которой выявлены понятия, семантически совпадающие со значениями упомянутых компонентов, должно быть выявлено не менее двух таких понятий, семантически совпадающих с не менее чем двумя значениями компонентов из одного юридического правила. При этом семантически совпадающими понятиями могут быть не только полностью совпадающие или однокоренные слова (термины), но и их синонимы и ассоциации, выявленные в специальных подключаемых словарях и справочниках. Все понятия, семантически совпадающие со значениями компонентов, идентифицированные таким способом регистрируются в специальной таблице - карте сочетаний семантически совпадающих понятий. Карта сочетаний семантически совпадающих понятий устанавливает связи между отдельными семантическими частями, содержащими компоненты, и семантическими частями, не содержащими компоненты. Эта связь основана на выявленных связях между компонентами и соответствующими понятиями. В итоге выявляются связанные предписания. Карта сочетаний семантически совпадающих понятий содержит следующую информацию по каждой паре связанных предписаний: наименование компонентов; виды сочетаемых компонентов; значение сочетаемых компонентов; уникальный номер семантической части, содержащей компоненты; уникальный номер логического раздела, содержащего упомянутую семантическую часть; уникальный номер логической конструкции, содержащей упомянутый логический раздел; наименование понятий, семантически совпадающих со значениями упомянутых компонентов; уникальный номер семантической части, содержащей упомянутые понятия; уникальный номер логического раздела, содержащего упомянутую семантическую часть с понятиями; уникальный номер логической конструкции, содержащей упомянутый логический раздел и упомянутую семантическую часть с понятиями. Карта сочетаний семантически совпадающих понятий может применятся как при правовом анализе некоего правового контента, например, отраслевой или тематической группы НПА, или отдельного НПА или отдельного проекта НПА, так и для поиска связанных предписаний по требованию пользователя в любом правовом контенте. В результате идентификации пользователю демонстрируются результаты в виде выявленных связанных предписаний (отдельных норм права).In FIG. 17, by way of example, but not limitation, a general flowchart of the inventive method 400 for finding relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs is shown. The claimed method 400 for searching relevant information is characterized by performing step 401 of generating a search query, which form a search query containing at least one search term and, if necessary, additionally assign at least one search criterion, which may be one from: search in the first and second semantic parts of the first logical sections of logical structures and the second semantic parts of the second logical sections of logical structures; search in the first semantic parts of the second logical sections of logical constructions and the second semantic parts of the second logical sections of logical constructions; wherein the search query may be one of: at least one of: terminological search query; component search query; component terminological search query; a search array identification step 402, which identifies a data array in said transformed structured source data array corresponding to said search term; step 403 of the identification of semantic parts, which identify at least one grammatically and spelling correct semantic part of the logical sections of the logical structures of said transformed structured source data array containing at least said search term; a logical structure identification step 404, wherein at least one logical structure of said transformed structured source data array is identified, comprising at least said grammatically and spelling-correct semantic part; and step 405 of demonstrating semantic parts, which demonstrate at least said identified logical construction of said transformed structured source data array containing at least said identified grammatically and spelling-correct semantic part, which is the sought-for relevant information. Additionally (Fig. 18), the claimed method 400 for searching for relevant information can be supplemented by a second search level, which consists in performing step 406 of selecting a logical structure, which selects at least one of these identified logical structures containing at least the aforementioned the grammatically and spelling-identified semantic part identified; step 407 of identifying related semantic parts, which identify at least grammatically and spelling correct semantic parts associated with said grammatically and spelling correct semantic parts contained in other logical constructs of the transformed structured data array, said identification being carried out on the basis of information from the map relations of components of grammatically and spelling-correct semantic parts of logical sections of logical constructs uktion; a logical construct identification step 408, wherein at least one or more logical constructs containing said identified grammatically and spelling correct semantic parts are identified or the absence of logical constructs containing said identified grammatically and spelling correct semantic parts is identified; and step 409 of demonstrating the logical constructs, which demonstrate at least one or more logical constructs containing the identified identified grammatically and spelling correct semantic parts or demonstrate the absence of logical constructs containing the identified identified grammatically and spelling correct semantic parts. Initially, the search array is a transformed structured source data array - i.e. normative legal acts in the form of logical constructions consisting of many data sub-arrays in which interdependencies exist both at the level of sub-arrays and between individual values of sub-arrays. Sub-arrays of the transformed structured source data array are grammatically and spelling-correct semantic parts of logical sections of logical constructions. Relevance of a search is the identification in the text of a normative legal act of logical constructions, which are normative prescriptions that correspond, at least, to the search query. To achieve the desired level of search relevance, one of the possible search criteria that are intended to refine the search area can be additionally assigned. To achieve the first level of search relevance, a search criterion is assigned to the first and second semantic parts of the first logical sections of logical constructions and the second semantic parts of the second logical sections of logical constructions. This search criterion allows you to search in arrays related to sections of situations. By assigning this search criterion, it will be possible to select the appropriate subarray (situations subarray) in which relevant information will be searched in accordance with the search query. A search query using this search criterion can only be terminological. A terminological query is a search query for matches with the term (concept) set in the query in the subarrays that match the search criteria. To achieve the second level of search relevance, a search criterion can be applied on the first semantic parts of the second logical sections of logical structures and the second semantic parts of the second logical sections of logical structures. This search criterion allows you to search in arrays related to rule sections. By assigning this search criterion, it will be possible to select the appropriate subarray (rule subarray) in which relevant information will be searched in accordance with the search query. A search query can be simple and complex. Simple queries are a terminology query and a component query. A component request is a request to search for matches, both by the presence of the components of a legal rule, and by their types, as well as by their values. A component request can be three-level - search by the name of a component of a legal rule (first level of a component request), search by type of a component of a legal rule (second level of a component request), value of the type of component (third level of a component request). Moreover, the first two levels are a search by the structure of the components of a legal rule. The third level is a search by terms from the text of the LA, indexed in the corresponding subarrays as the value of the type of component of the legal rule. A complex search query is a combination of two simple queries - component and terminological. A component-terminological query is a component query, supplemented by a fourth search level - a search by term or terms contained in the legal rules identified by the results of the component query. At the same time, performing a search query can be multi-stage. In particular, at the first stage of the search, the search criteria and the search query are applied to the entire base of legal entities. In the second and subsequent stages, the application of search criteria and search queries to the search results obtained by performing the first search stage can be carried out. After assigning a search criterion and executing a search query, in the subarrays of the transformed structured source data array that correspond to the search criterion, matches of indices and values with the set values of the search query are revealed. The result of the search query is the identification of a list of individual values of subarrays that correspond to the values of the search query. The values of subarrays identified as a result of the analysis of the transformed structured source array in accordance with the search criteria and the search query are associated with those semantic parts of the logical sections of the logical constructions in which they are registered. As a result, those logical constructions are identified that contain semantic parts in which the values corresponding to the search query in subarrays matching the search criteria are identified. As a result of the search for relevant information in the transformed structured source data array, the identified logical constructions - regulatory requirements will be demonstrated. The format of logical constructions corresponds to the format of elements of a transformed structured source data array and contains a legal rule and conditionality of the rule (conditionally - “situation”). Moreover, the legal rule consists of the semantic core of the legal rule and the refinement of the concepts of the semantic core of the rule, and the conditionality of the rule consists of the semantic core of the situation, the refinement of the concepts of the semantic core of the situation, the dependencies of the concepts of the semantic core of the situation and the dependencies of the concepts of the semantic core of the rule. Accordingly, in the case of assigning more than one value of the search query (i.e., generating several queries at the same time), it is additionally necessary to identify the logical relationship between the assigned values. The identification of a logical connection is necessary to assign an additional search criterion, which allows matching several search queries and the correct identification of the corresponding logical structures. In this case, several search queries can be coordinated by the logical connection “and” (conjunction) or the logical connection or ”(disjunction). The purpose of conjunctive logical communication allows you to identify regulatory requirements that are fully consistent with all requests, i.e. regulatory requirements, which contain in the relevant search criteria parts of the text of the regulatory requirement, both the meaning of the first request and the values of the others associated with the first request. The purpose of a disjunctive logical connection allows you to identify regulatory requirements that are fully consistent only with individual search queries, i.e. regulatory requirements, which contain in the relevant search criteria parts of the text of the regulatory requirement either the meaning of the first query or the meaning of other queries. Further, the search method may be supplemented by a second level of searching for relevant information. To implement this search method, the result of which is the identification of a logical rule of law, it is necessary to select one of the identified logical structures (one normative prescription), which will be the starting point for identifying the entire set of logical structures associated with the selected logical structure that form the logical rule of law. The identification of the relations of the semantic part of the selected logical construction with the semantic parts of this and other logical constructions is based on information from the second part of the component relationship map (from the map of combinations of semantically identical concepts). The minimal task of identifying a logical rule of law is the task of identifying a normative prescription that establishes sanctions for violating a legal rule specified in the original logical construction (in the original normative prescription) or vice versa - identifying the normative prescription on the basis of the original logical construction containing sanctions. In the form of a search query, either component values or concepts (terms) that semantically coincide with the component values can be used. It depends on what task is set when identifying the logical rule of law and this determines which arrays will be searched. When searching for sanctions for violation of a legal rule, the search query is the values of the components of the rule, and the search array is the arrays of all semantic parts related to the conditions of the rule. When searching for the legal rule itself by the known, previously identified, sanctions, the search query are terms that semantically coincide with the values of the rule components, and the search array is the arrays of all semantic parts related to the legal rule. As a result of a two-level search for relevant information in a transformed structured source data array, logical constructs are identified that contain semantic parts that contain terms or components that correspond to the second level search query and which are associated with the original logical construct within the framework of the logical rule of law. To identify such relations, external relations of components are used, which make up the second part of the map of component relations (a map of combinations of semantically identical concepts), based on the presence of semantic relations between components and individual words, and phrases in semantic parts that do not contain components. The semantic connection is understood as the presence between the meanings of the components and individual words, and phrases of semantic (semantic) coincidence, i.e. coincidence of the meaning of individual components and individual words within the meaning. As an example, but not limitation, we can consider one legal rule (the semantic part containing the components) - “The seller must transfer the goods to the consumer” and one semantic part not containing the components (conditionality of the rule, situation, legal fact) - “If the product is not transferred to the consumer. " The identification of the external relations of the components, i.e. the presence of a semantic connection between the meanings of the components and the concepts that semantically coincide with them. As a result, for this example, three relationships between the following meanings of the components and the words in the semantic part “situation” were revealed: a) product - product; b) must transfer - not transferred; c) to the consumer - to the consumer. To identify related semantic parts, only components registered in the component relationships map are used - i.e. components contained in one legal rule in an amount of more than one. Moreover, in the semantic part that does not contain components (“situations”), in which concepts are identified that semantically coincide with the meanings of the components mentioned, at least two such concepts should be revealed that semantically coincide with at least two meanings of the components from one legal rule. In this case, semantically coinciding concepts can be not only completely matching or one-root words (terms), but also their synonyms and associations identified in special connected dictionaries and reference books. All concepts that semantically coincide with the values of the components identified in this way are recorded in a special table - a map of combinations of semantically identical concepts. A map of combinations of semantically coinciding concepts establishes relationships between individual semantic parts containing components and semantic parts that do not contain components. This relationship is based on identified relationships between components and related concepts. As a result, related requirements are identified. A map of combinations of semantically matching concepts contains the following information for each pair of related prescriptions: name of components; types of components to be combined; the value of the combined components; unique number of the semantic part containing the components; unique number of the logical section containing the mentioned semantic part; a unique logical construction number containing the logical partition; the name of concepts that semantically coincide with the meanings of the mentioned components; unique number of the semantic part containing the mentioned concepts; unique number of the logical section containing the mentioned semantic part with concepts; a unique number of the logical construct containing the mentioned logical section and the mentioned semantic part with concepts. A map of combinations of semantically coinciding concepts can be used both in the legal analysis of certain legal content, for example, an industry or thematic group of legal acts, or a separate legal regulation or a separate draft legal regulation, and to search for related requirements at the request of the user in any legal content. As a result of identification, the user is shown the results in the form of identified related requirements (separate legal norms).

На фиг. 19 в качестве примера, но не ограничения, проиллюстрирована примерная схема заявленной системы 500, которая в предпочтительном варианте реализации содержит, по меньшей мере, одно или более устройств 501, содержащих, по меньшей мере, один или более процессоров 5011, один или более модулей ввода/вывода (I/O) 5012 и память 5013. Упомянутые устройства 501 могут представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, тонкий клиент и тому подобное. Память (машиночитаемый носитель данных) 5013 устройства 501 содержит код программы, который при выполнении побуждает упомянутые один или более процессоры 5011 упомянутого устройства 501 и/или устройства 501, связанного с ним, выполнять действия описанных в вариантах осуществления настоящего изобретения с первого по двенадцатый, в вариантах осуществления настоящего изобретения с двадцатого по двадцать первый, и в вариантах осуществления настоящего изобретения с двадцать девятого по тридцать четвертый, и содержит подлежащие преобразованию или преобразованные один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке. Более того, подлежащие преобразованию или преобразованные один или несколько структурированных исходных массивов данных могут являться загружаемыми и храниться, в частности, в базе данных 502 системы преобразования структурированного массива данных. В качестве примера, но не ограничения, машиночитаемый носитель данных может включать в себя оперативную память (RAM); постоянное запоминающее устройство (ROM); электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM); флэш-память или другие технологии памяти; CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для кодирования требуемой информации, и к которому может быть осуществлен доступ посредством описываемого устройства. Память включает в себя носитель данных на основе запоминающего устройства компьютера в форме энергозависимой или энергонезависимой памяти, или их комбинации. Примерные аппаратные устройства включают в себя твердотельную память, накопители на жестких дисках, накопители на оптических дисках и т.д. В памяти хранится примерная среда, в которой при помощи компьютерных команд или кодов, хранящихся в памяти устройства, могут быть осуществлены процедуры предварительного преобразования структурированного исходного массива данных, процедуры преобразования структурированного исходного массива данных, формирования карты связей компонентов преобразованного структурированного исходного массива данных, и процедуры поиска релевантной информации в преобразованных структурированных исходных массивах данных. Устройство содержит один или более процессоров 5011, которые предназначены для выполнения компьютерных команд или кодов, хранящихся в памяти устройства с целью обеспечения выполнения упомянутых выше процедур. Компьютерные команды или коды, хранящиеся в памяти, предназначены для выполнения предварительных преобразований структурированного исходного массива данных, преобразований структурированного исходного массива данных, формирования карты связей компонентов преобразованных структурированных исходных массивов данных, поиска релевантной информации в преобразованных структурированных исходных массивах данных. Модули I/O 5012 устройства 501 представляют собой, не ограничиваясь, типичные и известные из уровня техники средства управления устройством: манипулятор типа «мышь», клавиатура, джойстик, тачпад, трекбол, электронное перо, стилус, сенсорный дисплей и тому подобное. Так же модули I/O 5012 представляют собой, не ограничиваясь, типичные и известные из уровня техники средства демонстрирования информации: дисплей, монитор, проектор, принтер, графопостроитель и тому подобное. Система 500 также может включать в себя базу данных (БД) 502. БД 502 может представлять собой, не ограничиваясь: иерархическую БД, сетевую БД, реляционную БД, объектную БД, объектно-ориентированную БД, объектно-реляционную БД, пространственную БД, комбинацию перечисленных двух и более БД, и тому подобное. БД 502 хранит данные в памяти, которая может представлять собой, не ограничиваясь: постоянное запоминающее устройство (ROM), электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для хранения требуемой информации, и к которому может быть осуществлен доступ посредством устройства 501 преобразования структурированного исходного массива данных и сервера 503. БД 502 служит для хранения данных, представляющих собой, по меньшей мере, компьютерные команды или коды, хранящиеся в памяти, предназначенные для выполнения предварительных преобразований структурированного исходного массива данных, преобразований структурированного исходного массива данных, формирования карты связей компонентов преобразованных структурированных исходных массивов данных, поиска релевантной информации в преобразованных структурированных исходных массивах данных; подлежащие преобразованию или преобразованные один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке, которые могут быть загружены в память 5013 устройства 501; и других данных, необходимых для функционирования системы. Примерная система 500 дополнительно содержит серверное вычислительное устройство (сервер) 503, которое сохраняет и содействует манипуляции компьютерными командами или кодами, ранее описанными в данном документе, которые, соответственно, дополнительно не описываются. Сервер 503 может представлять собой: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, машину баз данных и тому подобное. Сервер 503 обеспечивает регулирование обменом данных в системе 500 преобразования структурированного исходного массива данных, а также обеспечивает обработку данных при условии подключения к нему одного или более чем одного устройств 501 преобразования структурированного массива данных или когда устройство 501 преобразования структурированного массива данных представляет собой тонкий клиент. В этом случае все вычислительные мощности, необходимые для обеспечения выполнения процедуры преобразования структурированного массива данных, расположены на сервере 503. Система 500 так же содержит одну или более сетей 504 передачи данных. Сети 504 передачи данных могут включать в себя, но не ограничиваться, одну или более локальных сетей (LAN) и/или глобальных сетей (WAN), или могут представлять собой информационно-телекоммуникационную сеть Интернет, или Интранет, или виртуальную частную сеть (VPN), или их комбинацию, и тому подобное. Сервер 503 также имеет возможность обеспечивать виртуальную вычислительную среду (Virtual Machine) для обеспечения взаимодействия между устройством 501 преобразования структурированного массива данных и БД 502. Сеть 504 служит для обеспечения взаимодействия между устройством 501, базой данных 502 и сервером 503 системы 500.In FIG. 19, by way of example, but not limitation, an exemplary diagram of the inventive system 500 is illustrated, which in a preferred embodiment includes at least one or more devices 501 comprising at least one or more processors 5011, one or more input modules I / O 5012 and memory 5013. The devices 501 mentioned may include, but are not limited to: a personal computer, a laptop computer, a tablet computer, a PDA, a smartphone, a thin client, and the like. The memory (computer-readable storage medium) 5013 of the device 501 contains a program code which, when executed, causes said one or more processors 5011 of said device 501 and / or device 501 associated with it to perform the steps described in Embodiments 1 through 12 of twentieth to twenty-first embodiments of the present invention, and twenty-ninth to thirty-fourth embodiments of the present invention, and comprises to be converted or transformed one or more structured source data arrays containing at least natural language text. Moreover, to be converted or converted one or more structured source data arrays can be downloaded and stored, in particular, in the database 502 of the structured data array conversion system. By way of example, but not limitation, a computer-readable storage medium may include random access memory (RAM); read-only memory device (ROM); Electrically Erasable Programmable Read-Only Memory (EEPROM); flash memory or other memory technologies; CDROM, digital versatile disc (DVD) or other optical or holographic storage media; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic memory devices, wave carriers or other storage medium that can be used to encode the required information, and which can be accessed through the described device. The memory includes a storage medium based on a computer storage device in the form of volatile or non-volatile memory, or a combination thereof. Exemplary hardware devices include solid state memory, hard disk drives, optical disk drives, etc. An example environment is stored in the memory in which, using computer instructions or codes stored in the device’s memory, the procedures for pre-converting a structured source data array, the procedures for converting a structured source data array, forming a map of the components of the converted structured source data array, and the procedure can be performed search for relevant information in transformed structured source data arrays. The device contains one or more processors 5011, which are designed to execute computer instructions or codes stored in the device memory in order to ensure that the above procedures are performed. Computer instructions or codes stored in memory are designed to perform preliminary transformations of a structured source data array, transformations of a structured source data array, form a map of connections between components of converted structured source data arrays, and search for relevant information in converted structured source data arrays. The I / O 5012 modules of device 501 are, but are not limited to, typical and prior art device controls: a mouse, keyboard, joystick, touchpad, trackball, electronic pen, stylus, touch screen, and the like. Also, I / O 5012 modules are, but are not limited to, typical and known from the prior art means of displaying information: a display, a monitor, a projector, a printer, a plotter, and the like. The system 500 may also include a database (DB) 502. The database 502 may include, but is not limited to: a hierarchical database, a network database, a relational database, an object database, an object-oriented database, an object-relational database, a spatial database two or more databases, and the like. The database 502 stores data in memory, which may be, but not limited to: read-only memory (ROM), electrically erasable programmable read-only memory (EEPROM), flash memory, CDROM, digital versatile disk (DVD), or other optical or holographic storage media; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic memory devices, wave carriers or other storage medium that can be used to store the required information, and which can be accessed by means of the device 501 converting a structured source data array and server 503. The database 502 is used to store data representing at least computer instructions or codes stored in memory, designed to perform pre Structured the transformations of the original data array transformation structured original data array components forming bonds card converted structured initial array data search the relevant information in converted structured source data arrays; to be converted or transformed one or more structured source data arrays containing at least natural language text that can be loaded into memory 5013 of device 501; and other data necessary for the functioning of the system. An exemplary system 500 further comprises a server computing device (server) 503 that stores and facilitates manipulation of computer instructions or codes previously described herein, which, accordingly, are not further described. Server 503 may be a personal computer, a laptop computer, a tablet computer, a handheld computer, a smartphone, a database machine, and the like. Server 503 provides data exchange control in the structured data source conversion system 500 and also provides data processing provided that one or more of the structured data array conversion devices 501 is connected to it or when the structured data array conversion device 501 is a thin client. In this case, all the computing power necessary to ensure the conversion of the structured data array is located on the server 503. The system 500 also contains one or more data networks 504. Data network 504 may include, but is not limited to, one or more local area networks (LANs) and / or wide area networks (WANs), or may be an information and telecommunications network Internet, or an Intranet, or a virtual private network (VPN) , or a combination thereof, and the like. The server 503 also has the ability to provide a virtual computing environment (Virtual Machine) to facilitate interaction between the device 501 converting the structured data array and the database 502. The network 504 is used to provide interaction between the device 501, the database 502, and the server 503 of the system 500.

Claims (18)

1. Способ преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, причем упомянутый способ содержит, по меньшей мере, этапы, на которых:
A) формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой:
структурно-сложные языковые конструкции, представляющие собой структурно-сложные языковые конструкции, содержащие контекстные термины, и структурно-сложные языковые конструкции, не содержащие контекстные термины; и
структурно-простые языковые конструкции, представляющие собой структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;
Б) идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины;
B) используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;
Г) осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины, причем преобразование первого типа включает форматное преобразование и лингвистическое преобразование;
Д) осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины, причем преобразование второго типа включает контекстное преобразование и лингвистическое преобразование;
Е) осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины, причем преобразование третьего типа включает форматное преобразование, контекстное преобразование и лингвистическое преобразование;
Ж) формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины, и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины.
1. A method of converting a structured source data array containing at least natural language text, said method comprising at least the steps of:
A) form the original data structure of a structured source data array containing the source elements of the original data structure, and the said source elements are:
structurally complex linguistic constructions, which are structurally complex linguistic constructions containing contextual terms, and structurally complex linguistic constructions that do not contain contextual terms; and
structurally simple language constructs, which are structurally simple language constructs containing contextual terms, and structurally simple language constructs that do not contain contextual terms;
B) identify context terms in said source elements and form a database of context terms containing said identified context terms;
B) using the information contained in said generated contextual terms database, structurally complex linguistic constructs containing contextual terms, structurally complex linguistic constructs not containing contextual terms, structurally simple linguistic constructs containing contextual terms are identified in said initial data structure , and structurally simple language constructs that do not contain contextual terms;
D) carry out the conversion of the first type on the above-mentioned structurally complex language constructs that do not contain contextual terms to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms, and the conversion of the first type includes format conversion and linguistic conversion;
E) carry out the conversion of the second type over the mentioned structurally simple language constructs containing contextual terms, to obtain grammatically and spelling correct structurally simple language constructs that do not contain contextual terms, and the conversion of the second type includes contextual conversion and linguistic conversion;
E) carry out the conversion of the third type over the above-mentioned structurally complex linguistic constructs containing contextual terms to obtain grammatically and spelling-correct structurally simple linguistic constructs that do not contain contextual terms, and the conversion of the third type includes formatting, contextual conversion and linguistic conversion;
G) form the final data structure of the structured initial data array containing the elements of the final data structure, and the elements of the final data structure are structurally simple language constructs that do not contain contextual terms and are grammatically and spelling correct due to transformations of the first, second and third types structurally simple language constructs that do not contain contextual terms.
2. Способ по п. 1, отличающийся тем, что дополнительно содержит, по меньшей мере, этапы, на которых:
З) на основании полученной итоговой структуры данных формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы;
И) формируют базу данных логических связей логических разделов упомянутых элементов первой структуры данных;
К) формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных содержат логические конструкции логических разделов упомянутых элементов первой структуры данных, сформированные с использованием информации из упомянутой базы данных логических связей логических разделов, причем упомянутые логические разделы содержат первые семантические части и вторые семантические части;
Л) формируют базу данных семантических частей логических разделов из упомянутых вторых семантических частей, причем упомянутые вторые семантические части исключаются из соответствующих упомянутых логических разделов;
М) формируют грамматически и орфографически верные семантические части упомянутых логических разделов путем лингвистических преобразований над упомянутыми семантическими частями;
Н) формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой результирующей структуры данных, причем упомянутые элементы результирующей структуры данных содержат логические конструкции, содержащие, по меньшей мере, упомянутые грамматически и орфографически верные семантические части логических разделов.
2. The method according to p. 1, characterized in that it further comprises at least the stages in which:
C) on the basis of the resulting final data structure form the first data structure of the structured source data array containing the elements of the said first data structure, said elements of the first data structure containing the first logical partitions and second logical partitions;
I) form a database of logical connections of logical sections of the mentioned elements of the first data structure;
K) form a second data structure of a structured source data array containing the elements of said second data structure, said elements of the second data structure containing logical structures of logical partitions of said elements of the first data structure formed using information from said logical linking database of logical partitions, said logical sections contain the first semantic parts and the second semantic parts;
K) form a database of semantic parts of logical sections from said second semantic parts, wherein said second semantic parts are excluded from the corresponding mentioned logical sections;
M) form grammatically and orthographically correct semantic parts of the mentioned logical sections by linguistic transformations over the mentioned semantic parts;
H) form the resulting data structure of the structured source data array containing the elements of the said resulting data structure, said elements of the resulting data structure containing logical constructs containing at least the grammatically and spelling-correct semantic parts of logical sections.
3. Способ по п. 2, отличающийся тем, что этап З) характеризуется, по меньшей мере, этапами, на которых:
- идентифицируют итоговую структуру данных структурированного исходного массива данных;
- идентифицируют элементы итоговой структуры данных;
- идентифицируют первые логические разделы упомянутых элементов итоговой структуры данных и вторые логические разделы упомянутых элементов итоговой структуры данных; и
- формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы.
3. The method according to p. 2, characterized in that stage H) is characterized by at least the stages in which:
- identify the final data structure of the structured source data array;
- identify the elements of the final data structure;
- identify the first logical sections of the said elements of the final data structure and the second logical sections of the said elements of the final data structure; and
- form the first data structure of the structured source data array containing the elements of the aforementioned first data structure, said elements of the first data structure containing the first logical partitions and second logical partitions.
4. Способ по п. 2, отличающийся тем, что этап И) характеризуется, по меньшей мере, этапами, на которых:
- идентифицируют элементы первой структуры данных, содержащие один упомянутый первый логический раздел, и элементы первой структуры данных, содержащие один упомянутый второй логический раздел;
- идентифицируют элементы первой структуры данных, содержащие более одного упомянутого первого логического раздела, и элементы первой структуры данных, содержащие более одного упомянутого второго логического раздела;
- среди элементов первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют логические связи между упомянутыми первыми логическими разделами или между упомянутыми вторыми логическими разделами;
- среди элементов первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют элементы первой структуры данных, не имеющие логической связи между логическими разделами; и
- формируют базу данных логических связей логических разделов элементов первой структуры данных.
4. The method according to p. 2, characterized in that stage I) is characterized by at least the stages in which:
- identify the elements of the first data structure containing one mentioned first logical partition, and the elements of the first data structure containing one mentioned second logical partition;
- identify elements of the first data structure containing more than one of the first logical partition, and elements of the first data structure containing more than one of the second logical partition;
- among the elements of the first data structure containing more than one of said first logical partitions, and in the elements of the first data structure containing more than one of said second logical partitions, logical relationships between said first logical partitions or between said second logical partitions are identified;
- among the elements of the first data structure containing more than one of the first logical partitions, and in the elements of the first data structure containing more than one of the second logical partitions, the elements of the first data structure that do not have a logical connection between logical partitions are identified; and
- form a database of logical relationships of logical sections of the elements of the first data structure.
5. Способ по п. 2, отличающийся тем, что этап К) характеризуется, по меньшей мере, этапами, на которых:
- формируют логические конструкции логических разделов элементов первой структуры данных, используя информацию из базы данных логических связей логических разделов элементов первой структуры данных и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый первый логический раздел, и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый второй логический раздел; и
- формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой сформированные логические конструкции логических разделов первой структуры данных.
5. The method according to p. 2, characterized in that stage K) is characterized by at least the stages in which:
- form logical structures of logical partitions of elements of the first data structure using information from a database of logical connections of logical partitions of elements of the first data structure and logical partitions of said elements of the first data structure containing one of the first logical partitions and logical partitions of said elements of the first data structure containing one said second logical partition; and
- form a second data structure of the structured source data array containing the elements of the second data structure, said elements of the second data structure being formed logical structures of logical partitions of the first data structure.
6. Способ по п. 2, отличающийся тем, что этап Л) характеризуется, по меньшей мере, этапами, на которых:
- идентифицируют первые логические разделы элементов второй структуры данных и вторые логические разделы элементов второй структуры данных;
- в упомянутых первых логических разделах и вторых логических разделах элементов второй структуры данных идентифицируют первые семантические части и вторые семантические части; и
- в упомянутых первых и вторых логических разделах элементов второй структуры данных идентифицируют, по меньшей мере, особые семантические части первых логических разделов элементов второй структуры данных и особые семантические части вторых логических разделов элементов второй структуры данных и формируют базу данных особых семантических частей логических разделов элементов второй структуры данных путем перемещения упомянутых особых семантических частей в упомянутую формируемую базу данных особых семантических частей логических разделов элементов второй структуры данных.
6. The method according to p. 2, characterized in that stage A) is characterized by at least the stages in which:
- identify the first logical partitions of the elements of the second data structure and the second logical partitions of the elements of the second data structure;
- in the aforementioned first logical sections and second logical sections of the elements of the second data structure, the first semantic parts and the second semantic parts are identified; and
- in said first and second logical sections of the elements of the second data structure, at least special semantic parts of the first logical sections of the elements of the second data structure and the special semantic parts of the second logical sections of the elements of the second data structure are identified and form a database of special semantic parts of the logical sections of the elements of the second data structures by moving said special semantic parts to said logically generated database of special semantic parts Partition elements of the second data structure.
7. Способ по п. 2, отличающийся тем, что этап М) характеризуется, по меньшей мере, этапами, на которых:
- в упомянутых вторых семантических частях, упомянутых вторых логических разделов элементов второй структуры данных идентифицируют, по меньшей мере, уточняющие структуры вторых семантических частей вторых логических разделов; и
- осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей упомянутых первых и вторых логических разделов, для формирования грамматически и орфографически верных семантических частей логических разделов элементов второй структуры данных.
7. The method according to p. 2, characterized in that stage M) is characterized by at least the stages in which:
- in said second semantic parts, said second logical sections of the elements of the second data structure, at least clarifying structures of the second semantic parts of the second logical sections are identified; and
- carry out linguistic transformations over all semantic parts, with the exception of the mentioned special semantic parts of the mentioned first and second logical sections, to form grammatically and spelling-correct semantic parts of logical sections of the elements of the second data structure.
8. Способ по п. 2, отличающийся тем, что этап Н) характеризуется, по меньшей мере, этапами, на которых:
- формируют из первых грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и упомянутых грамматически и орфографически верных уточняющих структур вторых семантических частей вторых логических разделов элементов второй структуры данных смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных; и
- формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы результирующей структуры данных, причем упомянутые элементы результирующей структуры данных представляют собой логические конструкции, содержащие упомянутые грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных.
8. The method according to p. 2, characterized in that stage H) is characterized by at least the stages in which:
- form semantic combinations of grammatically and spelling correct semantic parts of the second logical sections of the elements of the second data structure from the first grammatically and spelling correct semantic parts of the second logical sections of the elements of the second data structure ; and
- form the resulting data structure of the structured source data array containing the elements of the resulting data structure, and said elements of the resulting data structure are logical constructs containing the grammatically and spelling correct semantic parts of the logical sections of the elements of the second data structure.
9. Способ по п. 8, отличающийся тем, что упомянутые логические конструкции из упомянутой результирующей структуры данных дополнительно могут содержать упомянутые сформированные смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных.9. The method of claim 8, wherein said logical constructs from said resultant data structure may further comprise said semantic combinations of grammatically and spelling-correct semantic parts of second logical sections of elements of the second data structure. 10. Способ по п. 1, отличающийся тем, что дополнительно содержит, по меньшей мере, этапы, на которых:
З) идентифицируют итоговую структуру данных исходного структурированного массива данных; идентифицируют элементы итоговой структуры данных; идентифицируют первые логические разделы упомянутых элементов итоговой структуры данных и вторые логические разделы упомянутых элементов итоговой структуры данных; и формируют первую структуру данных исходного структурированного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы;
И) идентифицируют элементы первой структуры данных, содержащие один упомянутый первый логический раздел, и элементы первой структуры данных, содержащие один упомянутый второй логический раздел; идентифицируют элементы первой структуры данных, содержащие более одного упомянутого первого логического раздела, и элементы первой структуры данных, содержащие более одного упомянутого второго логического раздела; в элементах первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют логические связи между упомянутыми первыми логическими разделами или между упомянутыми вторыми логическими разделами; в элементах первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют элементы первой структуры данных, не имеющие логической связи между логическими разделами; и формируют базу данных логических связей логических разделов элементов первой структуры данных;
К) формируют логические конструкции логических разделов элементов первой структуры данных, используя информацию из базы данных логических связей логических разделов элементов первой структуры данных и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый первый логический раздел, и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый второй логический раздел; и формируют вторую структуру данных исходного структурированного массива данных, содержащую элементы второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой сформированные логические конструкции логических разделов первой структуры данных;
Л) идентифицируют первые логические разделы элементов второй структуры данных и вторые логические разделы элементов второй структуры данных; в упомянутых первых логических разделах и вторых логических разделах элементов второй структуры данных идентифицируют первые семантические части и вторые семантические части; и в упомянутых первых и вторых логических разделах элементов второй структуры данных идентифицируют, по меньшей мере, особые семантические части первых логических разделов элементов второй структуры данных и особые семантические части вторых логических разделов элементов второй структуры данных и формируют базу данных особых семантических частей логических разделов элементов второй структуры данных путем перемещения упомянутых особых семантических частей в упомянутую формируемую базу данных особых семантических частей логических разделов элементов второй структуры данных;
М) в упомянутых вторых семантических частях упомянутых вторых логических разделов элементов второй структуры данных идентифицируют, по меньшей мере, уточняющие структуры вторых семантических частей вторых логических разделов и осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей упомянутых первых и вторых логических разделов, для формирования грамматически и орфографически верных семантических частей логических разделов элементов второй структуры данных;
Н) формируют из первых грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и упомянутых грамматически и орфографически верных уточняющих структур вторых семантических частей вторых логических разделов элементов второй структуры данных смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов третьей структуры данных; и формируют результирующую структуру данных исходного структурированного массива данных, содержащую элементы результирующей структуры данных, причем упомянутые элементы результирующей структуры данных представляют собой логические конструкции, содержащие упомянутые грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных.
10. The method according to p. 1, characterized in that it further comprises at least the stages in which:
H) identify the final data structure of the original structured data array; identify elements of the resulting data structure; identifying the first logical sections of said elements of the resulting data structure and the second logical sections of said elements of the resulting data structure; and form the first data structure of the original structured data array containing the elements of said first data structure, said elements of the first data structure containing first logical partitions and second logical partitions;
I) identify elements of the first data structure containing one mentioned first logical partition, and elements of the first data structure containing one mentioned second logical partition; identifying elements of a first data structure containing more than one of said first logical partitions, and elements of a first data structure containing more than one of said second logical partition; in the elements of the first data structure containing more than one of said first logical partitions, and in the elements of the first data structure containing more than one of said second logical partitions, logical relationships between said first logical partitions or between said second logical partitions are identified; in the elements of the first data structure containing more than one of said first logical partitions, and in the elements of the first data structure containing more than one of said second logical partitions, elements of the first data structure that do not have a logical connection between logical partitions are identified; and form a database of logical relationships of logical partitions of the elements of the first data structure;
K) form logical structures of logical partitions of elements of the first data structure using information from a database of logical connections of logical partitions of elements of the first data structure and logical partitions of said elements of the first data structure containing one of the first logical partitions and logical partitions of said elements of the first data structure, containing one said second logical partition; and form a second data structure of the original structured data array containing elements of the second data structure, said elements of the second data structure being formed logical structures of logical partitions of the first data structure;
K) identify the first logical partitions of the elements of the second data structure and the second logical partitions of the elements of the second data structure; in said first logical sections and second logical sections of the elements of the second data structure, the first semantic parts and the second semantic parts are identified; and in said first and second logical partitions of the elements of the second data structure, at least special semantic parts of the first logical partitions of the elements of the second data structure and the special semantic parts of the second logical partitions of the elements of the second data structure are identified and form a database of special semantic parts of the logical partitions of the elements of the second data structures by moving said special semantic parts to said logically generated database of special semantic parts x sections of the elements of the second data structure;
M) in said second semantic parts of said second logical sections of the elements of the second data structure, at least clarifying structures of the second semantic parts of the second logical sections are identified and linguistic transformations are performed on all semantic parts, except for the mentioned special semantic parts of the said first and second logical sections , for the formation of grammatically and spelling-correct semantic parts of the logical sections of the elements of the second structure, yes data;
H) form semantic combinations of grammatically and spelling correct semantic parts of the second logical sections of the elements of the second structure from the first grammatically and spelling correct semantic parts of the second logical sections of the elements of the second data structure data; and form the resulting data structure of the original structured data array containing the elements of the resulting data structure, said elements of the resulting data structure being logical constructs containing the grammatically and spelling-correct semantic parts of the logical sections of the elements of the second data structure.
11. Способ по п. 10, отличающийся тем, что упомянутые логические конструкции из упомянутой результирующей структуры данных дополнительно могут содержать упомянутые сформированные смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных.11. The method according to p. 10, characterized in that said logical constructions from said resultant data structure may further comprise said semantic combinations of grammatically and spelling-correct semantic parts of second logical sections of elements of the second data structure. 12. Устройство преобразования структурированного исходного массива данных, содержащее, по меньшей мере:
один или более процессоров;
один или более модулей ввода/вывода (I/O); и
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из пп. 1-11, и содержащую подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке.
12. A device for converting a structured source data array containing at least:
one or more processors;
one or more input / output (I / O) modules; and
a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform method steps according to any one of claims. 1-11, and containing one or more structured source data arrays to be converted containing at least natural language text.
13. Устройство по п. 12, отличающееся тем, что упомянутые подлежащие преобразованию один или несколько структурированных исходных массивов данных являются загружаемыми, а упомянутое устройство выполнено с возможностью соединения с базой данных, в которой хранятся упомянутые загружаемые подлежащие преобразованию один или несколько структурированных исходных массивов данных, для осуществления загрузки в упомянутую память устройства, по меньшей мере, одного загружаемого подлежащего преобразованию структурированного исходного массива данных.13. The device according to p. 12, characterized in that said one or more structured source data arrays to be converted are downloadable, and said device is configured to connect to a database in which said loadable one or more structured source data arrays to be converted are stored , for loading into the aforementioned device memory of at least one loaded structured source array to be converted to data. 14. Система преобразования структурированного исходного массива данных, содержащая, по меньшей мере:
одно или более устройств, выполненных в виде устройств по любому из пп. 12 или 13;
один или несколько серверов, обеспечивающих регулирование обменом данных в упомянутой системе;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.
14. A system for converting a structured source data array, comprising at least:
one or more devices made in the form of devices according to any one of paragraphs. 12 or 13;
one or more servers providing regulation of data exchange in said system;
one or more databases for storing data configured to interact with said one or more devices;
one or more data transmission networks through which said devices, servers and databases interact.
15. Система по п. 14, отличающаяся тем, что способ по любому из пп. 1-11 осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент.15. The system according to p. 14, characterized in that the method according to any one of paragraphs. 1-11 is carried out by one or more of said servers, and said devices are a thin client. 16. Система по п. 15, отличающаяся тем, что упомянутая база данных служит для хранения данных, представляющих собой, по меньшей мере, одно из: код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из пп. 1-11, подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке.16. The system of claim 15, wherein said database is used to store data representing at least one of: program code, which upon execution prompts said one or more processors of said device and / or device connected with the said device, perform the steps of the method according to any one of paragraphs. 1-11, one or more structured source data arrays to be converted containing at least natural language text. 17. Система по любому из пп. 14-16, отличающаяся тем, что упомянутая сеть передачи данных представляет собой одно из: локальная сеть (LAN), глобальная сеть (WAN), информационно-телекоммуникационная сеть Интернет, виртуальная частная сеть (VPN).17. The system according to any one of paragraphs. 14-16, characterized in that the data network is one of: local area network (LAN), wide area network (WAN), information and telecommunication network Internet, virtual private network (VPN). 18. Машиночитаемый носитель данных, содержащий код программы, который при выполнении побуждает процессор или процессоры устройства, с которым взаимодействует машиночитаемый носитель данных, выполнять действия способа по любому из пп. 1-11. 18. A computer-readable storage medium containing program code that, when executed, causes the processor or processors of the device with which the computer-readable storage medium interacts to perform the steps of the method according to any one of claims. 1-11.
RU2014126197/08A 2014-06-27 2014-06-27 Method for preliminary conversion of structured data array RU2571405C1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2014126197/08A RU2571405C1 (en) 2014-06-27 2014-06-27 Method for preliminary conversion of structured data array
PCT/RU2015/000392 WO2015199581A2 (en) 2014-06-27 2015-06-25 Method for preliminary conversion of initial mass of data, method for forming map of connections between components of parts of logical constructs of a converted structured initial mass of data, method for searching a converted mass of data using a component connections map, and systems and devices for implementing said methods
EA201700031A EA201700031A1 (en) 2014-06-27 2015-06-25 METHOD first converting the original data files, METHOD FOR FORMING RELATIONSHIPS MAP components often STRUCTURED logical constructions convert the original data files, a method of searching in the transformed data sets using the card RELATIONS components and systems and apparatus for implementing these methods

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014126197/08A RU2571405C1 (en) 2014-06-27 2014-06-27 Method for preliminary conversion of structured data array

Publications (1)

Publication Number Publication Date
RU2571405C1 true RU2571405C1 (en) 2015-12-20

Family

ID=54871347

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014126197/08A RU2571405C1 (en) 2014-06-27 2014-06-27 Method for preliminary conversion of structured data array

Country Status (1)

Country Link
RU (1) RU2571405C1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2670781C2 (en) * 2017-03-23 2018-10-25 Илья Николаевич Логинов System and method for data storage and processing
WO2019235975A1 (en) * 2018-06-07 2019-12-12 Rogachev Igor Petrovich Conversion of a structured data array containing a linguistic sentence
WO2019235976A1 (en) * 2018-06-07 2019-12-12 Rogachev Igor Petrovich Method for the linguistic-logical conversion of a structured data array
RU2722587C1 (en) * 2019-09-06 2020-06-01 Акционерное общество "Калужский научно-исследовательский институт телемеханических устройств" Method of generating and breaking up a message text in information binary in application layer packets

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA002016B1 (en) * 2001-04-06 2001-10-22 Лев Лазаревич Матвеев A method of searching for fragments with similar text and/or semantic contents in electronic documents stored on a data storage devices

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA002016B1 (en) * 2001-04-06 2001-10-22 Лев Лазаревич Матвеев A method of searching for fragments with similar text and/or semantic contents in electronic documents stored on a data storage devices

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2670781C2 (en) * 2017-03-23 2018-10-25 Илья Николаевич Логинов System and method for data storage and processing
RU2670781C9 (en) * 2017-03-23 2018-11-23 Илья Николаевич Логинов System and method for data storage and processing
WO2019235975A1 (en) * 2018-06-07 2019-12-12 Rogachev Igor Petrovich Conversion of a structured data array containing a linguistic sentence
WO2019235976A1 (en) * 2018-06-07 2019-12-12 Rogachev Igor Petrovich Method for the linguistic-logical conversion of a structured data array
RU2722587C1 (en) * 2019-09-06 2020-06-01 Акционерное общество "Калужский научно-исследовательский институт телемеханических устройств" Method of generating and breaking up a message text in information binary in application layer packets
RU2722587C9 (en) * 2019-09-06 2020-09-14 Акционерное общество "Калужский научно-исследовательский институт телемеханических устройств" Method of generating and breaking up a message text in information binary application layer packets

Similar Documents

Publication Publication Date Title
Bakar et al. Feature extraction approaches from natural language requirements for reuse in software product lines: A systematic literature review
RU2564629C1 (en) Method of clustering of search results depending on semantics
US9678949B2 (en) Vital text analytics system for the enhancement of requirements engineering documents and other documents
JP2022547750A (en) Cross-document intelligent authoring and processing assistant
US8510328B1 (en) Implementing symbolic word and synonym English language sentence processing on computers to improve user automation
RU2544739C1 (en) Method to transform structured data array
KR101524889B1 (en) Identification of semantic relationships within reported speech
WO2017046729A1 (en) Natural language interface to databases
US10810643B2 (en) Method and system for request for proposal (RFP) response generation
Van Atteveldt et al. Computational analysis of communication
Kudashev Quality Assurance in Terminology Management
RU2571405C1 (en) Method for preliminary conversion of structured data array
Quirchmayr et al. Semi-automatic rule-based domain terminology and software feature-relevant information extraction from natural language user manuals: An approach and evaluation at Roche Diagnostics GmbH
Melo et al. A strategy for archives metadata representation on CIDOC-CRM and knowledge discovery
Sun A natural language interface for querying graph databases
US20190179811A1 (en) Generation of requests to a processing system
RU2563148C2 (en) System and method for semantic search
Kuhn et al. Coral: Corpus access in controlled language
Sane et al. Semantically rich framework to automate cyber insurance services
RU2571407C1 (en) Method to generate map of connections of converted structured data array components
RU2572367C1 (en) Method of searching for information in pre-transformed structured data array
Christophe et al. A methodology supporting syntactic, lexical and semantic clarification of requirements in systems engineering
US11921763B2 (en) Methods and systems to parse a software component search query to enable multi entity search
Ashfaq et al. Natural language ambiguity resolution by intelligent semantic annotation of software requirements
Šukys Querying ontologies on the base of semantics of business vocabulary and business rules

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20171110