RU2257611C2 - Method for automatic structuring of computer codes adequate for processed information - Google Patents
Method for automatic structuring of computer codes adequate for processed information Download PDFInfo
- Publication number
- RU2257611C2 RU2257611C2 RU2002103731/09A RU2002103731A RU2257611C2 RU 2257611 C2 RU2257611 C2 RU 2257611C2 RU 2002103731/09 A RU2002103731/09 A RU 2002103731/09A RU 2002103731 A RU2002103731 A RU 2002103731A RU 2257611 C2 RU2257611 C2 RU 2257611C2
- Authority
- RU
- Russia
- Prior art keywords
- sets
- information
- automatically
- adequate
- computer codes
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Abstract
Description
Область техникиTechnical field
Изобретение относится к области компьютерных технологий и может быть использовано при автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации.The invention relates to the field of computer technology and can be used for automatic structuring of computer codes adequate to the processed information.
Предшествующий уровень техникиState of the art
Известен способ автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, включающий выделение из объема поступающей в единицу времени информации ее части, которую выбирают в зависимости от вида информации, например цифровой или текстовой, разбивают поступившую информацию на логически законченные фрагменты, кодируют полученные фрагменты информации и распределяют их по базам данных [Айламазян А.К., Стась Е.В. "Информатика и теория развития". М., Наука, 1989 г.].A known method for the automatic structuring of computer codes adequate to the information being processed, including the allocation of part of the information received per unit time, which is selected depending on the type of information, for example, digital or textual, breaks the received information into logically complete fragments, encodes the resulting pieces of information and distributes them on the databases [Ailamazyan AK, Stas E.V. "Computer science and development theory." M., Science, 1989].
Известен также способ автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, включающий выделение из объема поступающей в единицу времени информации ее части, которую выбирают в зависимости от вида информации, например цифровой и/или текстовой, и/или графической, разбивают поступившую информацию на логически законченные фрагменты, кодируют полученные фрагменты информации, преобразуя их по заданному алгоритму, полученную совокупность преобразованных фрагментов распределяют по базам данных, помещая каждый из фрагментов в соответствующую ему базу [Д.Э.Бэстенс, В.-М.ван ден Берг, Д.Вуд. Нейронные сети и финансовые рынки, М:, Издательство ТВП, 1977 г.].There is also known a method of automatically structuring computer codes that are adequate to the information being processed, including extracting from the volume of information received per unit time its part, which is selected depending on the type of information, for example, digital and / or textual and / or graphic, breaking the received information into logically completed fragments, encode the obtained fragments of information, converting them according to a given algorithm, the resulting set of transformed fragments is distributed across databases, placing azhdy of the fragments in the corresponding base [D.E.Bestens, V.-M.van den Berg, D.Vud. Neural networks and financial markets, M :, Publisher TVP, 1977].
Недостатками известных способов являются несовершенство обработки компьютерных кодов, адекватных исходной информации, и относительно низкие скорости структуризации компьютерных кодов.The disadvantages of the known methods are the imperfection of processing computer codes that are adequate to the source information, and the relatively low rate of structuring of computer codes.
Решаемая задача и достигаемый технический результатThe problem to be solved and the technical result achieved
Решаемой изобретением задачей является совершенствование способов автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, с достижением при этом технического результата в отношении, в частности, повышения скорости структуризации компьютерных кодов. Использование в целом способа автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, позволяет значительно сэкономить расход вычислительных ресурсов (память, количество операций процессора и т.д.), повысить скорость и точность структуризации компьютерных кодов.The objective of the invention is to improve methods for the automatic structuring of computer codes that are adequate to the information being processed, while achieving a technical result in relation, in particular, to increase the speed of structuring computer codes. Using the whole method of automatic structuring of computer codes adequate to the information being processed can significantly save the consumption of computing resources (memory, the number of processor operations, etc.), and increase the speed and accuracy of structuring computer codes.
Краткое изложение сущности изобретенияSummary of the invention
В качестве кратких сведений, раскрывающих сущность изобретения, следует отметить, что достигаемый технический результат обеспечивают с помощью предложенного способа автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, который включает совокупность операций, осуществляемых по N1-каналам, где N1 выбирают от 1 до 2256. При этом в каждом из N2 каналов, выбираемых в количестве, удовлетворяющем неравенству 1+1/N1≤ (N2+α1N1)/N1≤ 2,3, где α 1 - экспериментальный коэффициент, выбираемый в зависимости от вида информации и от количества источников ее поступления в пределах от 0,61≤ α1≤ 1,3, выделяют из объема V1 поступающей в единицу времени информации ее часть объема V2, которую выбирают из соотношения в пределах 0,56≤ (V2+α 2V1)/V1≤ 2,8, где α 2 - экспериментальный коэффициент, выбираемый в зависимости от вида информации в пределах от 0,56≤ α2≤ 1,8. Разбивают поступившую информацию на логически законченные фрагменты, объемы V3i которых выбирают из соотношения в пределах 0,45≤ (V3i+α3V2)/V2≤ 2,7, где α 3 - экспериментальный коэффициент, выбираемый в зависимости от особенности их разбиения в пределах от 0,45≤ α3≤ 1,7, а i выбирают в пределах 1≤ i≤ 2256.As brief information revealing the essence of the invention, it should be noted that the achieved technical result is provided by the proposed method for automatically structuring computer codes adequate to the processed information, which includes a set of operations carried out on N 1 channels, where N 1 is selected from 1 to 2 256 . Moreover, in each of the N 2 channels, selected in an amount satisfying the
Затем кодируют полученные фрагменты информации, преобразуя их по заданному алгоритму до получения совокупности N-мерных множеств, адекватных преобразуемой исходной информации. Аj элементов вида {Вm, X1, Х2,... Хn}, где j - порядковый номер множества в пределах от 1 до 2256, Вm - идентификатор, X1-Xn - координата элемента относительно начала координат элемента, a m и n выбирают в пределах от 1 до 2256. Полученную совокупность N-мерных множеств сопоставляют с уже накопленными множествами и/или с вновь поступающими множествами по разным каналам, определяют и вырезают пересекающиеся части множеств. После этого вырезанные пересечения множеств и остающиеся после вырезания множества распределяют по базам данных, помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое из различающихся по какому-то параметру множества в соответствующие этим видам множеств базы данных и помещают на место вырезанных множеств идентификаторы хранящих эти множества баз данных.Then, the obtained pieces of information are encoded, transforming them according to a predetermined algorithm to obtain a set of N-dimensional sets that are adequate to the source information being transformed. And j elements of the form {B m , X 1 , X 2 , ... X n }, where j is the serial number of the set ranging from 1 to 2 256 , B m is the identifier, X 1 -X n is the coordinate of the element relative to the beginning element coordinates, am and n are selected in the range from 1 to 2 256 . The resulting set of N-dimensional sets is compared with already accumulated sets and / or with newly arriving sets through different channels, intersecting parts of the sets are determined and cut out. After that, the cut-off intersections of the sets and the sets remaining after cutting are distributed across the databases, placing each of the same sets in its corresponding database and each of the sets that differ in some parameter in the corresponding sets of the database and put the identifiers storing in place of the cut-out sets these sets of databases.
Перечень чертежейList of drawings
Фиг.1. Схема размещения компьютерных кодов, адекватных обрабатываемой информации. Фиг.2. Упрощенная схема осуществления способа для одного канала. Фиг.3. Упрощенная схема осуществления способа для двух каналов. Фиг.4. Упрощенная схема осуществления способа для десяти каналов. Фиг.5. Подробная иллюстрация заявленного способа. Фиг.6. Фрагмент подробной иллюстрации заявленного способа.Figure 1. The layout of computer codes adequate to the processed information. Figure 2. A simplified scheme of the method for one channel. Figure 3. A simplified diagram of the implementation of the method for two channels. Figure 4. A simplified diagram of the implementation of the method for ten channels. Figure 5. A detailed illustration of the claimed method. 6. A fragment of a detailed illustration of the claimed method.
Детальное описание и примеры осуществления изобретенияDetailed Description and Embodiments
При изложении сведений, подтверждающих возможность осуществления изобретения, целесообразно более детально описать предложенный способ автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, при описании которого нецелесообразно подробно останавливаться на известных из опубликованных данных особенностях выполнения его операций. При этом целесообразно привести для удобства восприятия информации определения используемых понятий.When presenting information confirming the possibility of carrying out the invention, it is advisable to describe in more detail the proposed method for automatically structuring computer codes that are adequate to the information being processed, when describing which it is inappropriate to dwell on the features of its operations known from published data. In this case, it is advisable to bring definitions of the concepts used for the convenience of perception of information.
Компьютерный код - машинопреобразуемое представление некоторого фрагмента информации (оригинала), в частности, в виде электромагнитных сигналов.Computer code is a machine-convertible representation of a piece of information (the original), in particular, in the form of electromagnetic signals.
Критерий - это фактор, по которому производят распознавание, например, параметр координата, логическое условие и т.п.A criterion is a factor by which recognition is performed, for example, a coordinate parameter, a logical condition, etc.
Система критериев - это совокупность критериев, взаимосвязанных их целевой направленностью, в частности их пригодностью для использования в процессе распознавания.A system of criteria is a set of criteria interconnected by their target orientation, in particular, their suitability for use in the recognition process.
Память - функциональный узел средства реализации способа, фиксирующий на определенный срок обрабатываемую информацию, с возможностью ее дальнейшего воспроизведения, считывания и других видов использования.Memory is a functional unit of the means of implementing the method, fixing processed information for a certain period of time, with the possibility of its further reproduction, reading, and other uses.
Заданный алгоритм - набор правил, по которым преобразуют поступающую по каждому из каналов исходную информацию.A given algorithm is a set of rules by which the source information arriving on each channel is transformed.
Множество - объединение в единое целое определенных вполне различаемых объектов, которые при этом называются элементами образуемого ими множества [″ Справочник по математике″ , И.Н.Бронштейн, К.А.Семендяев, изд. ″ Наука″ , Москва, 1986. с. 380. п.4.1.2.1].A set is a combination of certain completely distinguishable objects into a single whole, which are called elements of the set formed by them [″ Handbook of Mathematics ″, I.N. Bronstein, K.A.Semendyaev, ed. ″ Science ″, Moscow, 1986. p. 380. p. 4.1.2.1].
Различаемый объект - компьютерные коды, адекватные соответствующим фрагментам информации.The distinguished object is computer codes that are adequate to the corresponding pieces of information.
Пересечение двух множеств Аj и Aj+k - это множество, которое состоит из элементов, принадлежащих каждому из множеств Aj и Aj+k [″ Справочник по математике″ , И.Н.Бронштейн, К.А.Семендяев, изд. ″ Наука”, Москва, 1986, с.381, п.4.1.3.1], где j и j+k - номера множеств, взятые из области от 1 до 2256, либо, по аналогии, пересечение любого количества структурируемых по заявленному способу множеств.The intersection of two sets A j and A j + k is a set that consists of elements belonging to each of the sets A j and A j + k [″ Mathematics Reference ’, I.N. Bronstein, K.A.Semendyaev, ed. . ″ Science ”, Moscow, 1986, p. 381, clause 4.1.3.1], where j and j + k are the numbers of sets taken from the range from 1 to 2 256 , or, by analogy, the intersection of any number structured according to the claimed method sets.
Далее детально целесообразно остановиться только на отличительных существенных особенностях осуществления операций предложенного способа, заключающихся в том. что способ включает совокупность операций, осуществляемых по N1-каналам, где N1 выбирают от 1 до 2256. Выбор указанного количества каналов в заявленных пределах обеспечивает практически все существующие в настоящее время потребности реализации способа. При этом в каждом из N2 каналов, выбираемых в количестве, удовлетворяющем неравенству 1+1/N1≤ (N2+α 1N1)/N1≤ 2,3, где α 1 - экспериментальный коэффициент, выбираемый в зависимости от вида информации и от количества источников ее поступления в пределах от 0,61≤ α1≤ 1,3, выделяют из объема V1 поступающей в единицу времени информации ее часть объема V2, которую выбирают из соотношения в пределах 0,56≤ (V2+α 2V1)/V1≤ 2,8, где α 2 - экспериментальный коэффициент, выбираемый в зависимости от вида информации в пределах от 0,56≤ α2≤ 1,8. На практике это могут быть разновидности цифровой, текстовой, символьной, графической и смешанной информации. Поступившую информацию разбивают на логически законченные фрагменты, объемы V3i которых выбирают из соотношения в пределах 0,45≤ (V3i+α3V2)/V2≤ 2,7, где α 3 - экспериментальный коэффициент, выбираемый в зависимости от особенности их разбиения в пределах от 0,45≤ α3≤ 1,7, а i выбирают в пределах 1≤ i≤ 2256. В числе простейших особенностей разбиения поступившей информации на логически законченные фрагменты можно указать, например, на равные объемы фрагментов или не равные ее разбивают.Further, in detail, it is advisable to dwell only on the distinguishing essential features of the operations of the proposed method, namely. that the method includes a set of operations carried out on N 1 channels, where N 1 choose from 1 to 2 256 . The choice of the specified number of channels within the stated limits provides almost all currently existing needs for the implementation of the method. Moreover, in each of the N 2 channels, selected in an amount satisfying the
Затем кодируют полученные фрагменты информации, преобразуя их по заданному алгоритму до получения совокупности N-мерных множеств, адекватных преобразуемой исходной информации, Aj элементов (и/или фреймов) вида {Вm, Х1, Х2,... Хn), где j - порядковый номер множества в пределах от 1 до 2256, Вm – идентификатор, X1-Xn - координата элемента относительно начала координат элемента, a m и n выбирают в пределах от 1 до 2256. Здесь целесообразно отметить, что указанные элементы часто называют фреймами и каждый элемент имеет свою систему координат. Полученную совокупность N-мерных множеств сопоставляют с уже накопленными множествами и/или с вновь поступающими множествами по разным каналам, определяют и вырезают пересекающиеся части множеств. Сопоставление с уже накопленными множествами и/или с вновь поступающими производят одновременно или последовательно во времени. После этого вырезанные пересечения множеств и остающиеся после вырезания множества распределяют по базам данных, помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое их paзличающихся по какому-то параметру множества в соответствующие этим видам множеств базы данных и помещают на место вырезанных множеств идентификаторы хранящих эти множества баз данных.Then, the obtained pieces of information are encoded, transforming them according to a predetermined algorithm to obtain a set of N-dimensional sets adequate to the transformed initial information, A j elements (and / or frames) of the form {B m , X 1 , X 2 , ... X n ) where j is the sequence number of the set in the range from 1 to 2 256 , In m is the identifier, X 1 -X n is the coordinate of the element relative to the origin of the element, am and n are selected in the range from 1 to 2 256 . It is worth noting here that these elements are often called frames and each element has its own coordinate system. The resulting set of N-dimensional sets is compared with already accumulated sets and / or with newly arriving sets through different channels, intersecting parts of the sets are determined and cut out. Comparison with already accumulated sets and / or with new entrants is carried out simultaneously or sequentially in time. After that, the cut intersections of the sets and the sets remaining after cutting are distributed over the databases, placing each of the same sets in its corresponding database and each of them differing in some parameter of the set in the corresponding sets of the database sets and put the identifiers storing in place of the cut sets these sets of databases.
Учитывая использование ряда аналитических соотношений, следует отметить, что для практической реализации из множеств, удовлетворяющих аналитические соотношения значений параметров в заявленных пределах - выбирают для параметров, например, N, N1 или N2 - это целые положительные натуральные числа, а для остальных параметров - это действительные числа, исключая иррациональные, трансцендентные, комплексные, отрицательные и другие технически некорректные или практически не применимые, или не воспроизводимые значения взаимосвязанных параметров.Given the use of a number of analytical relationships, it should be noted that for practical implementation, from sets that satisfy the analytical relationships of the parameter values within the stated limits, they are chosen for the parameters, for example, N, N 1 or N 2 are positive integer positive integers, and for other parameters - these are real numbers, excluding irrational, transcendental, complex, negative and other technically incorrect or practically not applicable, or not reproducible values of interrelated parameters moat.
Промышленная применимость и достижение технического результатаIndustrial applicability and technical result achievement
Соответствие критерию промышленная применимость заявленного объекта доказывается как широким получением и использованием описанных приемов компьютерных технологий в массовых масштабах, так и отсутствием в заявленных притязаниях каких-либо практически трудно реализуемых признаков. Достигаемый технический результат, как показали данные экспериментов, может быть реализован только взаимосвязанной совокупностью всех существенных признаков заявленного способа, отраженных в формуле изобретения. Например, при поиске слова ″ Example″ в несортированной, неиндексированной базе данных из 100 миллионов записей или из 100 миллиардов записей количество операций будет примерно одинаковым, т.е. скорость поиска будет наиболее высокой по сравнению с известными способами при адекватных условиях их использования, зависит только от длины запроса и очень слабо зависит от размера базы данных.Compliance with the criterion of industrial applicability of the claimed object is proved both by the wide receipt and use of the described techniques of computer technology on a massive scale, and the absence of any practically difficult features in the claimed claims. Achievable technical result, as shown by experimental data, can be realized only by an interconnected set of all the essential features of the claimed method, reflected in the claims. For example, when searching for the word ″ Example ″ in an unsorted, non-indexed database of 100 million records or 100 billion records, the number of operations will be approximately the same, i.e. search speed will be the highest compared to known methods under adequate conditions for their use, it depends only on the length of the request and very weakly depends on the size of the database.
Нижние и верхние значения заявленных пределов были получены на основе статистической обработки результатов экспериментальных исследований, анализа и обобщения их и известных из опубликованных источников данных, а также изобретательской интуиции, исходя из условия достижения указанного технического результата. Указанные в формуле изобретения отличия дают основание сделать вывод о новизне данного техническою решения, а совокупность испрашиваемых притязаний - о ее изобретательском уровне, что доказывается как вышеприведенным детальным описанием заявленных объектов, так и следующим описанием примеров практической реализации заявленного способа. Для этого целесообразно привести основные функциональные схемы осуществления способа автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, при создании баз данных.The lower and upper values of the declared limits were obtained on the basis of statistical processing of the results of experimental studies, analysis and generalization of them and known from published data sources, as well as inventive intuition, based on the conditions for achieving the specified technical result. The differences indicated in the claims make it possible to conclude that this technical solution is new, and the set of claimed claims is about its inventive step, which is proved both by the above detailed description of the claimed objects and the following description of examples of practical implementation of the claimed method. To this end, it is advisable to give the main functional diagrams of the method for automatically structuring computer codes adequate to the processed information when creating databases.
Преобразование компьютерных кодов, адекватных обрабатываемой информации, по предложенному способу частично можно пояснить с помощью Фиг.1А), которая отражает случай, когда поступает первое множество, схематически отображенное в виде овала 1. Так как общая база данных еще пуста, то множество целиком помещается в новую базу БД № 1 данных. Фиг.1Б) отражает случай, когда поступают очередные два множества 2 и 4, содержащие совпадающие элементы. Пересечение множеств 3 вырезается и помещается в соответствующую БД №3, на его место во множества 2 и 4 вставляется идентификатор БД №3, модифицированные множества 2 и 4 помещаются в соответствующие базы данных БД №3 и БД №4.The conversion of computer codes adequate to the information being processed by the proposed method can partially be explained using Fig. 1A), which reflects the case when the first set arrives, schematically displayed as
Фиг.1В) отражает случай, когда поступает очередное множество N-1, не содержащее ни одного совпадающего элемента с предыдущими множествами, поэтому множество N-1 помещается в новую базу данных БД-№N-1. Фиг.1Г) отражает случай, когда поступает очередное множество N, содержащее целиком совпадающие элементы со множеством N-1, хранянящимся в базе данных БД №N-1. Пересечение множеств N вырезается и помещается и соответствующую базу данных БД №N, на его место во множество N-1 вставляется идентификатор базы данных БД №N, соответственно изменяется база данных БД №N-1. Таким образом, в каждой отдельной базе данных БД хранятся множества, не имеющие совпадающих элементов, т.е. ни одно из множеств не пересекается.Figv) reflects the case when the next set N-1 arrives that does not contain any matching element with the previous sets, therefore, the set N-1 is placed in a new database DB-NN-1. Fig.1G) reflects the case when the next set N arrives containing completely matching elements with the set N-1 stored in the database database No. N-1. The intersection of the sets N is cut out and the corresponding database of the database No. N is inserted, in its place in the set N-1 is inserted the identifier of the database of the database No. N, the database of the database No. N-1 is accordingly changed. Thus, in each separate database of the database, sets are stored that do not have matching elements, i.e. none of the sets intersect.
Упрощенные схемы осуществления способа последовательно для одного, двух и 10 каналов приведены соответственно на Фиг.2, Фиг.3 и Фиг.4. На Фиг.2 схематически изображена структурированная база данных текстовой информации, предназначенная для хранения больших массивов текстовой информации с выбором одного канала текстовой информации.Simplified diagrams of the method in series for one, two and 10 channels are shown in FIG. 2, FIG. 3 and FIG. 4, respectively. Figure 2 schematically shows a structured database of text information designed to store large arrays of text information with the selection of one channel of text information.
На Фиг.3 схематически изображена структурированная база данных текстовой и графической информации, предназначенная для хранения больших массивов текстовой и графической информации с выбором двух каналов - одного для текстовой информации, второго для графической информации.Figure 3 schematically shows a structured database of text and graphic information, designed to store large arrays of text and graphic information with a choice of two channels - one for text information, the second for graphic information.
Детально целесообразно охарактеризовать структурированную базу данных текстовой, графической и звуковой информации, предназначенную для хранения больших массивов текстовой, графической и звуковой информации, поступающей одновременно по 10 каналам (Фиг.4), например 6 текстовых, 2 графических и 2 звуковых. Совокупность операций способа, реализованная в устройстве Фиг.4, может быть охарактеризована следующим образом: N1 выбирают равным 10, N2 - от 2 до 6 при α 1=1 для текстовой информации, α 1=0,9 для графической информации, α 1=1,1 для звуковой информации. Выделяют из объема V1=10 000 Кб/с поступающей в единицу времени информации ее часть объема V2=1000 Кб/с при α 2=1 для текстовой информации, α 2=0,8 для графической информации, α 2=1,2 для звуковой информации. Разбивают поступившую информацию на логически законченные фрагменты, объемы которых выбирают из соотношения 1,4≤ (V3i+α 3V2)/V2≤ 1,6, где α 3=1 для текстовой информации, α 3=0,5 для графической информации, α 3=1,7 для звуковой информации, а i выбирают в пределах 1≤ i≤ 220.It is advisable to characterize in detail a structured database of text, graphic and audio information, intended for storing large arrays of text, graphic and audio information arriving simultaneously through 10 channels (Figure 4), for example 6 text, 2 graphic and 2 audio. The set of operations of the method implemented in the device of Figure 4 can be characterized as follows: N 1 is chosen equal to 10, N 2 from 2 to 6 with α 1 = 1 for text information, α 1 = 0.9 for graphic information, α 1 = 1.1 for audio information. Allocated from the volume V 1 = 10 000 Kb / s of information received per unit time, its part of the volume V 2 = 1000 Kb / s with α 2 = 1 for textual information, α 2 = 0.8 for graphic information, α 2 = 1, 2 for audio information. The received information is divided into logically completed fragments, the volumes of which are selected from the ratio 1.4 ≤ (V 3i + α 3 V 2 ) / V 2 ≤ 1.6, where α 3 = 1 for textual information, α 3 = 0.5 for graphic information, α 3 = 1.7 for audio information, and i is selected within 1≤ i≤ 2 20 .
Кодируют полученные фрагменты информации, преобразуя их по заданному алгоритму до получения совокупности N-мерных множеств Аj элементов вида {Вm, X1, X2,... Хn}, где Вm - идентификатор, X1-Xn - координата элемента, aj - порядковый номер множества в пределах от 1 до 263, относительно начала координат элемента (каждый элемент имеет свою систему координат), адекватных преобразуемой исходной информации, где m и n выбирают в пределах от 1 до 263. Полученную совокупность N-мерных множеств сопоставляют с уже накопленными множествами и/или с вновь поступающими (одновременно или последовательно во времени) множествами по разным каналам, выделяют и вырезают пересекающиеся части множеств, после чего вырезанные пересечения множеств и остающиеся после вырезания множества распределяют по базам данных, помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое из различающихся по какому-то параметру множества в соответствующие этим видам множеств базы данных и помещают на место вырезанных множеств идентификаторы хранящих эти множества баз данных.Encode the obtained pieces of information, transforming them according to a given algorithm to obtain a set of N-dimensional sets A j of elements of the form {Bm, X 1 , X 2 , ... Xn}, where B m is the identifier, X 1 -X n is the coordinate of the element , a j is the serial number of the set in the range from 1 to 2 63 , relative to the origin of the element (each element has its own coordinate system), adequate to the transformed initial information, where m and n are selected in the range from 1 to 2 63 . The resulting set of N-dimensional sets is compared with already accumulated sets and / or with newly arriving (simultaneously or sequentially in time) sets in different channels, the intersecting parts of the sets are extracted and cut out, after which the cut out intersections of the sets and the sets remaining after cutting are distributed over the databases , placing each of the same sets in its corresponding database and each of the sets differing in some parameter in the sets of the database corresponding to these types and in eschayut the place of cut sets identifiers storing these multiple databases.
Экспериментальным путем при этом была получена скорость автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, равная 930,55 Кб/с на вычислительном устройстве с четырьмя процессорами Pentium III 800MHz, размером оперативной памяти 1024 Мб.In this case, an experimentally obtained rate of automatic structuring of computer codes adequate to the processed information, equal to 930.55 Kb / s on a computing device with four Pentium III 800MHz processors, and 1024 MB of RAM.
Для иллюстрации заявленного способа в примере Фиг.5 использована структурированная база данных текстовой информации. Эта база данных предназначена для хранения больших массивов текстовой информации. В процессе реализации заявленного способа выбирают (Фиг.5, операция выбирают, изображена стрелкой 1) число каналов (поз. 2) N1 равным 1, N2=1 при α 1=1, по которому передают объем V1 (Фиг.5, позиция 3) информации. Выделяют (Фиг.5, операция выделяют, изображенная стрелкой, обозначена позицией 4) из объема V1=100 Кб/с поступающей в единицу времени информации ее часть (Фиг.5. позиция 5) объема V1=8 б/с, т.е. в данном случае V2 - это фрагмент текстовой информации, например слово ″ аргумент″ , при α 2=0,9.To illustrate the claimed method in the example of Figure 5, a structured database of textual information was used. This database is designed to store large amounts of text information. In the process of implementing the inventive method, choose (Figure 5, the operation is selected, shown by arrow 1) the number of channels (item 2) N 1 equal to 1, N 2 = 1 with α 1 = 1, which transmit the volume V 1 (Figure 5 , position 3) information. Isolate (Figure 5, the operation is highlighted, indicated by an arrow, is indicated by 4) from the volume V 1 = 100 Kb / s of the information received per unit of time, its part (Figure 5, position 5) of volume V 1 = 8 b / s, t .e. in this case, V 2 is a piece of textual information, for example, the word ″ argument ″, with α 2 = 0.9.
Затем разбивают (Фиг.5, поз. 6) поступившую информацию на логически законченные фрагменты (Фиг.5, поз. 7), объемы которых выбирают в пределах 1,3≤ (V3(i)+α 3V2)/V2≤ 1,5, где α 3=1, a i выбирают в пределах 1≤ i≤ 23. В результате получают следующие определенные с использованием выше приведенного аналитического соотношения конкретные значения для объемов фрагментов 7: V3(1)=1 б/с, V3(2)=1 б/с, V3(3)=1 б/с, V3(4)=1 б/с, V3(5)=1 б/с, V3(6)=1 б/с, V3(7)=1 б/с, V3(8)=1 б/с. Выбранные конкретные значения логически законченных фрагментов 7 кодируют (Фиг.5, поз. 8), преобразуя их по заданному алгоритму, в частности для данного примера у=f(x), где f(x)=V3(i)-191, до получения сосокупности N-мерных множеств Aj (поз. 9) элементов ak (поз. 10) вида {Вm, Х1, X2,... Хn}, где Bm - идентификатор, X1-Xn - координата элемента, где j - порядковый номер множества в пределах от 1 до 23, 1≤ k≤ 23, относительно начала координат элемента (каждый элемент ak имеет свою систему координат), адекватных преобразуемой исходной информации, где m и n выбирают в пределах от 1 до 231.Then, the received information is divided (FIG. 5, POS. 6) into logically completed fragments (FIG. 5, POS. 7), the volumes of which are selected within 1.3 ≤ (V 3 (i) + α 3 V 2 ) / V 2 ≤ 1.5, where α 3 = 1, ai is chosen within the range of 1≤ i≤ 2 3 . As a result, the following specific values determined for the volumes of
В результате получают преобразованные элементы в данном частном случае вида а1={1, 1}, а2={2, 2}, а3={3, 3}, a4={4, 4}, а5={5, 5}, а6={2, 6}, а7={6, 7}, а8={7, 8}. При этом отдельные идентификаторы (первые цифры в фигурных скобках) элементов множеств могут совпадать в случае совпадения результатов преобразования фрагментов информации по заданному алгоритму. Далее, совокупность операций выполняют как одно целое (Фиг.5. поз. 11). Полученную совокупность N-мерных множеств 9 сопоставляют (Фиг.5. позиция 12) с уже накопленными множествами (например, база данных 13 (БД №1)) и/или с вновь поступающими (одновременно или последовательно во времени) множествами 14 и 15 по разным каналам. Определяют и вырезают (Фиг.6, позиция 16) пересекающиеся части множеств 17 и 18. После чего вырезанные пересечения множеств (Фиг.6, позиция 19) и остающиеся после вырезания множества с замененными частями распределяют (Фиг.5. позиция 19) по базам данных, помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое из различающихся по какому-то параметру множества в соответствующие этим видам множеств базы данных и помещают (Фиг.5, позиция 20 или Фиг.6, позиция 20) на место вырезанных множеств идентификаторы хранящих эти множества баз данных.As a result, transformed elements are obtained in this particular case of the form a 1 = {1, 1}, and 2 = {2, 2}, and 3 = {3, 3}, a 4 = {4, 4}, and 5 = { 5, 5}, and 6 = {2, 6}, and 7 = {6, 7}, and 8 = {7, 8}. In this case, individual identifiers (first digits in curly brackets) of the elements of the sets can coincide if the results of converting pieces of information according to a given algorithm coincide. Further, the set of operations is performed as a single unit (Figure 5, item 11). The resulting set of N-
В результате получается (Фиг.5, позиция 21) общая база данных, состоящая из иерархически связанных баз данных - каждая дочерняя база данных представлена своим идентификатором в соответствующих родительских базах данных.The result is (Fig. 5, position 21) a common database consisting of hierarchically related databases - each child database is represented by its identifier in the respective parent databases.
Экспериментальным путем при этом была получена скорость автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, равная 96 Кб/с на вычислительном устройстве с одним процессором Pentium III 800MHz, размером оперативной памяти 256 Мб.In this case, an experimentally obtained rate of automatic structuring of computer codes adequate to the processed information, equal to 96 Kb / s on a computing device with one Pentium III 800 MHz processor, 256 MB of RAM.
Кроме указанного выше технического результата практическое осуществление заявленного объекта позволяет существенно расширить возможности его использования применительно, например, к различным видам и объемам поступающей информации, обеспечивает дополнительную возможность высокоэффективной аппаратной реализации (цена/качество/скорость) с применением самых различных типов элементной базы, a также автоматическую адаптацию под решение задач разного типа, в отличие от нейросетей, требующих заранее заданной топологии под каждую конкретную задачу.In addition to the above technical result, the practical implementation of the claimed object allows you to significantly expand the possibilities of its use as applied, for example, to various types and volumes of incoming information, provides an additional opportunity for highly efficient hardware implementation (price / quality / speed) using a wide variety of element base types, as well as automatic adaptation to solving problems of various types, unlike neural networks that require a predetermined topology for each specific the exact task.
Claims (1)
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2002103731/09A RU2257611C2 (en) | 2002-02-15 | 2002-02-15 | Method for automatic structuring of computer codes adequate for processed information |
PCT/RU2003/000045 WO2003069970A2 (en) | 2002-02-15 | 2003-02-13 | Method for the automatic structuring of computer codes conforming to processed information |
AU2003221224A AU2003221224A1 (en) | 2002-02-15 | 2003-02-13 | Method for the automatic structuring of computer codes conforming to processed information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2002103731/09A RU2257611C2 (en) | 2002-02-15 | 2002-02-15 | Method for automatic structuring of computer codes adequate for processed information |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2002103731A RU2002103731A (en) | 2003-08-27 |
RU2257611C2 true RU2257611C2 (en) | 2005-07-27 |
Family
ID=27752122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2002103731/09A RU2257611C2 (en) | 2002-02-15 | 2002-02-15 | Method for automatic structuring of computer codes adequate for processed information |
Country Status (3)
Country | Link |
---|---|
AU (1) | AU2003221224A1 (en) |
RU (1) | RU2257611C2 (en) |
WO (1) | WO2003069970A2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008079048A1 (en) * | 2006-12-26 | 2008-07-03 | Pavel Mikhaylovich Malyshev | Computerized method for converting the sequence of conforming computer codes requested by an information user and a system for carrying out said method |
-
2002
- 2002-02-15 RU RU2002103731/09A patent/RU2257611C2/en not_active IP Right Cessation
-
2003
- 2003-02-13 WO PCT/RU2003/000045 patent/WO2003069970A2/en not_active Application Discontinuation
- 2003-02-13 AU AU2003221224A patent/AU2003221224A1/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008079048A1 (en) * | 2006-12-26 | 2008-07-03 | Pavel Mikhaylovich Malyshev | Computerized method for converting the sequence of conforming computer codes requested by an information user and a system for carrying out said method |
Also Published As
Publication number | Publication date |
---|---|
AU2003221224A1 (en) | 2003-09-09 |
WO2003069970A2 (en) | 2003-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5257365A (en) | Database system with multi-dimensional summary search tree nodes for reducing the necessity to access records | |
US5884320A (en) | Method and system for performing proximity joins on high-dimensional data points in parallel | |
Koudas et al. | High dimensional similarity joins: Algorithms and performance evaluation | |
US5649181A (en) | Method and apparatus for indexing database columns with bit vectors | |
US6665661B1 (en) | System and method for use in text analysis of documents and records | |
KR100295354B1 (en) | Document information retrieval system | |
US6772170B2 (en) | System and method for interpreting document contents | |
US7319999B2 (en) | System and method for arranging clusters in a display by theme | |
US5319779A (en) | System for searching information using combinatorial signature derived from bits sets of a base signature | |
US6523030B1 (en) | Sort system for merging database entries | |
US20100293179A1 (en) | Identifying synonyms of entities using web search | |
Karpinski et al. | Top-k color queries for document retrieval | |
Jun et al. | A new criterion in selection and discretization of attributes for the generation of decision trees | |
JPH08500917A (en) | A system for extracting knowledge about typicality and exceptionality from a database of case records | |
WO2002054287A2 (en) | Multi-query data visualization | |
US20030014396A1 (en) | Unified database and text retrieval system | |
CN108241713B (en) | Inverted index retrieval method based on multi-element segmentation | |
CN105740264A (en) | Distributed XML database sorting method and apparatus | |
Ottmann et al. | 1-2 brother trees or AVL trees revisited | |
CN104699819A (en) | Sememe classification method and device | |
RU2257611C2 (en) | Method for automatic structuring of computer codes adequate for processed information | |
JPS5839377A (en) | Character recognizing device | |
Zhang et al. | An efficient clustering algorithm | |
KR102324571B1 (en) | Method for providing enhanced search result in passage-based information retrieval | |
Huy et al. | An efficient implementation of anytime k-medoids clustering for time series under dynamic time warping |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC4A | Invention patent assignment |
Effective date: 20061215 |
|
QB4A | Licence on use of patent |
Free format text: LICENCE Effective date: 20110426 |
|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20130216 |