RU2257611C2 - Method for automatic structuring of computer codes adequate for processed information - Google Patents

Method for automatic structuring of computer codes adequate for processed information Download PDF

Info

Publication number
RU2257611C2
RU2257611C2 RU2002103731/09A RU2002103731A RU2257611C2 RU 2257611 C2 RU2257611 C2 RU 2257611C2 RU 2002103731/09 A RU2002103731/09 A RU 2002103731/09A RU 2002103731 A RU2002103731 A RU 2002103731A RU 2257611 C2 RU2257611 C2 RU 2257611C2
Authority
RU
Russia
Prior art keywords
sets
information
automatically
adequate
computer codes
Prior art date
Application number
RU2002103731/09A
Other languages
Russian (ru)
Other versions
RU2002103731A (en
Inventor
В.В. Артюхов (RU)
В.В. Артюхов
Original Assignee
Шехтман Альфред Александрович
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Шехтман Альфред Александрович filed Critical Шехтман Альфред Александрович
Priority to RU2002103731/09A priority Critical patent/RU2257611C2/en
Priority to PCT/RU2003/000045 priority patent/WO2003069970A2/en
Priority to AU2003221224A priority patent/AU2003221224A1/en
Publication of RU2002103731A publication Critical patent/RU2002103731A/en
Application granted granted Critical
Publication of RU2257611C2 publication Critical patent/RU2257611C2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Abstract

FIELD: computer science.
SUBSTANCE: method includes performing a block of operations along N1 channels, where N1 is selected from 1 to 2256, wherein received information is separated on logically finished fragments, encoded on basis of preset algorithm, to produce a block of N-dimensional sets adequate for converted source information Aj with elements like {Bm, X1, X2,...,Xn}, where j - order number of set in range from 1 to 2256, Bm - identifier, X1-Xn - coordinate of element from its coordinates center, m and n are selected from 1 to 2256; received block of sets is compared to already accumulated and/or newly produced sets from multiple channels, intersecting portions of sets are found and cut out; after that cut intersections and sets remaining after cutting are distributed among databases, placing each same set into database appropriate for it and each of sets different with some parameter to databases appropriate for them and identifiers of databases storing these sets are substituted in place of cut sets.
EFFECT: higher speed of operation, higher precision, lower costs, broader functional capabilities, higher efficiency.
9 dwg

Description

Область техникиTechnical field

Изобретение относится к области компьютерных технологий и может быть использовано при автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации.The invention relates to the field of computer technology and can be used for automatic structuring of computer codes adequate to the processed information.

Предшествующий уровень техникиState of the art

Известен способ автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, включающий выделение из объема поступающей в единицу времени информации ее части, которую выбирают в зависимости от вида информации, например цифровой или текстовой, разбивают поступившую информацию на логически законченные фрагменты, кодируют полученные фрагменты информации и распределяют их по базам данных [Айламазян А.К., Стась Е.В. "Информатика и теория развития". М., Наука, 1989 г.].A known method for the automatic structuring of computer codes adequate to the information being processed, including the allocation of part of the information received per unit time, which is selected depending on the type of information, for example, digital or textual, breaks the received information into logically complete fragments, encodes the resulting pieces of information and distributes them on the databases [Ailamazyan AK, Stas E.V. "Computer science and development theory." M., Science, 1989].

Известен также способ автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, включающий выделение из объема поступающей в единицу времени информации ее части, которую выбирают в зависимости от вида информации, например цифровой и/или текстовой, и/или графической, разбивают поступившую информацию на логически законченные фрагменты, кодируют полученные фрагменты информации, преобразуя их по заданному алгоритму, полученную совокупность преобразованных фрагментов распределяют по базам данных, помещая каждый из фрагментов в соответствующую ему базу [Д.Э.Бэстенс, В.-М.ван ден Берг, Д.Вуд. Нейронные сети и финансовые рынки, М:, Издательство ТВП, 1977 г.].There is also known a method of automatically structuring computer codes that are adequate to the information being processed, including extracting from the volume of information received per unit time its part, which is selected depending on the type of information, for example, digital and / or textual and / or graphic, breaking the received information into logically completed fragments, encode the obtained fragments of information, converting them according to a given algorithm, the resulting set of transformed fragments is distributed across databases, placing azhdy of the fragments in the corresponding base [D.E.Bestens, V.-M.van den Berg, D.Vud. Neural networks and financial markets, M :, Publisher TVP, 1977].

Недостатками известных способов являются несовершенство обработки компьютерных кодов, адекватных исходной информации, и относительно низкие скорости структуризации компьютерных кодов.The disadvantages of the known methods are the imperfection of processing computer codes that are adequate to the source information, and the relatively low rate of structuring of computer codes.

Решаемая задача и достигаемый технический результатThe problem to be solved and the technical result achieved

Решаемой изобретением задачей является совершенствование способов автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, с достижением при этом технического результата в отношении, в частности, повышения скорости структуризации компьютерных кодов. Использование в целом способа автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, позволяет значительно сэкономить расход вычислительных ресурсов (память, количество операций процессора и т.д.), повысить скорость и точность структуризации компьютерных кодов.The objective of the invention is to improve methods for the automatic structuring of computer codes that are adequate to the information being processed, while achieving a technical result in relation, in particular, to increase the speed of structuring computer codes. Using the whole method of automatic structuring of computer codes adequate to the information being processed can significantly save the consumption of computing resources (memory, the number of processor operations, etc.), and increase the speed and accuracy of structuring computer codes.

Краткое изложение сущности изобретенияSummary of the invention

В качестве кратких сведений, раскрывающих сущность изобретения, следует отметить, что достигаемый технический результат обеспечивают с помощью предложенного способа автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, который включает совокупность операций, осуществляемых по N1-каналам, где N1 выбирают от 1 до 2256. При этом в каждом из N2 каналов, выбираемых в количестве, удовлетворяющем неравенству 1+1/N1≤ (N21N1)/N1≤ 2,3, где α 1 - экспериментальный коэффициент, выбираемый в зависимости от вида информации и от количества источников ее поступления в пределах от 0,61≤ α1≤ 1,3, выделяют из объема V1 поступающей в единицу времени информации ее часть объема V2, которую выбирают из соотношения в пределах 0,56≤ (V22V1)/V1≤ 2,8, где α 2 - экспериментальный коэффициент, выбираемый в зависимости от вида информации в пределах от 0,56≤ α2≤ 1,8. Разбивают поступившую информацию на логически законченные фрагменты, объемы V3i которых выбирают из соотношения в пределах 0,45≤ (V3i3V2)/V2≤ 2,7, где α 3 - экспериментальный коэффициент, выбираемый в зависимости от особенности их разбиения в пределах от 0,45≤ α3≤ 1,7, а i выбирают в пределах 1≤ i≤ 2256.As brief information revealing the essence of the invention, it should be noted that the achieved technical result is provided by the proposed method for automatically structuring computer codes adequate to the processed information, which includes a set of operations carried out on N 1 channels, where N 1 is selected from 1 to 2 256 . Moreover, in each of the N 2 channels, selected in an amount satisfying the inequality 1 + 1 / N 1 ≤ (N 2 + α 1 N 1 ) / N 1 ≤ 2.3, where α 1 is the experimental coefficient, chosen depending on type of information and from the number of sources of its receipt in the range from 0.61≤ α 1 ≤ 1.3, it is isolated from the volume V 1 of information received per unit time its part of the volume V 2 , which is selected from the ratio within 0.56≤ (V 2 + α 2 V 1 ) / V 1 ≤ 2.8, where α 2 is the experimental coefficient chosen depending on the type of information in the range from 0.56 ≤ α 2 ≤ 1.8. The received information is divided into logically completed fragments, the volumes of V 3i of which are selected from the ratio within the range of 0.45≤ (V 3i + α 3 V 2 ) / V 2 ≤ 2.7, where α 3 is the experimental coefficient chosen depending on the particular their partitions in the range from 0.45 ≤ α 3 ≤ 1.7, and i is selected in the range 1 ≤ i ≤ 2 256 .

Затем кодируют полученные фрагменты информации, преобразуя их по заданному алгоритму до получения совокупности N-мерных множеств, адекватных преобразуемой исходной информации. Аj элементов вида {Вm, X1, Х2,... Хn}, где j - порядковый номер множества в пределах от 1 до 2256, Вm - идентификатор, X1-Xn - координата элемента относительно начала координат элемента, a m и n выбирают в пределах от 1 до 2256. Полученную совокупность N-мерных множеств сопоставляют с уже накопленными множествами и/или с вновь поступающими множествами по разным каналам, определяют и вырезают пересекающиеся части множеств. После этого вырезанные пересечения множеств и остающиеся после вырезания множества распределяют по базам данных, помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое из различающихся по какому-то параметру множества в соответствующие этим видам множеств базы данных и помещают на место вырезанных множеств идентификаторы хранящих эти множества баз данных.Then, the obtained pieces of information are encoded, transforming them according to a predetermined algorithm to obtain a set of N-dimensional sets that are adequate to the source information being transformed. And j elements of the form {B m , X 1 , X 2 , ... X n }, where j is the serial number of the set ranging from 1 to 2 256 , B m is the identifier, X 1 -X n is the coordinate of the element relative to the beginning element coordinates, am and n are selected in the range from 1 to 2 256 . The resulting set of N-dimensional sets is compared with already accumulated sets and / or with newly arriving sets through different channels, intersecting parts of the sets are determined and cut out. After that, the cut-off intersections of the sets and the sets remaining after cutting are distributed across the databases, placing each of the same sets in its corresponding database and each of the sets that differ in some parameter in the corresponding sets of the database and put the identifiers storing in place of the cut-out sets these sets of databases.

Перечень чертежейList of drawings

Фиг.1. Схема размещения компьютерных кодов, адекватных обрабатываемой информации. Фиг.2. Упрощенная схема осуществления способа для одного канала. Фиг.3. Упрощенная схема осуществления способа для двух каналов. Фиг.4. Упрощенная схема осуществления способа для десяти каналов. Фиг.5. Подробная иллюстрация заявленного способа. Фиг.6. Фрагмент подробной иллюстрации заявленного способа.Figure 1. The layout of computer codes adequate to the processed information. Figure 2. A simplified scheme of the method for one channel. Figure 3. A simplified diagram of the implementation of the method for two channels. Figure 4. A simplified diagram of the implementation of the method for ten channels. Figure 5. A detailed illustration of the claimed method. 6. A fragment of a detailed illustration of the claimed method.

Детальное описание и примеры осуществления изобретенияDetailed Description and Embodiments

При изложении сведений, подтверждающих возможность осуществления изобретения, целесообразно более детально описать предложенный способ автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, при описании которого нецелесообразно подробно останавливаться на известных из опубликованных данных особенностях выполнения его операций. При этом целесообразно привести для удобства восприятия информации определения используемых понятий.When presenting information confirming the possibility of carrying out the invention, it is advisable to describe in more detail the proposed method for automatically structuring computer codes that are adequate to the information being processed, when describing which it is inappropriate to dwell on the features of its operations known from published data. In this case, it is advisable to bring definitions of the concepts used for the convenience of perception of information.

Компьютерный код - машинопреобразуемое представление некоторого фрагмента информации (оригинала), в частности, в виде электромагнитных сигналов.Computer code is a machine-convertible representation of a piece of information (the original), in particular, in the form of electromagnetic signals.

Критерий - это фактор, по которому производят распознавание, например, параметр координата, логическое условие и т.п.A criterion is a factor by which recognition is performed, for example, a coordinate parameter, a logical condition, etc.

Система критериев - это совокупность критериев, взаимосвязанных их целевой направленностью, в частности их пригодностью для использования в процессе распознавания.A system of criteria is a set of criteria interconnected by their target orientation, in particular, their suitability for use in the recognition process.

Память - функциональный узел средства реализации способа, фиксирующий на определенный срок обрабатываемую информацию, с возможностью ее дальнейшего воспроизведения, считывания и других видов использования.Memory is a functional unit of the means of implementing the method, fixing processed information for a certain period of time, with the possibility of its further reproduction, reading, and other uses.

Заданный алгоритм - набор правил, по которым преобразуют поступающую по каждому из каналов исходную информацию.A given algorithm is a set of rules by which the source information arriving on each channel is transformed.

Множество - объединение в единое целое определенных вполне различаемых объектов, которые при этом называются элементами образуемого ими множества [″ Справочник по математике″ , И.Н.Бронштейн, К.А.Семендяев, изд. ″ Наука″ , Москва, 1986. с. 380. п.4.1.2.1].A set is a combination of certain completely distinguishable objects into a single whole, which are called elements of the set formed by them [″ Handbook of Mathematics ″, I.N. Bronstein, K.A.Semendyaev, ed. ″ Science ″, Moscow, 1986. p. 380. p. 4.1.2.1].

Различаемый объект - компьютерные коды, адекватные соответствующим фрагментам информации.The distinguished object is computer codes that are adequate to the corresponding pieces of information.

Пересечение двух множеств Аj и Aj+k - это множество, которое состоит из элементов, принадлежащих каждому из множеств Aj и Aj+k [″ Справочник по математике″ , И.Н.Бронштейн, К.А.Семендяев, изд. ″ Наука”, Москва, 1986, с.381, п.4.1.3.1], где j и j+k - номера множеств, взятые из области от 1 до 2256, либо, по аналогии, пересечение любого количества структурируемых по заявленному способу множеств.The intersection of two sets A j and A j + k is a set that consists of elements belonging to each of the sets A j and A j + k [″ Mathematics Reference ’, I.N. Bronstein, K.A.Semendyaev, ed. . ″ Science ”, Moscow, 1986, p. 381, clause 4.1.3.1], where j and j + k are the numbers of sets taken from the range from 1 to 2 256 , or, by analogy, the intersection of any number structured according to the claimed method sets.

Далее детально целесообразно остановиться только на отличительных существенных особенностях осуществления операций предложенного способа, заключающихся в том. что способ включает совокупность операций, осуществляемых по N1-каналам, где N1 выбирают от 1 до 2256. Выбор указанного количества каналов в заявленных пределах обеспечивает практически все существующие в настоящее время потребности реализации способа. При этом в каждом из N2 каналов, выбираемых в количестве, удовлетворяющем неравенству 1+1/N1≤ (N21N1)/N1≤ 2,3, где α 1 - экспериментальный коэффициент, выбираемый в зависимости от вида информации и от количества источников ее поступления в пределах от 0,61≤ α1≤ 1,3, выделяют из объема V1 поступающей в единицу времени информации ее часть объема V2, которую выбирают из соотношения в пределах 0,56≤ (V22V1)/V1≤ 2,8, где α 2 - экспериментальный коэффициент, выбираемый в зависимости от вида информации в пределах от 0,56≤ α2≤ 1,8. На практике это могут быть разновидности цифровой, текстовой, символьной, графической и смешанной информации. Поступившую информацию разбивают на логически законченные фрагменты, объемы V3i которых выбирают из соотношения в пределах 0,45≤ (V3i3V2)/V2≤ 2,7, где α 3 - экспериментальный коэффициент, выбираемый в зависимости от особенности их разбиения в пределах от 0,45≤ α3≤ 1,7, а i выбирают в пределах 1≤ i≤ 2256. В числе простейших особенностей разбиения поступившей информации на логически законченные фрагменты можно указать, например, на равные объемы фрагментов или не равные ее разбивают.Further, in detail, it is advisable to dwell only on the distinguishing essential features of the operations of the proposed method, namely. that the method includes a set of operations carried out on N 1 channels, where N 1 choose from 1 to 2 256 . The choice of the specified number of channels within the stated limits provides almost all currently existing needs for the implementation of the method. Moreover, in each of the N 2 channels, selected in an amount satisfying the inequality 1 + 1 / N 1 ≤ (N 2 + α 1 N 1 ) / N 1 ≤ 2.3, where α 1 is the experimental coefficient, chosen depending on type of information and from the number of sources of its receipt in the range from 0.61≤ α 1 ≤ 1.3, it is isolated from the volume V 1 of information received per unit time its part of the volume V 2 , which is selected from the ratio within 0.56≤ (V 2 + α 2 V 1 ) / V 1 ≤ 2.8, where α 2 is the experimental coefficient chosen depending on the type of information in the range from 0.56 ≤ α 2 ≤ 1.8. In practice, these can be varieties of digital, textual, symbolic, graphic and mixed information. The received information is divided into logically completed fragments, the volumes of V 3i of which are selected from the ratio within the range of 0.45≤ (V 3i + α 3 V 2 ) / V 2 ≤ 2.7, where α 3 is the experimental coefficient selected depending on the particular their partitions in the range from 0.45 ≤ α 3 ≤ 1.7, and i is selected in the range 1 ≤ i ≤ 2 256 . Among the simplest features of dividing the received information into logically complete fragments, it is possible to indicate, for example, equal volumes of fragments or not equal fractions.

Затем кодируют полученные фрагменты информации, преобразуя их по заданному алгоритму до получения совокупности N-мерных множеств, адекватных преобразуемой исходной информации, Aj элементов (и/или фреймов) вида {Вm, Х1, Х2,... Хn), где j - порядковый номер множества в пределах от 1 до 2256, Вm – идентификатор, X1-Xn - координата элемента относительно начала координат элемента, a m и n выбирают в пределах от 1 до 2256. Здесь целесообразно отметить, что указанные элементы часто называют фреймами и каждый элемент имеет свою систему координат. Полученную совокупность N-мерных множеств сопоставляют с уже накопленными множествами и/или с вновь поступающими множествами по разным каналам, определяют и вырезают пересекающиеся части множеств. Сопоставление с уже накопленными множествами и/или с вновь поступающими производят одновременно или последовательно во времени. После этого вырезанные пересечения множеств и остающиеся после вырезания множества распределяют по базам данных, помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое их paзличающихся по какому-то параметру множества в соответствующие этим видам множеств базы данных и помещают на место вырезанных множеств идентификаторы хранящих эти множества баз данных.Then, the obtained pieces of information are encoded, transforming them according to a predetermined algorithm to obtain a set of N-dimensional sets adequate to the transformed initial information, A j elements (and / or frames) of the form {B m , X 1 , X 2 , ... X n ) where j is the sequence number of the set in the range from 1 to 2 256 , In m is the identifier, X 1 -X n is the coordinate of the element relative to the origin of the element, am and n are selected in the range from 1 to 2 256 . It is worth noting here that these elements are often called frames and each element has its own coordinate system. The resulting set of N-dimensional sets is compared with already accumulated sets and / or with newly arriving sets through different channels, intersecting parts of the sets are determined and cut out. Comparison with already accumulated sets and / or with new entrants is carried out simultaneously or sequentially in time. After that, the cut intersections of the sets and the sets remaining after cutting are distributed over the databases, placing each of the same sets in its corresponding database and each of them differing in some parameter of the set in the corresponding sets of the database sets and put the identifiers storing in place of the cut sets these sets of databases.

Учитывая использование ряда аналитических соотношений, следует отметить, что для практической реализации из множеств, удовлетворяющих аналитические соотношения значений параметров в заявленных пределах - выбирают для параметров, например, N, N1 или N2 - это целые положительные натуральные числа, а для остальных параметров - это действительные числа, исключая иррациональные, трансцендентные, комплексные, отрицательные и другие технически некорректные или практически не применимые, или не воспроизводимые значения взаимосвязанных параметров.Given the use of a number of analytical relationships, it should be noted that for practical implementation, from sets that satisfy the analytical relationships of the parameter values within the stated limits, they are chosen for the parameters, for example, N, N 1 or N 2 are positive integer positive integers, and for other parameters - these are real numbers, excluding irrational, transcendental, complex, negative and other technically incorrect or practically not applicable, or not reproducible values of interrelated parameters moat.

Промышленная применимость и достижение технического результатаIndustrial applicability and technical result achievement

Соответствие критерию промышленная применимость заявленного объекта доказывается как широким получением и использованием описанных приемов компьютерных технологий в массовых масштабах, так и отсутствием в заявленных притязаниях каких-либо практически трудно реализуемых признаков. Достигаемый технический результат, как показали данные экспериментов, может быть реализован только взаимосвязанной совокупностью всех существенных признаков заявленного способа, отраженных в формуле изобретения. Например, при поиске слова ″ Example″ в несортированной, неиндексированной базе данных из 100 миллионов записей или из 100 миллиардов записей количество операций будет примерно одинаковым, т.е. скорость поиска будет наиболее высокой по сравнению с известными способами при адекватных условиях их использования, зависит только от длины запроса и очень слабо зависит от размера базы данных.Compliance with the criterion of industrial applicability of the claimed object is proved both by the wide receipt and use of the described techniques of computer technology on a massive scale, and the absence of any practically difficult features in the claimed claims. Achievable technical result, as shown by experimental data, can be realized only by an interconnected set of all the essential features of the claimed method, reflected in the claims. For example, when searching for the word ″ Example ″ in an unsorted, non-indexed database of 100 million records or 100 billion records, the number of operations will be approximately the same, i.e. search speed will be the highest compared to known methods under adequate conditions for their use, it depends only on the length of the request and very weakly depends on the size of the database.

Нижние и верхние значения заявленных пределов были получены на основе статистической обработки результатов экспериментальных исследований, анализа и обобщения их и известных из опубликованных источников данных, а также изобретательской интуиции, исходя из условия достижения указанного технического результата. Указанные в формуле изобретения отличия дают основание сделать вывод о новизне данного техническою решения, а совокупность испрашиваемых притязаний - о ее изобретательском уровне, что доказывается как вышеприведенным детальным описанием заявленных объектов, так и следующим описанием примеров практической реализации заявленного способа. Для этого целесообразно привести основные функциональные схемы осуществления способа автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, при создании баз данных.The lower and upper values of the declared limits were obtained on the basis of statistical processing of the results of experimental studies, analysis and generalization of them and known from published data sources, as well as inventive intuition, based on the conditions for achieving the specified technical result. The differences indicated in the claims make it possible to conclude that this technical solution is new, and the set of claimed claims is about its inventive step, which is proved both by the above detailed description of the claimed objects and the following description of examples of practical implementation of the claimed method. To this end, it is advisable to give the main functional diagrams of the method for automatically structuring computer codes adequate to the processed information when creating databases.

Преобразование компьютерных кодов, адекватных обрабатываемой информации, по предложенному способу частично можно пояснить с помощью Фиг.1А), которая отражает случай, когда поступает первое множество, схематически отображенное в виде овала 1. Так как общая база данных еще пуста, то множество целиком помещается в новую базу БД № 1 данных. Фиг.1Б) отражает случай, когда поступают очередные два множества 2 и 4, содержащие совпадающие элементы. Пересечение множеств 3 вырезается и помещается в соответствующую БД №3, на его место во множества 2 и 4 вставляется идентификатор БД №3, модифицированные множества 2 и 4 помещаются в соответствующие базы данных БД №3 и БД №4.The conversion of computer codes adequate to the information being processed by the proposed method can partially be explained using Fig. 1A), which reflects the case when the first set arrives, schematically displayed as oval 1. Since the general database is still empty, the whole set is placed in new database database number 1 data. Fig.1B) reflects the case when the next two sets 2 and 4, containing matching elements. The intersection of sets 3 is cut out and placed in the corresponding database No. 3, in its place in sets 2 and 4 the identifier of database No. 3 is inserted, the modified sets 2 and 4 are placed in the corresponding database of database No. 3 and database No. 4.

Фиг.1В) отражает случай, когда поступает очередное множество N-1, не содержащее ни одного совпадающего элемента с предыдущими множествами, поэтому множество N-1 помещается в новую базу данных БД-№N-1. Фиг.1Г) отражает случай, когда поступает очередное множество N, содержащее целиком совпадающие элементы со множеством N-1, хранянящимся в базе данных БД №N-1. Пересечение множеств N вырезается и помещается и соответствующую базу данных БД №N, на его место во множество N-1 вставляется идентификатор базы данных БД №N, соответственно изменяется база данных БД №N-1. Таким образом, в каждой отдельной базе данных БД хранятся множества, не имеющие совпадающих элементов, т.е. ни одно из множеств не пересекается.Figv) reflects the case when the next set N-1 arrives that does not contain any matching element with the previous sets, therefore, the set N-1 is placed in a new database DB-NN-1. Fig.1G) reflects the case when the next set N arrives containing completely matching elements with the set N-1 stored in the database database No. N-1. The intersection of the sets N is cut out and the corresponding database of the database No. N is inserted, in its place in the set N-1 is inserted the identifier of the database of the database No. N, the database of the database No. N-1 is accordingly changed. Thus, in each separate database of the database, sets are stored that do not have matching elements, i.e. none of the sets intersect.

Упрощенные схемы осуществления способа последовательно для одного, двух и 10 каналов приведены соответственно на Фиг.2, Фиг.3 и Фиг.4. На Фиг.2 схематически изображена структурированная база данных текстовой информации, предназначенная для хранения больших массивов текстовой информации с выбором одного канала текстовой информации.Simplified diagrams of the method in series for one, two and 10 channels are shown in FIG. 2, FIG. 3 and FIG. 4, respectively. Figure 2 schematically shows a structured database of text information designed to store large arrays of text information with the selection of one channel of text information.

На Фиг.3 схематически изображена структурированная база данных текстовой и графической информации, предназначенная для хранения больших массивов текстовой и графической информации с выбором двух каналов - одного для текстовой информации, второго для графической информации.Figure 3 schematically shows a structured database of text and graphic information, designed to store large arrays of text and graphic information with a choice of two channels - one for text information, the second for graphic information.

Детально целесообразно охарактеризовать структурированную базу данных текстовой, графической и звуковой информации, предназначенную для хранения больших массивов текстовой, графической и звуковой информации, поступающей одновременно по 10 каналам (Фиг.4), например 6 текстовых, 2 графических и 2 звуковых. Совокупность операций способа, реализованная в устройстве Фиг.4, может быть охарактеризована следующим образом: N1 выбирают равным 10, N2 - от 2 до 6 при α 1=1 для текстовой информации, α 1=0,9 для графической информации, α 1=1,1 для звуковой информации. Выделяют из объема V1=10 000 Кб/с поступающей в единицу времени информации ее часть объема V2=1000 Кб/с при α 2=1 для текстовой информации, α 2=0,8 для графической информации, α 2=1,2 для звуковой информации. Разбивают поступившую информацию на логически законченные фрагменты, объемы которых выбирают из соотношения 1,4≤ (V3i3V2)/V2≤ 1,6, где α 3=1 для текстовой информации, α 3=0,5 для графической информации, α 3=1,7 для звуковой информации, а i выбирают в пределах 1≤ i≤ 220.It is advisable to characterize in detail a structured database of text, graphic and audio information, intended for storing large arrays of text, graphic and audio information arriving simultaneously through 10 channels (Figure 4), for example 6 text, 2 graphic and 2 audio. The set of operations of the method implemented in the device of Figure 4 can be characterized as follows: N 1 is chosen equal to 10, N 2 from 2 to 6 with α 1 = 1 for text information, α 1 = 0.9 for graphic information, α 1 = 1.1 for audio information. Allocated from the volume V 1 = 10 000 Kb / s of information received per unit time, its part of the volume V 2 = 1000 Kb / s with α 2 = 1 for textual information, α 2 = 0.8 for graphic information, α 2 = 1, 2 for audio information. The received information is divided into logically completed fragments, the volumes of which are selected from the ratio 1.4 ≤ (V 3i + α 3 V 2 ) / V 2 ≤ 1.6, where α 3 = 1 for textual information, α 3 = 0.5 for graphic information, α 3 = 1.7 for audio information, and i is selected within 1≤ i≤ 2 20 .

Кодируют полученные фрагменты информации, преобразуя их по заданному алгоритму до получения совокупности N-мерных множеств Аj элементов вида {Вm, X1, X2,... Хn}, где Вm - идентификатор, X1-Xn - координата элемента, aj - порядковый номер множества в пределах от 1 до 263, относительно начала координат элемента (каждый элемент имеет свою систему координат), адекватных преобразуемой исходной информации, где m и n выбирают в пределах от 1 до 263. Полученную совокупность N-мерных множеств сопоставляют с уже накопленными множествами и/или с вновь поступающими (одновременно или последовательно во времени) множествами по разным каналам, выделяют и вырезают пересекающиеся части множеств, после чего вырезанные пересечения множеств и остающиеся после вырезания множества распределяют по базам данных, помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое из различающихся по какому-то параметру множества в соответствующие этим видам множеств базы данных и помещают на место вырезанных множеств идентификаторы хранящих эти множества баз данных.Encode the obtained pieces of information, transforming them according to a given algorithm to obtain a set of N-dimensional sets A j of elements of the form {Bm, X 1 , X 2 , ... Xn}, where B m is the identifier, X 1 -X n is the coordinate of the element , a j is the serial number of the set in the range from 1 to 2 63 , relative to the origin of the element (each element has its own coordinate system), adequate to the transformed initial information, where m and n are selected in the range from 1 to 2 63 . The resulting set of N-dimensional sets is compared with already accumulated sets and / or with newly arriving (simultaneously or sequentially in time) sets in different channels, the intersecting parts of the sets are extracted and cut out, after which the cut out intersections of the sets and the sets remaining after cutting are distributed over the databases , placing each of the same sets in its corresponding database and each of the sets differing in some parameter in the sets of the database corresponding to these types and in eschayut the place of cut sets identifiers storing these multiple databases.

Экспериментальным путем при этом была получена скорость автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, равная 930,55 Кб/с на вычислительном устройстве с четырьмя процессорами Pentium III 800MHz, размером оперативной памяти 1024 Мб.In this case, an experimentally obtained rate of automatic structuring of computer codes adequate to the processed information, equal to 930.55 Kb / s on a computing device with four Pentium III 800MHz processors, and 1024 MB of RAM.

Для иллюстрации заявленного способа в примере Фиг.5 использована структурированная база данных текстовой информации. Эта база данных предназначена для хранения больших массивов текстовой информации. В процессе реализации заявленного способа выбирают (Фиг.5, операция выбирают, изображена стрелкой 1) число каналов (поз. 2) N1 равным 1, N2=1 при α 1=1, по которому передают объем V1 (Фиг.5, позиция 3) информации. Выделяют (Фиг.5, операция выделяют, изображенная стрелкой, обозначена позицией 4) из объема V1=100 Кб/с поступающей в единицу времени информации ее часть (Фиг.5. позиция 5) объема V1=8 б/с, т.е. в данном случае V2 - это фрагмент текстовой информации, например слово ″ аргумент″ , при α 2=0,9.To illustrate the claimed method in the example of Figure 5, a structured database of textual information was used. This database is designed to store large amounts of text information. In the process of implementing the inventive method, choose (Figure 5, the operation is selected, shown by arrow 1) the number of channels (item 2) N 1 equal to 1, N 2 = 1 with α 1 = 1, which transmit the volume V 1 (Figure 5 , position 3) information. Isolate (Figure 5, the operation is highlighted, indicated by an arrow, is indicated by 4) from the volume V 1 = 100 Kb / s of the information received per unit of time, its part (Figure 5, position 5) of volume V 1 = 8 b / s, t .e. in this case, V 2 is a piece of textual information, for example, the word ″ argument ″, with α 2 = 0.9.

Затем разбивают (Фиг.5, поз. 6) поступившую информацию на логически законченные фрагменты (Фиг.5, поз. 7), объемы которых выбирают в пределах 1,3≤ (V3(i)3V2)/V2≤ 1,5, где α 3=1, a i выбирают в пределах 1≤ i≤ 23. В результате получают следующие определенные с использованием выше приведенного аналитического соотношения конкретные значения для объемов фрагментов 7: V3(1)=1 б/с, V3(2)=1 б/с, V3(3)=1 б/с, V3(4)=1 б/с, V3(5)=1 б/с, V3(6)=1 б/с, V3(7)=1 б/с, V3(8)=1 б/с. Выбранные конкретные значения логически законченных фрагментов 7 кодируют (Фиг.5, поз. 8), преобразуя их по заданному алгоритму, в частности для данного примера у=f(x), где f(x)=V3(i)-191, до получения сосокупности N-мерных множеств Aj (поз. 9) элементов ak (поз. 10) вида {Вm, Х1, X2,... Хn}, где Bm - идентификатор, X1-Xn - координата элемента, где j - порядковый номер множества в пределах от 1 до 23, 1≤ k≤ 23, относительно начала координат элемента (каждый элемент ak имеет свою систему координат), адекватных преобразуемой исходной информации, где m и n выбирают в пределах от 1 до 231.Then, the received information is divided (FIG. 5, POS. 6) into logically completed fragments (FIG. 5, POS. 7), the volumes of which are selected within 1.3 ≤ (V 3 (i) + α 3 V 2 ) / V 2 ≤ 1.5, where α 3 = 1, ai is chosen within the range of 1≤ i≤ 2 3 . As a result, the following specific values determined for the volumes of fragments 7 determined using the above analytical relation are obtained: V 3 (1) = 1 b / s, V 3 (2) = 1 b / s, V 3 (3) = 1 b / s , V 3 (4) = 1 b / s, V 3 (5) = 1 b / s, V 3 (6) = 1 b / s, V 3 (7) = 1 b / s, V 3 (8) = 1 b / s. The selected specific values of the logically complete fragments 7 are encoded (Figure 5, item 8), transforming them according to a given algorithm, in particular for this example, y = f (x), where f (x) = V 3 (i) -191, to get the set of N-dimensional sets A j (pos. 9) of elements a k (pos. 10) of the form {B m , X 1 , X 2 , ... X n }, where B m is the identifier, X 1 -X n is the coordinate of the element, where j is the sequence number of the set in the range from 1 to 2 3 , 1≤ k≤ 2 3 , relative to the origin of the element (each element a k has its own coordinate system), adequate to the transformed initial information, where m and n choose before Lah from 1 to 2 31 .

В результате получают преобразованные элементы в данном частном случае вида а1={1, 1}, а2={2, 2}, а3={3, 3}, a4={4, 4}, а5={5, 5}, а6={2, 6}, а7={6, 7}, а8={7, 8}. При этом отдельные идентификаторы (первые цифры в фигурных скобках) элементов множеств могут совпадать в случае совпадения результатов преобразования фрагментов информации по заданному алгоритму. Далее, совокупность операций выполняют как одно целое (Фиг.5. поз. 11). Полученную совокупность N-мерных множеств 9 сопоставляют (Фиг.5. позиция 12) с уже накопленными множествами (например, база данных 13 (БД №1)) и/или с вновь поступающими (одновременно или последовательно во времени) множествами 14 и 15 по разным каналам. Определяют и вырезают (Фиг.6, позиция 16) пересекающиеся части множеств 17 и 18. После чего вырезанные пересечения множеств (Фиг.6, позиция 19) и остающиеся после вырезания множества с замененными частями распределяют (Фиг.5. позиция 19) по базам данных, помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое из различающихся по какому-то параметру множества в соответствующие этим видам множеств базы данных и помещают (Фиг.5, позиция 20 или Фиг.6, позиция 20) на место вырезанных множеств идентификаторы хранящих эти множества баз данных.As a result, transformed elements are obtained in this particular case of the form a 1 = {1, 1}, and 2 = {2, 2}, and 3 = {3, 3}, a 4 = {4, 4}, and 5 = { 5, 5}, and 6 = {2, 6}, and 7 = {6, 7}, and 8 = {7, 8}. In this case, individual identifiers (first digits in curly brackets) of the elements of the sets can coincide if the results of converting pieces of information according to a given algorithm coincide. Further, the set of operations is performed as a single unit (Figure 5, item 11). The resulting set of N-dimensional sets 9 are compared (Fig. 5, position 12) with the already accumulated sets (for example, database 13 (DB No. 1)) and / or with the new sets (simultaneously or sequentially in time) of sets 14 and 15 each different channels. The intersecting parts of the sets 17 and 18 are determined and cut out (Fig. 6, position 16). After that, the intersected sets of the sets (Fig. 6, position 19) and the sets remaining after cutting out with the replaced parts are distributed (Fig. 5, position 19) into the bases data, placing each of the same sets in its corresponding database and each of the sets differing in some parameter in the sets corresponding to these types of database sets and put (Figure 5, position 20 or Figure 6, position 20) in place of the cut-out sets identifiers storing these sets ba data.

В результате получается (Фиг.5, позиция 21) общая база данных, состоящая из иерархически связанных баз данных - каждая дочерняя база данных представлена своим идентификатором в соответствующих родительских базах данных.The result is (Fig. 5, position 21) a common database consisting of hierarchically related databases - each child database is represented by its identifier in the respective parent databases.

Экспериментальным путем при этом была получена скорость автоматической структуризации компьютерных кодов, адекватных обрабатываемой информации, равная 96 Кб/с на вычислительном устройстве с одним процессором Pentium III 800MHz, размером оперативной памяти 256 Мб.In this case, an experimentally obtained rate of automatic structuring of computer codes adequate to the processed information, equal to 96 Kb / s on a computing device with one Pentium III 800 MHz processor, 256 MB of RAM.

Кроме указанного выше технического результата практическое осуществление заявленного объекта позволяет существенно расширить возможности его использования применительно, например, к различным видам и объемам поступающей информации, обеспечивает дополнительную возможность высокоэффективной аппаратной реализации (цена/качество/скорость) с применением самых различных типов элементной базы, a также автоматическую адаптацию под решение задач разного типа, в отличие от нейросетей, требующих заранее заданной топологии под каждую конкретную задачу.In addition to the above technical result, the practical implementation of the claimed object allows you to significantly expand the possibilities of its use as applied, for example, to various types and volumes of incoming information, provides an additional opportunity for highly efficient hardware implementation (price / quality / speed) using a wide variety of element base types, as well as automatic adaptation to solving problems of various types, unlike neural networks that require a predetermined topology for each specific the exact task.

Claims (1)

Способ автоматической структуризации компьютерных кодов в виде электромагнитных сигналов, адекватных обрабатываемой информации, включающий совокупность операций, автоматически осуществляемых по N1-каналам, где N1 автоматически выбирают от 1 до 2256, таким образом, что в каждом из N2 каналов, автоматически выбираемых в количестве, удовлетворяющем неравенству 1+1/N1≤ (N21N1)/N1≤ 2,3, где α 1 - экспериментальный коэффициент, автоматически выбираемый в зависимости от вида информации, представленной в виде компьютерных кодов, адекватных обрабатываемой информации, и от количества источников её поступления в пределах 0,61≤ α1≤ 1,3, автоматически выделяют из объёма V1 поступающей в единицу времени информации, представленной в виде компьютерных кодов, адекватных обрабатываемой информации, её часть объёма V2, которую автоматически выбирают из соотношения в пределах 0,56≤ (V22V1)/V1≤ 2,8, где α 2 - экспериментальный коэффициент, автоматически выбираемый в зависимости от вида информации, представленной в виде компьютерных кодов, адекватных обрабатываемой информации, в пределах 0,56≤ α2≤ 1,8, автоматически разбивают поступившую информацию, представленную в виде компьютерных кодов, адекватных обрабатываемой информации, на логически законченные фрагменты, объёмы V3i которых автоматически выбирают из соотношения в пределах 0,45≤ (V3i3V2)/V2≤ 2,7, где α 3 - экспериментальный коэффициент, автоматически выбираемый в зависимости от особенности их разбиения в пределах 0,45≤ α3≤ 1,7, а i автоматически выбирают в пределах 1≤ i≤ 2256, автоматически кодируют полученные фрагменты информации, представленной в виде компьютерных кодов, адекватных обрабатываемой информации, автоматически преобразуя их по заданному алгоритму до получения совокупности N-мерных множеств, содержащих компьютерные коды, адекватные преобразуемой исходной информации, Aj элементов вида {Вm, X1, X2,...Хn}, где j - порядковый номер множества в пределах от 1 до 2256, Вm - идентификатор, X1-Xn - координата элемента относительно начала координат элемента, а m и n автоматически выбирают в пределах от 1 до 2256, полученную совокупность N-мерных множеств автоматически сопоставляют с уже накопленными множествами и/или с вновь автоматически поступающими множествами по разным каналам, автоматически определяют и автоматически вырезают пересекающиеся части множеств, после чего вырезанные пересечения множеств и остающиеся после вырезания множества автоматически распределяют по базам данных, автоматически помещая каждое из одинаковых множеств в соответствующую ему базу данных и каждое из различающихся по какому-то параметру множеств в соответствующие этим видам множеств базы данных, и автоматически помещают на место вырезанных множеств идентификаторы хранящих эти множества баз данных, содержащих компьютерные коды, адекватные обработанной информации.A method for automatically structuring computer codes in the form of electromagnetic signals adequate to the processed information, including a set of operations automatically performed on N 1 channels, where N 1 is automatically selected from 1 to 2 256 , so that in each of N 2 channels are automatically selected in an amount satisfying the inequality 1 + 1 / N 1 ≤ (N 2 + α 1 N 1 ) / N 1 ≤ 2,3, where α 1 is the experimental coefficient, automatically selected depending on the type of information presented in the form of computer codes, adequate processing Pipeline information on the number of sources and its receipt within 0,61≤ α 1 ≤ 1,3, automatically isolated from volume V 1 supplied per unit of time information represented in the form of computer code, adequate information processed, its part of the volume V 2, which is automatically selected from a ratio in the range of 0.56≤ (V 2 + α 2 V 1 ) / V 1 ≤ 2.8, where α 2 is the experimental coefficient, automatically selected depending on the type of information presented in the form of computer codes adequate processed information, within 0.56≤ α 2 ≤ 1.8, the received information, presented in the form of computer codes adequate to the processed information, is automatically divided into logically completed fragments, the volumes of V 3i of which are automatically selected from the ratio within 0.45≤ (V 3i + α 3 V 2 ) / V 2 ≤ 2.7, where α 3 is the experimental coefficient, automatically selected depending on the features of their partition within 0.45 ≤ α 3 ≤ 1.7, and i are automatically selected within 1 ≤ i ≤ 2 256 , the resulting fragments of information presented in the form of computer codes, hell cotton processed information, automatically converting them by a given algorithm until a plurality of N-dimensional sets containing computer code, transformed adequate initial information, A j elements of the form {B m, X 1, X 2, ... X n}, where j - the serial number of the set in the range from 1 to 2 256 , B m is the identifier, X 1 -X n is the coordinate of the element relative to the origin of the element, and m and n are automatically selected in the range from 1 to 2 256 , the resulting set of N-dimensional sets automatically correlate with already accumulated sets and / or with newly automatically arriving sets through different channels, the intersecting parts of the sets are automatically detected and automatically cut, after which the cut-off intersections of the sets and the remaining sets after cutting are automatically distributed to the databases, automatically placing each of the same sets into its corresponding database and each of them differing by some parameter sets in the corresponding to these types of sets of databases, and automatically put in place of the cut sets identifier ry storing these sets of databases containing computer codes adequate to the processed information.
RU2002103731/09A 2002-02-15 2002-02-15 Method for automatic structuring of computer codes adequate for processed information RU2257611C2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2002103731/09A RU2257611C2 (en) 2002-02-15 2002-02-15 Method for automatic structuring of computer codes adequate for processed information
PCT/RU2003/000045 WO2003069970A2 (en) 2002-02-15 2003-02-13 Method for the automatic structuring of computer codes conforming to processed information
AU2003221224A AU2003221224A1 (en) 2002-02-15 2003-02-13 Method for the automatic structuring of computer codes conforming to processed information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2002103731/09A RU2257611C2 (en) 2002-02-15 2002-02-15 Method for automatic structuring of computer codes adequate for processed information

Publications (2)

Publication Number Publication Date
RU2002103731A RU2002103731A (en) 2003-08-27
RU2257611C2 true RU2257611C2 (en) 2005-07-27

Family

ID=27752122

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2002103731/09A RU2257611C2 (en) 2002-02-15 2002-02-15 Method for automatic structuring of computer codes adequate for processed information

Country Status (3)

Country Link
AU (1) AU2003221224A1 (en)
RU (1) RU2257611C2 (en)
WO (1) WO2003069970A2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008079048A1 (en) * 2006-12-26 2008-07-03 Pavel Mikhaylovich Malyshev Computerized method for converting the sequence of conforming computer codes requested by an information user and a system for carrying out said method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008079048A1 (en) * 2006-12-26 2008-07-03 Pavel Mikhaylovich Malyshev Computerized method for converting the sequence of conforming computer codes requested by an information user and a system for carrying out said method

Also Published As

Publication number Publication date
AU2003221224A1 (en) 2003-09-09
WO2003069970A2 (en) 2003-08-28

Similar Documents

Publication Publication Date Title
US5257365A (en) Database system with multi-dimensional summary search tree nodes for reducing the necessity to access records
US5884320A (en) Method and system for performing proximity joins on high-dimensional data points in parallel
Koudas et al. High dimensional similarity joins: Algorithms and performance evaluation
US5649181A (en) Method and apparatus for indexing database columns with bit vectors
US6665661B1 (en) System and method for use in text analysis of documents and records
KR100295354B1 (en) Document information retrieval system
US6772170B2 (en) System and method for interpreting document contents
US7319999B2 (en) System and method for arranging clusters in a display by theme
US5319779A (en) System for searching information using combinatorial signature derived from bits sets of a base signature
US6523030B1 (en) Sort system for merging database entries
US20100293179A1 (en) Identifying synonyms of entities using web search
Karpinski et al. Top-k color queries for document retrieval
Jun et al. A new criterion in selection and discretization of attributes for the generation of decision trees
JPH08500917A (en) A system for extracting knowledge about typicality and exceptionality from a database of case records
WO2002054287A2 (en) Multi-query data visualization
US20030014396A1 (en) Unified database and text retrieval system
CN108241713B (en) Inverted index retrieval method based on multi-element segmentation
CN105740264A (en) Distributed XML database sorting method and apparatus
Ottmann et al. 1-2 brother trees or AVL trees revisited
CN104699819A (en) Sememe classification method and device
RU2257611C2 (en) Method for automatic structuring of computer codes adequate for processed information
JPS5839377A (en) Character recognizing device
Zhang et al. An efficient clustering algorithm
KR102324571B1 (en) Method for providing enhanced search result in passage-based information retrieval
Huy et al. An efficient implementation of anytime k-medoids clustering for time series under dynamic time warping

Legal Events

Date Code Title Description
PC4A Invention patent assignment

Effective date: 20061215

QB4A Licence on use of patent

Free format text: LICENCE

Effective date: 20110426

MM4A The patent is invalid due to non-payment of fees

Effective date: 20130216