RU77465U1 - DYNAMIC CONTENT FILTRATION SYSTEM OF ELECTRONIC DOCUMENTS - Google Patents

DYNAMIC CONTENT FILTRATION SYSTEM OF ELECTRONIC DOCUMENTS Download PDF

Info

Publication number
RU77465U1
RU77465U1 RU2008120195/22U RU2008120195U RU77465U1 RU 77465 U1 RU77465 U1 RU 77465U1 RU 2008120195/22 U RU2008120195/22 U RU 2008120195/22U RU 2008120195 U RU2008120195 U RU 2008120195U RU 77465 U1 RU77465 U1 RU 77465U1
Authority
RU
Russia
Prior art keywords
module
output
addresses
synchronizing
input
Prior art date
Application number
RU2008120195/22U
Other languages
Russian (ru)
Inventor
Геннадий Семенович Осипов
Илья Александрович Тихомиров
Илья Владимирович Соченков
Original Assignee
Учреждение Российской академии наук Институт системного анализа РАН
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Учреждение Российской академии наук Институт системного анализа РАН filed Critical Учреждение Российской академии наук Институт системного анализа РАН
Priority to RU2008120195/22U priority Critical patent/RU77465U1/en
Application granted granted Critical
Publication of RU77465U1 publication Critical patent/RU77465U1/en

Links

Abstract

Полезная модель относится к вычислительной технике, в частности к системе динамической контентной фильтрации электронных документов, передаваемых по протоколу HTTP (HyperText Transfer Protocol).The utility model relates to computer technology, in particular to a system of dynamic content filtering of electronic documents transmitted via HTTP (HyperText Transfer Protocol).

Техническим результатом является повышение полноты и точности контентной фильтрации электронных документов.The technical result is to increase the completeness and accuracy of the content filtering of electronic documents.

Технический результат достигается тем, что система содержит модуль селекции опорных адресов сайтов в базе данных сервера, модуль идентификации адресов электронных документов в списке доступа, модуль идентификации временных циклов выборки адресов из списка доступа, модуль формирования сигналов управления выборкой записей базы данных сервера, модуль селекции доступа к электронным документам.The technical result is achieved by the fact that the system comprises a module for selecting reference addresses of sites in the server database, a module for identifying addresses of electronic documents in the access list, a module for identifying time cycles for selecting addresses from the access list, a module for generating signal control signals for selecting records in the server database, an access selection module to electronic documents.

Description

Полезная модель относится к вычислительной технике, в частности к системе динамической контентной фильтрации электронных документов, передаваемых по протоколу HTTP (HyperText Transfer Protocol).The utility model relates to computer technology, in particular to a system of dynamic content filtering of electronic documents transmitted via HTTP (HyperText Transfer Protocol).

Система реализует технологическое решение, основной задачей которого является управление доступом пользователей к ресурсам сети Интернет в зависимости от категории запрашиваемых электронных документов и принятой политики безопасности. Система проверяет электронные документы, запрашиваемые пользователями, на принадлежность к конкретной категории. В случае запрещенной категории доступ к электронному документу блокируется.The system implements a technological solution, the main task of which is to control user access to Internet resources, depending on the category of requested electronic documents and the adopted security policy. The system checks electronic documents requested by users for belonging to a specific category. In the case of a prohibited category, access to an electronic document is blocked.

Под электронным документом в сети Интернет подразумевается информационный объект, доступный в сети передачи данных, который может быть получен путем информационного сетевого обмена оконечного оборудования пользователя с сервером по протоколу HTTP и далее воспроизведен с помощью оконечного оборудования пользователя в печатном или ином виде.An electronic document on the Internet means an information object accessible on a data transmission network, which can be obtained by means of an information network exchange of a user's terminal equipment with a server via HTTP and then reproduced using a user's terminal equipment in printed or other form.

Каждый электронный документ в World Wide Web имеет URL (Uniform Resourse Locator) - адрес, который включает в себя тип ресурса и местонахождение файла на сервере.Each electronic document on the World Wide Web has a URL (Uniform Resourse Locator) - an address that includes the type of resource and the location of the file on the server.

Общий синтаксис таков:The general syntax is as follows:

scheme://host.domain[:port]/path/filename.scheme: //host.domain [: port] / path / filename.

Множество электронных документов, имеющих одинаковый корневой URL, образуют сайт, или ресурс.Many electronic documents having the same root URL form a site or resource.

Электронный документ в формате HTML принято называть электронным гипертекстовым документом (или просто гипертекстовым документом).An electronic document in HTML format is usually called an electronic hypertext document (or simply a hypertext document).

Известна система Microsoft Internet Security and Acceleration (ISA) Server [l], осуществляющая фильтрацию документов, передаваемых по высокоуровневым протоколам (в частности, HTTP). Microsoft Internet Security and Acceleration (ISA) Server проверяет на соответствие заданным условиям не только пакеты сетевого обмена (запрещает или разрешает протоколы целиком), но и содержимое документов.The well-known Microsoft Internet Security and Acceleration (ISA) Server [l] system, which filters documents transmitted over high-level protocols (in particular, HTTP). Microsoft Internet Security and Acceleration (ISA) Server checks for compliance with the given conditions not only the network exchange packets (prohibits or allows the entire protocols), but also the contents of the documents.

С помощью этой системы можно исследовать содержимое пакетов и принять решение о допустимости этого содержимого. ISA Server обеспечивает следующие методы фильтрации: по имени DNS или конкретному URL, по ключевым словам внутри электронных документов и по типу файла.Using this system, you can examine the contents of packages and decide on the validity of these contents. ISA Server provides the following filtering methods: by DNS name or specific URL, by keywords within electronic documents, and by file type.

Чтобы блокировать доступ к нежелательным электронным документам, необходимо задать набор URL, как часть правила брандмауэра внутри существующей конфигурации ISA Server.To block access to unwanted electronic documents, you must specify a set of URLs as part of a firewall rule within an existing ISA Server configuration.

Основное различие между стандартным правилом политики брандмауэра и правилом фильтрации - тип места назначения. Место назначения в правиле брандмауэра - сетевой объект (отдельный узел или группа IP-адресов).The main difference between the standard firewall policy rule and the filter rule is the type of destination. The destination in a firewall rule is a network entity (a single host or a group of IP addresses).

Принимая решение о создании фильтра, администратор определяет набор URL как место назначения (адреса, к которым не имеет права обращаться пользователь, содержимое которых является нежелательным) и задает политику запрета всего трафика.When deciding to create a filter, the administrator defines the set of URLs as the destination (addresses that the user does not have the right to access, the contents of which are undesirable) and sets a policy to prohibit all traffic.

Пример использования подобного правила представлен в следующей таблице:An example of using such a rule is presented in the following table:

ПолеField ЗначениеValue ПравилоThe rule ЗапретитьTo prohibit ПротоколProtocol НTTРHTTP ИсточникиSources Внутренняя сеть (диапазон адресов)Internal network (address range) Место назначенияDestination *.badsite.com* .badsite.com

В наборе правил назначаются специальные правила, блокирующие документы, получаемые по протоколу HTTP и HTTPS, содержащие нежелательную строку или ключевое слово. В этом случае, если ISA Server обнаружит такую строку в HTTP-ответе (в границах байтового диапазона) Web-сервера, страница будет блокирована.In the ruleset, special rules are assigned that block documents received via the HTTP and HTTPS protocols that contain an unwanted string or keyword. In this case, if ISA Server detects such a line in the HTTP response (within the byte range of the Web server), the page will be blocked.

Недостатками подобного технического решения по фильтрации ответных строк являются низкая полнота (невозможно судить о характере документа, анализируя лишь ограниченный байтовый диапазон) и точность (решение о характере документа принимается лишь по наличию отдельных слов).The disadvantages of such a technical solution for filtering response lines are low completeness (it is impossible to judge the nature of a document by analyzing only a limited byte range) and accuracy (a decision on the nature of a document is made only by the presence of individual words).

Другие технические решения поставленной задачи [2], известные как Cobian Orange Filter компании Deerfield.com и EngageIP Content Filter фирмы LogiSense, предназначены исключительно для работы с информацией, доставляемой по каналам HTTP, и обеспечивают фильтрацию с использованием дополнительных протоколов.Other technical solutions to the task [2], known as Cobian Orange Filter by Deerfield.com and EngiIPIP Content Filter by LogiSense, are designed exclusively for working with information delivered via HTTP channels and provide filtering using additional protocols.

Списки разграничения доступа формируются статически. Полные списки и возможность правильно классифицировать URL - обязательный атрибут эффективной системы фильтрации Web-контента.Lists of access control are formed statically. Complete lists and the ability to correctly classify URLs are an essential attribute of an effective Web content filtering system.

Известны системы, которые могут быть использованы для решения поставленной задачи (3, 4).Known systems that can be used to solve the problem (3, 4).

Первая из известных систем содержит блоки приема и хранения данных, соединенные с блоками управления и обработки данных, блоки поиска и селекции, подключенные к блокам хранения данных и отображения, синхронизирующие входы которых соединены с выходами блока управления (3).The first of the known systems contains data reception and storage units connected to control and data processing units, search and selection units connected to data storage and display units, the synchronizing inputs of which are connected to the outputs of the control unit (3).

Существенный недостаток данной системы состоит в невозможности решения задачи обновления списка данных, хранимых в памяти в виде адресов соответствующих документов одновременно с решением задачи выдачи содержания этих документов пользователям в реальном масштабе времени.A significant drawback of this system is the impossibility of solving the problem of updating the list of data stored in memory in the form of addresses of relevant documents at the same time as solving the problem of delivering the contents of these documents to users in real time.

Известна и другая система, содержащая блоки обработки данных, информационные входы которых соединены с блоками приема данных и управления, а выходы подключены к первой группе блоков памяти, центральный процессор, входы которого соединены с выходами блоков памяти первой группы и блоков обработки данных, а выходы соединены с входами блоков памяти второй группы и блоков отображения данных (4).Another system is known that contains data processing units, the information inputs of which are connected to the data reception and control units, and the outputs are connected to the first group of memory units, the central processor, the inputs of which are connected to the outputs of the memory units of the first group and data processing units, and the outputs are connected with the inputs of the memory blocks of the second group and data display blocks (4).

Последнее из перечисленных выше технических решений наиболее близко к описываемому.The last of the above technical solutions is closest to the described.

Его недостаток заключается в невысоком быстродействии системы, обусловленном тем, что выполнение процедуры фильтрации данных реализуется через поиск данных по всей базе данных и их последующей обработке центральным процессором, что неизбежно приводит к необоснованным затратам времени.Its disadvantage lies in the low speed of the system, due to the fact that the data filtering procedure is implemented by searching for data across the entire database and their subsequent processing by the central processor, which inevitably leads to unreasonable waste of time.

Цель изобретения - повышение полноты и точности контентной фильтрации электронных документов путем динамической актуализации статичных списков доступа, содержащих идентификаторы адресов запрашиваемых электронных документов.The purpose of the invention is to increase the completeness and accuracy of the content filtering of electronic documents by dynamically updating static access lists containing the address identifiers of the requested electronic documents.

Поставленная цель достигается путем того, что в известную систему, содержащую модуль селекции опорных адресов сайтов в базе данных сервера, информационный и синхронизирующий входы которого являются первыми информационным и синхронизирующим входами системы соответственно, при этом первый информационный вход системы предназначен для приема запросов электронных документов по их сетевым адресам, первый синхронизирующий вход системы предназначен для приема сигналов занесения кодов запросов электронных документов в модуль селекции опорных адресов сайтов в базе данных сервера, а первый информационный выход модуля селекции опорных адресов сайтов в базе данных сервера предназначен для выдачи запросов электронных документов по их сетевым адресам на первый информационный вход сервера базы данных, модуль идентификации адресов электронных документов в списке доступа, один информационный и синхронизирующий входы которого являются вторыми информационным и синхронизирующим входами системы соответственно, при этом второй информационный вход системы предназначен для приема записей базы данных сервера, а второй синхронизирующий вход системы предназначен для приема сигналов занесения записей базы данных сервера в модуль идентификации адресов электронных документов в списке доступа, модуль формирования сигналов управления выборкой записей базы данных сервера, первый информационный вход которого соединен со вторым информационным выходом модуля селекции опорных адресов сайтов в базе данных сервера, синхронизирующий модуль формирования сигналов управления выборкой записей базы данных сервера подключен к синхронизирующему выходу модуля селекции опорных адресов сайтов в базе данных сервера, адресный выход модуля формирования сигналов управления выборкой записей базы данных сервера является адресным выходом системы, предназначенным для выдачи адресов записей базы данных на адресный вход сервера базы данных, а синхронизирующий выход модуля формирования сигналов управления выборкой записей базы данных сервера является первым синхронизирующим выходом системы, предназначенными для выдачи сигналов управления на вход первого канала прерывания сервера базы данных, введены модуль идентификации временных циклов выборки адресов из списка доступа, информационный вход которого соединен с третьим информационным выходом выходу модуля селекции опорных адресов сайтов в базе данных сервера, синхронизирующий вход модуля идентификации временных циклов выборки адресов из списка доступа подключен к синхронизирующему выходу модуля селекции опорных адресов сайтов в базе данных сервера, а счетный вход модуля идентификации временных циклов выборки адресов из списка доступа соединен с тактирующим выходом модуля идентификации адресов электронных документов в списке доступа, при этом один выход модуля идентификации временных циклов выборки адресов из списка доступа подключен к счетному входу модуля формирования сигналов управления выборкой записей базы данных сервера, а другой выход модуля идентификации временных циклов выборки адресов из списка доступа является вторым синхронизирующим выходом системы, предназначенным для выдачи сигналов управления на вход второго канала прерывания сервера базы данных, и модуль селекции доступа к электронным документам, один информационный вход которого соединен с первым выходом модуля селекции опорных адресов сайтов в базе данных сервера, другой информационный вход модуля селекции доступа к электронным документам подключен к информационному выходу модуля идентификации адресов электронных документов в списке доступа, а синхронизирующий вход модуля селекции доступа к электронным документам соединен с синхронизирующим выходом модуля идентификации адресов электронных документов в списке доступа, при этом информационный выход модуля селекции доступа к электронным документам является вторым информационным выходом системы, предназначенным для выдачи кодов электронных адресов документов в сеть Интернет, синхронизирующий выход модуля селекции доступа к электронным документам является третьим синхронизирующим выходом системы, предназначенным для выдачи синхронизирующих сигналов передачи кодов электронных адресов документов в сеть Интернет, а сигнальный выход модуля селекции доступа к электронным документам является сигнальным выходом системы, предназначенным для выдачи сигнала запрета допуска к электронным документам сети.This goal is achieved by the fact that in a known system containing a module for selecting reference addresses of sites in the server database, the information and synchronization inputs of which are the first information and synchronization inputs of the system, respectively, while the first information input of the system is designed to receive requests for electronic documents from them network addresses, the first synchronizing input of the system is intended for receiving signals of entering codes of requests for electronic documents into the selection module site addresses in the server database, and the first information output of the site reference addresses selection module in the server database is intended to issue requests for electronic documents at their network addresses to the first information input of the database server, the module for identifying addresses of electronic documents in the access list, one information and the synchronizing inputs of which are the second information and synchronizing inputs of the system, respectively, while the second information input of the system is designed to receive and server database records, and the second synchronizing input of the system is designed to receive signals for entering server database records in the identification module of electronic document addresses in the access list, a signal generation module for controlling the selection of server database records, the first information input of which is connected to the second information output of the module selection of reference addresses of sites in the server database, a synchronization module for generating signals to control the selection of server database records is connected to the synchronizing output of the module for selecting the reference addresses of sites in the server database, the address output of the module for generating control signals for selecting records of the server database is the address output of the system intended for issuing the addresses of database records to the address input of the database server, and the synchronizing output of the module for generating control signals the selection of server database records is the first synchronizing system output intended for issuing control signals to the input of the first channel the database server, an identification module for the time cycles of selecting addresses from the access list was introduced, the information input of which is connected to the third information output for the module for selecting the reference addresses of sites in the server database, the synchronizing input of the module for identifying the time cycles of selecting addresses from the access list is connected to the synchronizing output the module for selecting reference addresses of sites in the server database, and the counting input of the module for identifying time cycles for selecting addresses from the access list of the connection it is connected with the clocking output of the module for identifying addresses of electronic documents in the access list, while one output of the module for identifying time cycles for selecting addresses from the access list is connected to the counting input of the module for generating signals for controlling the selection of records in the server database, and another output for the module for identifying time cycles for selecting the database from access list is the second synchronizing output of the system, designed to issue control signals to the input of the second channel of the database server interrupt, and mod For selection of access to electronic documents, one information input of which is connected to the first output of the module for selecting reference addresses of sites in the server database, another information input of the module of selection of access to electronic documents is connected to the information output of the module for identifying addresses of electronic documents in the access list, and the synchronization input the module for selecting access to electronic documents is connected to the synchronizing output of the module for identifying addresses of electronic documents in the access list, when m the information output of the selection module for access to electronic documents is the second information output of the system, intended for issuing codes of electronic addresses of documents on the Internet, the synchronizing output of the module for selecting access to electronic documents is the third synchronizing output of the system, for issuing synchronizing signals for transmitting codes of electronic addresses of documents to the Internet, and the signal output of the module for selecting access to electronic documents is a signal output the house of the system, designed to issue a signal prohibiting access to electronic documents of the network.

Сущность изобретения поясняется чертежами, где на фиг.1 представлена структурная схема системы, на фиг.2 - структурная схема модуля селекции опорных адресов сайтов в базе данных сервера, на фиг.3 - структурная схема модуля идентификации адресов электронных документов в списке доступа, на фиг.4 - структурная схема модуля идентификации временных циклов выборки адресов из списка доступа, на фиг.5 - структурная схема модуля формирования сигналов управления выборкой записей базы данных сервера, на фиг.6 - структурная схема модуля селекции доступа к электронным документам, на фиг.7 представлена диаграмма потоков данных в системе, а на фиг.8 представлен алгоритм работы системы.The invention is illustrated by drawings, where Fig. 1 is a structural diagram of a system, Fig. 2 is a structural diagram of a module for selecting reference addresses of sites in a server database, Fig. 3 is a structural diagram of a module for identifying addresses of electronic documents in an access list, in Fig. .4 is a block diagram of a module for identifying time cycles of accessing addresses from an access list, FIG. 5 is a block diagram of a module for generating control signals for fetching records of a server database, and FIG. 6 is a block diagram of an access selection module electronic documents 7 is a diagram of data flow in the system, and Figure 8 is a flowchart of the system.

Система (фиг.1) содержит модуль 1 селекции опорных адресов сайтов в базе данных сервера, модуль 2 идентификации адресов электронных документов в списке доступа, модуль 3 идентификации временных циклов выборки адресов из списка доступа, модуль 4 формирования сигналов управления выборкой записей базы данных сервера, модуль 5 селекции доступа к электронным документам.The system (Fig. 1) comprises a module 1 for selecting reference addresses of sites in the server database, a module 2 for identifying addresses of electronic documents in the access list, a module 3 for identifying time cycles for selecting addresses from the access list, a module 4 for generating signals for controlling the selection of server database records, module 5 selection of access to electronic documents.

На фиг.1 также показаны первый 10 и второй 11 информационные входы системы, первый 12 и второй 13 синхронизирующие входы системы, первый 15 и второй 16 информационные выходы системы, адресный 17 выход системы, первый 18, второй 19 и третий 20 синхронизирующие выходы системы, и сигнальный 21 выход системы.1 also shows the first 10 and second 11 information inputs of the system, the first 12 and second 13 synchronizing inputs of the system, the first 15 and second 16 information outputs of the system, address 17 system output, the first 18, second 19 and third 20 synchronizing outputs of the system, and signal 21 system output.

Модуль 1 (фиг.2) селекции опорных адресов сайтов в базе данных сервера содержит регистр 25, дешифратор 26, узел памяти 27, выполненный в виде постоянного запоминающего устройства, элементы 28-30 И, и элементы 31, 32 задержки. На чертеже также показаны информационный 10 и синхронизирующий 12 входы, а также первый 36, второй 37, третий 38 и четвертый 39 информационные и синхронизирующий 40 выходы.Module 1 (figure 2) selection of reference addresses of sites in the server database contains a register 25, a decoder 26, a memory node 27 made in the form of read-only memory, elements 28-30 And, and elements 31, 32 delay. The drawing also shows information 10 and synchronizing 12 inputs, as well as the first 36, second 37, third 38 and fourth 39 information and synchronizing 40 outputs.

Модуль 2 (фиг.3) идентификации адресов электронных документов в списке доступа содержит регистр 45, компаратор 46, элемент 47 задержки. На чертеже показаны первый 48 и второй 49 информационные и синхронизирующий 50 входы,. а также информационный 51, тактирующий 52 и синхронизирующий 53 выходы.Module 2 (figure 3) identifying the addresses of electronic documents in the access list contains a register 45, a comparator 46, a delay element 47. The drawing shows the first 48 and second 49 information and synchronizing 50 inputs. as well as information 51, clocking 52 and synchronizing 53 outputs.

Модуль 3 (фиг.4) идентификации временных циклов выборки адресов из списка доступа содержит регистр 55, счетчик 56, компаратор 57, элементы 58, 59 задержки.Module 3 (Fig. 4) for identifying time cycles for accessing addresses from an access list contains a register 55, a counter 56, a comparator 57, delay elements 58, 59.

На чертеже показаны информационный 60, синхронизирующий 61 и счетный 62 входы, а также первый 63 и второй 64 выходы.The drawing shows information 60, synchronizing 61 and counting 62 inputs, as well as the first 63 and second 64 outputs.

Модуль 4 (фиг 5) формирования сигналов управления выборкой записей базы данных сервера содержит счетчик 65, элемент 66 ИЛИ, элемент 67 задержки. На чертеже показаны информационный 68, синхронизирующий 69 и счетный 70 входы, а также адресный 17 и синхронизирующий 18 выходы.Module 4 (FIG. 5) of generating control signals for selecting records of the server database contains a counter 65, an OR element 66, a delay element 67. The drawing shows information 68, synchronizing 69 and counting 70 inputs, as well as address 17 and synchronizing 18 outputs.

Модуль 5 (фиг.6) селекции доступа к электронным документам содержит дешифратор 75, триггеры 76, 77, элементы 78, 79 И, группа 80 элементов И, элемент 91 задержки. На чертеже показаны первый 84 и второй 85 информационные, и синхронизирующий 86 входы, а также информационный 16, синхронизирующий 20 и сигнальный 21 выходы системы.Module 5 (Fig.6) selection of access to electronic documents contains a decoder 75, triggers 76, 77, elements 78, 79 And, a group of 80 And elements, element 91 delay. The drawing shows the first 84 and second 85 information, and synchronizing 86 inputs, as well as information 16, synchronizing 20 and signal 21 system outputs.

Работа системы основана на использовании автоматического классификатора электронных документов для определения тематики документов.The system is based on the use of an automatic classifier of electronic documents to determine the subject of documents.

В данном случае под классификацией электронного документа понимается следующая последовательность действий (фиг 7):In this case, the classification of an electronic document means the following sequence of actions (Fig. 7):

- преобразование гипертекстового представления к специальному формату данных: отделение текста естественного языка от служебной HTML-разметки;- Transformation of the hypertext representation to a special data format: separation of the text of the natural language from the service HTML markup;

- анализ выделенного текста естественного языка с целью выделения значимых фрагментов; учет веса их вхождений в тексте для построения модели представления текста документа;- analysis of the selected text of the natural language in order to highlight significant fragments; accounting for the weight of their occurrences in the text to build a model for representing the text of the document;

- сравнение построенной модели представления текста с моделями заранее предопределенных классов документов, содержащими отличительные признаки и их значения, характеризующие тематику этих классов;- Comparison of the constructed model for presenting the text with models of predefined classes of documents containing distinctive features and their meanings characterizing the subject of these classes;

- принятие решения на основе проведенного сравнения об отнесении документа к одному или нескольким классам, при этом принятие решения о блокировании передачи HTTP-запроса пользователя к серверу в случае, когда тематика запрошенного электронного документа определена как нежелательная.- making a decision on the basis of a comparison on assigning a document to one or more classes, while making a decision on blocking the transmission of an HTTP request from a user to the server when the subject of the requested electronic document is defined as undesirable.

Общий алгоритм работы системы приведен на фиг.8 и заключается в выполнении следующей последовательности операций:The general algorithm of the system is shown in Fig. 8 and consists in performing the following sequence of operations:

- на вход 10 системы поступает запрос на доступ к электронному документу по его URL (шаги 1 и 2 диаграммы потоков данных);- input 10 of the system receives a request for access to the electronic document at its URL (steps 1 and 2 of the data flow diagram);

- проводится проверка сведений о документе в списке доступа (шаг 3). Если в списке доступа присутствует запись о классе непосредственно запрашиваемого URL, то результатом будет разрешение или запрет доступа, если класс документа - допустимый или нежелательный соответственно (шаг 4). Если в списке доступа отсутствуют сведения непосредственно о запрашиваемом URL, но при этом ресурс, к которому относится документ, помечен как нежелательный, то в результате производится запрет доступа к документу.- the information on the document in the access list is checked (step 3). If the access list contains an entry about the class of the directly requested URL, then the result will be permission or deny access, if the document class is valid or undesirable, respectively (step 4). If the access list does not contain information directly about the requested URL, but the resource to which the document belongs is marked as undesirable, then access to the document is denied.

Следующие шаги выполняются только в случае, когда в списке доступа отсутствуют сведения о документе и о ресурсе, к которому принадлежит документ.The following steps are performed only when the access list does not contain information about the document and about the resource to which the document belongs.

- запускается механизм автоматической классификации: для этого в интерфейс получения электронных документов передается URL классифицируемого документа (шаг 5). Интерфейс получения электронных документов предоставляется внешней вызывающей программой или реализуется непосредственно как функция подсистемы автоматической классификации;- the automatic classification mechanism starts: for this, the URL of the classified document is transmitted to the interface for receiving electronic documents (step 5). The interface for receiving electronic documents is provided by an external calling program or is implemented directly as a function of the automatic classification subsystem;

- гипертекстовое представление и URL документа передаются далее для проведения непосредственно классификации документа (шаг 6);- the hypertext representation and URL of the document are transmitted further to directly classify the document (step 6);

- после определения класса документа через интерфейс фильтрации возвращается разрешение/запрет на доступ в соответствии с определенным классом (шаг 7), а также производится помещение информации в список доступа (шаг 8);- after determining the class of the document, the permission / prohibition of access in accordance with the specified class is returned through the filtering interface (step 7), and information is also placed in the access list (step 8);

- дополнительно запускается механизм классификации ресурса, к которому относится документ (шаг 9). Для проведения процедуры классификации ресурса производится запрос сведений обо всех известных документах, относящихся к ресурсу (шаги 10, 11). Результат классификации ресурса также помещается в список доступа (шаг 12).- additionally, the classification mechanism of the resource to which the document belongs is activated (step 9). To carry out the resource classification procedure, a request is made for information about all known documents related to the resource (steps 10, 11). The result of the resource classification is also placed in the access list (step 12).

Классификация ресурса производится по следующему правилу: ресурс является нежелательным тогда и только тогда, когда доля документов, относящихся к этому ресурсу и классифицированных как нежелательные, превышает пороговую величину А, которая определяется на этапе настройки системы. В остальных случаях ресурс считается допустимым.A resource is classified according to the following rule: a resource is undesirable if and only if the proportion of documents related to this resource and classified as undesirable exceeds the threshold value A, which is determined at the stage of system setup. In other cases, the resource is considered valid.

Таким образом, система реализует следующие процедуры:Thus, the system implements the following procedures:

- в список доступа помещаются именно те документы и ресурсы, доступ к которым осуществляет пользователь;- the documents and resources accessed by the user are placed on the access list;

- однажды классифицированные документы не подвергаются повторной классификации при последующих обращениях пользователя.- Once classified documents are not re-classified upon subsequent user requests.

Идентификатор электронного документа представляет собой следующую структуру:The identifier of an electronic document is the following structure:

ПолеField ТипType of ЗначениеValue siteIDsiteID Целое числоInteger СRС32-хэш, вычисленный от части строки URL, задающей адрес ресурса (сайта)CRC32 hash calculated from the part of the URL string defining the resource (site) address pathIDpathID Целое числоInteger СRС32-хэш, вычисленный от части строки URL, задающей путь к документу относительно адреса ресурса (сайта)CRC32 hash calculated from the part of the URL string defining the path to the document relative to the address of the resource (site)

Идентификатор ресурса аналогичен идентификатору электронного документа, но второе поле pathID имеет всегда нулевое значение.The resource identifier is similar to the identifier of the electronic document, but the second field pathID is always zero.

Проиллюстрируем этот факт на следующем примере: пусть URL-адрес документа - http://www.site.com/foo/bar/doc.html.We illustrate this fact with the following example: let the document URL be http://www.site.com/foo/bar/doc.html.

Тогда siteID=CRC32(http://www.site.com)Then siteID = CRC32 (http://www.site.com)

pathID=CRC32(foo/bar/doc.html),pathID = CRC32 (foo / bar / doc.html),

и идентификатор электронного документа - есть пара (siteID, pathID), а идентификатор соответственного ресурса, к которому принадлежит документ - (siteID, 0).and the identifier of the electronic document is a pair (siteID, pathID), and the identifier of the corresponding resource to which the document belongs is (siteID, 0).

Структура данных, характеризующая тематическую принадлежность документа, выглядит следующим образом:The data structure characterizing the thematic affiliation of the document is as follows:

ПолеField ТипType of ЗначениеValue IDID пара (siteID, pathID)pair (siteID, pathID) Идентификатор документаDocument id categorycategory перечислениеtransfer Допустимый, нежелательный, неопределенный - в зависимости от результата классификацииPermissible, undesirable, indefinite - depending on the classification result

Для доступа к соответствующим электронным документам на вход 10 системы поступает идентификатор электронного документа в виде кодограммы, имеющий следующую структуру данных:To access the relevant electronic documents at the input 10 of the system receives the identifier of the electronic document in the form of a codogram having the following data structure:

КодThe code КодThe code siteIDsiteID pathIDpathID

Данная кодограмма с входа 10 системы поступает на информационный вход модуля 1 и далее на информационный вход регистра 25, в который указанные коды заносятся синхронизирующим импульсом с входа 12.This codogram from the input 10 of the system is fed to the information input of module 1 and then to the information input of register 25, into which the indicated codes are entered by a synchronizing pulse from input 12.

С выхода 33 регистра 25 вся кодовая комбинация через выход 36 модуля 1 выдается на как выход 15 системы и далее на информационный вход сервера базы данных допуска, так и на вход 85 модуля 5.From the output 33 of register 25, the entire code combination through the output 36 of module 1 is output to both the output 15 of the system and then to the information input of the admission database server, and to the input 85 of module 5.

С выхода 34 регистра 25 модуля 1 код siteID поступает на информационный вход дешифратора 26, который расшифровывает поступивший код и подготавливает цепь прохождения сигнала с входа 12, открывая один из элементов 28-30 И. Для определенности положим, что высокий потенциал поступил на один вход элемента 30 И.From the output 34 of register 25 of module 1, the siteID code is fed to the information input of the decoder 26, which decrypts the incoming code and prepares the signal path from input 12, opening one of the elements 28-30 I. For definiteness, we assume that a high potential is received at one input of the element 30 I.

Параллельно с этим, синхронизирующий импульс с входа 12 системы задерживается элементом 31 модуля 1 на время срабатывания регистра 25 и дешифратора 26 и далее опрашивает состояние элементов 28-30 И.In parallel with this, the synchronizing pulse from the input 12 of the system is delayed by the element 31 of the module 1 for the duration of the operation of the register 25 and the decoder 26 and then polls the state of the elements 28-30 I.

Учитывая то обстоятельство, что открытым по одному входу будет только элемент 30 И, то пройдя этот элемент И, синхроимпульс поступает, во-первых, на вход считывания соответствующей фиксированной ячейки памяти постоянного запоминающего устройства 27, где хранятся коды опорных адресов разделов памяти сервера базы данных, содержащих данные сайтов siteID.Given the fact that only 30 AND element will be open on one input, then passing through this And element, the clock pulse arrives, first, at the read input of the corresponding fixed memory cell of the permanent storage device 27, where the reference address codes of the database server memory partitions are stored containing siteID site data.

Структура кода данных сайтов siteID имеет следующий вид:The structure of the siteID site data code is as follows:

КодThe code КодThe code опорного адреса первой записи данногоreference address of the first record of this общего количества записей данных адресов в разделе базы данныхtotal number of address data records in the database partition siteIDsiteID siteIDsiteID

Код опорного адреса первой записи данного siteID считывается из памяти блока 27 и через выход 37 модуля 1 поступает на вход 68 модуля 4 и далее на информационный вход счетчика 65, а код общего количества записей данных адресов в разделе базы данных SiteID с выхода 38 модуля 1 поступает на информационный вход 60 модуля 3 и далее на информационный вход регистра 55.The code of the reference address of the first record of this siteID is read from the memory of block 27 and through the output 37 of module 1 goes to the input 68 of module 4 and then to the information input of the counter 65, and the code of the total number of records of address data in the section of the SiteID database from the output 38 of module 1 is received to the information input 60 of module 3 and then to the information input of the register 55.

Одновременно с этим, тот же импульс считывания с выхода элемента 31 задерживается элементом 32 задержки на время считывания содержимого фиксированной ячейки ПЗУ 27 и затем с выхода 40 модуля 1 поступает как на синхронизирующий вход 61 модуля 3, так и на синхронизирующий вход 69 модуля 4.At the same time, the same read pulse from the output of element 31 is delayed by the delay element 32 for the duration of reading the contents of the fixed cell of the ROM 27 and then from the output 40 of module 1 is supplied to both the synchronizing input 61 of module 3 and the synchronizing input 69 of module 4.

Код с входа 68 модуля 4 синхронизирующим импульсом с входа 69 заносится в счетчик 65, с выхода которого этот код поступает на адресный выход 17 системы.The code from input 68 of module 4 by a synchronizing pulse from input 69 is entered into the counter 65, from the output of which this code is sent to the address output 17 of the system.

Одновременно, этот же синхронизирующий импульс проходит через элемент 66 ИЛИ и задерживается на время занесения кода опорного адреса в счетчик 65 элементом 67. Затем данный импульс выдается на выход 18 системы в качестве сигнала управления считыванием содержимого ячейки памяти базы данных сервера по адресу, указанному на выходе 17 системы.At the same time, the same synchronizing pulse passes through the OR element 66 and is delayed by entering the reference address code into the counter 65 by the element 67. Then this pulse is output to the system output 18 as a control signal for reading the contents of the server database memory cell to the address indicated at the output 17 systems.

Код же общего количества записей данных адресов в разделе базы данных siteID с выхода 38 модуля 1 заносится через вход 60 модуля 3 в регистр 55 тем же синхронизирующим импульсом с выхода 40 модуля 1 через вход 61 модуля 3. С выхода регистра 55 этот код подается на один вход компаратора 57.The code of the total number of address data records in the siteID database section from the output 38 of module 1 is entered through the input 60 of module 3 into register 55 with the same clock pulse from the output 40 of module 1 through the input 61 of module 3. From the output of register 55 this code is sent to one comparator input 57.

По сигналу с выхода 18 системы сервер базы данных (на чертеже не показан) переходит на подпрограмму считывания содержимого ячейки базы данных по указанному на выходе 17 адресу, выдачи считанной записи базы данных на информационный 11 вход системы и занесения ее атрибутов в модуль 2 синхронизирующим импульсом, поступающим с сервера на вход 13 системы.Based on a signal from system output 18, the database server (not shown) goes to the subroutine for reading the contents of the database cell at the address indicated on output 17, issuing the read database record to the system’s information 11 input and entering its attributes into module 2 with a synchronizing pulse, coming from the server to the input 13 of the system.

В результате этого с входа 49 в регистр 45 синхронизирующим импульсом с входа 50 будут занесены атрибуты первой считанной из базы данных записи, имеющие следующую структуру:As a result of this, from the entrance 49 to the register 45, the synchronizing pulse from the input 50 will be entered the attributes of the first record read from the database, having the following structure:

КодThe code КодThe code Код признака доступаAccess Tag Code - либо разрешения доступа к электронному документу с данным адресом;- or permission to access an electronic document with a given address; siteIDsiteID pathIDpathID - либо запрещения доступа к электронному документу с данным адресом- or deny access to an electronic document with a given address

Код pathID из первой считанной записи из базы данных с первого выхода регистра 45 поступает на один вход компаратора 46, на другой информационный вход которого с выхода 39 модуля 1 поступает код pathID запрашиваемого электронного документа.The pathID code from the first read record from the database from the first output of the register 45 goes to one input of the comparator 46, the other information input of which from the output 39 of module 1 receives the pathID code of the requested electronic document.

Синхронизирующий импульс с входа 13 системы задерживается элементом 47 задержки на время занесения записи базы данных в регистр 45 модуля 2 и поступает на синхронизирующий вход компаратора 46.The synchronizing pulse from the input 13 of the system is delayed by the delay element 47 for the duration of recording the database record in the register 45 of module 2 and is supplied to the synchronizing input of the comparator 46.

По синхронизирующему сигналу компаратор 46 сравнивает входные коды, и если сравниваемые атрибуты pathID не совпадают между собой, то на выходе 52 модуля 2 формируется сигнал, поступающий на вход 62 модуля 3 и далее на счетный вход счетчика 56, фиксирующего число записей, считанных из базы данных сервера.The comparator 46 compares the input codes by the synchronization signal, and if the pathID attributes being compared do not coincide, then the output 52 of module 2 generates a signal that goes to the input 62 of module 3 and then to the counting input of the counter 56, fixing the number of records read from the database server.

К данному моменту времени счетчик 56 зафиксирует факт осуществления считывания первой записи из базы данных сервера. Выход счетчика 56 подключен к одному входу компаратора 57, сравнивающего общее число записей данного сайта в базе данных сервера, хранящегося в регистре 55 с числом записей в счетчике 56.At this point in time, the counter 56 will record the fact of reading the first record from the server database. The output of the counter 56 is connected to one input of the comparator 57, comparing the total number of records of this site in the server database stored in the register 55 with the number of records in the counter 56.

Компаратор 57 модуля 3 сравнивает показания регистра 55 и счетчика 56 по синхронизирующему импульсу, поступающему на синхронизирующий вход компаратора 67 с выхода элемента 58 задержки.The comparator 57 of module 3 compares the readings of the register 55 and the counter 56 by the clock pulse supplied to the clock input of the comparator 67 from the output of the delay element 58.

Поскольку в счетчике 56 зафиксирована первая единица, то его показания будут меньше показаний регистра 55 и на выходе 63 модуля 3 появляется импульс, который через вход 70 модуля 4 будет поступать на счетный вход счетчика 65, увеличивая базовый адрес ячейки считывания на единицу.Since the first unit is fixed in the counter 56, its readings will be less than the readings of the register 55 and a pulse appears at the output of the module 3 63, which through the input 70 of the module 4 will go to the counting input of the counter 65, increasing the base address of the read cell by one.

Кроме того, этот же импульс проходит через элемент 66 ИЛИ на вход элемента 67 задержки, где задерживается на время окончания срабатывания счетчика 65, и далее вновь выдается через выход 18 системы в качестве сигнала управления считыванием очередной записи базы данных по адресу, сформированному на выходе 17 системы.In addition, the same pulse passes through the OR element 66 to the input of the delay element 67, where it is delayed by the end time of the counter 65, and then again issued through the system output 18 as a control signal for reading the next database record at the address generated at the output 17 system.

По сигналу с выхода 18 системы сервер базы данных вновь переходит на подпрограмму считывания содержимого ячейки базы данных по указанному на выходе 17 адресу, выдачи считанной записи базы данных на информационный вход 11 системы и занесения ее атрибутов в регистр 45 модуля 2 синхронизирующим импульсом, поступающим с сервера на вход 13.Based on a signal from system output 18, the database server again switches to the subroutine for reading the contents of the database cell at the address specified on output 17, issuing the read database record to the system information input 11 and entering its attributes into register 45 of module 2 with a synchronizing pulse from the server at the entrance 13.

Этот процесс считывания записей базы данных сервера будет продолжаться до тех пор, пока показания счетчика 56 и регистра 55 не сравняются между собой, что будет свидетельствовать о том, что запрашиваемого адреса электронного документа в базе данных сервера нет. В этом случае импульс формируется на выходе 64 модуля 3 и через выход 19 системы поступает на вход второго канала прерывания сервера базы данных.This process of reading server database records will continue until the readings of counter 56 and register 55 are equal, which will indicate that there is no requested electronic document address in the server database. In this case, the pulse is generated at the output 64 of the module 3 and through the output 19 of the system is fed to the input of the second channel of the database server interrupt.

С приходом этого сигнала сервер переходит на подпрограмму автоматической классификации запрашиваемого идентификатора электронного документа, в соответствии с которой данные идентификатора электронного документа с выхода 15 системы поступают в сервер базы данных, где осуществляется следующая последовательность операций:With the arrival of this signal, the server switches to a subroutine for automatic classification of the requested identifier of the electronic document, in accordance with which the data of the identifier of the electronic document from the output 15 of the system goes to the database server, where the following sequence of operations is performed:

- преобразование гипертекстового представления к специальному формату данных: отделение текста естественного языка от служебной HTML-разметки;- Transformation of the hypertext representation to a special data format: separation of the text of the natural language from the service HTML markup;

- анализ выделенного текста естественного языка с целью выделения значимых фрагментов; учет веса их вхождений в тексте для построения модели представления текста документа;- analysis of the selected text of the natural language in order to highlight significant fragments; accounting for the weight of their occurrences in the text to build a model for representing the text of the document;

- сравнение построенной модели представления текста с моделями заранее предопределенных классов документов, содержащими отличительные признаки и их значения, характеризующие тематику этих классов;- Comparison of the constructed model for presenting the text with models of predefined classes of documents containing distinctive features and their meanings characterizing the subject of these classes;

- принятие решения на основе проведенного сравнения об отнесении документа к одному или нескольким классам, при этом принятие решения о блокировании передачи HTTP-запроса пользователя к серверу в случае, когда тематика запрошенного электронного документа определена как нежелательная, как это показано на фиг.8.- making a decision on the basis of a comparison about assigning a document to one or more classes, while making a decision to block the transmission of an HTTP request from a user to the server when the subject of the requested electronic document is defined as undesirable, as shown in Fig. 8.

Если же сравниваемые атрибуты pathID на входах компаратора 46 модуля 2 совпадают между собой, то на выходе 53 модуля 2 формируется сигнал, поступающий на вход 86 модуля 5 и далее на одни входы элементов 78, 79 И, управляемые дешифратором 75, на вход 84 которого с выхода 51 модуля 2 поступает код признака доступа к данному электронному документу.If the compared pathID attributes at the inputs of the comparator 46 of module 2 coincide, then the output 53 of module 2 generates a signal fed to the input 86 of module 5 and then to one of the inputs of elements 78, 79 I, controlled by a decoder 75, to the input 84 of which output 51 of module 2 receives a code sign of access to this electronic document.

Дешифратор 75 расшифровывает код признака доступа, и если доступ к данному электронному документу разрешен, то дешифратор 75 открывает по второму входу элемент 78 И, через который проходит импульс с входа 86 и поступает как на прямой вход триггера 76, устанавливая его в единичное состояние, так и на обратный вход триггера 77, подтверждая его исходное состояние.The decoder 75 decodes the code of the access flag, and if access to this electronic document is allowed, then the decoder 75 opens the And element 78 through the second input, through which the pulse from the input 86 passes and acts as a direct input to the trigger 76, setting it to a single state, so and on the reverse input of the trigger 77, confirming its initial state.

Переходя в единичное состояние, триггер 76 с прямого выхода высоким потенциалом открывает по одному входу элементы 80 И группы, на другой вход 85 которых с выхода 36 модуля 1 поступает идентификатор электронного документа, который через элементы 80 И группы выдаются на выход 16 системы.Turning to a single state, a flip-flop 76 with a direct output with high potential opens elements 80 And groups one input, to the other input 85 of which the output of module 36 receives the identifier of an electronic document, which through elements 80 And groups is output to system output 16.

Кроме того, синхронизирующий импульс с выхода элемента 78 И задерживается элементом 81 на время срабатывания триггера 76 и подключения элементов 80 И группы и с выхода 20 системы выдается в качестве синхронизирующего сигнала выдачи электронного идентификатора электронного документа.In addition, the synchronizing pulse from the output of the And element 78 is delayed by the element 81 for the duration of the trigger 76 and the connection of the And elements of the group 80 and from the system output 20 is issued as a synchronization signal issuing an electronic identifier of an electronic document.

Если же на входе дешифратора 75 будет зафиксирован код признака запрета доступа к адресу данного электронного документа, то открыт по второму входу будет элемент 79 И, через который синхронизирующий импульс с входа 86 установит триггер 77 в единичное состояние, а триггер 76 будет установлен в исходное состояние, при котором низким потенциалом с прямого выхода триггера 76 элементы 80 И группы будут закрыты, блокируя тем самым доступ к электронному документу.If, at the input of the decoder 75, a sign indicating the prohibition of access to the address of this electronic document is recorded, then element 79 And will be open at the second input, through which the synchronizing pulse from input 86 will set trigger 77 to a single state, and trigger 76 will be set to its original state at which the low potential from the direct output of the trigger 76 elements 80 And groups will be closed, thereby blocking access to the electronic document.

Высокий потенциал с прямого выхода триггера 77 выдается на выход 21 системы в качестве сигнала запрета доступа к данному электронному документу. Таким образом, система осуществляет блокировку электронных документов, которые либо принадлежат к нежелательным ресурсам, либо сами классифицированы как нежелательные.High potential from the direct output of the trigger 77 is issued to the output 21 of the system as a signal to deny access to this electronic document. Thus, the system blocks electronic documents that either belong to unwanted resources or are themselves classified as unwanted.

Применение метода автоматической классификации электронных документов, с помощью которого осуществляется анализ гипертекстового представления документа, выделение отличительных признаков, производится сравнение их значений и принимается решение о принадлежности документа к категории нежелательных либо допустимых, является отличительной чертой предложенной системы динамической контентной фильтрации.The use of the automatic classification method of electronic documents, with the help of which the analysis of the hypertext representation of the document is carried out, distinguishing features are distinguished, their values are compared and a decision is made whether the document belongs to the category of undesirable or permissible is a distinctive feature of the proposed dynamic content filtering system.

Таким образом, введение новых модулей и новых конструктивных связей позволило существенно повысить быстродействие системы путем локализации адресов записей списка доступа базы данных сервера по идентификаторам электронных документов.Thus, the introduction of new modules and new constructive connections made it possible to significantly increase the system performance by localizing the addresses of the records of the access list of the server database by the identifiers of electronic documents.

Источники информации, принятые во внимание при составлении описания заявки:Sources of information taken into account when drawing up the description of the application:

1. Тумбс Д. Фильтрация Web-контента с использованием ISA Server /Открытые системы: [Электронный документ]/(http://www.osp.ru/win2000/2006/08/3829260/).1. Tumbes D. Web Content Filtering Using ISA Server / Open Systems: [Electronic Document] / (http://www.osp.ru/win2000/2006/08/3829260/).

2. Хилл Б. Решения для фильтрации Web-контента /Открытые системы: [Электронный документ]/(http://www.osp.ru/win2000/2004/05/177073/).2. Hill B. Web Content Filtering Solutions / Open Systems: [Electronic Document] / (http://www.osp.ru/win2000/2004/05/177073/).

3. Патент США №5136708 М. кл. G06F 15/16, 1992.3. US Patent No. 5136708 M. cl. G06F 15/16, 1992.

4. Патент США №5129083 М. кл. G06F 12/00, 15/40, 1992 (прототип).4. US Patent No. 5129083 M. cl. G06F 12/00, 15/40, 1992 (prototype).

Claims (1)

Система динамической контентной фильтрации электронных документов, содержащая модуль селекции опорных адресов сайтов в базе данных сервера, информационный и синхронизирующий входы которого являются первыми информационным и синхронизирующим входами системы соответственно, при этом первый информационный вход системы предназначен для приема запросов электронных документов по их сетевым адресам, первый синхронизирующий вход системы предназначен для приема сигналов занесения кодов запросов электронных документов в модуль селекции опорных адресов сайтов в базе данных сервера, а первый информационный выход модуля селекции опорных адресов сайтов в базе данных сервера предназначен для выдачи запросов электронных документов по их сетевым адресам на первый информационный вход сервера базы данных, модуль идентификации адресов электронных документов в списке доступа, один информационный и синхронизирующий входы которого являются вторыми информационным и синхронизирующим входами системы соответственно, при этом второй информационный вход системы предназначен для приема записей базы данных сервера, а второй синхронизирующий вход системы предназначен для приема сигналов занесения записей базы данных сервера в модуль идентификации адресов электронных документов в списке доступа, модуль формирования сигналов управления выборкой записей базы данных сервера, первый информационный вход которого соединен со вторым информационным выходом модуля селекции опорных адресов сайтов в базе данных сервера, синхронизирующий модуль формирования сигналов управления выборкой записей базы данных сервера подключен к синхронизирующему выходу модуля селекции опорных адресов сайтов в базе данных сервера, адресный выход модуля формирования сигналов управления выборкой записей базы данных сервера является адресным выходом системы, предназначенным для выдачи адресов записей базы данных на адресный вход сервера базы данных, а синхронизирующий выход модуля формирования сигналов управления выборкой записей базы данных сервера является первым синхронизирующим выходом системы, предназначенными для выдачи сигналов управления на вход первого канала прерывания сервера базы данных, отличающаяся тем, что система содержит модуль идентификации временных циклов выборки адресов из списка доступа, информационный вход которого соединен с третьим информационным выходом выходу модуля селекции опорных адресов сайтов в базе данных сервера, синхронизирующий вход модуля идентификации временных циклов выборки адресов из списка доступа подключен к синхронизирующему выходу модуля селекции опорных адресов сайтов в базе данных сервера, а счетный вход модуля идентификации временных циклов выборки адресов из списка доступа соединен с тактирующим выходом модуля идентификации адресов электронных документов в списке доступа, при этом один выход модуля идентификации временных циклов выборки адресов из списка доступа подключен к счетному входу модуля формирования сигналов управления выборкой записей базы данных сервера, а другой выход модуля идентификации временных циклов выборки адресов из списка доступа является вторым синхронизирующим выходом системы, предназначенным для выдачи сигналов управления на вход второго канала прерывания сервера базы данных, и модуль селекции доступа к электронным документам, один информационный вход которого соединен с первым выходом модуля селекции опорных адресов сайтов в базе данных сервера, другой информационный вход модуля селекции доступа к электронным документам подключен к информационному выходу модуля идентификации адресов электронных документов в списке доступа, а синхронизирующий вход модуля селекции доступа к электронным документам соединен с синхронизирующим выходом модуля идентификации адресов электронных документов в списке доступа, при этом информационный выход модуля селекции доступа к электронным документам является вторым информационным выходом системы, предназначенным для выдачи кодов электронных адресов документов в сеть Интернет, синхронизирующий выход модуля селекции доступа к электронным документам является третьим синхронизирующим выходом системы, предназначенным для выдачи синхронизирующих сигналов передачи кодов электронных адресов документов в сеть Интернет, а сигнальный выход модуля селекции доступа к электронным документам является сигнальным выходом системы, предназначенным для выдачи сигнала запрета допуска к электронным документам сети.
Figure 00000001
A system of dynamic content filtering of electronic documents, containing a module for selecting the reference addresses of sites in the server database, the information and synchronizing inputs of which are the first information and synchronizing inputs of the system, respectively, while the first information input of the system is designed to receive requests for electronic documents at their network addresses, the first the synchronizing input of the system is designed to receive signals of entering codes of requests for electronic documents into the selection module about Ornate addresses of sites in the server database, and the first information output of the module for selecting reference addresses of sites in the server database is designed to issue requests for electronic documents at their network addresses to the first information input of the database server, the module for identifying addresses of electronic documents in the access list, one information and the synchronizing inputs of which are the second information and synchronizing inputs of the system, respectively, while the second information input of the system is intended for volume of server database records, and the second synchronizing input of the system is designed to receive signals for entering server database records in the identification module of electronic document addresses in the access list, a signal generation module for generating server database records, the first information input of which is connected to the second information output of the module selection of reference addresses of sites in the server database, a synchronization module for generating signals to control the selection of records of the database server subkey n to the synchronizing output of the module for selecting the reference addresses of sites in the server database, the address output of the module for generating signals for controlling the selection of server database records is the address output of the system designed to provide addresses of database records to the address input of the database server, and the synchronizing output of the module for generating signals control the selection of server database records is the first synchronizing system output designed to issue control signals to the input of the first channel database server interruption, characterized in that the system comprises a module for identifying time cycles for selecting addresses from an access list, the information input of which is connected to a third information output for the output of a module for selecting reference addresses of sites in the server database, synchronizing the input of a module for identifying time cycles for selecting addresses from a list access is connected to the synchronizing output of the module for selecting the reference addresses of sites in the server database, and the counting input of the module for identifying time cycles of sampling addresses from the access list is connected to the clocking output of the electronic document address identification module in the access list, while one output of the identification module for temporary cycles of address selection from the access list is connected to the counting input of the signal generation module for generating control records for server database records, and another output of the temporary identification module cycles of selecting addresses from the access list is the second synchronizing output of the system, designed to issue control signals to the input of the second channel a database server, and a selection module for access to electronic documents, one information input of which is connected to the first output of the selection module of reference addresses of sites in the server database, another information input of the selection module of access to electronic documents is connected to the information output of the identification module of electronic documents addresses in access list, and the synchronizing input of the module for selecting access to electronic documents is connected to the synchronizing output of the module for identifying addresses of electronic documents access list, the information output of the module for selecting access to electronic documents is the second information output of the system, intended for issuing codes of electronic addresses of documents on the Internet, the synchronizing output of the module for selecting access to electronic documents is the third synchronizing output of the system, for issuing synchronizing signals for transmitting codes of electronic addresses of documents to the Internet, and the signal output of the module for selecting access to electronic dock omen is the system's signal output intended for issuing a signal to prohibit access to electronic network documents.
Figure 00000001
RU2008120195/22U 2008-05-22 2008-05-22 DYNAMIC CONTENT FILTRATION SYSTEM OF ELECTRONIC DOCUMENTS RU77465U1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2008120195/22U RU77465U1 (en) 2008-05-22 2008-05-22 DYNAMIC CONTENT FILTRATION SYSTEM OF ELECTRONIC DOCUMENTS

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2008120195/22U RU77465U1 (en) 2008-05-22 2008-05-22 DYNAMIC CONTENT FILTRATION SYSTEM OF ELECTRONIC DOCUMENTS

Publications (1)

Publication Number Publication Date
RU77465U1 true RU77465U1 (en) 2008-10-20

Family

ID=40041742

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008120195/22U RU77465U1 (en) 2008-05-22 2008-05-22 DYNAMIC CONTENT FILTRATION SYSTEM OF ELECTRONIC DOCUMENTS

Country Status (1)

Country Link
RU (1) RU77465U1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2446460C1 (en) * 2010-11-18 2012-03-27 Учреждение Российской академии наук Институт Системного Анализа РАН (ИСА РАН) Method and system for filtering web content
RU2555219C2 (en) * 2009-06-03 2015-07-10 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Use of pre-processing on server for expansion of views of electronic documents in computer network
RU2738335C1 (en) * 2020-05-12 2020-12-11 Общество С Ограниченной Ответственностью "Группа Айби" Method and system for classifying and filtering prohibited content in a network

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2555219C2 (en) * 2009-06-03 2015-07-10 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Use of pre-processing on server for expansion of views of electronic documents in computer network
US10198523B2 (en) 2009-06-03 2019-02-05 Microsoft Technology Licensing, Llc Utilizing server pre-processing to deploy renditions of electronic documents in a computer network
RU2446460C1 (en) * 2010-11-18 2012-03-27 Учреждение Российской академии наук Институт Системного Анализа РАН (ИСА РАН) Method and system for filtering web content
RU2738335C1 (en) * 2020-05-12 2020-12-11 Общество С Ограниченной Ответственностью "Группа Айби" Method and system for classifying and filtering prohibited content in a network

Similar Documents

Publication Publication Date Title
CN112468520B (en) Data detection method, device and equipment and readable storage medium
CN101711470A (en) A system and method for creating a list of shared information on a peer-to-peer network
US20050091537A1 (en) Inferring content sensitivity from partial content matching
CN102077201A (en) System and method for dynamic and real-time categorization of webpages
CN103118035B (en) Method and the device of analyzing web site access request parameters legal range
CN107547671A (en) A kind of URL matching process and device
KR20180074774A (en) How to identify malicious websites, devices and computer storage media
CN110324273A (en) A kind of Botnet detection method combined based on DNS request behavior with domain name constitutive characteristic
CN107395650A (en) Even method and device is returned based on sandbox detection file identification wooden horse
US11797617B2 (en) Method and apparatus for collecting information regarding dark web
RU77465U1 (en) DYNAMIC CONTENT FILTRATION SYSTEM OF ELECTRONIC DOCUMENTS
RU2659482C1 (en) Protection of web applications with intelligent network screen with automatic application modeling
CN111427613A (en) Application program interface API management method and device
CN106528805A (en) Mobile internet baleful program URL intelligent analyzing and mining method based on users
US6941477B2 (en) Trusted content server
CN112769739B (en) Database operation violation processing method, device and equipment
RU2368004C1 (en) System for control of access to internet network resources
RU76482U1 (en) AUTOMATED SYSTEM OF IDENTIFICATION OF AVAILABLE INTERNET NETWORK RESOURCES
CN106411944B (en) A kind of management method and device of network access
CN110784483B (en) DGA abnormal domain name-based event detection system and method
Antunes et al. Automatically complementing protocol specifications from network traces
CN106559420A (en) A kind of filter method and device of message
CN114168945A (en) Method and device for detecting potential risk of sub-domain name
US9330185B2 (en) POI related information processing system and method, and apparatus for supporting the same
WO2013060107A1 (en) Widget installation management system and method

Legal Events

Date Code Title Description
MM1K Utility model has become invalid (non-payment of fees)

Effective date: 20090523

NF1K Reinstatement of utility model

Effective date: 20110310

MM1K Utility model has become invalid (non-payment of fees)

Effective date: 20140523