RU76482U1 - AUTOMATED SYSTEM OF IDENTIFICATION OF AVAILABLE INTERNET NETWORK RESOURCES - Google Patents

AUTOMATED SYSTEM OF IDENTIFICATION OF AVAILABLE INTERNET NETWORK RESOURCES Download PDF

Info

Publication number
RU76482U1
RU76482U1 RU2008116780/22U RU2008116780U RU76482U1 RU 76482 U1 RU76482 U1 RU 76482U1 RU 2008116780/22 U RU2008116780/22 U RU 2008116780/22U RU 2008116780 U RU2008116780 U RU 2008116780U RU 76482 U1 RU76482 U1 RU 76482U1
Authority
RU
Russia
Prior art keywords
module
output
addresses
input
synchronizing
Prior art date
Application number
RU2008116780/22U
Other languages
Russian (ru)
Inventor
Анатолий Николаевич Романов
Original Assignee
Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Восход"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Восход" filed Critical Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Восход"
Priority to RU2008116780/22U priority Critical patent/RU76482U1/en
Application granted granted Critical
Publication of RU76482U1 publication Critical patent/RU76482U1/en

Links

Abstract

Полезная модель относится к вычислительной технике, в частности, к автоматизированной системе идентификации доступных ресурсов сети Интернет в зависимости от категории запрашиваемых ресурсов и принятой политики безопасности. Система проверяет запросы пользователей на принадлежность к конкретной категории. В случае запрещенной категории запрос к ресурсу блокируется.The utility model relates to computing, in particular, to an automated system for identifying available Internet resources, depending on the category of requested resources and the adopted security policy. The system checks user requests for membership in a specific category. In the case of a forbidden category, the request to the resource is blocked.

Техническим результатом является повышение быстродействия системы путем локализации адресов поиска записей списков доступа базы данных сервера по идентификаторам электронных документов.The technical result is to increase the system performance by localizing the addresses of the search for records of access lists of the server database by the identifiers of electronic documents.

Технический результат достигается тем, что система содержит модуль селекции опорных адресов сайтов в базе данных сервера, модуль идентификации адресов электронных документов в списке доступа, модуль идентификации временных циклов выборки адресов из списка доступа, модуль формирования сигналов управления выборкой записей базы данных сервера, модуль селекции доступа к электронным документам. 8 ил.The technical result is achieved by the fact that the system comprises a module for selecting reference addresses of sites in the server database, a module for identifying addresses of electronic documents in the access list, a module for identifying time cycles for selecting addresses from the access list, a module for generating signal control signals for selecting records in the server database, an access selection module to electronic documents. 8 ill.

Description

Полезная модель относится к вычислительной технике, в частности, к автоматизированной системе идентификации доступных ресурсов сети Интернет в зависимости от категории запрашиваемых ресурсов и принятой политики безопасности. Система проверяет запросы пользователей на принадлежность к конкретной категории. В случае запрещенной категории запрос к ресурсу блокируется.The utility model relates to computing, in particular, to an automated system for identifying available Internet resources, depending on the category of requested resources and the adopted security policy. The system checks user requests for membership in a specific category. In the case of a forbidden category, the request to the resource is blocked.

В качестве ресурсов сети Интернет выступают так называемые электронные документы, представляющие собой информационные объекты, доступные в сети передачи данных, которые могут быть получены путем информационного сетевого обмена оконечного оборудования пользователя с сервером по протоколу HTTP и далее воспроизведены с помощью оконечного оборудования пользователя в печатном или ином виде.As the resources of the Internet network are the so-called electronic documents, which are information objects available on the data transfer network, which can be obtained by means of information network exchange of the user's terminal equipment with the server via HTTP and then reproduced using the user's terminal equipment in print or other form.

Каждый электронный документ в World Wide Web имеет URL (Uniform Resourse Locator) - адрес, который включает в себя тип ресурса и местонахождение файла на сервере.Each electronic document on the World Wide Web has a URL (Uniform Resourse Locator) - an address that includes the type of resource and the location of the file on the server.

Общий синтаксис таков:The general syntax is as follows:

scheme: //host.domain[:port] /path/filename.scheme: //host.domain[:port] / path / filename.

Множество электронных документов, имеющих одинаковый корневой URL, образуют сайт или ресурс.Many electronic documents with the same root URL form a site or resource.

Электронный документ в формате HTML принято называть электронным гипертекстовым документом (или просто гипертекстовым документом).An electronic document in HTML format is usually called an electronic hypertext document (or simply a hypertext document).

Известна система Microsoft Internet Security and Acceleration (ISA) Server [1], осуществляющая фильтрацию документов, передаваемых по высокоуровневым протоколам (в частности, HTTP). Microsoft Internet Security and Acceleration (ISA) Server проверяет на соответствие заданным условиям не только пакеты сетевого обмена (запрещает или разрешает протоколы целиком), но и содержимое документов.The well-known Microsoft Internet Security and Acceleration (ISA) Server [1] system, which filters documents transmitted over high-level protocols (in particular, HTTP). Microsoft Internet Security and Acceleration (ISA) Server checks for compliance with the given conditions not only the network exchange packets (prohibits or allows the entire protocols), but also the contents of the documents.

Чтобы блокировать доступ к нежелательным электронным документам, необходимо задать набор URL, как часть правила брандмауэра внутри существующей конфигурации ISA Server.To block access to unwanted electronic documents, you must specify a set of URLs as part of a firewall rule within an existing ISA Server configuration.

Пример использования подобного правила представлен в следующей таблице:An example of using such a rule is presented in the following table:

ПолеField ЗначениеValue ПравилоThe rule ЗапретитьTo prohibit ПротоколProtocol НИРResearch ИсточникиSources Внутренняя сеть (диапазон адресов)Internal network (address range) Место назначенияDestination *.badsite.com* .badsite.com

В наборе правил назначаются специальные правила, блокирующее документы, получаемые по протоколу HTTP и HTTPS, содержащие нежелательную строку или ключевое слово. В этом случае, если ISA Server обнаружит такую строку в HTTP-ответе (в границах байтового диапазона) Web-сервера, страница будет блокирована.In the ruleset, special rules are assigned that block documents received via HTTP and HTTPS containing an unwanted string or keyword. In this case, if ISA Server detects such a line in the HTTP response (within the byte range of the Web server), the page will be blocked.

Недостатками подобного технического решения по фильтрации ответных строк является низкая полнота (невозможно судить о характере документа, анализируя лишь ограниченный байтовый диапазон) и точность (решение о характере документа принимается лишь по наличию отдельных слов).The disadvantages of such a technical solution for filtering response lines are low completeness (it is impossible to judge the nature of the document by analyzing only a limited byte range) and accuracy (a decision on the nature of the document is made only by the presence of individual words).

Другие технические решения поставленной задачи [2], известные как Cobian Orange Filter компании Deerfield.com и EngageIP Content Filter фирмы LogiSense, предназначены исключительно для работы с информацией, доставляемой по каналам HTTP, и обеспечивают фильтрацию с использованием дополнительных протоколов. Все они используют механизм списков доступа и задание правил доступа.Other technical solutions to the task [2], known as Cobian Orange Filter by Deerfield.com and EngiIPIP Content Filter by LogiSense, are designed exclusively for working with information delivered via HTTP channels and provide filtering using additional protocols. All of them use the access list mechanism and set access rules.

Известны системы, которые могли бы быть использованы для решения поставленной задачи (3, 4).Known systems that could be used to solve the problem (3, 4).

Первая из известных систем содержит блоки приема и хранения данных, соединенные с блоками управления и обработки данных, блоки поиска и селекции, подключенные к блокам хранения данных и отображения, синхронизирующие входы которых соединены с выходами блока управления (3).The first of the known systems contains data reception and storage units connected to control and data processing units, search and selection units connected to data storage and display units, the synchronizing inputs of which are connected to the outputs of the control unit (3).

Существенный недостаток данной системы состоит в невозможности решения задачи обновления списка данных, хранимых в памяти в виде соответствующих документов одновременно с решением задачи выдачи содержания этих документов пользователям в реальном масштабе времени.A significant drawback of this system is the impossibility of solving the problem of updating the list of data stored in memory in the form of relevant documents at the same time as solving the problem of delivering the contents of these documents to users in real time.

Известна и другая система, содержащая блоки обработки данных, информационные входы которых соединены с блоками приема данных и управления, а выходы подключены к первой группе блоков памяти, центральный процессор, входы которого соединены с выходами блоков памяти первой группы и блоков обработки данных, а выходы соединены с входами блоков памяти второй группы и блоков отображения данных (4).Another system is known that contains data processing units, the information inputs of which are connected to the data reception and control units, and the outputs are connected to the first group of memory units, the central processor, the inputs of which are connected to the outputs of the memory units of the first group and data processing units, and the outputs are connected with the inputs of the memory blocks of the second group and data display blocks (4).

Последнее из перечисленных выше технических решений наиболее близко к описываемому.The last of the above technical solutions is closest to the described.

Его недостаток заключается в невысоком быстродействии системы, обусловленном тем, что выполнение процедуры фильтрации данных реализуется через поиск данных по всей базе данных и их последующей обработке центральным процессором, что неизбежно приводит к необоснованным затратам времени.Its disadvantage lies in the low speed of the system, due to the fact that the data filtering procedure is implemented by searching for data across the entire database and their subsequent processing by the central processor, which inevitably leads to unreasonable waste of time.

Цель изобретения - повышение быстродействия системы путем локализации адресов фильтрации записей базы данных допуска по идентификаторам адресов запрашиваемых электронных документов путем актуализации статичных списков доступа и повышения полноты и точности систем контентной фильтрации.The purpose of the invention is to improve system performance by localizing filter addresses of access database records by address identifiers of requested electronic documents by updating static access lists and increasing the completeness and accuracy of content filtering systems.

Поставленная цель достигается тем, что в известную систему, содержащую модуль селекции опорных адресов сайтов в базе данных сервера, информационный и синхронизирующий входы которого являются первыми информационным и синхронизирующим входами системы соответственно, при этом первый информационный вход системы предназначен для приема запросов электронных документов по их сетевым адресам, первый синхронизирующий вход системы предназначен для приема сигналов занесения кодов запросов электронных документов в модуль селекции опорных адресов сайтов в базе данных сервера, а первый информационный выход модуля селекции опорных адресов сайтов в базе данных сервера предназначен для выдачи запросов электронных документов по их сетевым адресам на первый информационный вход сервера базы данных, модуль идентификации адресов электронных документов в списке доступа, один информационный и синхронизирующий входы которого являются вторыми информационным и синхронизирующим входами системы соответственно, при этом второй информационный вход системы предназначен для приема записей базы данных сервера, а второй синхронизирующий вход системы предназначен для приема сигналов занесения записей базы данных сервера в модуль идентификации адресов электронных документов в списке доступа, модуль формирования сигналов управления выборкой записей базы данных сервера, первый информационный вход которого соединен со вторым информационным выходом модуля селекции опорных адресов сайтов в базе данных сервера, синхронизирующий модуль формирования сигналов управления выборкой записей базы данных сервера подключен к синхронизирующему выходу модуля селекции опорных адресов сайтов в базе данных сервера, адресный выход модуля формирования сигналов управления выборкой записей базы данных сервера является адресным выходом системы, предназначенным для выдачи адресов записей базы данных на адресный вход сервера базы данных, а синхронизирующий выход модуля формирования сигналов управления выборкой записей базы данных сервера является первым синхронизирующим выходом системы, предназначенными для выдачи сигналов управления на вход первого канала прерывания сервера базы данных, введены модуль идентификации временных циклов выборки адресов из списка доступа, информационный вход которого соединен с третьим информационным выходом выходу модуля селекции опорных адресов сайтов в базе данных сервера, синхронизирующий вход модуля идентификации временных циклов выборки адресов из списка доступа подключен к синхронизирующему выходу модуля селекции опорных адресов сайтов в базе данных сервера, а счетный вход модуля идентификации временных циклов выборки адресов из списка доступа соединен с тактирующим выходом модуля идентификации адресов электронных документов в списке доступа, при этом один выход модуля идентификации временных циклов выборки адресов из списка доступа подключен к счетному входу модуля формирования сигналов управления выборкой записей базы данных сервера, а другой выход модуля идентификации временных циклов выборки адресов из списка доступа является вторым синхронизирующим выходом системы, предназначенным для выдачи сигналов управления на вход второго канала прерывания сервера базы данных, и модуль селекции доступа к электронным документам, один информационный вход которого соединен с первым выходом модуля селекции опорных адресов сайтов в базе данных сервера, другой информационный вход модуля селекции доступа к электронным документам подключен к информационному выходу модуля идентификации адресов электронных документов в списке доступа, а синхронизирующий вход модуля селекции доступа к электронным документам соединен с синхронизирующим выходом модуля идентификации адресов электронных документов в списке доступа, при этом информационный выход модуля селекции доступа к электронным документам является вторым информационным выходом системы, предназначенным для выдачи кодов электронных адресов документов в сеть Интернет, синхронизирующий выход модуля селекции доступа к электронным документам является третьим синхронизирующим выходом системы, предназначенным для выдачи синхронизирующих сигналов передачи кодов электронных адресов документов в сеть Интернет, а сигнальный выход модуля селекции доступа к электронным документам является сигнальным выходом системы, предназначенным для выдачи сигнала запрета допуска к электронным документам сети.This goal is achieved by the fact that in a known system containing a module for selecting reference addresses of sites in the server database, the information and synchronizing inputs of which are the first information and synchronizing inputs of the system, respectively, while the first information input of the system is designed to receive requests for electronic documents via their network addresses, the first synchronizing input of the system is designed to receive signals of entering codes of requests for electronic documents in the selection module of reference hells There are sites in the server database, and the first information output of the module for selecting reference addresses of sites in the server database is designed to issue requests for electronic documents at their network addresses to the first information input of the database server, the module for identifying addresses of electronic documents in the access list, one information and whose synchronizing inputs are the second information and synchronizing inputs of the system, respectively, while the second information input of the system is designed to receive recording the server database, and the second synchronizing input of the system is designed to receive signals for entering server database records into the identification module for the addresses of electronic documents in the access list, a signal generation module for controlling the selection of server database records, the first information input of which is connected to the second information output of the selection module reference addresses of sites in the server database, the synchronizing module for generating signals for controlling the selection of server database records is connected to the sync to the output of the module for selecting reference addresses of sites in the server database, the address output of the module for generating control signals for selecting database server records is the address output of the system for issuing the addresses of database records for the address input of the database server, and the synchronizing output for the module for generating control signals for sampling server database records is the first synchronizing system output intended for issuing control signals to the input of the first interrupt channel database server, a module for identifying time cycles for selecting addresses from an access list, the information input of which is connected to the third information output for the module for selecting reference addresses of sites in the server database, the synchronizing input module for identifying time cycles for selecting addresses from an access list, is connected to the synchronizing output of the module selection of reference addresses of sites in the server database, and the counting input of the module for identifying time cycles for selecting addresses from the access list is connected to the output of the module for identifying addresses of electronic documents in the access list, while one output of the module for identifying time cycles for selecting addresses from the access list is connected to the counting input of the module for generating signals for controlling the selection of records of the server database, and another output for the module for identifying time cycles for selecting addresses from the access list is the second synchronizing system output intended for issuing control signals to the input of the second channel of the database server interrupt, and the module has sat down access to electronic documents, one information input of which is connected to the first output of the module for selecting reference addresses of sites in the server database, another information input of the module of selection of access to electronic documents is connected to the information output of the module for identifying addresses of electronic documents in the access list, and the synchronizing input of the module selection of access to electronic documents is connected to the synchronizing output of the module for identifying addresses of electronic documents in the access list, while the info the output of the module for selecting access to electronic documents is the second information output of the system, intended for issuing codes of electronic addresses of documents on the Internet, the synchronizing output of the module for selecting access to electronic documents is the third synchronizing output of the system, for issuing synchronizing signals for transmitting codes of electronic addresses of documents in Internet, and the signal output of the module for selecting access to electronic documents is the signal output of the system topics designed to issue a signal of prohibition of access to electronic documents of the network.

Сущность изобретения поясняется чертежами, где на фиг.1 представлена структурная схема системы, на фиг.2 - структурная схема модуля селекции опорных адресов сайтов в базе данных сервера, на фиг.3 - структурная схема модуля идентификации адресов электронных документов в списке доступа, на фиг.4 - структурная схема модуля идентификации временных циклов выборки адресов из списка доступа, на фиг.5 - структурная схема модуля формирования сигналов управления выборкой записей базы данных сервера, на фиг.6 - структурная схема модуля селекции доступа к электронным документам, на фиг.7 представлена диаграмма потоков данных в системе, а на фиг.8 представлен алгоритм работы системыThe invention is illustrated by drawings, where Fig. 1 is a structural diagram of a system, Fig. 2 is a structural diagram of a module for selecting reference addresses of sites in a server database, Fig. 3 is a structural diagram of a module for identifying addresses of electronic documents in an access list, in Fig. .4 is a block diagram of a module for identifying time cycles of accessing addresses from an access list, FIG. 5 is a block diagram of a module for generating control signals for fetching records of a server database, and FIG. 6 is a block diagram of an access selection module electronic documents 7 is a diagram of data flow in the system, and Figure 8 is a flowchart of operation of the system

Система (фиг.1) содержит модуль 1 селекции опорных адресов сайтов в базе данных сервера, модуль 2 идентификации адресов электронных документов в списке доступа, модуль 3 идентификации временных циклов выборки адресов из списка доступа, модуль 4 формирования сигналов управления выборкой записей базы данных сервера, модуль 5 селекции доступа к электронным документам.The system (Fig. 1) comprises a module 1 for selecting reference addresses of sites in the server database, a module 2 for identifying addresses of electronic documents in the access list, a module 3 for identifying time cycles for selecting addresses from the access list, a module 4 for generating signals for controlling the selection of server database records, module 5 selection of access to electronic documents.

На фиг.1 также показаны первый 10 и второй 11 информационные входы системы, первый 12 и второй 13 синхронизирующие входы системы, первый 15 и второй 16 информационные выходы системы, адресный 17 выход системы, первый 18, второй 19 и третий 20 синхронизирующие выходы системы, и сигнальный 21 выход системы.1 also shows the first 10 and second 11 information inputs of the system, the first 12 and second 13 synchronizing inputs of the system, the first 15 and second 16 information outputs of the system, address 17 system output, the first 18, second 19 and third 20 synchronizing outputs of the system, and signal 21 system output.

Модуль 1 (фиг.2) селекции опорных адресов сайтов в базе данных сервера содержит регистр 25, дешифратор 26, узел памяти 27, выполненный в виде постоянного запоминающего устройства, элементы 28-30 И, и элементы 31, 32 задержки. На чертеже также показаны информационный 10 и синхронизирующий 12 входы, а также первый 36, второй 37, третий 38 и четвертый 39 информационные и синхронизирующий 40 выходы.Module 1 (figure 2) selection of reference addresses of sites in the server database contains a register 25, a decoder 26, a memory node 27 made in the form of read-only memory, elements 28-30 And, and elements 31, 32 delay. The drawing also shows information 10 and synchronizing 12 inputs, as well as the first 36, second 37, third 38 and fourth 39 information and synchronizing 40 outputs.

Модуль 2 (фиг.3) идентификации адресов электронных документов в списке доступа содержит регистр 45, компаратор 46, элемент 47 задержки. На чертеже показаны первый 48 и второй 49 информационные и синхронизирующий 50 входы, а также информационный 51, тактирующий 52 и синхронизирующий 53 выходы.Module 2 (figure 3) identifying the addresses of electronic documents in the access list contains a register 45, a comparator 46, a delay element 47. The drawing shows the first 48 and second 49 information and clock 50 inputs, as well as information 51, clock 52 and clock 53 outputs.

Модуль 3 (фиг.4) идентификации временных циклов выборки адресов из списка доступа содержит регистр 55, счетчик 56, компаратор 57, элементы 58, 59 задержки.Module 3 (Fig. 4) for identifying time cycles for accessing addresses from an access list contains a register 55, a counter 56, a comparator 57, delay elements 58, 59.

На чертеже показаны информационный 60, синхронизирующий 61 и счетный 62 входы, а также первый 63 и второй 64 выходы.The drawing shows information 60, synchronizing 61 and counting 62 inputs, as well as the first 63 and second 64 outputs.

Модуль 4 (фиг.5) формирования сигналов управления выборкой записей базы данных сервера содержит счетчик 65, элемент 66 ИЛИ, элемент 67 задержки. На чертеже показаны информационный 68, синхронизирующий 69 и счетный 70 входы, а также адресный 17 и синхронизирующий 18 выходы.Module 4 (Fig. 5) for generating control signals for selecting database server records includes a counter 65, an OR element 66, a delay element 67. The drawing shows information 68, synchronizing 69 and counting 70 inputs, as well as address 17 and synchronizing 18 outputs.

Модуль 5 (фиг.6) селекции доступа к электронным документам содержит дешифратор 75, триггеры 76, 77, элементы 78, 79 И, группа 80 элементов И, элемент 91 задержки. На чертеже показаны первый 84 и второй 85 информационные, и синхронизирующий 86 входы, а также информационный 16, синхронизирующий 20 и сигнальный 21 выходы системы.Module 5 (Fig.6) selection of access to electronic documents contains a decoder 75, triggers 76, 77, elements 78, 79 And, a group of 80 And elements, element 91 delay. The drawing shows the first 84 and second 85 information, and synchronizing 86 inputs, as well as information 16, synchronizing 20 and signal 21 system outputs.

Работа системы основана на использовании автоматического классификатора электронных документов для определения тематики документов.The system is based on the use of an automatic classifier of electronic documents to determine the subject of documents.

В данном случае под классификацией электронного документа понимается следующая последовательность действий (фиг.7):In this case, the classification of an electronic document means the following sequence of actions (Fig.7):

- преобразование гипертекстового представления к специальному формату данных: отделение текста естественного языка от служебной HTML-разметки;- Transformation of the hypertext representation to a special data format: separation of the text of the natural language from the service HTML markup;

- анализ выделенного текста естественного языка с целью выделения значимых фрагментов; учет веса их вхождений в тексте для построения модели представления текста документа;- analysis of the selected text of the natural language in order to highlight significant fragments; accounting for the weight of their occurrences in the text to build a model for representing the text of the document;

- сравнение построенной модели представления текста с моделями заранее предопределенных классов документов, содержащими отличительные признаки и их значения, характеризующие тематику этих классов;- Comparison of the constructed model for presenting the text with models of predefined classes of documents containing distinctive features and their meanings characterizing the subject of these classes;

- принятие решения на основе проведенного сравнения об отнесении документа к одному или нескольким классам, при этом принятие решения о блокировании передачи НТТР-запроса пользователя к серверу в случае, когда тематика запрошенного электронного документа определена как нежелательная.- making a decision on the basis of a comparison on assigning a document to one or more classes, while making a decision to block the transmission of an HTTP request from a user to the server when the subject of the requested electronic document is defined as undesirable.

Общий алгоритм работы системы приведен на фиг.8 и заключается в выполнении следующей последовательности операций:The general algorithm of the system is shown in Fig. 8 and consists in performing the following sequence of operations:

- на вход 10 системы поступает запрос на доступ к электронному документу по его URL (шаги 1 и 2 диаграммы потоков данных).- input 10 of the system receives a request for access to an electronic document at its URL (steps 1 and 2 of the data flow diagram).

- проводится проверка сведений о документе в списке доступа (шаг 3). Если в списке доступа присутствует запись о классе непосредственно запрашиваемого URL, то результатом будет разрешение или запрет доступа, если класс документа - допустимый или нежелательный соответственно (шаг 4). Если в списке доступа отсутствуют сведения непосредственно о запрашиваемом URL, но при этом ресурс, к которому относится документ, помечен как нежелательный, то в результате производится запрет доступа к документу.- the information on the document in the access list is checked (step 3). If the access list contains an entry about the class of the directly requested URL, then the result will be permission or deny access, if the document class is valid or undesirable, respectively (step 4). If the access list does not contain information directly about the requested URL, but the resource to which the document belongs is marked as undesirable, then access to the document is denied.

Следующие шаги выполняются только в случае, когда списке доступа отсутствуют сведения о документе и о ресурсе, к которому принадлежит документ.The following steps are performed only when the access list does not contain information about the document and about the resource to which the document belongs.

- запускается механизм автоматической классификации: для этого в интерфейс получения электронных документов передается URL классифицируемого документа (шаг 5). Интерфейс получения электронных документов предоставляется внешней вызывающей программой или реализуется непосредственно как функция подсистемы автоматической классификации.- the automatic classification mechanism starts: for this, the URL of the classified document is transmitted to the interface for receiving electronic documents (step 5). The interface for receiving electronic documents is provided by an external calling program or is implemented directly as a function of the automatic classification subsystem.

- гипертекстовое представление и URL документа передаются далее для проведения непосредственно классификации документа (шаг 6).- the hypertext representation and the URL of the document are passed on to directly classify the document (step 6).

- после определения класса документа через интерфейс фильтрации возвращается разрешение/запрет на доступ в соответствии с определенным классом (шаг 7), а также производится помещение информации в список доступа (шаг 8).- after determining the class of the document, the permission / prohibition of access in accordance with the specified class is returned via the filtering interface (step 7), and information is also placed in the access list (step 8).

- дополнительно запускается механизм классификации ресурса, к которому относится документ (шаг 9). Для проведения процедуры классификации ресурса производится запрос сведений обо всех известных документах, относящихся к ресурсу (шаги 10, 11). Результат классификации ресурса также помещается в список доступа (шаг 12).- additionally, the classification mechanism of the resource to which the document belongs is activated (step 9). To carry out the resource classification procedure, a request is made for information about all known documents related to the resource (steps 10, 11). The result of the resource classification is also placed in the access list (step 12).

Классификация ресурса производится по следующему правилу:Resource classification is performed according to the following rule:

ресурс является нежелательным тогда и только тогда, когда доля документов, относящихся к этому ресурсу и классифицированных как нежелательные, превышает пороговую величину А, которая определяется на этапе настройки системы. В остальных случаях ресурс считается допустимым.a resource is undesirable if and only if the proportion of documents related to this resource and classified as undesirable exceeds a threshold value A, which is determined at the stage of system setup. In other cases, the resource is considered valid.

Таким образом, система реализует следующие процедуры:Thus, the system implements the following procedures:

- в список доступа помещаются именно те документы и ресурсы, доступ к которым осуществляет пользователь на практике;- the documents and resources that are accessed by the user in practice are placed on the access list;

- однажды классифицированные документы не подвергаются повторной классификации при последующих обращениях пользователя.- Once classified documents are not re-classified upon subsequent user requests.

Идентификатор электронного документа представляет собой следующую структуру:The identifier of an electronic document is the following structure:

ПолеField ТипType of ЗначениеValue siteIDsiteID Целое числоInteger СКС32-хэш, вычисленный от части строки URL, задающей адрес ресурса (сайта)SCS32 hash calculated from the part of the URL string that specifies the address of the resource (site) pathIDpathID Целое числоInteger СРС32-хэш, вычисленный от части строки URL, задающей путь к документу относительно адреса ресурса (сайта)CPC32 hash calculated from the part of the URL string that specifies the path to the document relative to the address of the resource (site)

Идентификатор ресурса аналогичен идентификатору электронного документа, но второе поле pathID имеет всегда нулевое значение.The resource identifier is similar to the identifier of the electronic document, but the second field pathID is always zero.

Проиллюстрируем этот факт на следующем примере: пусть URL-адрес документа - http://www.site.com/foo/bar/doc.html.We illustrate this fact with the following example: let the document URL be http://www.site.com/foo/bar/doc.html.

Тогда siteID=CRC32(http://www.site.com),Then siteID = CRC32 (http://www.site.com),

pathID=CRC32(foo/bar/doc.html),pathID = CRC32 (foo / bar / doc.html),

и идентификатор электронного документа - есть пара (siteID, pathID), а идентификатор соответственного ресурса, к которому принадлежит документ - (siteID, 0).and the identifier of the electronic document is a pair (siteID, pathID), and the identifier of the corresponding resource to which the document belongs is (siteID, 0).

Структура данных, характеризующая тематическую принадлежность документа, выглядит следующим образом:The data structure characterizing the thematic affiliation of the document is as follows:

ПолеField ТипType of ЗначениеValue IDID пара (siteID, pathID)pair (siteID, pathID) Идентификатор документаDocument id categorycategory перечислениеtransfer Допустимый, нежелательный, неопределенный - в зависимости от результата классификацииPermissible, undesirable, indefinite - depending on the classification result

Для доступа к соответствующим электронным документам на вход 10 системы поступает идентификатор электронного документа в виде кодограммы, имеющий следующую структуру данных:To access the relevant electronic documents at the input 10 of the system receives the identifier of the electronic document in the form of a codogram having the following data structure:

КодThe code КодThe code siteIDsiteID pathIDpathID

Данная кодограмма с входа 10 системы поступает на информационный вход модуля 1 и далее на информационный вход регистра 25, в который указанные коды заносятся синхронизирующим импульсом с входа 12.This codogram from the input 10 of the system is fed to the information input of module 1 and then to the information input of register 25, into which the indicated codes are entered by a synchronizing pulse from input 12.

С выхода 33 регистра 25 вся кодовая комбинация через выход 36 модуля 1 выдается на как выход 15 системы и далее на информационный вход сервера базы данных допуска, так и на вход 85 модуля 5.From the output 33 of register 25, the entire code combination through the output 36 of module 1 is output to both the output 15 of the system and then to the information input of the admission database server, and to the input 85 of module 5.

С выхода 34 регистра 25 модуля 1 код SiteID поступает на информационный вход дешифратора 26, который расшифровывает поступивший код и подготавливает цепь прохождения сигнала с входа 12, открывая один из элементов 28-30 И. Для определенности положим, что высокий потенциал поступил на один вход элемента 30 И.From the output 34 of register 25 of module 1, the SiteID code is fed to the information input of the decoder 26, which decrypts the incoming code and prepares the signal path from input 12, opening one of the 28-30 I elements. For definiteness, we assume that a high potential is received at one element input 30 I.

Параллельно с этим, синхронизирующий импульс с входа 12 системы задерживается элементом 31 модуля 1 на время срабатывания регистра 25 и дешифратора 26, и далее опрашивает состояние элементов 28-30 И.In parallel with this, the synchronizing pulse from the input 12 of the system is delayed by the element 31 of the module 1 at the time of operation of the register 25 and the decoder 26, and then polls the state of the elements 28-30 I.

Учитывая то обстоятельство, что открытым по одному входу будет только элемент 30 И, то пройдя этот элемент И, синхроимпульс поступает, во-первых, на вход считывания соответствующей фиксированной ячейки памяти постоянного запоминающего устройства 27, где хранятся коды опорных адресов разделов памяти сервера базы данных, содержащих данные сайтов siteID.Given the fact that only 30 AND element will be open on one input, then passing through this And element, the clock pulse arrives, first, at the read input of the corresponding fixed memory cell of the permanent storage device 27, where the reference address codes of the database server memory partitions are stored containing siteID site data.

Структура кода данных сайтов siteID, имеет следующий вид:The structure of the siteID site data code is as follows:

КодThe code КодThe code опорного адреса первой записи данного siteIDreference address of the first record of this siteID общего количества записей данных адресов в разделе базы данных siteIDtotal number of address data records in the siteID database partition

Код опорного адреса первой записи данного siteID считывается из памяти блока 27 и через выход 37 модуля 1 поступает на вход 68 модуля 4 и далее на информационный вход счетчика 65, а код общего количества записей данных адресов в разделе базы данных siteID с выхода 38 модуля 1 поступает на информационный вход 60 модуля 3 и далее на информационный вход регистра 55.The code of the reference address of the first record of this siteID is read from the memory of block 27 and through the output 37 of module 1 goes to the input 68 of module 4 and then to the information input of the counter 65, and the code of the total number of records of address data in the database section of the siteID from the output 38 of module 1 is received to the information input 60 of module 3 and then to the information input of the register 55.

Одновременно с этим, тот же импульс считывания с выхода элемента 31 задерживается элементом 32 задержки на время считывания содержимого фиксированной ячейки ПЗУ 27 и затем с выхода 40 модуля 1 поступает как на синхронизирующий вход 61 модуля 3, так и на синхронизирующий вход 69 модуля 4.At the same time, the same read pulse from the output of element 31 is delayed by the delay element 32 for the duration of reading the contents of the fixed cell of the ROM 27 and then from the output 40 of module 1 is supplied to both the synchronizing input 61 of module 3 and the synchronizing input 69 of module 4.

Код с входа 68 модуля 4 синхронизирующим импульсом с входа 69 заносится в счетчик 65, с выхода которого этот код поступает на адресный выход 17 системы.The code from input 68 of module 4 by a synchronizing pulse from input 69 is entered into the counter 65, from the output of which this code is sent to the address output 17 of the system.

Одновременно, этот же синхронизирующий импульс проходит через элемент 66 ИЛИ, и задерживается на время занесения кода опорного адреса в счетчик 65 элементом 67. Затем данный импульс выдается на выход 18 системы в качестве сигнала управления считыванием содержимого ячейки памяти базы данных сервера по адресу, указанному на выходе 17 системы.At the same time, the same synchronizing pulse passes through the OR element 66, and is delayed by entering the reference address code into the counter 65 by the element 67. Then this pulse is output to the system output 18 as a control signal for reading the contents of the server database memory cell at the address indicated on output 17 of the system.

Код же общего количества записей данных адресов в разделе базы данных siteID с выхода 38 модуля 1 заносится через вход 60 модуля 3 в регистр 55 тем же синхронизирующим импульсом с выхода 40 модуля 1 через вход 61 модуля 3. С выхода регистра 55 этот код подается на один вход компаратора 57.The code of the total number of address data records in the siteID database section from the output 38 of module 1 is entered through the input 60 of module 3 into register 55 with the same clock pulse from the output 40 of module 1 through the input 61 of module 3. From the output of register 55 this code is sent to one comparator input 57.

По сигналу с выхода 18 системы сервер базы данных (на чертеже не показан) переходит на подпрограмму считывания содержимого ячейки базы данных по указанному на выходе 17 адресу, выдачи считанной записи базы данных на информационный 11 вход системы и занесения ее атрибутов в модуль 2 синхронизирующим импульсом, поступающим с сервера на вход 13 системы.Based on a signal from system output 18, the database server (not shown) goes to the subroutine for reading the contents of the database cell at the address indicated on output 17, issuing the read database record to the system’s information 11 input and entering its attributes into module 2 with a synchronizing pulse, coming from the server to the input 13 of the system.

В результате этого с входа 49 в регистр 45 синхронизирующим импульсом с входа 50 будут занесены атрибуты первой считанной из базы данных записи, имеющие следующую структуру:As a result of this, from the entrance 49 to the register 45, the synchronizing pulse from the input 50 will be entered the attributes of the first record read from the database, having the following structure:

КодThe code КодThe code Код признака доступаAccess Tag Code siteIDsiteID pathIDpathID - либо разрешения доступа к электронному документу с данным адресом; - or permission to access an electronic document with a given address; -либо запрещения доступа к электронному документу с данным адресомor prohibiting access to an electronic document with a given address

Код pathID из первой считанной записи из базы данных с первого выхода регистра 45 поступает на один вход компаратора 46, на другой информационный вход которого с выхода 39 модуля 1 поступает код pathID запрашиваемого электронного документа.The pathID code from the first read record from the database from the first output of the register 45 goes to one input of the comparator 46, the other information input of which from the output 39 of module 1 receives the pathID code of the requested electronic document.

Синхронизирующий импульс с входа 13 системы задерживается элементом 47 задержки на время занесения записи базы данных в регистр 45 модуля 2, и поступает на синхронизирующий вход компаратора 46.The synchronizing pulse from the input 13 of the system is delayed by the delay element 47 for the time of recording the database in the register 45 of module 2, and is supplied to the synchronizing input of the comparator 46.

По синхронизирующему сигналу компаратор 46 сравнивает входные коды, и, если сравниваемые атрибуты pathID не совпадают между собой, то на выходе 52 модуля 2 формируется сигнал, поступающий на вход 62 модуля 3 и далее на счетный вход счетчика 56, фиксирующего число записей, считанных из базы данных сервера.The comparator 46 compares the input codes by the synchronization signal, and if the pathID attributes being compared do not coincide, then the output 52 of module 2 generates a signal fed to the input 62 of module 3 and then to the counting input of the counter 56, fixing the number of records read from the database server data.

К данному моменту времени счетчик 56 зафиксирует факт осуществления считывания первой записи из базы данных сервера. Выход счетчика 56 подключен к одному входу компаратора 57, сравнивающего общее число записей данного сайта в базе данных сервера, хранящегося в регистре 55 с числом записей в счетчике 56.At this point in time, the counter 56 will record the fact of reading the first record from the server database. The output of the counter 56 is connected to one input of the comparator 57, comparing the total number of records of this site in the server database stored in the register 55 with the number of records in the counter 56.

Компаратор 57 модуля 3 сравнивает показания регистра 55 и счетчика 56 по синхронизирующему импульсу, поступающему на синхронизирующий вход компаратора 67 с выхода элемента 58 задержки.The comparator 57 of module 3 compares the readings of the register 55 and the counter 56 by the clock pulse supplied to the clock input of the comparator 67 from the output of the delay element 58.

Поскольку в счетчике 56 зафиксирована первая единица, то его показания будут меньше показаний регистра 55 и на выходе 63 модуля 3 появляется импульс, который через вход 70 модуля 4 будет поступать на счетный вход счетчика 65, увеличивая базовый адрес ячейки считывания на единицу.Since the first unit is fixed in the counter 56, its readings will be less than the readings of the register 55 and a pulse appears at the output of the module 3 63, which through the input 70 of the module 4 will go to the counting input of the counter 65, increasing the base address of the read cell by one.

Кроме того, этот же импульс проходит через элемент 66 ИЛИ на вход элемента 67 задержки, где задерживается на время окончания срабатывания счетчика 65, и далее вновь выдается через выход 18 системы в качестве сигнала управления считыванием очередной записи базы данных по адресу, сформированному на выходе 17 системы.In addition, the same pulse passes through the OR element 66 to the input of the delay element 67, where it is delayed by the end time of the counter 65, and then again issued through the system output 18 as a control signal for reading the next database record at the address generated at the output 17 system.

По сигналу с выхода 18 системы сервер базы данных вновь переходит на подпрограмму считывания содержимого ячейки базы данных по указанному на выходе 17 адресу, выдачи считанной записи базы данных на информационный вход 11 системы и занесения ее атрибутов в регистр 45 модуля 2 синхронизирующим импульсом, поступающим с сервера на вход 13.Based on a signal from system output 18, the database server again switches to the subroutine for reading the contents of the database cell at the address specified on output 17, issuing the read database record to the system information input 11 and entering its attributes into register 45 of module 2 with a synchronizing pulse from the server at the entrance 13.

Этот процесс считывания записей базы данных сервера будет продолжаться до тех пор, пока показания счетчика 56 и регистра 55 не сравняются между собой, что будет свидетельствовать о том, что запрашиваемого адреса электронного документа в базе данных сервера нет. В этом случае импульс формируется на выходе 64 модуля 3 и через выход 19 системы поступает на вход второго канала прерывания сервера базы данных.This process of reading server database records will continue until the readings of counter 56 and register 55 are equal, which will indicate that there is no requested electronic document address in the server database. In this case, the pulse is generated at the output 64 of the module 3 and through the output 19 of the system is fed to the input of the second channel of the database server interrupt.

С приходом этого сигнала сервер переходит на подпрограмму автоматической классификации запрашиваемого идентификатора электронного документа, в соответствии с которой данные идентификатора электронного документа с выхода 15 системы поступают в сервер базы данных, где осуществляется следующая последовательность операций:With the arrival of this signal, the server switches to a subroutine for automatic classification of the requested identifier of the electronic document, in accordance with which the data of the identifier of the electronic document from the output 15 of the system goes to the database server, where the following sequence of operations is performed:

- преобразование гипертекстового представления к специальному формату данных: отделение текста естественного языка от служебной HTML-разметки;- Transformation of the hypertext representation to a special data format: separation of the text of the natural language from the service HTML markup;

- анализ выделенного текста естественного языка с целью выделения значимых фрагментов; учет веса их вхождений в тексте для построения модели представления текста документа;- analysis of the selected text of the natural language in order to highlight significant fragments; accounting for the weight of their occurrences in the text to build a model for representing the text of the document;

- сравнение построенной модели представления текста с моделями заранее предопределенных классов документов, содержащими отличительные признаки и их значения, характеризующие тематику этих классов;- Comparison of the constructed model for presenting the text with models of predefined classes of documents containing distinctive features and their meanings characterizing the subject of these classes;

- принятие решения на основе проведенного сравнения об отнесении документа к одному или нескольким классам, при этом принятие решения о блокировании передачи HTTP-запроса пользователя к серверу в случае, когда тематика запрошенного электронного документа определена как нежелательная, как это показано на фиг.8.- making a decision on the basis of a comparison about assigning a document to one or more classes, while making a decision to block the transmission of an HTTP request from a user to the server when the subject of the requested electronic document is defined as undesirable, as shown in Fig. 8.

Если же сравниваемые атрибуты pathID на входах компаратора 46 модуля 2 совпадают между собой, то на выходе 53 модуля 2 формируется сигнал, поступающий на вход 86 модуля 5 и далее на одни входы элементов 78, 79 И, управляемые дешифратором 75, на вход 84 которого с выхода 51 модуля 2 поступает код признака доступа к данному электронному документу.If the compared pathID attributes at the inputs of the comparator 46 of module 2 coincide, then the output 53 of module 2 generates a signal fed to the input 86 of module 5 and then to one of the inputs of elements 78, 79 And, controlled by a decoder 75, to the input 84 of which output 51 of module 2 receives a code sign of access to this electronic document.

Дешифратор 75 расшифровывает код признака доступа и, если доступ к данному электронному документу разрешен, то дешифратор 75 открывает по второму входу элемент 78 И, через который проходит импульс с входа 86 и поступает как на прямой вход триггера 76, устанавливая его в единичное состояние, так и на обратный вход триггера 77, подтверждая его исходное состояние.The decoder 75 decrypts the code of the access flag and, if access to this electronic document is allowed, then the decoder 75 opens the And element 78 through the second input, through which the pulse from the input 86 passes and acts as a direct input to the trigger 76, setting it to a single state, so and on the reverse input of the trigger 77, confirming its initial state.

Переходя в единичное состояние, триггер 76 с прямого выхода высоким потенциалом открывает по одному входу элементы 80 И группы, на другой вход 85 которых с выхода 36 модуля 1 поступает идентификатор электронного документа, который через элементы 80 И группы выдаются на выход 16 системы.Turning to a single state, a flip-flop 76 with a direct output with high potential opens elements 80 And groups one input, to the other input 85 of which from the output 36 of module 1 an electronic document identifier is received, which through elements 80 And groups is output to system output 16.

Кроме того, синхронизирующий импульс с выхода элемента 78 И задерживается элементом 81 на время срабатывания триггера 76 и подключения элементов 80 И группы, и с выхода 20 системы выдается в качестве синхронизирующего сигнала выдачи электронного идентификатора электронного документа.In addition, the synchronizing pulse from the output of the And element 78 is delayed by the element 81 for the duration of the trigger 76 and the connection of the And elements of the 80 group, and from the output of the system 20 it is issued as a synchronization signal for issuing an electronic identifier of an electronic document.

Если же на входе дешифратора 75 будет зафиксирован код признака запрета доступа к адресу данного электронного документа, то открыт по второму входу будет элемент 79 И, через который синхронизирующий импульс с входа 86 установит триггер 77 в единичное состояние, а триггер 76 будет установлен в исходное состояние, при котором низким потенциалом с прямого выхода триггера 76 элементы 80 И группы будут закрыты, блокируя тем самым доступ к электронному документу.If, at the input of the decoder 75, a code sign indicating the prohibition of access to the address of this electronic document is recorded, then element 79 And will be open at the second input, through which the synchronizing pulse from input 86 will set trigger 77 to a single state, and trigger 76 will be set to its original state at which the low potential from the direct output of the trigger 76 elements 80 And groups will be closed, thereby blocking access to the electronic document.

Высокий потенциал с прямого выхода триггера 77 выдается на выход 21 системы в качестве сигнала запрета доступа к данному электронному документу.High potential from the direct output of the trigger 77 is issued to the output 21 of the system as a signal to deny access to this electronic document.

Таким образом, система осуществляет блокировку электронных документов, которые либо принадлежат к нежелательным ресурсам, либо сами классифицированы как нежелательные.Thus, the system blocks electronic documents that either belong to unwanted resources or are themselves classified as unwanted.

Применение метода автоматической классификации электронных документов, с помощью которого осуществляется анализ гипертекстового представления документа, выделение отличительных признаков, производится сравнение их значений и принимается решение о принадлежности документа к категории нежелательных либо допустимых, является отличительной чертой предложенной системы динамической контентной фильтрации.The use of the automatic classification method of electronic documents, with the help of which the analysis of the hypertext representation of the document is carried out, distinguishing features are distinguished, their values are compared and a decision is made whether the document belongs to the category of undesirable or permissible is a distinctive feature of the proposed dynamic content filtering system.

Таким образом, введение новых модулей и новых конструктивных связей позволило существенно повысить быстродействие системы путем локализации адресов записей базы данных по идентификаторам электронных документов.Thus, the introduction of new modules and new constructive connections made it possible to significantly increase the system performance by localizing the addresses of database records by identifiers of electronic documents.

Источники информации, принятые во внимание при составлении описания заявки:Sources of information taken into account when drawing up the description of the application:

1. Тумбе Д. Фильтрация Web-контента с использованием ISA Server / Открытые системы: [Электронный документ] / (http://www.osp.ru/win2000/2006/08/3829260/).1. Tumbe D. Filtering Web content using ISA Server / Open Systems: [Electronic Document] / (http://www.osp.ru/win2000/2006/08/3829260/).

2. Хилл Б. Решения для фильтрации Web-контента / Открытые системы: [Электронный документ] / (http://www.osp.ru/win2000/2004/05/177073/).2. Hill B. Web Content Filtering Solutions / Open Systems: [Electronic Document] / (http://www.osp.ru/win2000/2004/05/177073/).

3. Патент США №5136708 М. кл. G06F 15/16, 19923. US Patent No. 5136708 M. cl. G06F 15/16, 1992

4. Патент США №5129083 М. кл. G06F 12/00, 15/40, 1992 (прототип). 4. US Patent No. 5129083 M. cl. G06F 12/00, 15/40, 1992 (prototype).

Claims (1)

Автоматизированная система идентификации доступных ресурсов сети Интернет, содержащая модуль селекции опорных адресов сайтов в базе данных сервера, информационный и синхронизирующий входы которого являются первыми информационным и синхронизирующим входами системы соответственно, при этом первый информационный вход системы предназначен для приема запросов электронных документов по их сетевым адресам, первый синхронизирующий вход системы предназначен для приема сигналов занесения кодов запросов электронных документов в модуль селекции опорных адресов сайтов в базе данных сервера, а первый информационный выход модуля селекции опорных адресов сайтов в базе данных сервера предназначен для выдачи запросов электронных документов по их сетевым адресам на первый информационный вход сервера базы данных, модуль идентификации адресов электронных документов в списке доступа, один информационный и синхронизирующий входы которого являются вторыми информационным и синхронизирующим входами системы соответственно, при этом второй информационный вход системы предназначен для приема записей базы данных сервера, а второй синхронизирующий вход системы предназначен для приема сигналов занесения записей базы данных сервера в модуль идентификации адресов электронных документов в списке доступа, модуль формирования сигналов управления выборкой записей базы данных сервера, первый информационный вход которого соединен со вторым информационным выходом модуля селекции опорных адресов сайтов в базе данных сервера, синхронизирующий модуль формирования сигналов управления выборкой записей базы данных сервера подключен к синхронизирующему выходу модуля селекции опорных адресов сайтов в базе данных сервера, адресный выход модуля формирования сигналов управления выборкой записей базы данных сервера является адресным выходом системы, предназначенным для выдачи адресов записей базы данных на адресный вход сервера базы данных, а синхронизирующий выход модуля формирования сигналов управления выборкой записей базы данных сервера является первым синхронизирующим выходом системы, предназначенным для выдачи сигналов управления на вход первого канала прерывания сервера базы данных, отличающаяся тем, что система содержит модуль идентификации временных циклов выборки адресов из списка доступа, информационный вход которого соединен с третьим информационным выходом модуля селекции опорных адресов сайтов в базе данных сервера, синхронизирующий вход модуля идентификации временных циклов выборки адресов из списка доступа подключен к синхронизирующему выходу модуля селекции опорных адресов сайтов в базе данных сервера, а счетный вход модуля идентификации временных циклов выборки адресов из списка доступа соединен с тактирующим выходом модуля идентификации адресов электронных документов в списке доступа, при этом один выход модуля идентификации временных циклов выборки адресов из списка доступа подключен к счетному входу модуля формирования сигналов управления выборкой записей базы данных сервера, а другой выход модуля идентификации временных циклов выборки адресов из списка доступа является вторым синхронизирующим выходом системы, предназначенным для выдачи сигналов управления на вход второго канала прерывания сервера базы данных, и модуль селекции доступа к электронным документам, один информационный вход которого соединен с первым выходом модуля селекции опорных адресов сайтов в базе данных сервера, другой информационный вход модуля селекции доступа к электронным документам подключен к информационному выходу модуля идентификации адресов электронных документов в списке доступа, а синхронизирующий вход модуля селекции доступа к электронным документам соединен с синхронизирующим выходом модуля идентификации адресов электронных документов в списке доступа, при этом информационный выход модуля селекции доступа к электронным документам является вторым информационным выходом системы, предназначенным для выдачи кодов электронных адресов документов в сеть Интернет, синхронизирующий выход модуля селекции доступа к электронным документам является третьим синхронизирующим выходом системы, предназначенным для выдачи синхронизирующих сигналов передачи кодов электронных адресов документов в сеть Интернет, а сигнальный выход модуля селекции доступа к электронным документам является сигнальным выходом системы, предназначенным для выдачи сигнала запрета допуска к электронным документам сети.
Figure 00000001
An automated system for identifying available resources of the Internet, containing a module for selecting the reference addresses of sites in the server database, the information and synchronizing inputs of which are the first information and synchronizing inputs of the system, respectively, while the first information input of the system is designed to receive requests for electronic documents at their network addresses, the first synchronizing input of the system is intended for receiving signals of entering codes of requests for electronic documents into the module section of the reference addresses of sites in the server database, and the first information output of the module for selecting reference addresses of sites in the server database is intended to issue requests for electronic documents at their network addresses to the first information input of the database server, the module for identifying addresses of electronic documents in the access list, one the information and synchronization inputs of which are the second information and synchronization inputs of the system, respectively, while the second information input of the system is intended for receiving server database records, and the second synchronizing system input is for receiving signals to enter server database records into an electronic document address identification module in an access list, a signal generation module for generating server database records selection, the first information input of which is connected to the second information output a module for selecting reference addresses of sites in the server database, a synchronization module for generating signals to control the selection of server database records it is connected to the synchronizing output of the module for selecting the reference addresses of sites in the server database, the address output of the module for generating signals for controlling the selection of server database records is the address output of the system designed to provide addresses of database records to the address input of the database server, and the synchronizing output of the signal generating module control the selection of server database records is the first synchronizing output of the system, designed to issue control signals to the input of the first to database server interruption analysis, characterized in that the system contains a module for identifying time cycles for selecting addresses from the access list, the information input of which is connected to the third information output of the module for selecting reference addresses of sites in the server database, synchronizing the input of the module for identifying temporary cycles for selecting addresses from the list access is connected to the synchronizing output of the module for selecting the reference addresses of sites in the server database, and the counting input of the module for identifying time cycles of sampling addresses from the access list is connected to the clocking output of the electronic document address identification module in the access list, while one output of the identification module for temporary cycles of address selection from the access list is connected to the counting input of the signal generation module for generating control records for server database records, and another output of the temporary identification module cycles of selecting addresses from the access list is the second synchronizing output of the system, designed to issue control signals to the input of the second channel a database server, and a selection module for access to electronic documents, one information input of which is connected to the first output of the selection module of reference addresses of sites in the server database, another information input of the selection module of access to electronic documents is connected to the information output of the identification module of electronic documents addresses in access list, and the synchronizing input of the module for selecting access to electronic documents is connected to the synchronizing output of the module for identifying addresses of electronic documents access list, the information output of the module for selecting access to electronic documents is the second information output of the system, intended for issuing codes of electronic addresses of documents on the Internet, the synchronizing output of the module for selecting access to electronic documents is the third synchronizing output of the system, for issuing synchronizing signals for transmitting codes of electronic addresses of documents to the Internet, and the signal output of the module for selecting access to electronic dock omen is the system's signal output intended for issuing a signal to prohibit access to electronic network documents.
Figure 00000001
RU2008116780/22U 2008-04-30 2008-04-30 AUTOMATED SYSTEM OF IDENTIFICATION OF AVAILABLE INTERNET NETWORK RESOURCES RU76482U1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2008116780/22U RU76482U1 (en) 2008-04-30 2008-04-30 AUTOMATED SYSTEM OF IDENTIFICATION OF AVAILABLE INTERNET NETWORK RESOURCES

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2008116780/22U RU76482U1 (en) 2008-04-30 2008-04-30 AUTOMATED SYSTEM OF IDENTIFICATION OF AVAILABLE INTERNET NETWORK RESOURCES

Publications (1)

Publication Number Publication Date
RU76482U1 true RU76482U1 (en) 2008-09-20

Family

ID=39868486

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008116780/22U RU76482U1 (en) 2008-04-30 2008-04-30 AUTOMATED SYSTEM OF IDENTIFICATION OF AVAILABLE INTERNET NETWORK RESOURCES

Country Status (1)

Country Link
RU (1) RU76482U1 (en)

Similar Documents

Publication Publication Date Title
RU2419986C2 (en) Combining multiline protocol accesses
CN101711470A (en) A system and method for creating a list of shared information on a peer-to-peer network
CN101453424B (en) Network information resource access control method and system
CN103118035B (en) Method and the device of analyzing web site access request parameters legal range
CN102077201A (en) System and method for dynamic and real-time categorization of webpages
CN112866023A (en) Network detection method, model training method, device, equipment and storage medium
CN107547671A (en) A kind of URL matching process and device
CN109379326A (en) XML message rule method of calibration, equipment and storage medium
CN103166966A (en) Method and device for distinguishing illegal access request to website
CN110324273A (en) A kind of Botnet detection method combined based on DNS request behavior with domain name constitutive characteristic
KR20180074774A (en) How to identify malicious websites, devices and computer storage media
US11797617B2 (en) Method and apparatus for collecting information regarding dark web
CN107395650A (en) Even method and device is returned based on sandbox detection file identification wooden horse
RU77465U1 (en) DYNAMIC CONTENT FILTRATION SYSTEM OF ELECTRONIC DOCUMENTS
KR100937217B1 (en) Optimizing system and method of signature
CN106528805A (en) Mobile internet baleful program URL intelligent analyzing and mining method based on users
CN105323751A (en) Mobile phone short message monitoring device
RU2368004C1 (en) System for control of access to internet network resources
RU76482U1 (en) AUTOMATED SYSTEM OF IDENTIFICATION OF AVAILABLE INTERNET NETWORK RESOURCES
CN112769739A (en) Database operation violation processing method, device and equipment
US20040181752A1 (en) Apparatus, method and program for converting structured document
CN113904851A (en) Network information processing method, user plane function system, medium, and electronic device
CN106411944B (en) A kind of management method and device of network access
CN107294969A (en) A kind of SQL injection attack detection and system based on SDN
Ribaux et al. Digital transformations in forensic science and their impact on policing

Legal Events

Date Code Title Description
MM1K Utility model has become invalid (non-payment of fees)

Effective date: 20090501