RU2701990C1 - Способ использования системы определения тематики документов для целей информационной безопасности - Google Patents
Способ использования системы определения тематики документов для целей информационной безопасности Download PDFInfo
- Publication number
- RU2701990C1 RU2701990C1 RU2018105780A RU2018105780A RU2701990C1 RU 2701990 C1 RU2701990 C1 RU 2701990C1 RU 2018105780 A RU2018105780 A RU 2018105780A RU 2018105780 A RU2018105780 A RU 2018105780A RU 2701990 C1 RU2701990 C1 RU 2701990C1
- Authority
- RU
- Russia
- Prior art keywords
- user
- document
- access
- web page
- topics
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/22—Arrangements for preventing the taking of data from a data transmission channel without authorisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Изобретение относится к способу автоматического управления доступом к веб-странице. Технический результат заключается в обеспечении автоматического управления доступом к веб-странице. В способе формируют запрос на доступ к веб-странице в сети с устройств пользователей; внешний сервер получает запрос пользователя, формирует ответ и отправляет его обратно к пользователю; фильтрующий сервер перехватывает сформированный ответ для пользователя, осуществляет извлечение текстовой части из полученной веб-страницы, анализирует извлеченный текст запрошенного документа и разбивает текст на уровень предложений и уровень слов; осуществляет лемматизацию полученных предложений и слов; сравнивает приведенные предложения и слова к словарной форме с базой классифицированных нежелательных слов, словосочетаний и цитат; формирует список тематик, к которым относится этот документ, который сравнивается с профилем доступа пользователя, в котором зафиксированы критерии, определяющие, может ли пользователь получить доступ к документу, отнесенному к данному набору тематик, или нет; по результатам сравнения блокируют или разрешают доступ к документу на веб-странице. 3 з.п. ф-лы, 4 ил.
Description
ОБЛАСТЬ ТЕХНИКИ
Настоящее техническое решение относится к системам управления доступом пользователей в Интернет и защита пользователей от нежелательного контента в Интернете.
УРОВЕНЬ ТЕХНИКИ
В данный момент, существует множество способов предотвратить посещение детьми нежелательных сайтов, довольно большое количество программ, ограничивающих к ним доступ. В зависимости от степени владения родителями компьютером, можно найти как более сложные и детальные, так и более простые способы оградить ребенка от нежелательного контента и других рисков Сети, не ограничивая при этом его доступ к огромному количеству полезных образовательных и развлекательных ресурсов в Интернете.
Из патентной заявки US 20150180746 A1 (МПК H04L 12/26, опубл. 25.06.2015) известна система мониторинга и контроля доступа за мобильными устройствами, которая основана том, что на устройство ребенка устанавливается программный модуль (агент), осуществляющий перехват различных данных (данные контактов по телефонной связи, SMS, данные об использовании приложений и веб-сайтов, геолокацию устройства и др., а также по голосовых данных и изображений с видеокамеры). Эти данные передаются с устройства на специализированный сервер, где производится анализ этих данных и принимается решение о доступе ребенка к данному виду информации или о ее блокировке в соответствии с настройками, сделанными родителями. Решения, принятые на сервере, передаются на устройство ребенка.
Недостатком описанной выше системы является то, что требуется обязательная установка на устройство ребенка агента, выполняющего сбор информации. Этот агент должен обеспечить корректное встраивание во все контролируемые приложения. Это позволяет использовать данную систему только для ограниченного числа сценариев, например, для контроля за использованием устройства у ребенка, которому родитель может принудительно установить подобное ПО на телефон, планшет или компьютер.
В качестве решений на текущем уровне техники, локально решающих вопросы ограничения доступа пользователей к определенным веб-сайтам с помощью родительского контроля можно рассматривать такие патентные документы и публикации, например, раскрытые в следующих документах: US 20130040629 A1, US 20090213001 A1, RU 2446460 C1, RU 2336561 C2.
Таким образом, известные из уровня техники решения, предназначенные для ограничения доступа пользователей к определенным веб-сайтам с помощью родительского контроля, имеют ограниченную функциональность, поскольку в них не предусмотрена возможность определения тематики ресурсов непосредственно по тексту веб-страницы, которую запросил пользователь, с учетом лингвистических особенностей языка, на котором написана данная веб-страница, а также имеют недостаточную надежность защиты пользователей от нежелательного контента из сети.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Технической проблемой, на решение которой направлено заявленное техническое решение, является создание способа использования системы определения тематики документов для целей информационной безопасности, который с помощью системы автоматического определения тематик документов, размещенных на веб-страницах, запрошенных пользователем в сети, позволяет в режиме реального времени осуществлять автоматизированную обработку и анализ содержания запрашиваемых пользователем веб-страниц, чтобы защитить от просмотра потенциально вредных и нежелательных материалов, а именно блокировать неподходящие и опасные веб-сайты.
Технический результат заключается в надежной защите пользователей от нежелательного содержания запрашиваемых веб-страниц, за счет автоматического определения тематик веб-страниц.
В предпочтительном варианте реализации заявлен способ использования системы определения тематики документов для целей информационной безопасности, заключающийся в выполнении этапов, на которых:
с помощью системы автоматического определения тематик документов, размещенных на веб-страницах, запрошенных пользователем в сети, в состав которой входят устройства пользователей, внешний сервер и фильтрующий сервер:
формируют запрос на доступ к веб-странице в сети с устройств пользователей;
внешний сервер получает запрос пользователя, формирует ответ и отправляет его обратно к пользователю;
фильтрующий сервер перехватывает сформированный ответ для пользователя и с помощью модуля автоматического определения тематик документа осуществляет извлечение текстовой части из полученной веб-страницы, анализирует извлеченный текст запрошенного документа и разбивает текст на уровень предложений и уровень слов;
осуществляет лемматизацию полученных предложений и слов;
сравнивает приведенные предложения и слова к словарной форме с базой классифицированных нежелательных слов, словосочетаний и цитат;
на основе полученного сравнения осуществляет автоматическое определение тематик проанализированного документа и формирует список тематик, к которым относится этот документ;
полученный набор тематик документа сравнивается с профилем доступа пользователя, в котором зафиксированы критерии, определяющие, может ли пользователь получить доступ к документу, отнесенному к данному набору тематик или нет;
по результатам сравнения блокируют или разрешают доступ к документу на веб-странице.
В частном варианте извлеченную текстовую часть разбивают на уровень предложений и уровень слов, используя модули морфологии.
В частном варианте сеть может быть локальной или глобальной.
В частном варианте автоматически распознают язык текстовой части полученной веб-страницы.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:
Фиг. 1 иллюстрирует общий вид системы автоматического определения тематик документов;
Фиг. 2 иллюстрирует блок-схему выполнения способа;
Фиг. 3 иллюстрирует блок-схему процедуры автоматического определения тематики документа;
Фиг. 4 иллюстрирует пример выполнения вычислительного устройства.
ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.
Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.
Настоящее изобретение направлено на обеспечение способа использования системы определения тематики документов для целей информационной безопасности.
В заявленном техническом решении автоматическое определение тематик документов, запрошенных веб-страниц, осуществляется с использованием базы классифицированных образцов терминов, словосочетаний и цитат, учитывающей лингвистические особенности текста на естественном языке. Предложенная процедура позволяет принимать решение о доступе непосредственно по тексту документа, в том числе без привлечения информации о параметрах, не связанных с содержимым документа. Это позволяет принимать правильные решение о предоставлении доступа даже в случае перемещения документа, изменения содержания документа, в том числе в случаях динамического содержания или высокой степени персонализации документа.
Как представлено на Фиг. 1, система автоматического определения тематик документов (100) включает устройства пользователей (110), фильтрующий сервер (120) и внешний сервер (130).
В качестве устройств пользователей (110) может использоваться смартфон, планшет, персональный компьютер, ноутбук, игровая приставка, телевизор с функцией Smart-TV и т.п.
Пользовательское взаимодействие с внешними серверами в публичных компьютерных сетях осуществляется с помощью программных средств доступа к веб-сервисам - браузеров или приложений, взаимодействующих с удаленными веб-серверами по стандартным протоколам взаимодействия с веб-серверами. Для нормальной работы приложений не требуется дополнительная модификация программных средств доступа к веб-сервисам или установка дополнительных программных агентов на устройстве пользователя. Взаимодействие с этими приложениями осуществляется с помощью стандартных средств ввода/вывода (средства В/В), обеспечивающих распознавание команд с последующим их преобразованием в машиночитаемую форму и вывод информации пользователю.
К таким средствам В/В можно отнести, не ограничиваясь, клавиатуру, сенсорный дисплей, экран, монитор, динамики, проектор, пульт Д/У, манипулятор мышь, джойстик, трекбол, тачпад, световое перо, стилус и т.п.
Предлагаемый способ использования системы определения тематики документов для целей информационной безопасности предполагает выполнение следующей последовательности операций (см. фиг. 2).
На первом этапе пользователь на своем устройстве формирует запрос на доступ к веб-странице в сети (202).
Внешний сервер с помощью программного обеспечения обрабатывает данный запрос, формирует ответ, содержащий запрошенную пользователем веб-страницу, и передает его обратно на пользовательское устройство (203). При этом внешний сервер может быть размещен, как в локальной сети, так и глобальной сети Интернет.
Ответ, сформированный внешним сервером, перехватывает фильтрующий сервер (204). На следующем этапе, фильтрующий сервер с помощью модуля автоматического определения тематик документа осуществляет извлечение текстовой части из полученной веб-страницы, анализирует извлеченный текст запрошенного документа и разбивает текст на уровень предложений и уровень слов (205). Осуществляет лемматизацию полученных предложений и слов (206). Сравнивает (207) приведенные предложения и слова к словарной форме с базой классификации (306, см. фиг. 3), в которой хранятся нежелательные слова, словосочетания и цитаты.
На основе полученного сравнения фильтрующий сервер с помощью модуля автоматического определения тематик документа осуществляет автоматическое определение тематик проанализированного документа и формирует список тематик, к которым относится этот документ (208).
На следующем этапе, фильтрующий сервер с помощью блока проверки тематик по профилю доступа пользователя выполняет сравнение списка тематик (209), распознанных модулем автоматического определения тематики, и сравнивает их с правилами доступа для данного пользователя, определенными в базе профиля доступа. По результатам сравнения формируется решение о том, можно ли пользователю разрешить доступ к запрошенному документу (210) или доступ к нему должен быть заблокирован (211).
Если критерии, определенные в профиле доступа, позволяют пользователю просмотреть документы распознанных тематик, формируется решение о предоставлении пользователю доступ к документу. В случае если распознанный набор тематик не соответствует критериям профиля доступа, формируется решение о блокировке доступа. В этом случае доступ к документу блокируется.
Блок проверки тематик может функционировать совместно с системой идентификации и/или авторизации пользователей (внешней или внутренней), что позволяет в частных реализациях формировать различные правила фильтрации для разных групп пользователей. Система авторизации может поддерживать различные виды идентификации пользователей. В частных реализациях могут использоваться авторизации пользователя по логину и паролю, авторизация по аппаратному ключу или смарт-карте, идентификация пользователей по их адресу, точке подключения, геолокации и т.д.
В ряде случаев (если это определено в профиле доступа) фильтрующий сервер может выполнить частичную блокировку материалов документа. При обнаружении в документе блоков текста, не соответствующих правилам доступа, данные блоки текста могут быть удалены из документа или заменены на последовательность знаков, замещающих собой нежелательную часть текста. При этом остальные части документа, не содержащие недопустимых материалов, и их форматирования сохраняются.
В зависимости от тематики запрошенного документа ответ для пользователя может содержать исходный документ (если документ соответствует профилю доступа пользователя), его модифицированную копию (если профилю не соответствуют только части запрошенного документа) или сообщение о запрещении доступа к запрошенному документу (в случае, если тематика документа не соответствует профилю доступа пользователя).
Структура и логика работы автоматического определения тематики страницы подробнее рассматривается на Фиг. 3. Фильтрующий сервер на вход (301) блока автоматического определения тематики страницы направляет перехваченный ответ для пользователя, где с помощью модуля выделения текста извлекают и выделяют текстовую часть документа из полученной веб-страницы (302). Данный модуль анализирует полученное в электронном виде представление документа и определяет его формат: например, документ в формате HyperText Markup Language (HTML), в формате офисного документа или структурированный ответ веб-сервера в формате JavaScript Object Notation (JSON) и т.п. В зависимости от распознанного типа документа вызывается подходящий Модуль разбора соответствующего формата.
Результатом работы является текстовое представление документа с сохранением естественного разделения текста на структурные единицы (разделы, абзацы и т.п.), а также информация о выделении фрагментов текста (жирный шрифт, курсив, цветовое выделение и т.п.). Дальнейшая работа производится с этим текстовым представлением.
Следующим этапом обработки является разделение текста на отдельные слова и предложения (303). При выделении слов используются Модули морфологии, позволяющие учесть лингвистические особенности словообразования в тексте, а также определить параметры словоформы (склонение, падеж, число), в которой в тексте употребляется данное слово. Параллельно производится синтаксический разбор текста и в тексте выделяются отдельные предложения. Результатом данной стадии является последовательность отдельных слов, при которых сохранена информация о положении их в тексте (координатная информация).
Далее производится лемматизация текста (304), при которой текст преобразуется в последовательность числовых идентификаторов, каждый из которых однозначно идентифицирует нормальную форму каждого слова в тексте. Для этой операции также используются Модули морфологии. При каждом идентификаторе также сохраняется информация о положении слова в тексте и предложении, информация о форме, в которой использовано данное слово и информация о выделении слова. Данная информация используется для учета связей внутри предложения, используемой при расчете степени соответствия тематики анализируемому тексту.
Полученный лемматизированный текст используется для определения тематики документа.
Для определения тематики в цифровом образе текста производится поиск слов, словосочетаний и цитат (305), включенных в базу классификации (306). Термины базы классификации предварительно также лемматизируются.
Для классификации текста производится поиск всех терминов базы классификации в обрабатываемом тексте. При этом производится поиск не только точных вхождений, но также вхождений отдельных слов терминов в анализируемый текст. В результате поиска формируется список слов для каждого из терминов, содержащихся в базе классификации, с данными о положении этих слов в тексте.
После этого производится оценка вероятности соответствия текста тематикам (307), представленным в базе классификации (306). При оценке вероятности учитывается наличие в анализируемом тексте точного или частичного появления текста термина из базы классификации, взаимное расположение найденных слов термина в предложении и тексте в целом, присутствие слов термина в одном предложении, частота встречаемости терминов, форма и согласование слов в найденных терминах, наличие выделения в тексте слов, входящих в термин, наличие в тексте других терминов из данной тематики или других близких тематик. Результатом данной процедуры является список тематик с оценками вероятности соответствия анализируемого текста заданной тематике.
Из списка тематик отбирается набор тематик, которые наиболее близко соответствуют данному тексту. Из них формируется финальный список тематик, к которым относится данный текст (308). Данный список тематик используется в качестве результата автоматического определения тематики документа.
Набор тематик, распознаваемых системой, и правила классификации обрабатываемых текстов определяется набором слов, словосочетаний и цитат, включенных в базу классификации (306). Это позволяет настраивать систему классификации на требуемый набор тематик. Ниже приведен пример тематик, содержание которых является нежелательными для просмотра несовершеннолетними и доступ этих пользователей к документам таких тематик должен быть заблокирован:
- Порнография - материалы порнографического и эротического характера. Распространение таких материалов среди детей запрещено законодательно;
- Контент для взрослых - к данной категории прежде всего относятся материалы, эксплуатирующие интерес к сексуальной жизни, но при этом тематически, как правило, не принадлежащие к порнографии или эротике;
- Знакомства - знакомства в Интернете, в том числе знакомства для взрослых, интим-знакомства, услуги по организации знакомств;
- Нецензурная лексика - нецензурная и грубая лексика, в том числе шутки, анекдоты, в том числе художественные произведения, содержащие нецензурную лексику;
- Наркотики - информация о наркотиках, в том числе рецепты приготовления и употребления, о неправильном использовании лекарственных препаратов, новости о преступлениях, связанных с наркотиками, а также материалы о вреде наркотиков, о борьбе с наркоманией и т.п.;
- Алкоголь - пропаганда алкоголя, рецепты и способы приготовления и употребления алкогольных напитков, новости о происшествиях с участием лиц, находящихся в состоянии алкогольного опьянения;
- Пропаганда курения - пропаганда курения, рецепты приготовления и способы употребления табачных изделий, материалы о борьбе с курением;
- Азартные игры - азартные игры и лотереи, игры на реальные или виртуальные деньги, информация и рекомендации по размещению ставок, участию в лотереях, азартных играх, виртуальные казино и рискованные предприятия, спортивные пари и тотализаторы;
- Самоубийства - Информация о самоубийствах, включая новости, пропаганду, способы, истории и т.п., которая потенциально может побудить детей к совершению действий, представляющих угрозу их жизни;
- Насилие, жестокость - информация о насильственных действиях против человека или животных, насильственная преступность, сексуальное насилие, жестокие компьютерные игры, новости о насилии, а также материалы, способные вызвать страх, ужас или панику;
- Экстремизм, национализм - категория, прежде всего, предназначена для блокирования экстремистских материалов, распространение которых на территории Российской Федерации запрещено;
- Взрывчатые вещества, оружие - материалы с информацией об изготовлении взрывчатых веществ и оружия; и в первую очередь - о способах их изготовления в домашних условиях;
- Секты/эзотерика - религиозные секты, сайты сект и информация о сектах, в том числе псевдохристианские, псевдовосточные, неоязыческие секты, психокульты и др. В Методических рекомендациях Министерства образования информация такого рода названа не совместимой с задачами образования;
- Учебные работы - готовые домашние задания, шпаргалки, рефераты, курсовые и другие виды учебных работ. Категория блокирует материалы, которые дают возможность учащимся списать или купить готовые учебные работы вместо того, чтобы выполнить их самостоятельно.
На Фиг. 4 представлен пример исполнения вычислительного устройства (400) для реализации функционала по управлению доступом пользователей в Интернет и защита пользователей от нежелательного контента в Интернете.
В общем случае устройство (400) содержит такие компоненты, как: один или более процессоров (401), по меньшей мере один блок оперативной памяти (402), средство хранения данных (403), интерфейсы ввода/вывода (404), средство В/В (405), средство сетевого взаимодействия (406), универсальную шину (410).
Процессор (401) устройства выполняет основные вычислительные операции, необходимые для функционирования системы (100) или функционала одного или более ее компонентов. Процессор (401) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (402).
Память (402), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.
Средство хранения данных (403) может выполняться в виде HDD, SSD дисков, рейд массива, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средства (403) позволяют выполнять долгосрочное хранение различного вида информации, например, истории обработки поисковых запросов, идентификаторов пользователей и т.п.
Интерфейсы (404) представляют собой стандартные средства для подключения и работы с серверами, например, USB, RS232, RJ45, LPT, СОМ, HDMI, PS/2, Lightning, Fire Wire и т.п.
Выбор интерфейсов (404) зависит от конкретного исполнения устройства (400), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.
В качестве средств В/В данных (405) может использоваться: клавиатура, джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.
Компоненты системы соединяются посредством средств сетевого взаимодействия (406), которые выбираются из средств, предназначенных для реализации процесса коммуникации между различными блоками посредством проводной и/или беспроводной связи, в частности, такими типами связи могут являться: GSM, GPRS, LTE, 5G, WLAN, WMAN, Wi-Fi, Bluetooth, BLE, спутниковая связь, NFC, Ethernet, USB, IrDa, Lightning, UART, CAN и т.п.
Взаимодействие всех компонентов устройства производится путем обмена данными через универсальную шину (410).
Система управления доступом сохраняются на Средстве хранения данных (403) в виде последовательности команд и загружаются в Память (402) при запуске устройства. Процессор (401) выполняет последовательность команд системы управления доступом и осуществляет взаимодействие с пользователями системы и внешними серверами посредством интерфейсов (406). Взаимодействие с администратором системы, выполняющим настройку и управление работой системы управления доступом, осуществляется через средства В/В данных (404 и 405).
Данные, необходимые для работы системы управления доступом, могут быть сохранены на Средстве хранения данных (403) или к ним может быть предоставлен удаленный доступ через набор интерфейсов (406).
В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.
Claims (13)
1. Способ автоматического управления доступом к веб-странице, заключающийся в выполнении этапов, на которых:
с помощью системы автоматического определения тематик документов, размещенных на веб-страницах, запрошенных пользователем в сети, в состав которой входят устройства пользователей, внешний сервер и фильтрующий сервер:
формируют запрос на доступ к веб-странице в сети с устройств пользователей;
внешний сервер получает запрос пользователя, формирует ответ и отправляет его обратно к пользователю;
фильтрующий сервер перехватывает сформированный ответ для пользователя и с помощью модуля автоматического определения тематик документа осуществляет извлечение текстовой части из полученной веб-страницы, анализирует извлеченный текст запрошенного документа и разбивает текст на уровень предложений и уровень слов;
осуществляет лемматизацию полученных предложений и слов;
сравнивает приведенные предложения и слова к словарной форме с базой классифицированных нежелательных слов, словосочетаний и цитат;
на основе полученного сравнения осуществляет автоматическое определение тематик проанализированного документа и формирует список тематик, к которым относится этот документ;
полученный набор тематик документа сравнивается с профилем доступа пользователя, в котором зафиксированы критерии, определяющие, может ли пользователь получить доступ к документу, отнесенному к данному набору тематик, или нет;
по результатам сравнения блокируют или разрешают доступ к документу на веб-странице.
2. Способ по п. 1, характеризующийся тем, что извлеченную текстовую часть разбивают на уровень предложений и уровень слов, используя модули морфологии.
3. Способ по п. 1, характеризующийся тем, что сеть может быть локальной или глобальной.
4. Способ по п. 1, характеризующийся тем, что автоматически распознают язык текстовой части полученной веб-страницы.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018105780A RU2701990C1 (ru) | 2018-07-12 | 2018-07-12 | Способ использования системы определения тематики документов для целей информационной безопасности |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018105780A RU2701990C1 (ru) | 2018-07-12 | 2018-07-12 | Способ использования системы определения тематики документов для целей информационной безопасности |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2701990C1 true RU2701990C1 (ru) | 2019-10-02 |
Family
ID=68170877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018105780A RU2701990C1 (ru) | 2018-07-12 | 2018-07-12 | Способ использования системы определения тематики документов для целей информационной безопасности |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2701990C1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2823436C1 (ru) * | 2023-12-21 | 2024-07-23 | Федеральное государственное бюджетное учреждение науки Институт системного программирования им. В.П. Иванникова Российской академии наук | Система автоматического определения тематики текстовых документов на основе объяснимых методов искусственного интеллекта |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001098934A2 (en) * | 2000-06-20 | 2001-12-27 | Privo, Inc. | Method and apparatus for granting access to internet content |
RU2305314C1 (ru) * | 2006-06-28 | 2007-08-27 | Общество с ограниченной ответственностью "Центр Компьютерного моделирования" | Способ поиска и выборки информации из различных баз данных |
US20070271220A1 (en) * | 2006-05-19 | 2007-11-22 | Chbag, Inc. | System, method and apparatus for filtering web content |
RU2336561C2 (ru) * | 2002-06-27 | 2008-10-20 | Майкрософт Корпорейшн | Фильтрация контента при веб-просмотре |
RU2409849C2 (ru) * | 2008-07-24 | 2011-01-20 | Закрытое Акционерное Общество "ТЕЛЕФОРМ" | Способ поиска информации в политематических массивах неструктурированных текстов |
RU2419858C2 (ru) * | 2004-10-05 | 2011-05-27 | Майкрософт Корпорейшн | Система, способ и интерфейс для обеспечения персонализированного поиска и доступа к информации |
RU2446460C1 (ru) * | 2010-11-18 | 2012-03-27 | Учреждение Российской академии наук Институт Системного Анализа РАН (ИСА РАН) | Способ и система фильтрации веб-контента |
US8601084B2 (en) * | 2005-01-20 | 2013-12-03 | Carrie Carlander | Controlling, filtering, and monitoring of mobile device access to the internet, data, voice, and applications |
-
2018
- 2018-07-12 RU RU2018105780A patent/RU2701990C1/ru not_active IP Right Cessation
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001098934A2 (en) * | 2000-06-20 | 2001-12-27 | Privo, Inc. | Method and apparatus for granting access to internet content |
RU2336561C2 (ru) * | 2002-06-27 | 2008-10-20 | Майкрософт Корпорейшн | Фильтрация контента при веб-просмотре |
RU2419858C2 (ru) * | 2004-10-05 | 2011-05-27 | Майкрософт Корпорейшн | Система, способ и интерфейс для обеспечения персонализированного поиска и доступа к информации |
US8601084B2 (en) * | 2005-01-20 | 2013-12-03 | Carrie Carlander | Controlling, filtering, and monitoring of mobile device access to the internet, data, voice, and applications |
US20070271220A1 (en) * | 2006-05-19 | 2007-11-22 | Chbag, Inc. | System, method and apparatus for filtering web content |
RU2305314C1 (ru) * | 2006-06-28 | 2007-08-27 | Общество с ограниченной ответственностью "Центр Компьютерного моделирования" | Способ поиска и выборки информации из различных баз данных |
RU2409849C2 (ru) * | 2008-07-24 | 2011-01-20 | Закрытое Акционерное Общество "ТЕЛЕФОРМ" | Способ поиска информации в политематических массивах неструктурированных текстов |
RU2446460C1 (ru) * | 2010-11-18 | 2012-03-27 | Учреждение Российской академии наук Институт Системного Анализа РАН (ИСА РАН) | Способ и система фильтрации веб-контента |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2823436C1 (ru) * | 2023-12-21 | 2024-07-23 | Федеральное государственное бюджетное учреждение науки Институт системного программирования им. В.П. Иванникова Российской академии наук | Система автоматического определения тематики текстовых документов на основе объяснимых методов искусственного интеллекта |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107547555B (zh) | 一种网站安全监测方法及装置 | |
Frauenstein et al. | Susceptibility to phishing on social network sites: A personality information processing model | |
Kolluri et al. | CoVerifi: A COVID-19 news verification system | |
US10375187B1 (en) | Suicide and alarming behavior alert/prevention system | |
RU2670030C2 (ru) | Способы и системы для определения нестандартной пользовательской активности | |
US20180349502A1 (en) | Data Content Filter | |
Ruan et al. | One App, Two Systems: How WeChat uses one censorship policy in China and another internationally | |
Brennan et al. | Adversarial stylometry: Circumventing authorship recognition to preserve privacy and anonymity | |
US20100011000A1 (en) | Managing the creation, detection, and maintenance of sensitive information | |
JP2020017275A (ja) | アプリケーションの内容分析を利用してユーザアクセスを制御する方法およびシステム | |
CN110909531A (zh) | 信息安全的甄别方法、装置、设备及存储介质 | |
US9998407B2 (en) | System and method for managing online messages using trust values | |
Roth et al. | Evaluating news media reports on the'blue whale challenge'for adherence to suicide prevention safe messaging guidelines | |
US20150067867A1 (en) | Risk Identification | |
US20140223572A1 (en) | Message service providing method, and apparatus and system therefor | |
EP3627796A1 (en) | Dynamic and private security fingerprinting | |
RU2697925C1 (ru) | Гибридная автоматическая система управления доступом пользователей к информационным ресурсам в публичных компьютерных сетях | |
Borden et al. | Improving automated crisis detection via an improved understanding of crisis language: Linguistic categories in social media crises | |
US11537708B1 (en) | Password semantic analysis pipeline | |
US11087098B2 (en) | Computer systems for classifying multilingual text | |
Min et al. | Detecting illegal online gambling (IOG) services in the mobile environment | |
US9922029B1 (en) | User feedback for low-confidence translations | |
Hope | Unsocial media: school surveillance of student internet use | |
Singhal et al. | Cybersecurity misinformation detection on social media: Case studies on phishing reports and zoom’s threat | |
RU2701990C1 (ru) | Способ использования системы определения тематики документов для целей информационной безопасности |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20200713 |