RU2747452C2 - Method for forming device clusters - Google Patents

Method for forming device clusters Download PDF

Info

Publication number
RU2747452C2
RU2747452C2 RU2019130609A RU2019130609A RU2747452C2 RU 2747452 C2 RU2747452 C2 RU 2747452C2 RU 2019130609 A RU2019130609 A RU 2019130609A RU 2019130609 A RU2019130609 A RU 2019130609A RU 2747452 C2 RU2747452 C2 RU 2747452C2
Authority
RU
Russia
Prior art keywords
devices
cluster
environment
network
links
Prior art date
Application number
RU2019130609A
Other languages
Russian (ru)
Other versions
RU2019130609A3 (en
RU2019130609A (en
Inventor
Дмитрий Геннадьевич Иванов
Андрей Владимирович Ладиков
Павел Владимирович Филонов
Original Assignee
Акционерное общество "Лаборатория Касперского"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Акционерное общество "Лаборатория Касперского" filed Critical Акционерное общество "Лаборатория Касперского"
Priority to RU2019130609A priority Critical patent/RU2747452C2/en
Publication of RU2019130609A3 publication Critical patent/RU2019130609A3/ru
Publication of RU2019130609A publication Critical patent/RU2019130609A/en
Application granted granted Critical
Publication of RU2747452C2 publication Critical patent/RU2747452C2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

FIELD: computer technology.
SUBSTANCE: invention relates to the field of computer technology for multiplatform synchronization and determining belonging of several devices to one user. The technical result described below is achieved by collecting information that characterizes unknown devices (hereinafter, device characteristics), and information that characterizes the environment of unknown devices (hereinafter, device environment characteristics); based on the collected characteristics for each of the unknown devices, at least one connection between the device and the device environment is detected; forming a communication profile for the detected communication based on the collected characteristics of the device and the environment, where the communication profile contains the characteristics of the connection and interaction between the selected device and other devices; selecting links for clustering and combining unknown devices into at least one cluster based on the similarity of the selected links, where the similarity of links is determined based on the similarity of the communication profile.
EFFECT: invention is aimed at increasing reliability and ensuring long-term binding of devices, their correlation with the profile and rapid response to changes in the user profile.
13 cl, 21 dwg

Description

Область техникиTechnology area

Изобретение относится к способам мультиплатформенной синхронизации и определения принадлежности нескольких устройств одному пользователю.The invention relates to methods for multi-platform synchronization and determination of the belonging of several devices to one user.

Уровень техникиState of the art

Число электронных устройств, приходящихся на одно домохозяйство (англ. householder) или пользователя, постоянно растет, среди данных устройств растет доля устройств, имеющих сетевой интерфейс. Теперь это не только персональные компьютеры и смартфоны, но и телевизоры, игровые приставки и даже электрические чайники. Соответственно возникла необходимость логически связывать эти устройства в одно домохозяйство вокруг их владельца/пользователя, то является концепцией умного дома, а в перспективе умного окружения. Связанные устройства необходимы, по меньшей мере, для:The number of electronic devices per household (English householder) or user is constantly growing, among these devices the share of devices with a network interface is growing. Now these are not only personal computers and smartphones, but also televisions, game consoles and even electric kettles. Accordingly, it became necessary to logically link these devices into one household around their owner / user, this is the concept of a smart home, and in the future, a smart environment. Associated devices are required at least for:

• централизованного управления устройствами (в т.ч. управления безопасностью устройств);• centralized device management (including device security management);

• проведения маркетинговых кампаний;• conducting marketing campaigns;

• эффективной коммуникации с пользователем;• effective communication with the user;

• аутентификации на нескольких устройствах (англ. cross-device) и т.д.• authentication on multiple devices (English cross-device), etc.

Лидерами в развитии технологий связывания устройств и анализа активности пользователя являются компании, которые занимаются рекламой, электронной коммерцией, профилированием для платформы клиентских данных (англ. customer data platform, CDP) или имеют мультиплатформенные программные и программно-аппаратные решения. Например, в публикации US 20150235275 описываются механизмы отслеживания, связывания и рекламного таргетирования основанные на сличении атрибутов из профиля пользователя. А в публикации US 20160125471 описывается механизм синхронизации cookie файлов.Leaders in the development of device linking technologies and user activity analysis are companies that are engaged in advertising, e-commerce, profiling for the customer data platform (CDP) or have multi-platform software and hardware-software solutions. For example, US 20150235275 describes tracking, linking, and advertising targeting mechanisms based on matching attributes from a user profile. And in the publication US 20160125471 describes the mechanism for synchronizing cookies.

Компаниям, которые занимаются безопасностью компьютерных систем также необходимо обнаруживать новые устройства в окружении и соотносить их с пользователем для обеспечения защиты устройства и сетевого окружения устройства. Необходимость следует из того, что устройства взаимодействуют между собой и любое из устройств в окружении может стать вектором атаки на другое устройство и данные пользователя, поэтому защищены должны быть все устройства пользователя, но для этого их нужно обнаружить и привязать к пользователю.Computer security companies also need to discover new devices in the environment and relate them to the user to protect the device and the device's network environment. The necessity follows from the fact that devices interact with each other and any of the devices in the environment can become an attack vector against another device and user data, therefore all user's devices must be protected, but for this they need to be detected and tied to the user.

Современные автоматические методы связывания устройств полагаются на данные, которые могут быть удалены (куки могут быть очищены) или на эвристики, имеющие недостаточно высокую точность. Необходима технология, которая обеспечила бы надежное и долговременное связывание устройств, соотносила их с профилем и оперативно реагировала на изменение пользовательского профиля.Modern automated device pairing methods rely on data that can be deleted (cookies can be cleared) or on heuristics that are not accurate enough. A technology is needed that would ensure reliable and long-term pairing of devices, correlate them with a profile, and respond quickly to changes in the user profile.

Краткое описание чертежейBrief Description of Drawings

Сопровождающие чертежи включены для обеспечения дополнительного понимания изобретения и составляют часть этого описания, показывают варианты осуществления изобретения и совместно с описанием служат для объяснения принципов изобретения.The accompanying drawings are included to provide a further understanding of the invention and form part of this description, show embodiments of the invention, and together with the description serve to explain the principles of the invention.

Заявленное изобретение поясняется следующими чертежами, на которых:The claimed invention is illustrated by the following drawings, in which:

Фиг. 1а - изображает примеры кластеров устройств.FIG. 1a shows examples of device clusters.

Фиг. 1б - изображает примеры профилей окружения, которые являются отображением кластеров устройств из предыдущей фигуры.FIG. 1b - depicts examples of environment profiles that are a mapping of device clusters from the previous figure.

Фиг. 1в - изображает пример расширенного кластера устройств с подкластерами.FIG. 1c depicts an example of an extended device cluster with subclusters.

Фиг. 1г - изображает пример расширенного профиля окружения, который является отображением расширенного кластера из предыдущей фигуры, где помимо устройств окружения выделяются пользователи этих устройств.FIG. 1d - depicts an example of an extended environment profile, which is a display of the extended cluster from the previous figure, where, in addition to the environment devices, users of these devices are distinguished.

Фиг. 1д - изображает пример расширенного профиля окружения, где помимо пользователей выделяется еще М2М сеть в рамках домохозяйства HomeID1.FIG. 1e - depicts an example of an extended environment profile, where, in addition to users, an M2M network is also allocated within the HomeID1 household.

Фиг. 2 - изображает систему кластеризации устройств.FIG. 2 - depicts a device clustering system.

Фиг. 3 - изображает способ формирования кластеров устройств.FIG. 3 depicts a method for forming clusters of devices.

Фиг. 3а - изображает множество полученных для формирования кластеров устройств.FIG. 3a depicts a plurality of devices obtained to form clusters.

Фиг. 3б - изображает множество устройств со обнаруженными связями.FIG. 3b - depicts a plurality of devices with detected connections.

Фиг. 3в - изображает множество устройств с обнаруженными связями, после типизации этих связей.FIG. 3c - depicts a set of devices with detected connections, after typing these connections.

Фиг. 3г - изображает множество устройств с обнаруженными связями, после типизации связей и выделения связей, которые относятся к локальным домашним сетям - кластер HomeID1 и кластер HomeID2, при этом кластеры изображены условно в виде дерева, где корневой узел идентификатор кластераFIG. 3d - depicts a set of devices with detected connections, after typing connections and highlighting connections that relate to local home networks - cluster HomeID1 and cluster HomeID2, while the clusters are shown conventionally in the form of a tree, where the root node is the cluster identifier

Фиг. 3д - в условном виде (в виде дерева, где корневой узел идентификатор кластера, внутренний узел идентификаторы подкластеров) изображает расширенные кластеры HomeID1 и HomeID2, где устройства внутри кластера устройств дополнительно кластеризуются по пользователям.FIG. 3d - in a conditional form (in the form of a tree, where the root node is the cluster identifier, the internal node is the subcluster identifiers) depicts the extended clusters HomeID1 and HomeID2, where devices inside the device cluster are additionally clustered by users.

Фиг. 4 - изображает способ отнесения неизвестного устройства к кластеру.FIG. 4 depicts a method for assigning an unknown device to a cluster.

Фиг. 4а - изображает устройства для кластеризации.FIG. 4a depicts clustering devices.

Фиг. 4б - изображает устройства с обнаруженными связями.FIG. 4b - depicts devices with detected connections.

Фиг. 4в - изображает устройства обнаруженными связями, после типизации связей.FIG. 4c - depicts devices with detected links, after typing the links.

Фиг. 4г - изображает результат сравнения обнаруженных связей с известными.FIG. 4d - shows the result of comparing the discovered links with the known ones.

Фиг. 4д - изображает результат сравнения сформированных профиле пользователей с известными профилями пользователей устройств, относящихся к кластеру.FIG. 4e - shows the result of comparing the generated user profiles with the known user profiles of devices belonging to the cluster.

Фиг. 5 - изображает способ формирования связей между кластерами устройств.FIG. 5 - depicts a method of forming connections between clusters of devices.

Фиг. 5а - изображает кластеры устройств и связи некоторых устройств.FIG. 5a - depicts clusters of devices and connections of some devices.

Фиг. 5б - изображает расширенные кластеры устройств и расширенные профили окружения, а также связи между ними.FIG. 5b - depicts extended device clusters and extended environment profiles, as well as the relationships between them.

Фиг. 6 - изображает пример компьютерной системы общего назначения.FIG. 6 depicts an example of a general purpose computer system.

Раскрытие изобретениеDisclosure invention

Настоящее изобретение предназначено для построения профиля окружения с привязкой устройств окружения к пользователю. В настоящем изобретении для его осуществления собирают информацию о устройстве и окружении устройства.The present invention is intended to build an ambience profile with linking ambience devices to a user. In the present invention, information about the device and the environment of the device is collected for its implementation.

Технический результат настоящего изобретения заключается в обеспечении формирования кластеров в результате осуществления способа, в котором на первом этапе собирают информацию, характеризующую неизвестные устройства (далее, характеристики устройства) и информацию, характеризующую окружение неизвестных устройств (далее, характеристики окружения устройства). В частном случае в качестве окружения устройства выступают по меньшей мере:The technical result of the present invention is to ensure the formation of clusters as a result of the implementation of the method, in which at the first stage information is collected characterizing unknown devices (hereinafter, device characteristics) and information characterizing the environment of unknown devices (hereinafter, characteristics of the device environment). In a particular case, at least the following acts as a device environment:

• компьютерные сети, к которым осуществляется подключение устройства, при этом в частном случае определяется тип сети;• computer networks to which the device is connected, in this case, in a particular case, the type of network is determined;

• иные устройства, к которым осуществляется подключение устройства.• other devices to which the device is connected.

В качестве характеристик устройства могут выступать по меньшей мере:The characteristics of the device can be at least:

• характеристики аппаратного обеспечения устройства;• hardware characteristics of the device;

• характеристики программного обеспечения устройства;• characteristics of the device software;

• характеристики сетевого трафика, формируемого устройством.• characteristics of network traffic generated by the device.

А в качестве характеристик окружения устройства выступают по меньшей мере:And the characteristics of the environment of the device are at least:

• характеристики сетей, к которым осуществляется подключение устройства, том числе тип сети;• characteristics of the networks to which the device is connected, including the type of network;

• сервисы, работающие на компьютерных сетях, с которыми осуществляется обмен данными устройством;• services operating on computer networks with which the device exchanges data;

• иные устройства, к которым осуществляется подключением устройства;• other devices to which the device is connected;

• сервисы, работающим на устройствах, к которым осуществляется подключением устройства.• services running on devices to which the device is connected.

Далее на основании собранных характеристик для каждого из неизвестных устройств обнаруживают, по меньшей мере одну, связь между устройством и окружением устройства. В частном случае связь описывается характеристиками связи, которые включают по меньшей мере характеристики окружения.Further, based on the collected characteristics for each of the unknown devices, at least one connection between the device and the environment of the device is detected. In a particular case, communication is described by communication characteristics, which include at least the characteristics of the environment.

После обнаружения связей выбирают связи для кластеризации и объединяют неизвестные устройства в, по меньшей мере один, кластер на основании похожести выбранных связей. Связи могут признаваться похожими, если по меньшей мере одна характеристика обнаруженной связи одного устройства, похожа на характеристику обнаруженной связи другого устройства. Тип сети, к которой подключается устройство может определять тип связи и в частном случае для кластеризации выбирают связи одного типа, например для кластеризации могут выбирать тип сети - локальная частная (домашняя) сеть.After the links are found, links for clustering are selected and unknown devices are combined into at least one cluster based on the similarity of the selected links. Relationships can be considered similar if at least one characteristic of the detected relationship of one device is similar to the characteristic of the detected relationship of another device. The type of network to which the device is connected can determine the type of connection, and in a particular case, one type of connection is selected for clustering, for example, for clustering, the type of network can be selected - a local private (home) network.

Дополнительно в частном случае кластер классифицируют на основании связей, которые являются для устройств данного кластера похожими.Additionally, in a particular case, the cluster is classified on the basis of connections that are similar for the devices of this cluster.

В частном случае на основании собранных характеристик устройства и окружения формируют профиль пользователя устройства и объединяют устройства из сформированного кластера устройств с похожими профилями в подкластер.In a particular case, based on the collected characteristics of the device and the environment, a device user profile is formed and devices from the formed cluster of devices with similar profiles are combined into a sub-cluster.

Описание вариантов осуществления изобретенийDescription of embodiments of inventions

Объекты и признаки настоящего изобретения, способы для достижения этих объектов и признаков станут очевидными посредством отсылки к примерным вариантам осуществления. Однако настоящее изобретение не ограничивается примерными вариантами осуществления, раскрытыми ниже, оно может воплощаться в различных видах. Приведенное описание предназначено для помощи специалисту в области техники для исчерпывающего понимания изобретения, которое определяется в объеме приложенной формулы. Ниже дается раскрытие ключевых понятий, используемых в заявке.The objects and features of the present invention, methods for achieving these objects and features will become apparent by reference to exemplary embodiments. However, the present invention is not limited to the exemplary embodiments disclosed below, but may be embodied in various forms. The foregoing description is intended to assist a person skilled in the art for a comprehensive understanding of the invention, which is defined within the scope of the appended claims. Below is a disclosure of the key concepts used in the application.

Профиль связи (англ. relation) - абстрактная сущность, которая в частном случае содержит характеристики соединения и взаимодействия (характеристики связи), между персональным устройством и точкой доступа, между персональным устройством и персональным устройством, между персональным устройством и IoT устройством. Таким образом профиль связи - информация, характеризующая связь, которая преобразована и упакована в структуру данных, пригодную для обработки, сравнения, построения агрегатов и суррогатов (векторов). Под персональными устройствами понимаются мобильные телефоны, ноутбуки, планшеты, персональные компьютеры и т.д. Одной из характеристик связи может быть тип сети, в рамках которого устанавливаются соединения с устройствами и формируется связь (домашняя беспроводная сеть, публичная беспроводная сеть, М2М, GSM и т.д.). Профиль может выражаться N-мерным вектором характеристик, компонентами которого являются характеристики связи, где подмножеством характеристики связи являются характеристики сетевого соединения (поэтому используется признак связь, а не соединение, признак связь описывается большим числом характеристик чем соединение и является шире). Характеристиками связи, по меньшей мере, могут быть:A relation profile is an abstract entity that in a particular case contains connection and interaction characteristics (communication characteristics), between a personal device and an access point, between a personal device and a personal device, between a personal device and an IoT device. Thus, a link profile is information characterizing a link, which is transformed and packed into a data structure suitable for processing, comparison, building aggregates and surrogates (vectors). Personal devices are understood as mobile phones, laptops, tablets, personal computers, etc. One of the characteristics of communication can be the type of network within which connections with devices are established and communication is formed (home wireless network, public wireless network, M2M, GSM, etc.). The profile can be expressed as an N-dimensional vector of characteristics, the components of which are the characteristics of the link, where the subset of the characteristics of the link are the characteristics of the network connection (therefore, the link is used, not the connection, the link is described by a greater number of characteristics than the connection and is broader). Communication characteristics can at least be:

• правило формирования сетевого соединения между устройством и окружением устройства;• a rule for forming a network connection between the device and the device's environment;

• длительность установленного соединения между устройством и окружением устройства;• the duration of the established connection between the device and the environment of the device;

• тип соединения между устройством и окружением устройства;• the type of connection between the device and the environment of the device;

• стабильность соединения между устройством и окружением устройства;• stability of the connection between the device and the environment of the device;

• геолокация соединения устройства с окружением устройства;• geolocation of connection of the device with the environment of the device;

• характеристики сетевого трафика между устройством и окружением устройства• characteristics of network traffic between the device and the environment of the device

• характеристики устройства, с которым устанавливается связь.• characteristics of the device with which communication is established.

Под окружением (англ. environment) устройства понимаются компьютерные сети или другие устройства, с которыми установлено или может быть установлено соединение по любому из известных протоколов.The environment of a device refers to computer networks or other devices with which a connection has been established or can be established using any of the known protocols.

N-мерный вектор характеристик связи - упорядоченный набор из N чисел, где числа есть координаты вектора. В числах могут кодироваться качественные (т.н. категорийные) характеристики Количество координат вектора называется размерностью вектора. Координаты определяют положение соответствующей связи устройства или некоторых характеристик связи (например, тип связи, MAC адрес, SSID). Вектор получают преобразованием информации об окружении и устройстве. Вектор отражает некоторую информацию об окружении.An N-dimensional vector of communication characteristics is an ordered set of N numbers, where the numbers are the coordinates of the vector. Qualitative (so-called categorical) characteristics can be encoded in numbers. The number of coordinates of a vector is called the dimension of the vector. Coordinates define the position of the associated device link or some link characteristics (eg link type, MAC address, SSID). The vector is obtained by transforming information about the environment and the device. The vector reflects some information about the environment.

Кластеризация устройств - упорядочивание устройств в сравнительные однородные группы (кластеры), на основании одного или нескольких признаков, например связей или отдельных характеристик связей. А под кластеризацией устройств а понимается нахождение кластера устройств, имеющего похожие связи, где при отсутствии таких кластеров создается новый кластер. Пример кластеров устройств изображен на Фиг. 1а.Device clustering is the ordering of devices into comparative homogeneous groups (clusters) based on one or more attributes, such as links or individual characteristics of links. And by clustering devices a is meant finding a cluster of devices that have similar connections, where, in the absence of such clusters, a new cluster is created. An example of device clusters is depicted in FIG. 1a.

Кластер устройств - упорядоченная группа устройств, объединенных на основании похожести каких-либо характеристик, например, похожести связей, в частном случае кластер описывается профилем окружения (Фиг. 1б), а расширенный кластер (кластер с подкластерами на Фиг. 1в) расширенным профилем окружения (Фиг. 1г и Фиг. 1д). Устройство может относиться к некоторому кластеру, если расстояние от N-мерного вектора связи устройства до центра данного кластера меньше радиуса кластера ("R") в направлении N-мерного вектора. В частном случае устройство относится к некоторому кластеру, если значение расстояния (на Фиг. 1а «d'») от N-мерного вектора элемента до ближайшего N-мерного вектора связи данного кластера меньше предельно допустимого (порогового значения расстояния [d']) или если значение расстояния (на Фиг. 1а «d») от N-мерного вектора связи до центра данного кластера меньше радиуса этого кластера. Варианты расстояний для оценки близости, например:A device cluster is an ordered group of devices united based on the similarity of some characteristics, for example, the similarity of connections, in a particular case, a cluster is described by an environment profile (Fig.1b), and an extended cluster (a cluster with subclusters in Fig.1c) by an extended environment profile ( Fig. 1d and Fig. 1e). A device can belong to a certain cluster if the distance from the N-dimensional communication vector of the device to the center of this cluster is less than the cluster radius ("R") in the direction of the N-dimensional vector. In a particular case, the device belongs to a certain cluster, if the value of the distance (in Fig. 1a "d '") from the N-dimensional vector of the element to the nearest N-dimensional vector of the connection of the given cluster is less than the maximum allowable (threshold value of the distance [d']) or if the value of the distance (in Fig. 1a "d") from the N-dimensional link vector to the center of this cluster is less than the radius of this cluster. Distance options for assessing proximity, for example:

• линейное расстояние;• linear distance;

• евклидово расстояние;• Euclidean distance;

• квадрат евклидова расстояния;• the square of the Euclidean distance;

• обобщенное степенное расстояние Минковского;• generalized power-law distance of Minkowski;

• расстояние Чебышева;• Chebyshev distance;

• Манхэттенское расстояние.• Manhattan distance.

Мера близости для оценки близости (степень сходства, коэффициент сходства) - безразмерный показатель для определения сходства элементов веб-страницы. Для определения меры близости используются меры:A measure of proximity for assessing proximity (degree of similarity, coefficient of similarity) is a dimensionless indicator for determining the similarity of elements of a web page. To determine the measure of proximity, the following measures are used:

• Охай;• Ohay;

• Жаккара;• Jacquard;

• Сокала-Снита;• Sokala-Snita;

• Кульчинского;• Kulchinsky;

• симметричная Дайса.• symmetrical Dies.

Центр кластера (центроид) - это вектор, элементы которого представляют собой средние значения соответствующих признаков, вычисленные по всем векторам кластера. Для кластеров, состоящих из одного вектора, данный вектор будет являться центром кластера.The center of the cluster (centroid) is a vector, the elements of which are the average values of the corresponding features, calculated over all vectors of the cluster. For clusters consisting of one vector, this vector will be the center of the cluster.

Радиус кластера (на Фиг. 1a «R») - максимальное расстояние N-мерных векторов, входящих в кластер, от центра кластера.The radius of the cluster (in Fig. 1a "R") is the maximum distance of the N-dimensional vectors included in the cluster from the center of the cluster.

Для кластеризации используют различные известные алгоритмы и подходы, в том числе иерархические (агломеративные и дивизивные) и неиерархические.For clustering, various well-known algorithms and approaches are used, including hierarchical (agglomerative and divisive) and non-hierarchical.

Профиль окружения - структурированная совокупность данных о группе устройств, объединенных на основании связей одного типа, на Фиг. 1б изображены профили для локальной частной (домашней) сети и для М2М. В частном случае профиль окружения это машиночитаемое описание кластера устройств.An environment profile is a structured collection of data about a group of devices combined based on links of the same type, in FIG. 1b shows the profiles for the local private (home) network and for M2M. In a particular case, an environment profile is a machine-readable description of a cluster of devices.

Расширенный профиль окружения - профиль окружения, дополненный данными о пользователях устройств (Фиг. 1г) или о смежных сетях, например, М2М (Фиг. 1д).Extended environment profile - an environment profile supplemented with data about device users (Fig. 1d) or about adjacent networks, for example, M2M (Fig. 1e).

Тип связи - одна из характеристик связи, которая характеризует тип сети, к которой или в рамках которой устанавливались соединения. Выделить возможно, по меньшей мере, следующие типы сетей:Connection type - one of the characteristics of a connection that characterizes the type of network to which or within which connections were established. It is possible to distinguish at least the following types of networks:

• локальная частная (домашняя) сеть;• local private (home) network;

• локальная публичная сеть;• local public network;

• GSM сеть;• GSM network;

• М2М (сеть с передачей от узла к узлу, в частном случае соединения с IoT);• М2М (network with transmission from node to node, in the particular case of connection with IoT);

Mesh сеть Типизация связей - процесс определения типа связи. Для определения типа связей используются как эвристические правила, так и машинное обучение (деревья принятия решений, нейросети, кластеризацию и т.д.). Для формирования эвристических правил выбираются связи, тип которых известен и выявляются характеристики (например, ищут значений характеристик), которые гарантировано позволяют/не позволяют отнести связь к данному типу и на основании этих характеристик формируется эвристическое правило, которое и применяется к связям, тип которых неизвестен. Когда эвристическое правило отсутствует или число характеристик недостаточно, типизация осуществляется за счет сравнения (определения похожести) вектора связи, тип которой неизвестен с векторами связей, тип которых известен. Для типизации связей могут использоваться, по меньшей мере, следующие характеристики:Mesh network Link typing is the process of defining the link type. To determine the type of connections, both heuristic rules and machine learning (decision trees, neural networks, clustering, etc.) are used. To form heuristic rules, links are selected, the type of which is known and characteristics are identified (for example, they are looking for values of characteristics) that guarantee / do not allow attributing a link to this type and based on these characteristics a heuristic rule is formed, which is applied to links whose type is unknown. ... When there is no heuristic rule or the number of characteristics is insufficient, typing is carried out by comparing (determining similarity) of the link vector, the type of which is unknown with the vectors of links, the type of which is known. For typing relationships, at least the following characteristics can be used:

• наличие авторизации для подключения к сети;• availability of authorization to connect to the network;

• используемый тип шифрования;• the type of encryption used;

• локальное время соединения с сетью и отключения от нее;• local time of connection to the network and disconnection from it;

• частота подключений к данной сети;• frequency of connections to this network;

• имя сети (ssid);• network name (ssid);

• день недели, когда произошло подключение;• day of the week when the connection was made;

• количество устройств, подключенных к точке доступа;• the number of devices connected to the access point;

• наличие рядом других точек доступа, расширяющих сеть данной точки (roaming-точки).• presence of other access points nearby, expanding the network of this point (roaming points).

Похожесть определяется различными способами, например если связь описывается вектором, составленным из характеристик связи, то связи считаются похожими, если по меньшей мере одна из характеристик неизвестной связи тождественна аналогичной характеристике другой связи. В частном случае такими характеристиками могут быть MAC адрес, название точки доступа, тип связи. Связи считаются также похожими, если расстояние между вектором одной сформированной связи и вектором другой связи в N-мерном пространстве или в проекции на одно из выбранных измерений (например измерении на котором откладывается длительность или частота соединений на основании которых формируется связь) меньше порогового значения или в общем случае, если скалярное произведение векторов не превышает заранее заданного порогового значения.The similarity is determined in various ways, for example, if a relationship is described by a vector composed of the characteristics of the relationship, then the relationships are considered similar if at least one of the characteristics of the unknown relationship is identical to the analogous characteristic of the other relationship. In a particular case, such characteristics may be the MAC address, the name of the access point, and the type of connection. Links are also considered to be similar if the distance between the vector of one formed link and the vector of another link in N-dimensional space or in projection onto one of the selected dimensions (for example, the dimension on which the duration or frequency of the links on the basis of which the link is formed) is less than the threshold value or in in general, if the dot product of vectors does not exceed a predetermined threshold value.

Для типизации также может использоваться обученная нейросеть, где на вход подаются характеристики связи, а на выходе получают тип связи. Нейросеть обучают известными из уровня техники способами на основании связей, тип которых известен.For typing, a trained neural network can also be used, where the characteristics of the connection are supplied to the input, and the type of connection is obtained at the output. The neural network is trained by methods known from the prior art based on connections, the type of which is known.

Профиль межкластерной связи - абстрактная сущность, которая в частном случае содержит характеристики похожих связей, характеристики устройств из разных кластеров, связи которых похожи между собой, профили пользователей этих устройств. Обнаружение похожих связей описано в способе 500. Таким образом профиль межкластерной связи - информация, о похожих связях, устройствах, у которых они обнаружены и пользователях этих устройств, преобразованная и упакованная в структуру данных, пригодную для обработки, сравнения, построения агрегатов и суррогатов (например, векторов). Характеристиками межкластерной связи могут быть:An inter-cluster communication profile is an abstract entity that, in a particular case, contains characteristics of similar links, characteristics of devices from different clusters, the links of which are similar to each other, profiles of users of these devices. The detection of similar links is described in method 500. Thus, the inter-cluster communication profile is information about similar links, the devices in which they are found and the users of these devices, converted and packed into a data structure suitable for processing, comparison, building aggregates and surrogates (for example , vectors). The characteristics of inter-cluster communication can be:

• кластеры и подкластеры между которыми сформирована связь;• clusters and sub-clusters between which a link is formed;

• сила межкластерной связи (определяется степенью похожести связей, подробнее описанном в способе 500, числом похожих связей их типом и числом устройств с похожими связями);• the strength of inter-cluster communication (determined by the degree of similarity of links, described in more detail in the method 500, the number of similar links, their type and the number of devices with similar links);

• типы похожих связей;• types of similar links;

• длительность существования похожих связей;• the duration of the existence of similar relationships;

• профили устройств с похожими связями;• profiles of devices with similar connections;

• профили пользователей этих устройств.• user profiles of these devices.

Профиль межкластерной связи содержит в общем случае информацию о всех похожих связях, обнаруженных между устройствами из двух связанных между собой кластеров.An inter-cluster communication profile generally contains information about all similar relationships found between devices from two interconnected clusters.

Типизация межкластерной связи - на основании профиля межкластерной связи осуществляют типизацию связи, чтобы определить в каком отношении находятся пользователи устройств из связанных кластеров и сами кластеры (а в частном случае домохозяйства, если кластеры объединяют устройства одного домохозяйства). Это осуществляется, например, на основании сравнения профиля межкластерной связи с другим профилем, тип которого известен либо с использованием нейросети, где на вход подаются характеристики межкластерной связи, а на выходе получают тип связи, где нейросеть предварительно обучена на размеченных кластерах и межкластерных связях.Typification of inter-cluster communication - based on the profile of inter-cluster communication, typing of communication is performed in order to determine in what relation the users of devices from linked clusters and the clusters themselves are located (and in the particular case of households, if the clusters combine devices of one household). This is done, for example, on the basis of comparing the inter-cluster communication profile with another profile, the type of which is known either using a neural network, where the characteristics of the inter-cluster communication are fed into the input, and the communication type is obtained at the output, where the neural network is pre-trained on marked clusters and inter-cluster connections.

Угроза (англ. threat) - потенциальное происшествие, которое способно нарушить должное функционирование системы и тем самым прямо или косвенно нанести ущерб. Виды угроз очень разнообразны и имеют множество классификаций, в рамках данной заявки используется классификации по характеру нарушения, а именно:Threat (English threat) - a potential incident that can disrupt the proper functioning of the system and thereby directly or indirectly cause damage. The types of threats are very diverse and have many classifications, within the framework of this application, classifications by the nature of the violation are used, namely:

• нарушение конфиденциальности данных;• violation of data confidentiality;

• нарушение целостности данных/подмена данных;• violation of data integrity / data substitution;

• нарушение работоспособности системы (в т.ч. отказ в обслуживании);• failure of the system (including denial of service);

• неавторизированное вмешательство в функционирование системы;• unauthorized interference with the functioning of the system;

• и т.д.• etc.

Модель угроз - формализованное описание угроз информационной безопасности в отношении системы. Включает, по меньшей мере:A threat model is a formalized description of information security threats to a system. Includes at least:

• вид угрозы, где угроза несанкционированное использование системы, отражающее интерес нарушителя;• type of threat, where the threat is unauthorized use of the system, reflecting the interest of the offender;

• элемент, через который реализуется данный вид угрозы;• the element through which this type of threat is implemented;

• способ реализации угрозы через указанный элемент;• the way the threat is realized through the specified element;

• вектор воздействия на систему для осуществления способа реализации угрозы (вектор атаки);• vector of influence on the system to implement the method of threat realization (attack vector);

Способ реализации угрозы, атака - действия нарушителя по реализации угрозы безопасности определенного вида. Для каждого элемента системы определенный вид угрозы может быть реализован разными способами, в том числе с задействованием других компонентов системыA method of implementing a threat, an attack - actions of an intruder to implement a security threat of a certain type. For each element of the system, a certain type of threat can be implemented in different ways, including involving other components of the system.

Вектор атаки - направление или конкретный способ воздействия на систему со стороны нарушителя при реализации угрозы безопасности. Признаку «вектор атаки» в рамках данной заявки тождественен признак «вектор воздействия на систему для осуществления способа реализации угрозы». Определяющими вектор атаки характеристиками по меньшей мере могут быть:An attack vector is a direction or a specific way of influencing a system from an intruder when a security threat is realized. The attribute "attack vector" in the framework of this application is identical to the attribute "vector of impact on the system to implement the method of implementing the threat." Attack vector defining characteristics can at least be:

• источник или множество источников атаки;• source or multiple sources of attack;

• элемент или множество элементов, являющихся целью атаки;• an element or a set of elements that are the target of an attack;

• вид воздействия;• type of impact;

• средства воздействия.• means of influence.

Модель угроз и модель использования формально могут ничем не отличаться друг от друга (за исключением вектора атаки) для одной и той же системы или комплекса. Классифицирующим признаком, позволяющим отличать одну модель от другой является то, что модель использования отражает интерес уполномоченного пользователя, а модель угроз интерес нарушителя. Примеры моделей для реальных систем будут приведены ниже.The threat model and the use model may not formally differ from each other (with the exception of the attack vector) for the same system or complex. A classifying feature that distinguishes one model from another is that the use model reflects the interest of the authorized user, and the threat model reflects the interest of the offender. Examples of models for real systems will be given below.

На Фиг. 2 изображена система кластеризации устройств 100, в которой имеются устройства 110. Устройствами являются по меньшей мере:FIG. 2 depicts a device clustering system 100 in which there are devices 110. The devices are at least:

• персональные устройства;• personal devices;

• IoT устройства;• IoT devices;

• роутеры, маршрутизаторы и др. сетевое оборудование.• routers, routers and other network equipment.

На устройства 110 установлены клиенты 120. Клиенты 120 собирают информацию об устройстве и об окружении устройства. Окружение устройства - это:Clients 120 are installed on devices 110. Clients 120 collect information about the device and the environment of the device. The device environment is:

• другие устройства 110 с клиентами 120;other devices 110 with clients 120;

• устройства 110а с которыми может быть установлено соединение, но которые не имеют клиентов 120 (например, персональные устройства, такие как персональный компьютер, мобильный телефон, планшет и т.д.), IoT устройства, в том числе бытовая техника, а также сетевое оборудование• devices 110a with which a connection can be established, but which do not have clients 120 (for example, personal devices such as a personal computer, mobile phone, tablet, etc.), IoT devices, including household appliances, and network equipment

Собранная клиентами 120 информация отправляется на серверную сторону и используется средством обнаружения связей 130 и средством профилирования устройств 140. Средство обнаружения связей 130 используется для обнаружения связей на основании информации, собранной клиентом 120 об окружении устройства 110 и формирования профиля связи. Средство профилирования устройств 140 на основании информации, собранной клиентом 120, формирует профиль устройства 110 - абстрактную сущность (например, запись в БД), которая описывает устройство, по меньшей мере: операционную систему, установленные приложения, спецификацию устройства и т.д. К каждому профилю устройства прикреплен идентификатор устройства (DeviceID N). В частном случае средство 130 и средство 140 могут располагаться на устройствах 110. Профили связи сохраняются в базе связей 150. Когда необходимо осуществить типизацию обнаруженных связей, то это осуществляется средством типизации связей 160. Профиль устройства сохраняется в базе устройств 170. Средство кластеризации устройств 180 группирует устройства на основании похожести связей и похожести профилей пользователей этих устройств. Группировка на основании похожести связей может осуществляться:The information collected by the clients 120 is sent to the server side and used by the link finder 130 and the device profiler 140. The link finder 130 is used to discover the links based on the information collected by the client 120 about the environment of the device 110 and generate a communication profile. The device profiling tool 140, based on the information collected by the client 120, generates a device profile 110 - an abstract entity (eg, a database entry) that describes a device, at least an operating system, installed applications, a device specification, and so on. Each device profile has a device identifier (DeviceID N) attached to it. In a particular case, the means 130 and the means 140 can be located on devices 110. The communication profiles are stored in the link base 150. When it is necessary to type the detected links, this is done by the link typing tool 160. The device profile is stored in the device base 170. The device clustering tool 180 groups devices based on the similarity of connections and the similarity of the user profiles of these devices. Grouping based on the similarity of links can be carried out:

• по любой характеристике связи, например типу связи;• by any characteristic of the connection, for example, the type of connection;

• по любой группе характеристик, например MAC адресу точки доступа и ее названию (SSID);• by any group of characteristics, for example, the MAC address of the access point and its name (SSID);

• на основании всех характеристик связи.• based on all communication characteristics.

При кластеризации из выбранных характеристик связи формируются векторы и откладываются в N-мерном пространстве и векторы, например, попавшие в радиус кластера, считаются отнесенными к этому кластеру, в частном случае радиус может равняться нулю. По результатам кластеризации формируются профили, например профили окружения, которые сохраняются в базе профилей окружения 190, сами кластеры также могут храниться в этой базе. На основании информации, собранной с устройств, и профилях устройств, а также информации, полученной от других систем, в том числе и сторонних, средство профилирования пользователей 141 формирует профиль пользователя, сохраняя его в базе пользователей 170. Для профилирования пользователей могут использоваться, например: сетевая активность устройства; данные о перемещении устройства в пространстве; различные персональные сетевые идентификаторы, обнаруженные на устройстве; адреса электронной почты из траффика, логины, номера телефонов и т.д. Эта информация преобразуется и упаковывается в структуру данных, пригодную для обработки, сравнения, построения агрегатов и суррогатов (векторов, словарей и т.д.) - профиль пользователя. Средство кластеризации устройств 180, используя кластеры устройств и профили пользователей, осуществляет дополнительную кластеризацию в рамках кластеров устройств из базы профилей окружения 190. Средство 180 группирует устройства внутри кластера устройств на основании похожести профилей пользователя устройств. По результатам кластеризации формируются расширенные профили окружения, которые сохраняются в базе расширенных профилей окружения 191, сами расширенные кластеры также могут храниться в этой базе.During clustering, vectors are formed from the selected bond characteristics and deposited in the N-dimensional space, and vectors, for example, within the cluster radius, are considered to be assigned to this cluster; in a particular case, the radius can be equal to zero. Based on the results of clustering, profiles are formed, for example, environment profiles, which are saved in the database of environment profiles 190, the clusters themselves can also be stored in this database. Based on information collected from devices and device profiles, as well as information received from other systems, including third-party systems, the user profiling tool 141 generates a user profile, storing it in the user base 170. For user profiling, for example: network activity of the device; data on the movement of the device in space; various personal network identifiers found on the device; email addresses from traffic, logins, phone numbers, etc. This information is converted and packed into a data structure suitable for processing, comparison, building aggregates and surrogates (vectors, dictionaries, etc.) - a user profile. Device Clustering Tool 180 uses device clusters and user profiles to perform additional clustering within device clusters from the environment profile database 190. Tool 180 groups devices within a device cluster based on the similarity of device user profiles. Based on the clustering results, extended environment profiles are formed, which are saved in the database of extended environmental profiles 191, the extended clusters themselves can also be stored in this database.

На Фиг. 3 изображен способ формирования кластеров устройств 200. На этапе 201 получают устройства 110/110а для кластеризации. На этапе 210 клиентом 120 на устройствах 110 собирают информацию об устройствах 110, на котором клиент установлен, либо о любом другом устройстве 110а. Клиентом собирается информация, характеризующая устройство (далее, характеристики устройства) и информация, характеризующую окружение устройства (далее, характеристики окружения мобильного устройства). Характеристиками устройства могут быть по меньшей мере:FIG. 3 depicts a method for clustering devices 200. At step 201, clustering devices 110 / 110a are obtained. At step 210, the client 120 on the devices 110 collects information about the devices 110 on which the client is installed, or about any other device 110a. The client collects information characterizing the device (hereinafter referred to as the characteristics of the device) and information characterizing the environment of the device (hereinafter referred to as the characteristics of the environment of the mobile device). The characteristics of the device can be at least:

• характеристики аппаратного обеспечения устройства;• hardware characteristics of the device;

• характеристики программного обеспечения устройства;• characteristics of the device software;

• характеристики сетевого трафика, формируемого устройством.• characteristics of network traffic generated by the device.

А характеристиками окружения могут быть, по меньшей мере:And the characteristics of the environment can be at least:

• характеристики сетей, к которым осуществляется подключение устройства;• characteristics of the networks to which the device is connected;

• сервисы, работающие на компьютерных сетях, с которыми осуществляется обмен данными устройством;• services operating on computer networks with which the device exchanges data;

• иные устройства, к которым осуществляется подключение устройства;• other devices to which the device is connected;

• сервисы, работающим на устройствах, к которым осуществляется подключением устройства.• services running on devices to which the device is connected.

На этом этапе клиент 120 обнаруживает другие устройства (отличные от обнаруженных на этапе 201) и собирает информацию о соединениях, для обнаружения других устройств используются сетевые протоколы: DHCP, ICMP, ARP, MDNS, UPNP, NetBIOS и т.д. Также клиент фиксирует все соединения в сети GSM и обнаруживает IoT устройства, например, используя возможности технологий ZigBee, LPWAN, BLE и т.д. На этом этапе, очевидно, могут быть обнаружены неизвестные устройства типа 110а, поэтому на Фиг. З процесс обнаружения и сбора изображен циклически (201↔210). На основании собранных характеристик на этапе 220 обнаруживают связь между устройством 110/110а и окружением устройства и формируют профиль связи.In this step, the client 120 discovers other devices (other than those discovered in step 201) and collects connection information, network protocols are used to discover other devices: DHCP, ICMP, ARP, MDNS, UPNP, NetBIOS, etc. Also, the client records all connections in the GSM network and discovers IoT devices, for example, using the capabilities of ZigBee, LPWAN, BLE, etc. At this stage, obviously unknown devices such as 110a can be detected, so in FIG. The process of detection and collection is depicted cyclically (201-210). Based on the collected characteristics, at step 220, communication is detected between the device 110 / 110a and the environment of the device and a communication profile is generated.

Далее необходимо сравнить обнаруженные связи устройств между собой, поэтому на этапе 230 сравнивают связи. Сравнение может осуществляться: суррогатами, сформированными из профилей связи; профили могут сравниваться непосредственно; или любым способом известным из уровня техники, подходящим для типа данных которым представлен профиль связи. Если похожие связи обнаружены, то на этапе 231 устройства, имеющие похожие связи, объединяются, и на этапе 232 создается кластер устройств. Очевидно, что устройство может одновременно находиться в различных кластерах, потому что:Next, it is necessary to compare the detected connections of the devices with each other, so at step 230 the connections are compared. Comparison can be carried out: by surrogates generated from communication profiles; profiles can be compared directly; or by any method known in the art suitable for the type of data to which the communication profile is represented. If similar relationships are found, then at step 231, devices having similar relationships are combined, and at step 232, a device cluster is created. Obviously, a device can be in different clusters at the same time, because:

• связи могут сравниваться не только по векторам, содержащим все характеристики связи, но и по отдельным компонентам векторов (расстояние между векторами измеряется не в пространстве, а в проекции);• links can be compared not only by vectors containing all the characteristics of a link, but also by individual components of vectors (the distance between vectors is measured not in space, but in projection);

• у устройства обнаруживается более чем одна связь.• the device has more than one link.

После того как на этапе 232 кластер создан необходимо создать профиль окружения и связать с кластером, это происходит на этапе 250.After the cluster has been created in step 232, an environment profile must be created and associated with the cluster, this occurs in step 250.

В частном случае (например, для выявления устройств, принадлежащих одному домохозяйству), прежде чем осуществить кластеризацию необходимо определить тип обнаруженной связи (этап 221) и выбрать нужные связи для кластеризации на этапе 223 (чтобы выявлять устройства домохозяйств выбирают связь с типом домашняя сеть) и тогда на этапе 230 сравнивают обнаруженные связи выбранного типа. В общем случае на этапе 223 связи выбираются на основании любой характеристики связи, а не только типа.In a special case (for example, to identify devices belonging to the same household), before performing clustering, it is necessary to determine the type of detected connection (step 221) and select the necessary connections for clustering at step 223 (to identify devices of households, a connection with the type of home network is selected) and then, at step 230, the detected links of the selected type are compared. In general, at step 223, the links are selected based on any link characteristic, not just the type.

На этапе 210 собирают не только характеристики окружения, но и характеристики устройства, на основании характеристик окружения, характеристик устройства, а также дополнительной информации, полученной от внешних, по отношению к системе, источников на этапе 222 формируют профиль пользователя устройства. Сформированные профили пользователя устройств кластера, созданного на этапе 232, сравниваются между собой (этап 240). Это делается для того, чтобы найти устройства, использующиеся одним и тем же пользователем. Если похожие профили найдены, то в рамках кластера устройств эти устройства объединяются на этапе 241. Объединяют устройства в рамках созданного подкластера (этап 242). Для устройств, профили пользователей которых не имеют похожих в кластере, на этапе 242 создается подкластер (единичный подкластер). Одно и тоже устройство может принадлежать различным подкластерам, так как устройство может использоваться более чем одним пользователем. После создания подкластеров на этапе 260 создается расширенный профиль окружения. Профили пользователей могут сравниваться способами аналогичными способам, которые использовались при сравнении связей или любым другим способом известным из уровня техники.At step 210, not only the characteristics of the environment are collected, but also the characteristics of the device, based on the characteristics of the environment, the characteristics of the device, as well as additional information obtained from sources external to the system, at step 222, a profile of the user of the device is formed. The generated user profiles of the devices of the cluster created at step 232 are compared with each other (step 240). This is done in order to find devices used by the same user. If similar profiles are found, then within the cluster of devices these devices are combined at block 241. Combine devices within the created sub-cluster (block 242). For devices whose user profiles are not similar in the cluster, a sub-cluster (single sub-cluster) is created at step 242. The same device can belong to different sub-clusters, since a device can be used by more than one user. After creating the subclusters, at step 260, an extended environment profile is created. User profiles can be compared in ways similar to those used in link comparison or in any other way known in the art.

Кластеры устройств после создания могут классифицироваться на этапе 233 на основании того, например: чем похожи связи, на основании которых устройства были объединены в кластер:Device clusters, once created, can be classified at 233 based on, for example: how are the relationships that have been used to cluster the devices:

• если на основании принадлежности к типу домашняя сеть, MAC адресу и SSID сети, то кластер может быть классифицирован как домохозяйство N (в примерах данной заявки такие кластеры обозначены как HomeID N);• if on the basis of belonging to the type of home network, MAC address and SSID of the network, then the cluster can be classified as household N (in the examples of this application, such clusters are denoted as HomeID N);

• если на основании принадлежности к типу публичная сеть, MAC адресу и SSID сети, то кластер может быть классифицирован как публичная сеть N (в примерах данной заявки такие кластеры обозначены как PublicID N).• if on the basis of belonging to the type of public network, MAC address and SSID of the network, then the cluster can be classified as public network N (in the examples of this application, such clusters are designated as PublicID N).

На Фиг. 3а-3д изображен пример осуществления способа формирования кластеров. Кластеры в примере изображены иначе, чем на Фиг. 1, так как нет необходимости их изображать в N-мерном пространстве, они развернуты в дерево для удобства восприятия, где корневой узел соответствует идентификатору кластера, а внутренний узел (для расширенных кластеров) идентификатору пользователя, листья соответствуют устройствам. Итак, имеются устройства 110 (Фиг. 3а) с установленным клиентом 120 (на фигуре не изображен). Необходимо сформировать кластеры из этих устройств, чтобы определить устройства, принадлежащие одному домохозяйству и разделить эти устройства по владельцам/пользователям внутри одного домохозяйства.FIG. 3a-3d show an example of the implementation of the method for forming clusters. The clusters in the example are shown differently than in FIG. 1, since there is no need to represent them in N-dimensional space, they are expanded into a tree for ease of perception, where the root node corresponds to the cluster identifier, and the internal node (for extended clusters) to the user identifier, leaves correspond to devices. So, there are devices 110 (FIG. 3a) with a client 120 installed (not shown). It is necessary to form clusters of these devices in order to identify devices belonging to the same household and divide these devices by owner / user within the same household.

Клиентом 120 на устройствах собирают информацию, характеризующую устройство и информацию, характеризующую окружение устройства, данная информация может собираться и накапливаться в течении некоторого времени, например недели. Далее, что изображено на Фиг. 3б, на основании собранных характеристик обнаруживают связи 300 между устройствами и окружением устройств, элементами такого окружения в частном случае выступают и точки доступа 310. Обнаруженные связи типизируют (Фиг. 3в), в данном примере выделяют связи в рамках следующих типов сетей:The client 120 collects information characterizing the device and information characterizing the environment of the device on the devices, this information can be collected and accumulated over a period of time, for example, a week. Further, as shown in FIG. 3b, based on the collected characteristics, links 300 between devices and the environment of devices are detected, access points 310 in a particular case also act as elements of such an environment. The detected links are typed (Fig. 3c), in this example, links are distinguished within the following types of networks:

• локальная частная (домашняя) сеть - 300а;• local private (home) network - 300a;

• локальная публичная сеть - 300б;• local public network - 300b;

• М2М-300в;• М2М-300v;

• GSM сеть - 300г.• GSM network - 300g.

Точки доступа также типизируют, выделяют домашние точки доступа 310а и публичные точки доступа 310б. В частном случае для типизации связи задача типизации точек доступа является первичной.The access points are also typed, highlighting home access points 310a and public access points 310b. In a particular case, for typing a connection, the task of typing access points is primary.

Так как по условиям необходимо определить устройства в рамках одного домохозяйства, то из всех устройств отбирают (этот шаг соответствует этапу 223 способа 300) только те устройства, которые имеют связи типа - локальная частная (домашняя) сеть (характеристика связи тип связи = локальная частная (домашняя) сеть), в примере это устройства со связями 300а (см. Фиг. 3г.). Для того чтобы определить устройства из одного домохозяйства, устройства, отобранные по типу связи, устройства группируют и создают кластер устройств, где кластер образуется из устройств, имеющих похожие связи одного типа. В данном примере связи считаются похожими, если по меньшей мере одна из характеристик одной связи (помимо характеристик тип связи) тождественна или похожа на аналогичную характеристику другой связи или связи взятой за эталон. В примере такими характеристиками связи могут быть:Since, according to the conditions, it is necessary to determine devices within one household, from all devices, only those devices are selected (this step corresponds to step 223 of method 300) that have connections of the type - local private (home) network (connection characteristic type of connection = local private ( home) network), in the example these are devices with connections 300a (see Fig. 3d). In order to identify devices from the same household, devices selected by the type of connection, the devices are grouped and create a cluster of devices, where the cluster is formed of devices with similar connections of the same type. In this example, links are considered similar if at least one of the characteristics of one link (in addition to the characteristics of the link type) is identical or similar to a similar characteristic of another link or link taken as a reference. In an example, such communication characteristics can be:

• MAC адрес точки доступа (характеристики должны быть тождественны);• MAC address of the access point (characteristics must be identical);

• название точки доступа - SSID (характеристики должны быть тождественны);• access point name - SSID (characteristics must be identical);

• длительность подключения (характеристики должны быть похожи или превышать некоторое пороговое значение характеристики эталонной связи).• duration of connection (characteristics should be similar or exceed some threshold value of the reference communication characteristics).

Именно на основании характеристики «длительность подключения» устройство 110б, которое имеет связи в двух сетях, относят к кластеру HomeID1. Устройство 110б могло принадлежать гостю, а это значит, что оно в домашней сети появляется нерегулярно и длительность подключения существенно ниже других устройств.It is on the basis of the "connection duration" characteristic that the device 110b, which has connections in two networks, is assigned to the HomeID1 cluster. Device 110b could belong to a guest, which means that it appears irregularly on the home network and the duration of the connection is significantly lower than other devices.

Далее (Фиг. 3д) устройства, принадлежащие одному кластеру, группируют по владельцам, используя собранную об устройстве информацию и профили пользователей. Так создается расширенный кластер устройств, в соответствии с которым создается расширенный профиль окружения HomeID1 и HomeID2.Further (Fig. 3d) devices belonging to one cluster are grouped by owners using the information collected about the device and user profiles. This creates an extended device cluster, according to which the extended environment profile HomeID1 and HomeID2 is created.

На Фиг. 4 изображен способ 400 отнесения неизвестного устройства к кластеру. На этапе 201а обнаруживают неизвестное устройство. Обнаружение происходит, по меньшей мере когда:FIG. 4 depicts a method 400 for assigning an unknown device to a cluster. In step 201a, an unknown device is discovered. Detection occurs at least when:

• клиент 120, установленный на устройстве 110, отправляет идентификатор устройства 110, на котором он установлен, и данный идентификатор отсутствует в базе 170;• the client 120 installed on the device 110 sends the identifier of the device 110 on which it is installed, and this identifier is not in the database 170;

• клиент 120 зафиксирует свой первый запуск на устройстве 110;• client 120 will commit its first launch to device 110;

• устройство 110 с установленным клиентом 120 фиксирует в своем окружении устройство 110а, информация о котором отсутствует как в базе данных клиента 120, так и в базе 170 на серверной стороне.• the device 110 with the client 120 installed captures in its surroundings a device 110a that is missing from both the client 120 database and the server side database 170.

Таким образом неизвестным считается устройство, информация о котором отсутствует в базах данных системы 100. На этапе 210 клиентом 120 собирают информацию об устройстве 110, на котором клиент установлен, либо о любом другом обнаруженном на этапе 201 устройстве. Клиентом собирается информация, характеризующая устройство (характеристики устройства) и информация, характеризующую окружение устройства (характеристики окружения устройства). Возможные характеристики устройства и окружения были перечислены выше. На этапе 210 клиент обнаруживает другие устройства (отличные от обнаруженных на этапе 201) и накапливает информацию о соединениях, где для обнаружения используются сетевые протоколы: DHCP, ICMP, ARP, MDNS, UPNP, NetBIOS и т.д. Также клиент фиксирует все соединения в сети GSM и обнаруживает IoT устройства, например, используя возможности технологий ZigBee, LPWAN, BLE и т.д. На этом этапе, очевидно, могут быть обнаружены неизвестные устройства типа 110а, поэтому на Фиг. 4 процесс обнаружения и сбора изображен циклически (201а↔210). На основании собираемых характеристик на этапе 220 обнаруживают связь между устройством 110/110а и окружением устройства и формируют профиль связи.Thus, unknown is a device that is not available in the databases of the system 100. At step 210, the client 120 collects information about the device 110 on which the client is installed, or about any other device discovered at step 201. The client collects information characterizing the device (characteristics of the device) and information characterizing the environment of the device (characteristics of the environment of the device). The possible characteristics of the device and environment have been listed above. At step 210, the client discovers other devices (other than those discovered at step 201) and accumulates information about connections where network protocols are used for discovery: DHCP, ICMP, ARP, MDNS, UPNP, NetBIOS, etc. Also, the client records all connections in the GSM network and discovers IoT devices, for example, using the capabilities of ZigBee, LPWAN, BLE, etc. At this stage, obviously unknown devices such as 110a can be detected, so in FIG. 4, the detection and collection process is depicted cyclically (201a - 210). Based on the collected characteristics, at step 220, the communication between the device 110 / 110a and the environment of the device is detected and a communication profile is generated.

Далее необходимо обнаружить кластер устройств, содержащий по меньшей мере одно устройство, связь которого похожа на обнаруженную на этапе 220 связь. Для этого на этапе 230а сравнивают обнаруженные связи с известными. Если похожие связи обнаружены, то на этапе 231а устройство помещается в кластеры устройств, устройства которых имеют похожие связи. Очевидно, что устройство может попасть одновременно в различные кластеры, потому что:Next, you need to discover a cluster of devices containing at least one device whose communication is similar to the communication found in step 220. To do this, at step 230a, the detected connections are compared with the known ones. If similar relationships are found, then at step 231a, the device is placed into device clusters whose devices have similar relationships. Obviously, a device can fall into different clusters at the same time, because:

• связи могут сравниваться не только по векторам, но и по отдельным характеристикам (расстояние измеряется не в пространстве, а в проекции);• links can be compared not only by vectors, but also by individual characteristics (distance is measured not in space, but in projection);

• устройство обычно имеет более чем одну связь.• the device usually has more than one link.

После того как в кластер устройств добавили устройство необходимо обновить связанный с кластером профиль окружения, это происходит на этапе 251. В частном случае (например, для выявления устройств, принадлежащих одному домохозяйству), прежде чем осуществить кластеризацию необходимо определить тип обнаруженной связи (этап 221) по принадлежности к сети (домашняя, публичная и т.д.) и искать похожие среди известных связей одного типа. В другом частном случае задача отнесения к домохозяйству может решаться иначе, для этого тип обнаруженных связей не определяется, но кластеры должны быть предварительно размечены (классифицированы), например, выделяются кластеры устройств, сгруппированные на основании похожести связей, тип связи у которых одинаков. Т.е. кластер объединяет устройства с похожими связями, векторы которых похожи, по меньшей мере по одной из характеристике (в примере, по меньшей мере по типу связи). Размечаться кластеры могут любым известным из уровня техники способом используемых при машинном обучении с «привлечением» учителя.After a device has been added to the device cluster, it is necessary to update the environment profile associated with the cluster, this occurs at step 251. In a special case (for example, to identify devices belonging to the same household), before performing clustering, it is necessary to determine the type of detected connection (step 221) by network membership (home, public, etc.) and look for similar ones among known connections of the same type. In another special case, the problem of assigning to a household can be solved differently, for this, the type of detected connections is not determined, but the clusters must be preliminarily marked (classified), for example, clusters of devices are allocated, grouped based on the similarity of connections, the type of connection for which is the same. Those. the cluster unites devices with similar connections, the vectors of which are similar in at least one of the characteristics (in the example, at least in the connection type). Clusters can be marked by any method known from the prior art, used in machine learning with the "involvement" of a teacher.

Если похожие связи при сравнении на этапе 230а не обнаружены создается новый кластер устройств на этапе 232 и с ним связывают новый профиль окружения на этапе 250.If no similar associations are found in the comparison at step 230a, a new device cluster is created at step 232 and a new environment profile is associated with it at step 250.

На этапе 210 собирают не только характеристики окружения, но и характеристики устройства, на основании характеристик окружения, характеристик устройства и дополнительных источников на этапе 222 формируют профиль пользователя устройства. Сформированный профиль пользователя на этапе 240а сравнивается с профилями пользователей других устройств кластера. Это делается для того, чтобы найти устройства, использующиеся одним и тем же пользователем. Если найден похожий профиль пользователя устройства среди устройств кластера найден, то устройства для которого формировался профиль на этапе 222 относят в подкластер, содержащий устройство с похожим профилем пользователя. Когда профиль похож на профили пользователей устройств из разных подкластеров, устройство относят в подкластеру с профилями пользователей устройств, которых похожесть максимальна (ближе к ядру кластеру, больше степень похожести и т.д.). В другом частном случае устройство помещают во все подкластеры, содержащие устройства с похожими профилями пользователя это делается из тех соображений, что данным устройством могут пользоваться несколько пользователей. Если похожих профилей не найдено на этапе 242 создают новый подкластер, это может свидетельствовать о том, что в окружении появился пользователь, который был неизвестен. После обновления подкластеров на этапе 241 или создания нового подкластера на этапе 242 необходимо обновить связанный с кластером расширенный профиль, это делается на этапе 261.At step 210, not only the environmental characteristics are collected, but also the characteristics of the device, based on the characteristics of the environment, the characteristics of the device and additional sources, at block 222, a profile of the user of the device is generated. The generated user profile is compared at step 240a with the user profiles of other devices in the cluster. This is done in order to find devices used by the same user. If a similar device user profile is found among the devices in the cluster, then the devices for which the profile was generated in step 222 are assigned to a sub-cluster containing a device with a similar user profile. When the profile is similar to the user profiles of devices from different sub-clusters, the device is assigned to a sub-cluster with the profiles of device users that are most similar (closer to the cluster core, more similarity, etc.). In another special case, the device is placed in all sub-clusters containing devices with similar user profiles, this is done on the basis that this device can be used by several users. If no similar profiles are found at block 242, a new subcluster is created, this may indicate that an unknown user has appeared in the environment. After updating the subclusters in step 241 or creating a new subcluster in step 242, the extended profile associated with the cluster needs to be updated at step 261.

На Фиг. 4а-4д изображен пример осуществления способа отнесения неизвестного устройства к кластеру. В примере устройства 110в/110г с установленным клиентом 120 (на фигуре не изображен). Необходимо для устройств 110, изображенных на Фиг. 4а, определить кластеры домохозяйств, к которым относятся устройства и пользователей устройств.FIG. 4a-4e show an example of the implementation of the method of assigning an unknown device to a cluster. In an example 110v / 110g device with client 120 installed (not shown). Required for devices 110 of FIG. 4a, identify the clusters of households to which devices and device users belong.

Клиентом 120 на устройствах собирают информацию, характеризующую устройство (далее характеристики устройства) и информацию, характеризующую окружение устройства (далее характеристики окружения устройства), данная информация может собираться накапливаться в течении некоторого времени, например, недели. Далее, что изображено на Фиг. 4б на основании собранных характеристик обнаруживают связи 300 между устройствами и окружением устройств, элементами такого окружения в частном случае выступают точки доступа 310. На основании собранной информации о связях их типизируют (Фиг. 4в), в данном примере выделяют связи в рамках следующих типов сетей:The client 120 collects information characterizing the device (hereinafter referred to as device characteristics) and information characterizing the device's environment (hereinafter referred to as the characteristics of the device environment) on devices, this information can be collected over a period of time, for example, a week. Further, as shown in FIG. 4b, based on the collected characteristics, connections 300 between devices and the environment of devices are detected, access points 310 in a particular case act as elements of such an environment. Based on the collected information about connections, they are typed (FIG. 4c), in this example, connections are identified within the following types of networks:

• локальная частная (домашняя) сеть - 300а;• local private (home) network - 300a;

• локальная публичная сеть - 300б.• local public network - 300b.

Так как необходимо определить устройства в рамках одного домохозяйства, то из всех сформированных связей отбирают связи, которые имеют тип - локальная частная (домашняя) сеть (характеристика связи тип связи = локальная частная (домашняя) сеть). Для того чтобы обнаружить кластеры домохозяйств, к которым относятся устройства обнаруженные связи устройств сравнивают с известными связями устройств из кластеров устройств (HomeID1 и HomeID2), изображенных на Фиг. 3г. В данном примере связи считаются похожими, если по меньшей мере одна из характеристик обнаруженной связи (помимо характеристики тип связи) тождественна или похожа на аналогичную характеристику другой связи. В примере такими характеристиками связи могут быть:Since it is necessary to determine devices within one household, then from all formed links, links are selected that have the type - local private (home) network (link characteristic type of link = local private (home) network). In order to discover the clusters of households to which the devices belong, the discovered device associations are compared with the known device associations from the device clusters (HomeID1 and HomeID2) shown in FIG. 3d. In this example, relationships are considered similar if at least one of the characteristics of the detected relationship (in addition to the characteristic type of relationship) is identical or similar to a similar characteristic of another relationship. In an example, such communication characteristics can be:

• MAC адрес точки доступа (характеристики должны быть тождественны);• MAC address of the access point (characteristics must be identical);

• название точки доступа - SSID (характеристики должны быть тождественны);• access point name - SSID (characteristics must be identical);

• длительность подключения (характеристики должны быть похожи или превышать некоторое пороговое значение характеристики эталонной связи).• duration of connection (characteristics should be similar or exceed some threshold value of the reference communication characteristics).

Результаты сравнения изображены на Фиг. 4г. Для устройства 110в похожие связи обнаружены у устройств из кластера HomeID1, поэтому данное устройство относят к этому кластеру. Для устройства 110г похожих связей, среди известных связей у устройств кластеров HomeID1 и HomeID2 не обнаружено, поэтому создается новый кластер HomeID3.The comparison results are shown in FIG. 4d. For the 110b device, similar connections were found for devices from the HomeID1 cluster, so this device is referred to this cluster. For device 110g, no similar links were found among the known links for devices of the clusters HomeID1 and HomeID2, so a new cluster HomeID3 is created.

Далее (Фиг. 4д), используя собранную информацию об устройствах и профили пользователей этих устройств, определяют пользователей устройств 110в/110г (ищутся похожие профили пользователей среди известных). Для устройства 110в похожий профиль пользователя найден (профиль пользователя с идентификатором UserID2) и данное устройство относят в подкластер UserID2, для устройства 110г похожий профиль не найден и для него создается новый подкластер UserID6. Так обновляют расширенный кластер устройств HomeID1, в соответствии с которым обновляют расширенный профиль окружения HomeID1, и создают расширенный кластер HomeID3, в соответствии с которым создают расширенный профиль окружения HomeID3.Further (Fig. 4e), using the collected information about the devices and the user profiles of these devices, the users of the 110v / 110g devices are determined (similar user profiles are searched among the known ones). For device 110b, a similar user profile was found (user profile with UserID2) and this device was assigned to the UserID2 subcluster, for 110g, a similar profile was not found and a new UserID6 subcluster was created for it. Thus, the extended cluster of devices HomeID1 is updated, in accordance with which the extended environment profile HomeID1 is updated, and an extended cluster HomeID3 is created, in accordance with which the extended environment profile HomeID3 is created.

На Фиг. 5 изображен способ 500 обнаружения связей между кластерами, на базе которого происходит обнаружение, например, связанных домохозяйств и агентов влияния (от англ. influencer) - пользователей, через которых и устройства которых, возможно распространять, в том числе, защитные решения и усиливать комплексную защиту домохозяйств, что является первым шагом к созданию иммунной системы сети. На первом этапе 200а получают предварительно сформированные кластеры устройств. Кластеры могут быть сформированы по способу 200 или любым другим известным из уровня техники способом. На этапе 200а получают по меньшей мере два кластера, из которых на этапе 201б выбирают по меньшей мере по одному устройству, в частном случае выбирают все устройства. На этапе 205 для выбранных устройств получают их связи. Если кластеры формировались по способу 200, то связи для устройств сохранены в базе связей 150 и получение заключается в запросе к базе связей. Если связи устройств не обнаруживались ранее или требуется обновление характеристик связей устройств, то для получения связей выполняются этапы 210 и 220, описанные ранее. Полученные связи сравниваются между собой, при этом сравниваются связи устройств из различных кластеров, связи устройств из одного кластера между собой не сравниваются. Если связи похожи, то кластеры признают связанными, так на этапе 233 обнаруживают связь между кластерами и на этапе 270 формируют профиль межкластерной связи. Профили окружения, описывающие кластеры, между которыми обнаружена связь тоже связываются (этап 252). Профиль межкластерной связи, содержит информацию о связи, например, какие кластеры связаны, какова сила связи (определяется степенью похожести, полученной на этапе 230а, числом похожих связей их типом и числом устройств с похожими связями), какие типы связей похожи, какова длительность существования похожих связей и т.д. В зависимости от характера похожести, например, когда при сравнении обнаружена тождественность связей, связанными признаются и подкластеры, так на этапе 243 обнаруживают связь между подкластерами. Если подкластеры не созданы, их создают, для этого осуществляют этапы 222, 240, 241, 242. После обнаружения на этапе 243 связи, связывают и соответствующие расширенные профили окружения, это происходит на этапе 262, все изменения отражаются в профиле межкластерной связи на этапе 270. Если кластеры содержат устройства из одного домохозяйства, то наличие связи между кластерами говорит о том, что между домохозяйства связаны, а если удалось связать подкластеры, то удалось обнаружить потенциальных агентов влияния - лиц из одного домохозяйства, которые имеют влияние на лиц другого домохозяйства. В частном случае это необходимо учитывать при построении системы защиты и осуществлении охраны домохозяйства.FIG. 5 depicts a method 500 for detecting connections between clusters, on the basis of which, for example, connected households and influencers (from the English influencer) are detected - users through whom and whose devices it is possible to distribute, including security solutions and enhance complex protection households, which is the first step towards building an immune system network. In a first step 200a, pre-formed device clusters are obtained. Clusters can be formed by method 200 or any other method known in the art. In step 200a, at least two clusters are obtained, from which in step 201b at least one device is selected, in particular all devices are selected. At 205, their associations are obtained for the selected devices. If the clusters were formed by method 200, then the connections for the devices are stored in the linkbase 150 and retrieval consists in a query to the linkbase. If device linkages have not been previously discovered, or if an update of the device linkage characteristics is required, then steps 210 and 220 described earlier are performed to obtain the links. The obtained connections are compared with each other, while the connections of devices from different clusters are compared, the connections of devices from the same cluster are not compared with each other. If the links are similar, then the clusters are considered linked, so at step 233 a link between the clusters is detected and at step 270 an inter-cluster link profile is generated. Environment profiles describing clusters between which a relationship is found are also associated (block 252). Inter-cluster communication profile, contains information about the connection, for example, which clusters are connected, what is the strength of the connection (determined by the degree of similarity obtained at step 230a, the number of similar connections, their type and the number of devices with similar connections), what types of connections are similar, how long the existence of similar connections, etc. Depending on the nature of the similarity, for example, when the comparison reveals the identity of the links, the subclusters are also recognized as related, so at step 243, the relationship between the subclusters is found. If the subclusters are not created, they are created, for this, steps 222, 240, 241, 242 are performed. After discovery in the communication step 243, the corresponding extended environment profiles are also associated, this happens in step 262, all changes are reflected in the inter-cluster communication profile in step 270 If the clusters contain devices from one household, then the presence of a connection between the clusters indicates that the households are connected, and if it was possible to connect the subclusters, then it was possible to find potential agents of influence - persons from one household who have an influence on the persons of another household. In a particular case, this must be taken into account when building a protection system and protecting a household.

На Фиг. 5а и Фиг. 5б изображен пример осуществления способа обнаружения связей между кластерами. На Фиг. 5а изображены предварительно сформированные способом 200 кластеры HomeID1 и HomeID2. Из этих кластеров выбирают по устройству, такими устройствами являются устройства 110б и 110д. Для выбранных устройств получают связи. Этими связями являются связи:FIG. 5a and FIG. 5b shows an example of a method for detecting connections between clusters. FIG. 5a shows clusters HomeID1 and HomeID2 pre-formed by method 200. From these clusters are selected by device, such devices are 110b and 110d. Links are obtained for the selected devices. These links are links:

• для устройства 110б: 300а' (две связи), 300б', 300в', 300г'• for device 110b: 300a '(two connections), 300b', 300v ', 300g'

• для устройства 110д: 300а', 300в', 300г'.• for 110d device: 300a ', 300v', 300g '.

Полученные связи устройств сравниваются между собой, например, связь 300а' устройства 110б сравнивается со связью 300а' устройства 110б. Между собой сравниваются связи только одного типа, при этом выбираются характеристики, по которым сравниваются связи. Например, связи типа 300а сравниваются по характеристикам SSID и MAC адресу точки доступа, а связь типа 300г по всем доступным характеристикам. Очевидно, что так как сравнение связей типа 300а осуществляется по имени и адресу точки доступа, а устройства 110б и 110д подключались к точке доступа из кластера HomeID2 (есть связь с точкой доступа), то эти связи признаются похожими по этим характеристикам. Устройства имеют также связи 300г', так как связи обнаружились, когда устройства соединялись между собой в сети GSM, то связь 300г' устройства 110б тождественна связи 300г' устройства 110б. Между другими связями сходства на основании выбранных характеристик не обнаружено. Взаимное сравнение может продолжаться и дальше и возможно еще будут обнаружены похожие связи у других устройств кластеров. Наличие похожих связей позволяет говорить о наличии связи 301 между кластерами HomeID1 и HomeID2, а наличие тождественных связей позволяет связать и подкластеры, в примере подкластеры объединяют устройства одного пользователя, поэтому на Фиг. 5б связь 302 создана между пользователями, соответственно связывают и расширенные профили окружения. При обнаружении связи между кластерами наполняют профиль межкластерной связи, где указывают на основании каких типов связей и похожести каких характеристик связь между кластерами была обнаружена. При необходимости и в зависимости от целей для которых осуществлялось поиск связей между кластерами, в профиле межкластерной связи указываются характеристики устройств, связи которых похожи и характеристики пользователей этих устройств (их профили).The resulting device connections are compared with each other, for example, the connection 300a 'of the device 110b is compared with the connection 300a' of the device 110b. Relationships of only one type are compared with each other, while the characteristics are selected by which the relationships are compared. For example, 300a links are compared in terms of SSID and MAC address of the access point, and 300g links are compared in all available characteristics. Obviously, since the comparison of links of type 300a is carried out by the name and address of the access point, and devices 110b and 110d were connected to the access point from the HomeID2 cluster (there is a connection with the access point), then these links are recognized as similar in these characteristics. The devices also have links 300g ', since the links were discovered when the devices were connected to each other in the GSM network, the link 300g' of the device 110b is identical to the link 300g 'of the device 110b. No similarities were found between the other links based on the characteristics selected. The intercomparison may continue further, and it is possible that similar relationships will still be found in other devices in the cluster. The presence of similar links allows us to speak about the presence of a link 301 between the clusters HomeID1 and HomeID2, and the presence of identical links allows linking sub-clusters, in the example, sub-clusters combine devices of one user, therefore, in Fig. 5b, a link 302 is created between users, and the extended environment profiles are linked accordingly. When a connection between clusters is found, the profile of an inter-cluster connection is filled in, where they indicate on the basis of what types of connections and the similarity of what characteristics the connection between the clusters was found. If necessary, and depending on the purposes for which the search for connections between clusters was carried out, the inter-cluster communication profile specifies the characteristics of devices whose connections are similar and the characteristics of users of these devices (their profiles).

Профиль окружения для домохозяйства позволяет использовать адаптивную защиту и оперативно реагировать на возникающие угрозы. Клиенты 120, которые установлены на устройствах 110 позволяют изменять характеристики связей и характеристики устройства для того, чтобы сделать реализацию угрозы невозможной и защитить домохозяйство. В аналогичных целях используются профили окружения не только домохозяйств.The household environment profile allows you to use adaptive protection and quickly respond to emerging threats. Clients 120 that are installed on devices 110 allow communication characteristics and device characteristics to be changed in order to make the threat impossible and protect the household. For similar purposes, not only household profiles are used.

Под средствами системы 100 понимаются реальные устройства, системы, компоненты, группа компонентов, реализованные с использованием аппаратных средств, таких как интегральные микросхемы (англ. application-specific integrated circuit, ASIC) или программируемой вентильной матрицы (англ. field-programmable gate array, FPGA) или, например, в виде комбинации программных и аппаратных средств, таких как микропроцессорная система и набор программных инструкций, а также на нейроморфных чипах (англ. neurosynaptic chips) функциональность указанных модулей может быть реализована исключительно аппаратными средствами, а также в виде комбинации, где часть функциональности реализована программными средствами, а часть аппаратными. В некоторых вариантах реализации средства могут быть исполнены на процессоре компьютера общего назначения (например, который изображен на Фиг. 6). Базы данных могут быть реализованы всеми возможными способами и содержаться как на одном физическом носителе, так и на разных, располагаться как локально, так и удаленно.System 100 means real devices, systems, components, a group of components implemented using hardware such as an application-specific integrated circuit (ASIC) or a field-programmable gate array (FPGA) ) or, for example, in the form of a combination of software and hardware, such as a microprocessor system and a set of software instructions, as well as on neurosynaptic chips, the functionality of these modules can be implemented exclusively by hardware, as well as a combination, where part of the functionality is implemented in software, and part in hardware. In some implementations, the tools may be executed on a processor of a general purpose computer (eg, as depicted in FIG. 6). Databases can be implemented in all possible ways and contained both on one physical medium, and on different ones, located both locally and remotely.

Фиг. 6 представляет пример компьютерной системы общего назначения, персональный компьютер или сервер 20, содержащий центральный процессор 21, системную память 22 и системную шину 23, которая содержит разные системные компоненты, в том числе память, связанную с центральным процессором 21. Системная шина 23 реализована, как любая известная из уровня техники шинная структура, содержащая в свою очередь память шины или контроллер памяти шины, периферийную шину и локальную шину, которая способна взаимодействовать с любой другой шинной архитектурой. Системная память содержит постоянное запоминающее устройство (ПЗУ) 24, память с произвольным доступом (ОЗУ) 25. Основная система ввода/вывода (BIOS) 26, содержит основные процедуры, которые обеспечивают передачу информации между элементами персонального компьютера 20, например, в момент загрузки операционной системы с использованием ПЗУ 24.FIG. 6 shows an example of a general-purpose computer system, a personal computer or server 20, comprising a central processing unit 21, a system memory 22, and a system bus 23 that contains various system components, including memory associated with the central processing unit 21. The system bus 23 is implemented as any bus structure known from the prior art, which in turn contains a bus memory or a bus memory controller, a peripheral bus and a local bus that is capable of interfacing with any other bus architecture. System memory contains read-only memory (ROM) 24, random access memory (RAM) 25. The main input / output system (BIOS) 26 contains basic procedures that transfer information between the elements of the personal computer 20, for example, at the time of loading the operating room. systems using ROM 24.

Персональный компьютер 20 в свою очередь содержит жесткий диск 27 для чтения и записи данных, привод магнитных дисков 28 для чтения и записи на сменные магнитные диски 29 и оптический привод 30 для чтения и записи на сменные оптические диски 31, такие как CD-ROM, DVD-ROM и иные оптические носители информации. Жесткий диск 27, привод магнитных дисков 28, оптический привод 30 соединены с системной шиной 23 через интерфейс жесткого диска 32, интерфейс магнитных дисков 33 и интерфейс оптического привода 34 соответственно. Приводы и соответствующие компьютерные носители информации представляют собой энергонезависимые средства хранения компьютерных инструкций, структур данных, программных модулей и прочих данных персонального компьютера 20.The personal computer 20, in turn, contains a hard disk 27 for reading and writing data, a magnetic disk drive 28 for reading and writing to removable magnetic disks 29 and an optical drive 30 for reading and writing to removable optical disks 31, such as CD-ROM, DVD -ROM and other optical media. The hard disk 27, the magnetic disk drive 28, and the optical drive 30 are connected to the system bus 23 via the hard disk interface 32, the magnetic disk interface 33, and the optical drive interface 34, respectively. Drives and corresponding computer storage media are non-volatile storage media for computer instructions, data structures, program modules and other data of a personal computer 20.

Настоящее описание раскрывает реализацию системы, которая использует жесткий диск 27, сменный магнитный диск 29 и сменный оптический диск 31, но следует понимать, что возможно применение иных типов компьютерных носителей информации 56, которые способны хранить данные в доступной для чтения компьютером форме (твердотельные накопители, флеш карты памяти, цифровые диски, память с произвольным доступом (ОЗУ) и т.п.), которые подключены к системной шине 23 через контроллер 55.The present description discloses an implementation of a system that uses a hard disk 27, a removable magnetic disk 29 and a removable optical disk 31, but it should be understood that other types of computer storage media 56 are possible that are capable of storing data in a computer readable form (solid state drives, flash memory cards, digital disks, random access memory (RAM), etc.), which are connected to the system bus 23 through the controller 55.

Компьютер 20 имеет файловую систему 36, где хранится записанная операционная система 35, а также дополнительные программные приложения 37, другие программные модули 38 и данные программ 39. Пользователь имеет возможность вводить команды и информацию в персональный компьютер 20 посредством устройств ввода (клавиатуры 40, манипулятора «мышь» 42). Могут использоваться другие устройства ввода (не отображены): микрофон, джойстик, игровая консоль, сканнер и т.п. Подобные устройства ввода по своему обычаю подключают к компьютерной системе 20 через последовательный порт 46, который в свою очередь подсоединен к системной шине, но могут быть подключены иным способом, например, при помощи параллельного порта, игрового порта или универсальной последовательной шины (USB). Монитор 47 или иной тип устройства отображения также подсоединен к системной шине 23 через интерфейс, такой как видеоадаптер 48. В дополнение к монитору 47, персональный компьютер может быть оснащен другими периферийными устройствами вывода (не отображены), например, колонками, принтером и т.п.Computer 20 has a file system 36, where the recorded operating system 35 is stored, as well as additional software applications 37, other program modules 38 and program data 39. The user has the ability to enter commands and information into the personal computer 20 through input devices (keyboard 40, manipulator " mouse "42). Other input devices may be used (not shown): microphone, joystick, game console, scanner, etc. Such input devices are conventionally connected to the computer system 20 through a serial port 46, which in turn is connected to the system bus, but can be connected in another way, for example, using a parallel port, a game port, or a universal serial bus (USB). A monitor 47 or other type of display device is also connected to the system bus 23 via an interface such as a video adapter 48. In addition to the monitor 47, the personal computer may be equipped with other peripheral output devices (not displayed), such as speakers, a printer, etc. ...

Персональный компьютер 20 способен работать в сетевом окружении, при этом используется сетевое соединение с другим или несколькими удаленными компьютерами 49. Удаленный компьютер (или компьютеры) 49 являются такими же персональными компьютерами или серверами, которые имеют большинство или все упомянутые элементы, отмеченные ранее при описании существа персонального компьютера 20, представленного на Фиг. 6. В вычислительной сети могут присутствовать также и другие устройства, например, маршрутизаторы, сетевые станции, пиринговые устройства или иные сетевые узлы.The personal computer 20 is capable of operating in a networked environment using a network connection with other or more remote computers 49. The remote computer (or computers) 49 are the same personal computers or servers that have most or all of the elements mentioned earlier in the description of the entity. the personal computer 20 shown in FIG. 6. There may also be other devices on a computer network, such as routers, network stations, peer-to-peer devices, or other network nodes.

Сетевые соединения могут образовывать локальную вычислительную сеть (LAN) 50 и глобальную вычислительную сеть (WAN). Такие сети применяются в корпоративных компьютерных сетях, внутренних сетях компаний и, как правило, имеют доступ к сети Интернет. В LAN- или WAN-сетях персональный компьютер 20 подключен к локальной сети 50 через сетевой адаптер или сетевой интерфейс 51. При использовании сетей персональный компьютер 20 может использовать модем 54 или иные средства обеспечения связи с глобальной вычислительной сетью, такой как Интернет. Модем 54, который является внутренним или внешним устройством, подключен к системной шине 23 посредством последовательного порта 46. Следует уточнить, что сетевые соединения являются лишь примерными и не обязаны отображать точную конфигурацию сети, т.е. в действительности существуют иные способы установления соединения техническими средствами связи одного компьютера с другим.Network connections can form a local area network (LAN) 50 and a wide area network (WAN). Such networks are used in corporate computer networks, internal networks of companies and, as a rule, have access to the Internet. In LAN or WAN networks, personal computer 20 is connected to local network 50 via a network adapter or network interface 51. When using networks, personal computer 20 may use a modem 54 or other means of providing communication with a wide area network, such as the Internet. Modem 54, which is an internal or external device, is connected to the system bus 23 via a serial port 46. It should be noted that the network connections are only exemplary and are not required to reflect the exact configuration of the network, i. E. in fact, there are other ways of establishing a connection by technical means of communication of one computer with another.

В заключение следует отметить, что приведенные в описании сведения являются примерами, которые не ограничивают объем настоящего изобретения, определенного формулой. Специалисту в данной области становится понятным, что могут существовать и другие варианты осуществления настоящего изобретения, согласующиеся с сущностью и объемом настоящего изобретения.In conclusion, it should be noted that the information given in the description are examples and do not limit the scope of the present invention defined by the claims. One skilled in the art will appreciate that there may be other embodiments of the present invention consistent with the spirit and scope of the present invention.

Claims (27)

1. Способ формирования кластеров устройств, в котором:1. A method of forming clusters of devices, in which: а) собирают информацию, характеризующую неизвестные устройства (далее, характеристики устройства), и информацию, характеризующую окружение неизвестных устройств (далее, характеристики окружения устройства);a) collect information characterizing unknown devices (hereinafter, device characteristics), and information characterizing the environment of unknown devices (hereinafter, device environment characteristics); б) на основании собранных характеристик для каждого из неизвестных устройств обнаруживают по меньшей мере одну связь между устройством и окружением устройства;b) based on the collected characteristics for each of the unknown devices, at least one connection between the device and the environment of the device is detected; в) формируют профиль связи для обнаруженной связи на основании собранных характеристик устройства и окружения, где профиль связи содержит характеристики соединения и взаимодействия между выбранным устройством и другими устройствами;c) forming a communication profile for the detected communication based on the collected characteristics of the device and the environment, where the communication profile contains the characteristics of the connection and interaction between the selected device and other devices; г) выбирают связи для кластеризации;d) select links for clustering; д) объединяют неизвестные устройства в по меньшей мере один кластер на основании похожести выбранных связей, где похожесть связей определяется на основании похожести профиля связи.e) combine unknown devices into at least one cluster based on the similarity of the selected links, where the similarity of the links is determined based on the similarity of the communication profile. 2. Способ по п.1, в котором дополнительно классифицируют кластер на основании связей, которые являются для устройств данного кластера похожими.2. The method of claim 1, further comprising classifying the cluster based on links that are similar to the devices in the cluster. 3. Способ по п.1, по которому в качестве характеристик устройства выступают по меньшей мере:3. The method according to claim 1, according to which the characteristics of the device are at least: • характеристики аппаратного обеспечения устройства;• hardware characteristics of the device; • характеристики программного обеспечения устройства;• characteristics of the device software; • характеристики сетевого трафика, формируемого устройством.• characteristics of network traffic generated by the device. 4. Способ по п.1, по которому в качестве окружения устройства выступают по меньшей мере:4. The method according to claim 1, wherein at least: • компьютерные сети, к которым осуществляется подключение устройства;• computer networks to which the device is connected; • иные устройства, к которым осуществляется подключение устройства.• other devices to which the device is connected. 5. Способ по п. 4, в котором дополнительно определяют тип сети, к которой подключается устройство.5. The method according to claim 4, further comprising determining the type of network to which the device is connected. 6. Способ по п.1, по которому в качестве характеристик окружения устройства выступают по меньшей мере:6. The method according to claim 1, wherein the characteristics of the environment of the device are at least: • характеристики сетей, к которым осуществляется подключение устройства, в том числе тип сети;• characteristics of the networks to which the device is connected, including the type of network; • сервисы, работающие на компьютерных сетях, с которыми осуществляется обмен данными устройством;• services operating on computer networks with which the device exchanges data; • иные устройства, к которым осуществляется подключение устройства;• other devices to which the device is connected; • сервисы, работающие на устройствах, к которым осуществляется подключение устройства.• services running on devices to which the device is connected. 7. Способ по п.1, в котором на основании собранных характеристик устройства и окружения формируют профиль пользователя устройства.7. The method of claim 1, wherein a user profile of the device is generated based on the collected characteristics of the device and the environment. 8. Способ по п.7, в котором объединяют устройства кластера устройств с похожими профилями в подкластер.8. The method of claim 7, wherein the devices of the cluster of devices with similar profiles are combined into a sub-cluster. 9. Способ по п.1, в котором связь описывается характеристиками связи, которые включают по меньшей мере характеристики окружения.9. The method of claim 1, wherein the communication is described by communication characteristics that include at least environmental characteristics. 10. Способ по п.8, в котором связь признается похожей, если по меньшей мере одна характеристика обнаруженной связи одного устройства похожа на характеристику обнаруженной связи другого устройства.10. The method of claim 8, wherein the link is considered similar if at least one characteristic of the detected link of one device is similar to the characteristic of the detected link of another device. 11. Способ по пп.6 и 8, в котором тип сети определяет тип связи.11. The method according to claims 6 and 8, wherein the type of network determines the type of communication. 12. Способ по п.10, в котором для кластеризации выбирают связи одного типа.12. The method of claim 10, wherein one type of link is selected for clustering. 13. Способ по п.12, в котором для кластеризации выбирают тип сети - локальная частная (домашняя) сеть.13. The method according to claim 12, wherein the network type is selected for clustering — local private (home) network.
RU2019130609A 2019-09-30 2019-09-30 Method for forming device clusters RU2747452C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2019130609A RU2747452C2 (en) 2019-09-30 2019-09-30 Method for forming device clusters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2019130609A RU2747452C2 (en) 2019-09-30 2019-09-30 Method for forming device clusters

Publications (3)

Publication Number Publication Date
RU2019130609A3 RU2019130609A3 (en) 2021-03-30
RU2019130609A RU2019130609A (en) 2021-03-30
RU2747452C2 true RU2747452C2 (en) 2021-05-05

Family

ID=75345905

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019130609A RU2747452C2 (en) 2019-09-30 2019-09-30 Method for forming device clusters

Country Status (1)

Country Link
RU (1) RU2747452C2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2821054C1 (en) * 2023-01-23 2024-06-17 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Method and system for forming clusters of nodes in computer network
WO2024158306A1 (en) * 2023-01-23 2024-08-02 Публичное Акционерное Общество "Сбербанк России" Method and system for clustering nodes in a computer network

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130173621A1 (en) * 2011-12-28 2013-07-04 International Business Machines Corporation Clustering Devices In An Internet Of Things ('IoT')
US20140241354A1 (en) * 2013-02-25 2014-08-28 Qualcomm Incorporated Establishing groups of internet of things (iot) devices and enabling communication among the groups of iot devices
US9292793B1 (en) * 2012-03-31 2016-03-22 Emc Corporation Analyzing device similarity
RU2654167C2 (en) * 2015-11-10 2018-05-16 федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский политехнический университет Петра Великого" (ФГАОУ ВО "СПбПУ") Method for detecting hidden interactions on the internet of things
RU2695487C1 (en) * 2018-09-26 2019-07-23 Олег Дмитриевич Гурин Method and system for interaction of devices of the internet of things (iot)

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130173621A1 (en) * 2011-12-28 2013-07-04 International Business Machines Corporation Clustering Devices In An Internet Of Things ('IoT')
US9292793B1 (en) * 2012-03-31 2016-03-22 Emc Corporation Analyzing device similarity
US20140241354A1 (en) * 2013-02-25 2014-08-28 Qualcomm Incorporated Establishing groups of internet of things (iot) devices and enabling communication among the groups of iot devices
RU2654167C2 (en) * 2015-11-10 2018-05-16 федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский политехнический университет Петра Великого" (ФГАОУ ВО "СПбПУ") Method for detecting hidden interactions on the internet of things
RU2695487C1 (en) * 2018-09-26 2019-07-23 Олег Дмитриевич Гурин Method and system for interaction of devices of the internet of things (iot)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2821054C1 (en) * 2023-01-23 2024-06-17 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Method and system for forming clusters of nodes in computer network
WO2024158306A1 (en) * 2023-01-23 2024-08-02 Публичное Акционерное Общество "Сбербанк России" Method and system for clustering nodes in a computer network

Also Published As

Publication number Publication date
RU2019130609A3 (en) 2021-03-30
RU2019130609A (en) 2021-03-30

Similar Documents

Publication Publication Date Title
RU2747451C2 (en) Method for detecting coupled clusters
Shahid et al. IoT devices recognition through network traffic analysis
Samarakoon et al. 5g-nidd: A comprehensive network intrusion detection dataset generated over 5g wireless network
EP3841730B1 (en) Identifying device types based on behavior attributes
Ganapathy et al. Intelligent Agent‐Based Intrusion Detection System Using Enhanced Multiclass SVM
US11140038B2 (en) Systems and methods for network device management using device clustering
US20220174008A1 (en) System and method for identifying devices behind network address translators
EP3935800B1 (en) Network protection
Ashibani et al. A behavior profiling model for user authentication in IoT networks based on app usage patterns
Monge et al. Detection of economic denial of sustainability (EDoS) threats in self-organizing networks
KR102234514B1 (en) Artificial intelligence method and system for integrated it monitoring
Chen et al. FCM technique for efficient intrusion detection system for wireless networks in cloud environment
US11570187B1 (en) Detection of cyberattacks and operational issues of internet of things devices
Aloqaily et al. Towards blockchain-based hierarchical federated learning for cyber-physical systems
RU2747452C2 (en) Method for forming device clusters
CN114205816A (en) Information security architecture of power mobile Internet of things and use method thereof
RU2747466C2 (en) Method for assigning an unknown device to a cluster
de Souza et al. Intrusion detection with Machine Learning in Internet of Things and Fog Computing: problems, solutions and research
Altaf et al. A roadmap to smart homes security aided SDN and ML
Melnyk et al. Machine learning based network traffic classification approach for Internet of Things devices
EP3798882A1 (en) System and method for protecting electronic devices from cyberattacks
Wang et al. Mining association rules for intrusion detection
Acar et al. Peek-a-boo
Andreopoulos et al. Clustering the internet topology at multiple layers
Almutairi Smart Home IoT Privacy and Security Preservation via Machine Learning Techniques.