CN111222123B - 确定具有聚集性的设备群的方法、装置、设备和存储介质 - Google Patents

确定具有聚集性的设备群的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111222123B
CN111222123B CN202010005903.4A CN202010005903A CN111222123B CN 111222123 B CN111222123 B CN 111222123B CN 202010005903 A CN202010005903 A CN 202010005903A CN 111222123 B CN111222123 B CN 111222123B
Authority
CN
China
Prior art keywords
pair
aggregation
equipment
information
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010005903.4A
Other languages
English (en)
Other versions
CN111222123A (zh
Inventor
王耀东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Financial Technology Nanjing Co Ltd
Original Assignee
Suning Financial Technology Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Financial Technology Nanjing Co Ltd filed Critical Suning Financial Technology Nanjing Co Ltd
Priority to CN202010005903.4A priority Critical patent/CN111222123B/zh
Publication of CN111222123A publication Critical patent/CN111222123A/zh
Application granted granted Critical
Publication of CN111222123B publication Critical patent/CN111222123B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/44Program or device authentication

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种确定具有聚集性的设备群的方法、装置、计算机设备和存储介质。所述方法包括:确定要确定聚集性的N个设备;将所述N个设备进行两两组合,得到M个设备对;获取每个设备对的设备硬件信息和设备操作信息等设备信息,根据所述设备信息确定每个设备对的设备相似度;根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群。本发明实施例能够精准地从多个设备中识别出具有聚集性的设备群。

Description

确定具有聚集性的设备群的方法、装置、设备和存储介质
技术领域
本申请涉及互联网技术领域,特别是涉及一种确定具有聚集性的设备群的方法、装置、计算机设备和存储介质。
背景技术
设备指纹用于识别设备唯一性。目前常用的设备指纹技术是通过部署在客户端的JS(JavaScript)代码或SDK(Software Development Kit,软件开发工具包)主动收集与设备相关的信息,更多是硬件方面的信息,比如设备的系统版本号、浏览器的语言设置及其时区、设备的网络配置等信息,并将这些信息进行组合,通过特定的哈希算法得到一个设备指纹ID值,作为该设备的唯一标识符。
然而,由于设备指纹的生成依赖于设备的相关信息,所以设备的相关信息如果发生改变,其设备指纹也会随之改变。有些不良用户就利用该设备指纹技术存在的局限,会使用一些手段来改变设备的设备指纹,比如修改浏览器配置信息,甚至通过软件篡改设备的硬编码、IP地址,UserAgent(用户代理)等重要信息,使得同一设备在同一APP或浏览器上可以对应有不同的设备指纹,这样不良用户使用数量很少的设备就能在网上生成数量很多的设备指纹,由于一个设备指纹会被识别为一个设备,所以不良用户使用上述操作就能用少量设备在网络上伪装成大量设备,进而方便其从事不良活动。
因此,如何从数量庞大的设备中识别出互相关联的设备是亟需解决的问题。
发明内容
本发明针对现有技术的缺点,提供了一种确定具有聚集性的设备群的方法、装置、计算机设备和存储介质,通过本发明实施例的方法,能够实现精准地从多个设备中识别出具有聚集性的设备群。
本发明根据第一方面提供了一种确定具有聚集性的设备群的方法,包括:
确定要确定聚集性的N个设备;
将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:
Figure BDA0002355273880000021
N为大于1的正整数,M为大于0的正整数;
获取每个设备对的设备信息,所述设备信息包括设备硬件信息和设备操作信息,根据所述设备信息确定每个设备对的设备相似度;
根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群。
在其中一个实施例中,所述每个设备对的设备信息是每个设备对包括的第一设备的第一设备信息和第二设备的第二设备信息,所述第一设备信息和第二设备信息分别包括K个对应不同特征类别的特征信息,K为大于0的正整数。
在其中一个实施例中,所述根据所述设备信息确定每个设备对的设备相似度,包括:
将每个设备对的第一设备信息的K个特征信息和第二设备信息的K个特征信息按照特征类别进行配对,得到K个特征信息对;
对每个特征信息对进行相似度分析处理,得到K份特征相似度;
对所述K份特征相似度进行汇总处理,得到每个设备对的设备相似度。
在其中一个实施例中,所述对每个特征信息对进行相似度分析处理,包括:
确定各个特征信息对的信息类型;
使用与各个特征信息对的信息类型对应的算法,对各个特征信息对进行处理。
在其中一个实施例中,所述根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群,包括:
将所述M个设备对中,设备相似度大于预设聚集阈值的设备对确定为聚集设备对,每个聚集设备对对应一个设备标识对;
将任一个聚集设备对的设备标识对与其他聚集设备对中任一个聚集设备对的设备标识对进行比对;
根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对;
将所述任一聚集设备对及其直接关联聚集设备对、间接关联聚集设备对对应的设备确定为同组具有聚集性的设备群。
在其中一个实施例中,所述根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对,包括:
从所述其他聚集设备对中,将与所述任一个聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的直接关联聚集设备对;
从所述其他聚集设备对中,将除了所述直接关联聚集设备对外,与任一个直接关联聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的间接关联聚集设备对。
在其中一个实施例中,在所述根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群之后,所述方法还包括:
将所述M个设备对中,设备相似度大于预设相似阈值的设备对确定为相似设备对,每个相似设备对对应一个设备标识对;
将任一个相似设备对的设备标识对与其他相似设备对中任一个相似设备对的设备标识对进行比对;
根据比对结果,从所述其他相似设备对中,确定出所述任一个相似设备对的直接关联相似设备对和间接关联相似设备对;
合并所述任一相似设备对及其直接关联相似设备对、间接关联聚集设备对对应的全部设备的设备标识和设备信息。
本发明根据第二方面提供了一种确定具有聚集性的设备群的装置,包括:
设备确定模块,用于确定要确定聚集性的N个设备;
设备组合模块,用于将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:
Figure BDA0002355273880000041
N为大于1的正整数,M为大于0的正整数;
设备相似度确定模块,用于获取每个设备对的设备信息,所述设备信息包括设备硬件信息和设备操作信息,根据所述设备信息确定每个设备对的设备相似度;
聚集性设备群确定模块,用于根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群。
本发明根据第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例的方法的步骤。
本发明根据第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例的方法的步骤。
上述确定具有聚集性的设备群的方法、装置、计算机设备和存储介质,先确定要确定聚集性的N个设备,接着将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:
Figure BDA0002355273880000042
N为大于1的正整数,M为大于0的正整数;再获取每个设备对的设备硬件信息和设备操作信息等设备信息,并根据所述设备信息确定每个设备对的设备相似度,最后根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群,能够实现精准地从多个设备中识别出相互关联的设备,即具有聚集性的设备群。
附图说明
图1为一个实施例中一种确定具有聚集性的设备群的方法的流程示意图;
图2为一个实施例中一种确定具有聚集性的设备群的装置的结构框图;
图3为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用于解释本申请,并不用于限定本申请。
如图1所示,本发明的一个实施例中,提供了一种确定具有聚集性的设备群的方法,以该方法应用于服务器为例进行说明,其中,该服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。该方法包括以下步骤:
S110,确定要确定聚集性的N个设备。
在本实施例中,服务器可以在接收到管理员下发的聚集性识别指令或者管理员预设的聚集性识别任务触发后,需要确定出要确定聚集性,即要进行聚集性识别的N个设备,服务器会将该聚集性识别指令或聚集性识别任务对应的设备确定为要进行聚集性识别的设备。该设备是服务器用于区分不同设备信息的区分标识,比如,可以是在存储设备信息时,数据库为该设备信息分配的唯一序列号,或者根据该设备信息生成的设备指纹。
S120,将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:
Figure BDA0002355273880000051
N为大于1的正整数,M为大于0的正整数。
具体地,服务器在确定出要进行聚集性识别的N个设备之后,将该N个设备进行两两组合,得到M个设备对,比如,将设备A、B、C三个设备进行两两组合,可以得到(A,B)、(A,C)和(B,C)共3个设备对。
S130,获取每个设备对的设备信息,所述设备信息包括设备硬件信息和设备操作信息,根据所述设备信息确定每个设备对的设备相似度。
具体地,在完成N个设备的两两组合后,服务器从存储设备信息的数据库中获取每个设备对的设备信息,设备信息包括设备硬件信息和设备操作信息。设备硬件信息是指设备的硬件信息,如操作系统版本、设备CPU型号等信息,设备操作信息是指用户对设备的操作信息,如设备的登陆时间段、设备的关联设备等信息。
具体地,每个设备对的设备信息是指每个设备对包括的第一设备的第一设备信息和第二设备的第二设备信息,需要说明的是,第一设备和第二设备都是指设备,其中的“第一”“第二”是用于区分设备对包括的两个设备,本实施例不限定设备对中的哪个设备是第一设备,哪个设备是第二设备;第一设备信息和第二设备信息都是指设备信息,其中的“第一”“第二”是用于区分设备信息对应哪个设备,第一设备信息指的是第一设备对应的设备信息,同理,第二设备信息指的是第二设备对应的设备信息。第一设备信息和第二设备信息各自包括K个对应不同特征类别的特征信息,K为大于0的正整数,这也是说每个设备信息会包含有多个特征信息,每个特征信息对应一个特征类别,服务器在采集设备信息时,需要根据预先配置的特征类别来采集特征类别对应的特征信息,具体的特征类别可以由管理员预先配置,比如,管理员预先配置两个特征类别,分别为浏览器列表、操作系统版本、设备CPU型号,那么服务器就会采集浏览器列表、操作系统版本和设备CPU型号对应的特征信息。
在获取到设备对的设备信息后,使用预设算法对各个设备对的设备信息进行处理,从而确定各个设备对的设备相似度。
S140,根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群。
具体地,服务器确定出各个设备对的设备相似度之后,将每个设备对与其他设备对的设备相似度进行对比,并根据对比结果来判断设备对与设备对之间是否具有聚集性。
设备信息是设备聚集性识别的分析基础,本实施例摒弃原先主要将设备硬件信息作为设备信息的做法,在设备硬件信息的基础上增加了设备操作信息,因为同一用户或者同一类用户的操作习惯会比较相同,即使更换了使用的设备,其在新设备上的设备操作信息也会跟老设备上的设备操作信息有很大相似,因此在设备信息中加入设备硬件信息能够协助挖掘出不同的设备之间的联系。本实施例利用多维度的设备信息对设备间的聚集性进行识别,降低了设备硬件信息对聚集性识别准确性的影响,能够精准地从多个设备中识别出具有聚集性的设备群。
在一个实施例中,所述根据所述设备信息确定每个设备对的设备相似度,可以包括:
将每个设备对的第一设备信息的K个特征信息和第二设备信息的K个特征信息按照特征类别进行配对,得到K个特征信息对;
对每个特征信息对进行相似度分析处理,得到K份特征相似度;
对所述K份特征相似度进行汇总处理,得到每个设备对的设备相似度。
在本实施例中,服务器在根据每个设备对的设备信息确定每个设备对的设备相似度时,先将每个设备对的第一设备信息的K个特征信息和第二设备信息的K个特征信息按照特征类别进行配对,比如,在为设备对(device1,device2)配对“登录过的IP地址”这个特征类别时,在该特征类别上,设备device1的特征信息为(IP1,IP2,IP3),设备device2的特征信息为(IP4,IP5),则设备对(device1,device2)对应的“登录过的IP地址”这个特征类别上的特征信息对为{(IP1,IP2,IP3),(IP3,IP4)}。其它的特征类别也跟上述配对“登录过的IP地址”的过程一样,当第一设备和第二设备的K个特征信息配对完成后,就得到K个特征信息对。
接着对每个特征信息对进行相似度分析处理,从而得到K份特征相似度。
具体地,所述对每个特征信息对进行相似度分析处理,包括:
确定各个特征信息对的信息类型;
使用与各个特征信息对的信息类型对应的算法,对各个特征信息对进行处理。
在本实施例中,设备信息由很多特征类别的特征信息构成,为了更准确地计算出各个特征信息对之间的相似度,为各个特征类别的特征信息对预先配置相应的算法,在处理特征信息对时,先确定特征信息对的信息类型,再使用与特征信息对对应的算法来处理。
具体地,某些算法可以适用于处理多种特征类别的特征信息对,因此,总结出多个信息类型,同一信息类型的特征信息对使用同一算法进行处理。需要说明的是,特征类别可以由管理员根据不同应用场景的进行具体配置,各个特征类比对应的算法也是根据不同应用场景针对性配置。
比如,如表1-1所示为在一个电商应用场景中部分特征类别及其对应的算法的具体配置。
表1-1:
Figure BDA0002355273880000081
Figure BDA0002355273880000091
在服务器计算得到每个设备对的K份特征相似度之后,对该K份特征相似度进行汇总处理,得到每个设备对的设备相似度。
具体地,服务器可以使用预先建立好的Xgboost(eXtreme Gradient Boosting,全名叫极端梯度提升)模型对每个设备对的K份特征相似度进行汇总计算来得到每个设备对的设备相似度。
Xgboost模型为采用boosting方法的集成学习算法,弱学习器为CART(Classification and Regression tree,分类回归树)决策树,可以看成是由K棵树{f,f,…,f}组成的加法模型,目标函数由损失函数和正则项两部分组成,损失函数采用了二阶泰勒展开进行逼近。
模型的建立过程包括以下步骤:
(1)将初始预测值赋值为0;
(2)从根节点开始,根据每个特征将训练数据进行排序,采用贪心算法计算每个特征的收益;此处的收益为分裂节点分裂前的最优值减去左子树的最优值和右子数的最优值,此处的最优值由目标函数的二阶泰勒展开推导得到;选择收益最大的特征作为分裂特征,并将样本数据映射到相应的叶子节点;对生成的叶子节点递归进行此操作直到达到一定的限制条件,决策树生成过程结束;
(3)然后由损失函数的一阶导数和二阶导数得到计算(2)中生成的决策树叶子节点的权值,作为下一棵树的拟合目标;
(4)回到第(2)步,递归执行到满足特定条件为止,至此完成模型建立过程。
服务器将每个设备对的K份特征相似度输入建立好的Xgboost模型,将Xgboost模型的预先建立的K棵决策树的结果加权求和,得到的结果即为每个设备对的设备相似度。
在一个实施例中,所述根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群,包括:
将所述M个设备对中,设备相似度大于预设聚集阈值的设备对确定为聚集设备对,每个聚集设备对对应一个设备标识对;
将任一个聚集设备对的设备标识对与其他聚集设备对中任一个聚集设备对的设备标识对进行比对;
根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对;
将所述任一聚集设备对及其直接关联聚集设备对、间接关联聚集设备对对应的设备确定为同组具有聚集性的设备群。
在本实施例中,服务器将M个设备对对应的设备相似度分别与预设聚集阈值进行对比,预设聚集阈值由管理员预先配置,若设备对的设备相似度大于预设聚集阈值,则说明该设备对对应的两个设备有很大关联,相互之间具有聚集性。在完成对比之后,将设备相似度大于预设聚集阈值的设备对确定为聚集设备对,每个聚集设备对相当于一组具有聚集性的设备群。
考虑到实际场景中,具有聚集性的设备群通常会包含多个设备,而不只是包含两个设备,属于不同聚集设备对的设备之间也可能具有聚集性,所以还需要进一步判断不同聚集设备对的设备之间是否具有聚集性。
具体地,将任一个聚集设备对的设备标识对与其他聚集设备对中任一个聚集设备对的设备标识对进行比对。需要说明的是,每个设备对都对应有一个设备标识对,设备标识对是指设备对中第一设备对应的第一设备标识和第二设备对应的第二设备标识,设备标识也是用于区分不同设备信息,可以是设备编号,比如设备device1和设备device2组合的设备对,其设备标识对可以表示为(device1,device2)。
服务器会根据比对结果,从其他聚集设备对中,确定出与该任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对,最后将任一聚集设备对及其直接关联聚集设备对、间接关联聚集设备对对应的设备确定为同组具有聚集性的设备群,也就是将属于不同聚集设备对但之间具有聚集性的设备并到一组。
具体地,所述根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对,包括:
从所述其他聚集设备对中,将与所述任一个聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的直接关联聚集设备对;
从所述其他聚集设备对中,将除了所述直接关联聚集设备对外,与任一个直接关联聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的间接关联聚集设备对。
为了帮助阅读者更好地理解两个聚集设备对之间关联关系的确定过程,以下以一个例子来说明。
比如,A聚集设备对的设备标识对为(device1,device2)、B聚集设备对的设备标识对为(device1,device3),将A的两个设备标识分别与B中的两个设备标识进行对比,可以得到4对设备标识的对比,即device1-device1、device1-device3、device2-device1、device2-device3,4对设备标识的对比结果分别是标识重合、标识不重合、标识不重合、标识不重合,只要有一对设备标识的对比结果是标识重合,就确定两个聚集设备对之间设备标识对的对比结果为标识相关,容易理解地,如果没有任何一对设备标识的对比结果是标识重合,就确定两个聚集设备对之间设备标识对的对比结果为标识不相关。所以可以确定在上述例子中,A聚集设备对和B聚集设备对之间设备标识对的对比结果为标识相关,进而可以确定B聚集设备对是A聚集设备对的直接关联聚集设备对。假设在上述例子中,还有C聚集设备对,其设备标识对为(device3,device4),通过上述说明的对比过程可以确定A和C之间设备标识对的对比结果为标识不相关,B和C之间设备标识对的对比结果为标识相关,因为B是A的直接关联聚集设备对,所以可以确定C是A的间接关联聚集设备对。
在一个实施例中,在所述根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群之后,所述方法还包括:
将所述M个设备对中,设备相似度大于预设相似阈值的设备对确定为相似设备对,每个相似设备对对应一个设备标识对;
将任一个相似设备对的设备标识对与其他相似设备对中任一个相似设备对的设备标识对进行比对;
根据比对结果,从所述其他相似设备对中,确定出所述任一个相似设备对的直接关联相似设备对和间接关联相似设备对;
合并所述任一相似设备对及其直接关联相似设备对、间接关联聚集设备对对应的全部设备的设备标识和设备信息。
在本实施例中,服务器将M个设备对对应的设备相似度分别与预设相似阈值进行对比,预设相似阈值由管理员预先配置,若设备对的设备相似度大于预设相似阈值,则说明该设备对对应的两个设备非常相似,属于同一设备。在完成对比之后,将设备相似度大于预设相似阈值的设备对确定为相似设备对,每个相似设备对相当于一个设备。
考虑到属于不同聚集设备对的设备之间也可能是同一设备,所以还需要进一步判断不同相似设备对的设备之间是否是同一设备。
具体地,将任一个相似设备对的设备标识对与其他相似设备对中任一个相似设备对的设备标识对进行比对。在前述实施例已经对设备标识对进行了说明,在此不在赘述。在完成对比之后,服务器会根据比对结果,从其他相似设备对中,确定出与该任一个相似设备对的直接关联相似设备对和间接关联相似设备对,最后合并任一相似设备对及其直接关联相似设备对、间接关联聚集设备对对应的全部设备的设备标识和设备信息。在合并设备标识和设备信息时,可以按照设备标识的记录时间从早到晚进行排序,将记录时间非最早的所有设备标识的设备信息合并到记录时间最早的设备标识的设备信息中,当然也可以有其他合并方式,比如将记录时间非最晚的所有设备标识的设备信息合并到记录时间最晚的设备标识的设备信息中等,本发明实施例不对合并方式进行限定。
具体地,所述根据比对结果,从所述其他相似设备对中,确定出所述任一个相似设备对的直接关联相似设备对和间接关联相似设备对,包括:
从所述其他相似设备对中,将与所述任一个相似设备对间的比对结果为标识相关的聚集设备对,确定为所述任一相似设备对的直接关联相似设备对;
从所述其他相似设备对中,将除了所述直接关联相似设备对外,与任一个直接关联相似设备对间的比对结果为标识相关的相似设备对,确定为所述任一相似设备对的间接关联相似设备对。
两个相似设备对之间关联关系的确定过程与前述实施例中介绍两个聚集设备对之间关联关系的确定过程相似。
为了帮助阅读者更好地理解两个相似设备对之间关联关系的确定过程,同样以一个例子来说明。
比如,A相似设备对的设备标识对为(device1,device2)、B相似设备对的设备标识对为(device1,device3),将A的两个设备标识分别与B中的两个设备标识进行对比,可以得到4对设备标识的对比,即device1-device1、device1-device3、device2-device1、device2-device3,4对设备标识的对比结果分别是标识重合、标识不重合、标识不重合、标识不重合,只要有一对设备标识的对比结果是标识重合,就确定两个相似设备对之间设备标识对的对比结果为标识相关,如果没有任何一对设备标识的对比结果是标识重合,就确定两个相似设备对之间设备标识对的对比结果为标识不相关。在上述例子中,可以确定A相似设备对和B相似设备对之间设备标识对的对比结果为标识相关,进而可以确定B相似设备对是A相似设备对的直接关联相似设备对。假设在上述例子中,还有C相似设备对,其设备标识对为(device3,device4),通过上述说明的对比过程可以确定A和C之间设备标识对的对比结果为标识不相关,B和C之间设备标识对的对比结果为标识相关,因为B是A的直接关联相似设备对,所以可以确定C是A的间接关联相似设备对。
在一个实施例中,如图2所示,提供了一种确定具有聚集性的设备群的装置,包括:设备确定模块110、设备组合模块120、设备相似度确定模块130和聚集性设备群确定模块140,其中:
设备确定模块110,用于确定要确定聚集性的N个设备;
设备组合模块120,用于将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:
Figure BDA0002355273880000141
N为大于1的正整数,M为大于0的正整数;
设备相似度确定模块130,用于获取每个设备对的设备信息,所述设备信息包括设备硬件信息和设备操作信息,根据所述设备信息确定每个设备对的设备相似度;
聚集性设备群确定模块140,用于根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群。
在其中一个实施例中,所述每个设备对的设备信息是每个设备对包括的第一设备的第一设备信息和第二设备的第二设备信息,所述第一设备信息和第二设备信息分别包括K个对应不同特征类别的特征信息,K为大于0的正整数。
所述设备相似度确定模块,可以包括:
特征信息对配对子模块,用于将每个设备对的第一设备信息的K个特征信息和第二设备信息的K个特征信息按照特征类别进行配对,得到K个的特征信息对;
特征信息处理子模块,用于对每个特征信息对进行相似度分析处理,得到K份特征相似度;
汇总处理子模块,用于对所述K份特征相似度进行汇总处理,得到每个设备对的设备相似度。
在其中一个实施例中,所述特征信息处理子模块,可以包括:
信息类型确定单元,用于确定各个特征信息对的信息类型;
特征信息处理单元,用于使用与各个特征信息对的信息类型对应的距离算法,对各个特征信息对进行处理。
在其中一个实施例中,所述聚集性设备群确定模块,可以包括:
聚集设备对确定子模块,用于将所述M个设备对中,设备相似度大于预设聚集阈值的设备对确定为聚集设备对,每个聚集设备对对应一个设备标识对;
第一比对子模块,用于将任一个聚集设备对的设备标识对与其他聚集设备对中任一个聚集设备对的设备标识对进行比对;
关联聚集设备对确定子模块,用于根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对;
聚集性设备群确定子模块,用于将所述任一聚集设备对及其直接关联聚集设备对、间接关联聚集设备对对应的设备确定为同组具有聚集性的设备群。
在其中一个实施例中,所述关联聚集设备对确定子模块,可以包括:
第一确定单元,用于从所述其他聚集设备对中,将与所述任一个聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的直接关联聚集设备对;
第二确定单元,用于从所述其他聚集设备对中,将除了所述直接关联聚集设备对外,与任一个直接关联聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的间接关联聚集设备对。
在其中一个实施例中,所述确定具有聚集性的设备群的装置,还可以包括:
相似设备对确定子模块,用于将所述M个设备对中,设备相似度大于预设相似阈值的设备对确定为相似设备对,每个相似设备对对应一个设备标识对;
第二比对子模块,用于将任一个相似设备对的设备标识对与其他相似设备对中任一个相似设备对的设备标识对进行比对;
关联相似设备对确定子模块,用于根据比对结果,从所述其他相似设备对中,确定出所述任一个相似设备对的直接关联相似设备对和间接关联相似设备对;
信息合并子模块,用于合并所述任一相似设备对及其直接关联相似设备对、间接关联聚集设备对对应的全部设备的设备标识和设备信息。
关于确定具有聚集性的设备群的装置的具体限定可以参见上文中对于确定具有聚集性的设备群的方法的限定,在此不再赘述。上述确定具有聚集性的设备群的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是数据处理的服务器,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储设备的设备信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种确定具有聚集性的设备群的方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
确定要确定聚集性的N个设备;将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:M=C_N^2,N为大于1的正整数,M为大于0的正整数;获取每个设备对的设备信息,所述设备信息包括设备硬件信息和设备操作信息,根据所述设备信息确定每个设备对的设备相似度;根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群。
在一个实施例中,所述每个设备对的设备信息是每个设备对包括的第一设备的第一设备信息和第二设备的第二设备信息,所述第一设备信息和第二设备信息分别包括K个对应不同特征类别的特征信息,K为大于0的正整数。
处理器执行计算机程序,实现根据所述设备信息确定每个设备对的设备相似度时,还实现以下步骤:
将每个设备对的第一设备信息的K个特征信息和第二设备信息的K个特征信息按照特征类别进行配对,得到K个特征信息对;对每个特征信息对进行相似度分析处理,得到K份特征相似度;对所述K份特征相似度进行汇总处理,得到每个设备对的设备相似度。
在一个实施例中,处理器执行计算机程序,实现对每个特征信息对进行相似度分析处理时,还实现以下步骤:
确定各个特征信息对的信息类型;使用与各个特征信息对的信息类型对应的算法,对各个特征信息对进行处理。
在一个实施例中,处理器执行计算机程序,实现根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群时,还实现以下步骤:
将所述M个设备对中,设备相似度大于预设聚集阈值的设备对确定为聚集设备对,每个聚集设备对对应一个设备标识对;将任一个聚集设备对的设备标识对与其他聚集设备对中任一个聚集设备对的设备标识对进行比对;根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对;将所述任一聚集设备对及其直接关联聚集设备对、间接关联聚集设备对对应的设备确定为同组具有聚集性的设备群。
在一个实施例中,处理器执行计算机程序,实现根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对时,还实现以下步骤:
从所述其他聚集设备对中,将与所述任一个聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的直接关联聚集设备对;从所述其他聚集设备对中,将除了所述直接关联聚集设备对外,与任一个直接关联聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的间接关联聚集设备对。
在一个实施例中,处理器执行计算机程序,实现根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群之后,还实现以下步骤:
将所述M个设备对中,设备相似度大于预设相似阈值的设备对确定为相似设备对,每个相似设备对对应一个设备标识对;将任一个相似设备对的设备标识对与其他相似设备对中任一个相似设备对的设备标识对进行比对;根据比对结果,从所述其他相似设备对中,确定出所述任一个相似设备对的直接关联相似设备对和间接关联相似设备对;合并所述任一相似设备对及其直接关联相似设备对、间接关联聚集设备对对应的全部设备的设备标识和设备信息。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
确定要确定聚集性的N个设备;将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:M=C_N^2,N为大于1的正整数,M为大于0的正整数;获取每个设备对的设备信息,所述设备信息包括设备硬件信息和设备操作信息,根据所述设备信息确定每个设备对的设备相似度;根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群。
在一个实施例中,所述每个设备对的设备信息是每个设备对包括的第一设备的第一设备信息和第二设备的第二设备信息,所述第一设备信息和第二设备信息分别包括K个对应不同特征类别的特征信息,K为大于0的正整数。
计算机程序被处理器执行,根据所述设备信息确定每个设备对的设备相似度,还实现以下步骤:
将每个设备对的第一设备信息的K个特征信息和第二设备信息的K个特征信息按照特征类别进行配对,得到K个特征信息对;对每个特征信息对进行相似度分析处理,得到K份特征相似度;对所述K份特征相似度进行汇总处理,得到每个设备对的设备相似度。
在一个实施例中,计算机程序被处理器执行,对每个特征信息对进行相似度分析处理时,还实现以下步骤:
确定各个特征信息对的信息类型;使用与各个特征信息对的信息类型对应的算法,对各个特征信息对进行处理。
在一个实施例中,计算机程序被处理器执行,根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群时,还实现以下步骤:
将所述M个设备对中,设备相似度大于预设聚集阈值的设备对确定为聚集设备对,每个聚集设备对对应一个设备标识对;将任一个聚集设备对的设备标识对与其他聚集设备对中任一个聚集设备对的设备标识对进行比对;根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对;将所述任一聚集设备对及其直接关联聚集设备对、间接关联聚集设备对对应的设备确定为同组具有聚集性的设备群。
在一个实施例中,计算机程序被处理器执行,根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对时,还实现以下步骤:
从所述其他聚集设备对中,将与所述任一个聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的直接关联聚集设备对;从所述其他聚集设备对中,将除了所述直接关联聚集设备对外,与任一个直接关联聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的间接关联聚集设备对。
在一个实施例中,计算机程序被处理器执行,根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群之后,还实现以下步骤:
将所述M个设备对中,设备相似度大于预设相似阈值的设备对确定为相似设备对,每个相似设备对对应一个设备标识对;将任一个相似设备对的设备标识对与其他相似设备对中任一个相似设备对的设备标识对进行比对;根据比对结果,从所述其他相似设备对中,确定出所述任一个相似设备对的直接关联相似设备对和间接关联相似设备对;合并所述任一相似设备对及其直接关联相似设备对、间接关联聚集设备对对应的全部设备的设备标识和设备信息。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种确定具有聚集性的设备群的方法,其特征在于,包括:
确定要确定聚集性的N个设备;
将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:
Figure FDA0003639403660000011
N为大于1的正整数,M为大于0的正整数;
获取每个设备对的设备信息,所述设备信息包括设备硬件信息和设备操作信息,根据所述设备信息确定每个设备对的设备相似度;
根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群,包括:
将所述M个设备对中,设备相似度大于预设聚集阈值的设备对确定为聚集设备对,每个聚集设备对对应一个设备标识对;
将任一个聚集设备对的设备标识对与其他聚集设备对中任一个聚集设备对的设备标识对进行比对;
根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对;
将所述任一聚集设备对及其直接关联聚集设备对、间接关联聚集设备对对应的设备确定为同组具有聚集性的设备群。
2.如权利要求1所述的确定具有聚集性的设备群的方法,其特征在于,
所述每个设备对的设备信息是每个设备对包括的第一设备的第一设备信息和第二设备的第二设备信息,所述第一设备信息和第二设备信息分别包括K个对应不同特征类别的特征信息,K为大于0的正整数。
3.如权利要求2所述的确定具有聚集性的设备群的方法,其特征在于,
所述根据所述设备信息确定每个设备对的设备相似度,包括:
将每个设备对的第一设备信息的K个特征信息和第二设备信息的K个特征信息按照特征类别进行配对,得到K个特征信息对;
对每个特征信息对进行相似度分析处理,得到K份特征相似度;
对所述K份特征相似度进行汇总处理,得到每个设备对的设备相似度。
4.如权利要求3所述的确定具有聚集性的设备群的方法,其特征在于,
所述对每个特征信息对进行相似度分析处理,包括:
确定各个特征信息对的信息类型;
使用与各个特征信息对的信息类型对应的算法,对各个特征信息对进行处理。
5.如权利要求1所述的确定具有聚集性的设备群的方法,其特征在于,
所述根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对,包括:
从所述其他聚集设备对中,将与所述任一个聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的直接关联聚集设备对;
从所述其他聚集设备对中,将除了所述直接关联聚集设备对外,与任一个直接关联聚集设备对间的比对结果为标识相关的聚集设备对,确定为所述任一聚集设备对的间接关联聚集设备对。
6.如权利要求1所述的确定具有聚集性的设备群的方法,其特征在于,
在所述根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群之后,所述方法还包括:
将所述M个设备对中,设备相似度大于预设相似阈值的设备对确定为相似设备对,每个相似设备对对应一个设备标识对;
将任一个相似设备对的设备标识对与其他相似设备对中任一个相似设备对的设备标识对进行比对;
根据比对结果,从所述其他相似设备对中,确定出所述任一个相似设备对的直接关联相似设备对和间接关联相似设备对;
合并所述任一相似设备对及其直接关联相似设备对、间接关联聚集设备对对应的全部设备的设备标识和设备信息。
7.一种确定具有聚集性的设备群的装置,其特征在于,包括:
设备确定模块,用于确定要确定聚集性的N个设备;
设备组合模块,用于将所述N个设备进行两两组合,得到M个设备对,其中,N和M之间的关系为:
Figure FDA0003639403660000021
N为大于1的正整数,M为大于0的正整数;
设备相似度确定模块,用于获取每个设备对的设备信息,所述设备信息包括设备硬件信息和设备操作信息,根据所述设备信息确定每个设备对的设备相似度;
聚集性设备群确定模块,用于根据所述每个设备对的设备相似度确定所述N个设备中具有聚集性的设备群;
所述聚集性设备群确定模块,包括:
聚集设备对确定子模块,用于将所述M个设备对中,设备相似度大于预设聚集阈值的设备对确定为聚集设备对,每个聚集设备对对应一个设备标识对;
第一比对子模块,用于将任一个聚集设备对的设备标识对与其他聚集设备对中任一个聚集设备对的设备标识对进行比对;
关联聚集设备对确定子模块,用于根据比对结果,从所述其他聚集设备对中,确定出所述任一个聚集设备对的直接关联聚集设备对和间接关联聚集设备对;
聚集性设备群确定子模块,用于将所述任一聚集设备对及其直接关联聚集设备对、间接关联聚集设备对对应的设备确定为同组具有聚集性的设备群。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010005903.4A 2020-01-03 2020-01-03 确定具有聚集性的设备群的方法、装置、设备和存储介质 Active CN111222123B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010005903.4A CN111222123B (zh) 2020-01-03 2020-01-03 确定具有聚集性的设备群的方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010005903.4A CN111222123B (zh) 2020-01-03 2020-01-03 确定具有聚集性的设备群的方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111222123A CN111222123A (zh) 2020-06-02
CN111222123B true CN111222123B (zh) 2022-08-19

Family

ID=70810595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010005903.4A Active CN111222123B (zh) 2020-01-03 2020-01-03 确定具有聚集性的设备群的方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111222123B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113989859B (zh) * 2021-12-28 2022-05-06 江苏苏宁银行股份有限公司 一种防刷机设备指纹相似度识别方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107465648A (zh) * 2016-06-06 2017-12-12 腾讯科技(深圳)有限公司 异常设备的识别方法及装置
CN108053247A (zh) * 2017-12-15 2018-05-18 北京知道创宇信息技术有限公司 一种假量识别模型生成方法、假量识别方法及计算设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10817542B2 (en) * 2018-02-28 2020-10-27 Acronis International Gmbh User clustering based on metadata analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107465648A (zh) * 2016-06-06 2017-12-12 腾讯科技(深圳)有限公司 异常设备的识别方法及装置
CN108053247A (zh) * 2017-12-15 2018-05-18 北京知道创宇信息技术有限公司 一种假量识别模型生成方法、假量识别方法及计算设备

Also Published As

Publication number Publication date
CN111222123A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
US10110634B2 (en) Monitoring user authenticity in distributed system
US20160352760A1 (en) Tracking Users over Network Hosts Based on User Behavior
US20200104292A1 (en) Method and apparatus for integrating multi-data source user information
CN109858919B (zh) 异常账号的确定方法及装置、在线下单方法及装置
CN110912908B (zh) 网络协议异常检测方法、装置、计算机设备和存储介质
US20170372069A1 (en) Information processing method and server, and computer storage medium
CN111177714A (zh) 异常行为检测方法、装置、计算机设备和存储介质
US20190387012A1 (en) Log analysis apparatus, log analysis method, and log analysis program
CN112733146B (zh) 基于机器学习的渗透测试方法、装置、设备及存储介质
CN113422782A (zh) 基于大数据的云服务漏洞分析方法及人工智能分析系统
JP6629973B2 (ja) 携帯電話番号を変更するためのサービス要求を認識する方法及び装置
CN112559364A (zh) 一种测试用例生成方法、装置、计算机设备和存储介质
CN111222123B (zh) 确定具有聚集性的设备群的方法、装置、设备和存储介质
CN115830649A (zh) 一种网络资产指纹特征的识别方法、装置及电子设备
CN117376228B (zh) 一种网络安全测试工具确定方法及装置
CN107515876B (zh) 一种特征模型的生成、应用方法及装置
CN111177481A (zh) 用户标识映射方法及装置
CN111125748A (zh) 越权查询的判断方法、装置、计算机设备和存储介质
CN111339317A (zh) 用户注册识别方法、装置、计算机设备和存储介质
CN111898035A (zh) 基于物联网的数据处理策略配置方法、装置和计算机设备
KR101625890B1 (ko) 인터넷 응용 트래픽 프로토콜의 시그니처 변경 탐지를 위한 테스트 자동화 방법 및 시스템
CN115906048A (zh) 一种基于终端信息的设备识别方法及系统
CN110197066B (zh) 一种云计算环境下的虚拟机监控方法及监控系统
US20220263725A1 (en) Identifying Unused Servers
CN114048344A (zh) 一种相似人脸搜索方法、装置、设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant