CN116861399A - 团伙篡改指纹检测方法、装置、电子设备及存储介质 - Google Patents
团伙篡改指纹检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116861399A CN116861399A CN202310760853.4A CN202310760853A CN116861399A CN 116861399 A CN116861399 A CN 116861399A CN 202310760853 A CN202310760853 A CN 202310760853A CN 116861399 A CN116861399 A CN 116861399A
- Authority
- CN
- China
- Prior art keywords
- scene data
- sample
- identification
- target
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 31
- 230000000694 effects Effects 0.000 claims abstract description 55
- 238000001514 detection method Methods 0.000 claims abstract description 36
- 238000012216 screening Methods 0.000 claims abstract description 22
- 239000000523 sample Substances 0.000 claims description 98
- 239000013068 control sample Substances 0.000 claims description 19
- 230000006835 compression Effects 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/44—Program or device authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明涉及人工智能技术领域,揭露了一种团伙篡改指纹检测方法,包括:对获取的目标用户登录场景数据进行非标识性参数筛选,得到登录场景数据的非标识性参数;对非标识性参数进行特征提取和特征分类,得到非标识性参数的分类特征;获取目标用户的活动场景数据,利用活动场景数据和分类特征对目标用户进行场景交叉检测,得到目标用户的交叉特征;利用交叉特征确定目标用户中的篡改设备指纹群体。此外,本发明还涉及区块链技术,数据列表可存储于区块链的节点。本发明还提出一种团伙篡改指纹检测装置、电子设备以及存储介质。本发明可以提高团伙篡改指纹检测的准确性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种团伙篡改指纹检测方法、装置、电子设备及存储介质。
背景技术
互联网风控为了防止营销活动作弊、虚假交易等欺诈行为,需要对用户使用设备进行定位识别,获取高唯一性的设备标识码,以设备维度、用户号码维度、收货地址维度约束用户获取的权益。但随着国家、个人对信息安全的重视,部分高唯一性的设备标识码被禁止主动获取,使得获取到的字段信息存在大量为空的记录,而在设备唯一标识为空或被篡改情况下无法精准识别到欺诈行为,容易产生薅羊毛事件,给公司财产造成巨大损失。
现如今,常采用用户授权方式采集标识字段进行风控,但是用户授权所需要的时间较长,迭代速度慢,当获取到大量的空字段,为了保证设备指纹的唯一性,需要牺牲准确性,使得真实的同一个设备会生成不同的设备指纹,因此如何提升团伙篡改指纹检测时的准确性,成为了亟待解决的问题。
发明内容
本发明提供一种团伙篡改指纹检测方法、装置及存储介质,其主要目的在于解决团伙篡改指纹检测时准确性较低的问题。
为实现上述目的,本发明提供的一种团伙篡改指纹检测方法,包括:
获取目标用户的登录场景数据,对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数;
对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征;
利用所述非标识性特征生成所述登录场景数据的核心对象集合,根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征;
获取所述目标用户的活动场景数据,利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征;
利用所述交叉特征确定所述目标用户中的篡改设备指纹群体。
可选地,所述对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数,包括:
根据预设的分割规则对所述登录场景数据进行字段分割,得到所述登录场景数据的分割字段;
对所述分割字段进行字段选取,得到所述分割字段的目标字段;
根据所述目标字段的字段标识确定所述登录场景数据的非标识性参数。
可选地,所述对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征,包括:
对所述非标识性参数进行数值编码,得到所述非标识性参数的编码参数;对所述编码参数进行矩阵压缩,得到所述编码参数的压缩参数,确定所述压缩参数为所述非标识性参数的非标识性特征。
可选地,所述利用所述非标识性特征生成所述登录场景数据的核心对象集合,包括:
根据所述非标识性特征生成所述登录场景数据的用户记录样本集,逐一选取所述用户记录样本集中的用户样本为目标样本;
计算所述目标样本与所述用户记录样本集中的对照样本的样本距离,根据所述样本距离与预设的距离阈值确定所述目标样本的邻域样本;
根据所述邻域样本的样本总数和预设的数目阈值生成所述目标样本的核心对象,汇集所述核心对象为所述登录场景数据的核心对象集合。
可选地,所述计算所述目标样本与所述用户记录样本集中的对照样本的样本距离,包括:
利用如下样本距离算法计算所述目标样本与所述用户记录样本集中的对照样本的样本距离:
其中,d是所述目标样本与所述用户记录样本集中的对照样本的样本距离,A是所述目标样本的非标识性特征的总数,a是所述目标样本的非标识性特征的特征标识,xia是所述目标样本的第a个非标识性特征,xja是所述用户记录样本集中的对照样本的第a个非标识性特征,i是所述目标样本的样本标识,j是所述用户记录样本集中的对照样本的样本标识。
可选地,所述根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征,包括:
S11、选取所述核心对象集合中的其中一个核心对象为目标对象,根据所述目标对象生成所述非标识性特征的初始类别;
S12、确定所述目标对象的邻域集合,对所述邻域集合进行核心对象判断,当所述邻域集合不存在所述核心对象,返回步骤S11;
S13、当所述邻域集合存在所述核心对象时,确定所述邻域集合属于所述初始类别;
S14、根据所述初始类别对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征。
可选地,所述利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征,包括:
对所述活动场景数据进行特征筛选,得到所述活动场景数据的活动记录特征;
根据预设的相似度算法计算所述活动记录特征与所述分类特征的特征相似度;
根据所述特征相似度和预设的相似度阈值生成所述目标用户的交叉特征。
为了解决上述问题,本发明还提供一种团伙篡改指纹检测装置,所述装置包括:
参数筛选模块,用于获取目标用户的登录场景数据,对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数;
特征提取模块,用于对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征;
特征分类模块,用于利用所述非标识性特征生成所述登录场景数据的核心对象集合,根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征;
交叉检测模块,用于获取所述目标用户的活动场景数据,利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征;
群体生成模块,用于利用所述交叉特征确定所述目标用户中的篡改设备指纹群体。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的团伙篡改指纹检测方法。
为了解决上述问题,本发明还提供一种存储介质,所述存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的团伙篡改指纹检测方法。
本发明实施例通过对获取的目标用户的登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数,并对所述非标识性参数进行特征提取和特征分类,实现了登录场景数据的充分挖掘,并对目标用户的活动场景数据再次进行条件聚类,从而生成所述登录场景数据和所述活动场景数据的交叉特征,针对识别到的目标用户,根据所述交叉特征可以确定多个场景识别的异常原因,使检测结果具备可解释性;同时识别的异常结果用于登录和活动场景,进行人机验证环节,可进一步降低对用户的误判,对通过验证的用户及时洗白,并优化前序的检测算法,因此本发明提出团伙篡改指纹检测方法、装置、电子设备及存储介质,可以解决团伙篡改指纹检测精确度较低的问题。
附图说明
图1为本发明一实施例提供的团伙篡改指纹检测方法的流程示意图;
图2为本发明一实施例提供的非标识性参数筛选的流程示意图;
图3为本发明一实施例提供的生成核心对象集合的流程示意图;
图4为本发明一实施例提供的团伙篡改指纹检测装置的功能模块图;
图5为本发明一实施例提供的实现所述团伙篡改指纹检测方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种团伙篡改指纹检测方法。所述团伙篡改指纹检测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述团伙篡改指纹检测方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的团伙篡改指纹检测方法的流程示意图。在本实施例中,所述团伙篡改指纹检测方法包括:
S1、获取目标用户的登录场景数据,对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数。
本发明实施例中,所述目标用户是指需要确定属不属于指纹篡改团伙的用户,所述登录场景数据可以是字典格式,例如:{‘用户’:手机号,‘APP版本号’:a1,‘SDK版本’:b2,‘设备操作系统’:c1,‘网络类型’:d1,‘运营商’:e1,‘WIFI名称’:f1,‘WIFI MAC地址’:g1,‘手机品牌’:h1,‘手机型号’:i1,‘手机号处理器’:j1,‘CPU类型’:k1,‘屏幕分辨率’:l1,‘存储总空间’:m1,‘存储剩余空间’:n1},所述登录场景数据可以是所述目标用户的近30天的设备使用数据。
详细地,所述登录场景数据是指目标用户登录金融产品时的场景数据。
详细地,所述非标识性参数为APP版本号、SDK版本、设备操作系统、网络类型、运营商、WIFI名称、WIFI MAC地址、手机品牌、手机型号、手机处理器、CPU类型、屏幕分辨率、存储总空间和存储剩余空间。
在本发明实施例中,参图2所示,所述对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数,包括:
S21、根据预设的分割规则对所述登录场景数据进行字段分割,得到所述登录场景数据的分割字段;
S22、对所述分割字段进行字段选取,得到所述分割字段的目标字段;
S23、根据所述目标字段的字段标识确定所述登录场景数据的非标识性参数。
详细地,所述预设的分割规则是指对所述登录场景数据的字符串进行分割,例如:将所述登录场景数据{‘用户’:手机号,‘APP版本号’:a1,‘SDK版本’:b2,‘设备操作系统’:c1,‘网络类型’:d1,‘运营商’:e1,‘WIFI名称’:f1,‘WIFI MAC地址’:g1,‘手机品牌’:h1,‘手机型号’:i1,‘手机号处理器’:j1,‘CPU类型’:k1,‘屏幕分辨率’:l1,‘存储总空间’:m1,‘存储剩余空间’:n1}划分得到的所述登录场景数据的分割字段为:{用户、手机号、APP版本号a1、SDK版本b2、设备操作系统c1、网络类型d1、运营商e1、WIFI名称f1、WIFI MAC地址g1、手机品牌h1、手机型号i1、手机号处理器j1、CPU类型k1、屏幕分辨率l1、存储总空间m1和存储剩余空间n1}。
详细地,所述对所述分割字段进行字段选取可以确定出所述分割字段的目标字段为:APP版本号a1、SDK版本b2、设备操作系统c1、网络类型d1、运营商e1、WIFI名称f1、WIFIMAC地址g1、手机品牌h1、手机型号i1、手机号处理器j1、CPU类型k1、屏幕分辨率l1、存储总空间m1和存储剩余空间n1。
详细地,所述根据所述目标字段的字段标识是指a1、b2、c1、d1、e1、f1、g1、h1、i1、j1、k1、l1、m1和n1,所述根据所述目标字段的字段标识确定所述登录场景数据的非标识性参数是指根据所述字段标识与所述登录场景数据的对应关系确定所述登录场景数据的非标识性参数。
S2、对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征。
在本发明实施例中,所述非标识性特征用来表征所述登录场景数据的。
在本发明实施例中,所述对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征,包括:
对所述非标识性参数进行数值编码,得到所述非标识性参数的编码参数;
对所述编码参数进行矩阵压缩,得到所述编码参数的压缩参数,确定所述压缩参数为所述非标识性参数的非标识性特征。
在本发明实施例中,所述对所述非标识性参数进行数值编码可以利用独热编码,利用所述独热编码将文字型的所述非标识性参数转化为数字型的编码参数。
详细地,所述独热编码又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效,亦即,只有一位元素是1,其余元素都是零值,独热编码是利用0和1表示一些参数,使用N位状态寄存器来对N个状态进行编码。
详细地,所述对所述编码参数进行矩阵压缩可以利用python中sklearn库中的DictVectorizer()函数进行所述编码参数的压缩,对所述DictVectorizer()函数进行参数设置,将参数设置好的DictVectorizer()函数对所述编码参数进行处理,得到所述编码参数的压缩参数。
S3、利用所述非标识性特征生成所述登录场景数据的核心对象集合,根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征。
在本发明实施例中,参图3所示,所述利用所述非标识性特征生成所述登录场景数据的核心对象集合,包括:
S31、根据所述非标识性特征生成所述登录场景数据的用户记录样本集,逐一选取所述用户记录样本集中的用户样本为目标样本;
S32、计算所述目标样本与所述用户记录样本集中的对照样本的样本距离,根据所述样本距离与预设的距离阈值确定所述目标样本的邻域样本;
S33、根据所述邻域样本的样本总数和预设的数目阈值生成所述目标样本的核心对象,汇集所述核心对象为所述登录场景数据的核心对象集合。
在本发明实施例中,所述根据所述非标识性特征生成所述登录场景数据的用户记录样本集是指所述非标识性特征用来体现用户记录,从而所述用户记录样本集是指用户记录做为样本而生成的集合。
详细地,所述计算所述目标样本与所述用户记录样本集中的对照样本的样本距离是为了确定所述目标样本的邻域样本,所述邻域样本是指与所述目标样本的样本距离小于预设的距离阈值的样本,所以预设的距离阈值可以是根据经验主义设定的,例如:所述预设的距离阈值为0.5。
详细地,所述根据所述邻域样本的样本总数和预设的数目阈值生成所述目标样本的核心对象是指当所述目标样本的邻域样本的样本总数大于所述预设的数目阈值时,可以确定所述目标样本为核心对象,其中,所述预设的数目阈值时根据经验主义设定的,例如:所述预设的数目阈值为5。
详细地,所述计算所述目标样本与所述用户记录样本集中的对照样本的样本距离,包括:
利用如下样本距离算法计算所述目标样本与所述用户记录样本集中的对照样本的样本距离:
其中,d是所述目标样本与所述用户记录样本集中的对照样本的样本距离,A是所述目标样本的非标识性特征的总数,a是所述目标样本的非标识性特征的特征标识,xia是所述目标样本的第a个非标识性特征,xja是所述用户记录样本集中的对照样本的第a个非标识性特征,i是所述目标样本的样本标识,j是所述用户记录样本集中的对照样本的样本标识。
详细地,所述目标样本的非标识性特征的特征标识的取值范围可以根据所述非标识性参数的总数确定,亦即,所述非标识性参数的总数决定了所述非标识型特征的特征标识的取值范围,所述非标识性参数的总数决定了所述非标识型特征的特征标识的取值范围的上限。
在本发明实施例中,所述根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征,包括:
S11、选取所述核心对象集合中的其中一个核心对象为目标对象,根据所述目标对象生成所述非标识性特征的初始类别;
S12、确定所述目标对象的邻域集合,对所述邻域集合进行核心对象判断,当所述邻域集合不存在所述核心对象,返回步骤S11;
S13、当所述邻域集合存在所述核心对象时,确定所述邻域集合属于所述初始类别;
S14、根据所述初始类别对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征。
详细地,所述根据所述目标对象生成所述非标识性特征的初始类别是指为所述目标对象赋予一个类别c1,亦即,所述非标识性特征的初始类别为c1;所述确定所述目标对象的邻域集合是根据所述目标对象的邻域对象确定的,所述邻域对象是指所述样本距离算法确定的。
详细地,所述对所述邻域集合进行核心对象判断是为了确定所述目标对象的邻域集合是否存在核心对象,所述当所述邻域集合存在所述核心对象时,确定所述邻域集合属于所述初始类别是指当所述邻域集合存在所述核心对象时,则将所述邻域集合中的邻域对象合并到所述目标对象的类别中,亦即,将所述邻域集合中的邻域对象合并到初始类别c1中。
详细地,所述当所述邻域集合不存在所述核心对象,返回步骤S11选取所述核心对象集合中的其中一个核心对象为目标对象时,将不再选取已经被选取过的核心对象做为目标对象,当遍历完所述核心对象集合中的所有核心对象,结束所述核心对象集合中的核心对象的选取。
详细地,所述根据所述初始类别对所述非标识性特征进行特征分类是因为所述非标识型特征已经完成类别的分类,亦即,每个所述非标识型特征都有自己的所属类别,所以可以根据所述初始类别生成所述非标识性特征的分类特征。
S4、获取所述目标用户的活动场景数据,利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征。
在本发明实施例中,所述活动场景数据是指所述目标用户在登录金融产品账户后的一系列操作产生的数据,所述活动场景数据可以根据金融产品模块的点击、金融产品账号信息的更新以及金融产品的页面跳转等活动产生,所述活动场景数据显示出用户的网络类型、手机号、设备号和APP版本号等。
在本发明实施例中,所述利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征,包括:
对所述活动场景数据进行特征筛选,得到所述活动场景数据的活动记录特征;
根据预设的相似度算法计算所述活动记录特征与所述分类特征的特征相似度;
根据所述特征相似度和预设的相似度阈值生成所述目标用户的交叉特征。
详细地,所述对所述活动场景数据进行特征筛选,得到所述活动场景数据的活动记录特征是指从所述活动场景数据中筛选出手机号、APP版本号和WIFI名称做为所述活动场景数据的活动记录特征。
详细地,所述根据预设的相似度算法可以是欧氏距离和切比雪夫距离公式确定,例如:利用所述欧氏距离得到的所述活动记录特征与所述分类特征的特征距离可以作为所述活动记录特征与所述分类特征的特征相似度,所述特征相似度越小,说明所述活动记录特征与所述分类特征越相似。
详细地,所述根据所述特征相似度和预设的相似度阈值生成所述目标用户的交叉特征是指当所述特征相似度小于预设的相似度阈值,可以将所述活动记录特征与所述分类特征的相似部分做为所述目标用户的交叉特征。
S5、利用所述交叉特征确定所述目标用户中的篡改设备指纹群体。
在本发明实施例中,所述交叉特征的表现形式可以为:当所述登录场景数据的分类特征显示登录场景下用户设备缺失,但是根据所述活动场景数据的活动记录特征显示活动场景下用户设备聚集,所以可以根据所述交叉特征确定所述目标用户中篡改设备指纹群体。
详细地,在同一天内,根据所述分类特征确定所述目标用户的场景信息不连贯,但是根据所述活动记录特征可以确定所述目标用户的活动频繁,那么根据所述分类特征和所述活动记录特征生成的交叉特征可以确定登录场景疑似存在篡改设备信息问题,可以确定出所述目标用户中的篡改设备指纹群体。
本发明实施例通过对获取的目标用户的登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数,并对所述非标识性参数进行特征提取和特征分类,实现了登录场景数据的充分挖掘,并对目标用户的活动场景数据再次进行条件聚类,从而生成所述登录场景数据和所述活动场景数据的交叉特征,针对识别到的目标用户,根据所述交叉特征可以确定多个场景识别的异常原因,使检测结果具备可解释性;同时识别的异常结果用于登录和活动场景,进行人机验证环节,可进一步降低对用户的误判,对通过验证的用户及时洗白,并优化前序的检测算法,因此本发明提出团伙篡改指纹检测方法,可以解决团伙篡改指纹检测精确度较低的问题。
如图4所示,是本发明一实施例提供的团伙篡改指纹检测装置的功能模块图。
本发明所述团伙篡改指纹检测装置100可以安装于电子设备中。根据实现的功能,所述团伙篡改指纹检测装置100可以包括参数筛选模块101、特征提取模块102、特征分类模块103、交叉检测模块104及群体生成模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述参数筛选模块101,用于获取目标用户的登录场景数据,对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数;
所述特征提取模块102,用于对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征;
所述特征分类模块103,用于利用所述非标识性特征生成所述登录场景数据的核心对象集合,根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征;
所述交叉检测模块104,用于获取所述目标用户的活动场景数据,利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征;
所述群体生成模块105,用于利用所述交叉特征确定所述目标用户中的篡改设备指纹群体。
如图5所示,是本发明一实施例提供的实现团伙篡改指纹检测方法的电子设备的结构示意图。
所述电子设备可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如团伙篡改指纹检测程序。
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing Unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行团伙篡改指纹检测程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
所述存储器11至少包括一种类型的存储介质,所述存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如团伙篡改指纹检测程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线12可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
所述通信接口13用于上述电子设备与其他电子设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图中仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图中示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备中的所述存储器11存储的团伙篡改指纹检测程序是多个指令的组合,在所述处理器10中运行时,可以实现:
获取目标用户的登录场景数据,对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数;
对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征;
利用所述非标识性特征生成所述登录场景数据的核心对象集合,根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征;
获取所述目标用户的活动场景数据,利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征;
利用所述交叉特征确定所述目标用户中的篡改设备指纹群体。
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。所述存储介质可以是易失性的,也可以是非易失性的。例如,所述存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取目标用户的登录场景数据,对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数;
对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征;
利用所述非标识性特征生成所述登录场景数据的核心对象集合,根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征;
获取所述目标用户的活动场景数据,利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征;
利用所述交叉特征确定所述目标用户中的篡改设备指纹群体。
在本发明所提供的几个实施例中,应该理解到,所揭露的电子设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种团伙篡改指纹检测方法,其特征在于,所述方法包括:
获取目标用户的登录场景数据,对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数;
对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征;
利用所述非标识性特征生成所述登录场景数据的核心对象集合,根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征;
获取所述目标用户的活动场景数据,利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征;
利用所述交叉特征确定所述目标用户中的篡改设备指纹群体。
2.如权利要求1所述的团伙篡改指纹检测方法,其特征在于,所述对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数,包括:
根据预设的分割规则对所述登录场景数据进行字段分割,得到所述登录场景数据的分割字段;
对所述分割字段进行字段选取,得到所述分割字段的目标字段;
根据所述目标字段的字段标识确定所述登录场景数据的非标识性参数。
3.如权利要求1所述的团伙篡改指纹检测方法,其特征在于,所述对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征,包括:
对所述非标识性参数进行数值编码,得到所述非标识性参数的编码参数;对所述编码参数进行矩阵压缩,得到所述编码参数的压缩参数,确定所述压缩参数为所述非标识性参数的非标识性特征。
4.如权利要求1所述的团伙篡改指纹检测方法,其特征在于,所述利用所述非标识性特征生成所述登录场景数据的核心对象集合,包括:
根据所述非标识性特征生成所述登录场景数据的用户记录样本集,逐一选取所述用户记录样本集中的用户样本为目标样本;
计算所述目标样本与所述用户记录样本集中的对照样本的样本距离,根据所述样本距离与预设的距离阈值确定所述目标样本的邻域样本;
根据所述邻域样本的样本总数和预设的数目阈值生成所述目标样本的核心对象,汇集所述核心对象为所述登录场景数据的核心对象集合。
5.如权利要求4所述的团伙篡改指纹检测方法,其特征在于,所述计算所述目标样本与所述用户记录样本集中的对照样本的样本距离,包括:
利用如下样本距离算法计算所述目标样本与所述用户记录样本集中的对照样本的样本距离:
其中,d是所述目标样本与所述用户记录样本集中的对照样本的样本距离,A是所述目标样本的非标识性特征的总数,a是所述目标样本的非标识性特征的特征标识,xia是所述目标样本的第a个非标识性特征,xja是所述用户记录样本集中的对照样本的第a个非标识性特征,i是所述目标样本的样本标识,j是所述用户记录样本集中的对照样本的样本标识。
6.如权利要求1所述的团伙篡改指纹检测方法,其特征在于,所述根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征,包括:
S11、选取所述核心对象集合中的其中一个核心对象为目标对象,根据所述目标对象生成所述非标识性特征的初始类别;
S12、确定所述目标对象的邻域集合,对所述邻域集合进行核心对象判断,当所述邻域集合不存在所述核心对象,返回步骤S11;
S13、当所述邻域集合存在所述核心对象时,确定所述邻域集合属于所述初始类别;
S14、根据所述初始类别对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征。
7.如权利要求1至6中任一项所述的团伙篡改指纹检测方法,其特征在于,所述利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征,包括:
对所述活动场景数据进行特征筛选,得到所述活动场景数据的活动记录特征;
根据预设的相似度算法计算所述活动记录特征与所述分类特征的特征相似度;
根据所述特征相似度和预设的相似度阈值生成所述目标用户的交叉特征。
8.一种团伙篡改指纹检测装置,其特征在于,所述装置包括:
参数筛选模块,用于获取目标用户的登录场景数据,对所述登录场景数据进行非标识性参数筛选,得到所述登录场景数据的非标识性参数;
特征提取模块,用于对所述非标识性参数进行特征提取,得到所述非标识性参数的非标识性特征;
特征分类模块,用于利用所述非标识性特征生成所述登录场景数据的核心对象集合,根据所述核心对象集合对所述非标识性特征进行特征分类,得到所述非标识性特征的分类特征;
交叉检测模块,用于获取所述目标用户的活动场景数据,利用所述活动场景数据和所述分类特征对所述目标用户进行场景交叉检测,得到所述目标用户的交叉特征;
群体生成模块,用于利用所述交叉特征确定所述目标用户中的篡改设备指纹群体。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的团伙篡改指纹检测方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的团伙篡改指纹检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310760853.4A CN116861399A (zh) | 2023-06-26 | 2023-06-26 | 团伙篡改指纹检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310760853.4A CN116861399A (zh) | 2023-06-26 | 2023-06-26 | 团伙篡改指纹检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116861399A true CN116861399A (zh) | 2023-10-10 |
Family
ID=88235033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310760853.4A Pending CN116861399A (zh) | 2023-06-26 | 2023-06-26 | 团伙篡改指纹检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116861399A (zh) |
-
2023
- 2023-06-26 CN CN202310760853.4A patent/CN116861399A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112507936B (zh) | 图像信息审核方法、装置、电子设备及可读存储介质 | |
CN112541745A (zh) | 用户行为数据分析方法、装置、电子设备及可读存储介质 | |
CN113364753B (zh) | 反爬虫方法、装置、电子设备及计算机可读存储介质 | |
CN113792089B (zh) | 基于人工智能的非法行为检测方法、装置、设备及介质 | |
CN111931047B (zh) | 基于人工智能的黑产账号检测方法及相关装置 | |
CN112733531B (zh) | 虚拟资源分配方法、装置、电子设备及计算机存储介质 | |
CN113489704A (zh) | 基于流量的敏感数据识别方法、装置、电子设备及介质 | |
CN113961764A (zh) | 诈骗电话的识别方法、装置、设备及存储介质 | |
CN114491047A (zh) | 多标签文本分类方法、装置、电子设备及存储介质 | |
CN116757812A (zh) | 检测异常数据的方法、装置、电子设备及存储介质 | |
CN115018588A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN112085611A (zh) | 数据异步核验方法、装置、电子设备及存储介质 | |
CN116485512A (zh) | 基于强化学习的银行数据分析方法及系统 | |
CN115659401A (zh) | 基于大数据的数据安全管控方法、装置、设备及存储介质 | |
CN115544566A (zh) | 日志脱敏方法、装置、设备及存储介质 | |
CN113221888B (zh) | 车牌号管理系统测试方法、装置、电子设备及存储介质 | |
CN115333776A (zh) | 基于http流量的sql注入攻击检测方法、装置、设备及介质 | |
CN114996386A (zh) | 业务角色识别方法、装置、设备及存储介质 | |
CN116861399A (zh) | 团伙篡改指纹检测方法、装置、电子设备及存储介质 | |
CN113434365B (zh) | 数据特征监控方法、装置、电子设备及存储介质 | |
CN113315790B (zh) | 入侵流量检测方法、电子设备及存储介质 | |
CN118094551B (zh) | 基于大数据的系统安全分析方法、设备及介质 | |
CN117391864A (zh) | 基于数据流向的风险识别方法、装置、电子设备及介质 | |
CN114625442A (zh) | 冷启动推荐方法、装置、电子设备及可读存储介质 | |
CN113362039A (zh) | 业务审批方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |