CN113987182A - 基于安全情报的欺诈实体识别方法、装置及相关设备 - Google Patents
基于安全情报的欺诈实体识别方法、装置及相关设备 Download PDFInfo
- Publication number
- CN113987182A CN113987182A CN202111266741.0A CN202111266741A CN113987182A CN 113987182 A CN113987182 A CN 113987182A CN 202111266741 A CN202111266741 A CN 202111266741A CN 113987182 A CN113987182 A CN 113987182A
- Authority
- CN
- China
- Prior art keywords
- fraud
- entity
- identification
- data
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000004364 calculation method Methods 0.000 claims abstract description 34
- 230000006399 behavior Effects 0.000 claims abstract description 23
- 238000000926 separation method Methods 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 11
- 238000012417 linear regression Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
Abstract
本发明应用于网络安全技术领域,公开了一种基于安全情报的欺诈实体识别方法,用于提高网络欺诈实体及其欺诈行为的识别准确性。本发明提供的方法包括:当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据;针对每个维度的所述特征数据,对所述特征数据进行分箱处理,得到至少两个类别数据,并对每个所述类别数据进行权重编码,得到编码数据;将所述编码数据输入到预设的欺诈识别模型中,采用所述预设的欺诈识别模型生成欺诈分数计算参数,并根据所述欺诈分数计算参数计算得到所述识别实体的欺诈分数;根据欺诈分数与欺诈等级的对应关系,确定所述识别实体的欺诈等级,并根据所述欺诈等级确定所述识别实体的欺诈识别结果。
Description
技术领域
本发明涉及网络安全技术领域,尤其涉及一种基于安全情报的欺诈实体识别方法、装置及相关设备。
背景技术
得益于互联网技术的发展,发展出许多依靠互联网技术的欺诈手段,在互联网金融、网络购物等领域,衍生出许多规模化、产业化以及专业化的欺诈团伙,其欺诈手法种类多样且变化灵活,善于伪装户或者掩盖欺诈行为,易造成一定的经济损失。
现有技术识别欺诈实体的方法一般是通过识别IP地址以及设备指纹进行特征识别,或者通过机器学习或者统计规则构建欺诈特征识别模型。随着欺诈行为的隐蔽性,通过IP地址识别出欺诈实体的准确度不高。另外,机器学习一般需要进行标注的样本数据,标注的样本数据获取方式困难,且在监督学习的过程中的要求较高,因此,在用于识别欺诈实体的效率不高。
发明内容
本发明提供一种基于安全情报的欺诈实体识别方法、装置及相关设备,以提高识别互联网欺诈行为的准确性。
一种基于安全情报的欺诈实体识别方法,包括:
当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据,其中,所述特征数据至少包括一个维度的特征数据;
针对每个维度的所述特征数据,对所述特征数据进行分箱处理,得到至少两个类别数据,并对每个所述类别数据进行权重编码,得到编码数据;
将所述编码数据输入到预设的欺诈识别模型中,采用所述预设的欺诈识别模型生成欺诈分数计算参数,并根据所述欺诈分数计算参数计算得到所述识别实体的欺诈分数;
根据欺诈分数与欺诈等级的对应关系,确定所述识别实体的欺诈等级,并根据所述欺诈等级确定所述识别实体的欺诈识别结果。
一种基于安全情报的欺诈实体识别装置,包括:
识别实体确定模块,用于当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据,其中,所述特征数据至少包括一个维度的特征数据;
数据分类模块,用于针对每个维度的所述特征数据,对所述特征数据进行分箱处理,得到至少两个类别数据,并对每个所述类别数据进行权重编码,得到编码数据;
分数计算模块,用于将所述编码数据输入到预设的欺诈识别模型中,采用所述预设的欺诈识别模型生成欺诈分数计算参数,并根据所述欺诈分数计算参数计算得到所述识别实体的欺诈分数;
识别结果模块,用于根据欺诈分数与欺诈等级的对应关系,确定所述识别实体的欺诈等级,并根据所述欺诈等级确定所述识别实体的欺诈识别结果。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于安全情报的欺诈实体识别方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于安全情报的欺诈实体识别方法的步骤。
本发明提供的基于安全情报的欺诈实体识别方法、装置、计算机设备及存储介质,当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据;针对每个维度的所述特征数据,对所述特征数据进行分箱处理,得到至少两个类别数据,并对每个所述类别数据进行权重编码,得到编码数据;将所述编码数据输入到预设的欺诈识别模型中,采用所述预设的欺诈识别模型生成欺诈分数计算参数,并根据所述欺诈分数计算参数计算得到所述识别实体的欺诈分数;根据欺诈分数与欺诈等级的对应关系,确定所述识别实体的欺诈等级,并根据所述欺诈等级确定所述识别实体的欺诈识别结果,通过获取欺诈实体相关的多维度的特征数据,并对每一维度的特征数据进行分箱处理,得到多个类别数据,通过多个类别数据进行权重编码,得到构建评分模型的参数,对每一个反映欺诈特征的特征数据进行细化,进而在计算欺诈分数可以细化欺诈实体的特性,从而根据每个待识别实体的欺诈分数确定是否是欺诈实体,用于提高检测识别到欺诈实体的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于安全情报的欺诈实体识别方法的一应用环境示意图;
图2是本发明一实施例中基于安全情报的欺诈实体识别方法的一流程图;
图3是本发明一实施例中基于安全情报的欺诈实体识别装置的结构示意图;
图4是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于安全情报的欺诈实体识别方法,可应用在如图1的应用环境中,其中,终端设备通过网络与服务器进行通信。其中,终端设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
系统框架100可以包括终端设备、网络和服务器。网络用以在终端设备和服务器之间提供通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备通过网络与服务器交互,以接收或者发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture EpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureEperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本发明实施例所提供的基于安全情报的欺诈实体识别方法由服务器执行,相应地,基于安全情报的欺诈实体识别装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的,根据实现需要,可以具有任意数目的终端设备、网络和服务器,本发明实施例中的终端设备具体可以对应的是实际生产中的应用系统。
在一实施例中,如图2所示,提供一种基于安全情报的欺诈实体识别方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤S10至S40:
S10:当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据,其中,特征数据至少包括一个维度的特征数据。
其中,当接收到应用端发送的欺诈实体识别请求时,则基于该欺诈实体识别请求确定所需要进行识别的识别实体。具体的,应用端可以是具有识别欺诈功能的应用软件或者终端设备等。
其中,欺诈实体是指实施欺诈行为的黑产实体,欺诈实体识别请求是指对某一实体进行识别以判断该实体是否是黑产实体以及是否涉及欺诈行为。
当接收到欺诈实体识别请求时,则从识别请求中获取需要进行识别的对象即识别实体,进而通过与情报平台的预设接口获取情报数据,并从情报数据筛选出用于表征欺诈行为的特征数据,其中,特征数据包括多个维度的特征,例如行为特征、工具特征和基础特征等。
其中,情报平台可以是预先选取的数据源,例如主流论坛、社交平台等。通过爬虫脚本,基于关键词获取具有相关性的数据作为情报数据。
进一步的,行为特征是指某一个ip地址在社交平台上的访问时间、在线时间等。进一步的,可以实现获取欺诈实体或者黑产实体的行为特征数据,对其进行数据分析,从而根据已知的欺诈实体的行为特征数据获取情报平台上的相关数据作为行为特征。工具特征是指终端设备标识号、工具包版本号以及话术文本数据等。基础特征是值识别实体的ip地址、对应的手机号码、银行卡号等基础信息。
根据行为特征提取出识别实体的访问次数、访问时长或者异常访问时段占比等信息。通过正则解析出工具特征数据中的源码数据、设备型号等关键字段。
S20:针对每个维度的特征数据,对特征数据进行分箱处理,得到至少两个类别数据,并对每个类别数据进行权重编码,得到编码数据。
其中,分箱处理是进行数据分箱,是一种数据预处理技术,将数据按照特定的规则进行分组没实现数据的离散化,增强数据的稳定性。
针对每个维度的特征数据,指定特定的分组规则,将特征数据分成多个类别数据,例如,一组以年龄为维度的数据,对其进行分箱操作,将其分为[0-18],[19,35],[36,60]等。
对针对每个维度的特征数据,进行分箱处理之后,每个维度的特征数据都被分为至少两个类别的特征数据,对没一个维度的数据进行权重编码,得到编码数据。
其中,权重编码是指证据权重编码(WeightofEvidece,WOE)是对特征数据的一种编码形式,要对一个类别的特征数据进行WOE编码,得到每一个类别的特征数据的特征编码。
S30:将编码数据输入到预设的欺诈识别模型中,采用预设的欺诈识别模型生成欺诈分数计算参数,并根据欺诈分数计算参数计算得到识别实体的欺诈分数。
其中,预设的编码识别模型用于根据每一个类型的特征数据对应的编码数据,识别出与欺诈行为的相关特征的模型,通过预设的欺诈识别模型计算出欺诈分数计算参数,其中欺诈分数计算参数用以构建评价识别实体的欺诈分数。欺诈分数的作用是用于表征识别实体的欺诈指数,从而确定识别实体是否是欺诈实体。进一步的,预设的欺诈识别模型可以基于线性回归模型构建,用于根据输入的特征数据估计模型参数,将模型参数作为欺诈分数计算参数,用以构建欺诈分数计算模型,实现对识别实体的欺诈行为识别。
S40:根据欺诈分数与欺诈等级的对应关系,确定识别实体的欺诈等级,并根据欺诈等级确定识别实体的欺诈识别结果。
其中,根据计算得到的欺诈分数在欺诈等级对应的欺诈分数范围,确定识别实体对应的欺诈等级,将欺诈等级作为识别实体的欺诈识别结果。其中。欺诈识别结果反映该识别实体是否是欺诈实体,如果是欺诈实体,对应的欺诈行为以及欺诈行为对应的危害程度。欺诈等级可以根据实际场景中欺诈行为的严重程度设置,将欺诈等级进行细分,从而提高欺诈行为的识别精度。进一步的,根据得到的欺诈等级,可以设置对应的执行操作等。
在本实施例中,当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据,其中,特征数据至少包括一个维度的特征数据。针对每个维度的特征数据,对特征数据进行分箱处理,得到至少两个类别数据,通过对反映欺诈行为特性的特征数据进行分类,再针对每个类别的数据进行证据权重编码,并对每个类别数据进行权重编码,得到编码数据。将编码数据输入到预设的欺诈识别模型中,采用预设的欺诈识别模型生成欺诈分数计算参数,并根据欺诈分数计算参数,计算得到识别实体的欺诈分数,其中,将编码数据输入到根据欺诈分数与欺诈等级的对应关系,确定识别实体的欺诈等级,并根据欺诈等级确定识别实体的欺诈识别结果,针对欺诈行为的特征数据细化计算,得到识别实体的欺诈分数,从而根据欺诈分数确定识别实体是否是欺诈实体,进一步提高识别欺诈实体以及欺诈行为的准确性。
在本实施例中,作为一种可选的实现方式,在步骤S10,当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据,其中,特征数据至少包括一个维度的特征数据的步骤包括:
S101:从欺诈实体识别请求中,确定对应的识别实体,并根据预设的情报接口,从数据库中获取识别实体的情报数据。
其中,采用预设的数据获取脚本,通过情报获取接口,获取数据库中与所述识别实体的情报数据。数据库包括社交平台、主流论坛等,基于识别实体,获取与其相关的情报数据。
S102:基于预设的特征类别,提取出情报数据中每个特征类别的特征数据。
其中,根据业务规则,设定特征提取规则,将每一个维度的特征数据提取出来。
在本实施例中,通过预先设置的数据获取脚本,自动进行数据获取,并按照多个维度,针对每个维度分别提取出对应的特征数据,进而从多个维度对识别实体进行分析,以确定识别实体的特征数据,进而可以针对多维特征数据得到更准确的识别结果。
在本实施例中,作为一种可选的实现方式,在步骤S20中,针对每个维度的特征数据,对特征数据进行分箱处理,得到至少两个类别数据,并对每个类别数据进行权重编码,得到编码数据的步骤包括:
S201:基于不同维度的分类规则,对每个维度的特征数据进行分箱,得到每个维度的多个类别数据。
其中,对于不同的维度,按照实际需要设置维度对应的分类规则,并根据每一维度的分类规则对每一维度的特征数据进行分箱处理,每一维度的特征数据至少包括两个类别的特征数据。
S202:针对每个维度的特征数据,根据证据权重编码方式,分别对特征数据对应的每个类别数据进行权重编码,得到编码数据。
其中,针对每个维度的每个类别的特征数据,进行证据权重编码方式,得到每个维度的编码数据。
其中,证据权重编码可以根据如下公式进行:
WOE=In(好类型占比/坏类型占比)*100%
其中,好类型占比是指积极结果的占比,坏类型占比是指消极结果的占比。具体的,积极结果是指某一自变量的积极的表现结果,即该自变量的正向结果,例如,数量增长等;消极结果是指某一字变量的消极的表现结果,即该自变量的负向结果,例如,数量减少等。例如,某人每月的工资高于平均水平,则为积极结果,每月的工资低于平均水平,则为消极结果。
在本实施例中,通过证据权重编码对特征数据进行编码,得到编码数据,提高了对识别实体的数据的识别准确率,从而根据对特征数据进行编码得到的编码数据在计算欺诈分数时可以将特征转化成数据的形式,且保留每个识别实体的特征,使得识别的结果更加准确。
在本实施例中,作为一种可选的实现方式,在步骤S30,将编码数据输入到预设的欺诈识别模型中,采用预设的欺诈识别模型生成欺诈分数计算参数,并根据欺诈分数计算参数计算得到识别实体的欺诈分数之前,包括:
S1:通过预设的采集端口,获取至少一个类型的情报数据,对情报数据进行预处理,得到多类型情报数据。
S2:根据预设的特征提取规则,提取出多类型情报数据中的特征数据。
其中,预设的特征提取规则是通过关键词匹配的方式,具体是:通过预设的维度特征,设置关键字段,在情报数据中根据关键词匹配的方式,匹配出于预设的维度特征相关的数据,作为特征数据。
S3:通过线性回归模型构建欺诈识别模型,并通过特征数据训练欺诈识别模型,得到预设的欺诈识别模型。
其中,线性回归是利用数理统计知识进行回归分析,来确定两种或看两种以上变量间相互依赖的定量关系的一种统计分析方法。
在本实施例中,线性回归模型基于logistic模型构建欺诈识别模型,通过logistic模型的模型参数构建欺诈实体的欺诈分数,以达到识别出欺诈实体的目的。Logistic模型空通过估计概率衡量多个自变量与因变量之间的关系,并且保证了特征数据的解释性。
在本实施例中,作为一种可选的实现方式,在步骤S30中,将编码数据输入到预设的欺诈识别模型中,采用预设的欺诈识别模型生成欺诈分数计算参数,并根据欺诈分数计算参数计算得到识别实体的欺诈分数的步骤包括:
S301:获取预设的欺诈识别模型的欺诈分数计算参数,并基于欺诈分数计算参数构建评分模型。
其中,评分模型可以通过如下公式表示:
Score=A-Blog(odds)=A-B(w0+w1x1+…+w+nxn)
其中Score为样本得分,A为补偿项,B为刻度,w0,w1,w,n表示训练好的模型权重参数,x1,xn表示各特征经过woe编码后得到的woe值,并通过给定odds、参考分数值和翻倍分数值则可计算出A,B的值。
p表示某一自变量出现积极结果的概率。
S302:将编码数据输入到评分模型中,得到识别实体的欺诈分数。
在本实施例中,通过获取识别实体的特征数据,通过预设的欺诈识别模型和评分模型将特征数据中的多个自变量转化成以数字形式表现的欺诈分数,使得识别结果能精确匹配特征数据所表现出来的特征,从而,提到了欺诈分数的精确性,进而保证识别结果的准确性。
在本实施例中,作为一种可选的实现方式,在步骤S40中,根据欺诈分数与欺诈等级的对应关系,确定识别实体的欺诈等级,并根据欺诈等级确定识别实体的欺诈识别结果,包括如下步骤:
S401:根据预设的函数关系式,基于欺诈分数,计算出识别实体对应的欺诈等级。
其中,预设的函数关系式可以设置为正比例函数,即,根据欺诈分数与对应的欺诈等级之间的对应关系,将欺诈分数映射到对应的欺诈等级。
S402:基于欺诈等级与欺诈行为的对应关系,确定欺诈实体的欺诈识别结果。
其中,按照业务需求,设置欺诈等级与欺诈行为之间的映射关系,进一步确定识别实体的欺诈行为,得到欺诈识别结果。另外,通过设置欺诈等级与欺诈行为之间的映射关系,在识别出欺诈结果的同时能确定其对应的欺诈行为,从而便于业务人员进行相应的操作。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于安全情报的欺诈实体识别装置,该基于安全情报的欺诈实体识别装置与上述实施例中基于安全情报的欺诈实体识别方法一一对应。如图3所示,该基于安全情报的欺诈实体识别装置包括识别实体确定模块31、数据分类模块32、分数计算模块33和十倍结果模块34。各功能模块详细说明如下:
识别实体确定模块31,用于当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据,其中,特征数据至少包括一个维度的特征数据。
数据分类模块32,用于针对每个维度的特征数据,对特征数据进行分箱处理,得到至少两个类别数据,并对每个类别数据进行权重编码,得到编码数据。
分数计算模块33,用于将编码数据输入到预设的欺诈识别模型中,采用预设的欺诈识别模型生成欺诈分数计算参数,并根据欺诈分数计算参数计算得到识别实体的欺诈分数。
识别结果模块34,用于根据欺诈分数与欺诈等级的对应关系,确定识别实体的欺诈等级,并根据欺诈等级确定识别实体的欺诈识别结果。
进一步的,识别实体确定模块31包括如下子模块:
情报数据获取子模块,用于从欺诈实体识别请求中,确定对应的识别实体,并根据预设的情报接口,从数据库中获取识别实体的情报数据。
特征数据提取子模块,用于基于预设的特征类别,提取出情报数据中每个特征类别的特征数据。
进一步的,数据分类模块32包括如下子模块:
数据分类子模块,用于基于不同维度的分类规则,对每个维度的特征数据进行分箱,得到每个维度的多个类别数据。
数据编码子模块,用于针对每个维度的特征数据,根据证据权重编码方式,分别对特征数据对应的每个类别数据进行权重编码,得到编码数据。
进一步的,分数计算模块33包括如下子模块:
模型构建子模块,用于获取预设的欺诈识别模型的欺诈分数计算参数,并基于欺诈分数计算参数构建评分模型。
分数计算子模块,用于将编码数据输入到评分模型中,得到识别实体的欺诈分数。
进一步的,识别结果模块34包括如下子模块:
欺诈等级确定子模块,用于根据预设的函数关系式,基于欺诈分数,计算出识别实体对应的欺诈等级。
识别结果子模块,用于基于欺诈等级与欺诈行为的对应关系,确定欺诈实体的欺诈识别结果。
进一步的,基于安全情报的欺诈实体识别装置还包括如下模块:
训练数据获取模块,用于通过预设的采集端口,获取至少一个类型的情报数据,对情报数据进行预处理,得到多类型情报数据。
特征数据提取模块,用于根据预设的特征提取规则,提取出多类型情报数据中的特征数据。
欺诈识别模型构建模块,用于通过线性回归模型构建欺诈识别模型,并通过特征数据训练欺诈识别模型,得到预设的欺诈识别模型。
其中上述模块/单元中的“第一”和“第二”的意义仅在于将不同的模块/单元加以区分,并不用于限定哪个模块/单元的优先级更高或者其它的限定意义。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式。
关于基于安全情报的欺诈实体识别装置的具体限定可以参见上文中对于基于安全情报的欺诈实体识别方法的限定,在此不再赘述。上述基于安全情报的欺诈实体识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于安全情报的欺诈实体识别方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于安全情报的欺诈实体识别方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中基于安全情报的欺诈实体识别方法的步骤,例如图2所示的步骤S10至步骤S40及该方法的其它扩展和相关步骤的延伸。或者,处理器执行计算机程序时实现上述实施例中基于安全情报的欺诈实体识别装置的各模块/单元的功能,例如图3所示模块31至模块34的功能。为避免重复,这里不再赘述。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。
所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中基于安全情报的欺诈实体识别方法的步骤,例如图2所示的步骤S10至步骤S40及该方法的其它扩展和相关步骤的延伸。或者,计算机程序被处理器执行时实现上述实施例中基于安全情报的欺诈实体识别装置的各模块/单元的功能,例如图3所示模块31至模块34的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于安全情报的欺诈实体识别方法,其特征在于,包括:
当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据,其中,所述特征数据至少包括一个维度的特征数据;
针对每个维度的所述特征数据,对所述特征数据进行分箱处理,得到至少两个类别数据,并对每个所述类别数据进行权重编码,得到编码数据;
将所述编码数据输入到预设的欺诈识别模型中,采用所述预设的欺诈识别模型生成欺诈分数计算参数,并根据所述欺诈分数计算参数计算得到所述识别实体的欺诈分数;
根据欺诈分数与欺诈等级的对应关系,确定所述识别实体的欺诈等级,并根据所述欺诈等级确定所述识别实体的欺诈识别结果。
2.根据权利要求1所述的基于安全情报的欺诈实体识别方法,其特征在于,所述当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据的步骤包括:
从所述欺诈实体识别请求中,确定对应的识别实体,并根据预设的情报接口,从数据库中获取所述识别实体的情报数据;
基于预设的特征类别,提取出所述情报数据中每个特征类别的特征数据。
3.根据权利要求1所述的基于安全情报的欺诈实体识别方法,其特征在于,所述针对每个维度的所述特征数据,对所述特征数据进行分箱处理,得到至少两个类别数据,并对每个所述类别数据进行权重编码,得到编码数据的步骤包括:
基于不同维度的分类规则,对每个维度的特征数据进行分箱,得到每个维度的多个类别数据;
针对每个维度的特征数据,根据证据权重编码方式,分别对所述特征数据对应的每个所述类别数据进行权重编码,得到编码数据。
4.根据权利要求1所述的基于安全情报的欺诈实体识别方法,其特征在于,在将所述编码数据输入到预设的欺诈识别模型中,采用所述预设的欺诈识别模型生成欺诈分数计算参数,并根据所述欺诈分数计算参数计算得到所述识别实体的欺诈分数的步骤之前,所述方法包括:
通过预设的采集端口,获取至少一个类型的情报数据,对所述情报数据进行预处理,得到多类型情报数据;
根据预设的特征提取规则,提取出所述多类型情报数据中的特征数据;
通过线性回归模型构建欺诈识别模型,并通过所述特征数据训练所述欺诈识别模型,得到预设的欺诈识别模型。
5.根据权利要求1所述的基于安全情报的欺诈实体识别方法,其特征在于,将所述编码数据输入到预设的欺诈识别模型中,采用所述预设的欺诈识别模型生成欺诈分数计算参数,并根据所述欺诈分数计算参数计算得到所述识别实体的欺诈分数的步骤包括:
获取所述预设的欺诈识别模型的欺诈分数计算参数,并基于所述欺诈分数计算参数构建评分模型;
将所述编码数据输入到所述评分模型中,得到所述识别实体的欺诈分数。
6.根据权利要求1所述的基于安全情报的欺诈实体识别方法,其特征在于,所述根据欺诈分数与欺诈等级的对应关系,确定所述识别实体的欺诈等级,并根据所述欺诈等级确定所述识别实体的欺诈识别结果的步骤包括:
根据预设的函数关系式,基于所述欺诈分数,计算出所述识别实体对应的欺诈等级;
基于欺诈等级与欺诈行为的对应关系,确定所述欺诈实体的欺诈识别结果。
7.一种基于安全情报的欺诈实体识别装置,其特征在于,包括:
识别实体确定模块,用于当接收到欺诈实体识别请求时,确定对应的识别实体,并通过预设接口获取对应的特征数据,其中,所述特征数据至少包括一个维度的特征数据;
数据分类模块,用于针对每个维度的所述特征数据,对所述特征数据进行分箱处理,得到至少两个类别数据,并对每个所述类别数据进行权重编码,得到编码数据;
分数计算模块,用于将所述编码数据输入到预设的欺诈识别模型中,采用所述预设的欺诈识别模型生成欺诈分数计算参数,并根据所述欺诈分数计算参数计算得到所述识别实体的欺诈分数;
识别结果模块,用于根据欺诈分数与欺诈等级的对应关系,确定所述识别实体的欺诈等级,并根据所述欺诈等级确定所述识别实体的欺诈识别结果。
8.根据权利要求7所述的基于安全情报的欺诈实体识别装置,其特征在于,所述分数计算模块包括:
模型构建子模块,用于获取所述预设的欺诈识别模型的欺诈分数计算参数,并基于所述欺诈分数计算参数构建评分模型;
分数计算子模块,用于将所述编码数据输入到所述评分模型中,得到所述识别实体的欺诈分数。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述基于安全情报的欺诈实体识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述基于安全情报的欺诈实体识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111266741.0A CN113987182A (zh) | 2021-10-28 | 2021-10-28 | 基于安全情报的欺诈实体识别方法、装置及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111266741.0A CN113987182A (zh) | 2021-10-28 | 2021-10-28 | 基于安全情报的欺诈实体识别方法、装置及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113987182A true CN113987182A (zh) | 2022-01-28 |
Family
ID=79743891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111266741.0A Pending CN113987182A (zh) | 2021-10-28 | 2021-10-28 | 基于安全情报的欺诈实体识别方法、装置及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113987182A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114881711A (zh) * | 2022-07-11 | 2022-08-09 | 荣耀终端有限公司 | 基于请求行为进行异常分析的方法及电子设备 |
CN115082079A (zh) * | 2022-08-22 | 2022-09-20 | 深圳市华付信息技术有限公司 | 关联用户的识别方法、装置、计算机设备及存储介质 |
CN116881914A (zh) * | 2023-09-06 | 2023-10-13 | 国网思极网安科技(北京)有限公司 | 文件系统操作处理方法、系统、设备和计算机可读介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030219122A1 (en) * | 2002-02-15 | 2003-11-27 | Servicios Especializados Y Tecnologia Informatica, S.A. | Check anti-fraud security system |
CN107038449A (zh) * | 2016-02-04 | 2017-08-11 | 中国移动(深圳)有限公司 | 一种欺诈用户的识别方法及装置 |
CN109816390A (zh) * | 2019-01-03 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 基于交易数据的反欺诈分析处理方法、装置和计算机设备 |
CN109858566A (zh) * | 2019-03-01 | 2019-06-07 | 成都新希望金融信息有限公司 | 一种基于多层模型构建增加入模维度的评分卡的方法 |
CN110633991A (zh) * | 2019-09-20 | 2019-12-31 | 阿里巴巴集团控股有限公司 | 风险识别方法、装置和电子设备 |
CN110659817A (zh) * | 2019-09-16 | 2020-01-07 | 上海云从企业发展有限公司 | 一种数据处理方法、装置、机器可读介质及设备 |
CN112348519A (zh) * | 2020-10-21 | 2021-02-09 | 上海淇玥信息技术有限公司 | 一种欺诈用户识别方法、装置和电子设备 |
CN112700321A (zh) * | 2020-12-31 | 2021-04-23 | 重庆富民银行股份有限公司 | 基于用户行为数据的多规则反欺诈预测方法及系统 |
US10997596B1 (en) * | 2016-08-23 | 2021-05-04 | Mastercard International Incorporated | Systems and methods for use in analyzing declined payment account transactions |
-
2021
- 2021-10-28 CN CN202111266741.0A patent/CN113987182A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030219122A1 (en) * | 2002-02-15 | 2003-11-27 | Servicios Especializados Y Tecnologia Informatica, S.A. | Check anti-fraud security system |
CN107038449A (zh) * | 2016-02-04 | 2017-08-11 | 中国移动(深圳)有限公司 | 一种欺诈用户的识别方法及装置 |
US10997596B1 (en) * | 2016-08-23 | 2021-05-04 | Mastercard International Incorporated | Systems and methods for use in analyzing declined payment account transactions |
CN109816390A (zh) * | 2019-01-03 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 基于交易数据的反欺诈分析处理方法、装置和计算机设备 |
CN109858566A (zh) * | 2019-03-01 | 2019-06-07 | 成都新希望金融信息有限公司 | 一种基于多层模型构建增加入模维度的评分卡的方法 |
CN110659817A (zh) * | 2019-09-16 | 2020-01-07 | 上海云从企业发展有限公司 | 一种数据处理方法、装置、机器可读介质及设备 |
CN110633991A (zh) * | 2019-09-20 | 2019-12-31 | 阿里巴巴集团控股有限公司 | 风险识别方法、装置和电子设备 |
CN112348519A (zh) * | 2020-10-21 | 2021-02-09 | 上海淇玥信息技术有限公司 | 一种欺诈用户识别方法、装置和电子设备 |
CN112700321A (zh) * | 2020-12-31 | 2021-04-23 | 重庆富民银行股份有限公司 | 基于用户行为数据的多规则反欺诈预测方法及系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114881711A (zh) * | 2022-07-11 | 2022-08-09 | 荣耀终端有限公司 | 基于请求行为进行异常分析的方法及电子设备 |
CN114881711B (zh) * | 2022-07-11 | 2023-06-30 | 荣耀终端有限公司 | 基于请求行为进行异常分析的方法及电子设备 |
CN115082079A (zh) * | 2022-08-22 | 2022-09-20 | 深圳市华付信息技术有限公司 | 关联用户的识别方法、装置、计算机设备及存储介质 |
CN116881914A (zh) * | 2023-09-06 | 2023-10-13 | 国网思极网安科技(北京)有限公司 | 文件系统操作处理方法、系统、设备和计算机可读介质 |
CN116881914B (zh) * | 2023-09-06 | 2023-11-28 | 国网思极网安科技(北京)有限公司 | 文件系统操作处理方法、系统、设备和计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11709854B2 (en) | Artificial intelligence based smart data engine | |
CN113987182A (zh) | 基于安全情报的欺诈实体识别方法、装置及相关设备 | |
WO2022156065A1 (zh) | 一种文本情感分析方法、装置、设备及存储介质 | |
CN110888911A (zh) | 样本数据处理方法、装置、计算机设备及存储介质 | |
CN110674131A (zh) | 财务报表数据处理方法、装置、计算机设备和存储介质 | |
CN111835561A (zh) | 基于用户行为数据的异常用户群体检测方法、装置、设备 | |
CN115082209A (zh) | 业务数据风险预警方法、装置、计算机设备及存储介质 | |
CN114399396A (zh) | 保险产品推荐方法、装置、计算机设备及存储介质 | |
CN111259952A (zh) | 异常用户识别方法、装置、计算机设备及存储介质 | |
CN112395500A (zh) | 内容数据推荐方法、装置、计算机设备及存储介质 | |
CN114461869B (zh) | 业务特征数据处理方法、装置、电子设备及存储介质 | |
CN114004700A (zh) | 业务数据处理方法、装置、电子设备及存储介质 | |
CN111767192A (zh) | 基于人工智能的业务数据检测方法、装置、设备和介质 | |
CN113707296B (zh) | 医疗方案数据处理方法、装置、设备及存储介质 | |
CN114356747A (zh) | 显示内容的测试方法、装置、设备、存储介质及程序产品 | |
CN115618415A (zh) | 敏感数据识别方法、装置、电子设备和存储介质 | |
CN115099988A (zh) | 模型训练方法、数据处理方法、设备及计算机介质 | |
CN115018625A (zh) | 征信融合报告生成方法、装置、设备及存储介质 | |
CN114387089A (zh) | 客户信用风险评估方法、装置、设备及存储介质 | |
CN110827144B (zh) | 用户的申请风险评估方法、申请风险评估装置及电子设备 | |
CN113704452A (zh) | 基于Bert模型的数据推荐方法、装置、设备及介质 | |
CN110610378A (zh) | 产品需求分析方法、装置、计算机设备和存储介质 | |
CN113988886A (zh) | 基于安全情报的欺诈行为追踪方法、装置及相关设备 | |
CN114048392B (zh) | 多媒体资源推送方法、装置、电子设备及存储介质 | |
CN114021739B (zh) | 业务处理、业务处理模型训练方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220128 |
|
RJ01 | Rejection of invention patent application after publication |