CN110866049A - 目标对象类别的确认方法及装置、存储介质、电子装置 - Google Patents

目标对象类别的确认方法及装置、存储介质、电子装置 Download PDF

Info

Publication number
CN110866049A
CN110866049A CN201911185368.9A CN201911185368A CN110866049A CN 110866049 A CN110866049 A CN 110866049A CN 201911185368 A CN201911185368 A CN 201911185368A CN 110866049 A CN110866049 A CN 110866049A
Authority
CN
China
Prior art keywords
data
target object
analyzed
training
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911185368.9A
Other languages
English (en)
Inventor
许德明
陈秀坤
王欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhizhi Heshu Technology Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN201911185368.9A priority Critical patent/CN110866049A/zh
Publication of CN110866049A publication Critical patent/CN110866049A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents

Abstract

本发明提供了目标对象类别的确认方法及装置、存储介质、电子装置,其中,上述方法包括:获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;根据所述特征数据对异常模型进行训练;根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别,采用上述技术方案,解决了相关技术中,确定目标对象的目标对象类别的方式存在的准确性低等问题,提升了数据结果的准确性,减少了错误数据的产生。

Description

目标对象类别的确认方法及装置、存储介质、电子装置
技术领域
本发明涉及通信领域,具体而言,涉及一种目标对象类别的确认方法及装置、存储介质、电子装置。
背景技术
由于通信和网络行业的快速发展,社会各行业蓬勃发展,蒸蒸日上。与此同时,违法犯罪案件也相应的增多,层出不群。电信诈骗在我国人口基数大,贫富差距大的现实国情下,更是如社会之癌一样,到处扩散,屡屡打击不绝。
对于电诈人员的打击,大部分都是在受害者报案之后,公安机关采取的事发后侦查打击。电诈行为具有较大的隐蔽性和距离感,犯罪证据的抓获和固定较难。事前预防和针对非特定群体的电诈人员识别则显得难度颇大。现有大部分厂商主要采取对于人员进行异常度分析,按照异常积分阈值来实现主动预警。
存在以下问题:1、每条规则对应的积分值,大部分是纯主观经验值,并不都科学合理;2、阈值难以确定,按照大量案件统计分布区间计算的均值指标,对于个案不具有指导意义。3、基于以上规则产生的预警人员名单,命中率较低。
针对相关技术中,相关技术中,确定目标对象的目标对象类别的方式存在的准确性低等问题,尚未提出有效的技术方案。
发明内容
本发明实施例提供了目标对象类别的确认方法及装置、存储介质、电子装置,以至少解决相关技术中相关技术中,确定目标对象的目标对象类别的方式存在的准确性低等问题。
根据本发明的一个实施例,提供了一种目标对象类别的确认方法,包括:获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:国际移动用户识别码(International Mobie Subscriber Identity,简称为IMSI数据,媒体接入控制(MediaAccess Control,简称为MAC)数据,人像数据,轨迹数据,话单数据;根据所述特征数据对异常模型进行训练;根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别。
可选的,根据特征数据对异常模型进行训练,包括:获取特征数据的所有特征信息,以及设置特征数据的置信度;对所有特征信息进行归一化处理,得到归一化后的训练特征矩阵;根据训练特征矩阵和置信度对异常训练模型进行训练。。
可选的,根据训练后的异常模型对待分析的目标对象进行分析,以确定待分析的目标对象是否属于目标对象类别,包括:根据训练后的异常模型对待分析的目标对象的特征数据进行分析,输出目标置信度;根据目标置信度确定待分析的目标对象是否属于目标对象类别。
可选的,根据目标置信度确定待分析的目标对象是否属于目标对象类别,包括:根据以下公式确定待分析的目标对象是否属于目标对象类别是否属于目标对象类别:Y=A*X1+B*X2+C*X3+D*X4+E*X5,其中,A表示待分析的目标对象的IMSI数据所对应的值,B表示待分析的目标对象的MAC数据所对应的值,C表示待分析的目标对象的人像数据所对应的值,D表示待分析的目标对象的轨迹数据所对应的值,E表示待分析的目标对象的话单数据所对应的值X1,X2,X3,X4,X5分别为A,B,C,D,E对应的目标置信度。
根据本发明的另一个实施例,还提供了一种目标对象类别的确认装置,包括:获取模块,用于获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;训练模块,用于根据所述特征数据对异常模型进行训练;确定模块,用于根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别
在本发明实施例中,训练模块还用于获取所述特征数据的所有特征信息,以及设置所述特征数据的置信度;对所述所有特征信息进行归一化处理,得到归一化后的训练特征矩阵;根据所述训练特征矩阵和置信度对所述异常训练模型进行训练。
在本发明实施例中,确定模块还用于根据训练后的异常模型对待分析的目标对象的特征数据进行分析,输出目标置信度;根据所述目标置信度确定所述待分析的目标对象是否属于目标对象类别。
在本发明实施例中,确定模块还用于根据以下公式确定所述待分析的目标对象是否属于目标对象类别是否属于所述目标对象类别:Y=A*X1+B*X2+C*X3+D*X4+E*X5,其中,A表示所述待分析的目标对象的IMSI数据所对应的值,B表示所述待分析的目标对象的MAC数据所对应的值,C表示所述待分析的目标对象的人像数据所对应的值,D表示所述待分析的目标对象的轨迹数据所对应的值,E表示所述待分析的目标对象的话单数据所对应的值X1,X2,X3,X4,X5分别为A,B,C,D,E对应的目标置信度。
根据本发明的另一个实施例,还提供了一种存储介质,存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;根据所述特征数据对异常模型进行训练;根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别,采用上述技术方案,解决了相关技术中,确定目标对象的目标对象类别的方式存在的准确性低等问题,提升了目标对象类别确认结果的准确性,精确性,减少了错误数据的产生。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种目标对象类别的确认方法的计算机终端的硬件结构框图;
图2是根据本发明实施例的目标对象类别的确认方法的流程图;
图3是根据本发明实施例的目标对象类别的确认装置的结构框图。
具体实施方式
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例1所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种目标对象类别的确认方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的目标对象类别的确认方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种运行于上述计算机终端的一种目标对象类别的确认方法,图2是根据本发明实施例的目标对象类别的确认方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;
步骤S204,根据所述特征数据对异常模型进行训练;
步骤S206,根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别。
通过上述步骤,获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;根据所述特征数据对异常模型进行训练;根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别,采用上述技术方案,解决了相关技术中,确定目标对象的目标对象类别的方式存在的准确性低等问题,提升了目标对象类别确认结果的准确性,精确性,减少了错误数据的产生。
在本发明实施例中,需要说明的是,上述目标对象的特征数据具体的可以理解为:对于IMSI数据,引入目标对象的号码归属地参数,并且从归属地中,按照本地、敏感地区、一般地区分类。对于位置数据,分为高危地区、一般地区。捕获次数分为高频、低频、均值;对于MAC数据,可以理解是目标对象所使用的设备对应的MAC数据;对于人像数据,按照捕获次数分为均值、高频、低频,按照位置分为高危地区、一般地区。对于轨迹数据,按照轨迹出现的场所性质,分为交通场所、休闲场所、旅游场所、生活购物场所、住宅、办公场所、特殊行业场所等。对于轨迹位置,分为高危地区、一般地区。对于话单数据,按照通话时间段,分为白天通联、午夜通联,按照通联对象,分为敏感通联和一般通联。通话次数,分为高频通话,低频通话,普通频次通话。通话时长分为长时间通话,短时间通话,普通时长通话。
可选地,根据特征数据对异常模型进行训练的实现方式可以通过以下可选实施例进行确认:
例如:从历史案件信息中,提取电诈人员的种子数据,数量5000条,提取训练样本数据100000条,对训练数据进行数据清洗,提取训练特征规则。在获取特征数据的所有特征信息后,根据特征性信息设置特征数据的置信度;对所有特征信息进行归一化处理,得到归一化后的训练特征矩阵;根据训练特征矩阵和置信度对异常训练模型进行训练。
通过本实施例,设置特征数据的置信度,归一化处理特征信息后得到训练特征矩阵,进而用两者对异常训练模型进行训练,使用模型对目标对象的特征信息进行参数优化,提升了对目标对象数据结果再次分析的准确性、精确性。
可选的,根据训练后的异常模型对待分析的目标对象进行分析,以确定待分析的目标对象是否属于目标对象类别,包括:根据训练后的异常模型对待分析的目标对象的特征数据进行分析,输出目标置信度;本发明实施例中根据目标置信度确定待分析的目标对象是否属于目标对象类别。通过异常模型对待分析的目标对象进行分析输出目标对象对应的置信度,进而通过置信度进一步确定目标对象的类别。相应的还可以用已确定的目标对象对异常模型进行验证,证明训练结果的准确。保证异常模型参数的及时优化,提升对目标对象类型结果确认的精确性。
可选的,根据目标置信度确定待分析的目标对象是否属于目标对象类别,包括:根据以下公式确定待分析的目标对象是否属于目标对象类别是否属于目标对象类别:Y=A*X1+B*X2+C*X3+D*X4+E*X5,其中,A表示待分析的目标对象的IMSI数据所对应的值,B表示待分析的目标对象的MAC数据所对应的值,C表示待分析的目标对象的人像数据所对应的值,D表示待分析的目标对象的轨迹数据所对应的值,E表示待分析的目标对象的话单数据所对应的值X1,X2,X3,X4,X5分别为A,B,C,D,E对应的目标置信度。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
在本实施例中还提供了一种目标对象类别的确认装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是根据本发明实施例的目标对象类别的确认装置的结构框图,如图3所示,该装置包括:
获取模块32,用于获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;
训练模块34,用于根据所述特征数据对异常模型进行训练;
确定模块36,用于根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别。
通过上述装置,获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;根据所述特征数据对异常模型进行训练;根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别,采用上述技术方案,解决了相关技术中,确定目标对象的目标对象类别的方式存在的准确性低等问题,提升了目标对象类别确认结果的准确性,精确性,减少了错误数据的产生。
在本发明实施例中,训练模块还用于获取所述特征数据的所有特征信息,以及设置所述特征数据的置信度;对所述所有特征信息进行归一化处理,得到归一化后的训练特征矩阵;根据所述训练特征矩阵和置信度对所述异常训练模型进行训练。根据特征数据对异常模型进行训练,需要说明的是,上述目标对象的特征数据具体的可以理解可以为:对于IMSI数据,引入其号码归属地参数,并且从归属地中,按照本地、敏感地区、一般地区分类。对于位置数据,分为高危地区、一般地区。捕获次数分为高频、低频、均值。对于MAC数据,可以理解是目标对象所使用的设备对应的MAC数据;对于人像数据,按照捕获次数分为均值、高频、低频,按照位置分为高危地区、一般地区。对于轨迹数据,按照轨迹出现的场所性质,分为交通场所、休闲场所、旅游场所、生活购物场所、住宅、办公场所、特殊行业场所等。对于轨迹位置,分为高危地区、一般地区。对于话单数据,按照通话时间段,分为白天通联、午夜通联,按照通联对象,分为敏感通联和一般通联。通话次数,分为高频通话,低频通话,普通频次通话。通话时长分为长时间通话,短时间通话,普通时长通话。例如:从历史案件信息中,提取电诈人员的种子数据,数量5000条,提取训练样本数据100000条,对训练数据进行数据清洗,提取训练特征规则。在获取特征数据的所有特征信息后,根据特征性信息设置特征数据的置信度;对所有特征信息进行归一化处理,得到归一化后的训练特征矩阵;根据训练特征矩阵和置信度对异常训练模型进行训练。
通过本实施例,通过训练模块来设置特征数据的置信度,归一化处理特征信息后得到训练特征矩阵,进而用两者对异常训练模型进行训练,使用模型对目标对象的特征信息进行参数优化,提升了对目标对象数据结果再次分析的准确性、精确性。
可选的,确定模块还用于根据训练后的异常模型对待分析的目标对象进行分析,以确定待分析的目标对象是否属于目标对象类别,包括:根据训练后的异常模型对待分析的目标对象的特征数据进行分析,输出目标置信度;本发明实施例中根据目标置信度确定待分析的目标对象是否属于目标对象类别。通过异常模型对待分析的目标对象进行分析输出目标对象对应的置信度,进而通过置信度进一步确定目标对象的类别。相应的还可以用已确定的目标对象对异常模型进行验证,证明训练结果的准确。保证异常模型参数的及时优化,提升对目标对象类型结果确认的精确性。
在本发明实施例中,确定模块还用于根据以下公式确定所述待分析的目标对象是否属于目标对象类别是否属于所述目标对象类别:Y=A*X1+B*X2+C*X3+D*X4+E*X5,其中,A表示所述待分析的目标对象的IMSI数据所对应的值,B表示所述待分析的目标对象的MAC数据所对应的值,C表示所述待分析的目标对象的人像数据所对应的值,D表示所述待分析的目标对象的轨迹数据所对应的值,E表示所述待分析的目标对象的话单数据所对应的值X1,X2,X3,X4,X5分别为A,B,C,D,E对应的目标置信度。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
为了更好的理解上述目标对象类别的确认流程,以下结合一可选实施例进行说明,但不用于限定本发明实施例的技术方案,具体可包括以下步骤:
步骤一,,采用逻辑回归算法,对数据的特征类别进行详细提取。
电诈特征数据来源一般有以下方面:1、IMSI数据,2、MAC数据,3、人像数据,4、轨迹数据,5、话单数据。基于以上数据,采用逻辑回归算法,对数据的特征类别进行详细提取。按照1年内的数据和1年以上数据分类。重点人员类别(编号为A):对于人员按重点人员、团伙骨干、一般人员分类。IMSI数据(编号为B),引入其号码归属地参数,并且从归属地中,按照本地、敏感地区、一般地区分类。对于位置数据,分为高危地区、一般地区。捕获次数分为高频、低频、均值。人像数据(编号为C),按照捕获次数分为均值、高频、低频,按照位置分为高危地区、一般地区。轨迹数据(编号为D),按照轨迹出现的场所性质,分为交通场所、休闲场所、旅游场所、生活购物场所、住宅、办公场所、特殊行业场所等。对于轨迹位置,分为高危地区、一般地区。话单数据(编号为E),按照通话时间段,分为白天通联、午夜通联,按照通联对象,分为敏感通联和一般通联。通话次数,分为高频通话,低频通话,普通频次通话。通话时长分为长时间通话,短时间通话,普通时长通话。
将以上数据A/B/C/D/E的置信度规定为X1,X2,X3,X4,X5进行大量的模型训练。采用机器学习的方法,对A/B/C/D/E的置信度提取基于数据源的5类数据的总共13个特征,包括:是否本地号码、是否敏感地区号码、是否高危地出现、IMSI捕获次数、MAC位置、MAC捕获频次、人像捕获频次。是否轨迹高危地出现、轨迹场所属性值、通话时长、通话次数、通话时间、通话对象;最终标定结果权重。
步骤二,训练样本数据,按照归一化训练公式,对训练特征矩阵的元素进行归一化处理,得到归一化后的训练特征矩阵。
准备描述应为:对于数据ABCDE的置信度,初始设定为X1,X2,X3,X4,X5。对训练数据进行数据清洗。其数据清洗详细过程如下:a,删除训练数据中的空数据;b,删除训练数据中的明显脏数据,异常数据,c,删除训练数据中的回车,制表符,d,删除训练数据中的空行。
归一化是指把不同特征值不同维度的数据,统一到一个标准区间来计算,目的是消除数据差异性,使各数据处于同一标准量级下,适宜进行综合计算和比较。
归一过程,采用线性函数归一化法。具体是指将原始数据进行线性的变换,并确保新的数据均映射到[0,1]区间内,实现对原始数据的等比缩放。
其公式为:Xnew=X-Xmin/Xmax-Xmin,其中Xnew表示收敛到0和1之间的该列的新值,Xmin指本列最小值,Xmax指本列最大值。
举例如下:
Figure BDA0002292272300000111
Figure BDA0002292272300000121
归一化的过程如下,假设归一化后的矩阵为S:
S11=(2000-2000)/(4800-2000)=0
S21=(4800-2000)/(4800-2000)=1
S31=(3600-2000)/(4800-2000)=0.571429
S41=(2800-2000)/(4800-2000)=0.285714
S12=(1-1)/(4-1)=0
S22=(2-1)/(4-1)=0.33
S32=(3-1)/(4-1)=0.6667
S42=(4-1)/(4-1)=1
对样本数据,按照公式A*X1+B*X2+C*X3+D*X4+E*X5=Y计算,Y代表结果向量,有两种取值(0和1,0代表非电信诈骗人员,1代表电信诈骗人员)。利用最小二乘法,求解上述矩阵,获得X1,X2,X3,X4,X5的值。
步骤三,测试数据验证,用测试数据进行验证,所有种子,则证明训练结果准确输出置信度学习结果数据,将学习结果输出,作为置信度参数。
通过上述可选实施例,模型基本无过拟合,精度控制在90%左右,召回率在85%以上,精度和召回率之间可以平衡,后续视业务需求调整。可以对目标对象类别的确认做到更加准确。
通过上述实施例,解决了相关技术中,确定目标对象的目标对象类别的方式存在的准确性低等问题,达到了以下技术效果:
(1)对数据来源按照置信度进行了权重分析,提升了数据结果的准确性;
(2)取消阈值,按积分值推荐,减少了错误数据的产生;
(3)模型参数优化,提升了数据结果的精确性;
(4)引入置信度权重的异常积分规则,取消阈值的积分降序推荐人员方法,模型参数优化,共同保证了对电信诈骗人员推荐算法的精准性。
本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1,获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;;
S2,根据所述特征数据对异常模型进行训练;
S3,根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别。
本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;;
S2,根据所述特征数据对异常模型进行训练;
S3,根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种目标对象类别的确认方法,其特征在于,包括:
获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;
根据所述特征数据对异常模型进行训练;
根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别。
2.根据权利要求1所述的方法,其特征在于,根据所述特征数据对异常模型进行训练,包括:
获取所述特征数据的所有特征信息,以及设置所述特征数据的置信度;
对所述所有特征信息进行归一化处理,得到归一化后的训练特征矩阵;
根据所述训练特征矩阵和置信度对所述异常训练模型进行训练。
3.根据权利要求1所述的方法,其特征在于,根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别,包括:
根据训练后的异常模型对待分析的目标对象的特征数据进行分析,输出目标置信度;
根据所述目标置信度确定所述待分析的目标对象是否属于目标对象类别。
4.根据权利要求3所述的方法,其特征在于,根据所述目标置信度确定所述待分析的目标对象是否属于目标对象类别,包括:
根据以下公式确定所述待分析的目标对象是否属于目标对象类别是否属于所述目标对象类别:
Y=A*X1+B*X2+C*X3+D*X4+E*X5,其中,A表示所述待分析的目标对象的IMSI数据所对应的值,B表示所述待分析的目标对象的MAC数据所对应的值,C表示所述待分析的目标对象的人像数据所对应的值,D表示所述待分析的目标对象的轨迹数据所对应的值,E表示所述待分析的目标对象的话单数据所对应的值X1,X2,X3,X4,X5分别为A,B,C,D,E对应的目标置信度。
5.一种目标对象类别的确认装置,其特征在于,包括:
获取模块,用于获取目标对象的特征数据,其中,所述特征数据至少包括以下之一:IMSI数据,MAC数据,人像数据,轨迹数据,话单数据;
训练模块,用于根据所述特征数据对异常模型进行训练;
确定模块,用于根据训练后的异常模型对待分析的目标对象进行分析,以确定所述待分析的目标对象是否属于目标对象类别。
6.根据权利要求5所述的装置,其特征在于,所述训练模块,还用于获取所述特征数据的所有特征信息,以及设置所述特征数据的置信度;对所述所有特征信息进行归一化处理,得到归一化后的训练特征矩阵;根据所述训练特征矩阵和置信度对所述异常训练模型进行训练。
7.根据权利要求5所述的装置,其特征在于,所述确定模块,还用于根据训练后的异常模型对待分析的目标对象的特征数据进行分析,输出目标置信度;根据所述目标置信度确定所述待分析的目标对象是否属于目标对象类别。
8.根据权利要求7所述的装置,其特征在于,所述训练模块,还用于根据以下公式确定所述待分析的目标对象是否属于目标对象类别是否属于所述目标对象类别:Y=A*X1+B*X2+C*X3+D*X4+E*X5,其中,A表示所述待分析的目标对象的IMSI数据所对应的值,B表示所述待分析的目标对象的MAC数据所对应的值,C表示所述待分析的目标对象的人像数据所对应的值,D表示所述待分析的目标对象的轨迹数据所对应的值,E表示所述待分析的目标对象的话单数据所对应的值X1,X2,X3,X4,X5分别为A,B,C,D,E对应的目标置信度。
9.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至4任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至4任一项中所述的方法。
CN201911185368.9A 2019-11-27 2019-11-27 目标对象类别的确认方法及装置、存储介质、电子装置 Withdrawn CN110866049A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911185368.9A CN110866049A (zh) 2019-11-27 2019-11-27 目标对象类别的确认方法及装置、存储介质、电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911185368.9A CN110866049A (zh) 2019-11-27 2019-11-27 目标对象类别的确认方法及装置、存储介质、电子装置

Publications (1)

Publication Number Publication Date
CN110866049A true CN110866049A (zh) 2020-03-06

Family

ID=69656191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911185368.9A Withdrawn CN110866049A (zh) 2019-11-27 2019-11-27 目标对象类别的确认方法及装置、存储介质、电子装置

Country Status (1)

Country Link
CN (1) CN110866049A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914244A (zh) * 2020-07-31 2020-11-10 深圳力维智联技术有限公司 数据处理方法、装置及计算机可读存储介质
CN112188014A (zh) * 2020-10-28 2021-01-05 中国联合网络通信集团有限公司 信息处理方法及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077371A (zh) * 2014-06-24 2014-10-01 用友优普信息技术有限公司 监测数据库异常数据的方法及系统
CN107644106A (zh) * 2017-10-17 2018-01-30 厦门市美亚柏科信息股份有限公司 自动挖掘业务中间人的方法、终端设备及存储介质
CN108133061A (zh) * 2018-02-01 2018-06-08 天津市国瑞数码安全系统股份有限公司 一种诈骗群体识别系统
CN108810290A (zh) * 2018-07-17 2018-11-13 中国联合网络通信集团有限公司 一种诈骗电话的识别的方法及系统
CN108961315A (zh) * 2018-08-01 2018-12-07 腾讯科技(深圳)有限公司 目标跟踪方法、装置、计算机设备和存储介质
CN109299135A (zh) * 2018-11-26 2019-02-01 平安科技(深圳)有限公司 基于识别模型的异常查询识别方法、识别设备及介质
CN109903053A (zh) * 2019-03-01 2019-06-18 成都新希望金融信息有限公司 一种基于传感器数据进行行为识别的反欺诈方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077371A (zh) * 2014-06-24 2014-10-01 用友优普信息技术有限公司 监测数据库异常数据的方法及系统
CN107644106A (zh) * 2017-10-17 2018-01-30 厦门市美亚柏科信息股份有限公司 自动挖掘业务中间人的方法、终端设备及存储介质
CN108133061A (zh) * 2018-02-01 2018-06-08 天津市国瑞数码安全系统股份有限公司 一种诈骗群体识别系统
CN108810290A (zh) * 2018-07-17 2018-11-13 中国联合网络通信集团有限公司 一种诈骗电话的识别的方法及系统
CN108961315A (zh) * 2018-08-01 2018-12-07 腾讯科技(深圳)有限公司 目标跟踪方法、装置、计算机设备和存储介质
CN109299135A (zh) * 2018-11-26 2019-02-01 平安科技(深圳)有限公司 基于识别模型的异常查询识别方法、识别设备及介质
CN109903053A (zh) * 2019-03-01 2019-06-18 成都新希望金融信息有限公司 一种基于传感器数据进行行为识别的反欺诈方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914244A (zh) * 2020-07-31 2020-11-10 深圳力维智联技术有限公司 数据处理方法、装置及计算机可读存储介质
CN112188014A (zh) * 2020-10-28 2021-01-05 中国联合网络通信集团有限公司 信息处理方法及设备

Similar Documents

Publication Publication Date Title
CN108924333B (zh) 诈骗电话识别方法、装置和系统
CN104283918B (zh) 一种无线局域网终端类型获取方法及系统
CN110719605B (zh) 一种基于5g技术的网速检测系统
CN110517097A (zh) 识别异常用户的方法、装置、设备及存储介质
CN107306306B (zh) 通信号码处理方法及装置
CN105592008A (zh) 用户网络行为处理方法及装置
CN108989581B (zh) 一种用户风险识别方法、装置及系统
CN110166344B (zh) 一种身份标识识别方法、装置以及相关设备
CN110866049A (zh) 目标对象类别的确认方法及装置、存储介质、电子装置
CN102769851B (zh) 一种监控服务提供商业务的方法及系统
CN112751835B (zh) 一种流量预警方法、系统、设备和存储介质
CN112866192B (zh) 一种识别异常聚集行为的方法及装置
CN114338064B (zh) 识别网络流量类型的方法、装置、系统、设备和存储介质
CN115034305A (zh) 利用人在回路图神经网络在通话网络中识别诈骗用户的方法、系统和存储介质
CN110445772B (zh) 一种基于主机关系的互联网主机扫描方法及系统
CN110347566A (zh) 用于对注册风控模型进行效能评估的方法及装置
CN109819125A (zh) 一种限制电信诈骗的方法及装置
CN110536302A (zh) 电信诈骗提醒方法和装置
CN109951609B (zh) 一种恶意电话号码处理方法和装置
CN109873836A (zh) 一种数据的风险评估方法及装置
CN114168423A (zh) 异常号码的呼叫监控方法、装置、设备及存储介质
CN104378329A (zh) 安全验证的方法、装置及系统
CN117295157B (zh) 一种用于可穿戴式背夹终端的定位方法及系统
Swarnalaxmi et al. User activity analysis driven anomaly detection in cellular network
CN110636451B (zh) 信息管理方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210918

Address after: 100124 room 650, 6th floor, building 11, Huashan Garden Cultural Media Industrial Park, 1376 folk culture street, Gaobeidian village, Gaobeidian Township, Chaoyang District, Beijing

Applicant after: Beijing Zhizhi Heshu Technology Co.,Ltd.

Address before: A1002, 10th floor, building 1, yard 1, Zhongguancun East Road, Haidian District, Beijing 100086

Applicant before: MININGLAMP SOFTWARE SYSTEMS Co.,Ltd.

WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200306