CN113630495B - 涉诈订单预测模型训练方法和装置,订单预测方法和装置 - Google Patents

涉诈订单预测模型训练方法和装置,订单预测方法和装置 Download PDF

Info

Publication number
CN113630495B
CN113630495B CN202010375837.XA CN202010375837A CN113630495B CN 113630495 B CN113630495 B CN 113630495B CN 202010375837 A CN202010375837 A CN 202010375837A CN 113630495 B CN113630495 B CN 113630495B
Authority
CN
China
Prior art keywords
fraud
order
model
card
mobile phone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010375837.XA
Other languages
English (en)
Other versions
CN113630495A (zh
Inventor
罗仕漳
魏丫丫
王健
雷勇
槐正
王红波
臧艳芳
杨传信
孙鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202010375837.XA priority Critical patent/CN113630495B/zh
Publication of CN113630495A publication Critical patent/CN113630495A/zh
Application granted granted Critical
Publication of CN113630495B publication Critical patent/CN113630495B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/663Preventing unauthorised calls to a telephone set
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供一种涉诈订单预测模型训练方法和装置,订单预测方法和装置。训练装置以预定周期从数据库中提取出涉及诈骗的手机号码清单;根据手机号码清单获取相关联的诈骗号卡订单;提取诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;将正样本和负样本提供给堆叠模型,其中将第一模型中的多个子模型的输出结果集成后,提供给第二模型以得到输出结果;利用输出结果同正样本和负样本的偏差确定损失函数值;根据损失函数值对堆叠模型进行训练,直至损失函数值满足预定条件为止。本公开通过利用经训练的堆叠模型,能够在号卡购买阶段进行防诈骗预测,有效提升防诈效果。

Description

涉诈订单预测模型训练方法和装置,订单预测方法和装置
技术领域
本公开涉及信息技术领域,特别涉及一种涉诈订单预测模型训练方法和装置,订单预测方法和装置。
背景技术
目前的通信防诈骗主要采取在通话过程中黑名单拦截的方式。即从通话开始,针对主叫号码是否属于黑名单以进行拦截处理,直到通话结束为止。由于诈骗人频繁更换电话号码,黑名单号码实际占比很小,防诈骗效果往往未能达到预期。相关技术中还出现一种基于聚类算法的实时拦截诈骗电话的方案,其中通过采用聚类算法分簇来初步识别诈骗电话,并使用逻辑回归计算可疑度指数以实现进一步的过滤。
此外,在相关技术中,还通过语音识别技术进行分词处理,以识别出相应的诈骗关键词。
发明内容
发明人通过研究发现,在利用聚类算法进行诈骗电话拦截的过程中,各特征指标的区间范围需要依经验划分且需反复调整,逻辑回归中的所有权重值和极大似然值也要反复尝试,模型训练不确定因素多、难度大、调整时间长,泛化性能差。此外,在采用语音识别技术进行处理的过程中,需要增加新的通信网元来记录终端串号(与主叫号码不同)相关的诈骗和骚扰信息,从而需要改变通信网络结构,改造难度大成本高,且无法保证终端串号实时获得,在串号为空的情况下拦截效果差。
据此,本公开提供一种涉诈订单预测模型训练和涉诈订单预测方案,通过将诈骗行为发生后的被动防御,调整为在号卡购买阶段的防诈骗预测,有效提升防诈效果。
根据本公开实施例的第一方面,提供一种涉诈订单预测模型训练方法,包括:以预定周期从数据库中提取出涉及诈骗的手机号码清单;根据所述手机号码清单获取相关联的诈骗号卡订单;提取所述诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;将所述正样本和所述负样本提供给堆叠模型中的第一模型,以便所述第一模型中的多个子模型分别对所述正样本和所述负样本进行处理,以分别得到对应的输出结果;将所述多个子模型的输出结果集成后,提供给所述堆叠模型中的第二模型,以得到所述堆叠模型的输出结果;利用所述堆叠模型的输出结果同所述正样本和所述负样本的偏差确定损失函数值;根据所述损失函数值对所述第一模型和所述第二模型进行训练,直至所述损失函数值满足预定条件为止。
在一些实施例中,根据所述手机号码清单获取相关联的诈骗号卡订单包括:根据所述手机号码清单中的每个手机号码,查询相关联的号卡订单;根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息;查询与所述入网用户身份证信息或收货用户手机号码相关联的号卡订单,然后重复执行根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的号卡订单为止。
在一些实施例中,将查询出的号卡订单写入历史诈骗号卡订单库中。
在一些实施例中,所述第一模型中的多个子模型分别采用不同的分类器模型。
根据本公开实施例的第二方面,提供一种涉诈订单预测模型训练装置,包括:第一提取模块,被配置为以预定周期从数据库中提取出涉及诈骗的手机号码清单;订单获取模块,被配置为根据所述手机号码清单获取相关联的诈骗号卡订单;样本生成模块,被配置为提取所述诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;训练模块,被配置为将所述正样本和所述负样本提供给堆叠模型中的第一模型,以便所述第一模型中的多个子模型分别对所述正样本和所述负样本进行处理,以分别得到对应的输出结果,将所述多个子模型的输出结果集成后,提供给所述堆叠模型中的第二模型,以得到所述堆叠模型的输出结果,利用所述堆叠模型的输出结果同所述正样本和所述负样本的偏差确定损失函数值,根据所述损失函数值对所述第一模型和所述第二模型进行训练,直至所述损失函数值满足预定条件为止。
在一些实施例中,订单获取模块被配置为根据所述手机号码清单中的每个手机号码,查询相关联的号卡订单,根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息,查询与所述入网用户身份证信息或收货用户手机号码相关联的号卡订单,然后重复执行根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的号卡订单为止。
在一些实施例中,订单获取模块还被配置为将查询出的号卡订单写入历史诈骗号卡订单库中。
在一些实施例中,所述第一模型中的多个子模型分别采用不同的分类器模型。
根据本公开实施例的第三方面,提供一种涉诈订单预测模型训练装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的方法。
根据本公开实施例的第四方面,提供一种涉诈订单预测方法,包括:提取待预测的号卡订单的特征信息;将所提取的特征信息输入经上述任一实施例所述的涉诈订单预测模型训练方法所训练的涉诈订单预测模型,以获得所述待预测的号卡订单的预测结果;若所述预测结果指示所述待预测的号卡订单为涉诈订单,则进行相应的预警处理。
根据本公开实施例的第五方面,提供一种涉诈订单预测装置,包括:第二提取模块,被配置为提取待预测的号卡订单的特征信息;预测模块,被配置为将所提取的特征信息输入经上述任一实施例所述的涉诈订单预测模型训练方法所训练的涉诈订单预测模型,以获得所述待预测的号卡订单的预测结果;预警处理模块,被配置为若所述预测结果指示所述待预测的号卡订单为涉诈订单,则进行相应的预警处理。
根据本公开实施例的第六方面,提供一种涉诈订单预测装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的方法。
根据本公开实施例的第七方面,提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上述任一实施例涉及的方法。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1是根据本公开一个实施例的涉诈订单预测模型训练方法的流程示意图;
图2是根据本公开一个实施例的查询诈骗号卡订单方法的流程示意图;
图3是根据本公开一个实施例的涉诈订单预测模型的结构示意图;
图4是根据本公开一个实施例的决策树的示意图;
图5是根据本公开一个实施例的涉诈订单预测模型训练装置的结构示意图;
图6是根据本公开另一个实施例的涉诈订单预测模型训练装置的结构示意图;
图7是根据本公开一个实施例的涉诈订单预测方法的流程示意图;
图8是根据本公开一个实施例的涉诈订单预测装置的结构示意图;
图9是根据本公开另一个实施例的涉诈订单预测装置的结构示意图。
应当明白,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。此外,相同或类似的参考标号表示相同或类似的构件。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。对示例性实施例的描述仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。本公开可以以许多不同的形式实现,不限于这里所述的实施例。提供这些实施例是为了使本公开透彻且完整,并且向本领域技术人员充分表达本公开的范围。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、材料的组分和数值应被解释为仅仅是示例性的,而不是作为限制。
本公开中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其他要素的可能。
本公开使用的所有术语(包括技术术语或者科学术语)与本公开所属领域的普通技术人员理解的含义相同,除非另外特别定义。还应当理解,在诸如通用字典中定义的术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
图1是根据本公开一个实施例的涉诈订单预测模型训练方法的流程示意图。在一些实施例中,下面的涉诈订单预测模型训练方法步骤由涉诈订单预测模型训练装置执行。
在步骤101,以预定周期从数据库中提取出涉及诈骗的手机号码清单。
例如,可定期(例如一个月)通过公安部、12321等部门的数据库提取出涉及诈骗的手机号码清单。
在步骤102,根据手机号码清单获取相关联的诈骗号卡订单。
图2是根据本公开一个实施例的查询诈骗号卡订单方法的流程示意图。在一些实施例中,下面的查询诈骗号卡订单方法步骤由涉诈订单预测模型训练装置执行。
在步骤201,根据手机号码清单中的每个手机号码,查询相关联的号卡订单。
在步骤202,根据相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息。
在步骤203,查询与入网用户身份证信息和/或收货用户手机号码相关联的号卡订单。
在步骤204,重复执行根据相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的号卡订单为止。
通过上述处理,可查询出与诈骗手机号码相关联的全部号卡订单,以便于后续模型训练的准确性。
在步骤205,将查询出的号卡订单写入历史诈骗号卡订单库中。
通过将查询出的号卡订单写入历史诈骗号卡订单库,以便通过历史诈骗号卡订单库,可以方便用户了解诈骗号卡订单的历史数据。
返回图1。在步骤103,提取诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本。
这里需要说明的是,诈骗号卡订单相比于与诈骗无关的正常卡号订单,通常具有以下的特点:
(1)常为互联网卡;(2)不充值不预存;(3)不撤单不退款不退换;(4)通常没有副卡;(5)实名制通过率高;(6)物流可达率高;(7)订单激活率高;(8)收货人或入网人地域集中;(9)收货人或入网人一定时期多次购买;(10)购买渠道集中等。
因此,通过上述特征,可有效识别一个号卡订单是否为诈骗订单。
相应的示例可如表1所示。
Figure GDA0003692999700000071
表1
在步骤104,将正样本和负样本提供给堆叠模型中的第一模型,以便第一模型中的多个子模型分别对正样本和负样本进行处理,以分别得到对应的输出结果。
图3是根据本公开一个实施例的涉诈订单预测模型的结构示意图。
如图3所示,涉诈订单预测模型采用堆叠法。具体地,涉诈订单预测模型包括第一模型和第二模型,第一模型中包括多个子模型。第一模型中的多个子模型互不相同。例如,子模型可以为随机森林、Xgboost、focal loss+等分类器模型。由于不同模型的侧重点不同,因此通过将不同子模型的输出结果集成后提供给第二模型,能够得到更优的预测结果。例如,第二模型可采用Xgboost分类器模型。
返回图1。在步骤105,将多个子模型的输出结果集成后,提供给堆叠模型中的第二模型,以得到堆叠模型的输出结果。
在步骤106,利用堆叠模型的输出结果同正样本和负样本的偏差确定损失函数值。
在步骤107,根据损失函数值对第一模型和第二模型进行训练,直至损失函数值满足预定条件为止。
在本公开上述实施例提供的涉诈订单预测模型训练方法中,通过利用不同类型的号卡订单的特征对堆叠模型进行训练,从而能够利用经过训练的堆叠模型在号卡的购买环节进行防诈骗检测,有效提升防诈效果。
例如,在图3所示实施例中,子模块1采用随机森林模型,子模块2采用Xgboost模型,子模型n采用Focal loss+模型。
子模块1在构建随机森林每棵决策树的过程中,首先构建训练集。N为训练集样本个数,d为训练集特征数目。例如N=15,d=3。对于每一个树节点,随机选择k个基于此点上的特征。本实施方式中k取值为3。从N个训练案例中做有放回取样(bootstrap采样),取样N次,形成一组训练数据集D。训练集D如表2所示。
Figure GDA0003692999700000081
表2
在训练集D中,(1)销售品编码,为1时代表互联网卡1,为2时代表互联网卡2;(2)支付金额是否超过0.1元,为0时代表不超过,为1时代表超过;(3)收货地址,为1时代表某县,为2时代表北京。
接下来,从根节点开始,分别计算决策树当前节点下各特征所对应的信息增益,取信息增益最大的特征作为当前节点的分裂特征。基于相应分裂方式对每个节点进行分裂,直到得到一颗完整的决策树。其中的一次分裂过程描述如下:
1、计算信息熵
Figure GDA0003692999700000091
2、计算信息增益
Figure GDA0003692999700000092
Figure GDA0003692999700000093
Figure GDA0003692999700000094
3、选信息增益最大的特征作为分裂特征。显然“收货地址”为分裂特征。
4、从根节点开始,基于上述分裂方式对各节点进行分裂处理,直到当前节点下分裂属性用完,最后得到一颗完整的决策树。构建的决策树如图4所示。
5、重复决策树的构建构成,得到多颗决策树,形成一个随机森林。
子模块2在利用Xgboost模型的过程中,采用深度为10、决策树为200个、学习率为0.1、目标函数为Softmax的分类器。
子模块n在利用Focal loss+模型的过程中,构建了3层神经网络,分别为150、150、100个节点,其中激活函数为relu和softmax,损失函数使用Focal loss,采用adam优化器。这里需要说明的是,这种模型适用于诈骗订单占比较小的数据不平衡场景。
图5是根据本公开一个实施例的涉诈订单预测模型训练装置的结构示意图。涉诈订单预测模型训练装置包括第一提取模块51、订单获取模块52、样本生成模块53和训练模块54。
第一提取模块51被配置为以预定周期从数据库中提取出涉及诈骗的手机号码清单。
例如,可定期(例如一个月)通过公安部、12321等部门的数据库提取出涉及诈骗的手机号码清单。
订单获取模块52被配置为根据手机号码清单获取相关联的诈骗号卡订单。
在一些实施例中,订单获取模块52被配置为根据手机号码清单中的每个手机号码,查询相关联的号卡订单,根据相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息,查询与入网用户身份证信息或收货用户手机号码相关联的号卡订单,然后重复执行根据相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的号卡订单为止。
此外,订单获取模块52还被配置为将查询出的号卡订单写入历史诈骗号卡订单库中。
样本生成模块53被配置为提取诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本。
这里需要说明的是,诈骗号卡订单相比于与诈骗无关的正常卡号订单,通常具有以下的特点:
(1)常为互联网卡;(2)不充值不预存;(3)不撤单不退款不退换;(4)通常没有副卡;(5)实名制通过率高;(6)物流可达率高;(7)订单激活率高;(8)收货人或入网人地域集中;(9)收货人或入网人一定时期多次购买;(10)购买渠道集中等。
因此,通过上述特征,可有效识别一个号卡订单是否为诈骗订单。
训练模块54被配置为将正样本和负样本提供给堆叠模型中的第一模型,以便第一模型中的多个子模型分别对正样本和负样本进行处理,以分别得到对应的输出结果,将多个子模型的输出结果集成后,提供给堆叠模型中的第二模型,以得到堆叠模型的输出结果,利用堆叠模型的输出结果同正样本和负样本的偏差确定损失函数值,根据损失函数值对第一模型和第二模型进行训练,直至损失函数值满足预定条件为止。
在一些实施例中,涉诈订单预测模型如图3所示。
在本公开上述实施例提供的涉诈订单预测模型训练装置中,通过利用不同类型的号卡订单的特征对堆叠模型进行训练,从而能够利用经过训练的堆叠模型在号卡的购买环节进行防诈骗检测,有效提升防诈效果。
图6是根据本公开另一个实施例的涉诈订单预测模型训练装置的结构示意图。如图6所示,涉诈订单预测模型训练装置包括存储器61和处理器62。
存储器61用于存储指令。处理器62耦合到存储器61。处理器62被配置为基于存储器存储的指令执行实现如图1或图2中任一实施例涉及的方法。
如图6所示,涉诈订单预测模型训练装置还包括通信接口63,用于与其它设备进行信息交互。同时,该涉诈订单预测模型训练装置还包括总线64,处理器62、通信接口63、以及存储器61通过总线64完成相互间的通信。
存储器61可以包含高速RAM(Random Access Memory,随机存取存储器),也可还包括NVM(Non-Volatile Memory,非易失性存储器)。例如至少一个磁盘存储器。存储器61也可以是存储器阵列。存储器61还可能被分块,并且块可按一定的规则组合成虚拟卷。
此外,处理器62可以是一个中央处理器,或者可以是ASIC(Application SpecificIntegrated Circuit,专用集成电路),或者是被配置成实施本公开实施例的一个或多个集成电路。
本公开还提供一种计算机可读存储介质。计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如图1或图2中任一实施例涉及的方法。
图7是根据本公开一个实施例的涉诈订单预测方法的流程示意图。在一些实施例中,下列的涉诈订单预测方法步骤由涉诈订单预测装置执行。
在步骤701,提取待预测的号卡订单的特征信息。
在步骤702,将所提取的特征信息输入涉诈订单预测模型,以获得待预测的号卡订单的预测结果。这里使用的涉诈订单预测模型是经图1或图2中任一实施例涉及的涉诈订单预测模型训练方法所训练的涉诈订单预测模型。
在步骤703,若预测结果指示待预测的号卡订单为涉诈订单,则进行相应的预警处理。
例如,可将涉诈订单作为疑似订单,将该疑似订单转至客户外呼,或者分流至属地营业厅进行处理。
图8是根据本公开一个实施例的涉诈订单预测装置的结构示意图。如图8所示,涉诈订单预测装置包括第二提取模块81、预测模块82和预警处理模块83。
第二提取模块81被配置为提取待预测的号卡订单的特征信息。
预测模块82被配置为将所提取的特征信息输入涉诈订单预测模型,以获得待预测的号卡订单的预测结果。这里使用的涉诈订单预测模型是经图1或图2中任一实施例涉及的涉诈订单预测模型训练方法所训练的涉诈订单预测模型。
预警处理模块83被配置为若预测结果指示待预测的号卡订单为涉诈订单,则进行相应的预警处理。
图9是根据本公开另一个实施例的涉诈订单预测装置的结构示意图。如图9所示,涉诈订单预测装置包括存储器91、处理器92、通信接口93和总线94。图9和图6的不同之处在于,在图9的实施例中,处理器92被配置为基于存储器存储的指令执行实现如图7中任一实施例涉及的方法。
在一些实施例中,在上面所描述的功能单元模块可以实现为用于执行本公开所描述功能的通用处理器、可编程逻辑控制器(Programmable Logic Controller,简称:PLC)、数字信号处理器(Digital Signal Processor,简称:DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,简称:ASIC)、现场可编程门阵列(Field-ProgrammableGate Array,简称:FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或者其任意适当组合。
通过将本公开的方案运用于中国电信电子渠道防欺诈信息系统。截至2019年11月,该系统跟踪关联涉诈身份证号2.2万个,涉诈手机号2.6万个,涉诈库共拦截8.96万订单,黑名单库共拦截2.24万订单。以米粉卡为例,2019年2-5月涉诈占比较2018年11-1月下降0.9%,仅为0.0065%。公安部和12321平台通报涉案号码数据中电渠涉诈号码占比呈明显下降趋势,防诈效果明显。
至此,已经详细描述了本公开的实施例。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改或者对部分技术特征进行等同替换。本公开的范围由所附权利要求来限定。

Claims (13)

1.一种涉诈订单预测模型训练方法,包括:
以预定周期从数据库中提取出涉及诈骗的手机号码清单;
根据所述手机号码清单获取相关联的诈骗号卡订单;
提取所述诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;
将所述正样本和所述负样本提供给堆叠模型中的第一模型,以便所述第一模型中的多个子模型分别对所述正样本和所述负样本进行处理,以分别得到对应的输出结果;
将所述多个子模型的输出结果集成后,提供给所述堆叠模型中的第二模型,以得到所述堆叠模型的输出结果;
利用所述堆叠模型的输出结果同所述正样本和所述负样本的偏差确定损失函数值;
根据所述损失函数值对所述第一模型和所述第二模型进行训练,直至所述损失函数值满足预定条件为止。
2.根据权利要求1所述的方法,其中,根据所述手机号码清单获取相关联的诈骗号卡订单包括:
根据所述手机号码清单中的每个手机号码,查询相关联的号卡订单;
根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息;
查询与所述入网用户身份证信息或收货用户手机号码相关联的号卡订单,然后重复执行根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的号卡订单为止。
3.根据权利要求2所述的方法,还包括:
将查询出的号卡订单写入历史诈骗号卡订单库中。
4.根据权利要求1所述的方法,其中,
所述第一模型中的多个子模型分别采用不同的分类器模型。
5.一种涉诈订单预测模型训练装置,包括:
第一提取模块,被配置为以预定周期从数据库中提取出涉及诈骗的手机号码清单;
订单获取模块,被配置为根据所述手机号码清单获取相关联的诈骗号卡订单;
样本生成模块,被配置为提取所述诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;
训练模块,被配置为将所述正样本和所述负样本提供给堆叠模型中的第一模型,以便所述第一模型中的多个子模型分别对所述正样本和所述负样本进行处理,以分别得到对应的输出结果,将所述多个子模型的输出结果集成后,提供给所述堆叠模型中的第二模型,以得到所述堆叠模型的输出结果,利用所述堆叠模型的输出结果同所述正样本和所述负样本的偏差确定损失函数值,根据所述损失函数值对所述第一模型和所述第二模型进行训练,直至所述损失函数值满足预定条件为止。
6.根据权利要求5所述的装置,其中,
订单获取模块被配置为根据所述手机号码清单中的每个手机号码,查询相关联的号卡订单,根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息,查询与所述入网用户身份证信息或收货用户手机号码相关联的号卡订单,然后重复执行根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的号卡订单为止。
7.根据权利要求6所述的装置,其中,
订单获取模块被配置为将查询出的号卡订单写入历史诈骗号卡订单库中。
8.根据权利要求5所述的装置,其中,
所述第一模型中的多个子模型分别采用不同的分类器模型。
9.一种涉诈订单预测模型训练装置,包括:
存储器,被配置为存储指令;
处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如权利要求1-4中任一项所述的方法。
10.一种涉诈订单预测方法,包括
提取待预测的号卡订单的特征信息;
将所提取的特征信息输入经权利要求1-4中任一项所述的涉诈订单预测模型训练方法所训练的涉诈订单预测模型,以获得所述待预测的号卡订单的预测结果;
若所述预测结果指示所述待预测的号卡订单为涉诈订单,则进行相应的预警处理。
11.一种涉诈订单预测装置,包括
第二提取模块,被配置为提取待预测的号卡订单的特征信息;
预测模块,被配置为将所提取的特征信息输入经权利要求1-4中任一项所述的涉诈订单预测模型训练方法所训练的涉诈订单预测模型,以获得所述待预测的号卡订单的预测结果;
预警处理模块,被配置为若所述预测结果指示所述待预测的号卡订单为涉诈订单,则进行相应的预警处理。
12.一种涉诈订单预测装置,包括:
存储器,被配置为存储指令;
处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如权利要求10所述的方法。
13.一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如权利要求1-4、10中任一项所述的方法。
CN202010375837.XA 2020-05-07 2020-05-07 涉诈订单预测模型训练方法和装置,订单预测方法和装置 Active CN113630495B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010375837.XA CN113630495B (zh) 2020-05-07 2020-05-07 涉诈订单预测模型训练方法和装置,订单预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010375837.XA CN113630495B (zh) 2020-05-07 2020-05-07 涉诈订单预测模型训练方法和装置,订单预测方法和装置

Publications (2)

Publication Number Publication Date
CN113630495A CN113630495A (zh) 2021-11-09
CN113630495B true CN113630495B (zh) 2022-08-02

Family

ID=78376750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010375837.XA Active CN113630495B (zh) 2020-05-07 2020-05-07 涉诈订单预测模型训练方法和装置,订单预测方法和装置

Country Status (1)

Country Link
CN (1) CN113630495B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114418593A (zh) * 2021-12-23 2022-04-29 中国电信股份有限公司 非法行为识别方法、装置、电子设备及可读介质
CN116205664A (zh) * 2023-04-28 2023-06-02 成都新希望金融信息有限公司 一种中介欺诈识别方法、装置、电子设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106385693A (zh) * 2016-09-22 2017-02-08 长沙创客软件有限公司 针对虚拟号段的电信诈骗判断方法
CN107506776A (zh) * 2017-01-16 2017-12-22 恒安嘉新(北京)科技股份公司 一种诈骗电话号码的分析方法
CN107872772A (zh) * 2017-12-19 2018-04-03 北京奇虎科技有限公司 诈骗短信的检测方法及装置
CN108805583A (zh) * 2018-05-18 2018-11-13 连连银通电子支付有限公司 基于地址映射的电商欺诈检测方法、装置、设备及介质
WO2019085331A1 (zh) * 2017-11-02 2019-05-09 平安科技(深圳)有限公司 欺诈可能性分析方法、装置及存储介质
CN110008984A (zh) * 2019-01-22 2019-07-12 阿里巴巴集团控股有限公司 一种基于多任务样本的目标模型训练方法和装置
WO2019147918A1 (en) * 2018-01-26 2019-08-01 Alibaba Group Holding Limited Method for training fraudulent transaction detection model, detection method, and corresponding apparatus
CN110222992A (zh) * 2019-06-11 2019-09-10 深圳市安络科技有限公司 一种基于受骗群体画像的网络诈骗预警方法及装置
CN110378364A (zh) * 2019-05-29 2019-10-25 上海欣方智能系统有限公司 话单诈骗模型识别方法和系统
CN110399925A (zh) * 2019-07-26 2019-11-01 腾讯科技(武汉)有限公司 账号的风险识别方法、装置及存储介质
CN110493477A (zh) * 2019-09-12 2019-11-22 中国联合网络通信集团有限公司 诈骗号码识别方法、装置、设备及存储介质
CN110798330A (zh) * 2018-08-01 2020-02-14 中国移动通信集团浙江有限公司 一种电信诈骗库更新处理方法及装置
CN110969441A (zh) * 2019-12-23 2020-04-07 集奥聚合(北京)人工智能科技有限公司 基于深度学习的反欺诈模型处理方法及装置
CN110995937A (zh) * 2019-11-29 2020-04-10 上海观安信息技术股份有限公司 一种被骚扰用户的识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279868B (zh) * 2013-05-22 2016-08-17 兰亭集势有限公司 一种自动识别欺诈订单的方法和装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106385693A (zh) * 2016-09-22 2017-02-08 长沙创客软件有限公司 针对虚拟号段的电信诈骗判断方法
CN107506776A (zh) * 2017-01-16 2017-12-22 恒安嘉新(北京)科技股份公司 一种诈骗电话号码的分析方法
WO2019085331A1 (zh) * 2017-11-02 2019-05-09 平安科技(深圳)有限公司 欺诈可能性分析方法、装置及存储介质
CN107872772A (zh) * 2017-12-19 2018-04-03 北京奇虎科技有限公司 诈骗短信的检测方法及装置
WO2019147918A1 (en) * 2018-01-26 2019-08-01 Alibaba Group Holding Limited Method for training fraudulent transaction detection model, detection method, and corresponding apparatus
CN108805583A (zh) * 2018-05-18 2018-11-13 连连银通电子支付有限公司 基于地址映射的电商欺诈检测方法、装置、设备及介质
CN110798330A (zh) * 2018-08-01 2020-02-14 中国移动通信集团浙江有限公司 一种电信诈骗库更新处理方法及装置
CN110008984A (zh) * 2019-01-22 2019-07-12 阿里巴巴集团控股有限公司 一种基于多任务样本的目标模型训练方法和装置
CN110378364A (zh) * 2019-05-29 2019-10-25 上海欣方智能系统有限公司 话单诈骗模型识别方法和系统
CN110222992A (zh) * 2019-06-11 2019-09-10 深圳市安络科技有限公司 一种基于受骗群体画像的网络诈骗预警方法及装置
CN110399925A (zh) * 2019-07-26 2019-11-01 腾讯科技(武汉)有限公司 账号的风险识别方法、装置及存储介质
CN110493477A (zh) * 2019-09-12 2019-11-22 中国联合网络通信集团有限公司 诈骗号码识别方法、装置、设备及存储介质
CN110995937A (zh) * 2019-11-29 2020-04-10 上海观安信息技术股份有限公司 一种被骚扰用户的识别方法及装置
CN110969441A (zh) * 2019-12-23 2020-04-07 集奥聚合(北京)人工智能科技有限公司 基于深度学习的反欺诈模型处理方法及装置

Also Published As

Publication number Publication date
CN113630495A (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
CN107122369B (zh) 一种业务数据处理方法、装置和系统
CN107563757B (zh) 数据风险识别的方法及装置
US11714793B2 (en) Systems and methods for providing searchable customer call indexes
CN114119137B (zh) 风险控制方法和装置
CN105787025B (zh) 网络平台公共账号分类方法及装置
CN109670837A (zh) 债券违约风险的识别方法、装置、计算机设备和存储介质
CN107622333A (zh) 一种事件预测方法、装置及系统
CN111428217B (zh) 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质
CN113630495B (zh) 涉诈订单预测模型训练方法和装置,订单预测方法和装置
CN110609908A (zh) 案件串并方法及装置
CN110956503A (zh) 基于用户网络行为的具有借贷需求的用户识别方法及装置
CN111127062A (zh) 一种基于空间搜索算法的群体欺诈识别方法及装置
CN109902129B (zh) 基于大数据分析的保险代理人归类方法及相关设备
Yu Machine learning application in online lending risk prediction
CN108711073B (zh) 用户分析方法、装置及终端
CN117151727A (zh) 基于用户行为分析的客服智能切换方法
CN110287284A (zh) 语义匹配方法、装置及设备
CN111078877B (zh) 数据处理、文本分类模型的训练、文本分类方法和装置
CN111539853B (zh) 标准案由确定方法、装置和设备
CN117993910A (zh) 异常交易应对策略的验证方法及相关装置
CN113761897A (zh) 基于文本大数据的呼叫中心客服工单实体识别的方法
CN113723522B (zh) 异常用户的识别方法、装置、电子设备以及存储介质
Kang Fraud Detection in Mobile Money Transactions Using Machine Learning
US20230047062A1 (en) System and method for determining market share of an organization
CN113763111B (zh) 物品搭配方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant