CN116188014A - 风险票据团伙识别方法、装置、介质及设备 - Google Patents

风险票据团伙识别方法、装置、介质及设备 Download PDF

Info

Publication number
CN116188014A
CN116188014A CN202211543112.2A CN202211543112A CN116188014A CN 116188014 A CN116188014 A CN 116188014A CN 202211543112 A CN202211543112 A CN 202211543112A CN 116188014 A CN116188014 A CN 116188014A
Authority
CN
China
Prior art keywords
bill
node
risk
partner
network diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211543112.2A
Other languages
English (en)
Inventor
朱婷
田鸥
刘玲
王丽虹
文广明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202211543112.2A priority Critical patent/CN116188014A/zh
Publication of CN116188014A publication Critical patent/CN116188014A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种风险票据团伙识别方法、装置、介质及设备,该方法包括:基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;对票据关系网络图进行子图切割生成多个节点子集;对节点子集中的无用节点进行去除操作生成小社团票据关系网络图;将小社团票据关系网络图输入风险评估模型进行风险评估操作得到评估结果;根据评估结果判断待识别票据团伙是否存在风险。利用本申请实施例,通过将票据所在票据团伙的信息构建形成票据关系网络图,再将票据关系网络图进行切割处理得到精简后的小社团票据关系网络图,再将小社团票据关系网络图输入训练好的风险评估模型进行判断票据所在团伙是否存在风险。

Description

风险票据团伙识别方法、装置、介质及设备
技术领域
本申请涉及电子通信技术领域,尤其涉及一种数据更新技术领域,特别涉及一种风险票据团伙识别方法、装置、介质及设备。
背景技术
传统的基于专家规则评分模型构建的票据中介的风控体系对于层出不穷的、隐藏更深的据中介团伙识别难度较大。通过建立关联图谱,从票据的背书交易关联关系、工商关系、交易对手关系等挖掘出隐藏较深的风险团伙关系,直观展示票据链条上的关联企业,进一步挖掘票据中介团伙。
发明内容
本申请实施例提供一种风险票据团伙识别方法、装置、介质及设备,利用本申请实施例提供的风险票据团伙识别方法,通过将票据所在票据团伙的信息构建形成票据关系网络图,再将票据关系网络图进行切割处理得到精简后的小社团票据关系网络图,实现去除大量无用节点,从而减少后续的计算量,再将小社团票据关系网络图输入训练好的风险评估模型进行判断票据所在团伙是否存在风险。
本申请实施例一方面提供了一种风险票据团伙识别方法,所述风险票据团伙识别方法包括:
基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;
对所述票据关系网络图进行子图切割,生成多个节点子集;
对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;
将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;
根据所述评估结果判断所述待识别票据团伙是否存在风险。
在本申请实施例所述的风险票据团伙识别方法中,所述票据关系网络图包括节点数据及边数据,其中,所述票据关系网络图中的节点数据用于存储单个票据关联人对应的基本信息,所述边数据用于存储相邻两个节点数据之间的关系信息。
在本申请实施例所述的风险票据团伙识别方法中,所述对所述票据关系网络图进行子图切割,生成多个节点子集,包括:
通过预设分割算法对所述票据关系网络图进行子图切割,生成多个节点子集;
所述分割算法通过以下公式表示:
Figure SMS_1
其中,m为票据关系网络图中总的边数,Aij为节点i和节点j之间的边的边权重(weight),ki为节点i的邻边权重之和,kj为节点j的邻边权重之和,Ci为节点i属于某个社区的标号,Cj为节点j属于某个社区的标号。
在本申请实施例所述的风险票据团伙识别方法中,所述对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图,包括:
通过最小生成树算法对节点子集进行计算得到最小生成树;
通过k-核算法对所述最小生成树进行迭代剪枝以去除所述无用节点;
根据剩余的节点生成小社团票据关系网络图。
在本申请实施例所述的风险票据团伙识别方法中,所述风险评估模型基于XGBoost模型训练得到;所述XGBoost模型的训练过程包括:
获取样本集D,其中,D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R),xi为第i个样本一天各个时刻的指标值,yi为第i个样本一天中指标是否存在通信异常的标签值,yi∈{0,1},0表示通信正常,1表示通信异常,n为样本数,m为样本特征数;
基于样本集D构造梯度提升树,采用CART回归树作为模型的子树模型,通过迭代的方式增加CART回归树,将所有的CART回归树合并在一起得到训练好的XGBoost模型。
在本申请实施例所述的风险票据团伙识别方法中,所述方法还包括:
根据所述评估结果生成报告,其中,所述报告包括评估结果及与所述评估报告对应的票据团伙信息。
相应的,本申请实施例另一方面还提供了一种风险票据团伙识别装置,所述风险票据团伙识别装置包括:
构建模块,用于基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;
切割模块,用于对所述票据关系网络图进行子图切割,生成多个节点子集;
去除模块,用于对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;
评估模块,用于将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;
判断模块,用于根据所述评估结果判断所述待识别票据团伙是否存在风险。
在本申请实施例所述的风险票据团伙识别装置中,所述票据关系网络图包括节点数据及边数据,其中,所述票据关系网络图中的节点数据用于存储单个票据关联人对应的基本信息,所述边数据用于存储相邻两个节点数据之间的关系信息。
相应的,本申请实施例另一方面还提供了一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行如上所述的风险票据团伙识别方法。
相应的,本申请实施例另一方面还提供了一种终端设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述指令以执行如上所述的风险票据团伙识别方法。
本申请实施例提供了一种风险票据团伙识别方法、装置、介质及设备,该方法通过基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;对所述票据关系网络图进行子图切割,生成多个节点子集;对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;根据所述评估结果判断所述待识别票据团伙是否存在风险。利用本申请实施例提供的风险票据团伙识别方法,通过将票据所在票据团伙的信息构建形成票据关系网络图,再将票据关系网络图进行切割处理得到精简后的小社团票据关系网络图,实现去除大量无用节点,从而减少后续的计算量,再将小社团票据关系网络图输入训练好的风险评估模型进行判断票据所在团伙是否存在风险。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的风险票据团伙识别方法的流程示意图。
图2为本申请实施例提供的风险票据团伙识别装置的结构示意图。
图3为本申请实施例提供的风险票据团伙识别装置的另一结构示意图。
图4为本申请实施例提供的终端设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护范围。
需要说明的是,以下内容是对本方案背景做出的简单介绍:
本方案主要是围绕“传统的基于专家规则评分模型构建的票据中介的风控体系对于层出不穷的、隐藏更深的据中介团伙识别难度较大”这一技术问题开展的。可以理解的是,随着票据市场的发展,票据中介市场越来越受到监管的关注。近年来,最高院、监管部门陆续发文规范票据市场,多次点名票据中介。票据中介巧妙地使用空壳公司、冒充真实贸易交易场景等手段进行欺诈,使用各类成熟的技术操纵大量票据流转及贴现。在监管趋严的背景下,为了规范银行票据贴现体系,准确识别票据中介的需求变得十分重要。传统的基于专家规则评分模型构建的票据中介的风控体系对于层出不穷的、隐藏更深的据中介团伙识别难度较大。通过建立关联图谱,从票据的背书交易关联关系、工商关系、交易对手关系等挖掘出隐藏较深的风险团伙关系,直观展示票据链条上的关联企业,进一步挖掘票据中介团伙。
为了解决上述技术问题,本申请实施例提供一种风险票据团伙识别方法。利用本申请实施例提供的风险票据团伙识别方法,通过将票据所在票据团伙的信息构建形成票据关系网络图,再将票据关系网络图进行切割处理得到精简后的小社团票据关系网络图,实现去除大量无用节点,从而减少后续的计算量,再将小社团票据关系网络图输入训练好的风险评估模型进行判断票据所在团伙是否存在风险。
请参阅图1,图1为本申请实施例提供的风险票据团伙识别方法的流程示意图。所述风险票据团伙识别方法,应用于终端设备中。可选地,该终端设备为终端或服务器。可选地,该服务器是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电及车载终端等,但并不局限于此。
在一实施例中,所述方法可以包括以下步骤:
步骤101,基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图。
需要说明的是,在盗用、欺诈、作弊、套现、冒用等风控场景中,通常存在团伙作案的方式,这种成员之间相互勾连进行作案的方式,波及面广且容易造成较大资损。
例如,在欺诈场景中,一个人可能冒充公检法给受害人打电话,以威胁的方式让受害人转账到指定账户中。通常这种诈骗集团存在一定的团伙聚集性,即冒充公检法的人群之间可能存在某些关联关系,例如,关联关系包括资金、通讯录、社交、媒介等。若将已知的欺诈作案人群之间通过上述关联关系进行关联,便得到了他们之间的团伙关系,在本实施例中利用上述团伙关系可以基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图。
其中,票据关系网络图包括节点数据及边数据。
需要解释的是,票据关系网络图中的节点数据用于存储单个票据关联人对应的基本信息,边数据用于存储相邻两个节点数据之间的关系信息。
示例性地,基本信息包括背书人、开票人、收款人、贴现人、同法人、同董监高等企业。这些企业构成票据图谱上的所有节点。关系信息包含各节点对应的企业的背书关系、法人关系、董监高关系等。
步骤102,对所述票据关系网络图进行子图切割,生成多个节点子集。
在本实施例中,可以通过预设分割算法对票据关系网络图进行子图切割,生成多个节点子集。
示例性地,分割算法可以采用Louvain算法。Louvain算法是基于模块度的社区发现算法,该算法在效率和效果上都表现较好,并且能够发现层次性的社区结构,其优化目标是最大化整个社区网络的模块度。Louvain算法的核心思想是不断地将社区折叠成一个单点,直到整体的模块度不再增加为止。
其中,Louvain算法通过以下公式表示:
Figure SMS_2
其中,m为票据关系网络图中总的边数,Aij为节点i和节点j之间的边的边权重(weight),ki为节点i的邻边权重之和,kj为节点j的邻边权重之和,Ci为节点i属于某个社区的标号,Cj为节点j属于某个社区的标号。
步骤103,对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图。
其中,由于节点子集中可能存在较多的无用节点,因此需要对节点子集中的无用节点进行去除操作,得到精简后的小社团票据关系网络图,实现去除大量无用节点,从而减少后续的计算量。通过最小生成树算法对节点子集进行计算得到最小生成树;通过k-核算法对最小生成树进行迭代剪枝以去除无用节点;根据剩余的节点生成小社团票据关系网络图。
步骤104,将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果。
在本实施例中,风险评估模型基于XGBoost模型训练得到;基于XGBoost模型训练得到的风险评估模型结合了实体的基本属性、实体所在团的属性以及实体所在团内的图指标,更全面的反应了实体所在团中的风险大小。
XGBoost模型的训练过程包括:
获取样本集D,其中,D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R),xi为第i个样本一天各个时刻的指标值,yi为第i个样本一天中指标是否存在通信异常的标签值,yi∈{0,1},0表示通信正常,1表示通信异常,n为样本数,m为样本特征数;
基于样本集D构造梯度提升树,采用CART回归树作为模型的子树模型,通过迭代的方式增加CART回归树,将所有的CART回归树合并在一起得到训练好的XGBoost模型。
XGBoost模型模型参数:
learing_rate:学习步长,一般情况下,理想的学习步长一般在0.05-0.3之间波动,本次模型的学习步长设为0.1。
n_estimators:模型对训练数据的迭代次数,范围一般为100-1000,本次模型的迭代次数为600。
max_depth:树的最大深度,值越大,模型学到的更具体更局部的样本,越大越容易出现过拟合。取值一般为3-10,本次模型的树深度设置为3。
gamma:指定节点分裂所需的最小损失函数下降值。值越大,算法越保守。本次模型此参数设置0.3。
reg_lambda:权重的L2正则化项,用于控制xgboost的正则化部分。本次模型此参数设置为8。
reg_alpha:权重的L1正则化项。本次模型此参数设置为7。
步骤105,根据所述评估结果判断所述待识别票据团伙是否存在风险。
其中,小社团票据关系网络图输入训练好的风险评估模型的输出结果为票据关系网络图中各个节点对应的企业是否为票据中介的概率值,通过将概率值与预设阈值进行比较得到评估结果,便可将风险定位在某个或者某些企业。
在一些实施例中,可根据评估结果生成报告,其中,报告包括评估结果及与评估报告对应的票据团伙信息。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
具体实施时,本申请不受所描述的各个步骤的执行顺序的限制,在不产生冲突的情况下,某些步骤还可以采用其它顺序进行或者同时进行。
由上可知,本申请实施例提供的风险票据团伙识别方法通过基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;对所述票据关系网络图进行子图切割,生成多个节点子集;对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;根据所述评估结果判断所述待识别票据团伙是否存在风险。利用本申请实施例提供的风险票据团伙识别方法,通过将票据所在票据团伙的信息构建形成票据关系网络图,再将票据关系网络图进行切割处理得到精简后的小社团票据关系网络图,实现去除大量无用节点,从而减少后续的计算量,再将小社团票据关系网络图输入训练好的风险评估模型进行判断票据所在团伙是否存在风险。
本申请实施例还提供一种风险票据团伙识别装置,所述风险票据团伙识别装置可以集成在终端设备中。
请参阅图2,图2为本申请实施例提供的风险票据团伙识别装置的结构示意图。风险票据团伙识别装置30可以包括:
构建模块31,用于基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;
切割模块32,用于对所述票据关系网络图进行子图切割,生成多个节点子集;
去除模块33,用于对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;
评估模块34,用于将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;
判断模块35,用于根据所述评估结果判断所述待识别票据团伙是否存在风险。
在一些实施例中,所述票据关系网络图包括节点数据及边数据,其中,所述票据关系网络图中的节点数据用于存储单个票据关联人对应的基本信息,所述边数据用于存储相邻两个节点数据之间的关系信息。
在一些实施例中,所述切割模块32,用于通过预设分割算法对所述票据关系网络图进行子图切割,生成多个节点子集;
所述分割算法通过以下公式表示:
Figure SMS_3
其中,m为票据关系网络图中总的边数,Aij为节点i和节点j之间的边的边权重(weight),ki为节点i的邻边权重之和,kj为节点j的邻边权重之和,Ci为节点i属于某个社区的标号,Cj为节点j属于某个社区的标号。
在一些实施例中,所述去除模块33,用于通过最小生成树算法对节点子集进行计算得到最小生成树;通过k-核算法对所述最小生成树进行迭代剪枝以去除所述无用节点;根据剩余的节点生成小社团票据关系网络图。
在一些实施例中,所述风险评估模型基于XGBoost模型训练得到;所述XGBoost模型的训练过程包括:
获取样本集D,其中,D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R),xi为第i个样本一天各个时刻的指标值,yi为第i个样本一天中指标是否存在通信异常的标签值,yi∈{0,1},0表示通信正常,1表示通信异常,n为样本数,m为样本特征数;
基于样本集D构造梯度提升树,采用CART回归树作为模型的子树模型,通过迭代的方式增加CART回归树,将所有的CART回归树合并在一起得到训练好的XGBoost模型。
在一些实施例中,所述装置还包括生成模块,用于根据所述评估结果生成报告,其中,所述报告包括评估结果及与所述评估报告对应的票据团伙信息。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现。
由上可知,本申请实施例提供的风险票据团伙识别装置30,其中构建模块31用于基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;切割模块32用于对所述票据关系网络图进行子图切割,生成多个节点子集;去除模块33用于对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;评估模块34用于将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;判断模块35用于根据所述评估结果判断所述待识别票据团伙是否存在风险。
请参阅图3,图3为本申请实施例提供的风险票据团伙识别装置的另一结构示意图,风险票据团伙识别装置30包括存储器120、一个或多个处理器180、以及一个或多个应用程序,其中该一个或多个应用程序被存储于该存储器120中,并配置为由该处理器180执行;该处理器180可以包括构建模块31,切割模块32,去除模块33,评估模块34以及判断模块35。例如,以上各个部件的结构和连接关系可以如下:
存储器120可用于存储应用程序和数据。存储器120存储的应用程序中包含有可执行代码。应用程序可以组成各种功能模块。处理器180通过运行存储在存储器120的应用程序,从而执行各种功能应用以及风险票据团伙识别。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180对存储器120的访问。
处理器180是装置的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器120内的应用程序,以及调用存储在存储器120内的数据,执行装置的各种功能和处理数据,从而对装置进行整体监控。可选的,处理器180可包括一个或多个处理核心;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等。
具体在本实施例中,处理器180会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器120中,并由处理器180来运行存储在存储器120中的应用程序,从而实现各种功能:
构建指令,用于基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;
切割指令,用于对所述票据关系网络图进行子图切割,生成多个节点子集;
去除指令,用于对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;
评估指令,用于将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;
判断指令,用于根据所述评估结果判断所述待识别票据团伙是否存在风险。
在一些实施例中,所述票据关系网络图包括节点数据及边数据,其中,所述票据关系网络图中的节点数据用于存储单个票据关联人对应的基本信息,所述边数据用于存储相邻两个节点数据之间的关系信息。
在一些实施例中,所述切割指令,用于通过预设分割算法对所述票据关系网络图进行子图切割,生成多个节点子集;
所述分割算法通过以下公式表示:
Figure SMS_4
其中,m为票据关系网络图中总的边数,Aij为节点i和节点j之间的边的边权重(weight),ki为节点i的邻边权重之和,kj为节点j的邻边权重之和,Ci为节点i属于某个社区的标号,Cj为节点j属于某个社区的标号。
在一些实施例中,所述去除指令,用于通过最小生成树算法对节点子集进行计算得到最小生成树;通过k-核算法对所述最小生成树进行迭代剪枝以去除所述无用节点;根据剩余的节点生成小社团票据关系网络图。
在一些实施例中,所述风险评估模型基于XGBoost模型训练得到;所述XGBoost模型的训练过程包括:
获取样本集D,其中,D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R),xi为第i个样本一天各个时刻的指标值,yi为第i个样本一天中指标是否存在通信异常的标签值,yi∈{0,1},0表示通信正常,1表示通信异常,n为样本数,m为样本特征数;
基于样本集D构造梯度提升树,采用CART回归树作为模型的子树模型,通过迭代的方式增加CART回归树,将所有的CART回归树合并在一起得到训练好的XGBoost模型。
在一些实施例中,所述程序还包括生成指令,用于根据所述评估结果生成报告,其中,所述报告包括评估结果及与所述评估报告对应的票据团伙信息。
本申请实施例还提供一种终端设备。所述终端设备可以是服务器、智能手机、电脑、平板电脑等设备。
请参阅图4,图4示出了本申请实施例提供的终端设备的结构示意图,该终端设备可以用于实施上述实施例中提供的风险票据团伙识别方法。该终端设备1200可以为智能手机或平板电脑。
如图4所示,终端设备1200可以包括RF(Radio Frequency,射频)电路110、包括有一个或一个以上(图中仅示出一个)计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、传输模块170、包括有一个或者一个以上(图中仅示出一个)处理核心的处理器180以及电源190等部件。本领域技术人员可以理解,图4中示出的终端设备1200结构并不构成对终端设备1200的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。RF电路110可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。RF电路110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。
存储器120可用于存储软件程序以及模块,如上述实施例中风险票据团伙识别方法对应的程序指令/模块,处理器180通过运行存储在存储器120内的软件程序以及模块,从而执行各种功能应用以及风险票据团伙识别,可以根据终端设备所处的当前场景来自动选择振动提醒模式来进行数据更新,既能够保证会议等场景不被打扰,又能保证用户可以感知来电,提升了终端设备的智能性。存储器120可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器120可进一步包括相对于处理器180远程设置的存储器,这些远程存储器可以通过网络连接至终端设备1200。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触控显示屏或者触控板,可收集用户在其上或附近的触控操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触控检测装置和触控控制器两个部分。其中,触控检测装置检测用户的触控方位,并检测触控操作带来的信号,将信号传送给触控控制器;触控控制器从触控检测装置上接收触控信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端设备1200的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid CrystalDisplay,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触控操作后,传送给处理器180以确定触控事件的类型,随后处理器180根据触控事件的类型在显示面板141上提供相应的视觉输出。虽然在图4中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
终端设备1200还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在终端设备1200移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端设备1200还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器161,传声器162可提供用户与终端设备1200之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一终端,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与终端设备1200的通信。
终端设备1200通过传输模块170(例如Wi-Fi模块)可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了传输模块170,但是可以理解的是,其并不属于终端设备1200的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是终端设备1200的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端设备1200的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;在一些实施例中,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
终端设备1200还包括给各个部件供电的电源190,在一些实施例中,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端设备1200还可以包括摄像头(如前置摄像头、后置摄像头)、蓝牙模块等,在此不再赘述。具体在本实施例中,终端设备1200的显示单元140是触控屏显示器,终端设备1200还包括有存储器120,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器120中,且经配置以由一个或者一个以上处理器180执行一个或者一个以上程序包含用于进行以下操作的指令:
构建指令,用于基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;
切割指令,用于对所述票据关系网络图进行子图切割,生成多个节点子集;
去除指令,用于对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;
评估指令,用于将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;
判断指令,用于根据所述评估结果判断所述待识别票据团伙是否存在风险。
在一些实施例中,所述票据关系网络图包括节点数据及边数据,其中,所述票据关系网络图中的节点数据用于存储单个票据关联人对应的基本信息,所述边数据用于存储相邻两个节点数据之间的关系信息。
在一些实施例中,所述切割指令,用于通过预设分割算法对所述票据关系网络图进行子图切割,生成多个节点子集;
所述分割算法通过以下公式表示:
Figure SMS_5
其中,m为票据关系网络图中总的边数,Aij为节点i和节点j之间的边的边权重(weight),ki为节点i的邻边权重之和,kj为节点j的邻边权重之和,Ci为节点i属于某个社区的标号,Cj为节点j属于某个社区的标号。
在一些实施例中,所述去除指令,用于通过最小生成树算法对节点子集进行计算得到最小生成树;通过k-核算法对所述最小生成树进行迭代剪枝以去除所述无用节点;根据剩余的节点生成小社团票据关系网络图。
在一些实施例中,所述风险评估模型基于XGBoost模型训练得到;所述XGBoost模型的训练过程包括:
获取样本集D,其中,D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R),xi为第i个样本一天各个时刻的指标值,yi为第i个样本一天中指标是否存在通信异常的标签值,yi∈{0,1},0表示通信正常,1表示通信异常,n为样本数,m为样本特征数;
基于样本集D构造梯度提升树,采用CART回归树作为模型的子树模型,通过迭代的方式增加CART回归树,将所有的CART回归树合并在一起得到训练好的XGBoost模型。
在一些实施例中,所述程序还包括生成指令,用于根据所述评估结果生成报告,其中,所述报告包括评估结果及与所述评估报告对应的票据团伙信息。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,所述计算机执行上述任一实施例所述的风险票据团伙识别方法。
需要说明的是,对本申请所述风险票据团伙识别方法而言,本领域普通测试人员可以理解实现本申请实施例所述风险票据团伙识别方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读存储介质中,如存储在终端设备的存储器中,并被该终端设备内的至少一个处理器执行,在执行过程中可包括如所述风险票据团伙识别方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)等。
对本申请实施例的所述风险票据团伙识别装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中,所述存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的风险票据团伙识别方法、装置、介质及设备进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种风险票据团伙识别方法,其特征在于,包括:
基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;
对所述票据关系网络图进行子图切割,生成多个节点子集;
对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;
将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;
根据所述评估结果判断所述待识别票据团伙是否存在风险。
2.如权利要求1所述的风险票据团伙识别方法,其特征在于,所述票据关系网络图包括节点数据及边数据,其中,所述票据关系网络图中的节点数据用于存储单个票据关联人对应的基本信息,所述边数据用于存储相邻两个节点数据之间的关系信息。
3.如权利要求1所述的风险票据团伙识别方法,其特征在于,所述对所述票据关系网络图进行子图切割,生成多个节点子集,包括:
通过预设分割算法对所述票据关系网络图进行子图切割,生成多个节点子集;
所述分割算法通过以下公式表示:
Figure FDA0003978659820000011
其中,m为票据关系网络图中总的边数,Aij为节点i和节点j之间的边的边权重(weight),ki为节点i的邻边权重之和,kj为节点j的邻边权重之和,Ci为节点i属于某个社区的标号,Cj为节点j属于某个社区的标号。
4.如权利要求1所述的风险票据团伙识别方法,其特征在于,所述对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图,包括:
通过最小生成树算法对节点子集进行计算得到最小生成树;
通过k-核算法对所述最小生成树进行迭代剪枝以去除所述无用节点;
根据剩余的节点生成小社团票据关系网络图。
5.如权利要求1所述的风险票据团伙识别方法,其特征在于,所述风险评估模型基于XGBoost模型训练得到;所述XGBoost模型的训练过程包括:
获取样本集D,其中,D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R),xi为第i个样本一天各个时刻的指标值,yi为第i个样本一天中指标是否存在通信异常的标签值,yi∈{0,1},0表示通信正常,1表示通信异常,n为样本数,m为样本特征数;
基于样本集D构造梯度提升树,采用CART回归树作为模型的子树模型,通过迭代的方式增加CART回归树,将所有的CART回归树合并在一起得到训练好的XGBoost模型。
6.如权利要求1所述的风险票据团伙识别方法,其特征在于,所述方法还包括:
根据所述评估结果生成报告,其中,所述报告包括评估结果及与所述评估报告对应的票据团伙信息。
7.一种风险票据团伙识别装置,其特征在于,所述风险票据团伙识别装置包括:
构建模块,用于基于多个票据关联人的身份信息构建待识别票据团伙的票据关系网络图;
切割模块,用于对所述票据关系网络图进行子图切割,生成多个节点子集;
去除模块,用于对所述节点子集中的无用节点进行去除操作,生成小社团票据关系网络图;
评估模块,用于将所述小社团票据关系网络图输入训练好的风险评估模型进行风险评估操作,得到评估结果;
判断模块,用于根据所述评估结果判断所述待识别票据团伙是否存在风险。
8.如权利要求7所述的风险票据团伙识别装置,其特征在于,所述票据关系网络图包括节点数据及边数据,其中,所述票据关系网络图中的节点数据用于存储单个票据关联人对应的基本信息,所述边数据用于存储相邻两个节点数据之间的关系信息。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至6任一项所述的风险票据团伙识别方法。
10.一种终端设备,其特征在于,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述指令以执行权利要求1至6任一项所述的风险票据团伙识别方法。
CN202211543112.2A 2022-12-02 2022-12-02 风险票据团伙识别方法、装置、介质及设备 Pending CN116188014A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211543112.2A CN116188014A (zh) 2022-12-02 2022-12-02 风险票据团伙识别方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211543112.2A CN116188014A (zh) 2022-12-02 2022-12-02 风险票据团伙识别方法、装置、介质及设备

Publications (1)

Publication Number Publication Date
CN116188014A true CN116188014A (zh) 2023-05-30

Family

ID=86451268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211543112.2A Pending CN116188014A (zh) 2022-12-02 2022-12-02 风险票据团伙识别方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN116188014A (zh)

Similar Documents

Publication Publication Date Title
CN108470253B (zh) 一种用户识别方法、装置及存储设备
CN110503409B (zh) 信息处理的方法以及相关装置
CN113360580A (zh) 基于知识图谱的异常事件检测方法、装置、设备及介质
CN111914180B (zh) 基于图结构的用户特征确定方法、装置、设备及介质
CN115392405A (zh) 模型训练方法、相关装置及存储介质
CN103501487A (zh) 分类器更新方法、装置、终端、服务器及系统
CN111951021B (zh) 一种可疑社团的发现方法和装置、存储介质及计算机设备
CN112232048B (zh) 一种基于神经网络的表格处理方法以及相关装置
CN111753047B (zh) 一种文本处理方法及装置
CN117115590A (zh) 基于自监督学习的内容审核模型训练方法、装置及介质
CN116307394A (zh) 产品用户体验评分方法、装置、介质及设备
CN116778306A (zh) 伪造对象检测方法、相关装置及存储介质
CN116957585A (zh) 一种数据处理方法、装置、设备和存储介质
CN116342940A (zh) 图像审批方法、装置、介质及设备
CN116167867A (zh) 基于知识图谱的保险业务风险识别方法、装置及电子设备
CN115330522A (zh) 基于聚类的信用卡审批方法、装置、电子设备和介质
CN116188014A (zh) 风险票据团伙识别方法、装置、介质及设备
CN113409096B (zh) 目标对象识别方法、装置、计算机设备及存储介质
CN117009328A (zh) 一种基于噪声过滤的模型训练方法、装置以及存储介质
CN113360908A (zh) 数据处理方法、违规识别模型训练方法及相关设备
CN115082071A (zh) 一种异常交易账户的识别方法、装置及存储介质
CN112837061B (zh) 一种数据处理方法和相关装置
CN116596653A (zh) 一种信用风险识别方法、装置、设备及存储介质
CN118691399A (zh) 一种大数据虚拟资源处理方法、装置、设备及存储介质
CN116403263A (zh) 人脸图像的异常检测方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination