CN114358911B - 开票数据风险控制方法、装置、计算机设备和存储介质 - Google Patents

开票数据风险控制方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114358911B
CN114358911B CN202210257474.9A CN202210257474A CN114358911B CN 114358911 B CN114358911 B CN 114358911B CN 202210257474 A CN202210257474 A CN 202210257474A CN 114358911 B CN114358911 B CN 114358911B
Authority
CN
China
Prior art keywords
wind control
invoicing
control rule
invoice
billing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210257474.9A
Other languages
English (en)
Other versions
CN114358911A (zh
Inventor
张民遐
邓常识
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Gaodeng Computer Technology Co ltd
Original Assignee
Shenzhen Gaodeng Computer Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Gaodeng Computer Technology Co ltd filed Critical Shenzhen Gaodeng Computer Technology Co ltd
Priority to CN202210257474.9A priority Critical patent/CN114358911B/zh
Publication of CN114358911A publication Critical patent/CN114358911A/zh
Application granted granted Critical
Publication of CN114358911B publication Critical patent/CN114358911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种开票数据风险控制方法、装置、计算机设备和存储介质,该方法包括:开票风险分析引擎对预设时间窗口内流入的开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代;确定命中的目标风控规则组所对应的目标风险等级;按照目标风险等级所对应的预警方式进行开票风险预警。本方案能提高开票预警效率。

Description

开票数据风险控制方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种开票数据风险控制方法、装置、计算机设备和存储介质。
背景技术
随着科学技术的飞速发展,各种先进技术不断涌现。在财税领域,数据的安全性至关重要,因此在财税领域的风险控制技术也越来越受到重视。如何监管好每一笔线上交易,是财税领域需要面对的一大痛点。
对于财税领域来说,传统的预警处理还是离线的,通过离线的方式对海量的开票数据进行分析,这样就会导致分析结果产出的比较晚,不够及时,从而导致风险预警也不够及时,因此,存在开票风险预警时效性差的弊端。
发明内容
基于此,有必要针对上述技术问题,提供一种避免提高时效性的开票数据风险控制方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本申请提供了一种开票数据风险控制方法。所述方法包括:
开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;
基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;
按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代;其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的;
确定命中的目标风控规则组所对应的目标风险等级;
按照所述目标风险等级所对应的预警方式进行开票风险预警。
在其中一个实施例中,所述开票数据流是用于响应开票预警任务进行预警分析所涉及的开票数据流;
所述按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代包括:
按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,在与所述当前风控规则组进行匹配时,从所述当前风控规则组包括的多个风控规则项中筛选识别出与所述开票预警任务相关的风控规则项;
将各发票风控维度下的当前累积风控计算结果分别与筛选出的风控规则项进行匹配,并在命中风控规则组后停止迭代。
在其中一个实施例中,每个风控规则项携带有相应的规则属性标签;
所述从所述当前风控规则组包括的多个风控规则项中筛选识别出与所述开票预警任务相关的风控规则项包括:
获取所述开票预警任务对应的任务描述信息;
获取所述当前风控规则组的每个风控规则项携带的规则属性标签;
将各所述规则属性标签分别与所述任务描述信息进行语义匹配,从所述当前风控规则组的多个风控规则项中筛选出与所述任务描述信息语义相匹配的风控规则项。
在其中一个实施例中,所述预设的风控规则项是从风控规则库中获取的;所述方法还包括:
监测所述风控规则库的状态;
在监测到所述风控规则库发生更新后,触发从所述风控规则库中获取实时更新后的风控规则项;
基于更新后的风控规则项更新相应风控规则组。
在其中一个实施例中,所述方法还包括:
若在预设时间窗口内流入的开票数据流满足计算触发条件,则执行所述开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次流入发票数据的步骤;
若在预设时间窗口内没有满足计算触发条件的开票数据流流入所述开票风险分析引擎中,则设置用于自动触发计算的自动触发计时器;在等待时间超过所述自动触发计时器所设定的时间的情况下,则自动触发本次风控计算以得到各发票风控维度下的本次风控计算结果。
在其中一个实施例中,所述开票风险分析引擎部署于流式计算集群中;所述开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果包括:
所述流式计算集群中运行的开票风险分析引擎,获取在预设时间窗口内从开票数据来源平台流入的开票数据流;所述开票数据来源平台存储的是从数据源服务器中获取的开票数据源;
所述开票风险分析引擎对流入的开票数据流进行数据清洗,并基于清洗后的开票数据流计算得到各发票风控维度下的本次风控计算结果。
在其中一个实施例中,所述开票数据流中包括多条开票数据;每条开票数据中包括所述开票数据的生成时间;
所述对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果包括:
针对预设时间窗口内流入的开票数据流中的多条开票数据,按照所述多条开票数据分别对应的生成时间由早到晚的顺序,对所述多条开票数据进行排序;
依次对排序后的各条开票数据进行数据加工计算,得到各发票风控维度下的本次风控计算结果。
第二方面,本申请还提供了一种开票数据风险控制装置。该装置包括:
计算模块,用于开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;
匹配模块,用于按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代;其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的;
预警模块,用于确定命中的目标风控规则组所对应的目标风险等级;按照所述目标风险等级所对应的预警方式进行开票风险预警。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;
基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;
按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代;其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的;
确定命中的目标风控规则组所对应的目标风险等级;
按照所述目标风险等级所对应的预警方式进行开票风险预警。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;
基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;
按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代;其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的;
确定命中的目标风控规则组所对应的目标风险等级;
按照所述目标风险等级所对应的预警方式进行开票风险预警。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;
基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;
按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代;其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的;
确定命中的目标风控规则组所对应的目标风险等级;
按照所述目标风险等级所对应的预警方式进行开票风险预警。
上述开票数据风险控制方法、装置、计算机设备、存储介质和计算机程序产品,开票风险分析引擎可以对预设时间窗口内流入的开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果,以对开票数据流进行流式计算,而不需要对海量开票数据整体进行计算,提高了计算效率。开票风险分析引擎按照风险等级对风控规则项进行了分组,从而以组为单位与各发票风控维度下的当前累积风控计算结果进行规则匹配,大大提高了规则匹配效率,进而提高了预警效率。进而,不同风险等级设置有不同的预警方式,可以按照匹配到的目标风控规则组所属的目标风险等级对应的预警方式进行开票风险预警。因此,在提高预警效率的基础上也提高了预警准确性。
附图说明
图1为一个实施例中开票数据风险控制方法的应用环境图;
图2为一个实施例中开票数据风险控制方法的流程示意图;
图3为另一个实施例中开票数据风险控制方法的流程示意图;
图4为一个实施例中的开票数据风险控制方法的原理简示图;
图5为一个实施例中开票数据风险控制方法的系统架构图;
图6为一个实施例中开票数据风险控制装置的结构框图;
图7为另一个实施例中开票数据风险控制装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的开票数据风险控制方法,可以应用于如图1所示的应用环境中。其中,计算集群104通过网络分别与设备102和风控规则库106进行通信。数据存储系统可以存储计算集群104需要处理的数据。数据存储系统可以集成在计算集群104上,也可以放在云上或其他网络服务器上。计算集群104中运行有开票风险分析引擎。设备102是提供开票数据的一个或多个设备。设备102可以是开票数据来源平台。
开票数据流从设备102流入计算集群104中。计算集群104所运行的开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果。开票风险分析引擎可以预先从风控规则库106中获取预设的风控规则项,并将预设的风控规则项按照风险等级进行分组。开票风险分析引擎可以按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代。开票风险分析引擎可以确定命中的目标风控规则组所对应的目标风险等级;按照所述目标风险等级所对应的预警方式进行开票风险预警。
在一个实施例中,如图2所示,提供了一种开票数据风险控制方法,该方法可以应用于计算机设备,该计算机设备可以是服务器或者其他可以进行风险控制处理的设备。该方法包括以下步骤:
步骤202,开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果。
可以理解,每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值。
开票风险分析引擎是对开票数据进行流式预警分析的流式处理引擎。发票风控维度,是对开票数据进行风险管控的维度。可以理解,评估开票数据是否存在风险,需要从多个维度来进行评估和管控,这些进行风险评估及管控的维度即为发票风控维度。为便于理解,现举例说明,比如,发票总开票量,即为一个发票风控维度,即,从总开票量来评估是否存在开票风险,以及判断是否需要进行风险管控。发票风控维度为至少一个。
具体地,开票数据可以流式地流入开票风险分析引擎中。开票风险分析引擎可以对在预设时间窗口内流入的开票数据流进行数据加工计算,得到各发票风控维度下的本次风控计算结果。可以理解,每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值。比如,针对开票总数量这一发票风控维度,基于预设时间窗口内流入的开票数据流计算的在该维度下本次风控计算结果则为本次流入的发票数量,假设预设时间窗口为3分钟,那么,计算出最近3分钟内流入的发票数量为50张,即为本次流入的发票数量。
在一个实施例中,开票风险分析引擎可以使用map、FlatMap、Filter、Reduce、KeyBy等至少一种算子对在预设时间窗口内流入的开票数据流进行数据加工处理。
可以理解,开票数据流是流入的初始数据流。开票风险分析引擎可以按照发票风控维度,并基于预设时间窗口内流入的开票数据流确定进行风控处理所需要的数据,即确定各发票风控维度下的本次风控计算结果。
开票数据流可以是对开票数据源进行数据清洗等预处理后得到的。
在一个实施例中,开票数据可以包括开具的增值税普通发票,增值税电子发票,区块链电子发票以及增值税专票等至少一种类型的发票数据。
在一个实施例中,针对一些发票风控维度,该维度下的值是可以直接从开票数据流中提取的,比如,单张发票金额,所以,开票风险分析引擎可以从开票数据流中直接提取发票风控维度下的值,作为发票风控维度下的本次风控计算结果。
在一个实施例中,针对一些发票风控维度,其值是无法直接从开票数据流中提取的,而是需要进行分析计算的,比如,开票总数量、开票总金额、预设开票公司的开票总额等,这种情况下,开票风险分析引擎则可以按照发票风控维度从开票数据流中确定所需要的数据,并基于该所需要的数据进行分析计算,得到发票风控维度下的值作为发票风控维度下的本次风控计算结果。
需要说明的是,发票风控维度并不限定于上面列举的几项,可以根据实际管控需求进行自定义设置,对此不作限定。在一个实施例中,发票风控维度还可以是对风控规则库中的风控规则项进行分析,根据分析结果自动制定生成的。
可以理解,开票风险分析引擎可以是在flink流式计算框架、SparkStream流式计算框架以及Strom流式计算框架等中任意一种或多种流式计算框架的基础上,进行开票预警相关的改进而得到的。需要说明的是,开票风险分析引擎并非通用的流式处理引擎,而是赋予了对开票数据流进行流式分析预警等功能,以通过执行本申请的方法专门针对开票数据进行流式预警处理的专用引擎。
步骤204,基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果。
其中,已累积的风控计算结果是在本次之前的流式计算中累积计算得到的风控计算结果。比如,本次是第N次对开票数据流进行流式风控计算,那么,已累积的风控计算结果则可以是第1至N-1次的各个风控计算结果累积起来得到的结果。需要说明的是,已累积的风控计算结果是在本次风控计算之前历史累积的风控计算结果。当前累积风控计算结果是在历史累积的风控计算结果的基础上,又考虑了本次风控计算结果之后的累积风控计算结果。
具体地,每次针对预设时间窗口内的开票数据流计算出各发票风控维度下的本次风控计算结果后,针对每个发票风控维度,开票风险分析引擎可以将该发票风控维度下的本次风控计算结果和该发票风控维度下已累积的风控计算结果进行结合,得到各发票风控维度下的当前累积风控计算结果。
需要说明的是,本申请中的开票风险分析引擎,会将之前计算的风控计算结果累积记录(即已累积的风控计算结果),因而每次只需针对预设时间窗口内的开票数据流进行计算,从而能快速、便捷地计算出当前累积风控计算结果,而不需要对海量数据计算,大大提高了效率。
在一个实施例中,开票风险分析引擎可以将该发票风控维度下的本次风控计算结果和该发票风控维度下已累积的风控计算结果进行相加或者汇总,得到各发票风控维度下的当前累积风控计算结果。
比如,在进行第K次风控计算时,针对每个发票风控维度,其第K次的当前累积风控计算结果等于第K次计算之前已累积的风控计算结果加上本次风控计算结果。
在其他实施例中,也不限于将同一发票风控维度下的本次风控计算结果和已累积的风控计算结果进行相加,还可以是其他能够实现二者结合的计算方式来得到当前累积风控计算结果,只要能实现综合考量本次风控计算结果和已累积的风控计算结果得到当前累积风控计算结果即可,并不限定具体的某一种或多种计算方式。
步骤206,按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代。
其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的。
具体地,运行于计算机设备的开票风险分析引擎可以从风控规则库中获取多个预设的风控规则项,并对获取多个预设的风控规则项按照风险等级进行分组,从而得到多个风控规则组。可以理解,同一风控规则组中的风控规则项风险等级相同或者相近。开票风险分析引擎可以按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与当前风控规则组中的各风控规则项进行匹配。可以理解,若与当前风控规则组中的任意一个或预设数量个风控规则项相匹配,则判定命中该当前风控规则组。若命中该当前风控规则组,则停止迭代不再继续选取下一个当前风控规则组。若未命中该当前风控规则组,则继续迭代选取对应于下一个风险等级的风控规则组作为当前风控规则组,以继续将各发票风控维度下的当前累积风控计算结果分别与当前风控规则组中的各风控规则项进行匹配。
比如,风险等级划分为三个等级,1级为风险,2级一般风险,3级严重风险。那么,每个风险等级都对应有一个风控规则组,则可以先将第3等级的风控规则组作为当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与第3等级的风控规则组中的各风控规则项进行匹配,如果未命中,则继续将第2等级的风控规则组作为当前风控规则组,如果命中第2等级的风控规则组,则停止迭代匹配。
在一个实施例中,若任意发票风控维度下的当前累积风控计算结果命中该当前风控规则组中的任意风控规则项,则判定命中该当前风控规则组。
步骤208,确定命中的目标风控规则组所对应的目标风险等级。
其中,目标风控规则组是命中的风控规则组,即,与各发票风控维度下的当前累积风控计算结果匹配到的风控规则项所位于的风控规则组。
可以理解,是依据风险等级对风控规则项进行分组的,所以,每个风控规则组具有对应的风险等级,因而,可以在确定命中的目标风控规则组后,确定命中的目标风控规则组所对应的目标风险等级。
步骤210,按照目标风险等级所对应的预警方式进行开票风险预警。
需要说明的是,不同的风险等级意味着不同的开票风险程度,对不同风险等级进行区别化预警处理能够一定程度上节省资源,也能更准确地进行预警。所以,本申请中针对不同的风险等级设置有不同的预警方式,开票风险分析引擎可以确定目标风险等级所对应的预警方式,并按照该预警方式进行开票风险预警。
为便于理解,现举例说明,假设2021-12-01至2021-12-31 期间,风控规则项为开票总数量的预警阈值为5千张,开票总数量这一维度下的当前累积风控计算结果为开票总数量为1万张,那么,则命中该风控规则项,进而需要确定该风控规则项对应的目标风险等级,假设为3级,则需要按照3级风险等级所对应的预警方式来进行重点预警。
上述开票数据风险控制方法,开票风险分析引擎可以对预设时间窗口内流入的开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果,以对开票数据流进行流式计算,而不需要对海量开票数据整体进行计算,提高了计算效率。开票风险分析引擎按照风险等级对风控规则项进行了分组,从而以组为单位与各发票风控维度下的当前累积风控计算结果进行规则匹配,大大提高了规则匹配效率,进而提高了预警效率。进而,不同风险等级设置有不同的预警方式,可以按照匹配到的目标风控规则组所属的目标风险等级对应的预警方式进行开票风险预警。因此,在提高预警效率的基础上也提高了预警准确性。
在一个实施例中,开票数据流是用于响应开票预警任务进行预警分析所涉及的开票数据流。步骤206按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代包括:按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,在与所述当前风控规则组进行匹配时,从所述当前风控规则组包括的多个风控规则项中筛选识别出与所述开票预警任务相关的风控规则项;将各发票风控维度下的当前累积风控计算结果分别与筛选出的风控规则项进行匹配,并在命中风控规则组后停止迭代。
其中,开票预警任务是指定的进行开票预警的任务。用户可以根据业务需求指定不同的开票预警任务,以进行区分化、针对性地进行预警处理。不同的开票预警任务有着不同的开票预警要求。
可以理解,用户可以根据业务需求指定开票预警任务,开票风险分析引擎在接收到该开票预警任务后,可以流式地分析在预设时间窗口内流入的开票数据流,以针对该开票预警任务进行相应的预警分析处理。
具体地,计算机设备可以通过开票风险分析引擎对预设时间窗口内的流入的开票数据流计算得到各发票风控维度下的本次风控计算结果之后,可以基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果,按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组。在将各发票风控维度下的当前累积风控计算结果与当前风控规则组进行匹配时,计算机设备可以通过开票风险分析引擎从所述当前风控规则组包括的多个风控规则项中筛选识别出与所述开票预警任务相关的风控规则项,然后,将各发票风控维度下的当前累积风控计算结果分别与筛选出的风控规则项进行匹配,并在命中风控规则组后停止迭代。
可以理解,每个风控规则组中包括多个相同或相近风险等级的风控规则项,然而,其中有些风控规则项与开票预警任务可能并没有很大的关联关系,即,一个风控规则组中可能存在一些与开票预警任务关联性不大的风控规则项。比如,用户比较在意的是对开票数量的预警,对开票公司所处的区域并不限制。那么,这些关联性不大的风控规则项对开票预警任务就起不到重要的预警作用,如果还用这些关联性不大的风控规则项进行规则匹配,实际上对开票预警任务就起不到重要的预警作用,只会浪费一些计算匹配资源。因此,本申请的方案中能够对风控规则组进行规则项的筛选,只从中筛选出与开票预警任务相关的风控规则项来进行匹配,从而节省了计算机资源,一定程度上也能提高规则匹配效率,进而提高预警效率。
如图3所示,在一个实施例中,提供了另一种该开票数据风险控制方法,包括以下步骤:
步骤302,开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;该开票数据流是用于响应开票预警任务进行预警分析所涉及的开票数据流。
步骤304,基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果。
步骤306,按照各风控规则组对应的风险等级由高到低的顺序,迭代选取当前风控规则组。
可以理解,在与所述当前风控规则组进行匹配时,执行步骤308-312。
步骤308,获取所述当前风控规则组的每个风控规则项携带的规则属性标签。
可以理解,每个风控规则项携带有相应的规则属性标签;所述规则属性标签用于描述所述风控规则项所要管控的发票维度信息。即规则属性标签描述了要管控发票哪些方面的信息。
步骤310,将各所述规则属性标签分别与开票预警任务的任务描述信息进行语义匹配,从所述当前风控规则组的多个风控规则项中筛选出与所述任务描述信息语义相匹配的风控规则项。
具体地,计算机设备可以通过开票风险分析引擎分别对当前风控规则组中的各个风控规则项进行语义识别,以及对开票预警任务的任务描述信息进行语义识别,然后,将各个风控规则项的语义识别结果与任务描述信息的语义识别结果进行匹配,以从所述当前风控规则组的多个风控规则项中筛选出与所述任务描述信息语义相匹配的风控规则项。
步骤312,将各发票风控维度下的当前累积风控计算结果分别与筛选出的风控规则项进行匹配。
可以理解,若命中风控规则组后停止迭代,若未命中风控规则组,则按序选取下一个风控规则组作为当前风控规则组。
步骤314,确定命中的目标风控规则组所对应的目标风险等级;按照所述目标风险等级所对应的预警方式进行开票风险预警。
上述实施例中,将当前风控规则组的多个风控规则项的规则属性标签分别与开票预警任务的任务描述信息进行语义匹配,能够准确、快速地从当前风控规则组中筛选出与所述任务描述信息语义相匹配的风控规则项,从而节省了计算机资源,一定程度上也能提高规则匹配效率,进而提高预警效率。
在一个实施例中,所述预设的风控规则项是从风控规则库中获取的。该方法还包括:监测所述风控规则库的状态;在监测到所述风控规则库发生更新后,触发从所述风控规则库中获取实时更新后的风控规则项;基于更新后的风控规则项更新相应风控规则组。
其中,风控规则库是预先设置风控规则的库。
具体地,开票风险分析引擎还可以对风控规则库的更新状态进行监测。在监测到所述风控规则库发生更新后,则自动触发从所述风控规则库中获取实时更新后的风控规则项。开票风险分析引擎可以基于更新后的风控规则项更新相应风控规则组,即基于更新后的风控规则项更新确定风控规则组的划分。
在其他实施例中,也可以是由风控规则库自动地将更新后的风控规则项推送至开票风险分析引擎,以触发开票风险分析引擎基于更新后的风控规则项更新相应风控规则组。对此不限定。
在一个实施例中,开票风险分析引擎还可以对规则设置关联信息自动地进行规则智能化分析,以动态更新规则项。动态更新规则项可以包括动态生成新的规则项、动态更新已有规则项的值和动态删减规则项中的至少一种,比如,动态更新风控阈值即属于动态更新已有规则项的值。其中,规则设置关联信息是与发票风控规则相关的信息。在一个实施例中,规则设置关联信息可以从业务指示信息和颁发的业务制度信息中进行学习和提取。具体地,可以预先训练一个信息提取模型,从业务指示信息和颁发的业务制度信息中提取规则设置关联信息,并对规则设置关联信息进行分析,以动态更新规则项。动态更新规则项可以更加及时准确地对开票数据进行风险预警。
可以理解,本申请实施例中的开票风险分析引擎具有对规则库的更新状态实时监测能力,从而能够在规则变更后能及时地更新风控规则组,进而提高了后续的风险预警准确性。
在一个实施例中,该方法还包括:若在预设时间窗口内流入的开票数据流满足计算触发条件,则执行步骤202,即执行所述开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次流入发票数据的步骤。若在预设时间窗口内没有满足计算触发条件的开票数据流流入所述开票风险分析引擎中,则设置用于自动触发计算的自动触发计时器;在等待时间超过所述自动触发计时器所设定的时间的情况下,则自动触发本次风控计算以得到各发票风控维度下的本次风控计算结果。
具体地,开票风险分析引擎在进行对开票数据进行流式处理时,若预设时间窗口内流入的开票数据流满足计算触发条件,即预设时间窗口内流入的开票数据流可以进行本次的风控计算,则对预设窗口内流入的开票数据流进行数据加工计算得到各发票风控维度下的本次流入发票数据。但是有些情况下,预设时间窗口内没有开票数据流入开票风险分析引擎或者流入的开票数据不能用来进行本次的风控计算,即,不满足计算触发条件。这种情况下,如果继续再等待一个或多个时间窗口就可能会对后续的计算造成影响,因此,本申请设置了一个用于自动触发计算的自动触发计时器,该自动触发计时器设定了一个自动触发计算的时间,在等待时间超过所述自动触发计时器所设定的时间的情况下,则自动触发本次风控计算以得到各发票风控维度下的本次风控计算结果。
比如,预设时间窗口为5分钟,如果5分钟内没有满足计算触发条件的开票数据流流入开票风险分析引擎中,则可以设置自动触发计时器,在等待一定时间后就自动触发计算。
图4为一个实施例中的开票数据风险控制方法的原理简示图。开票数据接入开票风险分析引擎,开票风险分析引擎按照预设时间窗口(Window)来触发风控计算,输出计算结果,即输出各发票风控维度下的当前累积风控计算结果。如果预设时间窗口内没有触发计算的开票数据流入的话,则通过设置自动触发计时器来自动触发计算。开票风险分析引擎可以对风控规则库中的风控规则项按照风险等级分组,并按照风险等级由高到低的顺序,依次将各发票风控维度下的当前累积风控计算结果与各个风控规则组进行匹配,按照命中的风控规则组所属目标风险等级对应预警方式来进行针对性地、准确地进行开票风险预警。
上述实施例中,通过设置触发计时器,能够在预设时间窗口内的开票数据流无法满足计算触发条件的情况下自动触发计算,避免了等待过长对后续计算造成的影响,维护了计算性能。
在一个实施例中,所述开票风险分析引擎部署于流式计算集群中;所述开票风险分析引擎获取在预设时间窗口内流入的开票数据流包括:所述流式计算集群中运行的开票风险分析引擎,获取在预设时间窗口内从开票数据来源平台流入的开票数据流;所述开票数据来源平台存储的是从数据源服务器中获取的开票数据源;所述开票风险分析引擎对流入的开票数据流进行数据清洗,并基于清洗后的开票数据流计算得到各发票风控维度下的本次风控计算结果。
具体地,数据源服务器中存储了原始的开票数据源,即数据源服务器是开票数据的原始存储位置。为了不影响数据源服务器的正常运行,可以将数据源服务器中存储的原始的开票数据源存储至开票数据来源平台。开票数据来源平台相当于将开票源数据作中转存储,以与开票风险分析引擎进行对接。开票数据来源平台可以将存储的开票数据流式地流入所述流式计算集群中;流式计算集群中运行的开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对流入的开票数据流进行数据清洗。然后,基于清洗后的开票数据流计算得到各发票风控维度下的本次风控计算结果。
在一个实施例中,开票数据来源平台可以是基于消息组件实现的分布式消息平台、关系数据库、NoSQL数据库,内存数据库甚至文件类型等,只要能存储开票数据,向开票风险分析引擎接入开票数据即可。
在一个实施例中,开票风险分析引擎可以通过设定的规则或算法对开票数据源中的开票数据进行清洗。
图5为一个实施例中开票数据风险控制方法的系统架构图。从图5可知,数据源服务器中的开票数据源在开票数据来源平台存储。开票数据来源平台可以是基于kafka消息组件实现的分布式流式消息平台。然后流入流式计算集群中,部署于流式计算集群中的开票风险分析引擎则可以对流入的开票数据流进行数据清洗。开票风险分析引擎还可以从风控规则库中获取预设的风控规则项,并按照风险等级进行分组。开票风险分析引擎可以通过执行本申请各实施例的方法基于清洗后的开票数据流进行一系列分析,得到目标风险等级,并按照所述目标风险等级所对应的预警方式进行开票风险预警。可以理解,开票风险分析引擎还可以将清洗后的开票数据存储至存储数据库,以便于后续的使用。
上述实施例中,开票风险分析引擎从开票数据来源平台获取开票数据流,避免了风控分析对数据源服务器的影响,从而减少了对系统性能影响。此外,开票风险分析引擎还可以对流入的开票数据流进行数据清洗,并基于清洗后的开票数据流计算得到各发票风控维度下的本次风控计算结果,提高了风控计算结果的准确性,进而提高了后续开票风险预警的准确性。
在一个实施例中,所述开票数据流中包括多条开票数据;每条开票数据中包括所述开票数据的生成时间。本实施例中,步骤202对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果包括:针对预设时间窗口内流入的开票数据流中的多条开票数据,按照所述多条开票数据分别对应的生成时间由早到晚的顺序,对所述多条开票数据进行排序;依次对排序后的各条开票数据进行数据加工计算,得到各发票风控维度下的本次风控计算结果。
其中,开票数据的生成时间是开票数据在业务方的真实发生时间。
可以理解,数据的时间除了生成时间还包括进入计算系统的时间以及在系统中被处理的时间。通常这些时间都会比生成时间要晚一些。传统方法中在进行数据处理时,都会默认按照数据在系统中被处理的时间来进行处理,在处理流式数据时如果默认按照数据在系统中被处理的时间来进行处理,就可能会因为数据传输过程中可能出现的问题导致时间乱序。因此,本申请在对开票数据流进行计算处理时,不再按照系统默认时间来进行处理,而是专门编写了一套处理逻辑,即,针对预设时间窗口内流入的开票数据流中的多条开票数据,按照所述多条开票数据分别对应的生成时间由早到晚的顺序,对所述多条开票数据进行排序;依次对排序后的各条开票数据进行数据加工计算,得到各发票风控维度下的本次风控计算结果。从而提高了开票数据处理的准确性,进而提高了后续开票预警的准确性,满足了开票数据的高安全性要求。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,本申请各实施例中的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种开票数据风险控制装置600,该装置包括:
计算模块602,用于开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;
匹配模块604,用于按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,将各发票风控维度下的当前累积风控计算结果分别与所述当前风控规则组中的各风控规则项进行匹配,并在命中风控规则组后停止迭代;其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的;
预警模块606,用于确定命中的目标风控规则组所对应的目标风险等级;按照所述目标风险等级所对应的预警方式进行开票风险预警。
在一个实施例中,所述开票数据流是用于响应开票预警任务进行预警分析所涉及的开票数据流;匹配模块604还用于按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,在与所述当前风控规则组进行匹配时,从所述当前风控规则组包括的多个风控规则项中筛选识别出与所述开票预警任务相关的风控规则项;将各发票风控维度下的当前累积风控计算结果分别与筛选出的风控规则项进行匹配,并在命中风控规则组后停止迭代。
在一个实施例中,每个风控规则项携带有相应的规则属性标签;匹配模块604还用于获取所述开票预警任务对应的任务描述信息;获取所述当前风控规则组的每个风控规则项携带的规则属性标签;将各所述规则属性标签分别与所述任务描述信息进行语义匹配,从所述当前风控规则组的多个风控规则项中筛选出与所述任务描述信息语义相匹配的风控规则项。
如图7所示,在一个实施例中,所述预设的风控规则项是从风控规则库中获取的。该装置还包括:
更新模块603,用于监测所述风控规则库的状态;在监测到所述风控规则库发生更新后,触发从所述风控规则库中获取实时更新后的风控规则项;基于更新后的风控规则项更新相应风控规则组。
在一个实施例中,计算模块602还用于若在预设时间窗口内流入的开票数据流满足计算触发条件,则执行所述开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次流入发票数据的步骤;若在预设时间窗口内没有满足计算触发条件的开票数据流流入所述开票风险分析引擎中,则设置用于自动触发计算的自动触发计时器;在等待时间超过所述自动触发计时器所设定的时间的情况下,则自动触发本次风控计算以得到各发票风控维度下的本次风控计算结果。
在一个实施例中,计算模块602还用于所述流式计算集群中运行的开票风险分析引擎,获取在预设时间窗口内从开票数据来源平台流入的开票数据流;所述开票数据来源平台存储的是从数据源服务器中获取的开票数据源;所述开票风险分析引擎对流入的开票数据流进行数据清洗,并基于清洗后的开票数据流计算得到各发票风控维度下的本次风控计算结果。
在一个实施例中,所述开票数据流中包括多条开票数据;每条开票数据中包括所述开票数据的生成时间;计算模块602还用于针对预设时间窗口内流入的开票数据流中的多条开票数据,按照所述多条开票数据分别对应的生成时间由早到晚的顺序,对所述多条开票数据进行排序;依次对排序后的各条开票数据进行数据加工计算,得到各发票风控维度下的本次风控计算结果。
上述开票数据风险控制装置,开票风险分析引擎可以对预设时间窗口内流入的开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果,以对开票数据流进行流式计算,而不需要对海量开票数据整体进行计算,提高了计算效率。开票风险分析引擎按照风险等级对风控规则项进行了分组,从而以组为单位与各发票风控维度下的当前累积风控计算结果进行规则匹配,大大提高了规则匹配效率,进而提高了预警效率。进而,不同风险等级设置有不同的预警方式,可以按照匹配到的目标风控规则组所属的目标风险等级对应的预警方式进行开票风险预警。因此,在提高预警效率的基础上也提高了预警准确性。
关于开票数据风险控制装置的具体限定可以参见上文中对于开票数据风险控制方法的限定,在此不再赘述。上述开票数据风险控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器或终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储开票数据风险控制数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种开票数据风险控制方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种开票数据风险控制方法,其特征在于,包括:
开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;所述开票数据流是用于响应开票预警任务进行预警分析所涉及的开票数据流;开票预警任务是指定的进行开票预警的任务;不同的开票预警任务有着不同的开票预警要求;
基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;
按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,在与所述当前风控规则组进行匹配时,获取所述开票预警任务对应的任务描述信息;获取所述当前风控规则组的每个风控规则项携带的规则属性标签;将各所述规则属性标签分别与所述任务描述信息进行语义匹配,从所述当前风控规则组的多个风控规则项中筛选出与所述任务描述信息语义相匹配的风控规则项,将各发票风控维度下的当前累积风控计算结果分别与筛选出的各风控规则项进行匹配,并在命中风控规则组后停止迭代;其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的;每个风险等级都对应有一个风控规则组;
确定命中的目标风控规则组所对应的目标风险等级;
按照所述目标风险等级所对应的预警方式进行开票风险预警。
2.根据权利要求1所述的方法,其特征在于,所述预设的风控规则项是从风控规则库中获取的;所述方法还包括:
监测所述风控规则库的状态;
在监测到所述风控规则库发生更新后,触发从所述风控规则库中获取实时更新后的风控规则项;
基于更新后的风控规则项更新相应风控规则组。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若在预设时间窗口内流入的开票数据流满足计算触发条件,则执行所述开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次流入发票数据的步骤;
若在预设时间窗口内没有满足计算触发条件的开票数据流流入所述开票风险分析引擎中,则设置用于自动触发计算的自动触发计时器;在等待时间超过所述自动触发计时器所设定的时间的情况下,则自动触发本次风控计算以得到各发票风控维度下的本次风控计算结果。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述开票风险分析引擎部署于流式计算集群中;所述开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果包括:
所述流式计算集群中运行的开票风险分析引擎,获取在预设时间窗口内从开票数据来源平台流入的开票数据流;所述开票数据来源平台存储的是从数据源服务器中获取的开票数据源;
所述开票风险分析引擎对流入的开票数据流进行数据清洗,并基于清洗后的开票数据流计算得到各发票风控维度下的本次风控计算结果。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述开票数据流中包括多条开票数据;每条开票数据中包括所述开票数据的生成时间;
所述对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果包括:
针对预设时间窗口内流入的开票数据流中的多条开票数据,按照所述多条开票数据分别对应的生成时间由早到晚的顺序,对所述多条开票数据进行排序;
依次对排序后的各条开票数据进行数据加工计算,得到各发票风控维度下的本次风控计算结果。
6.一种开票数据风险控制装置,其特征在于,所述装置包括:
计算模块,用于开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次风控计算结果;每个发票风控维度下的本次风控计算结果,是本次计算出的该发票风控维度下的值;基于同一发票风控维度下的本次风控计算结果和已累积的风控计算结果,得到各发票风控维度下的当前累积风控计算结果;所述开票数据流是用于响应开票预警任务进行预警分析所涉及的开票数据流;开票预警任务是指定的进行开票预警的任务;不同的开票预警任务有着不同的开票预警要求;
匹配模块,用于按照各风控规则组对应的风险等级由高到低的顺序迭代选取当前风控规则组,在与所述当前风控规则组进行匹配时,获取所述开票预警任务对应的任务描述信息;获取所述当前风控规则组的每个风控规则项携带的规则属性标签;将各所述规则属性标签分别与所述任务描述信息进行语义匹配,从所述当前风控规则组的多个风控规则项中筛选出与所述任务描述信息语义相匹配的风控规则项,将各发票风控维度下的当前累积风控计算结果分别与筛选出的各风控规则项进行匹配,并在命中风控规则组后停止迭代;其中,各风控规则组是将预设的风控规则项按照风险等级进行分组得到的;每个风险等级都对应有一个风控规则组;
预警模块,用于确定命中的目标风控规则组所对应的目标风险等级;按照所述目标风险等级所对应的预警方式进行开票风险预警。
7.根据权利要求6所述的装置,其特征在于,所述预设的风控规则项是从风控规则库中获取的;所述装置还包括:
更新模块,用于监测所述风控规则库的状态;在监测到所述风控规则库发生更新后,触发从所述风控规则库中获取实时更新后的风控规则项;基于更新后的风控规则项更新相应风控规则组。
8.根据权利要求6所述的装置,其特征在于,所述计算模块还用于若在预设时间窗口内流入的开票数据流满足计算触发条件,则执行所述开票风险分析引擎获取在预设时间窗口内流入的开票数据流,并对所述开票数据流进行数据加工计算得到各发票风控维度下的本次流入发票数据的步骤;若在预设时间窗口内没有满足计算触发条件的开票数据流流入所述开票风险分析引擎中,则设置用于自动触发计算的自动触发计时器;在等待时间超过所述自动触发计时器所设定的时间的情况下,则自动触发本次风控计算以得到各发票风控维度下的本次风控计算结果。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述计算模块还用于流式计算集群中运行的开票风险分析引擎,获取在预设时间窗口内从开票数据来源平台流入的开票数据流;所述开票数据来源平台存储的是从数据源服务器中获取的开票数据源;所述开票风险分析引擎对流入的开票数据流进行数据清洗,并基于清洗后的开票数据流计算得到各发票风控维度下的本次风控计算结果。
10.根据权利要求6至8中任一项所述的装置,其特征在于,所述开票数据流中包括多条开票数据;每条开票数据中包括所述开票数据的生成时间;所述计算模块还用于针对预设时间窗口内流入的开票数据流中的多条开票数据,按照所述多条开票数据分别对应的生成时间由早到晚的顺序,对所述多条开票数据进行排序;依次对排序后的各条开票数据进行数据加工计算,得到各发票风控维度下的本次风控计算结果。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN202210257474.9A 2022-03-16 2022-03-16 开票数据风险控制方法、装置、计算机设备和存储介质 Active CN114358911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210257474.9A CN114358911B (zh) 2022-03-16 2022-03-16 开票数据风险控制方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210257474.9A CN114358911B (zh) 2022-03-16 2022-03-16 开票数据风险控制方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN114358911A CN114358911A (zh) 2022-04-15
CN114358911B true CN114358911B (zh) 2022-08-02

Family

ID=81095265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210257474.9A Active CN114358911B (zh) 2022-03-16 2022-03-16 开票数据风险控制方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114358911B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590216A (zh) * 2015-11-18 2016-05-18 中国银联股份有限公司 实时监控交易风险的方法及系统
CN110298547A (zh) * 2019-05-24 2019-10-01 深圳壹账通智能科技有限公司 风险评估方法、装置、计算机装置及存储介质
CN112966497A (zh) * 2021-04-22 2021-06-15 中国建设银行股份有限公司 风险识别系统、方法、服务器及存储介质
CN113052516A (zh) * 2021-05-31 2021-06-29 深圳高灯计算机科技有限公司 一种基于流式计算的风控方法、系统及设备
CN114116802A (zh) * 2021-11-26 2022-03-01 南京星云数字技术有限公司 Flink计算框架的数据处理方法、装置、设备和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110349013A (zh) * 2019-07-12 2019-10-18 蔷薇智慧科技有限公司 风险控制方法及装置
CN114170025A (zh) * 2021-12-10 2022-03-11 中国建设银行股份有限公司 一种风险等级确定方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590216A (zh) * 2015-11-18 2016-05-18 中国银联股份有限公司 实时监控交易风险的方法及系统
CN110298547A (zh) * 2019-05-24 2019-10-01 深圳壹账通智能科技有限公司 风险评估方法、装置、计算机装置及存储介质
CN112966497A (zh) * 2021-04-22 2021-06-15 中国建设银行股份有限公司 风险识别系统、方法、服务器及存储介质
CN113052516A (zh) * 2021-05-31 2021-06-29 深圳高灯计算机科技有限公司 一种基于流式计算的风控方法、系统及设备
CN114116802A (zh) * 2021-11-26 2022-03-01 南京星云数字技术有限公司 Flink计算框架的数据处理方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN114358911A (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN108537544B (zh) 一种交易系统实时监控方法及其监控系统
CN109345377B (zh) 一种数据实时处理系统及数据实时处理方法
US20170109676A1 (en) Generation of Candidate Sequences Using Links Between Nonconsecutively Performed Steps of a Business Process
CN109120429B (zh) 一种风险识别方法及系统
US20170109667A1 (en) Automaton-Based Identification of Executions of a Business Process
CN112579728B (zh) 基于海量数据全文检索的行为异常识别方法及装置
US20170109636A1 (en) Crowd-Based Model for Identifying Executions of a Business Process
CN109120428B (zh) 一种用于风控分析的方法及系统
CN109213752A (zh) 一种基于cim的数据清洗转换方法
CN110471945B (zh) 活跃数据的处理方法、系统、计算机设备和存储介质
US20170109638A1 (en) Ensemble-Based Identification of Executions of a Business Process
CN103425564A (zh) 一种智能手机软件使用预测方法
CN111666978B (zh) 一种it系统运维大数据的智能故障预警系统
CN110956278A (zh) 重新训练机器学习模型的方法和系统
CN109308290A (zh) 一种基于cim的高效数据清洗转换方法
CN116244367A (zh) 一种基于多模型的自定义算法的可视化大数据分析平台
CN107871055B (zh) 一种数据分析方法和装置
US20170109640A1 (en) Generation of Candidate Sequences Using Crowd-Based Seeds of Commonly-Performed Steps of a Business Process
CN114116872A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN114358911B (zh) 开票数据风险控制方法、装置、计算机设备和存储介质
US20170109637A1 (en) Crowd-Based Model for Identifying Nonconsecutive Executions of a Business Process
CN116827950A (zh) 云资源的处理方法、装置、设备及存储介质
CN115470279A (zh) 基于企业数据的数源转换方法、装置、设备及介质
CN115168509A (zh) 风控数据的处理方法及装置、存储介质、计算机设备
CN114756602A (zh) 实时流式的流程挖掘方法和系统及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant