CN114065194A - 异常接口申请的检测方法及其装置、电子设备及存储介质 - Google Patents
异常接口申请的检测方法及其装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114065194A CN114065194A CN202111398221.5A CN202111398221A CN114065194A CN 114065194 A CN114065194 A CN 114065194A CN 202111398221 A CN202111398221 A CN 202111398221A CN 114065194 A CN114065194 A CN 114065194A
- Authority
- CN
- China
- Prior art keywords
- application
- abnormal
- interface
- data
- interface application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/554—Detecting local intrusion or implementing counter-measures involving event detection and direct action
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种异常接口申请的检测方法及其装置、电子设备及存储介质,涉及大数据技术领域,其中,该检测方法包括:获取历史过程中涉及接口申请的申请数据,从申请数据中提取关联规则集,基于关联规则集,确定异常申请判定策略,其中,异常申请判定策略用于检测异常的接口申请。本发明解决了相关技术中无法自动检测异常接口申请,导致检测效率和准确性较低的技术问题。
Description
技术领域
本发明涉及数据挖掘技术领域,具体而言,涉及一种异常接口申请的检测方法及其装置、电子设备及存储介质。
背景技术
目前,许多应用APP涉及诸如交易、转账、支付、信息查询等功能,为支持此类应用APP的开发,许多金融机构已对外开放部分API(应用程序接口)调用接口,应用APP可向金融机构申请使用特定的API以实现其相应功能。
然而,相关技术中,API申请主要由金融机构的内部审计部门进行人工审批无法自动检测异常接口申请,这种审批方式不仅执行效率低,同时也容易忽视部分应用APP的非法申请行为。例如,可能存在部分应用APP非法申请了与其主要功能不相关的API,从而造成信息泄露。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种异常接口申请的检测方法及其装置、电子设备及存储介质,以至少解决相关技术中无法自动检测异常接口申请,导致检测效率和准确性较低的技术问题。
根据本发明实施例的一个方面,提供了一种异常接口申请的检测方法,包括:获取历史过程中涉及接口申请的申请数据,其中,所述接口申请是指外部设备的应用程序申请调用本地金融机构的应用程序接口API的请求行为;从所述申请数据中提取关联规则集;基于所述关联规则集,确定异常申请判定策略,其中,所述异常申请判定策略用于检测异常的接口申请。
可选地,在获取历史过程中涉及接口申请的申请数据之后,所述检测方法还包括:分析所述申请数据,提取满足清洗条件的所述申请数据中的接口申请;删除满足清洗条件的所有接口申请。
可选地,在删除满足清洗条件的所有接口申请之后,所述检测方法还包括:接收数据格式转换任务;获取所述申请数据中每个所述接口申请的数据格式,其中,所述数据格式至少包括:接口名称;将所述接口申请的接口名称映射为正整数,以完成所述接口申请的数据格式转换任务。
可选地,从所述申请数据中提取关联规则集,包括:获取所述申请数据中每个所述接口申请所包含的API;提取接口支持度大于等于最小支持度的API,得到常用项集合;基于所述常用项集合,生成所述关联规则集。
可选地,基于所述常用项集合,生成所述关联规则集,包括:对于每个所述常用项集合,产生所述常用项集合的所有非空子集;计算每个所述非空子集的支持度与所述常用项集合的支持度之间的支持度比值;在所述支持度比值大于等于最小置信度阈值的情况下,则确定每个所述非空子集与所述常用项集合之间的关联规则,得到关联规则集。
可选地,在基于所述关联规则集,确定异常申请判定策略之后,所述检测方法还包括:采用第一类异常申请判定策略确定负相关模式的满足条件;组合每两个所述常用项集合,得到常用项并集;检测每两个所述常用项集合对应的常用项并集是否为负相关模式;在所述常用项并集是负相关模式的情况下,确定包含所述常用项并集的接口申请为异常的接口申请。
可选地,在基于所述关联规则集,确定异常申请判定策略之后,所述检测方法还包括:采用第二类异常申请判定策略确定支持度阈值,其中,所述支持度阈值大于最小支持度;分析当前接口申请中支持度小于所述支持度阈值的API,得到第一类接口;检测所述关联规则集中是否存在支持第一类接口的当前接口申请的规则;在所述关联规则集中不存在支持第一类接口的当前接口申请的规则的情况下,确定所述当前接口申请为异常的接口申请。
可选地,在基于所述关联规则集,确定异常申请判定策略之后,所述检测方法还包括:拆分经过清洗的申请数据,得到数据训练集和数据测试集;采用异常申请判定策略和所述数据训练集构建异常申请分析模型,其中,所述异常申请分析模型用于分析待检测的接口申请是否为异常的接口申请;运行所述数据测试集,以确定所述异常申请分析模型的模型泛化参数,其中,所述模型泛化参数用于评估所述异常申请分析模型在检测异常接口申请时的准确度。
根据本发明实施例的另一方面,还提供了一种异常接口申请的检测装置,包括:获取单元,用于获取历史过程中涉及接口申请的申请数据,其中,所述接口申请是指外部设备的应用程序申请调用本地金融机构的应用程序接口API的请求行为;提取单元,用于从所述申请数据中提取关联规则集;确定单元,用于基于所述关联规则集,确定异常申请判定策略,其中,所述异常申请判定策略用于检测异常的接口申请。
可选地,所述检测装置还包括:第一分析模块,用于在获取历史过程中涉及接口申请的申请数据之后,分析所述申请数据,提取满足清洗条件的所述申请数据中的接口申请;第一删除模块,用于删除满足清洗条件的所有接口申请。
可选地,所述检测装置还包括:第一接收模块,用于在删除满足清洗条件的所有接口申请之后,接收数据格式转换任务;第一获取模块,用于获取所述申请数据中每个所述接口申请的数据格式,其中,所述数据格式至少包括:接口名称;第一映射模块,用于将所述接口申请的接口名称映射为正整数,以完成所述接口申请的数据格式转换任务。
可选地,所述提取单元包括:第二获取模块,用于获取所述申请数据中每个所述接口申请所包含的API;第一提取模块,用于提取接口支持度大于等于最小支持度的API,得到常用项集合;第一生成模块,用于基于所述常用项集合,生成所述关联规则集。
可选地,所述第一生成模块包括:第一产生子模块,用于对于每个所述常用项集合,产生所述常用项集合的所有非空子集;第一计算子模块,用于计算每个所述非空子集的支持度与所述常用项集合的支持度之间的支持度比值;第一确定子模块,用于在所述支持度比值大于等于最小置信度阈值的情况下,则确定每个所述非空子集与所述常用项集合之间的关联规则,得到关联规则集。
可选地,所述检测装置还包括:第一采用模块,用于在基于所述关联规则集,确定异常申请判定策略之后,采用第一类异常申请判定策略确定负相关模式的满足条件;第一组合模块,用于组合每两个所述常用项集合,得到常用项并集;第一检测模块,用于检测每两个所述常用项集合对应的常用项并集是否为负相关模式;第一确定模块,用于在所述常用项并集是负相关模式的情况下,确定包含所述常用项并集的接口申请为异常的接口申请。
可选地,所述检测装置还包括:第二采用模块,用于在基于所述关联规则集,确定异常申请判定策略之后,采用第二类异常申请判定策略确定支持度阈值,其中,所述支持度阈值大于最小支持度;第二分析模块,用于分析当前接口申请中支持度小于所述支持度阈值的API,得到第一类接口;第二检测模块,用于检测所述关联规则集中是否存在支持第一类接口的当前接口申请的规则;第二确定模块,用于在所述关联规则集中不存在支持第一类接口的当前接口申请的规则的情况下,确定所述当前接口申请为异常的接口申请。
可选地,所述检测装置还包括:第一拆分模块,用于在基于所述关联规则集,确定异常申请判定策略之后,拆分经过清洗的申请数据,得到数据训练集和数据测试集;第三采用模块,用于采用异常申请判定策略和所述数据训练集构建异常申请分析模型,其中,所述异常申请分析模型用于分析待检测的接口申请是否为异常的接口申请;第一运行模块,用于运行所述数据测试集,以确定所述异常申请分析模型的模型泛化参数,其中,所述模型泛化参数用于评估所述异常申请分析模型在检测异常接口申请时的准确度。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的异常接口申请的检测方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项所述的异常接口申请的检测方法。
在本公开中,获取历史过程中涉及接口申请的申请数据,从申请数据中提取关联规则集,基于关联规则集,确定异常申请判定策略,其中,异常申请判定策略用于检测异常的接口申请。在本申请中,可通过分析接口申请的申请数据,得到关联规则,从而确定异常申请判定策略(用以筛选出异常的接口申请),实现了检测过程自动化,有效地提高了检测的效率和准确性,进而解决了相关技术中无法自动检测异常接口申请,导致检测效率和准确性较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的异常接口申请的检测方法的流程图;
图2是根据本发明实施例的一种可选的检测异常API申请系统的检测过程的示意图;
图3是根据本发明实施例的一种可选的算法调用过程的示意图;
图4是根据本发明实施例的一种可选的异常接口申请的检测装置的示意图;
图5是根据本发明实施例的一种用于实现异常接口申请的检测方法的电子设备(或移动设备)的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于本领域技术人员理解本发明,下面对本发明各实施例中涉及的部分术语或名词做出解释:
应用程序接口(Application Programming Interface,API):是一些预先定义的接口(如函数、HTTP接口),或指软件系统不同组成部分衔接的约定。
关联分析:又称关联挖掘,是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。
需要说明的是,本公开中的异常接口申请的检测方法及其装置可用于大数据领域在检测异常接口申请的情况下,也可用于除大数据领域之外的任意领域在检测异常接口申请的情况下,本公开中的异常接口申请的检测方法及其装置的应用领域不做限定。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本发明下述各实施例可应用于各种检测异常接口申请的系统/应用/设备中,该接口申请是指外部设备的应用程序申请调用本地金融机构的应用程序接口API的请求行为,其中,应用程序可以是各种具有交易、转账、支付等功能的应用APP,金融机构包括但不限于:基金机构、债券机构等。
本发明可先通过扫描API申请记录数据库,使用高效的算法挖掘出频繁项集,并导出关联和相关规则,之后通过扫描产生的关联规则集,结合数据特征,制定异常行为的判定策略,筛选出异常API申请。本发明充分利用了大数据平台的计算资源,可定量计算API之间的相关性,有效缩短了审批验证流程,减轻了审计人员工作压力,同时,也增强了结果的可解释性,有助于推广至其余领域。
实施例一
根据本发明实施例,提供了一种异常接口申请的检测方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的异常接口申请的检测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取历史过程中涉及接口申请的申请数据,其中,接口申请是指外部设备的应用程序申请调用本地金融机构的应用程序接口API的请求行为。
步骤S102,从申请数据中提取关联规则集。
步骤S103,基于关联规则集,确定异常申请判定策略,其中,异常申请判定策略用于检测异常的接口申请。
通过上述步骤,可以获取历史过程中涉及接口申请的申请数据,从申请数据中提取关联规则集,基于关联规则集,确定异常申请判定策略,其中,异常申请判定策略用于检测异常的接口申请。在本发明实施例中,可通过分析接口申请的申请数据,得到关联规则,从而确定异常申请判定策略(用以筛选出异常的接口申请),实现了检测过程自动化,有效地提高了检测的效率和准确性,进而解决了相关技术中无法自动检测异常接口申请,导致检测效率和准确性较低的技术问题。
下面结合上述各步骤对本发明实施例进行详细说明。
步骤S101,获取历史过程中涉及接口申请的申请数据,其中,接口申请是指外部设备的应用程序申请调用本地金融机构的应用程序接口API的请求行为。
在本发明实施例中,外部设备可以是个各种终端设备,例如:手机、PC机、平板等,外部设备可通过其上的应用程序申请调用本地金融机构(例如,银行等)的应用程序接口API,以与金融机构系统进行信息交互。
可选的,在获取历史过程中涉及接口申请的申请数据之后,检测方法还包括:分析申请数据,提取满足清洗条件的申请数据中的接口申请;删除满足清洗条件的所有接口申请。
在本发明实施例中,在获取历史过程中涉及接口申请的申请数据之后,可以对申请数据进行清洗,用于简化分析任务,防止因数据质量差或数据不平衡导致算法无法运行。本实施例中的清洗条件至少满足以下任一方面:
(1)某应用APP申请的所有API只有该应用APP申请过;
(2)某应用APP申请的API中至少有1个API只有该应用APP申请过;
(3)某应用APP只申请了1个API;
若申请数据中有满足该清洗条件的接口申请,则删除该接口申请,例如,可以采用SQL语句进行数据清洗,删除满足清洗条件的接口申请。
可选的,在删除满足清洗条件的所有接口申请之后,检测方法还包括:接收数据格式转换任务;获取申请数据中每个接口申请的数据格式,其中,数据格式至少包括:接口名称;将接口申请的接口名称映射为正整数,以完成接口申请的数据格式转换任务。
在本发明实施例中,转化数据格式是为了使每个接口申请的数据格式与所采用的算法接口保持一致,是指将API名(即接口申请的接口名称)映射为正整数,例如,若规定get_name(为接口名称)是0,get_date是1,get_info是2,那么,{get_name,get_info}被映射为{0,2}。
步骤S102,从申请数据中提取关联规则集。
可选的,从申请数据中提取关联规则集,包括:获取申请数据中每个接口申请所包含的API;提取接口支持度大于等于最小支持度的API,得到常用项集合;基于常用项集合,生成关联规则集。
在本发明实施例中,在申请数据清洗完成,并且数据格式转化完成后,可以提取该申请数据中的所有API,当API的接口支持度大于等于最小支持度(可根据具体情况进行设定),则得到常用项集合(即频繁项集,用于挖掘关联规则,可以由FP—Growth算法或Apriori算法生成),之后,可基于常用项集合,生成关联规则集。
可选的,基于常用项集合,生成关联规则集,包括:对于每个常用项集合,产生常用项集合的所有非空子集;计算每个非空子集的支持度与常用项集合的支持度之间的支持度比值;在支持度比值大于等于最小置信度阈值的情况下,则确定每个非空子集与常用项集合之间的关联规则,得到关联规则集。
在本发明实施例中,对于每个常用项集合,可以产生常用项集合的所有非空子集,计算每个非空子集的支持度与常用项集合的支持度之间的支持度比值,在支持度比值大于等于最小置信度阈值(可采用数据特征确定该阈值的大小,其中,数据特征包含有均值、方差、中位数、众数等,可以用SQL语句直接得到)的情况下,则确定每个非空子集与常用项集合之间的关联规则,得到关联规则集(例如,可以调用Python第三方库mlxtend中的association_rules函数计算出关联规则集),例如,对于每个频繁项集L,产生L的所有的非空子集,对于L的每个非空子集S,如果support_count(L)/support_count(S)>=min_conf,则产生关联规则S=>(L-S),其中,min_conf是最小置信度阈值。
步骤S103,基于关联规则集,确定异常申请判定策略,其中,异常申请判定策略用于检测异常的接口申请。
可选的,在基于关联规则集,确定异常申请判定策略之后,检测方法还包括:采用第一类异常申请判定策略确定负相关模式的满足条件;组合每两个常用项集合,得到常用项并集;检测每两个常用项集合对应的常用项并集是否为负相关模式;在常用项并集是负相关模式的情况下,确定包含常用项并集的接口申请为异常的接口申请。
在本发明实施例中,第一类异常申请判定策略为挖掘“负相关模式”,其中负相关模式定义如下:
假设项集X和Y都是频繁的(即项集X和Y都是常用项集),即sup(X)>=min_support,sup(Y)>=min_support,如果(P(X|Y)+P(Y|X))/2<eps,其中,min_support为最小支持度,eps是负模式阈值(可根据具体情况进行设定),则X U Y是负相关模式。
并且,P(X|Y)与P(Y|X)可以由FP—Growth算法计算得出,能够判断任意两个频繁项集组成的并集是否为负相关模式(即组合每两个常用项集合,得到常用项并集,检测每两个常用项集合对应的常用项并集是否为负相关模式),为检测某API申请(即接口申请)是否异常,可检查其是否包含负相关模式,如果存在负相关模式,则可判定该请求异常,并输出至最终结果(即在常用项并集是负相关模式的情况下,确定包含常用项并集的接口申请为异常的接口申请)。
可选的,在基于关联规则集,确定异常申请判定策略之后,检测方法还包括:采用第二类异常申请判定策略确定支持度阈值,其中,支持度阈值大于最小支持度;分析当前接口申请中支持度小于支持度阈值的API,得到第一类接口;检测关联规则集中是否存在支持第一类接口的当前接口申请的规则;在关联规则集中不存在支持第一类接口的当前接口申请的规则的情况下,确定当前接口申请为异常的接口申请。
在本发明实施例中,第二类异常申请判定策略为设定一个阈值alpha(即支持度阈值),并且满足alpha>min_support(即最小支持度),筛选出常用项集中所有支持度小于alpha的API,这些API被定义为“低频API”(本实施例以第一类接口进行表示),对每个包含低频API的申请请求,检测关联规则集中是否存在某条规则能支持该低频API申请的合理性(即检测关联规则集中是否存在支持第一类接口的当前接口申请的规则),如果无法找到则可判定该请求异常,并输出至最终结果(即在关联规则集中不存在支持第一类接口的当前接口申请的规则的情况下,确定当前接口申请为异常的接口申请)。
可选的,在基于关联规则集,确定异常申请判定策略之后,检测方法还包括:拆分经过清洗的申请数据,得到数据训练集和数据测试集;采用异常申请判定策略和数据训练集构建异常申请分析模型,其中,异常申请分析模型用于分析待检测的接口申请是否为异常的接口申请;运行数据测试集,以确定异常申请分析模型的模型泛化参数,其中,模型泛化参数用于评估异常申请分析模型在检测异常接口申请时的准确度。
在本发明实施例中,可以拆分经过清洗的申请数据,通过拆分出训练集(可以设定训练集约占全体数据集的80%)与测试集(可以设定测试集约占全体数据集的20%),使其能覆盖原有数据,之后可以采用异常申请判定策略(即第一类异常申请判定策略和第二类异常申请判定策略)和数据训练集构建异常申请分析模型,用于分析待检测的接口申请是否为异常的接口申请,在构建完成后,可以运行数据测试集,以检验该模型的泛化能力(即运行数据测试集,以确定异常申请分析模型的模型泛化参数),其模型泛化参数用于评估异常申请分析模型在检测异常接口申请时的准确度。
本发明实施例,通过扫描API申请记录数据库,使用高效的算法挖掘出频繁项集,并由此导出关联和相关规则,并结合数据特征,制定异常行为的判定策略,筛选出异常API申请,实现了检测过程自动化,能够有效缩短审批验证流程,减轻审计人员工作压力,同时,增强了结果的可解释性,有助于推广至其余领域。
实施例二
图2是根据本发明实施例的一种可选的检测异常API申请系统的检测过程的示意图,如图2所示,包括:数据清洗、数据拆分、特征抽取、算法调用、模型评估,其中:
数据清洗:用于简化分析任务,防止因数据质量差或数据不平衡导致算法无法运行。本实施例中,有以下3类数据需要事先被清洗:
(1)某应用APP申请的所有API只有该应用APP申请过;
(2)某应用APP申请的API中至少有1个API只有该应用APP申请过;
(3)某应用APP只申请了1个API。
本系统可以使用SQL语句进行数据清洗。
数据拆分:通过拆分出训练集(可以设定训练集约占全体数据集的80%)与测试集(可以设定测试集约占全体数据集的20%),使其能覆盖原有数据。
特征抽取:用于转化数据格式,使其与算法接口保持一致。
图3是根据本发明实施例的一种可选的算法调用过程的示意图,算法调用过程具体如下:
本系统可以使用图灵平台提供的FP—Growth算法挖掘频繁模式,并调用Python第三方库mlxtend中的association_rules函数导出关联规则集,在导出关联规则集的过程需设置最小支持度阈值min_support,以及设置最小置信度阈值confidence,上述阈值可由相关用户进行设定。
得到关联规则集后,可采用如下策略为对异常申请行为进行建模,得到异常申请分析模型:
第一种策略是设定一个阈值alpha(即低频API阈值alpha),并且满足alpha>min_support,筛选出所有支持度小于alpha的API,这些API被定义为“低频API”。对每个包含低频API的申请请求,检测关联规则集中是否存在某条规则能支持该低频API申请的合理性(即判断低频API请求合理性),如果无法找到则可判定该请求异常,并输出至最终结果。
第二种策略是挖掘“负相关模式”,负相关模式如下定义:
假设项集X和Y都是频繁的,sup(X)>=min_support,sup(Y)>=min_support,如果(P(X|Y)+P(Y|X))/2<eps,其中,min_support为最小支持度,eps是负模式阈值(可根据具体情况进行设定),则X U Y是负相关模式。
并且,P(X|Y)与P(Y|X)可以由FP—Growth算法计算得出,能够判断任意两个频繁项集组成的并集是否为负相关模式,为考察某API申请是否异常,可检查其是否包含负相关模式(即判定请求是否包含负相关模式),如存在负相关模式,则可判定该请求异常,并输出至最终结果。
模型评估:运行测试数据集,以检验模型的泛化能力,其模型的泛化能力用于评估异常申请分析模型在检测异常接口申请时的准确度。
本发明实施例,充分利用图灵平台提供的计算资源,通过扫描API申请记录数据库,使用高效的算法挖掘出频繁项集,并由此导出关联和相关规则,并结合数据特征,制定异常行为的判定策略,筛选出异常API申请,实现了检测过程自动化。本发明实施例构建的检测异常API申请系统能有效简化API申请审批流程,减轻审计人员研判压力,此外,该系统能准确度量API之间的相关性,并增强最终结果的可解释性。
实施例三
本实施例中提供的一种异常接口申请的检测装置包含了多个实施单元,每个实施单元对应于上述实施例一中的各个实施步骤。
图4是根据本发明实施例的一种可选的异常接口申请的检测装置的示意图,如图4所示,该检测装置可以包括:获取单元40,提取单元41,确定单元42,其中,
获取单元40,用于获取历史过程中涉及接口申请的申请数据,其中,接口申请是指外部设备的应用程序申请调用本地金融机构的应用程序接口API的请求行为;
提取单元41,用于从申请数据中提取关联规则集;
确定单元42,用于基于关联规则集,确定异常申请判定策略,其中,异常申请判定策略用于检测异常的接口申请。
上述检测装置,可以通过获取单元40获取历史过程中涉及接口申请的申请数据,通过提取单元41从申请数据中提取关联规则集,通过确定单元42基于关联规则集,确定异常申请判定策略,其中,异常申请判定策略用于检测异常的接口申请。在本发明实施例中,可通过分析接口申请的申请数据,得到关联规则,从而确定异常申请判定策略,用以筛选出异常的接口申请,实现了检测过程自动化,有效地提高了检测的效率和准确性,进而解决了相关技术中无法自动检测异常接口申请,导致检测效率和准确性较低的技术问题。
可选的,检测装置还包括:第一分析模块,用于在获取历史过程中涉及接口申请的申请数据之后,分析申请数据,提取满足清洗条件的申请数据中的接口申请;第一删除模块,用于删除满足清洗条件的所有接口申请。
可选的,检测装置还包括:第一接收模块,用于在删除满足清洗条件的所有接口申请之后,接收数据格式转换任务;第一获取模块,用于获取申请数据中每个接口申请的数据格式,其中,数据格式至少包括:接口名称;第一映射模块,用于将接口申请的接口名称映射为正整数,以完成接口申请的数据格式转换任务。
可选的,提取单元包括:第二获取模块,用于获取申请数据中每个接口申请所包含的API;第一提取模块,用于提取接口支持度大于等于最小支持度的API,得到常用项集合;第一生成模块,用于基于常用项集合,生成关联规则集。
可选的,第一生成模块包括:第一产生子模块,用于对于每个常用项集合,产生常用项集合的所有非空子集;第一计算子模块,用于计算每个非空子集的支持度与常用项集合的支持度之间的支持度比值;第一确定子模块,用于在支持度比值大于等于最小置信度阈值的情况下,则确定每个非空子集与常用项集合之间的关联规则,得到关联规则集。
可选的,检测装置还包括:第一采用模块,用于在基于关联规则集,确定异常申请判定策略之后,采用第一类异常申请判定策略确定负相关模式的满足条件;第一组合模块,用于组合每两个常用项集合,得到常用项并集;第一检测模块,用于检测每两个常用项集合对应的常用项并集是否为负相关模式;第一确定模块,用于在常用项并集是负相关模式的情况下,确定包含常用项并集的接口申请为异常的接口申请。
可选的,检测装置还包括:第二采用模块,用于在基于关联规则集,确定异常申请判定策略之后,采用第二类异常申请判定策略确定支持度阈值,其中,支持度阈值大于最小支持度;第二分析模块,用于分析当前接口申请中支持度小于支持度阈值的API,得到第一类接口;第二检测模块,用于检测关联规则集中是否存在支持第一类接口的当前接口申请的规则;第二确定模块,用于在关联规则集中不存在支持第一类接口的当前接口申请的规则的情况下,确定当前接口申请为异常的接口申请。
可选的,检测装置还包括:第一拆分模块,用于在基于关联规则集,确定异常申请判定策略之后,拆分经过清洗的申请数据,得到数据训练集和数据测试集;第三采用模块,用于采用异常申请判定策略和数据训练集构建异常申请分析模型,其中,异常申请分析模型用于分析待检测的接口申请是否为异常的接口申请;第一运行模块,用于运行数据测试集,以确定异常申请分析模型的模型泛化参数,其中,模型泛化参数用于评估异常申请分析模型在检测异常接口申请时的准确度。
上述的检测装置还可以包括处理器和存储器,上述获取单元40,提取单元41,确定单元42等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来确定异常申请判定策略。
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取历史过程中涉及接口申请的申请数据,从申请数据中提取关联规则集,基于关联规则集,确定异常申请判定策略,其中,异常申请判定策略用于检测异常的接口申请。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项的异常接口申请的检测方法。
图5是根据本发明实施例的一种用于实现异常接口申请的检测方法的电子设备(或移动设备)的硬件结构框图。如图5所示,电子设备可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、键盘、电源和/或相机。本领域普通技术人员可以理解,图5所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,电子设备还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项的异常接口申请的检测方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (11)
1.一种异常接口申请的检测方法,其特征在于,包括:
获取历史过程中涉及接口申请的申请数据,其中,所述接口申请是指外部设备的应用程序申请调用本地金融机构的应用程序接口API的请求行为;
从所述申请数据中提取关联规则集;
基于所述关联规则集,确定异常申请判定策略,其中,所述异常申请判定策略用于检测异常的接口申请。
2.根据权利要求1所述的检测方法,其特征在于,在获取历史过程中涉及接口申请的申请数据之后,所述检测方法还包括:
分析所述申请数据,提取满足清洗条件的所述申请数据中的接口申请;
删除满足清洗条件的所有接口申请。
3.根据权利要求2所述的检测方法,其特征在于,在删除满足清洗条件的所有接口申请之后,所述检测方法还包括:
接收数据格式转换任务;
获取所述申请数据中每个所述接口申请的数据格式,其中,所述数据格式至少包括:接口名称;
将所述接口申请的接口名称映射为正整数,以完成所述接口申请的数据格式转换任务。
4.根据权利要求1所述的检测方法,其特征在于,从所述申请数据中提取关联规则集,包括:
获取所述申请数据中每个所述接口申请所包含的API;
提取接口支持度大于等于最小支持度的API,得到常用项集合;
基于所述常用项集合,生成所述关联规则集。
5.根据权利要求4所述的检测方法,其特征在于,基于所述常用项集合,生成所述关联规则集,包括:
对于每个所述常用项集合,产生所述常用项集合的所有非空子集;
计算每个所述非空子集的支持度与所述常用项集合的支持度之间的支持度比值;
在所述支持度比值大于等于最小置信度阈值的情况下,则确定每个所述非空子集与所述常用项集合之间的关联规则,得到关联规则集。
6.根据权利要求5所述的检测方法,其特征在于,在基于所述关联规则集,确定异常申请判定策略之后,所述检测方法还包括:
采用第一类异常申请判定策略确定负相关模式的满足条件;
组合每两个所述常用项集合,得到常用项并集;
检测每两个所述常用项集合对应的常用项并集是否为负相关模式;
在所述常用项并集是负相关模式的情况下,确定包含所述常用项并集的接口申请为异常的接口申请。
7.根据权利要求1所述的检测方法,其特征在于,在基于所述关联规则集,确定异常申请判定策略之后,所述检测方法还包括:
采用第二类异常申请判定策略确定支持度阈值,其中,所述支持度阈值大于最小支持度;
分析当前接口申请中支持度小于所述支持度阈值的API,得到第一类接口;
检测所述关联规则集中是否存在支持第一类接口的当前接口申请的规则;
在所述关联规则集中不存在支持第一类接口的当前接口申请的规则的情况下,确定所述当前接口申请为异常的接口申请。
8.根据权利要求1所述的检测方法,其特征在于,在基于所述关联规则集,确定异常申请判定策略之后,所述检测方法还包括:
拆分经过清洗的申请数据,得到数据训练集和数据测试集;
采用异常申请判定策略和所述数据训练集构建异常申请分析模型,其中,所述异常申请分析模型用于分析待检测的接口申请是否为异常的接口申请;
运行所述数据测试集,以确定所述异常申请分析模型的模型泛化参数,其中,所述模型泛化参数用于评估所述异常申请分析模型在检测异常接口申请时的准确度。
9.一种异常接口申请的检测装置,其特征在于,包括:
获取单元,用于获取历史过程中涉及接口申请的申请数据,其中,所述接口申请是指外部设备的应用程序申请调用本地金融机构的应用程序接口API的请求行为;
提取单元,用于从所述申请数据中提取关联规则集;
确定单元,用于基于所述关联规则集,确定异常申请判定策略,其中,所述异常申请判定策略用于检测异常的接口申请。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至8中任意一项所述的异常接口申请的检测方法。
11.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至8中任意一项所述的异常接口申请的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111398221.5A CN114065194A (zh) | 2021-11-23 | 2021-11-23 | 异常接口申请的检测方法及其装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111398221.5A CN114065194A (zh) | 2021-11-23 | 2021-11-23 | 异常接口申请的检测方法及其装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114065194A true CN114065194A (zh) | 2022-02-18 |
Family
ID=80275982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111398221.5A Pending CN114065194A (zh) | 2021-11-23 | 2021-11-23 | 异常接口申请的检测方法及其装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114065194A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115002000A (zh) * | 2022-06-24 | 2022-09-02 | 中国平安财产保险股份有限公司 | 异常接口容错方法、装置、设备及存储介质 |
-
2021
- 2021-11-23 CN CN202111398221.5A patent/CN114065194A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115002000A (zh) * | 2022-06-24 | 2022-09-02 | 中国平安财产保险股份有限公司 | 异常接口容错方法、装置、设备及存储介质 |
CN115002000B (zh) * | 2022-06-24 | 2024-04-05 | 中国平安财产保险股份有限公司 | 异常接口容错方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109063966B (zh) | 风险账户的识别方法和装置 | |
US20200273570A1 (en) | Predictive analysis platform | |
US20190026358A1 (en) | Big data-based method and device for calculating relationship between development objects | |
CN109741173B (zh) | 可疑洗钱团伙的识别方法、装置、设备及计算机存储介质 | |
US10970263B1 (en) | Computer system and method of initiative analysis using outlier identification | |
CN107729376B (zh) | 保险数据审核方法、装置、计算机设备及存储介质 | |
CN111462845A (zh) | 动态表单生成方法、装置、计算机设备和存储介质 | |
CN108596759A (zh) | 贷款申请信息检测方法及服务器 | |
US9053170B2 (en) | Relationship discovery in business analytics | |
US11243785B2 (en) | User interface interaction optimization system and method to detect and display a correlation between a user interface variation and a user interaction goal | |
US20160132496A1 (en) | Data filtering | |
CN114004700A (zh) | 业务数据处理方法、装置、电子设备及存储介质 | |
CN114065194A (zh) | 异常接口申请的检测方法及其装置、电子设备及存储介质 | |
CN112989763A (zh) | 数据获取方法、装置、计算机设备及存储介质 | |
US20160232478A1 (en) | Using source data to predict and detect software deployment and shelfware | |
CN111553803A (zh) | 理赔处理方法和装置 | |
CN115689571A (zh) | 异常用户行为监测方法、装置、设备和介质 | |
CN115052037A (zh) | 客户端检测方法、装置、存储介质和设备 | |
CN115204888A (zh) | 一种目标账户识别方法、装置、存储介质和电子设备 | |
CN110532317B (zh) | 案件分析数据处理方法、装置、设备和可读存储介质 | |
CN112785320B (zh) | 信用风险的确定方法及装置、存储介质和电子设备 | |
US20230376977A1 (en) | System for determining cross selling potential of existing customers | |
TWM560616U (zh) | 提供關聯功能表選單的電子裝置 | |
CN114880713B (zh) | 基于数据链路的用户行为分析方法、装置、设备及介质 | |
CN117113402A (zh) | 一种数据挖掘方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |