CN117808597A - 一种生成风险规则的方法及装置 - Google Patents
一种生成风险规则的方法及装置 Download PDFInfo
- Publication number
- CN117808597A CN117808597A CN202410211543.1A CN202410211543A CN117808597A CN 117808597 A CN117808597 A CN 117808597A CN 202410211543 A CN202410211543 A CN 202410211543A CN 117808597 A CN117808597 A CN 117808597A
- Authority
- CN
- China
- Prior art keywords
- rule
- risk
- target
- rules
- matching result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 description 31
- 101100264195 Caenorhabditis elegans app-1 gene Proteins 0.000 description 18
- 239000000725 suspension Substances 0.000 description 7
- 230000006399 behavior Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000009434 installation Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例涉及一种生成风险规则的方法及装置,所述方法包括:首先,从预先形成的与交易相关的知识图谱中采样出多个目标节点对,任一目标节点对的两个节点所代表的用户和/或交易之间具有特定的风险类别。然后,生成符合目标规则范式的多个候选风险规则,其中包括属性规则范式,用于定义基于头节点和/或尾节点的属性值的约束规则。接下来,对于任一目标节点对,将所述多个候选风险规则应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集。最后,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则,用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。
Description
技术领域
本说明书一个或多个实施例涉及知识图谱领域,尤其涉及一种生成风险规则的方法及装置。
背景技术
风险控制,简称风控,是许多服务平台面临的问题。风控是通过对各类风险进行评估和管理,以确保服务平台的运行和/或用户资产安全的一系列措施和方法。随着互联网的发展,风控的范围也在不断增加,其中,一个重要的方向是在电子支付/电子交易平台对潜在的风险用户/风险交易进行识别,并采取相应的风控措施。
目前一些主流的方法是使用机器学习模型进行预测和识别,但是机器学习模型生成的结果的可解释性往往较差,无法满足用户、专家的具体需求。而知识图谱中的知识则具有十分直观的可解释性,因此,需要一种更好的方法,基于知识图谱生成解释性强且种类丰富的风险识别规则。
发明内容
本说明书一个或多个实施例描述了一种生成风险规则的方法及装置,旨在生成高可解释性且种类更加丰富的风险规则,同时基于预设的评价标准,从诸多生成的风险规则中筛选出更加可靠的风险规则。
第一方面,提供了一种生成风险规则的方法,包括:
从预先形成的与交易相关的知识图谱中采样出多个目标节点对,任一目标节点对的两个节点所代表的用户和/或交易之间具有特定的风险类别;
生成符合目标规则范式的多个候选风险规则,所述目标规则范式包括属性规则范式,所述属性规则范式用于定义基于头节点和/或尾节点的属性值的约束规则;
对于任一目标节点对,将所述多个候选风险规则应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集;
基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则;所述目标风险规则用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。
在一种可能的实施方式中,所述属性规则范式包括第一子范式和第二子范式;所述第一子范式用于定义约束所述头节点或尾节点的属性值的规则;所述第二子范式用于定义比较所述头节点和尾节点之间的属性值的规则。
在一种可能的实施方式中,所述目标规则范式还包括单边悬挂规则范式,所述单边悬挂规则范式用于定义一端为所述头节点或尾节点,另一端为任意实体的规则。
在一种可能的实施方式中,所述目标规则范式还包括:
路径规则范式,用于定义两端分别为所述头节点和尾节点的规则;单边实例规则范式,用于定义一端为所述头节点或尾节点,另一端为特定实体的规则。
在一种可能的实施方式中,所述目标规则范式还包括交叉规则范式,所述交叉规则范式用于定义,符合其它任意规则范式的组合的规则。
在一种可能的实施方式中,所述其它任意规则范式的组合,包括:
将其它任意规则范式之间进行合取和/或析取所生成的组合。
在一种可能的实施方式中,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则,包括:
将所述匹配结果集中的匹配结果转化为匹配结果向量,所述匹配结果向量中任意位置的值指示其对应的候选风险规则是否命中对应的目标节点对;
至少基于所述匹配结果集中的多个匹配结果向量,对各个候选规则进行拟合,其中,所述各个匹配结果向量对应的标签为真;
基于拟合结果中各个候选风险规则所对应的权重值与预设的权重阈值之间的关系,选择出若干目标风险规则。
在一种可能的实施方式中,所述拟合基于逻辑回归或机器学习模型。
在一种可能的实施方式中,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则,包括:
基于所述匹配结果集中的匹配结果,分别计算各个候选风险规则的置信度和覆盖度;
基于各个候选风险规则的置信度和覆盖度与预设的置信度阈值和覆盖度阈值之间的关系,选择出若干目标风险规则。
第二方面,提供了一种生成风险规则的装置,包括:
采样单元,配置为,从预先形成的与交易相关的知识图谱中采样出多个目标节点对,任一目标节点对的两个节点所代表的用户和/或交易之间具有特定的风险类别;
规则生成单元,配置为,生成符合目标规则范式的多个候选风险规则,所述目标规则范式包括属性规则范式,所述属性规则范式用于定义基于头节点和/或尾节点的属性值的约束规则;
规则匹配单元,配置为,对于任一目标节点对,将所述多个候选风险规则应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集;
规则筛选单元,配置为,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则;所述目标风险规则用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
第四方面,提供了一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
本说明书实施例提出的一种生成风险规则的方法及装置,通过增加多种新的规则范式,可以生成形式更加丰富的规则。在经过筛选后,能够生成种类丰富且高效可靠的风险规则,以更好地发现潜在的风险,提升风控的效果。
附图说明
为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出根据一个实施例的生成风险规则的方法的实施场景示意图;
图2示出根据一个实施例的生成风险规则的方法的流程图;
图3示出一个与风控有关的知识图谱的局部子图;
图4示出根据一个实施例的生成风险规则的装置的示意性框图。
具体实施方式
在介绍本说明书实施例的具体技术方案之前,首先对相关技术术语进行解释说明。
规则:用于对潜在的目标关系进行判别。如果当规则X成立时,相应的目标关系Y也成立,则可以写成推理式X→Y,即规则X可以推出目标关系Y。其中,规则是一个或多个可以判断正误的逻辑文字的组合,组合可以是合取或析取;目标关系是一个可以判断正误的逻辑文字。
上述逻辑文字在知识图谱中可以是三元组(h, r, t),即判断(h, r, t)所代表的实体h和实体t之间是否存在关系r。对应的推理式X→Y可以用于表示,当规则X中的各个三元组所代表的内容成立时(在知识图谱中存在时),推出目标关系Y里的三元组所代表的内容也成立(在知识图谱中存在)。
例如,对于一个知识图谱来说,想要判断的目标关系Y是(h, isMarriedTo, t),即h和t两个人之间是否存在婚姻关系。与目标关系Y相对应的一个规则X可以是:(h,hasChild, c) ∧ (t, hasChild, c),即h和t都拥有孩子c。对应的推理式(h, hasChild,c) ∧ (t, hasChild, c) → (h, isMarriedTo, t)可以解释为,如果两个人拥有同一个孩子,则推断出这两个人之间存在婚姻关系。
规则范式:定义了生成的规则应该符合的形式要求。例如由规则范式(h?, r?,t?)定义的规则应该是三元组形式,其中,问号代表对应的实体或关系可以是任意的实体或关系。
路径:头尾节点(h, t)之间通过一个或多个三元组关系形成的通路,例如(h, r1,e1)、(e1, r2, e2)、(e2, r3, t),代表节点h经由关系r1、r2、r3到节点t的通路。
下面结合附图,对本说明书提供的方案进行描述。
如前所述,目前主流的风控方法所使用的机器学习模型的预测结果,存在可解释性差的问题,即,虽然模型能够给出正确率较高的预测结果,但是难以说明给出该预测结果的具体原因和理由。使得用户难以得知自己被风控的具体原因,相关领域专家也难以根据模型的预测结果总结出一套合理而高效的风控方案。
为了解决上述问题,可以基于知识图谱的高可解释性,对风控相关的样本进行学习,以根据不同的风险类别,生成相应的风险规则。图1示出根据一个实施例的生成风险规则的方法的实施场景示意图。如图1所示,首先,从预先形成的与交易相关的知识图谱中采样出多个节点对(h1, t1), (h2, t2),…, (hn, tn),任一节点对(hi, ti)的两个节点hi和ti所代表的用户和/或交易之间具有特定的风险类别。例如,风险类别可以是两个代表用户的节点之间具有某种特定的交易安全风险,可以记为风险关系1,则对应于知识图谱中的三元组可以是(用户hi,风险关系1,用户ti);又例如,风险类别可以是代表用户的头节点hj与代表交易的尾节点tj之间为高风险转账关系,则对应于知识图谱中的三元组可以是(用户hj,高风险转账,交易tj)。
在采样时,判断两个节点hi和ti所代表的用户和/或交易之间具有特定的风险类别,可以直接从知识图谱中进行判断,例如,hi和ti之间具有该风险类别的连接边;也可以通过外部信息判断,例如,hi和ti之间经过打标任务被标记为具有该风险类别,这里不做限定。
然后,基于所述风险类别,生成符合规则范式的多个候选风险规则{R1, R2,…Rk},任一风险规则符合规则范式{F1, F2,…,Fm}中的某一规则范式。接下来,对于任一目标节点对,将所述多个候选风险规则{R1, R2,…Rk}应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集。例如,匹配结果集中可以包括,规则R1命中了节点对(h1, t1),也命中了节点对(h2, t2)等等;规则R2未命中节点对(h1, t1),但是命中了节点对(h2, t2)等等;规则Rk命中了命中了节点对(h1, t1),也命中了节点对(h2,t2)等等。
某一风险规则Ri命中节点对(hj, tj)可以是,将风险规则Ri应用到节点对(hj,tj)所得到的一个或多个结果,在相应的知识图谱中全部存在。例如,某一风险规则Ri是,头节点用户h给尾节点用户t进行了高风险转账,即(h, 高风险转账, t)。将风险规则Ri应用到节点对(hj, tj),得到结果(hj, 高风险转账, tj)。当知识图谱中存在(hj, 高风险转账, tj)时,则风险规则Ri命中节点对(hj, tj);当知识图谱中不存在(hj, 高风险转账,tj)时,则风险规则Ri未命中节点对(hj, tj)。
最后,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则,这些目标风险规则用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。选择目标风险规则的具体流程将在说明书的后续部分详细描述。
从上述流程中可以看出,风险规则是基于规则范式产生的,然后再根据与知识图谱的匹配情况进行筛选,得到最终的风险规则。因此,用于生成风险规则的规则范式种类越丰富,相应的风险规则的种类也就越丰富,进而可以得到更加丰富的风控规则。
以下结合具体的实施例,描述上述生成风险规则的方法的具体实施步骤。图2示出根据一个实施例的生成风险规则的方法的流程图,所述方法的执行主体可以为任何具有计算、处理能力的平台或服务器或设备集群等。如图2所示,所述方法至少包括:步骤202,从预先形成的与交易相关的知识图谱中采样出多个目标节点对,任一目标节点对的两个节点所代表的用户和/或交易之间具有特定的风险类别;步骤204,生成符合目标规则范式的多个候选风险规则,所述目标规则范式包括属性规则范式,所述属性规则范式用于定义基于头节点和/或尾节点的属性值的约束规则;步骤206,对于任一目标节点对,将所述多个候选风险规则应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集;步骤208,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则;所述目标风险规则用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。下面描述上述各个步骤的具体执行过程。
首先,在步骤202,从预先形成的与交易相关的知识图谱中采样出多个目标节点对,任一目标节点对的两个节点所代表的用户和/或交易之间具有特定的风险类别。
风险类别可以由节点之间的关系表示,例如,某一特定的风险类别可以对应着节点之间的目标关系r。此时,步骤202可以是,从预先形成的与交易相关的知识图谱中采样出多个目标节点对(h1, t1), (h2, t2),…, (hn, tn),任一目标节点对(hi, ti)的两个节点之间拥有目标关系r,其形成三元组(hi, r, ti)。
然后,在步骤204,生成符合目标规则范式的多个候选风险规则,所述目标规则范式包括属性规则范式,所述属性规则范式用于定义基于头节点和/或尾节点的属性值的约束规则。
为了便于对各个规则范式所生成的风险规则进行描述,以下将结合图3对各个类型的风险规则进行举例说明。图3示出一个与风控有关的知识图谱的局部子图。在图3中,要判断的风险类别为两个用户之间是否存在风险关系1,采样出的目标节点对(用户A,用户B)之间具有该风险关系1。其中,用户A自身的属性包含高转账频率,位于地区1,安装了App1,App1的属性包含中交易风险。用户B自身的属性包含高转账频率,位于地区2,安装了App1,进行过风险行为行为1,地区2的属性包含高交易风险。用户A和用户B之间相互转账。
属性规则范式用于定义基于头节点和/或尾节点的属性值的约束规则。在一些可能的实施方式中,属性规则范式包括第一子范式和第二子范式;所述第一子范式用于定义约束所述头节点或尾节点的属性值的规则;所述第二子范式用于定义比较所述头节点和尾节点之间的属性值的规则。
具体地,第一子范式用于定义约束某一个节点的属性值的规则,其形式可以是,h.property?=const?,和/或t.property?=const?,其中,问号代表对应的实体、属性和属性值可以是任意的。即,头节点的某个指定属性为某指定属性值,以及,尾节点的某个指定属性为某指定属性值。例如,在图3中,由第一子范式定义的风险规则可以是,h.转账频率=‘高’、t.转账频率=‘高’以及App.交易风险=‘中’,等等。
第二子范式用于定义比较两个节点的属性值之间的规则,其形式可以是,h.property? op? t.property?,其中,问号代表对应的实体、属性和运算符可以是任意的。其中,op?代表任意运算符,例如可以是相等=,不等于!=,大于>,小于<等等。例如,在图3中,由第二子范式定义的风险规则可以是,h.转账频率=t.转账频率、h.转账频率>t.转账频率,等等。
在一些可能的实施方式中,目标规则范式还包括单边悬挂规则范式,所述单边悬挂规则范式用于定义一端为所述头节点或尾节点,另一端为任意实体的规则。
具体地,单边悬挂规则范式的形式可以是,(h, r?),和/或(t, r?),即,头节点有某指定关系,但是不限定关系的另一端的值是什么,以及,尾节点有指定某关系,但是不限定关系的另一端的值是是什么。例如,在图3中,由单边悬挂规则范式定义的风险规则可以是,(t, 风险行为),即,只要尾节点t有过风险行为就算匹配成功,而并不限定具体是与哪个实体进行了什么风险行为。
在一些可能的实施方式中,目标规则范式还包括:路径规则范式,用于定义两端分别为所述头节点和尾节点的规则;以及,单边实例规则范式,用于定义一端为所述头节点或尾节点,另一端为特定实体的规则。
具体地,路径规则范式的形式可以是,(h, r0?, e1?) ∧ (e1?, r1?, e2?) ∧… ∧ (en?, rn?, t),即,头节点经过某路径到达了尾节点。例如,在图3中,由路径规则范式定义的风险规则可以是,(h, 安装, App1) ∧ (App1, 安装_inv, t),其中,安装_inv代表安装的反向边。
单边实例规则范式的形式可以是,(h, r?, const?),和/或(t, r?, const?),即,头节点与某指定实体之间具有某指定关系,以及,尾节点与某指定实体之间具有某指定关系。例如,在图3中,由单边实例规则范式定义的规则可以是,(h, 安装, App1)、(t, 安装,App1)、(t, 风险行为, 行为1)等等。与前述单边悬挂规则范式不同的是,由单边实例规则范式定义的规则,需要明确规则右侧的实体为某个特定的实体,而由单边悬挂规则范式定义的规则,不限定规则右侧的实体的具体值。
在一些可能的实施方式中,目标规则范式还包括交叉规则范式,所述交叉规则范式用于定义,符合其它任意规则范式的组合的规则。其中,任意规则范式的组合可以是将其它任意规则范式之间进行合取和/或析取所生成的组合。
例如,在图3中,由交叉规则范式定义的规则可以是,(h, 转账, t) ∧ (t, 转账,h) ∧ h.转账频率=‘高’ ∧ t.转账频率=‘高’,即h和t之间相互都转账过,并且h和t都拥有高转账频率的属性;((h, 转账, t) ∨ (t, 转账, h)) ∧ (t, 风险行为)、即h和t之间一方给另一方转账过,并且t有过风险行为;(h, 转账, t) ∧ (h, 安装, App1) ∧ (t,安装, App1),即h给t转账,并且h和t都安装了App1,等等。
以上各实施方式描述了可以用于生成风险规则的各个规则范式的形式。基于多种规则范式,可以生成种类丰富的风险规则。
接着,在步骤206,对于任一目标节点对,将所述多个候选风险规则应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集。
例如,在图3中,目标节点对为(用户A,用户B)。将某一候选风险规则(h, 转账, t)∧ (h, 安装, App1) ∧ (t, 安装, App1),应用于(用户A,用户B),得到匹配结果(用户A,转账, 用户B) ∧ (用户A, 安装, App1) ∧ (用户B, 安装, App1),通过与知识图谱比对后可知,上述匹配结果在知识图谱中存在,也就是说这个风险规则命中了目标节点对(用户A,用户B);将另一候选风险规则(h, 转账, t) ∧ t.转账频率=‘中’,应用于(用户A,用户B),得到匹配结果(用户A, 转账, 用户B) ∧ 用户B.转账频率=‘中’,通过与知识图谱比对后可知,虽然用户A给用户B转账过,但是用户B.转账频率并不是中,而是高,所以上述匹配结果在知识图谱中不存在,也就是说这个风险规则没有命中目标节点对(用户A,用户B)。
最后,在步骤208,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则;所述目标风险规则用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。
可以使用多种方法从候选风险规则中选择出多个目标风险规则。
在一个实施例中,步骤208具体包括:将所述匹配结果集中的匹配结果转化为匹配结果向量,所述匹配结果向量中任意位置的值指示其对应的候选风险规则是否命中对应的目标节点对;至少基于所述匹配结果集中的多个匹配结果向量,对各个候选规则进行拟合,其中,所述各个匹配结果向量对应的标签为真;基于拟合结果中各个候选风险规则所对应的权重值与预设的权重阈值之间的关系,选择出若干目标风险规则。
在一个更加具体的实施例中,拟合基于逻辑回归或机器学习模型。
例如,候选风险规则共有五个,对应于{R1, R2, R3, R4, R5}。将候选风险规则应用于目标节点对1,得到的匹配结果为“命中、命中、未命中、未命中、命中”,则相应的匹配结果向量可以是[1, 1, 0, 0, 1],对应的标签为1;将候选风险规则应用于目标节点对2,得到的匹配结果为“未命中、命中、未命中、命中、未命中”,则相应的匹配结果向量可以是[0,1, 0, 1, 0],向量对应的标签为1。然后,基于各个向量与标签形成的样本集进行拟合,得到各个候选规则对应的权重值,将各个权重值与预设的权重阈值之间的关系,然后选择出若干风险规则作为目标风险规则。
以上描述了构造正样本的方法,在一些实施例中,还包括构造负样本的方法。具体包括:从知识图谱中采样出多个负样本节点对,任一负样本节点对的两个节点所代表的用户和/或交易之间不具有特定的风险类别。然后将各个候选规则应用于负样本节点对上,得到匹配结果,根据匹配结果确定匹配结果向量,并将对应的标签设置为“假”或0,形成多个负样本。将负样本添加到前述样本集中,与正样本一并拟合,可以提高最终目标风险规则的质量。
在另一个实施例中,步骤208具体包括:基于所述匹配结果集中的匹配结果,分别计算各个候选风险规则的置信度和覆盖度;基于各个候选风险规则的置信度和覆盖度与预设的置信度阈值和覆盖度阈值之间的关系,选择出若干目标风险规则。
某一风险规则R的置信度的计算方式可以是,知识图谱中使风险规则R与目标关系r同时成立的节点对的数量,与使风险规则R成立的节点对的数量的比值。即,
置信度=num(R∧r)/num(R)。
某一风险规则R的覆盖度的计算方式可以是,知识图谱中使风险规则R与目标关系r同时成立的节点对的数量,与使目标关系r成立的节点对的数量的比值。即,
覆盖度=num(R∧r)/num(r)。
在其他实施例中,还可以使用其它方法,并定义相应的评价指标,对候选风险规则进行筛选,得到目标风险规则,这里不做限定。
基于各个目标风险规则R和待推理的风险类别r,可以构成多个推理式R→r,即,对于待预测的两个节点,当R成立时,推断出这两个节点之间具有风险类别r。例如,在图3中,某个目标风险规则为(h, 转账, t) ∧ (h, 安装, App1) ∧ (t, 安装, App1),则对应的推理式可以是(h, 转账, t) ∧ (h, 安装, App1) ∧ (t, 安装, App1) → (h, 风险关系1 ,t)。即如果待预测的两个节点h和t之间满足,h向t转账过,且h和t都安装了App1,则推出h和t之间存在风险关系1。
综合以上,本说明书实施例提出的生成风险规则的方法,通过定义了多种规则范式,可以生成种类更加丰富的风控规则。
根据另一方面的实施例,还提供一种生成风险规则的装置。图4示出根据一个实施例的生成风险规则的装置的示意性框图,该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。如图4所示,该装置400包括:
采样单元401,配置为,从预先形成的与交易相关的知识图谱中采样出多个目标节点对,任一目标节点对的两个节点所代表的用户和/或交易之间具有特定的风险类别;
规则生成单元402,配置为,生成符合目标规则范式的多个候选风险规则,所述目标规则范式包括属性规则范式,所述属性规则范式用于定义基于头节点和/或尾节点的属性值的约束规则;
规则匹配单元403,配置为,对于任一目标节点对,将所述多个候选风险规则应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集;
规则筛选单元404,配置为,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则;所述目标风险规则用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述任一实施例所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述任一实施例所描述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者装置中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种生成风险规则的方法,包括:
从预先形成的与交易相关的知识图谱中采样出多个目标节点对,任一目标节点对的两个节点所代表的用户和/或交易之间具有特定的风险类别;
生成符合目标规则范式的多个候选风险规则,所述目标规则范式包括属性规则范式,所述属性规则范式用于定义基于头节点和/或尾节点的属性值的约束规则;
对于任一目标节点对,将所述多个候选风险规则应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集;
基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则;所述目标风险规则用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。
2.根据权利要求1所述的方法,其中,所述属性规则范式包括第一子范式和第二子范式;所述第一子范式用于定义约束所述头节点或尾节点的属性值的规则;所述第二子范式用于定义比较所述头节点和尾节点之间的属性值的规则。
3.根据权利要求1所述的方法,其中,所述目标规则范式还包括单边悬挂规则范式,所述单边悬挂规则范式用于定义一端为所述头节点或尾节点,另一端为任意实体的规则。
4.根据权利要求1所述的方法,其中,所述目标规则范式还包括:
路径规则范式,用于定义两端分别为所述头节点和尾节点的规则;单边实例规则范式,用于定义一端为所述头节点或尾节点,另一端为特定实体的规则。
5.根据权利要求1-4任一项所述的方法,其中,所述目标规则范式还包括交叉规则范式,所述交叉规则范式用于定义,符合其它任意规则范式的组合的规则。
6.根据权利要求5所述的方法,其中,所述其它任意规则范式的组合,包括:
将其它任意规则范式之间进行合取和/或析取所生成的组合。
7.根据权利要求1所述的方法,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则,包括:
将所述匹配结果集中的匹配结果转化为匹配结果向量,所述匹配结果向量中任意位置的值指示其对应的候选风险规则是否命中对应的目标节点对;
至少基于所述匹配结果集中的多个匹配结果向量,对各个候选规则进行拟合,其中,所述各个匹配结果向量对应的标签为真;
基于拟合结果中各个候选风险规则所对应的权重值与预设的权重阈值之间的关系,选择出若干目标风险规则。
8.根据权利要求7所述的方法,其中,所述拟合基于逻辑回归或机器学习模型。
9.根据权利要求1所述的方法,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则,包括:
基于所述匹配结果集中的匹配结果,分别计算各个候选风险规则的置信度和覆盖度;
基于各个候选风险规则的置信度和覆盖度与预设的置信度阈值和覆盖度阈值之间的关系,选择出若干目标风险规则。
10.一种生成风险规则的装置,包括:
采样单元,配置为,从预先形成的与交易相关的知识图谱中采样出多个目标节点对,任一目标节点对的两个节点所代表的用户和/或交易之间具有特定的风险类别;
规则生成单元,配置为,生成符合目标规则范式的多个候选风险规则,所述目标规则范式包括属性规则范式,所述属性规则范式用于定义基于头节点和/或尾节点的属性值的约束规则;
规则匹配单元,配置为,对于任一目标节点对,将所述多个候选风险规则应用于所述目标节点对,得到各个候选风险规则是否命中所述目标节点对的匹配结果集;
规则筛选单元,配置为,基于所述匹配结果集,从所述多个候选风险规则中选择若干目标风险规则;所述目标风险规则用于判断待预测的两个节点所代表的用户和/或交易之间是否具有所述风险类别。
11.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项所述的方法。
12.一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410211543.1A CN117808597B (zh) | 2024-02-26 | 2024-02-26 | 一种生成风险规则的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410211543.1A CN117808597B (zh) | 2024-02-26 | 2024-02-26 | 一种生成风险规则的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117808597A true CN117808597A (zh) | 2024-04-02 |
CN117808597B CN117808597B (zh) | 2024-07-30 |
Family
ID=90434779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410211543.1A Active CN117808597B (zh) | 2024-02-26 | 2024-02-26 | 一种生成风险规则的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117808597B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109194611A (zh) * | 2018-07-24 | 2019-01-11 | 北京邮电大学 | 一种网间互联安全控制策略规则映射方法 |
WO2019196549A1 (zh) * | 2018-04-12 | 2019-10-17 | 阿里巴巴集团控股有限公司 | 确定高风险用户的方法及装置 |
CN112257098A (zh) * | 2020-12-21 | 2021-01-22 | 蚂蚁智信(杭州)信息技术有限公司 | 规则模型的安全性的确定方法、装置 |
CN113837635A (zh) * | 2021-09-29 | 2021-12-24 | 支付宝(杭州)信息技术有限公司 | 风险检测处理方法、装置及设备 |
CN114066242A (zh) * | 2021-11-11 | 2022-02-18 | 北京道口金科科技有限公司 | 一种企业风险的预警方法及装置 |
WO2023050491A1 (zh) * | 2021-09-30 | 2023-04-06 | 深圳前海环融联易信息科技服务有限公司 | 一种商机挖掘方法、装置、计算机设备及存储介质 |
WO2023051400A1 (zh) * | 2021-09-29 | 2023-04-06 | 浙江大学 | 一种可微的挖掘常量规则的方法 |
CN116361488A (zh) * | 2023-04-23 | 2023-06-30 | 支付宝(杭州)信息技术有限公司 | 一种基于知识图谱挖掘风险对象的方法及装置 |
CN116521896A (zh) * | 2023-04-28 | 2023-08-01 | 支付宝(杭州)信息技术有限公司 | 一种基于图的负样本获取方法和系统 |
CN117036060A (zh) * | 2023-09-27 | 2023-11-10 | 之江实验室 | 车险欺诈识别方法、装置和存储介质 |
CN117494048A (zh) * | 2023-11-14 | 2024-02-02 | 青岛理工大学 | 融合知识图谱与图注意网络的企业违规数据检测识别方法 |
-
2024
- 2024-02-26 CN CN202410211543.1A patent/CN117808597B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019196549A1 (zh) * | 2018-04-12 | 2019-10-17 | 阿里巴巴集团控股有限公司 | 确定高风险用户的方法及装置 |
CN109194611A (zh) * | 2018-07-24 | 2019-01-11 | 北京邮电大学 | 一种网间互联安全控制策略规则映射方法 |
CN112257098A (zh) * | 2020-12-21 | 2021-01-22 | 蚂蚁智信(杭州)信息技术有限公司 | 规则模型的安全性的确定方法、装置 |
CN113837635A (zh) * | 2021-09-29 | 2021-12-24 | 支付宝(杭州)信息技术有限公司 | 风险检测处理方法、装置及设备 |
WO2023051400A1 (zh) * | 2021-09-29 | 2023-04-06 | 浙江大学 | 一种可微的挖掘常量规则的方法 |
WO2023050491A1 (zh) * | 2021-09-30 | 2023-04-06 | 深圳前海环融联易信息科技服务有限公司 | 一种商机挖掘方法、装置、计算机设备及存储介质 |
CN114066242A (zh) * | 2021-11-11 | 2022-02-18 | 北京道口金科科技有限公司 | 一种企业风险的预警方法及装置 |
CN116361488A (zh) * | 2023-04-23 | 2023-06-30 | 支付宝(杭州)信息技术有限公司 | 一种基于知识图谱挖掘风险对象的方法及装置 |
CN116521896A (zh) * | 2023-04-28 | 2023-08-01 | 支付宝(杭州)信息技术有限公司 | 一种基于图的负样本获取方法和系统 |
CN117036060A (zh) * | 2023-09-27 | 2023-11-10 | 之江实验室 | 车险欺诈识别方法、装置和存储介质 |
CN117494048A (zh) * | 2023-11-14 | 2024-02-02 | 青岛理工大学 | 融合知识图谱与图注意网络的企业违规数据检测识别方法 |
Non-Patent Citations (2)
Title |
---|
漆桂林;高桓;吴天星;: "知识图谱研究进展", 情报工程, no. 01, 15 February 2017 (2017-02-15), pages 5 - 26 * |
许诺;唐锡晋;: "基于百度热搜新闻词的社会风险事件5W提取研究", 系统工程理论与实践, no. 02, 25 February 2020 (2020-02-25), pages 334 - 342 * |
Also Published As
Publication number | Publication date |
---|---|
CN117808597B (zh) | 2024-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Waldmann et al. | A Bayesian network model of causal learning | |
US7627543B2 (en) | Automated anomaly detection | |
US20190122096A1 (en) | Automated evaluation of neural networks using trained classifier | |
CN109190379B (zh) | 一种深度学习系统的漏洞检测方法和装置 | |
CN111898758A (zh) | 一种用户异常行为识别方法、装置及计算机可读存储介质 | |
CN112101562A (zh) | 机器学习建模过程的实现方法和系统 | |
Singh et al. | Learning context conditions for BDI plan selection | |
JP2005339534A (ja) | グラフ分析および同期の方法およびシステム | |
JP2019152948A (ja) | 画像判定システム、モデル更新方法およびモデル更新プログラム | |
Zeng et al. | Estimation of software defects fix effort using neural networks | |
CN110909758A (zh) | 计算机可读记录介质、学习方法和学习装置 | |
CN1976353B (zh) | 恢复和调试失败的网络可访问服务构建的方法和系统 | |
Wijs et al. | Efficient property preservation checking of model refinements | |
Liu et al. | Evolving knowledge graphs | |
CN114385512B (zh) | 软件源代码缺陷检测方法及装置 | |
CN110889493A (zh) | 针对关系网络添加扰动的方法及装置 | |
CN115293235A (zh) | 建立风险识别模型的方法及对应装置 | |
US20080172650A1 (en) | Program verification and discovery using probabilistic inference | |
CN117808597B (zh) | 一种生成风险规则的方法及装置 | |
Wang et al. | Sound and complete causal identification with latent variables given local background knowledge | |
Mezzanzanica et al. | Data quality sensitivity analysis on aggregate indicators | |
CN116702157A (zh) | 一种基于神经网络的智能合约漏洞检测方法 | |
KR101822062B1 (ko) | 컴포넌트 상호연관성 추출 기반 소프트웨어 컴포넌트 추천 방법 및 이를 기록한 기록 매체 | |
Raun et al. | C-3PA: Streaming Conformance, Confidence and Completeness in Prefix-Alignments | |
JP7180520B2 (ja) | 更新プログラム、更新方法および情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |