CN113723611B - 基于因果推断的业务因子生成方法、装置、设备及介质 - Google Patents

基于因果推断的业务因子生成方法、装置、设备及介质 Download PDF

Info

Publication number
CN113723611B
CN113723611B CN202111045512.6A CN202111045512A CN113723611B CN 113723611 B CN113723611 B CN 113723611B CN 202111045512 A CN202111045512 A CN 202111045512A CN 113723611 B CN113723611 B CN 113723611B
Authority
CN
China
Prior art keywords
behavior
causal
node
network
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111045512.6A
Other languages
English (en)
Other versions
CN113723611A (zh
Inventor
张严严
王雨洲
潘琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202111045512.6A priority Critical patent/CN113723611B/zh
Publication of CN113723611A publication Critical patent/CN113723611A/zh
Application granted granted Critical
Publication of CN113723611B publication Critical patent/CN113723611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及人工智能技术,揭露了一种基于因果推断的业务因子生成方法,包括:接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件,计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应,根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。此外,本发明还涉及区块链技术,所述业务因子可存储在区块链的节点中。本发明还提出一种基于因果推断的业务因子生成方法装置、电子设备以及计算机可读存储介质。本发明可以解决相关业务因子查找准确率较低的问题。

Description

基于因果推断的业务因子生成方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于因果推断的业务因子生成方法、装置、电子设备及计算机可读存储介质。
背景技术
传统机器学习算法中,关注的是特征之间的相关性,而无法去识别特征之间的因果,因此在进行产品决策与判断的时候,适用性较差。随着人工智能的进一步发展,各领域开始使用因果推断的方法对用户行为信息进行分析,从而提高产品或服务推送的准确率。
现有技术中,因果推断方法都是通过相关分析和A/B测试实验,而相关分析不能用于决策,A/B测试实验又是需要大量盲测进行事后验证,需要配置多次大量的实验才能找到真正有效的影响因子。测试周期长,营销成本大,且全凭业务经验挑选影响因子,无法从全局甚至多业务线联动发现有影响关系的业务因子,使得相关的业务因子的查找效率较低且不准确。
发明内容
本发明提供一种基于因果推断的业务因子生成方法、装置、设备及存储介质,其主要目的在于解决相关业务因子查找准确率较低的问题。
为实现上述目的,本发明提供的一种基于因果推断的业务因子生成方法,包括:
接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件;
计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应;
根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
可选地,所述接收用户选取指令之前,所述方法还包括:
获取用户行为事件集合,抽取所述用户行为事件集合中用户的行为因子;
根据所述行为因子的优先度构建原始行为因果网络;
对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络。
可选地,所述抽取所述用户行为事件集合中用户的行为因子,包括:
提取所述用户行为事件集合中预设个数的多个待归因事件;
按照时间顺序将所述多个待归因事件进行排列,得到事件序列;
依次从所述事件序列中任意选取一个待归因事件作为目标因子,计算所述事件序列中其他待归因事件与所述目标因子的相关系数;
选取所述相关系数大于预设的相关阈值的待归因事件作为行为因子。
可选地,所述根据所述行为因子的优先度构建原始行为因果网络,包括:
随机选取预设个数的行为因子作为样本集;
计算所述样本集中各行为因子间的节点优先度;
以各行为因子作为网络节点,根据所述节点优先度对所述网络节点进行排列,并构造各个网络节点间的有向边;
汇总所述有向边及所述网络节点得到所述样本集的行为因果网络;
利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到所述原始行为因果网络
可选地,所述计算所述样本集中各行为因子间的节点优先度,包括:
利用下述评分函数计算所述样本集中各行为因子间的节点优先度:
其中,D为所述样本集,n为样本集中行为因子的个数,score(D)为样本集中行为因子的节点优先度,mijk为样本集中第i个节点取第k个值时,其父节点为第j个值的样本个数,qi为样本中父节点个数,αijk为狄利克雷分布的超参数,γ()为伽马函数。
可选地,所述所述利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到所述原始行为因果网络,包括:
按照所述行为因果网络中的节点顺序,利用预设的评分算法依次确定每个节点的节点结构以及所述节点结构的结构得分;
汇总每个节点最大结构得分的节点结构,得到所述原始行为因果网络。
可选地,所述对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络,包括:
计算所述原始行为因果网络中由有向边关联的节点间的互信息值;
将所述互信息值小于等于预设的互信息阈值的节点间的有向边删除,并计算所述原始行为因果网络中各节点的节点优先度;
若所述各节点的节点优先度未收敛,则调节所述原始行为因果网络中各节点间有向边的方向,直至所述原始行为因果网络中各节点的节点优先度收敛,得到所述标准行为因果网络。
为了解决上述问题,本发明还提供一种基于因果推断的业务因子生成装置,所述装置包括:
目标事件选取模块,用于接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件;
业务因子生成模块,用于计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应,根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个计算机程序;及
处理器,执行所述存储器中存储的计算机程序以实现上述所述的基于因果推断的业务因子生成方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于因果推断的业务因子生成方法。
本发明通过预构建标准行为因果网络,并根据用户选取指令中选择的目标节点作为目标事件,可以直接输出与所述目标事件因果效应较强的业务因子,不需要复杂的相关分析和A/B测试实验,也无需人工根据经验选取,提高了业务因子生成的效率及准确率。因此本发明提出的基于因果推断的业务因子生成方法、装置、电子设备及计算机可读存储介质,可以解决相关业务因子查找准确率较低的问题。
附图说明
图1为本发明一实施例提供的基于因果推断的业务因子生成方法的流程示意图;
图2为本发明一实施例提供的基于因果推断的业务因子生成装置的功能模块图;
图3为本发明一实施例提供的实现所述基于因果推断的业务因子生成方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于因果推断的业务因子生成方法。所述基于因果推断的业务因子生成方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于因果推断的业务因子生成方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于因果推断的业务因子生成方法的流程示意图。在本实施例中,所述基于因果推断的业务因子生成方法包括:
S1、接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件。
本发明实施例中,所述标准行为因果网络可以为贝叶斯网络,由代表变量节点及连接这些节点的有向边构成,其中,节点代表随机变量(如用户的行为因子),节点间的有向边代表了节点间的互相关系(由父节点指向其子节点),用条件概率表达节点间的关系强度。
具体地,所述接收用户选取指令之前,所述方法还包括:
获取用户行为事件集合,抽取所述用户行为事件集合中用户的行为因子;
根据所述行为因子的优先度构建原始行为因果网络;
对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络。
本发明实施例中,所述用户行为事件集合中包括不同业务领域用户产生的行为业务事件,所述行为因子是指业务事件中用户产生的相关性较强的关键业务行为。比如,在金融领域中,银行用户A的行为事件为:在2021年6月1日存入1万元,购买理财产品,成为日活客户。则对应的待归因事件包括:“存入1万元”、“购买理财产品”、“成为日活客户”等。
具体地,所述抽取所述用户行为事件集合中用户的行为因子,包括:
提取所述用户行为事件集合中预设个数的的多个待归因事件;
按照时间顺序将所述多个待归因事件进行排列,得到事件序列;
依次从所述事件序列中任意选取一个待归因事件作为目标因子,计算所述事件序列中其他待归因事件与所述目标因子的相关系数;
选取所述相关系数大于预设的相关阈值的待归因事件作为行为因子。
本发明一可选实施例中,可以依次将所述事件序列中的每一个待归因事件作为目标因子,并将与所述目标因子相关系数较大的待归因事件作为该目标因子的行为因子,从而提高因果推断的准确率。同时,可以根据业务线(如贷款业务)、特定用户群(如还款用户)等方式来抽取待归因事件。
本发明实施例中,所述计算所述事件序列中其他待归因事件与所述目标因子的相关系数,包括:
利用预设的卡方公式计算所述事件序列中待归因事件与所述目标因子的相关系数:
其中,X2为所述相关系数,A为选取的目标因子,T为所述目标因子之外的任意一个待归因事件。
可选地,利用所述卡方公式计算出的相关系数描述了自变量(目标因子)与因变量(待归因事件)之间的相关程度。其中,X2越大,表示实际与期望差距越大,两个变量的独立性越小,也就是越相关,X2越小,表示实际与期望的情况近似,那么独立性越大,相关性越小。
本发明实施例中,通过将相关性较强的行为事件作为用户的行为因子,可以提高用户的行为因果判断的准确率。无需人工凭借经验挑选相关的行为因子,也提高了因果推断的效率。
具体地,所述根据所述行为因子的优先度构建原始行为因果网络,包括:
随机选取预设个数的行为因子作为样本集;
计算所述样本集中各行为因子间的节点优先度;
以各行为因子作为网络节点,根据所述节点优先度对所述网络节点进行排列,并构造各个网络节点间的有向边;
汇总所述有向边及所述网络节点得到所述样本集的行为因果网络;
利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到所述原始行为因果网络。
本发明实施例中,所述计算所述样本集中各行为因子间的节点优先度,包括:
利用下述评分函数计算所述样本集中各行为因子间的节点优先度:
其中,D为所述样本集,n为样本集中行为因子的个数,score(D)为样本集中行为因子的节点优先度,mijk为样本集中第i个节点取第k个值时,其父节点为第j个值的样本个数,qi为样本中父节点个数,αijk为狄利克雷分布的超参数,γ()为伽马函数。
本发明一可选实施例中,可以选取100个行为因子作为样本集。例如,对于每个节点x(i),有其余x(j)∈{x1,x2,…,x(i-1),x(i+1),…,xn}与之相邻,通过上述评分公式,分别带入两两连接的节点,计算连接方向x(i)–>x(j)和x(j)->x(i),比较score(G<xi,xj>|D)和score(G<xj,xi>|D)的大小,保留分值较高的连接方向。
具体地,所述利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到所述原始行为因果网络,包括:
按照所述行为因果网络中的节点顺序,利用预设的评分算法依次确定每个节点的节点结构以及所述节点结构的结构得分;
汇总每个节点最大结构得分的节点结构,得到所述原始行为因果网络。
可选的,所述预设的评分算法可以为K2算法,所述K2算法按随机变量(网络节点)的先后顺序,然后依次对每个变量求结构得分,得出此变量最大得分的结构。例如,节点顺序为节点1、2、3,3的结构可以为:1→3,2→3等。
本发明一可选实施例中,所述预设的评分算法为:
其中,n为样本集中行为因子的个数,scoreK2为节点的结构得分,mijk为样本集中第i个节点取第k个值时,其父节点为第j个值的样本个数,qi为样本中父节点个数,ri是变量行为因子的取值数目,mijk为样本集中第i个节点取第k个值时,其父节点为第j个值的样本个数。
本发明实施例中,通过对行为因子进行优先级排序,并通过各个节点最大结构得分的节点结构组建得到所述原始行为因果网络,进一步地提高了因果推断的准确性。
本发明实施例中,由于用户的行为因子数量较大,在得到原始行为因果网络的情况下,仍有可能在业务场景下不存在关联关系的两个节点在网络中发生关联,因此需要进一步的优化网络。
详细地,所述对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络,包括:
计算所述原始行为因果网络中由有向边关联的节点间的互信息值;
将所述互信息值小于等于预设的互信息阈值的节点间的有向边删除,并计算所述原始行为因果网络中各节点的节点优先度;
若所述各节点的节点优先度未收敛,则调节所述原始行为因果网络中各节点间有向边的方向,直至所述原始行为因果网络中各节点的节点优先度收敛,得到所述标准行为因果网络。
本发明实施例中,所述互信息值(Mutual Information)用来衡量随机变量之间相互依赖程度。
本发明一可选实施例中,所述计算所述原始行为因果网络中由有向边关联的节点间的互信息值,包括:
利用下述公式计算有向边两端的节点间的互信息值:
I(X;Y)=H(X)-H(X|Y)
其中,X,Y为有向边连接的两个节点,I(X;Y)为X,Y的互信息值,H(X)为X的信息熵,H(X|Y)为已知Y的情况下,X的信息熵。
本发明实施例中,通过删除互信息较小的有向边,以及调节有向边的方向,可以对网络全局进行优化,得到更加准确地行为因果网络。
S2、计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应,根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
本发明一可选实施例中,可以使用全概率公式计算行为因子与所述目标事件的因果效应,并根据因果效应的大小选取预设数量,如TOP10的行为因子作为所述目标事件的业务因子。
本发明通过预构建标准行为因果网络,并根据用户选取指令中选择的目标节点作为目标事件,可以直接输出与所述目标事件因果效应较强的业务因子,不需要复杂的相关分析和A/B测试实验,也无需人工根据经验选取,提高了业务因子生成的效率及准确率。因此本发明提出的基于因果推断的业务因子生成方法,可以解决相关业务因子查找准确率较低的问题。
如图2所示,是本发明一实施例提供的基于因果推断的业务因子生成装置的功能模块图。
本发明所述基于因果推断的业务因子生成装置100可以安装于电子设备中。根据实现的功能,所述基于因果推断的业务因子生成装置100可以包括行为目标事件选取模块101及业务因子生成模块102。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述目标事件选取模块101,用于接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件;
所述业务因子生成模块102,用于计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应,根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
详细地,所述基于因果推断的业务因子生成装置100各模块的具体实施方式如下:
步骤一、
接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件。
本发明实施例中,所述标准行为因果网络可以为贝叶斯网络,由代表变量节点及连接这些节点的有向边构成,其中,节点代表随机变量(如用户的行为因子),节点间的有向边代表了节点间的互相关系(由父节点指向其子节点),用条件概率表达节点间的关系强度。
具体地,所述接收用户选取指令之前,所述方法还包括:
获取用户行为事件集合,抽取所述用户行为事件集合中用户的行为因子;
根据所述行为因子的优先度构建原始行为因果网络;
对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络。
本发明实施例中,所述用户行为事件集合中包括不同业务领域用户产生的行为业务事件,所述行为因子是指业务事件中用户产生的相关性较强的关键业务行为。比如,在金融领域中,银行用户A的行为事件为:在2021年6月1日存入1万元,购买理财产品,成为日活客户。则对应的待归因事件包括:“存入1万元”、“购买理财产品”、“成为日活客户”等。
具体地,所述抽取所述用户行为事件集合中用户的行为因子,包括:
提取所述用户行为事件集合中预设个数的的多个待归因事件;
按照时间顺序将所述多个待归因事件进行排列,得到事件序列;
依次从所述事件序列中任意选取一个待归因事件作为目标因子,计算所述事件序列中其他待归因事件与所述目标因子的相关系数;
选取所述相关系数大于预设的相关阈值的待归因事件作为行为因子。
本发明一可选实施例中,可以依次将所述事件序列中的每一个待归因事件作为目标因子,并将与所述目标因子相关系数较大的待归因事件作为该目标因子的行为因子,从而提高因果推断的准确率。同时,可以根据业务线(如贷款业务)、特定用户群(如还款用户)等方式来抽取待归因事件。
本发明实施例中,所述计算所述事件序列中其他待归因事件与所述目标因子的相关系数,包括:
利用预设的卡方公式计算所述事件序列中待归因事件与所述目标因子的相关系数:
其中,X2为所述相关系数,A为选取的目标因子,T为所述目标因子之外的任意一个待归因事件。
可选地,利用所述卡方公式计算出的相关系数描述了自变量(目标因子)与因变量(待归因事件)之间的相关程度。其中,X2越大,表示实际与期望差距越大,两个变量的独立性越小,也就是越相关,X2越小,表示实际与期望的情况近似,那么独立性越大,相关性越小。
本发明实施例中,通过将相关性较强的行为事件作为用户的行为因子,可以提高用户的行为因果判断的准确率。无需人工凭借经验挑选相关的行为因子,也提高了因果推断的效率。
具体地,所述根据所述行为因子的优先度构建原始行为因果网络,包括:
随机选取预设个数的行为因子作为样本集;
计算所述样本集中各行为因子间的节点优先度;
以各行为因子作为网络节点,根据所述节点优先度对所述网络节点进行排列,并构造各个网络节点间的有向边;
汇总所述有向边及所述网络节点得到所述样本集的行为因果网络;
利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到所述原始行为因果网络。
本发明实施例中,所述计算所述样本集中各行为因子间的节点优先度,包括:
利用下述评分函数计算所述样本集中各行为因子间的节点优先度:
其中,D为所述样本集,n为样本集中行为因子的个数,score(D)为样本集中行为因子的节点优先度,mijk为样本集中第i个节点取第k个值时,其父节点为第j个值的样本个数,qi为样本中父节点个数,αijk为狄利克雷分布的超参数,γ()为伽马函数。
本发明一可选实施例中,可以选取100个行为因子作为样本集。例如,对于每个节点x(i),有其余x(j)∈{x1,x2,…,x(i-1),x(i+1),…,xn}与之相邻,通过上述评分公式,分别带入两两连接的节点,计算连接方向x(i)–>x(j)和x(j)->x(i),比较score(G<xi,xj>|D)和score(G<xj,xi>|D)的大小,保留分值较高的连接方向。
具体地,所述利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到所述原始行为因果网络,包括:
按照所述行为因果网络中的节点顺序,利用预设的评分算法依次确定每个节点的节点结构以及所述节点结构的结构得分;
汇总每个节点最大结构得分的节点结构,得到所述原始行为因果网络。
可选的,所述预设的评分算法可以为K2算法,所述K2算法按随机变量(网络节点)的先后顺序,然后依次对每个变量求结构得分,得出此变量最大得分的结构。例如,节点顺序为节点1、2、3,3的结构可以为:1→3,2→3等。
本发明一可选实施例中,所述预设的评分算法为:
其中,n为样本集中行为因子的个数,scoreK2为节点的结构得分,mijk为样本集中第i个节点取第k个值时,其父节点为第j个值的样本个数,qi为样本中父节点个数,ri是变量行为因子的取值数目,mijk为样本集中第i个节点取第k个值时,其父节点为第j个值的样本个数。
本发明实施例中,通过对行为因子进行优先级排序,并通过各个节点最大结构得分的节点结构组建得到所述原始行为因果网络,进一步地提高了因果推断的准确性。
本发明实施例中,由于用户的行为因子数量较大,在得到原始行为因果网络的情况下,仍有可能在业务场景下不存在关联关系的两个节点在网络中发生关联,因此需要进一步的优化网络。
详细地,所述对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络,包括:
计算所述原始行为因果网络中由有向边关联的节点间的互信息值;
将所述互信息值小于等于预设的互信息阈值的节点间的有向边删除,并计算所述原始行为因果网络中各节点的节点优先度;
若所述各节点的节点优先度未收敛,则调节所述原始行为因果网络中各节点间有向边的方向,直至所述原始行为因果网络中各节点的节点优先度收敛,得到所述标准行为因果网络。
本发明实施例中,所述互信息值(Mutual Information)用来衡量随机变量之间相互依赖程度。
本发明一可选实施例中,所述计算所述原始行为因果网络中由有向边关联的节点间的互信息值,包括:
利用下述公式计算有向边两端的节点间的互信息值:
I(X;Y)=H(X)-H(X|Y)
其中,X,Y为有向边连接的两个节点,I(X;Y)为X,Y的互信息值,H(X)为X的信息熵,H(X|Y)为已知Y的情况下,X的信息熵。
本发明实施例中,通过删除互信息较小的有向边,以及调节有向边的方向,可以对网络全局进行优化,得到更加准确地行为因果网络。
步骤二、计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应,根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
本发明一可选实施例中,可以使用全概率公式计算行为因子与所述目标事件的因果效应,并根据因果效应的大小选取预设数量,如TOP10的行为因子作为所述目标事件的业务因子。
本发明通过预构建标准行为因果网络,并根据用户选取指令中选择的目标节点作为目标事件,可以直接输出与所述目标事件因果效应较强的业务因子,不需要复杂的相关分析和A/B测试实验,也无需人工根据经验选取,提高了业务因子生成的效率及准确率。因此本发明提出的基于因果推断的业务因子生成装置,可以解决相关业务因子查找准确率较低的问题。
如图3所示,是本发明一实施例提供的实现基于因果推断的业务因子生成方法的电子设备的结构示意图。
所述电子设备可以包括处理器10、存储器11、通信接口12和总线13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于因果推断的业务因子生成程序。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于因果推断的业务因子生成程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于因果推断的业务因子生成程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
所述通信接口12用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
所述总线13可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线13可以分为地址总线、数据总线、控制总线等。所述总线13被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。
可选地,该电子设备还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备中的所述存储器11存储的基于因果推断的业务因子生成程序是多个指令的组合,在所述处理器10中运行时,可以实现:
接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件;
计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应;
根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件;
计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应;
根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (7)

1.一种基于因果推断的业务因子生成方法,其特征在于,所述方法包括:
获取用户行为事件集合,提取所述用户行为事件集合中预设个数的多个待归因事件,按照时间顺序将所述多个待归因事件进行排列,得到事件序列,依次从所述事件序列中任意选取一个待归因事件作为目标因子,计算所述事件序列中其他待归因事件与所述目标因子的相关系数,选取所述相关系数大于预设的相关阈值的待归因事件作为行为因子,随机选取预设个数的行为因子作为样本集,计算所述样本集中各行为因子间的节点优先度,以各行为因子作为网络节点,根据所述节点优先度对所述网络节点进行排列,并构造各个网络节点间的有向边,汇总所述有向边及所述网络节点得到所述样本集的行为因果网络,利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到原始行为因果网络,对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络;
接收用户选取指令,从所述标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件;
计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应;
根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
2.如权利要求1所述的基于因果推断的业务因子生成方法,其特征在于,所述计算所述样本集中各行为因子间的节点优先度,包括:
利用下述评分函数计算所述样本集中各行为因子间的节点优先度:
,/>
其中,为所述样本集,/>为样本集中行为因子的个数,/>为样本集中行为因子的节点优先度,/>为样本集中第/>个节点取第/>个值时,其父节点为第/>个值的样本个数,为样本中父节点个数,/>为狄利克雷分布的超参数,/>为伽马函数。
3.如权利要求1所述的基于因果推断的业务因子生成方法,其特征在于,所述利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到所述原始行为因果网络,包括:
按照所述行为因果网络中的节点顺序,利用预设的评分算法依次确定每个节点的节点结构以及所述节点结构的结构得分;
汇总每个节点最大结构得分的节点结构,得到所述原始行为因果网络。
4.如权利要求1所述的基于因果推断的业务因子生成方法,其特征在于,所述对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络,包括:
计算所述原始行为因果网络中由有向边关联的节点间的互信息值;
将所述互信息值小于等于预设的互信息阈值的节点间的有向边删除,并计算所述原始行为因果网络中各节点的节点优先度;
若所述各节点的节点优先度未收敛,则调节所述原始行为因果网络中各节点间有向边的方向,直至所述原始行为因果网络中各节点的节点优先度收敛,得到所述标准行为因果网络。
5.一种基于因果推断的业务因子生成装置,其特征在于,所述装置包括:
获取用户行为事件集合,提取所述用户行为事件集合中预设个数的多个待归因事件,按照时间顺序将所述多个待归因事件进行排列,得到事件序列,依次从所述事件序列中任意选取一个待归因事件作为目标因子,计算所述事件序列中其他待归因事件与所述目标因子的相关系数,选取所述相关系数大于预设的相关阈值的待归因事件作为行为因子,随机选取预设个数的行为因子作为样本集,计算所述样本集中各行为因子间的节点优先度,以各行为因子作为网络节点,根据所述节点优先度对所述网络节点进行排列,并构造各个网络节点间的有向边,汇总所述有向边及所述网络节点得到所述样本集的行为因果网络,利用预设的评分算法对所述行为因果网络进行贪婪搜索,得到原始行为因果网络,对所述原始行为因果网络进行反向调节及删边调节,得到标准行为因果网络;
目标事件选取模块,用于接收用户选取指令,从预构建的标准行为因果网络中将所述用户选取指令中选择的目标节点作为目标事件;
业务因子生成模块,用于计算所述标准行为因果网络中各节点的行为因子与所述目标事件的因果效应,根据所述因果效应的大小选取预设数量的行为因子作为所述目标事件的业务因子。
6.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至4中任意一项所述的基于因果推断的业务因子生成方法。
7.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任意一项所述的基于因果推断的业务因子生成方法。
CN202111045512.6A 2021-09-07 2021-09-07 基于因果推断的业务因子生成方法、装置、设备及介质 Active CN113723611B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111045512.6A CN113723611B (zh) 2021-09-07 2021-09-07 基于因果推断的业务因子生成方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111045512.6A CN113723611B (zh) 2021-09-07 2021-09-07 基于因果推断的业务因子生成方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113723611A CN113723611A (zh) 2021-11-30
CN113723611B true CN113723611B (zh) 2024-03-29

Family

ID=78682260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111045512.6A Active CN113723611B (zh) 2021-09-07 2021-09-07 基于因果推断的业务因子生成方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113723611B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113327136A (zh) * 2021-06-23 2021-08-31 中国平安财产保险股份有限公司 归因分析方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109598346A (zh) * 2017-09-30 2019-04-09 日本电气株式会社 用于估计观测变量之间的因果关系的方法、装置和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113327136A (zh) * 2021-06-23 2021-08-31 中国平安财产保险股份有限公司 归因分析方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于因果效应的贝叶斯网络结构学习方法;安宁;滕越;杨矫云;李廉;;计算机应用研究(12);第3609-3613页 *

Also Published As

Publication number Publication date
CN113723611A (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN112446025A (zh) 联邦学习防御方法、装置、电子设备及存储介质
CN112988963B (zh) 基于多流程节点的用户意图预测方法、装置、设备及介质
CN113592605B (zh) 基于相似产品的产品推荐方法、装置、设备及存储介质
CN111639706A (zh) 基于图像集的个人风险画像生成方法及相关设备
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
CN113516417A (zh) 基于智能建模的业务评估方法、装置、电子设备及介质
CN114997263A (zh) 基于机器学习的结训率分析方法、装置、设备及存储介质
CN115049397A (zh) 识别社交网络中的风险账户的方法及装置
CN116401602A (zh) 事件检测方法、装置、设备及计算机可读介质
CN113723611B (zh) 基于因果推断的业务因子生成方法、装置、设备及介质
CN113656586B (zh) 情感分类方法、装置、电子设备及可读存储介质
CN113657546B (zh) 信息分类方法、装置、电子设备及可读存储介质
CN113628043B (zh) 基于数据分类的投诉有效性判断方法、装置、设备及介质
CN113419951B (zh) 人工智能模型优化方法、装置、电子设备及存储介质
CN111859985B (zh) Ai客服模型测试方法、装置、电子设备及存储介质
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN114463590A (zh) 信息处理方法、装置、设备、存储介质及程序产品
CN114723488B (zh) 课程推荐方法、装置、电子设备及存储介质
CN114781833B (zh) 基于业务人员的能力测评方法、装置、设备及存储介质
CN113723554B (zh) 模型调度方法、装置、电子设备及计算机可读存储介质
CN113592606B (zh) 基于多重决策的产品推荐方法、装置、设备及存储介质
CN113051475B (zh) 内容推荐方法、装置、电子设备及可读存储介质
CN113139129B (zh) 虚拟阅读轨迹图生成方法、装置、电子设备及存储介质
CN114757541B (zh) 基于培训行为数据的绩效分析方法、装置、设备及介质
CN116703539A (zh) 基于增量学习的金融风险识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant