CN114118420A - 一种因果关系确定方法、装置、电子设备及存储介质 - Google Patents

一种因果关系确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114118420A
CN114118420A CN202111436655.XA CN202111436655A CN114118420A CN 114118420 A CN114118420 A CN 114118420A CN 202111436655 A CN202111436655 A CN 202111436655A CN 114118420 A CN114118420 A CN 114118420A
Authority
CN
China
Prior art keywords
factor
determining
target
factors
causal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111436655.XA
Other languages
English (en)
Inventor
陈冠霖
段雨佑
贾晋康
王轶凡
杨帆
吴少兵
李虓
封树超
高玥龙
陈冠丞
刘少江
周春荣
杜运辉
孔清清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Priority to CN202111436655.XA priority Critical patent/CN114118420A/zh
Publication of CN114118420A publication Critical patent/CN114118420A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种因果关系确定方法、装置、电子设备、可读存储介质以及计算机程序产品,涉及互联网和智能搜索领域。具体实现方案为:确定多个相关性因素与指定目标之间的第一因果关系,所述相关性因素为与所述指定目标的变化存在相关性的因素;根据所述第一因果关系,在所述相关性因素中确定目标因素,所述目标因素为与所述指定目标的变化存在因果效应的因素;根据所述第一因果关系以及所述目标因素,确定所述目标因素与所述指定目标之间的第二因果关系。该方案能够筛选出相关性因素中包含的目标因素,并进一步确定出目标因素与指定目标之间的第二因果关系,从而使第二因果关系所反映出的因果关系具有更高的精准度。

Description

一种因果关系确定方法、装置、电子设备及存储介质
技术领域
本公开涉及人工智能领域,具体涉及互联网和智能搜索技术,具体可用于互联网、智能搜索等场景。
背景技术
随着互联网技术的不断发展,越来越多的互联网产品被开发出来,用于给相关用户提供更为方便、快捷的服务。与此同时,如何为用户提供精准、优质的服务,也成为了产品开发时面临的重要问题。其中,所谓互联网产品一般是指:运行在计算机、智能手机以及其他电子设备上的与互联网直播服务相关的应用程序(Application,APP)、软件、应用等,例如:搜索类应用、新闻类APP、外卖APP等。
相关技术中,为了确保产品能够向用户提供精准、优质的服务,相关技术人员往往会采用数据分析以及机器学习等手段,来确定产品业务目标对应的影响因素,并构建影响因素与业务目标之间的因果关系。进而基于该因果关系来调整影响因素,以使业务目标能够达到预期目标。
但相关技术中所确定出的因果关系,往往精准度较低。
发明内容
本公开提供了提供一种因果关系确定方法、装置、电子设备、可读存储介质以及计算机程序产品,以提高因果关系的精准度。
根据本公开的一方面,提供了一种因果关系确定方法,该方法可以包括以下步骤:
确定相关性因素与指定目标之间的第一因果关系,相关性因素为与指定目标的变化存在相关性的因素;
根据第一因果关系,在相关性因素中确定目标因素,目标因素为与指定目标的变化存在因果效应的因素;
根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系。
根据本公开的第二方面,提供了一种因果关系确定装置,该装置可以包括:
第一因果关系确定单元,用于确定相关性因素与指定目标之间的第一因果关系,相关性因素为与指定目标的变化存在相关性的因素;
目标因素确定单元,用于根据第一因果关系,在相关性因素中确定目标因素,目标因素为与指定目标的变化存在因果效应的因素;
第二因果关系确定单元,用于根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现本公开任一实施例中的方法。
本公开的技术,能够在确定相关性因素与指定目标之间的第一因果关系的基础上,再根据第一因果关系,在相关性因素中确定与指定目标的变化存在因果效应的目标因素,进而根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系。本公开的技术,能够筛选出相关性因素中包含的目标因素,并进一步确定出目标因素与指定目标之间的第二因果关系,从而使第二因果关系所反映出的因果关系具有更高的精准度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1为本公开的实施例提供一种因果关系确定方法的流程图;
图2为本公开的实施例中提供的一种第一因果关系确定方法的流程图;
图3为本公开的实施例中提供的一种目标因素的确定方法的流程图;
图4为本公开的实施例中提供的一种因果图的示意图;
图5为本公开的实施例中提供的一种后门准则的应用示意图;
图6为本公开的实施例中提供的一种因果关系确定系统的示意图;
图7为本公开的实施例提供一种因果关系确定装置的示意图;
图8为本公开的实施例提供的一种电子设备的示意图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开提供一种因果关系确定方法,具体请参照图1,其为本公开的实施例提供一种因果关系确定方法的流程图。该方法可以包括以下步骤:
步骤S101:确定多个相关性因素与指定目标之间的第一因果关系,相关性因素为与指定目标的变化存在相关性的因素。
步骤S102:根据第一因果关系,在相关性因素中确定目标因素,目标因素为与指定目标的变化存在因果效应的因素。
步骤S103:根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系。
本公开的实施例中提供的因果关系确定方法,执行主体可以为客户端,所谓客户端为运行在电子设备上的目标程序、应用或软件。所谓目标程序、应用或软件一般为具有因果关系确定的功能的程序、应用或软件。所谓电子设备包括但不限于手机、电脑。
本公开的实施例中提供的因果关系确定方法,执行主体还可以为服务端,所谓服务端为用于为目标程序、应用或软件提供数据处理、数据存储等服务的服务器或者服务器集群。
本公开的实施例中提供的因果关系确定方法,能够在确定多个相关性因素与指定目标之间的第一因果关系的基础上,再根据第一因果关系,在相关性因素中确定与指定目标的变化存在因果效应的目标因素,进而根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系。该因果关系确定方法,能够筛选出相关性因素中包含的目标因素,并进一步确定出目标因素与指定目标之间的第二因果关系,从而使第二因果关系所反映出的因果关系具有更高的精准度。
所谓指定目标为更好地分析、研究及解决产品、项目等中存在问题,而预先设定的目标。具体包括但不限于互联网产品的业务目标、工业生产制造的生产目标、针对某一社会性问题的目标以及商品的经济效益目标。
所谓互联网产品的业务目标可以包括:目标应用的日活跃用户数量、用户的活跃度、注册用户增长数量以及用户好评率等。
所谓生产目标可以包括:产品的日均产量以及产品的成功率等。
所谓商品的经济效益目标可以包括:商品的销量、商品的毛利率等。
所谓指定目标的变化存在相关性的因素是指,与指定目标的变化存在关联的因素,包括但不限于与指定目标的变化存在直接关联的因素,与指定目标的变化存在间接关联的因素。在两个对象之间具有相关性时,这两个对象之间可能具有因果关系,也可能不具有因果关系。也就是说,相关性包括因果关系,但是相关性不仅仅只包括因果关系。
所谓因果关系是指,对指定目标的变化存在影响的因素,该因素变化时能够直接或者间接导致指定目标的变化。其中,因素变化时能够直接或者间接导致指定目标的变化,即该因素与指定目标的变化存在因果效应。
以下结合具体的例子,对相关因素、目标因素、相关性、因果关系、因果效应、第一因果关系以及第二因果关系进行说明。
具体的,以溺水死亡人数、气温以及冰淇淋销量为例,为了分析气温以及冰淇淋销量对溺水死亡人数的影响,经相关人员研究表明:冰淇淋销量增多时,溺水死亡人数也会变高。但经过进一步的研究表明:冰淇淋销量的变化,并不会直接导致溺水死亡人数的变化,溺水死亡人数变化的根本原因在于气温的升高,而气温的升高会同时导致冰淇淋销量的增多。
在上述示例中,溺水死亡人数为指定目标;溺水死亡人数、气温均是与溺水死亡人数的变化存在相关性的相关性因素;溺水死亡人数与气温之间、溺水死亡人数与冰淇淋销量之间,气温与冰淇淋销量之间,以及气温、冰淇淋销量和溺水死亡人数之间均具有相关性;针对上述相关性构建的初始因果关系为第一因果关系;气温由于与溺水死亡人数之间存在因果效应,因此,气温为目标因素;由于气温的变化能够同时导致冰淇淋销量和溺水死亡人数的变化,因此,气温为混杂因素;在第一因果关系的基础上,针对气温与溺水死亡人数重新构建的因果关系为第二因果关系。
本公开的实施例中,确定多个相关性因素与指定目标之间的第一因果关系的步骤如图2所示,图2为本公开的实施例中提供的一种第一因果关系确定方法的流程图。
步骤S201:基于针对指定目标预设的相关性筛选规则,确定相关性因素。
步骤S202:确定相关性因素与指定目标之间的相关性关系。
步骤S203:针对相关性关系,利用预设的因果关系分析策略,确定相关性因素与指定目标之间的因果关系路径。
步骤S204:根据因果关系路径,确定第一因果关系。
本公开的实施例在确定相关性因素时,会基于针对指定目标预设的相关性筛选规则,筛选得到相关性因素,从而排除与指定目标的变化无关的因素。进而能够提高因果关系确定的工作量,并且在筛选掉无关因素的基础上,能够进一步确保第二因果关系的精准度。
所谓相关性筛选规则可以为:基于先验值的筛选规则。此时,基于针对指定目标预设的相关性筛选规则,筛选出相关性因素的具体实现方式如下:
首先,选定指定目标。
指定目标可以为互联网产品的用户活跃度,也可以患者用药的疗效等。
然后,针对指定目标,确定该指定目标所属场景下的场景数据。
对于互联网产品的用户活跃度而言,该场景数据是指产品的业务数据,一般包括用户的历史使用数据以及产品运营数据。对于患者用药的疗效而言,场景数据是指患者就诊数据,一般包括患者的就诊记录、患者的用药记录、患者的个人信息以及健康状况信息等。
最后,针对业务数据,根据所属场景相关人员的先验值,筛选出相关因素。
在对业务数据进行特征提取后,会得到针对多种不同类型因素,但是这些因素中往往会存在与指定目标无关的因素。此时,需要根据相关人员先前积累的经验,筛选出指定目标对应的相关性因素,例如:与互联网产品的用户活跃度变化相关的因素包括:查询(query)类别数量产品的广告推送评论、用户针对产品相关页面的滑动次数、用户针对产品中的相关内容的收藏量、用户针对产品相关页面的浏览时长以及用户针对产品相关页面的点击量等;再如,与患者用药的疗效变化相关的因素包括:患者的用药量以及患者的用药天数等。
另外,在确定用户的相关因素后,需要进一步对业务数据进行特征提取,以筛选出相关因素对应的数据以及指定目标对应的数据,用于以确定相关性关系。
所谓相关性筛选规则可以为:基于皮尔逊相关系数和最大信息系数的筛选规则。此时,基于针对指定目标预设的相关性筛选规则,筛选出相关性因素的具体实现方式如下:分别采用皮尔逊相关系数和最大信息系数分析变量间的线性和非线性相关性筛选得到相关性因素。
本公开的实施例中,所谓确定相关性因素与指定目标之间的相关性关系的具体实现方式为:基于先验值来确定相关性关系。由于相关性因素与指定目标之间的相关性关系,可以为相关性因素与指定目标之间的直接相关性关系,以及相关性因素与指定目标之间的间接相关性关系。因此,本公开的实施例中的相关性关系中一般包括:相关性因素之间的因素相关性关系。
本公开的实施例中,所谓针对相关性关系,利用预设的因果关系分析策略,确定相关性因素与指定目标之间的因果关系路径的具体实现方式可以为:构建结构因果模型;确定因果关系参数;建立观察参数与因果模型的联系;评估平均因果作用公式的可识别性,确定多条路径的因果关系。
所谓因果关系路径为相关性因素之间,以及相关性因素与指定目标之间的因果关系结构以及因果关系方向的路径,用于表示相关性因素之间,以及相关性因素与指定目标之间的因果效应。
所谓根据因果关系路径,确定第一因果关系,包括:将不同的因果关系路径进行合并,得到第一因果关系。
所谓第一因果关系为针对相关性因素与指定目标确定出的因果关系,用于反映相关性因素与指定目标之间的因果关系。但是由于该因果关系中并未排除与指定目标的变化具有相关性但不具有因果效应的因素。因此,往往掩盖了与指定目标的变化存在因果效应的因素与指定目标之间的因果关系。从而导致该因果关系的精准度往往较低。
本公开的实施例中,根据第一因果关系,在相关性因素中确定目标因素的步骤如图3所示,图3为本公开的实施例中提供的一种目标因素的确定方法的流程图。
步骤S301:根据第一因果关系,确定相关性因素中包含的混杂因素,混杂因素为同时与指定目标的变化以及待检测因素的变化存在因果效应的因素,待检测因素为相关性因素中待检测是否为目标因素的因素。
步骤S302:通过控制混杂因素的变化,确定待检测因素是否为目标因素。
由于混杂因素的存在,往往会导致在因果关系的分析过程中,无法排除与指定目标的变化具有相关性但不具有因果效应的因素。因此,在排除混杂因素的影响的基础上来确定因果关系,能够使因果关系具有更高的精准度。
以下结合具体实例,对需要通过控制混杂因素的变化,来确定待检测因素是否为目标因素的原因进行详细的说明。
例如:在分析相关性因素(学历、智商)是否为指定目标(收入)的目标因素时,由于“智商”能够同时影响到“学历”和“收入”。因此,“智商”为混杂因素。由于“智商”这一混杂因素的存在,如果不控制“智商”的变换,就无法直接推断出“学历”与“收入”之间是否存在因果效应。
而如果我们把“智商”水平不同的人分离出来,分为“高智商水平”和“低智商水平”。那么,对于同一智商水平的人,这个混杂因素就被控制住了,不存在所谓的“智商”差异。此时,就可以去推断“学历”对“收入”的影响。
本公开的实施例中,所谓根据第一因果关系,确定相关性因素中包含的混杂因素的实现方式可以为:首先,确定第一因果关系对应的因果图,因果图为用于表示第一因果关系的有向无环图。然后,针对因果图,采用预设的混杂因素检测策略,确定混杂因素。
本公开的实施例中,将第一因果关系转换因果图,能够更为直观的向相关人员呈现相关性因素与指定目标之间的因果关系。进而能够更为方便的筛选出相关因素中的混杂因素。
所谓因果图可以包括与多个相关性因素相对应的多个节点,连接多个节点的一个或多个携带有因果关系方向的因果边。具体请参照图4,图4为本公开的实施例中提供的一种因果图的示意图。
其中,图4中的指定目标为搜索类产品对应的后两周在线天数,图中带有箭头的线即为因果边,箭头的方向用于表示因果关系方向,图中的“后两周在线天数”为指定目标,“推动次数”、“广告展现量”、“自由分发量”以及“点赞”等均为相关性因素,“后两周在线天数”、“推动次数”、“广告展现量”、“自由分发量”以及“点赞”等都分别对应一个节点。
另外,需要说明的是,除了以因果图的视觉形式来展现第一因果关系外,还可以以表格的形成呈现第一因果关系。
本公开的实施例中,所谓针对因果图,采用预设的混杂因素检测策略,确定混杂因素的过程为:首先,利用后门准则,确定因果图中的后门路径。然后,基于后门路径,确定混杂因素。
所谓后门路径是指,相关性因素中的指定因素到指定目标之间的伪路径。即指定因素与指定目标之间每条指向指定因素的路径。具体请参照图5,图5为本公开的实施例中提供的一种后门准则的应用示意图。图5中“A”、“B”、“C”用于表示相关性因素,“B”用于表示待检测因素,“D”用于表示指定目标。从“B”到“D”之间存在两条路径。第一条是B-C-D,第二条是B-A-D,为了推断“B”与“D”之间是否存在因果效应,需要阻断第二条路径。该第二条路径满足后门准则。因此,该第二条路径为后门路径。
在确定后门路径后,可以进一步确定后门路径上与待检测因素的非后代因素为混杂因素。如:第二条路径上的“A”。从而是混杂因素的确定更为方便快捷。
另外,本公开的实施例中,还可以采用前门准则来确定混杂因素。
在确定混杂因素后,为了能够排除混杂因素对因果效应推断的影响,需要在控制混杂因素的数值不发生变化的情况下,来确定待检测因素与指定目标之间的因果效应值,并基于因果效应值,确定待检测因素是否为目标因素。
具体的,可以采用回归算法、分层算法、匹配算法、得分加权算法、DR估计法、互学习(DML)双模型算法,元学习法以及表示学习法等,实现在控制混杂因素的数值不发生变化的情况下,确定待检测因素与指定目标之间的因果效应值。
具体的,以采用LR线性回归法,计算“query类别数量”对“用户活跃度”的因果效应值为例。在找到“query类别数量”与“用户活跃度”之间的混杂因素X(i)时,在控制X(i)的数值不发生变化的情况下,拟合“query类别数量”与“用户活跃度”之间的相关性因素,得到Y=b*T+a*X(i)。通过计算Y的值作为因果效应值。
在得到因果效应值后,可以基于对应设置的效应阈值来确定待检测因素是否为目标因素。具体的,如果因果效应值未达到效应阈值,则判定待检测因素不为目标因素;如果因果效应值达到效应阈值,则判定待检测因素为目标因素。
在确定目标因素后,根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系,包括:首先,确定目标因素与指定目标之间的因果关系,在第一因果关系的中排除目标因素与指定目标之间的因果关系,得到第二因果关系。在第一因果关系用因果关系图表示的情况下,根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系的具体实现方式为:去除因果关系图中只具有相关性而不具有因果效应的相关性元素之间,以及相关性元素与指定目标之间的因果边,得到新的因果图。
需要说明的是,本公开的实施例提供的因果关系确定方法,可以基于预先配置的因果关系确定系统来实现。该因果关系确定系统如图6所示,图6为本公开的实施例中提供的一种因果关系确定系统的示意图。
该因果关系确定系统包括三个子系统,分别为:因果关系发现子系统、因果效应估计子系统以及算法评测子系统。
所谓因果关系发现子系统,用于确定相关性因素,并确定相关性因素与指定目标之间的第一因果关系。
因果效应估计子系统,用于根据第一因果关系,在相关性因素中确定目标因素,目标因素为与指定目标的变化存在因果效应的因素;以及根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系。
该因果效应估计子系统具体可以实现因果图处理,执行的步骤包括:有向无环图(DAG)建模,即确定第一因果关系对应的因果图;还包括:因果结构识别,即对针对因果图,采用预设的混杂因素检测策略,确定混杂因素。
该因果效应估计子系统还具体可以实现效应估计,执行的步骤包括:在实现因果图处理后,采用回归算法、分层算法、匹配算法、得分加权算法、DR估计法、互学习(DML)双模型算法,元学习法以及表示学习法等,在控制混杂因素的数值不发生变化的情况下,确定待检测因素与指定目标之间的因果效应值,并基于因果效应值,确定待检测因素是否为目标因素。
本公开的实施例中,在确定第二因果关系之后,还可以进一步的对第二因果关系的稳定性进行评估。具体的实现方式可以为关系发现算法评估,具体步骤为:通过对第二因果关系图增加预设的混杂因素的方式,来判断在增加预设的混杂因素后,目标因素与指定目标之间的因果效应值是否发生改变;若否,则判定目标因素与指定目标之间的因果关系稳定。
另外,评估第二因果关系的稳定性的方式还可以为推断算法评估,具体步骤为:先将目标因素替换成随机变量,再通过控制随机变量的数值变化的方式,来判断目标因素与指定目标之间的因果效应值是否发生改变;若未发生变化,则判定目标因素与指定目标之间的因果关系稳定。
在对第二因果关系的稳定性进行评估后,还可以进一步修正和优化第二因果关系。
如图7所示,本公开的实施例提供一种因果关系确定装置,该装置包括:
第一因果关系确定单元701,用于确定相关性因素与指定目标之间的第一因果关系,相关性因素为与指定目标的变化存在相关性的因素;
目标因素确定单元702,用于根据第一因果关系,在相关性因素中确定目标因素,目标因素为与指定目标的变化存在因果效应的因素;
第二因果关系确定单元703,用于根据第一因果关系以及目标因素,确定目标因素与指定目标之间的第二因果关系。
在本公开的另一实施例中,第一因果关系确定单元701,还可以包括:
相关性因素确定子单元,用于基于针对指定目标预设的相关性筛选规则,筛选出相关性因素;
相关性确定子单元,用于确定相关性因素与指定目标之间的相关性关系;
因果要素确定子单元,用于针对相关性关系,利用预设的因果关系分析策略,确定相关性因素与指定目标之间的因果关系路径;
第一因果关系确定子单元,用于根据因果关系路径,确定第一因果关系。
在本公开的另一实施例中,目标因素确定单元702,还可以包括:
混杂因素确定子单元,用于根据第一因果关系,确定相关性因素中包含的混杂因素,混杂因素为同时与指定目标的变化以及待检测因素的变化存在因果效应的因素,待检测因素为相关性因素中待检测是否为目标因素的因素;
目标因素确定子单元,用于通过控制混杂因素的变化,确定待检测因素是否为目标因素。
在本公开的另一实施例中,混杂因素确定子单元,还可以包括:
因果图确定子单元,用于确定第一因果关系对应的因果图,因果图为用于表示第一因果关系的有向无环图;
混杂因素检测子单元,用于针对因果图,采用预设的混杂因素检测策略,确定混杂因素。
在本公开的另一实施例中,混杂因素检测子单元,还可以包括:
后门路径确定子单元,用于在混杂因素检测策略为后门准则的情况下,利用后门准则,确定因果图中的后门路径;
后门路径处理子单元,用于基于后门路径,确定混杂因素。
在本公开的另一实施例中,目标因素确定子单元,还可以包括:
因果效应值确定子单元,用于在控制混杂因素的数值不发生变化的情况下,确定待检测因素与指定目标之间的因果效应值;
因果效应值检测子单元,用于基于因果效应值,确定待检测因素是否为目标因素。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开实施例,本公开还提供了一种电子设备和一种可读存储介质。
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM802以及RAM803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如因果关系确定方法。例如,在一些实施例中,因果关系确定方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM803并由计算单元801执行时,可以执行上文描述的因果关系确定方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行因果关系确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程因果关系确定装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (15)

1.一种因果关系确定方法,包括:
确定多个相关性因素与指定目标之间的第一因果关系,所述相关性因素为与所述指定目标的变化存在相关性的因素;
根据所述第一因果关系,在所述相关性因素中确定目标因素,所述目标因素为与所述指定目标的变化存在因果效应的因素;
根据所述第一因果关系以及所述目标因素,确定所述目标因素与所述指定目标之间的第二因果关系。
2.根据权利要求1所述的方法,其中,所述确定多个相关性因素与指定目标之间的第一因果关系,包括:
基于针对所述指定目标预设的相关性筛选规则,筛选出所述相关性因素;
确定所述相关性因素与所述指定目标之间的相关性关系;
针对所述相关性关系,利用预设的因果关系分析策略,确定所述相关性因素与所述指定目标之间的因果关系路径;
根据所述因果关系路径,确定所述第一因果关系。
3.根据权利要求1所述的方法,其中,所述根据所述第一因果关系,在所述相关性因素中确定目标因素,包括:
根据所述第一因果关系,确定所述相关性因素中包含的混杂因素,所述混杂因素为同时与所述指定目标的变化以及待检测因素的变化存在所述因果效应的因素;
通过控制所述混杂因素的变化,确定所述待检测因素是否为所述目标因素。
4.根据权利要求3所述的方法,其中,所述根据所述第一因果关系,确定所述相关性因素中包含的混杂因素,包括:
确定所述第一因果关系对应的因果图,所述因果图为用于表示所述第一因果关系的有向无环图;
针对所述因果图,采用预设的混杂因素检测策略,确定所述混杂因素。
5.根据权利要求4所述的方法,其中,在所述混杂因素检测策略为后门准则的情况下,所述采用预设的混杂因素检测策略,确定所述混杂因素,包括:
利用所述后门准则,确定所述因果图中的后门路径;
基于所述后门路径,确定所述混杂因素。
6.根据权利要求3-5任意一项所述的方法,其中,所述通过控制所述混杂因素的变化,确定所述待检测因素是否为所述目标因素,包括:
在控制所述混杂因素的数值不发生变化的情况下,确定所述待检测因素与所述指定目标之间的因果效应值;
基于所述因果效应值,确定所述待检测因素是否为所述目标因素。
7.一种因果关系确定装置,包括:
第一因果关系确定单元,用于确定多个相关性因素与指定目标之间的第一因果关系,所述相关性因素为与所述指定目标的变化存在相关性的因素;
目标因素确定单元,用于根据所述第一因果关系,在所述相关性因素中确定目标因素,所述目标因素为与所述指定目标的变化存在因果效应的因素;
第二因果关系确定单元,用于根据所述第一因果关系以及所述目标因素,确定所述目标因素与所述指定目标之间的第二因果关系。
8.根据权利要求7所述的装置,其中,所述第一因果关系确定单元,包括:
相关性因素确定子单元,用于基于针对所述指定目标预设的相关性筛选规则,筛选出所述相关性因素;
相关性确定子单元,用于确定所述相关性因素与所述指定目标之间的相关性关系;
因果要素确定子单元,用于针对所述相关性关系,利用预设的因果关系分析策略,确定所述相关性因素与所述指定目标之间的因果关系路径;
第一因果关系确定子单元,用于根据所述因果关系路径,确定所述第一因果关系。
9.根据权利要求7所述的装置,其中,所述目标因素确定单元,包括:
混杂因素确定子单元,用于根据所述第一因果关系,确定所述相关性因素中包含的混杂因素,所述混杂因素为同时与所述指定目标的变化以及待检测因素的变化存在所述因果效应的因素,所述待检测因素为所述相关性因素中待检测是否为所述目标因素的因素;
目标因素确定子单元,用于通过控制所述混杂因素的变化,确定所述待检测因素是否为所述目标因素。
10.根据权利要求9所述的装置,其中,所述混杂因素确定子单元,包括:
因果图确定子单元,用于确定所述第一因果关系对应的因果图,所述因果图为用于表示所述第一因果关系的有向无环图;
混杂因素检测子单元,用于针对所述因果图,采用预设的混杂因素检测策略,确定所述混杂因素。
11.根据权利要求10所述的装置,其中,所述混杂因素检测子单元,包括:
后门路径确定子单元,用于在所述混杂因素检测策略为后门准则的情况下,利用所述后门准则,确定所述因果图中的后门路径;
后门路径处理子单元,用于基于所述后门路径,确定所述混杂因素。
12.根据权利要求9-11任意一项所述的装置,其中,所述目标因素确定子单元,包括:
因果效应值确定子单元,用于在控制所述混杂因素的数值不发生变化的情况下,确定所述待检测因素与所述指定目标之间的因果效应值;
因果效应值检测子单元,用于基于所述因果效应值,确定所述待检测因素是否为所述目标因素。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6中任意一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行权利要求1至6中任意一项所述的方法。
15.一种计算机程序产品,包括计算机程序/指令,其中,该计算机程序/指令被处理器执行时实现权利要求1至6所述方法的步骤。
CN202111436655.XA 2021-11-29 2021-11-29 一种因果关系确定方法、装置、电子设备及存储介质 Pending CN114118420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111436655.XA CN114118420A (zh) 2021-11-29 2021-11-29 一种因果关系确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111436655.XA CN114118420A (zh) 2021-11-29 2021-11-29 一种因果关系确定方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114118420A true CN114118420A (zh) 2022-03-01

Family

ID=80367907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111436655.XA Pending CN114118420A (zh) 2021-11-29 2021-11-29 一种因果关系确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114118420A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881124A (zh) * 2022-04-21 2022-08-09 北京百度网讯科技有限公司 因果关系图的构建方法、装置、电子设备和介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881124A (zh) * 2022-04-21 2022-08-09 北京百度网讯科技有限公司 因果关系图的构建方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
WO2021174944A1 (zh) 基于目标对象活跃度的消息推送方法及相关设备
AU2013352429B2 (en) Querying features based on user actions in online systems
EP3690677B1 (en) Differentially private query budget refunding
CA2944652C (en) Inference model for traveler classification
Dutta et al. Bayesian inference of spreading processes on networks
CN111723292A (zh) 基于图神经网络的推荐方法、系统、电子设备及存储介质
CN111369344B (zh) 一种动态生成预警规则的方法和装置
Zhang et al. A trust model stemmed from the diffusion theory for opinion evaluation
US11381635B2 (en) Method of operating a server apparatus for delivering website content, server apparatus and device in communication with server apparatus
WO2015101161A1 (zh) 一种用于生成与目标系统对应的用户页面方法和装置
CN113569162A (zh) 数据处理方法、装置、设备及存储介质
CN112765452A (zh) 搜索推荐方法、装置及电子设备
CN112507098A (zh) 问题处理方法、装置、电子设备、存储介质及程序产品
Krymova et al. Trend estimation and short-term forecasting of COVID-19 cases and deaths worldwide
US20170004401A1 (en) Artificial intuition
CN114118420A (zh) 一种因果关系确定方法、装置、电子设备及存储介质
CN114417118A (zh) 一种异常数据处理方法、装置、设备以及存储介质
CN113592293A (zh) 风险识别处理方法、电子设备及计算机可读存储介质
Abdollahpouri et al. A multi-objective model for identifying valuable nodes in complex networks with minimum cost
CN113761379B (zh) 商品推荐方法及装置、电子设备和介质
Nie Applying correlation dimension to the analysis of the evolution of network structure
CN114881124A (zh) 因果关系图的构建方法、装置、电子设备和介质
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
Isken et al. Queueing inspired feature engineering to improve and simplify patient flow simulation metamodels
CN113722593A (zh) 事件数据处理方法、装置、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220301

RJ01 Rejection of invention patent application after publication