CN112000856A - 因果关系的确定方法、装置、设备及可读存储介质 - Google Patents

因果关系的确定方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN112000856A
CN112000856A CN202010891985.7A CN202010891985A CN112000856A CN 112000856 A CN112000856 A CN 112000856A CN 202010891985 A CN202010891985 A CN 202010891985A CN 112000856 A CN112000856 A CN 112000856A
Authority
CN
China
Prior art keywords
data
neural network
conversion
determining
causal relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010891985.7A
Other languages
English (en)
Inventor
张天豫
范力欣
吴锦和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010891985.7A priority Critical patent/CN112000856A/zh
Publication of CN112000856A publication Critical patent/CN112000856A/zh
Priority to PCT/CN2021/094934 priority patent/WO2022041866A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种因果关系的确定方法、装置、设备及可读存储介质,该方法包括:获取第一数据和第二数据,并基于预设神经网络和第一数据,转换第二数据,得到与第一数据在预设神经网络的散度上匹配的第三数据;基于预设神经网络和第二数据,转换第一数据,得到与第二数据在预设神经网络的散度上匹配的第四数据;获取第二数据与第三数据转换的第一转换时间,以及第一数据与第四数据转换的第二转换时间,并根据第一转换时间对应的第一转换难易程度系数,与第二转换时间对应的第二转换难易程度系数,确定第一数据与第二数据之间的因果关系。由第一数据与第二数据相互转换的难易程度,准确确定第一数据和第二数据之间的因果关系,提升数据分析精度。

Description

因果关系的确定方法、装置、设备及可读存储介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种因果关系的确定方法、装置、设备及可读存储介质。
背景技术
随着金融科技(Fintech),尤其是互联网科技金融的不断发展,越来越多的技术(如人工智能、大数据分析、云存储等)应用在金融领域,但金融领域也对各类技术提出了更高的要求,如要求提升数据分析的精度等。
目前,机器学习算法作为一种有效的数据分析工具广泛的使用在各个领域,但是机器学习算法在数据间因果关系推断方面的能力稍有欠缺,使得数据分析的精度不高,而限制了机器学习算法在对数据分析精度要求高的领域的推广使用。
因此,如何实现数据间因果关系的推断,提升数据分析精度,是当前亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种因果关系的确定方法、装置、设备及可读存储介质,旨在解决现有技术中如何实现数据间因果关系的推断,提升数据分析精度的技术问题。
为实现上述目的,本发明提供一种因果关系的确定方法,所述因果关系的确定方法包括以下步骤:
获取第一数据和第二数据,并基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据;
基于所述预设神经网络和第二数据,对所述第一数据进行转换,得到与所述第二数据在所述预设神经网络的散度上匹配的第四数据;
获取所述第二数据与所述第三数据之间转换的第一转换时间,以及所述第一数据与所述第四数据之间转换的第二转换时间,并根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系。
可选地,所述根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系的步骤包括:
将所述第一转换难易程度系数与所述第二转换难易程度系数对比,确定所述第一转换难易程度系数与所述第二转换难易程度系数之间的大小关系;
若所述大小关系为第一转换难易程度系数大于第二转换难易程度系数,则确定所述第一数据构成所述因果关系的原因,所述第二数据构成所述因果关系中的结果;
若所述大小关系为第一转换难易程度系数小于第二转换难易程度系数,则确定所述第二数据构成所述因果关系的原因,所述第一数据构成所述因果关系中的结果。
可选地,所述基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据的步骤包括:
将所述第一数据作为指引,基于所述预设神经网络中的生成器对所述第二数据进行转换,得到中间数据;
基于预设神经网络中的判别器,对所述中间数据进行判别,确定所述第一数据与所述中间数据之间的散度值;
根据所述散度值,确定与所述第一数据在所述预设神经网络的散度上匹配的第三数据。
可选地,所述基于预设神经网络中的判别器,对所述中间数据进行判别,确定所述第一数据与所述中间数据之间的散度值的步骤包括:
基于预设神经网络中的判别器,对所述中间数据进行判别,生成所述中间数据的第一概率分布;
获取所述第一数据的第二概率分布,并根据所述第一概率分布和所述第二概率分布,生成所述第一数据与所述中间数据之间的散度值。
可选地,所述根据所述散度值,确定与所述第一数据在所述预设神经网络的散度上匹配的第三数据的步骤包括:
判断所述散度值是否小于预设阈值,若小于预设阈值,则将所述中间数据确定为所述第三数据;
若所述散度值不小于所述预设阈值,则根据所述散度值,执行基于所述预设神经网络中的生成器对所述第二数据进行转换的步骤,直到所述散度值小于预设阈值。
可选地,所述将所述中间数据确定为所述第三数据的步骤之后,所述方法包括:
查找对所述第二数据首次转换的第一时间点,以及确定所述第三数据的第二时间点;
根据所述第一时间点和所述第二时间点,生成与所述第三数据对应的第一转换时间。
可选地,所述获取第一数据和第二数据的步骤之前,所述方法还包括:
获取具有预设因果关系的第一数据集和第二数据集,并基于预设神经网络,对所述第一数据集和所述第二数据集进行处理,生成处理结果;
判断所述处理结果中的因果关系,与所述预设因果关系是否一致,若一致,则基于预设神经网络对第一数据和第二数据处理。
进一步地,为实现上述目的,本发明还提供一种因果关系的确定装置,所述因果关系的确定装置包括:
获取模块,用于获取第一数据和第二数据,并基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据;
转换模块,用于基于所述预设神经网络和第二数据,对所述第一数据进行转换,得到与所述第二数据在所述预设神经网络的散度上匹配的第四数据;
确定模块,用于获取所述第二数据与所述第三数据之间转换的第一转换时间,以及所述第一数据与所述第四数据之间转换的第二转换时间,并根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系。
进一步地,为实现上述目的,本发明还提供一种因果关系的确定设备,所述因果关系的确定设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的因果关系的确定程序,所述因果关系的确定程序被所述处理器执行时实现如上述所述的因果关系的确定方法的步骤。
进一步地,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有因果关系的确定程序,所述因果关系的确定程序被处理器执行时实现如上所述的因果关系的确定方法的步骤。
本发明的因果关系的确定方法、装置、设备及可读存储介质,与现有技术难以推断数据间因果关系相比,本发明采用的手段为:获取第一数据和第二数据,并以第一数据为参照,通过预设神经网络对第二数据进行转换,得到与第一数据在预设神经网络的散度上匹配的第三数据;同时以第二数据为参照,通过预设神经网络对第一数据进行转换,得到与第二数据在预设神经网络的散度上匹配的第四数据;进而获取第二数据与第三数据之间转换的第一转换时间,以及第一数据与第四数据之间转换的第二转换时间,并依据第一转换时间对应的第一转换难易程度系数,以及与第二转换时间对应的第二转换难易程度系数,来确定第一数据与第二数据之间的因果关系。其中,第一转换时间为形成第三数据的时长,其对应的第一转换难易程度系数表征将第二数据转换为与第一数据匹配的第三数据的难易程度,第二转换时间为形成第四数据的时长,其对应的第二转换难易程度系数表征将第一数据转换为与第二数据匹配的第四数据的难易程度。时长越短、对应的系数越小,则转换越容易,构成因果关系中的因;时长越长、对应的系数越大,则转换越困难,构成因果关系中的果;以此,通过第一转换时间与第二转换时间分别对应的第一转换难易程度系数和第二转换难易程度系数之间的大小关系,来准确确定第一数据和第二数据之间的因果关系。克服了现有技术中难以推断数据间因果关系的缺陷,有利于数据分析的精度提升。
附图说明
图1为本发明因果关系的确定设备实施例方案涉及的设备硬件运行环境的结构示意图;
图2为本发明因果关系的确定方法第一实施例的流程示意图;
图3为本发明因果关系的确定方法第三实施例的流程示意图;
图4为本发明因果关系的确定装置较佳实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提供一种因果关系的确定设备,参照图1,图1为本发明因果关系的确定设备实施例方案涉及的设备硬件运行环境的结构示意图。
如图1所示,该因果关系的确定设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
本领域技术人员可以理解,图1中示出的因果关系的确定设备的硬件结构并不构成对因果关系的确定设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及因果关系的确定程序。其中,操作系统是管理和控制因果关系的确定设备与软件资源的程序,支持网络通信模块、用户接口模块、因果关系的确定程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1004;用户接口模块用于管理和控制用户接口1003。
在图1所示的因果关系的确定设备硬件结构中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;处理器1001可以调用存储器1005中存储的因果关系的确定程序,并执行以下操作:
获取第一数据和第二数据,并基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据;
基于所述预设神经网络和第二数据,对所述第一数据进行转换,得到与所述第二数据在所述预设神经网络的散度上匹配的第四数据;
获取所述第二数据与所述第三数据之间转换的第一转换时间,以及所述第一数据与所述第四数据之间转换的第二转换时间,并根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系。
进一步地,所述根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系的步骤包括:
将所述第一转换难易程度系数与所述第二转换难易程度系数对比,确定所述第一转换难易程度系数与所述第二转换难易程度系数之间的大小关系;
若所述大小关系为第一转换难易程度系数大于第二转换难易程度系数,则确定所述第一数据构成所述因果关系的原因,所述第二数据构成所述因果关系中的结果;
若所述大小关系为第一转换难易程度系数小于第二转换难易程度系数,则确定所述第二数据构成所述因果关系的原因,所述第一数据构成所述因果关系中的结果。
进一步地,所述基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据的步骤包括:
将所述第一数据作为指引,基于所述预设神经网络中的生成器对所述第二数据进行转换,得到中间数据;
基于预设神经网络中的判别器,对所述中间数据进行判别,确定所述第一数据与所述中间数据之间的散度值;
根据所述散度值,确定与所述第一数据在所述预设神经网络的散度上匹配的第三数据。
进一步地,所述基于预设神经网络中的判别器,对所述中间数据进行判别,确定所述第一数据与所述中间数据之间的散度值的步骤包括:
基于预设神经网络中的判别器,对所述中间数据进行判别,生成所述中间数据的第一概率分布;
获取所述第一数据的第二概率分布,并根据所述第一概率分布和所述第二概率分布,生成所述第一数据与所述中间数据之间的散度值。
进一步地,所述根据所述散度值,确定与所述第一数据在所述预设神经网络的散度上匹配的第三数据的步骤包括:
判断所述散度值是否小于预设阈值,若小于预设阈值,则将所述中间数据确定为所述第三数据;
若所述散度值不小于所述预设阈值,则根据所述散度值,执行基于所述预设神经网络中的生成器对所述第二数据进行转换的步骤,直到所述散度值小于预设阈值。
进一步地,所述将所述中间数据确定为所述第三数据的步骤之后,处理器1001可以调用存储器1005中存储的因果关系的确定程序,并执行以下操作:
查找对所述第二数据首次转换的第一时间点,以及确定所述第三数据的第二时间点;
根据所述第一时间点和所述第二时间点,生成与所述第三数据对应的第一转换时间。
进一步地,所述获取第一数据和第二数据的步骤之前,处理器1001可以调用存储器1005中存储的因果关系的确定程序,并执行以下操作:
获取具有预设因果关系的第一数据集和第二数据集,并基于预设神经网络,对所述第一数据集和所述第二数据集进行处理,生成处理结果;
判断所述处理结果中的因果关系,与所述预设因果关系是否一致,若一致,则基于预设神经网络对第一数据和第二数据处理。
本发明因果关系的确定设备的具体实施方式与下述因果关系的确定方法各实施例基本相同,在此不再赘述。
本发明还提供一种因果关系的确定方法。
参照图2,图2为本发明因果关系的确定方法第一实施例的流程示意图。
本发明实施例提供了因果关系的确定方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。具体地,本实施例中的因果关系的确定方法包括:
步骤S10,获取第一数据和第二数据,并基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据;
本实施例中因果关系的确定方法应用于确定设备,该确定设备可以是服务器,也可以是客户端。对于服务器,则与多个具有因果关系确定需求的客户端通信连接,本实施例以客户端为例进行说明。其中,客户端部署有预设神经网络,并且该预设神经网络优选为对抗神经网络(GAN,Generative Adversarial Network),对抗神经网络中包括有生成器和判别器。由生成器生成仿真的信息去欺骗判别器,判别器则用以区分仿真的信息和真实的信息;最终实现生成器生成足以“以假乱真”的信息,判别器则难以判断生成器生成信息的真假。本实施借助预设神经网络分析数据之间的因果关系。
具体地,将具有因果关系解释需求的数据作为第一数据和第二数据,并通过预设神经网络和第一数据,对第二数据进行转换。将第一数据作为参照,通过预设神经网络中的生成器对第二数据进行转换,生成为与第一数据相似的仿真数据。并且,通过预设神经网络中的判别器对生成的仿真数据进行判别,通过判别的难易程度来生成与第一数据在预设神经网络的散度上匹配的第三数据。其中,散度用于比较两个概率分布的接近程度,本实施例用预设神经网络的散度来表征经预设神经网络处理后的仿真数据与真实数据之间的相似度。散度上匹配的第三数据,表征通过生成器生成的第三数据与第一数据之间的相似度较高,难以通过判别器判别。
步骤S20,基于所述预设神经网络和第二数据,对所述第一数据进行转换,得到与所述第二数据在所述预设神经网络的散度上匹配的第四数据;
进一步地,对于第一数据,则通过预设神经网络和第二数据进行转换。将第二数据作为参照,由预设神经网络中的生成器对第一数据进行转换,生成与第二数据相似的仿真数据。同样地,通过预设神经网络中的判别器对生成的仿真数据进行判别,生成与第二数据在预设神经网络的散度上匹配的第四数据,体现与第二数据之间的高度相似性。
步骤S30,获取所述第二数据与所述第三数据之间转换的第一转换时间,以及所述第一数据与所述第四数据之间转换的第二转换时间,并根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系。
更进一步地,在对第二数据进行转换的过程中,对转换的时长进行记录,得到生成第三数据所花费的时长,作为第二数据与第三数据之间的第一转换时间。同时,对于第一数据的转换,也记录时长,得到生成第四数据所花费的时长,作为第一数据与第四数据之间的第二转换时间。时长的差异反应了转换的难易程度,转换所花费的时长越短,转换越容易,反之则转换越难。而转换的过程体现了原因和结果之间逻辑关系的推导过程,转换越容易,则推导越容易,体现由原因向结果的推导。转换越难,则推导越不容易,体现由结果向原因的推导。因此,可通过转换所花费的时长所表征的难易程度,来体现数据之间的因果关系。即由第一转换时间和第二转换时间之间的大小关系,来确定第一数据和第二数据之间的因果关系。具体地,根据第一转换时间对应的第一转换难易程度系数,与第二转换时间对应的第二转换难易程度系数,确定第一数据与第二数据之间的因果关系的步骤包括:
步骤S31,将所述第一转换难易程度系数与所述第二转换难易程度系数对比,确定所述第一转换难易程度系数与所述第二转换难易程度系数之间的大小关系;
步骤S32,若所述大小关系为第一转换难易程度系数大于第二转换难易程度系数,则确定所述第一数据构成所述因果关系的原因,所述第二数据构成所述因果关系中的结果;
步骤S33,若所述大小关系为第一转换难易程度系数小于第二转换难易程度系数,则确定所述第二数据构成所述因果关系的原因,所述第一数据构成所述因果关系中的结果。
更进一步地,将第一转换时间和第二转换时间对比,确定两者之间的大小关系。若经对比确定大小关系为第一转换时间大于第二转换时间,则说明第二数据向第一数据转换的时间长,而第一数据向第二数据转换的时间短,故可确定第一数据构成因果关系中的原因,第二数据构成用过关系中的结果。反之若经对比确定大小关系为第一转换时间小于第二转换时间,则说明第二数据向第一数据转换的时间短,而第一数据向第二数据转换的时间长,故可确定第二数据构成因果关系中的原因,第一数据构成用过关系中的结果。
需要说明的是,对于第一转换时间和第二转换时间的大小关系相同的情况,难以区分第一数据和第二数据之间的因果关系,则输出第一数据和第二数据之间不存在因果关系的提示信息。此外,为了防止转换时间过长,预先设定表征转换时长超出正常转换时长的预设时间阈值,当第一转换时间和第二转换时间中均大于该预设时间阈值,则说明第一数据难以向第二数据转换,且第二数据也难以向第一数据转换,第一数据和第二数据之间不存在原因和结果之间的逻辑关系,故而输出不存在因果关系的提示信息。当第一转换时间和第二转换时间中存在任一项大于预设时间阈值,则根据不大于预设时间阈值的转换时间,确定第一数据和第二数据之间的因果关系。如若第一转换时间大于预设时间阈值,而第二转换时间不大于预设之间阈值,则依据第二转换时间确定第一数据和第二数据之间的因果关系。因第二转换时间为第一数据向第二数据转换的时间,第二转换时间大于预设时间阈值,则说明第一数据向第二数据转换的时间短,故第一数据构成因果关系中的原因,而第二数据构成因果关系中的结果。以此,依据第一转换时间和第二转换时间之间的大小关系,确定第一数据和第二数据之间的因果关系。
本发明的因果关系的确定方法,与现有技术难以推断数据间因果关系相比,本发明采用的手段为:获取第一数据和第二数据,并以第一数据为参照,通过预设神经网络对第二数据进行转换,得到与第一数据在预设神经网络的散度上匹配的第三数据;同时以第二数据为参照,通过预设神经网络对第一数据进行转换,得到与第二数据在预设神经网络的散度上匹配的第四数据;进而获取第二数据与第三数据之间转换的第一转换时间,以及第一数据与第四数据之间转换的第二转换时间,并依据第一转换时间对应的第一转换难易程度系数,以及与第二转换时间对应的第二转换难易程度系数,来确定第一数据与第二数据之间的因果关系。其中,第一转换时间为形成第三数据的时长,其对应的第一转换难易程度系数表征将第二数据转换为与第一数据匹配的第三数据的难易程度,第二转换时间为形成第四数据的时长,其对应的第二转换难易程度系数表征将第一数据转换为与第二数据匹配的第四数据的难易程度。时长越短、对应的系数越小,则转换越容易,构成因果关系中的因;时长越长、对应的系数越大,则转换越困难,构成因果关系中的果;以此,通过第一转换时间与第二转换时间分别对应的第一转换难易程度系数和第二转换难易程度系数之间的大小关系,来准确确定第一数据和第二数据之间的因果关系。克服了现有技术中难以推断数据间因果关系的缺陷,有利于数据分析的精度提升。
进一步地,基于本发明因果关系的确定方法的第一实施例,提出本发明因果关系的确定方法第二实施例。
所述因果关系的确定方法第二实施例与所述因果关系的确定方法第一实施例的区别在于,所述基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据的步骤包括:
步骤S14,将所述第一数据作为指引,基于所述预设神经网络中的生成器对所述第二数据进行转换,得到中间数据;
步骤S15,基于预设神经网络中的判别器,对所述中间数据进行判别,确定所述第一数据与所述中间数据之间的散度值;
本实施例通过预设神经网络和第一数据对第二数据进行转换,得到与第一数据在预设神经网络的散度上匹配的第三数据。具体地,以第一数据作为指引,由预设神经网络中的生成器对第二数据进行转换,得到转换的中间数据。此后,通过预设神经网络中的判别器对转换的中间数据进行判别,将中间数据从第一数据中区分出来,并生成第一数据与中间数据之间的散度值。具体地,基于预设神经网络中的判别器,对中间数据进行判别,确定第一数据与中间数据之间的散度值的步骤包括:
步骤S151,基于预设神经网络中的判别器,对所述中间数据进行判别,生成所述中间数据的第一概率分布;
步骤S152,获取所述第一数据的第二概率分布,并根据所述第一概率分布和所述第二概率分布,生成所述第一数据与所述中间数据之间的散度值。
进一步地,调用预设神经网络中的判别器,对中间数据进行判别,生成中间数据的第一概率分布,通过第一概率分布描述中间数据所含有的信息。同时针对第一数据生成第二概率分布,由第二概率分布描述第一数据所含有的信息。进而对第一概率分布和第二概率分布进行计算,生成两者之间的散度值;其中,计算可以是计算两者对数差的期望值,所得到的期望值结果即为散度值。
步骤S16,根据所述散度值,确定与所述第一数据在所述预设神经网络的散度上匹配的第三数据。
更进一步地,因散度值用于表征通过预设神经网络转换得到的数据与真实数据之间的相似性,故可通过散度值所表征的相似性高低,确定与第一数据在散度上匹配的第三数据,即与第一数据相似性高的第三数据。具体地,根据散度值,确定与第一数据在预设神经网络的散度上匹配的第三数据的步骤包括:
步骤S161,判断所述散度值是否小于预设阈值,若小于预设阈值,则将所述中间数据确定为所述第三数据;
步骤S162,若所述散度值不小于所述预设阈值,则根据所述散度值,执行基于所述预设神经网络中的生成器对所述第二数据进行转换的步骤,直到所述散度值小于预设阈值。
进一步地,预先设置表征相似性高低的预设阈值,将所生成的散度值和该预设阈值对比,判断散度值是否小于预设阈值。若经对比确定散度值小于预设阈值,则说明第一数据的概率分布和中间数据的概率分布之间接近程度较高,从而将中间数据确定为与第一数据具有较高相似性的第三数据。反之,若经对比确定散度值不小于预设阈值,则说明经预设神经网络处理得到的中间数据,与第一数据之间的差别较大,故而需要通过预设神经网络继续以第一数据为参考,对第二数据迭代转换。
更进一步地,在对第二数据迭代转换过程中,将散度值作为参考,由预设神经网络依据第一数据将第二数据朝向缩小差别的方向转换,再次生成中间数据进行判别得到散度值,确定是否小于预设阈值。若小于预设阈值,则将该中间数据确定为第三数据。若仍不小于预设阈值,则继续转换得到新的中间数据;如此循环,直到所生成的散度值小于预设阈值,得到中间数据确定为与第一数据在预设神经网络的散度上匹配的第三数据。
进一步地,所述将所述中间数据确定为所述第三数据的步骤之后,所述方法包括:
步骤a1,查找对所述第二数据首次转换的第一时间点,以及确定所述第三数据的第二时间点;
步骤a2,根据所述第一时间点和所述第二时间点,生成与所述第三数据对应的第一转换时间。
本实施例在开始对第二数据进行首次转换时,对转换的时间点进行记录,记录为第一时间点。在得到第三数据后,查找该记录的第一时间点,同时记录当前得到第三数据的时间点,作为生成第三数据的第二时间点。在第一时间点和第二时间点之间对比,得到两者之间的时间间隔。该时间间隔即为转换得到第三数据所花费的时间,将其作为与第三数据对应的第一转换时间,以用于结合第四数据对应的第二转换时间,来确定第一数据与第二数据之间的因果关系。
需要说明的是,在生成第四数据时,以第二数据作为指引,并通过预设神经网络对第一数据进行转换,得到中间数据和第二数据进行判别,生成两者之间的散度值,以此确定第四数据。其中,该第四数据的具体生成过程,与上述第三数据的生成过程具有相似性,在此不做赘述。
本实施例设置循环更新转换机制,对于每次转换得到的中间数据,均和第一数据进行散度值计算,直到所计算得到的散度值大于预设阈值后,将中间数据作为接近第一数据的第三数据。进而由得到第三数据整个过程所花费的时间长短体现转换的难易程度,通过准确确定第三数据来提高因果关系确定的准确性。
进一步地,请参照图3,基于本发明因果关系的确定方法的第一或第二实施例,提出本发明因果关系的确定方法第三实施例。
所述因果关系的确定方法第三实施例与所述因果关系的确定方法第一或第二实施例的区别在于,所述获取第一数据和第二数据的步骤之前,所述方法还包括:
步骤S40,获取具有预设因果关系的第一数据集和第二数据集,并基于预设神经网络,对所述第一数据集和所述第二数据集进行处理,生成处理结果;
步骤S50,判断所述处理结果中的因果关系,与所述预设因果关系是否一致,若一致,则基于预设神经网络对第一数据和第二数据处理。
本实施例对预设神经网络的有效性进行确定,即确定预设神经网络是否可有效对数据间的因果关系进行判定。具体地,获取具有预设因果关系的第一数据集和第二数据集,第一数据集和第二数据集中均包含有多项数据。预设因果关系表征第一数据集中数据和第二数据集中数据之间设定有明确的因果逻辑关系。如第一数据集中的数据为因果关系中的原因,第二数据集中的数据为因果关系中的结果。
进一步地,通过预设神经网络,对第一数据集和第二数据集进行处理,生成处理结果,该处理结果表征对第一数据集和第二数据集进行判断,所生成两者中各项数据之间原因和结果的因果关系。进而将处理结果所表征的因果关系和预设因果关系对比,判断两者是否一致,若一致则说明通过预设神经网络处理所得到的因果关系,与原本的因果关系一致,所处理得到的结果准确,可将预设神经网络用于因果关系的判定,用于对第一数据和第二数据进行处理,以确定两者之间的因果关系。
反之,若处理所得到的因果关系与原本的因果关系不一致,则说明处理结果不准确,不能将预设神经网络用于因果关系的判定,而需要重新设定更新参数进行判定。若更新参数后的预设神经网络可准确得出处理结果,则用更新参数后的预设神经网络对第一数据和第二数据进行处理。否则继续更新参数,如此循环,直到得到准确的处理结果后,用于对第一数据和第二数据进行处理,判断两者之间的因果关系。
需要说明的是,第一数据集和第二数据集中均包含多项具有预设因果关系的数据,所生成的处理结果中则包含多项数据之间的因果关系,在确定处理结果中的因果关系与预设因果关系是否一致时,其实质为确定各项数据之间的因果关系是否与预设因果关系一致。考虑到处理过程中外界环境因素的影响,难以到达各项因果关系均与预设因果关系一致的情形,故预先依据需求设定预设阈值,如95%。当各项因果关系中与预设因果关系一致的比例大于预设阈值,则判定为一致,反之则判定为不一致而需要更新参数重新处理,直到比例大于预设阈值。
本实施例通过确定预设神经网络是否可有效对数据间的因果关系进行判定,来确保对第一数据和第二数据之间因果关系判定的准确性。同时设置比例机制,在确保准确判定的同时提升判定效率。
本发明还提供一种因果关系的确定装置。
参照图4,图4为本发明因果关系的确定装置第一实施例的功能模块示意图。所述因果关系的确定装置包括:
获取模块,用于获取第一数据和第二数据,并基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据;
转换模块,用于基于所述预设神经网络和第二数据,对所述第一数据进行转换,得到与所述第二数据在所述预设神经网络的散度上匹配的第四数据;
确定模块,用于获取所述第二数据与所述第三数据之间转换的第一转换时间,以及所述第一数据与所述第四数据之间转换的第二转换时间,并根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系。
进一步地,所述确定模块包括:
第一确定单元,用于将所述第一转换难易程度系数与所述第二转换难易程度系数对比,确定所述第一转换难易程度系数与所述第二转换难易程度系数之间的大小关系;
第一构成单元,用于若所述大小关系为第一转换难易程度系数大于第二转换难易程度系数,则确定所述第一数据构成所述因果关系的原因,所述第二数据构成所述因果关系中的结果;
第二构成单元,用于若所述大小关系为第一转换难易程度系数小于第二转换难易程度系数,则确定所述第二数据构成所述因果关系的原因,所述第一数据构成所述因果关系中的结果。
进一步地,所述获取模块包括:
转换单元,用于将所述第一数据作为指引,基于所述预设神经网络中的生成器对所述第二数据进行转换,得到中间数据;
判别单元,用于基于预设神经网络中的判别器,对所述中间数据进行判别,确定所述第一数据与所述中间数据之间的散度值;
确定单元,用于根据所述散度值,确定与所述第一数据在所述预设神经网络的散度上匹配的第三数据。
进一步地,所述判别单元还用于:
基于预设神经网络中的判别器,对所述中间数据进行判别,生成所述中间数据的第一概率分布;
获取所述第一数据的第二概率分布,并根据所述第一概率分布和所述第二概率分布,生成所述第一数据与所述中间数据之间的散度值。
进一步地,所述确定单元还用于:
判断所述散度值是否小于预设阈值,若小于预设阈值,则将所述中间数据确定为所述第三数据;
若所述散度值不小于所述预设阈值,则根据所述散度值,执行基于所述预设神经网络中的生成器对所述第二数据进行转换的步骤,直到所述散度值小于预设阈值。
进一步地,所述确定单元还用于:
查找对所述第二数据首次转换的第一时间点,以及确定所述第三数据的第二时间点;
根据所述第一时间点和所述第二时间点,生成与所述第三数据对应的第一转换时间。
进一步地,所述因果关系的确定装置还包括:
生成模块,用于获取具有预设因果关系的第一数据集和第二数据集,并基于预设神经网络,对所述第一数据集和所述第二数据集进行处理,生成处理结果;
判断模块,用于判断所述处理结果中的因果关系,与所述预设因果关系是否一致,若一致,则基于预设神经网络对第一数据和第二数据处理。
本发明因果关系的确定装置具体实施方式与上述因果关系的确定方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种可读存储介质。
可读存储介质上存储有因果关系的确定程序,因果关系的确定程序被处理器执行时实现如上所述的因果关系的确定方法的步骤。
本发明可读存储介质可以是计算机可读存储介质,其具体实施方式与上述因果关系的确定方法各实施例基本相同,在此不再赘述。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。

Claims (10)

1.一种因果关系的确定方法,其特征在于,所述因果关系的确定方法包括以下步骤:
获取第一数据和第二数据,并基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据;
基于所述预设神经网络和第二数据,对所述第一数据进行转换,得到与所述第二数据在所述预设神经网络的散度上匹配的第四数据;
获取所述第二数据与所述第三数据之间转换的第一转换时间,以及所述第一数据与所述第四数据之间转换的第二转换时间,并根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系。
2.如权利要求1所述的因果关系的确定方法,其特征在于,所述根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系的步骤包括:
将所述第一转换难易程度系数与所述第二转换难易程度系数对比,确定所述第一转换难易程度系数与所述第二转换难易程度系数之间的大小关系;
若所述大小关系为第一转换难易程度系数大于第二转换难易程度系数,则确定所述第一数据构成所述因果关系的原因,所述第二数据构成所述因果关系中的结果;
若所述大小关系为第一转换难易程度系数小于第二转换难易程度系数,则确定所述第二数据构成所述因果关系的原因,所述第一数据构成所述因果关系中的结果。
3.如权利要求1所述的因果关系的确定方法,其特征在于,所述基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据的步骤包括:
将所述第一数据作为指引,基于所述预设神经网络中的生成器对所述第二数据进行转换,得到中间数据;
基于预设神经网络中的判别器,对所述中间数据进行判别,确定所述第一数据与所述中间数据之间的散度值;
根据所述散度值,确定与所述第一数据在所述预设神经网络的散度上匹配的第三数据。
4.如权利要求3所述的因果关系的确定方法,其特征在于,所述基于预设神经网络中的判别器,对所述中间数据进行判别,确定所述第一数据与所述中间数据之间的散度值的步骤包括:
基于预设神经网络中的判别器,对所述中间数据进行判别,生成所述中间数据的第一概率分布;
获取所述第一数据的第二概率分布,并根据所述第一概率分布和所述第二概率分布,生成所述第一数据与所述中间数据之间的散度值。
5.如权利要求3所述的因果关系的确定方法,其特征在于,所述根据所述散度值,确定与所述第一数据在所述预设神经网络的散度上匹配的第三数据的步骤包括:
判断所述散度值是否小于预设阈值,若小于预设阈值,则将所述中间数据确定为所述第三数据;
若所述散度值不小于所述预设阈值,则根据所述散度值,执行基于所述预设神经网络中的生成器对所述第二数据进行转换的步骤,直到所述散度值小于预设阈值。
6.如权利要求5所述的因果关系的确定方法,其特征在于,所述将所述中间数据确定为所述第三数据的步骤之后,所述方法包括:
查找对所述第二数据首次转换的第一时间点,以及确定所述第三数据的第二时间点;
根据所述第一时间点和所述第二时间点,生成与所述第三数据对应的第一转换时间。
7.如权利要求1-6任一项所述的因果关系的确定方法,其特征在于,所述获取第一数据和第二数据的步骤之前,所述方法还包括:
获取具有预设因果关系的第一数据集和第二数据集,并基于预设神经网络,对所述第一数据集和所述第二数据集进行处理,生成处理结果;
判断所述处理结果中的因果关系,与所述预设因果关系是否一致,若一致,则基于预设神经网络对第一数据和第二数据处理。
8.一种因果关系的确定装置,其特征在于,所述因果关系的确定装置包括:
获取模块,用于获取第一数据和第二数据,并基于预设神经网络和第一数据,对所述第二数据进行转换,得到与所述第一数据在所述预设神经网络的散度上匹配的第三数据;
转换模块,用于基于所述预设神经网络和第二数据,对所述第一数据进行转换,得到与所述第二数据在所述预设神经网络的散度上匹配的第四数据;
确定模块,用于获取所述第二数据与所述第三数据之间转换的第一转换时间,以及所述第一数据与所述第四数据之间转换的第二转换时间,并根据所述第一转换时间对应的第一转换难易程度系数,与所述第二转换时间对应的第二转换难易程度系数,确定所述第一数据与所述第二数据之间的因果关系。
9.一种因果关系的确定设备,其特征在于,所述因果关系的确定设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的因果关系的确定程序,所述因果关系的确定程序被所述处理器执行时实现如权利要求1-7中任一项所述因果关系的确定方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有因果关系的确定程序,所述因果关系的确定程序被处理器执行时实现如权利要求1-7中任一项所述因果关系的确定方法的步骤。
CN202010891985.7A 2020-08-27 2020-08-27 因果关系的确定方法、装置、设备及可读存储介质 Pending CN112000856A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010891985.7A CN112000856A (zh) 2020-08-27 2020-08-27 因果关系的确定方法、装置、设备及可读存储介质
PCT/CN2021/094934 WO2022041866A1 (zh) 2020-08-27 2021-05-20 因果关系的确定方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010891985.7A CN112000856A (zh) 2020-08-27 2020-08-27 因果关系的确定方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112000856A true CN112000856A (zh) 2020-11-27

Family

ID=73465986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010891985.7A Pending CN112000856A (zh) 2020-08-27 2020-08-27 因果关系的确定方法、装置、设备及可读存储介质

Country Status (2)

Country Link
CN (1) CN112000856A (zh)
WO (1) WO2022041866A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022041866A1 (zh) * 2020-08-27 2022-03-03 深圳前海微众银行股份有限公司 因果关系的确定方法、装置、设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762319B2 (en) * 2008-05-21 2014-06-24 New York University Method, system, and computer-accessible medium for inferring and/or determining causation in time course data with temporal logic
CN101408769B (zh) * 2008-11-21 2011-01-12 冶金自动化研究设计院 一种基于乘积arima模型的在线能源预测系统及方法
US10528669B2 (en) * 2018-03-20 2020-01-07 Wipro Limited Method and device for extracting causal from natural language sentences for intelligent systems
CN111488740B (zh) * 2020-03-27 2023-12-22 北京百度网讯科技有限公司 一种因果关系的判别方法、装置、电子设备及存储介质
CN112000856A (zh) * 2020-08-27 2020-11-27 深圳前海微众银行股份有限公司 因果关系的确定方法、装置、设备及可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022041866A1 (zh) * 2020-08-27 2022-03-03 深圳前海微众银行股份有限公司 因果关系的确定方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
WO2022041866A1 (zh) 2022-03-03

Similar Documents

Publication Publication Date Title
KR102247179B1 (ko) 이상행위탐지모델의 비지도 학습을 위한 xai 기반 정상학습데이터 생성방법 및 장치
CN111783812B (zh) 违禁图像识别方法、装置和计算机可读存储介质
US20220245465A1 (en) Picture searching method and apparatus, electronic device and computer readable storage medium
CN112559538A (zh) 关联关系生成方法、装置、计算机设备和存储介质
CN115601629A (zh) 模型训练方法、图像识别方法、介质、装置和计算设备
Kusa et al. Vombat: A tool for visualising evaluation measure behaviour in high-recall search tasks
CN113657538B (zh) 模型训练、数据分类方法、装置、设备、存储介质及产品
CN112000856A (zh) 因果关系的确定方法、装置、设备及可读存储介质
AU2021251463B2 (en) Generating performance predictions with uncertainty intervals
US11539730B2 (en) Method, device, and computer program product for abnormality detection
CN114756401B (zh) 基于日志的异常节点检测方法、装置、设备及介质
US11688175B2 (en) Methods and systems for the automated quality assurance of annotated images
CN113361455B (zh) 人脸鉴伪模型的训练方法、相关装置及计算机程序产品
CN109446325B (zh) 一种高正确率的自然语言分类器系统
KR20210024871A (ko) 기계학습 모델 관리 시스템과 방법 및 영상 분석 장치
CN116028941B (zh) 接口的漏洞检测方法、装置、存储介质及设备
CN113836291B (zh) 数据处理方法、装置、设备和存储介质
CN114255219B (zh) 征象识别方法、装置、电子设备和存储介质
CN117454204A (zh) Api请求功能的确定方法、装置、设备及存储介质
CN111984836A (zh) 因果关系的确定方法、装置、设备及可读存储介质
CN117371506A (zh) 模型训练、模型测试方法、装置、电子设备及存储介质
WO2023167824A1 (en) Automated key-value pair extraction
CN118245362A (zh) 一种页面测试方法、装置、电子设备及存储介质
CN117407878A (zh) 数据处理方法、装置、设备和存储介质
KR20230067422A (ko) 적대적 변형된 이미지 탐지 방법 및 적대적 변형된 이미지 탐지 방법을 실행시키도록 기록매체에 저장된 컴퓨터 프로그램

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201127