CN115240843A - 基于结构因果模型的公平性预测系统 - Google Patents

基于结构因果模型的公平性预测系统 Download PDF

Info

Publication number
CN115240843A
CN115240843A CN202210826417.8A CN202210826417A CN115240843A CN 115240843 A CN115240843 A CN 115240843A CN 202210826417 A CN202210826417 A CN 202210826417A CN 115240843 A CN115240843 A CN 115240843A
Authority
CN
China
Prior art keywords
causal
model
fairness
decision
decision model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210826417.8A
Other languages
English (en)
Inventor
余国先
苏聪
王峻
崔立真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202210826417.8A priority Critical patent/CN115240843A/zh
Publication of CN115240843A publication Critical patent/CN115240843A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于结构因果模型的公平性预测系统,获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;根据通过目标函数优化后的预设机器学习算法作为决策模型;对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果;本发明仅以观测样本和先验因果图作为输入,无需繁琐的操作步骤即可获得最终的满足公平性要求的决策模型,具备良好的可用性。

Description

基于结构因果模型的公平性预测系统
技术领域
本发明涉及生物工程及人工智能技术领域,特别涉及一种基于结构因果模型的公平性预测系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术,并不必然构成现有技术。
随着大数据时代下数据量的爆炸式增长以及算力的提升,机器学习技术得到了长足发展,并且越来越多的被用于辅助或代替人们进行决策,特别是那些与民生息息相关且具有重要影响的领域。例如,使用机器学习技术能够有效地利用电子健康记录(EHR)做出针对患者的决策,可以提高诊断、治疗选择的效率并有效降低成本。机器学习模型通过学习历史数据的经验规律来改善计算机系统或算法的能力与性能。过去经历过提供医疗保健方面偏见的群体,很容易受到错误预测或医疗资源扣留的伤害。这些偏见的来源比较复杂,可能与由患者的敏感特征(如社会经济等)导致的历史护理差异、用于模型训练的患者电子健康记录数据中某类患者的代表性不足等有关。因而,在医疗保健等领域,机器学习算法的公平性问题逐渐引起研究人员、社会公众的关注。公平机器学习算法是指在决策过程中,不存在基于个体或群体的内在或后天特征的任何偏见或歧视。比起基于统计学的公平性定义,基于因果关系的公平性定义考虑了数据的生成机制,可以追溯引起不公平现象的根源,因此,越来越多的研究员从因果的角度出发提出了公平性概念,如总效应公平、反事实公平、特定路径公平等。但是由于检测技术的局限性以及法律和伦理约束等因素,现实中患者的许多特征是不可观测的,但是如果忽略这些特征的存在及对模型的影响,会导致错误的因果效应的评估(这些特征被称为潜在混淆因子)。在某些情况下因果效应不能从观测数据被唯一计算。如何消除潜在混淆因子的影响以及解决因果效应不可识别性问题,是当前公平机器学习技术将基于因果关系的公平性概念应用于医疗保健等领域中仍待提升的难点。
目前,针对历史数据呈现歧视问题的基于结构因果模型的处理方法有:在数据预处理阶段,通过重构数据集来消除敏感特征对决策的不公平路径的影响;在训练模型时,加入基于因果关系的公平性约束;在后处理阶段,通过重构模型修改算法的输出结果,使其满足反事实公平等方法。这些方法大多基于变量间没有潜在混淆因子的假设来简化因果效应的评估,然而,在实际应用场景中,特别是在医疗保健中,潜在混淆因子的存在是一个不可避免的事实。因而,这些忽略潜在混淆因子对模型影响的方法并不可靠。此外,这些方法大多只能处理单一的基于因果关系的公平性指标的因果效应不可识别情况,可扩展性差,但是不同的实际场景需要使用不同的公平性指标来评估,使得基于结构因果模型的公平机器学习技术还存在较多的改进空间。
发明内容
为了解决现有技术的不足,本发明提供了一种基于结构因果模型的公平性预测系统,仅以观测样本和先验因果图作为输入,无需繁琐的操作步骤即可获得最终的满足公平性要求的决策模型,具备良好的可用性。
为了实现上述目的,本发明采用如下技术方案:
本发明第一方面提供了一种基于结构因果模型的公平性预测系统。
一种基于结构因果模型的公平性预测系统,包括:
数据获取与预处理模块,被配置为:获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
参数化因果模型模块,被配置为:结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
初始决策模型训练模块,被配置为:根据通过目标函数优化后的预设机器学习算法作为决策模型;
决策模型后处理模块,被配置为:对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
本发明第二方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如下步骤:
获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
根据通过目标函数优化后的预设机器学习算法作为决策模型;
对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
本发明第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如下步骤:
获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
根据通过目标函数优化后的预设机器学习算法作为决策模型;
对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
与现有技术相比,本发明的有益效果是:
1、本发明借助响应变量函数来参数化因果模型,以此来捕获符合观测数据分布的所有因果模型,响应变量函数既能编码由潜在混淆因子导致的不确定性又有助于处理因果效应无法识别的问题,以便后续因果效应边界的计算;根据实际场景选择合适的机器学习算法来训练决策模型,为之后重构决策模型提供了一个更好的起点;通过限制敏感特征对决策的因果效应边界在公平性阈值之内来对训练好的决策模型进行重构,使得最终的决策模型满足公平性约束。
2、本发明借助响应变量函数可以有效地处理潜在混淆因子和解决各种因果效应不可识别性问题,特别是多种因果效应不可识别性问题的组合,因此本发明适用于各种基于结构因果模型的公平性指标;通过后处理的机制,使得本发明因地制宜,不拘泥于某个特定的机器学习算法,具有适应各临床实践场景的优势;此外,本系统仅以观测样本和先验因果图作为输入,无需繁琐的操作步骤即可获得最终的满足公平性要求的决策模型,具备良好的可用性。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1提供的基于结构因果模型的公平性预测系统的结构示意图。
图2为本发明实施例1提供的基于结构因果模型的公平性预测系统的公知方法流程图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1:
如图1和图2所示,本发明实施例1提供了一种基于结构因果模型的公平性预测系统,包括:
数据获取与预处理模块,被配置为:获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
参数化因果模型模块,被配置为:结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
初始决策模型训练模块,被配置为:根据通过目标函数优化后的预设机器学习算法作为决策模型;
决策模型后处理模块,被配置为:对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
具体的,所述系统的工作方法,包括以下过程:
S101,获取待解决问题的患者数据样本并进行离散化处理,以及获取由这些患者数据特征构成的因果图。
S1011,获取观测样本并进行离散化处理。
具体地,首先将患者特征转变为计算机可计算的形式,如对于人口统计学特征中的性别特征,将“男”表示为0,“女”表示为1等。然后根据数据的特点,将连续型数据转化为离散化数据,具体的离散化方法有等距、等频、STL 离散化算法等。
S1012,获取先验知识因果图。
具体地,可根据所研究问题的领域知识或(和)结合因果发现算法构建符合实际的因果图。因果图是一种有向无环图并以权重邻接矩阵的形式呈现,其中两变量间存在因果关系则以权重1表示,不存在因果关系则以权重0表示。
S102,参数化因果模型。
具体的,首先引入响应变量函数,将所有未知的外生变量(其中包括潜在混淆因子)映射到已知的有限域的空间内,以此来捕获符合观测数据分布的所有因果模型。然后可以明确地遍历所有可能的因果模型来计算最紧密的因果效应边界,便于S104中训练最终的满足公平性要求的决策模型。
具体的,所述步骤102的具体实现方式如下:
S1021,根据结构因果模型的定义,每个内生变量(即可观测变量)V都受其对应的一个外生变量UV的影响,以此来表示可观测变量V的不确定性。如果外生变量间存在相关关系,那么这些外生变量就是我们所说的潜在混淆因子。此外,每个可观测变量V都有一个因果结构方程v=fV(pa(V),uV),其中pa(V)表示该可观测变量V的父变量,以此来表示该观测变量的生成机制。由于所有观测变量的取值有限且已知它们的因果关系,可以将外生变量的值域映射到几个等价域内,并且每个等价域对应一个响应变量函数rV:domain(UV)→N,通过这一从U到R的映射变换后,每个可观测变量的结构方程被转换为有限数量的参数化映射函数,以可观测变量V为例,其结构方程变为
Figure BDA0003746784800000071
其数量为|V||Pa(V)|,或者如果该变量没有父变量,则其数量为|V|。
例如,有因果关系:X是Y的因,且X没有可观测父变量。此外,X和Y都只有两种取值,即X∈{x+,x-},Y∈{y+,y-},并且他们的响应函数变量分别为RX和 RY。对于X来说,由于X没有父变量,其响应函数变量只有两种取值,则其响应函数变量RX和响应函数
Figure BDA0003746784800000072
的定义如下:
Figure BDA0003746784800000073
类似的,Y的响应函数变量RY和响应函数
Figure BDA0003746784800000081
的可以被定义为如下形式:
Figure BDA0003746784800000082
Figure BDA0003746784800000083
然后,通过从U到R的函数映射,内生变量的联合分布P(v)可由原来的满足从Pa(V)到V函数映射的U的值u的概率之和P(v)=∑{u|V(u)=v}P(u)转变成如下式子计算:
Figure BDA0003746784800000084
其中,V(r)=v表示对于任意一个内生变量V∈V,
Figure BDA0003746784800000085
因此,公式(1)可以改写为如下形式:
Figure BDA0003746784800000086
其中t(·)是一个指示函数:
Figure BDA0003746784800000087
S1022,计算因果效应边界。
具体的,为了便于理解,这里使用总效应公平这一基于因果关系的公平性指标
Figure BDA0003746784800000088
其中
Figure BDA0003746784800000089
表示决策模型的输出,do(s+) 表示干预敏感特征S,使其强制取s+,来说明如何通过响应变量函数R来计算
Figure BDA00037467848000000810
的边界,通过从U到R的函数映射,
Figure BDA00037467848000000811
可以由包含R的式子表达,具体定义如下:
Figure BDA0003746784800000091
其中,V′=V\{S,Y},pa+(v)表示如果Pa(V)包含敏感特征S,则其值取s+, pa-(v)类似。
由此,观测变量的联合分布P(v)和基于因果的公平性指标(这里以
Figure BDA0003746784800000092
为例)都可表示为关于P(r)的线性函数。所有符合观测数据分布的因果模型P(r)都不能被区分,因此,计算
Figure BDA0003746784800000093
的边界相当于找到符合观测数据分布且使得
Figure BDA0003746784800000094
最大或最小的因果模型P(r),形式化定义如下:
Figure BDA0003746784800000095
Figure BDA0003746784800000096
其中,
Figure BDA0003746784800000097
表示观测数据分布,
Figure BDA0003746784800000098
可由公式(4)计算,P(v)可由公式 (2)计算。通过最大化或最小化公式(5)即可得到
Figure BDA0003746784800000099
的紧确界。
S103,选择合适的机器学习算法训练决策模型。
具体的,根据待解决的实际场景问题的特点,来选择合适的机器学习算法,并使用S1011预处理后的数据作为输入来训练模型,通过优化该机器学习算法的目标函数,得到一个精确度高,泛化能力强的初始决策模型。
例如,对于一个二分类问题,可以选择使用Logistic回归算法来构建初始决策模型。Logistic回归算法通过拟合一个逻辑函数(通常是sigmod函数
Figure BDA00037467848000000910
其中,z=wTx,x表示样本的特征,w表示需要训练的模型参数)来预测一个事件发生的概率。
Logistic回归算法的目标函数定义如下:
Figure BDA0003746784800000101
其中,n表示数据集样本数量,i表示第i个样本,可采用随机梯度下降法优化目标函数(6),得到精确度高、泛化能力较强的初始决策模型w。
S104,采用后处理机制重构决策模型,使其满足公平性约束。
具体的,通过限制敏感特征对决策的因果效应边界,来修改分类器的输出结果
Figure BDA0003746784800000102
使得修改后的输出结果
Figure BDA0003746784800000103
满足公平性约束。其优化目标是找到一个最优的概率映射函数
Figure BDA0003746784800000104
使得在最小化Y和
Figure BDA0003746784800000105
之间差异的同时,重构的分类器输出
Figure BDA0003746784800000106
满足公平性约束。形式化定义如下:
Figure BDA0003746784800000107
Figure BDA0003746784800000108
Figure BDA0003746784800000109
Figure BDA00037467848000001010
Figure BDA00037467848000001011
其中,
Figure BDA00037467848000001012
表示基于因果关系的公平性指标(例如,
Figure BDA00037467848000001013
), P(v)由公式(2)给出,分布
Figure BDA00037467848000001014
可以通过
Figure BDA00037467848000001015
得出,
Figure BDA00037467848000001016
表示S103选用的机器学习算法的目标函数。
此外,
Figure BDA00037467848000001017
其中
Figure BDA00037467848000001018
的形式化定义如下:
Figure BDA00037467848000001019
Figure BDA0003746784800000111
目标函数(7)是一个min-max优化问题,其中需要优化的变量包括响应函数变量P(r)和后处理函数映射
Figure BDA0003746784800000112
具体来说,使用粒子群优化算法PSO来进行求解目标函数(7)。PSO算法随机选择一组优化问题的解来初始化,并且将每个解称为一个“粒子”,在本发明中,粒子表示后处理函数映射
Figure BDA0003746784800000113
在PSO算法中,每个粒子都有一个飞行速度,并且每个粒子可以根据自己的飞行经验和其他同伴的飞行经验(即计算粒子的适应值)来调整其飞行方向和大小,以达到全局最优位置。具体来说,第i个粒子在第t轮迭代时其位置
Figure BDA0003746784800000114
的形式化定义为:
Figure BDA0003746784800000115
其中
Figure BDA0003746784800000116
表示该粒子的飞行速度,定义如下:
Figure BDA0003746784800000117
其中w表示权衡全局和局部飞行经验的惯性权重;
Figure BDA0003746784800000118
表示第i个粒子的最佳位置,即到当前迭代为止第i个粒子所到达的最佳位置坐标(即该粒子表示的最优解),而
Figure BDA0003746784800000119
表示种群的最优解;r1和r2是两个由均匀分布产生的随机数,其取值范围为[0,1];C1和C2分别表示认知系数和社会系数。
第i个粒子在第t轮迭代时其适应值的定义如下:
Figure BDA00037467848000001110
使用粒子群优化算法PSO优化目标函数(7)的具体流程如下:首先初始化一个种群,其中包括每个粒子的位置(即后处理函数映射
Figure BDA0003746784800000121
)、速度、个体最佳位置和群体最佳位置。然后执行算法主循环内的内容直到最大迭代次数。在主循环内,首先根据公式(9)和公式(10)计算每个粒子的速度和位置。然后根据当前位置,根据S102和公式(11)计算公平性指标的边界和每个粒子的适应值。最后,算法返回种群的最佳位置(即
Figure BDA0003746784800000122
),即得到最终的满足公平性约束的决策模型。
综上所述,本发明提出了基于结构因果模型的公平性预测系统;该系统首先借助响应变量函数来参数化因果模型,以此来捕获符合观测数据分布的所有因果模型,响应变量函数既能编码由潜在混淆因子导致的不确定性又有助于处理因果效应无法识别的问题,以便后续因果效应边界的计算;然后根据实际场景选择合适的机器学习算法来训练决策模型,为之后重构决策模型提供一个更好的起点。最后,通过限制敏感特征对决策的因果效应边界在公平性阈值之内来对训练好的决策模型进行重构,使得最终的决策模型满足公平性约束;本发明借助响应变量函数可以有效地处理潜在混淆因子和解决各种因果效应不可识别性问题,特别是多种因果效应不可识别性问题的组合。因此,本发明适用于各种基于结构因果模型的公平性指标。通过后处理的机制,使得本发明因地制宜,不拘泥于某个特定的机器学习算法,具有适应各临床实践场景的优势(例如可以采用病人的历史诊疗信息进行癌症发病程度的预测,或者进行癌症病人的情绪进行预测和识别等)。此外,本系统仅以观测样本和先验因果图作为输入,无需繁琐的操作步骤即可获得最终的满足公平性要求的决策模型,具备良好的可用性。
实施例2:
本发明实施例2提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如下步骤:
获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
根据通过目标函数优化后的预设机器学习算法作为决策模型;
对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
详细步骤与实施例1提供的系统工作方法相同,这里不再赘述。
实施例3:
本发明实施例3提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如下步骤:
获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
根据通过目标函数优化后的预设机器学习算法作为决策模型;
对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
详细步骤与实施例1提供的系统工作方法相同,这里不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于结构因果模型的公平性预测系统,其特征在于:
包括:
数据获取与预处理模块,被配置为:获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
参数化因果模型模块,被配置为:结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
初始决策模型训练模块,被配置为:根据通过目标函数优化后的预设机器学习算法作为决策模型;
决策模型后处理模块,被配置为:对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
2.如权利要求1所述的基于结构因果模型的公平性预测系统,其特征在于:
参数化因果模型模块中,包括:引入响应变量函数,将所有未知的外生变量映射到已知的有限域的空间内,捕获符合观测数据分布的所有因果模,遍历所有可能的因果模型来计算因果效应边界。
3.如权利要求2所述的基于结构因果模型的公平性预测系统,其特征在于:
每个可观测变量V都受其对应的一个外生变量UV的影响,所有可观测变量的取值有限且已知它们的因果关系,将外生变量UV的值域映射到多个等价域内,每个等价域对应一个响应变量函数rV:domain(UV)→N,通过从U到R的映射变换后,每个可观测变量的结构方程被转换为有限数量的参数化映射函数;
通过从U到R的函数映射,可观测变量V的联合分布P(v)由原来的满足从Pa(V)到V函数映射的U的值u的概率之和P(v)=∑{u|V(u)=v}P(u)转变成如下式子计算:P(v)=∑{r|V(r)=v}P(r),其中,V(r)=v表示对于任意一个可观测变量V∈V,
Figure FDA0003746784790000021
P(v)进一步的表示为:P(v)=∑rP(r)∏V∈Vt(rV;v,pa(v)),其中t(·)是一个指示函数:
Figure FDA0003746784790000022
Figure FDA0003746784790000023
4.如权利要求2所述的基于结构因果模型的公平性预测系统,其特征在于:
可观测变量V的联合分布P(v)和基于因果的公平性指标
Figure FDA0003746784790000024
都为关于符合观测数据分布的因果模型P(r)的线性函数,所有符合观测数据分布的因果模型P(r)都不能被区分,找到符合观测数据分布且使得
Figure FDA0003746784790000025
最大或最小的因果模型P(r),进而得到因果效应边界。
5.如权利要求4所述的基于结构因果模型的公平性预测系统,其特征在于:
Figure FDA0003746784790000026
Figure FDA0003746784790000027
其中,
Figure FDA0003746784790000028
表示观测数据分布,通过最大化或最小化上式得到
Figure FDA0003746784790000029
的紧确界。
6.如权利要求1所述的基于结构因果模型的公平性预测系统,其特征在于:
决策模型后处理模块中,包括:
通过限制敏感特征对决策的因果效应边界,修改决策模型的输出结果
Figure FDA00037467847900000210
使得修改后的输出结果
Figure FDA00037467847900000211
满足公平性约束,优化目标函数找到一个最优的概率映射函数
Figure FDA00037467847900000212
使得在最小化Y和
Figure FDA00037467847900000213
之间差异的同时,重构的决策模型输出
Figure FDA00037467847900000214
满足公平性约束。
7.如权利要求6所述的基于结构因果模型的公平性预测系统,其特征在于:
Figure FDA0003746784790000031
其中,
Figure FDA0003746784790000032
表示基于因果关系的公平性指标,
Figure FDA0003746784790000033
表示决策模型的目标函数。
8.如权利要求7所述的基于结构因果模型的公平性预测系统,其特征在于:
Figure FDA0003746784790000034
其中,
Figure FDA0003746784790000035
9.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如下步骤:
获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
根据通过目标函数优化后的预设机器学习算法作为决策模型;
对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如下步骤:
获取患者数据样本并进行离散化处理,根据离散化处理后的患者数据特征得到因果图;
结合得到的因果图,通过将响应变量函数引入因果模型来参数化因果模型,捕获符合观测数据分布的所有因果模型,计算敏感特征对决策的因果效应边界;
根据通过目标函数优化后的预设机器学习算法作为决策模型;
对训练好的决策模型进行重构调整,限制敏感特征对决策的因果效应边界在公平性阈值之内,得到最终的满足公平性约束的决策模型,根据满足公平性约束的决策模型,得到患者的临床风险预测结果。
CN202210826417.8A 2022-07-14 2022-07-14 基于结构因果模型的公平性预测系统 Pending CN115240843A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210826417.8A CN115240843A (zh) 2022-07-14 2022-07-14 基于结构因果模型的公平性预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210826417.8A CN115240843A (zh) 2022-07-14 2022-07-14 基于结构因果模型的公平性预测系统

Publications (1)

Publication Number Publication Date
CN115240843A true CN115240843A (zh) 2022-10-25

Family

ID=83673307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210826417.8A Pending CN115240843A (zh) 2022-07-14 2022-07-14 基于结构因果模型的公平性预测系统

Country Status (1)

Country Link
CN (1) CN115240843A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151485A (zh) * 2023-04-18 2023-05-23 中国传媒大学 反事实预测和效果评估方法、系统
CN117610398A (zh) * 2023-09-22 2024-02-27 中国人民大学 反事实公平性的预测模型训练方法、预测方法及其装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151485A (zh) * 2023-04-18 2023-05-23 中国传媒大学 反事实预测和效果评估方法、系统
CN117610398A (zh) * 2023-09-22 2024-02-27 中国人民大学 反事实公平性的预测模型训练方法、预测方法及其装置

Similar Documents

Publication Publication Date Title
US11620487B2 (en) Neural architecture search based on synaptic connectivity graphs
US11593617B2 (en) Reservoir computing neural networks based on synaptic connectivity graphs
US11593627B2 (en) Artificial neural network architectures based on synaptic connectivity graphs
US11625611B2 (en) Training artificial neural networks based on synaptic connectivity graphs
CN110647920A (zh) 机器学习中的迁移学习方法及装置、设备与可读介质
US11568201B2 (en) Predicting neuron types based on synaptic connectivity graphs
CN115240843A (zh) 基于结构因果模型的公平性预测系统
US11631000B2 (en) Training artificial neural networks based on synaptic connectivity graphs
Li et al. Active feature acquisition with generative surrogate models
Selvan et al. Uncertainty quantification in medical image segmentation with normalizing flows
US11568212B2 (en) Techniques for understanding how trained neural networks operate
CN112232407A (zh) 病理图像样本的神经网络模型训练方法、装置
CN111242948A (zh) 图像处理、模型训练方法、装置、设备和存储介质
US20210319269A1 (en) Apparatus for determining a classifier for identifying objects in an image, an apparatus for identifying objects in an image and corresponding methods
Han Multimodal brain image analysis and survival prediction using neuromorphic attention-based neural networks
Angayarkanni Predictive analytics of chronic kidney disease using machine learning algorithm
Townsend et al. Discovering visual concepts and rules in convolutional neural networks
Lin et al. A particle swarm optimization based classifier for liver disorders classification
EP3975071A1 (en) Identifying and quantifying confounding bias based on expert knowledge
CN118072976B (zh) 基于数据分析的儿童呼吸道疾病预测系统及方法
Güvenç et al. BRAIN TUMOR SEGMENTATION ON FLAIR MR IMAGES WITH U-NET
CN112699909B (zh) 信息识别方法、装置、电子设备及计算机可读存储介质
WO2024000566A1 (en) Method and apparatus for auxiliary learning with joint task and data scheduling
Klonecki et al. Cost-constrained Group Feature Selection Using Information Theory
Kumar Siddamallappa Feature selection for image classification using ESSO

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination