CN112331340B - 育龄夫妇妊娠概率的智能预测方法及系统 - Google Patents

育龄夫妇妊娠概率的智能预测方法及系统 Download PDF

Info

Publication number
CN112331340B
CN112331340B CN202011097478.2A CN202011097478A CN112331340B CN 112331340 B CN112331340 B CN 112331340B CN 202011097478 A CN202011097478 A CN 202011097478A CN 112331340 B CN112331340 B CN 112331340B
Authority
CN
China
Prior art keywords
probability
pregnancy
factor
model
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011097478.2A
Other languages
English (en)
Other versions
CN112331340A (zh
Inventor
马旭
赵君
洪翔
王蓓
张宏光
代巧云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute Of Science And Technology National Health Commission
Southeast University
Original Assignee
Institute Of Science And Technology National Health Commission
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Science And Technology National Health Commission, Southeast University filed Critical Institute Of Science And Technology National Health Commission
Priority to CN202011097478.2A priority Critical patent/CN112331340B/zh
Publication of CN112331340A publication Critical patent/CN112331340A/zh
Application granted granted Critical
Publication of CN112331340B publication Critical patent/CN112331340B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种育龄夫妇妊娠概率的智能预测方法及系统,所述方法包括:采集影响育龄夫妇生育力的多个数据信息并进行数据标准化处理,建立育龄夫妇一年妊娠概率与影响因素的关联数据库;提取部分数据集进行训练,筛选各因素指标并与育龄夫妇一年妊娠概率构建多因素回归预测模型;将所述预测模型可视化,绘制Nomogram图,为每一个预测的风险因素计算风险评分,并根据各风险因素的评分相加得到总评分;根据总评分与结局事件发生概率之间的关系,计算出某个体发生妊娠事件的概率预测值。本发明解决了现有的育龄夫妇无法自助对妊娠概率进行较为准确的预测的问题。

Description

育龄夫妇妊娠概率的智能预测方法及系统
技术领域
本发明属于医学生殖健康领域,具体涉及一种育龄夫妇妊娠概率的智能预测方法及系统。
背景技术
育龄人群生殖健康对人口素质与经济社会发展具有深远的影响,受到国际社会的普遍关注。生育力是一个复杂的公共卫生问题,人口学家和社会学家将人群繁衍后代的能力定义为生育力,它直接对人口的增长或下降有影响。最近的一项研究报道,随着人群健康需求的提高和健康管理措施的提前,人们关注的不仅仅是能否成功受孕,更关注能否按计划和意愿有准备的受孕,过长的备孕时间会给夫妻双方带来心理压力,甚至会影响正常生活与工作节奏。目前WHO临床指南中将一对夫妻至少一年未避孕但未妊娠诊断为不育不孕。有研究报道,我国育龄夫妇的不孕不育率高达25.0%,平均为15%左右,并呈现年轻化及上升趋势。据WHO统计,不孕不育将成为仅次于心脑血管病和肿瘤等严重危害人类健康的第三大疾病。不孕不育症以及采用辅助生育技术不仅给家庭带来沉重的经济负担,也给夫妇带来心理负担,进而影响家庭生活、社会稳定。
国内外研究显示不孕不育是多重因素作用的结果,包括生理因素(卵子、精子的形成)、社会因素(经济收入、精神压力等)、生活行为因素(吸烟、饮酒等)和生物因素(药物、感染等)。目前,生育力评估主要针对不孕不育、特殊疾病(如肿瘤)、高危环境作业的人群开展,大多需要在生殖健康专科医院或综合医院的辅助生殖门诊通过专门的医学检查后由专业医师给出建议。大多数育龄夫妇认为备孕过程涉及个人隐私,备孕困难又会带来巨大的心理压力,辅助生殖门诊检查繁琐且需要多次频繁就诊,因此常常自行购买排卵试纸进行检测以确定最佳同房时间,但是却忽略了自身健康状况对生育力的影响。如何设计出一种基于综合因素考量,并适用于普通育龄夫妇自我测评且无需依赖专业医学检查的生育力预测系统变成了目前亟待解决的问题。
发明内容
基于现有技术的上述缺陷,本发明的目的在于提供一种育龄夫妇妊娠概率的智能预测方法及系统,以解决现有的育龄夫妇无法自助对妊娠概率进行较为准确的预测的问题。
为解决上述技术问题,本发明的第一方面提供了一种育龄夫妇妊娠概率的智能预测方法,该方法包括:
采集影响育龄夫妇生育力的多个数据信息并进行数据标准化处理,建立育龄夫妇一年妊娠概率与影响因素的关联数据库;
提取部分数据集进行训练,筛选各因素指标并与育龄夫妇一年妊娠概率构建多因素回归预测模型;
将所述预测模型可视化,绘制Nomogram图,为每一个预测的风险因素计算风险评分,并根据各风险因素的评分相加得到总评分;
根据总评分与结局事件发生概率之间的关系,计算出某个体发生妊娠事件的概率预测值。
进一步地,通过剩余的数据集对构建的所述多元回归模型进行内部验证和外部验证,并校准受试者工作特征曲线。
进一步地,构建多因素回归预测模型包括:采用最大似然估计法,构建样本似然函数,分别拟合妊娠概率与各因素指标的关联函数,筛选其中的变量与育龄夫妇一年妊娠概率建立Logistic多因素回归预测模型。
进一步地,从多个因素指标中筛选出通过检验统计方法计算的概率值小于预设阈值的指标纳入模型的变量中,并对纳入的所有多分类变量进行哑变量转换。
进一步地,在建立Logistic多因素回归预测模型,并计算模型所有的参数后,还对模型进行拟合优度检验。
进一步地,将各因素指标分别定义为X1、X2、……XJ,采用最大似然估计法,构建样本似然函数L:
Figure GDA0003153775190000031
其中,Pi表示第i例观察对象在暴露条件下怀孕的概率,根据实际是否怀孕,取值Yi=1或0;
分别拟合妊娠概率P与各因素指标的关联,如下:
Figure GDA0003153775190000032
Figure GDA0003153775190000033
……
Figure GDA0003153775190000034
采用迭代运算使得上述等式的最大似然函数L达到最大,估计出此时的参数β01、β02、……β0J以及β11、β12、……β1J,其中β01、β02、……β0J等为等式的常数项参数,而β11、β12、……β1J分别表示所关注的指标X1、X2、……XJ每增加1个单位时,logit(P)的增加幅度;
采用Wald方法检验参数β11、β12、……β1J的统计学意义,分别计算
Figure GDA0003153775190000035
其中
Figure GDA0003153775190000036
为β1j的标准差,根据计算得到的χ2值以及卡方概率密度分布,采用微积分法计算P检验统计值,并与业界通用的统计检验水准0.05进行比较,筛选出P检验统计<0.05的指标纳入进一步回归模型的变量;
如果Xj为多分类变量,进行虚拟变量转换,即:当Xj分类数量为h时,则转换为h-1个系列虚拟变量(Xj1、Xj2……Xj(h-1)),也可称之为哑变量,每个变量的取值为0或1,计算Xj与妊娠概率P的关联,则可构造函数:
Figure GDA0003153775190000041
其中αj(h-1)表示相比于Xj为参考组的人群,Xj取值为类别(h-1)的人怀孕概率logit(P)的变化。
进一步地,将上述筛选出的变量与育龄夫妇一年妊娠概率P建立Logistic多元回归模型,重新拟合各个变量的权重βj,模型拟合如下:
Figure GDA0003153775190000042
其中X1、X2、……XJ为上一步筛选出的P检验统计<0.05的变量,而此处β0为常数项参数;
在采用最大似然函数估计出所有参数以后,对模型进行拟合优度检验:
Figure GDA0003153775190000043
Figure GDA0003153775190000044
其中,y=0,1分别表示结局变量的不同取值,h表示所有的预测因子组合数,从1到s,Ahy表示在预测因子组合为h时,未怀孕(y=0)或发生怀孕(y=1)的实际人数;Thy表示预测因子组合为h时,据构建的logistic预测模型,未怀孕(y=0)或发生怀孕(y=1)的理论人数,通过上述公式计算所得的统计量Qp和QL均满足卡方概率密度分布,应用微积分求得对应Qp和QL值的P检验
进一步地,确定总评分与结局事件发生概率之间的关联包括:
设定一个常数B,假定βj每增高B设定为妊娠概率增加1分,则每个影响因素Xj实际取值对应的风险评分计算方式为:
Figure GDA0003153775190000045
其中j为所关注的影响因素个数,取值范围为1~J,(Xj-MRefj)*βj为任意一个影响因素Xj与基础参考值之间的距离;
确定数据库中每个个体妊娠概率评分的总得分:
Figure GDA0003153775190000051
确定ZTotal与预测一年妊娠概率Pprediction的关系:
Figure GDA0003153775190000052
取MRefj=0,将模型可简化为:
Figure GDA0003153775190000053
其中β0为logistic回归模型中估计得到的常数项参数。
本发明的第二方面提供了一种育龄夫妇妊娠概率的智能预测系统,该系统包括:数据采集模块、模型构建模块、可视图转化模块、分值计算模块和预测模块,其中,
所述数据采集模块,用于采集影响育龄夫妇生育力的多个数据信息进行数据标准化处理,建立育龄夫妇一年妊娠概率与影响因素的关联数据库;
所述模型构建模块,用于从数据库中提取部分数据集进行训练,筛选各因素指标并与育龄夫妇一年妊娠概率构建多因素回归预测模型;
所述可视图转化模块,用于将多因素回归预测模型可视化;
所述分值计算模块,用于为每一个预测的风险因素计算风险评分,并根据各风险因素的评分相加得到总评分;
所述预测模块,根据总评分与结局事件发生概率之间的关系,计算出某个体发生妊娠事件的概率预测值。
进一步地,还包括验证模块,验证模块通过剩余的训练集对构建的所述多元回归模型进行内部验证和外部验证,并校准受试者工作特征曲线。
与现有技术相比,本发明所公开的一种育龄夫妇妊娠概率的智能预测方法及系统,首先基于真实世界大样本妊娠队列建立育龄夫妇一年妊娠概率预测数据库,随机选取一定的样本量(比如70%)数据作为训练集,基于Logistic模型算法,建立育龄夫妇一年妊娠概率与综合影响因素的关联;基于此,通过Nomogram模型对结果进行可视化,为每一个预测因子计算风险评分;通过计算各风险评分得到总分,拟合估计育龄夫妇一年妊娠概率;并对数据集中剩余30%的样本量数据进行模型验证和评估,从而使模型可以得到更大范围内的推广应用。
附图说明
图1为本发明实施例中的育龄夫妇妊娠概率的智能预测方法的原理图。
图2为本发明实施例中的预测模型进行校正时的曲线图。
图3为本发明实施例中的育龄夫妇妊娠概率的智能预测系统的原理图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。
本发明实施例所公开的一种育龄夫妇妊娠概率的智能预测方法包括如下过程:
步骤S1:采集影响育龄夫妇生育力的多个数据信息并进行数据标准化处理,建立育龄夫妇一年妊娠概率与影响因素的关联数据库;
首先,基于真实世界大样本育龄夫妇妊娠队列,筛选出有意愿且身体状况适合立即备孕的夫妇,对其基线时收集的生育力综合影响因素信息(包括夫妇基本人口学资料、孕育史、月经情况、不良生活行为史以及少量可自我监测的常规健康指标)进行数据标准化清理,例如育龄夫妇年龄(age,单位:周岁),现有子女数(children,单位:个),体质指数(BMI、单位:kg/m2),高血压(BP,0=无,1=有),是否吸烟(smoke,0=否,1=是),饮酒频率(drink,0=从不,1=偶尔,2=经常);妻子是否曾经怀孕(pregnant,0=否,1=是),月经周期是否规律(cycle,0=否,1=是),月经经量(bleeding,1=过少,2=正常,3=过多),痛经程度(dysmenorrhea,0=无,1=轻度痛经,2=中重度),等等。建立育龄夫妇一年妊娠概率与综合影响因素指标的关联数据库,将这些影响因素分别定义为X1、X2、……XJ
步骤S2:提取部分数据集进行训练,筛选各因素指标并与育龄夫妇一年妊娠概率构建多因素回归预测模型。
其中,构建多因素回归预测模型具体包括:
步骤S21、采用最大似然估计法,构建样本似然函数。
妊娠队列密切跟踪随访一年,将一年随访期内是否成功妊娠作为主要结局变量Y,Y=1表示一年内成功怀孕,Y=0表示一年内未怀孕。采用最大似然估计法,构建样本似然函数L:
Figure GDA0003153775190000071
其中,Pi表示第i例观察对象在暴露条件下怀孕的概率,如果实际是怀孕的,则Yi=1,否则Yi=0。根据最大似然函数原理,在一次抽样中获得现有样本的概率应该最大,即似然函数L应达到最大。
步骤S22、分别拟合妊娠概率P与各因素指标(X1、X2、……XJ)的关联函数。
Figure GDA0003153775190000081
Figure GDA0003153775190000082
……
Figure GDA0003153775190000083
采用Newton-Raphson迭代方法使得上述等式的最大似然函数L达到最大,估计出此时的参数β01、β02、……β0J以及β11、β12、……β1J等。其中β01、β02、……β0J等为等式的常数项参数,而β11、β12、……β1J分别表示所关注指标X1、X2、……XJ每增加1个单位时,logit(P)的增加幅度,可以反映X1、X2、……XJ与怀孕概率P的关联强度,|β|越大,表示二者关联越密切。
进一步采用Wald方法检验参数β11、β12、……β1J的统计学意义,分别计算
Figure GDA0003153775190000084
其中Sβ1j为β1j的标准差。根据计算得到的χ2值以及卡方概率密度分布,采用微积分法计算P检验统计值,并与业界通用的统计检验水准0.05进行比较,筛选出P检验统计<0.05的指标纳入进一步多元模型的变量。当然,根据不同的精确度需求,阈值可不限定为0.05,亦可为其它值。
步骤S23、筛选其中的变量建立育龄夫妇一年妊娠概率Logistic多因素回归预测模型。
对所有多分类变量,进行虚拟变量转换,即:当Xj为多分类变量,且分类数量为h时,则转换为h-1个系列虚拟变量(Xj1、Xj2……Xj(h-1)),也可称之为哑变量,每个变量的取值为0或1。当Xj取值为参考类别h时,Xj1、Xj2、……X(j(h-1))均取0;当Xj取值为类别1时,Xj1=1,其余虚拟变量取值为0;当Xj取值为类别2时,Xj2=1,其余虚拟变量取值为0;以此类推。相关的转换矩阵如下:
Figure GDA0003153775190000091
从表中可知,如果当某个个体原Xj变量取值为类别2时,共构建新的哑变量h-1个,其中Xj2=1,其余哑变量均等于0。
此时,计算Xj与妊娠概率P的关联,则可构造函数:
Figure GDA0003153775190000092
其中,αj2的含义即:相比于Xj为参考组类别h的人群,Xj为类别2的人群怀孕概率logit(P)的变化,其余αj(h-1)值的含义以此类推。只要有一个哑变量Xjh的αjh通过Wald检验且P检验统计<0.05,则将Xj纳入到进一步多元模型中,且保留所有哑变量(Xj1、Xj2……Xj(h-1))。
将上述筛选出的变量与育龄夫妇一年妊娠概率P建立Logistic多元回归模型,重新拟合各个变量权重βj,模型拟合如下:
Figure GDA0003153775190000101
其中X1、X2、……XJ为上一步筛选出的P检验统计<0.05的变量,而此处β0为常数项参数;Xj1、…、Xj(h-1)表示Xj变量在不同取值时生成的哑变量;β1、β2……βJ分别表示所关注指标X1、X2、……XJ每增加1个单位时,logit(P)的增加幅度,可以反映X1、X2、……XJ与怀孕概率P的关联强度,|β|越大,表示二者关联越密切。
本实施例中,采用最大似然函数估计出所有参数以后,还对模型进行拟合优度检验,以评估模型的适用性。计算检验统计量Qp和QL,所用公式如下:
Figure GDA0003153775190000102
Figure GDA0003153775190000103
其中y=0,1表示结局变量的不同取值,h表示所有的预测因子组合数,从1到s,例如(X1=1、X2=0、……Xh=0)为一种组合,定义为h=1。根据数学原理,s等于每一个分类变量Xj分类数的乘积。其中,Ah1表示,在预测因子组合为h时,发生怀孕(y=1)的实际人数,而同理Ah0表示该情况下不怀孕(y=0)的实际人数。Thy则表示,在预测因子组合为h时,根据本发明构建的logistic预测模型,应该怀孕(y=1)或不怀孕(y=0)的理论人数。上述公式计算得出的统计量Qp和QL均满足卡方概率密度分布。应用微积分求得对应Qp和QL值的P检验,如果P>0.05,提示模型拟合良好,最终模型通过检验。
步骤S3:将所述预测模型可视化,绘制Nomogram图,为每一个预测的风险因素计算风险评分,并根据各风险因素的评分相加得到总评分;
诺莫图(Nomogram图)是建立在多因素回归分析的基础上,将多个预测指标进行整合,然后采用带有刻度的线段,按照一定的比例绘制在同一平面上,从而用以表达预测模型中各个变量之间的相互关系。诺莫图的基本原理,就是通过构建多因素回归模型(常用的回归模型,例如Cox回归、Logistic回归等),根据模型中各个影响因素对结局变量的贡献程度(回归系数的大小),给每个影响因素的每个取值水平进行赋分,然后再将各个评分相加得到总评分,最后通过总评分与结局事件发生概率之间的函数转换关系,从而计算出该个体结局事件的预测值。诺莫图将复杂的回归方程,转变为了可视化的图形,使预测模型的结果更具有可读性,方便对患者进行评估。
为了确定每个影响因素指标Xj实际取值对应的妊娠风险评分。首先,确定每个因素Xj的基础参考值MiRef。由于本模型中Xj均为分类变量,且已做哑变量处理,因此所有变量的参考值组赋值均为0,即MRefj=0。以βj作为衡量每一个影响因素对结局Y的影响效应“尺度”,则任意一个影响因素Xj与基础参考值之间的距离均为(Xj-MRefj)*βj
然后,设定一个常数B,假定βj每增高B设定为妊娠概率增加1分,则每个影响因素Xj实际取值对应的风险评分计算方式为:
Figure GDA0003153775190000121
其中j为所关注的影响因素个数,1~J。
其次,确定数据库中每个个体妊娠概率评分的总得分
Figure GDA0003153775190000122
最后,确定ZTotal与预测一年妊娠概率Pprediction的关联。
Figure GDA0003153775190000123
由于模型中每个变量均为分类变量,MRefj=0,则模型可简化为:
Figure GDA0003153775190000124
其中,β0为logistic回归模型中估计得到的常数项参数。
步骤S4:根据总评分与结局事件发生概率之间的关系,计算出某个体发生妊娠事件的概率预测值。
举例来说,如果育龄妇女为24岁,根据建模得到的诺莫图,得分为96分;家庭中无子女,得分52分;无妊娠史,得分5分;月经规律,得分10分;经量正常,得分9分;无痛经,得分11分;体质指数正常,得分10分;无高血压,得分10分;不吸烟,得分19分;不饮酒,得分20分;男性28岁,得分55分;体质指数正常,得分6分;无高血压,得分4分;不吸烟,得分5分;不饮酒,得分10分;总分为322分,对应的育龄夫妇一年妊娠概率就约为85.06%。
在获得预测模型后,还通过剩余的训练集对构建的多元回归模型进行内部验证和外部验证,采用多重验证方式,以提高模型的精度。
(1)内部验证
根据公式可计算出训练集数据库中所有个体的一年妊娠预测概率,与实际妊娠情况进行比对。利用受试者工作特征曲线(Receiver Operating Characteristic curve,ROC)进行准确度分析。将根据不同的妊娠预测概率作为“临界值”,对样本进行二分类(妊娠组/非妊娠组),并将其与实际怀孕情况做比较,计算灵敏度和特异度。
可以作为“临界值”的妊娠概率,连续分布在0-1之间。将每一个临界值的灵敏度作为纵坐标,“1-特异度”作为横坐标,即可拟合成弧形曲线。通过微积分计算曲线下面积,以评估模型预测妊娠概率的效果。如图2所示,阴影部分为曲线下面积(AUC)。AUC的取值范围在0.5-1.0之间,越接近1.0,说明模型预测效果越好。
(2)外部验证
根据公式,对验证集30%的个体进行一年妊娠概率预测,并与实际妊娠情况进行对比。同样利用受试者工作特征曲线进行预测准确度评估。
此外,由于本发明根据上述公式求得每个变量的Zj值以及Pprediction公式生成了一种育龄夫妇一年妊娠概率预测可视化工具,便于育龄夫妇随时随地输入个人信息,即时获得测评结果,有针对性地制定备孕计划,也便于更大范围内的推广应用。
参照图3所示,本发明的另一实施例还提供了一种育龄夫妇妊娠概率的智能预测系统,该系统包括:数据采集模块、模型构建模块、可视图转化模块、分值计算模块和预测模块,其中,
数据采集模块,用于采集影响育龄夫妇生育力的多个数据信息(包括夫妇基本人口学资料、孕育史、月经情况、不良生活行为史以及少量可自我监测的常规健康指标等),将这些数据进行数据标准化处理,以便使得计算机能够识别,建立育龄夫妇一年妊娠概率与影响因素的关联数据库;
模型构建模块,用于从数据库中提取部分数据集(比如选取70%的训练集)进行训练,筛选各因素指标并与育龄夫妇一年妊娠概率构建多因素回归预测模型;
可视图转化模块,用于将多因素回归预测模型可视化,此处的可视化是通过计算机语言绘制Nomogram图。
分值计算模块,用于为每一个预测的风险因素计算风险评分,并根据各风险因素的评分相加得到总评分;不同的风险因素,其取值有差异,对结果变量的影响大小也不同。
预测模块,根据总评分与结局事件发生概率之间的关系,计算出某个体发生妊娠事件的概率预测值。这样,只需要育龄夫妇各自输入自己的基本信息后,便可通过预测模块生成发生妊娠的概率预测值。
为了评估模型的准确性,对模型进行校验,本系统还设置有验证模块,验证模块通过剩余的验证集(30%的验证集)对构建的所述多元回归模型进行内部验证和外部验证,并校准受试者工作特征曲线。
本发明基于育龄夫妇的妊娠队列,考虑了影响生育力的多方面因素,开发了一种育龄夫妇一年妊娠概率智能预测的方法及系统,能够基于育龄夫妇的基本人口学资料、孕育史、月经情况、不良生活行为史,以及可自我监测的常规健康指标,无需在生殖健康专科医院或综合医院的辅助生殖门诊进行专门的医学检查,只需通过本发明的方法及系统,即可计算得到妊娠风险评分,并实现育龄夫妇一年妊娠概率的预测。本系统具有使用非常便捷友好,在系统内输入页面分别输入夫妇个人基本信息,点击评估后瞬间输出一年妊娠概率预测结果。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种育龄夫妇妊娠概率的智能预测方法,其特征在于,该方法包括:
采集影响育龄夫妇生育力的多个数据信息并进行数据标准化处理,建立育龄夫妇一年妊娠概率与影响因素的关联数据库;
提取部分数据集进行训练,筛选各因素指标并与育龄夫妇一年妊娠概率构建多因素回归预测模型;
将所述预测模型可视化,绘制Nomogram图,为每一个预测的风险因素计算风险评分,并根据各风险因素的评分相加得到总评分;
根据总评分与结局事件发生概率之间的关系,计算出某个体发生妊娠事件的概率预测值,其中,确定总评分与结局事件发生概率之间的关系包括:
设定一个常数B,假定影响因素X j的权重β j 每增高B,妊娠风险评分增加1分,则每个影响因素X j实际取值对应的风险评分计算方式为:
Figure DEST_PATH_GDA0003153775190000121
Figure 667624DEST_PATH_IMAGE002
其中,j为所关注的影响因素编号,取值范围为1~J,(X j -M Refj )*β j 为任意一个影响因素X j 与基础参考值M Refj 之间的距离
确定数据库中每个个体妊娠概率评分的总得分:
Figure DEST_PATH_GDA0003153775190000122
Figure 988884DEST_PATH_IMAGE003
确定Z Total与预测一年妊娠概率P prediction的关系:
Figure 556263DEST_PATH_IMAGE004
取M Refj =0,将模型可简化为:
Figure 621171DEST_PATH_IMAGE005
,其中β 0 为logistic回归模型中估计得到的常数项参数。
2.根据权利要求1所述的智能预测方法,其特征在于,所述方法还包括,通过剩余的数据集对构建的所述多因素回归预测模型进行内部验证和外部验证,并校准受试者工作特征曲线。
3.根据权利要求1所述的智能预测方法,其特征在于,构建多因素回归预测模型包括:采用最大似然估计法,构建样本似然函数,分别拟合妊娠概率与各因素指标的关联函数,筛选其中的变量与育龄夫妇一年妊娠概率建立Logistic多因素回归预测模型。
4.根据权利要求3所述的智能预测方法,其特征在于,从多个因素指标中筛选出通过检验统计方法计算的概率值小于预设阈值的指标纳入模型的变量中,并对纳入的所有多分类变量进行哑变量转换。
5.根据权利要求3或4所述的智能预测方法,其特征在于,在建立Logistic多因素回归预测模型,并计算模型所有的参数后,还对模型进行拟合优度检验。
6.根据权利要求5所述的智能预测方法,其特征在于:
将各因素指标分别定义为X 1X 2、……X J,采用最大似然估计法,构建样本似然函数L:
Figure DEST_PATH_GDA0003153775190000071
Figure 692026DEST_PATH_IMAGE006
,其中,Pi
Figure 184187DEST_PATH_IMAGE007
表示第i例观察对象在暴露条件下怀孕的概率,根据实际是否怀孕,取值Yi
Figure 973283DEST_PATH_IMAGE008
=1或0;
分别拟合妊娠概率P与各因素指标的关联,如下:
Figure 310723DEST_PATH_IMAGE009
采用迭代运算使得上述的似然函数L达到最大,估计出此时的参数β 01β 02、……β 0J以及β 11β 12、……β 1J,其中β 01β 02、……β 0J等为等式的常数项参数,而β 11β 12、……β 1J分别表示所关注的指标X 1X 2、……X J每增加1个单位时,logit(P)的增加幅度;
采用Wald方法检验参数β 11β 12、……β 1J的统计学意义,分别计算:
Figure DEST_PATH_GDA0003153775190000084
Figure 501664DEST_PATH_IMAGE010
其中,S β1j
Figure DEST_PATH_IMAGE011
β 1j的标准差,根据计算得到的χ2
Figure 712197DEST_PATH_IMAGE012
值以及卡方概率密度分布,采用微积分法计算P 检验统计值,并与业界通用的统计检验水准0.05进行比较,筛选出P 检验统计 <0.05的指标纳入进一步回归模型的变量;
如果X j 为多分类变量,进行虚拟变量转换,当X j 分类数量为h时,则转换为h-1个系列虚拟变量( X j1 X j2 ……X j(h-1) ),每个变量的取值为0或1,当X j取值为类别1时,X j1=1,其余虚拟变量取值为0;当X j取值为类别2时,X j2=1,其余虚拟变量取值为0,当X j取值为参考类别h时, X j1 X j2 ……X j(h-1) 均为0,此时,计算X j 与妊娠概率P的关联,则可构造函数:
Figure 237856DEST_PATH_IMAGE013
其中α j(h-1) 表示相比于X j 为参考类别的人群,X j 取值为(h-1)类别的人群怀孕概率logit(P)的变化。
7.根据权利要求6所述的智能预测方法,其特征在于,将上述筛选出的变量与育龄夫妇一年妊娠概率P建立Logistic多元回归模型,重新拟合各个变量的权重βj,模型拟合如下:
Figure DEST_PATH_GDA0003153775190000101
其中,X 1X 2、……X J为上一步筛选出的P 检验统计 <0.05 的变量,而此处β 0 为常数项参数;
在采用最大似然函数估计出所有参数以后,对模型进行拟合优度检验,
Figure 690014DEST_PATH_IMAGE015
,其中,y=0、1分别表示结局变量的不同取值,h表示所有的预测因子组合,从1到s,Ahy表示在预测因子组合为h时,未怀孕y=0或发生怀孕y=1的实际人数,Thy表示,在预测因子组合为h时,根据构建的logistic预测模型,未怀孕y=0或发生怀孕y=1的理论人数,通过公式计算所得的统计量Q p Q L 均满足卡方概率密度分布,应用微积分求得对应Q p Q L 值的P 检验
8.一种育龄夫妇妊娠概率的智能预测系统,其特征在于,所述系统包括,数据采集模块、模型构建模块、可视图转化模块、分值计算模块和预测模块,其中,
所述数据采集模块,用于采集影响育龄夫妇生育力的多个数据信息进行数据标准化处理,建立育龄夫妇一年妊娠概率与影响因素的关联数据库;
所述模型构建模块,用于从数据库中提取部分数据集进行训练,筛选各因素指标并与育龄夫妇一年妊娠概率构建多因素回归预测模型;
所述可视图转化模块,用于将多因素回归预测模型可视化;
所述分值计算模块,用于为每一个预测的风险因素计算风险评分,并根据各风险因素的评分相加得到总评分;
所述预测模块,根据总评分与结局事件发生概率之间的关系,计算出某个体发生妊娠事件的概率预测值,其中,确定总评分与结局事件发生概率之间的关系包括:
设定一个常数B,假定β j 每增高B设定为妊娠概率增加1分,则每个影响因素X j实际取值对应的风险评分计算方式为:
Figure 564907DEST_PATH_GDA0003153775190000121
Figure 258399DEST_PATH_IMAGE002
其中,j为所关注的影响因素个数,取值范围为1~J,(X j -M Refj )*β j 为任意一个影响因素X j 与基础参考值M Refj 之间的距离
确定数据库中每个个体妊娠概率评分的总得分:
Figure 544365DEST_PATH_GDA0003153775190000122
Figure 39665DEST_PATH_IMAGE016
确定Z Total与预测一年妊娠概率P prediction的关系:
Figure 984487DEST_PATH_IMAGE017
取M Refj =0,将模型可简化为:
Figure 884441DEST_PATH_IMAGE005
,其中β 0 为logistic回归模型中估计得到的常数项参数。
9.根据权利要求8所述的智能预测系统,其特征在于,还包括验证模块,所述验证模块通过剩余的数据集对构建的所述多因素回归预测模型进行内部验证和外部验证,并校准受试者工作特征曲线。
CN202011097478.2A 2020-10-14 2020-10-14 育龄夫妇妊娠概率的智能预测方法及系统 Active CN112331340B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011097478.2A CN112331340B (zh) 2020-10-14 2020-10-14 育龄夫妇妊娠概率的智能预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011097478.2A CN112331340B (zh) 2020-10-14 2020-10-14 育龄夫妇妊娠概率的智能预测方法及系统

Publications (2)

Publication Number Publication Date
CN112331340A CN112331340A (zh) 2021-02-05
CN112331340B true CN112331340B (zh) 2021-11-23

Family

ID=74314235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011097478.2A Active CN112331340B (zh) 2020-10-14 2020-10-14 育龄夫妇妊娠概率的智能预测方法及系统

Country Status (1)

Country Link
CN (1) CN112331340B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113257421B (zh) * 2021-05-31 2023-09-15 吾征智能技术(北京)有限公司 一种高血压预测模型的构建方法和系统
CN114613507A (zh) * 2022-03-16 2022-06-10 温子娜 基于大数据和人工智能的精子受精功能预测模型

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249068B1 (en) * 2000-06-30 2007-07-24 Hewlett-Packard Development Company, L.P. Spot market-based inventory planning
CN103488857A (zh) * 2012-06-15 2014-01-01 国家人口计生委科学技术研究所 一种自然流产风险预测系统及构建该系统的方法
CN103559389A (zh) * 2013-10-21 2014-02-05 中国农业大学 一种县域耕地等级变化监测样点布设的方法
EP3149640A1 (en) * 2014-05-30 2017-04-05 Sequenom, Inc. Chromosome representation determinations
CN107491656A (zh) * 2017-09-04 2017-12-19 北京航空航天大学 一种基于相对危险度决策树模型的妊娠结局影响因子评估方法
CN108520781A (zh) * 2018-03-28 2018-09-11 北京大学人民医院 一种计算试管婴儿成功结局几率的方法
CN109073654A (zh) * 2016-04-20 2018-12-21 苏州爱尔迪思生物科技有限公司 用于预测早产的方法和组合物
CN109214375A (zh) * 2018-11-07 2019-01-15 浙江大学 一种基于分段采样视频特征的胚胎妊娠结果预测装置
CN109544512A (zh) * 2018-10-26 2019-03-29 浙江大学 一种基于多模态的胚胎妊娠结果预测装置
CN109935286A (zh) * 2019-02-26 2019-06-25 重庆善功科技有限公司 基于逻辑回归的人工授精成功率影响因素计算方法与系统
CN110634573A (zh) * 2019-09-27 2019-12-31 南昌大学第一附属医院 一种临床脑梗患者复发风险预警评分可视化模型系统及其评价方法
CN111243750A (zh) * 2020-01-15 2020-06-05 四川美康医药软件研究开发有限公司 多方式识别患者妊娠状态的方法及装置
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063678A (zh) * 2006-04-30 2007-10-31 安徽省生物医学研究所 一种预测妊娠不良结局发生风险的方法
US9177098B2 (en) * 2012-10-17 2015-11-03 Celmatix Inc. Systems and methods for determining the probability of a pregnancy at a selected point in time
US11534104B2 (en) * 2014-10-29 2022-12-27 Bloom Technologies NV Systems and methods for contraction monitoring and labor detection

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249068B1 (en) * 2000-06-30 2007-07-24 Hewlett-Packard Development Company, L.P. Spot market-based inventory planning
CN103488857A (zh) * 2012-06-15 2014-01-01 国家人口计生委科学技术研究所 一种自然流产风险预测系统及构建该系统的方法
CN103559389A (zh) * 2013-10-21 2014-02-05 中国农业大学 一种县域耕地等级变化监测样点布设的方法
EP3149640A1 (en) * 2014-05-30 2017-04-05 Sequenom, Inc. Chromosome representation determinations
CN109073654A (zh) * 2016-04-20 2018-12-21 苏州爱尔迪思生物科技有限公司 用于预测早产的方法和组合物
CN107491656A (zh) * 2017-09-04 2017-12-19 北京航空航天大学 一种基于相对危险度决策树模型的妊娠结局影响因子评估方法
CN108520781A (zh) * 2018-03-28 2018-09-11 北京大学人民医院 一种计算试管婴儿成功结局几率的方法
CN109544512A (zh) * 2018-10-26 2019-03-29 浙江大学 一种基于多模态的胚胎妊娠结果预测装置
CN109214375A (zh) * 2018-11-07 2019-01-15 浙江大学 一种基于分段采样视频特征的胚胎妊娠结果预测装置
CN109935286A (zh) * 2019-02-26 2019-06-25 重庆善功科技有限公司 基于逻辑回归的人工授精成功率影响因素计算方法与系统
CN110634573A (zh) * 2019-09-27 2019-12-31 南昌大学第一附属医院 一种临床脑梗患者复发风险预警评分可视化模型系统及其评价方法
CN111243750A (zh) * 2020-01-15 2020-06-05 四川美康医药软件研究开发有限公司 多方式识别患者妊娠状态的方法及装置
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Prediction of ischemic placental diseases during the first trimester combined test period: a retrospective cohort of low-risk pregnancies in search of the link between parity and disease;Kose, Semir等;《JOURNAL OF MATERNAL-FETAL & NEONATAL MEDICINE》;20201001;第33卷(第19期);第3272-3278页 *
The influence of age at menarche, menstrual cycle length and bleeding duration on time to pregnancy: a large prospective cohort study among rural Chinese women.;ZHANG Q.等;《BJOG: An International Journal of Obstetrics and Gynaecology》;20170127;第124卷(第11期);第1654-1662页 *
前后循环短暂性脑缺血发作危险因素及ABCD~3-Ⅰ评分比较的前瞻性研究;赵君;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;20150215(第02期);E070-101 *
孕妇人型支原体感染与不良妊娠结局关联的Meta分;徐敏等;《循证医学》;20160415;第16卷(第2期);第86-92页 *
河南农村育龄妇女妊娠等待时间影响因素分析及生育能力预测模型比较研究;张倩;《中国博士学位论文全文数据库 医药卫生科技辑》;20171115(第11期);E068-10 *

Also Published As

Publication number Publication date
CN112331340A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
JP5450556B2 (ja) 診療情報処理装置および方法並びにプログラム
CN112331340B (zh) 育龄夫妇妊娠概率的智能预测方法及系统
Jaques et al. Uptake of prenatal diagnostic testing and the effectiveness of prenatal screening for Down syndrome
CN110739076A (zh) 一种医疗人工智能公共训练平台
CN107066798A (zh) 一种心脏健康质量预警系统及其预警方法
WO2022099668A1 (zh) 一种基于家族遗传病与体征数据关联的精准健康管理与风险预警方法及系统
CN113838577B (zh) 便捷化分层老年mods早期死亡风险评估模型、装置及建立方法
CN115714022B (zh) 基于人工智能的新生儿黄疸健康管理系统
CN114464322A (zh) 女性盆底功能障碍性疾病风险预警模型及其构建方法和系统
CN113593708A (zh) 基于集成学习算法的脓毒症预后预测方法
CN114628033A (zh) 疾病风险预测方法、装置、设备及存储介质
CN111816303B (zh) 一种基于机器学习的难治性精神分裂症风险的预测方法
CN113112372A (zh) 一种医保支付预警系统及其处理方法
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及系统
Harper et al. Classification trees: A possible method for maternity risk grouping
KR20130026845A (ko) 설문 정보를 이용한 건강 상태 판단 장치 및 방법, 건강 분류 함수 생성 장치 및 그 방법
CN111968747A (zh) Vte智能防治管理系统
Dzien et al. Detecting disabilities in everyday life: evidence from a geriatric assessment
CN116864062B (zh) 一种基于互联网的健康体检报告数据分析管理系统
CN111430032B (zh) 基于apc模型与遗传聚类算法的老年人疾病建立模型方法
Rocca Agency in Contraceptive Decision-Making in Patient Care: a Psychometric Measure
Zaylaa et al. Early Diagnosis of Osteoporosis: An Artificial Intelligence-Based Framework
CN114764793A (zh) 基于证据推理规则的缺血性脑卒中程度辨识建模方法
CN116313038A (zh) 一种诊断肌少症的装置、设备和系统
Roller-Wirnsberger et al. Intrinsic capacity predicts negative health outcomes in older adults

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant