CN106446595B - 一种机器学习妊娠期糖尿病发病风险及病情程度预测系统 - Google Patents

一种机器学习妊娠期糖尿病发病风险及病情程度预测系统 Download PDF

Info

Publication number
CN106446595B
CN106446595B CN201611168422.5A CN201611168422A CN106446595B CN 106446595 B CN106446595 B CN 106446595B CN 201611168422 A CN201611168422 A CN 201611168422A CN 106446595 B CN106446595 B CN 106446595B
Authority
CN
China
Prior art keywords
module
pregnant woman
data
risk
physical condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611168422.5A
Other languages
English (en)
Other versions
CN106446595A (zh
Inventor
徐先明
吴海龙
刘轩
李康
潘永锋
李军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Shangdai Technology Development Co Ltd
Original Assignee
Shanghai Shangdai Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shangdai Technology Development Co Ltd filed Critical Shanghai Shangdai Technology Development Co Ltd
Priority to CN201611168422.5A priority Critical patent/CN106446595B/zh
Publication of CN106446595A publication Critical patent/CN106446595A/zh
Application granted granted Critical
Publication of CN106446595B publication Critical patent/CN106446595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种机器学习妊娠期糖尿病发病风险病情程度预测系统,其组成包括:数据采集模块,所述的数据采集模块的输出端与数据预处理模块的输入端连接,所述的数据预处理模块的输出端与机器学习模块和专家系统模块的输入端连接,所述的机器学习模块的输出端与风险性评估模块的输入端连接,所述的风险性评估模块的输出端与专家系统模块输入端连接,所述的专家系统模块的输出端与显示输出模块的输入端连接。一种机器学习妊娠期糖尿病发病风险及病情程度预测系统,其基于人工智能的机器学习算法,用于预测妊娠期糖尿病的发病风险和/或病情程度,并结合互联网和大数据技术,应用在广大妊娠期糖尿病的患者医生人群中。

Description

一种机器学习妊娠期糖尿病发病风险及病情程度预测系统
技术领域
本发明涉及一种机器学习妊娠期糖尿病发病风险及病情程度预测系统技术领域,具体为一种机器学习妊娠期糖尿病发病风险及病情程度预测系统。
背景技术
妊娠期糖尿病(Gestational Diabetes Mellitus,GDM)是指妊娠期间首次发生或发现的不同程度的糖耐量异常,包含了一部分妊娠前已患有糖尿病但孕期首次被诊断的患者。2012年卫生部推荐采用国际糖尿病与妊娠研究小组(international association ofdiabetes and pregnancy study group,IADPSG)推荐的标准,我国GDM的发病率高达17.5%左右。近年来,单独二胎政策的放开及实施,高龄产妇越来越多,加上孕妇膳食结构的不合理及体力活动的缺乏,GDM的患病率也在不断增加。GDM不仅是糖代谢的紊乱,而且同时还存在脂代谢及蛋白质代谢的紊乱,由此导致的近期及远期母婴并发症也越来越多。包括巨大儿的发生率、早产发生率、先天性畸形发生率、剖宫产率、新生儿低血糖及高胆红素血症的发生率升高、子代儿童期肥胖、糖尿病及高血压的发生率升高。GDM对母亲的影响包括孕期体重增加过多所致肥胖、妊娠期高血压、高脂血症及心脑血管疾病等一系列代谢综合症的发生率升高。远期影响有产后肥胖及高血压的发生率升高及糖代谢异常的发生率也明显升高。预测约70%的GDM患者在产后5年至10年后转变成2型糖尿病。
孕妇体重(包括孕前体重及孕期体重增加)、产妇年龄、产妇孕前BMI、产妇家族糖尿病史、产妇孕期营养摄入、产妇孕期运动量、产妇所在的地域等因素与妊娠糖尿病的关系成为围产学者关注的焦点,大多数研究表明,孕妇孕前体重指数过大及体重增加过度会导致妊娠期糖尿病、高血压、产后出血、剖宫产及巨大儿等概率升高。剖宫产、产后出血、巨大儿、高危妊娠(妊娠期糖尿病等)的发生率在这些体重增加过多的孕妇中发生率明显上升。研究结果表明正常体重指数的孕妇体重增长过多同样会导致不良的妊娠结局,适当地控制饮食调整膳食结构和运动,有利于体重的控制,孕期体重指数的增长得到一定控制会使妊娠期合并糖尿病并发症、巨大儿发生率、手术产率、产后出血率减少。此外,有研究表明产妇的家族糖尿病史与产妇妊娠糖尿病发病也有很强的正相关性。
近年来越来越多的研究关注胎儿起源学说,妊娠期糖尿病导致的糖代谢异常,营养不足或过剩导致低出生体重儿和巨大儿的出现,这些后代患慢性非感染性疾病如高血压、糖尿病、心脏病的风险均增加。所以慢性疾病的预防要从胎儿期开始,在宫内阶段就要开始关注母亲的营养体重管理和血糖管理,争取理想的出生体重,减少巨大儿和降低剖宫产率,并尽量减少可能出现的对子代的远期不良影响。
妊娠期糖尿病(GDM)危害母儿近期及远期健康。发病原因尚不清楚,可能与胰岛素抵抗有关,除遗传及妊娠期内分泌改变可引起胰岛素抵抗外,饮食及运动是胰岛素抵抗的一个重要影响因素。孕期运动及饮食是孕期体重增加的重要影响因素,而孕期体重增加又是孕期胰岛素抵抗最重要的原因。本发明借助互联网+技术,可以做到每天监测一天的饮食、运动量、空腹血糖、体重变化,通过这些因素形成可以实现机器学习的自动算法,并采用算法来评估孕期的生活方式,通过对生活方式健康与否的评估,继而了解这些不同的生活方式与GDM的发生的关系,并可以进一步的预测妊娠期糖尿病的发病几率和病情程度的变化。
发明内容
本发明的目的在于提供一种机器学习妊娠期糖尿病发病风险及病情程度预测系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种机器学习妊娠期糖尿病发病风险及病情程度预测系统,其组成包括:数据采集模块、数据预处理模块、机器学习模块、风险性评估模块、专家系统模块、显示输出模块,所述的数据采集模块的输出端与数据预处理模块的输入端连接,所述的数据预处理模块的输出端与机器学习模块和专家系统模块的输入端连接,所述的机器学习模块的输出端与风险性评估模块的输入端连接,所述的风险性评估模块的输出端与专家系统模块输入端连接,专家系统模块的输出端与显示输出模块的输入端连接,数据采集模块负责采集孕妇的数据,包括对孕妇的年龄,身高,体重,血糖,怀孕周期数据的采集工作,其中,年龄,身高、工作性质和每周运动量为节点数据,体重、血糖和怀孕周期为流数据,所述的数据预处理模块负责数据的预处理工作,包含两部分工作,数据清洗、数据标准化,数据清洗负责清洗出无效数据和错误数据,数据标准化是指将用户的年龄,体重,血糖,怀孕周期数据,统一度量单位,统一格式,所述的机器学习模块负责分析单因素连续时间变量与妊娠期糖尿病之间的关系,该模块采用隐马尔科夫模型分析单因素的异常波动与妊娠期糖尿病之间的关系,其模型可以由一个五元组表示;
λ=(A,B,π,Q,V) (1)
身体状态集合Q
孕妇的身体状态是一个隐含变量,日常生活中不可能被直接观测出来,因此用隐马尔科夫模型中的隐含状态表示孕妇的身体健康状态,设Q是所有可能的身体健康状态的集合,则
Q={q0,q1} (2)
其中,q0表示孕妇身体处于健康状态,q1表示孕妇身体处于非健康状态;
检测指标集合V
在医疗诊断环节中,孕妇的检查指标是可以观测到的变量,因此,令孕妇的身体检测指标集合作为可观测状态集合,设V是某项检测项目所有可能检测结果的集合,则
V={v1,v2,…,vM} (3)
其中,M是可能的检测结果的数量;
身体状态转移矩阵A
设L是长度为T的身体健康状态序列,L=(l0,l1,l2,…,lT),孕妇的当前的状态与之前的身体状态有关,则身体状态转移矩阵A为:
A=[aij]N×N (4)
其中,
aij=p(lr=qi|lx-1=qj),1≤r≤T (5)
表示状态转移概率,其中aij是与时间t独立的,且满足0≤aij≤1,
身体状态观测概率矩阵B
设O是对应的检测项目观测序列,O=(o1,o2,…,oT),则观测概率矩阵为
B=[bi(k)]N×M (6)
其中,
bi(k)=p(ot=vk|lr=qi),1≤r≤T表示顾客身体健康状态与检测指标之间观测概率,其中bi(k)是与时间t独立的,且满足0≤bi(k)≤1,
初始孕妇身体状态分布π
描述了在初始状态时,孕妇身体健康与非健康状态之间的比例;
π=(πl) (7)
其中,
πi=P(lr=qi),1≤r≤T (8)
且满足0≤πi≤1,且
采用前向后向算法,对隐马尔科夫模型进行学习,前向学习算法过程如下:
第一步,确定前向概率αt(i);
在给定隐马尔科夫模型λ中,前向概率是指到时刻t时孕妇某项检测指标为o1,o2,…,ot且孕妇的身体状态为qi的条件概率,记作
然后通过归纳法求解αt+1(i)
递推可得:
那么,前向观测概率为
第二步确定后向概率;
在给定隐马尔科夫模型λ中,后向变量βt(i)是指在t时刻为状态qi的条件下,从t+1到T的部分孕妇检测指标序列为ot+1,ot+2,…,oT的条件概率,记作
通过归纳法求解βt(i)可得:
于是可以得出:
第三步执行EM算法的E步:
求Q函数
其中,是隐马尔科夫模型参数的当前估计值,λ是要极大化的隐马尔科夫模型参数;
P(O,L|λ)=πibi(ot)ai…b1(o1)a1 (16)
于是函数可以改写为
第四步执行EM算法的M步:
极大化Q函数由于要极大化的参数在公式中单独出现在三个项中,所以只需要对各项分别极大化即可,分别对每一项进行拉格朗日乘子法求解,可以找到使得公式取得最大值的条件,分别如下所示;采用Hadar等价变换,在隐马尔科夫模型中,状态序列为其观测过程为
Yt=[lt,lt-1,…,lt-(r-1)],1≤t≤T (18)
则可以由公式得出
第一项极大化条件:
第二项极大化条件:
第三项极大化条件:
所述的风险性评估模块在获得模型中各个参数之后,给定任何孕妇的某项项目的检测指标,采用维特比算法就可以识别出每一个时刻的孕妇的身体状态,从而可以判断出当前孕妇患病的风险;
定义t模式时为单个身体状态序列中的最大值,则在时刻t模式时检测为身体状态概率最大值为
采用维特比算法,就可以得到某一个孕妇在某时刻的身体状态;
算法流程
初始化:
δ1(i)=πibi(o1) (23)
其中,0≤i≤N-1
递归计算:
其中,0≤i≤N-1
中断:
回溯最佳路径:
最佳的身体状态序列:
Y*=l2-r…lT (30)
通过上述方式,就可以根据孕妇的实时的检测项目具体指标,判断出孕妇当前的身体健康状态,从而判断出孕妇患病的风险,所述的机器学习妊娠期糖尿病发病及风险病情程度预测系统,所述的专家系统模块根据孕妇的风险性评估模块,通过分析不同检验指标,可以得出孕妇可能患有妊娠期糖尿病的概率,采用BP神经网络方法评估各指标的风险性,从而对患病概率做出预测,BP神经网络包括三层,分别是输入层,隐含层和输出层;
输入层输入与妊娠期糖尿病有关的各个因素,分别为孕妇年龄x1、血糖风险x2、体脂比风险x3、工作性质x4、锻炼强度指标x5,采用有监督学习算法进行训练集学习,根据给出正确的输入和输出对神经网络进行调整,让神经网络能做出正确的反应,学习训练样本表示为其中,为样本输入数据,yi为样本输出数据,N为训练集样本数量,通过学习调整各神经元的参数,让神经网络产生期望的结果;
其中,隐含神经元的功能函数为
其中,θ'为指定的阈值,w为权重,且f=1-ex/1+ex
输出层的功能函数为
其中,θ”为指定的阈值,u为权重,且f=1-eh/1+eh,所述的显示输出模块根据孕妇的实际判断数据,做出相应的输出。
与现有技术相比,本发明的有益效果是:该机器学习妊娠期糖尿病发病风险及病情程度预测系统,其保证母婴健康,减少因为体重管理不当导致的妊娠预后不良发生增加。可以帮助医生和患者提早发现GDM病情,并且为治疗疾病争取更多的时间从而可以有效提高患者治疗质量,降低病情对胎儿的影响。GDM对孕产妇、胎婴儿具有多重负性影响,如GDM产妇在产后易发展为2型糖尿病(T2DM);胎婴儿有巨大儿、死胎、新生儿呼吸窘迫综合征、低血糖等并发症;子代将来患糖耐量减低、儿童期肥胖、神经心理失调等风险增加。按新的诊断标准GDM的发生率约18%,其持续增长的流行病学趋势已成为严重的公共卫生问题。目前75g口服葡萄糖耐量试验(OGTT)筛查时机多为孕24~28周后,对筛查出GDM孕妇进行饮食或胰岛素干预,以降低孕产妇并发症及围生儿不良妊娠结局的发生率。然而此时已至孕中晚期,分娩前对GDM干预时间短,因此通过孕早期分析和评价危险因素,不仅有助于确定高危人群、提高GDM的筛查效率,并且对预防和降低GDM发生起到重要作用。
附图说明
图1为本发明系统框图。
图2为本发明原理框图。
图3为本发明BP神经网络原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明提供一种技术方案:
实施例1:
一种机器学习妊娠期糖尿病发病风险及病情程度预测系统,其组成包括:数据采集模块、数据预处理模块、机器学习模块、风险性评估模块、专家系统模块、显示输出模块,所述的数据采集模块的输出端与数据预处理模块的输入端连接,所述的数据预处理模块的输出端与机器学习模块和专家系统模块的输入端连接,所述的机器学习模块的输出端与风险性评估模块的输入端连接,所述的风险性评估模块的输出端与专家系统模块输入端连接,所述的专家系统模块的输出端与显示输出模块的输入端连接。
实施例2:
根据实施例1所述的机器学习妊娠期糖尿病发病及风险病情程度预测系统,所述的数据采集模块负责采集孕妇的数据,包括对孕妇的年龄,身高,体重,血糖,怀孕周期等数据的采集工作,其中,年龄,身高、工作性质和每周运动量为节点数据,体重、血糖和怀孕周期为流数据。
实施例3:
根据实施例1或2所述的机器学习妊娠期糖尿病发病及风险病情程度预测系统,所述的数据预处理模块负责数据的预处理工作,主要包含两部分工作,数据清洗、数据标准化,数据清洗主要负责清洗出一些无效数据和错误数据,数据标准化是指将用户的年龄,体重,血糖,怀孕周期等数据,同一度量单位,同一格式。
实施例4:
根据实施例1或2或3所述的机器学习妊娠期糖尿病发病及风险病情程度预测系统,所述的机器学习模块主要负责分析单因素连续时间变量与妊娠期糖尿病之间的关系,例如血糖,体脂比变化等,该模块采用隐马尔科夫模型分析单因素的异常波动与妊娠期糖尿病之间的关系,其模型可以由一个五元组表示;
λ=(A,B,π,Q,V) (1)
身体状态集合Q
孕妇的身体状态是一个隐含变量,日常生活中不可能被直接观测出来,因此用隐马尔科夫模型中的隐含状态表示孕妇的身体健康状态,设Q是所有可能的身体健康状态的集合,则
Q={q0,q1} (2)
其中,q0表示孕妇身体处于健康状态,q1表示孕妇身体出于非健康状态;
检测指标集合V
在医疗诊断环节中,孕妇的检查指标是可以观测到的变量,因此,令孕妇的身体检测指标集合作为可观测状态集合,设V是某项检测项目所有可能检测结果的集合,则
V={v1,v2,…,vM} (3)
其中,M是可能的检测结果的数量;
身体状态转移矩阵A
设L是长度为T的身体健康状态序列,L=(l0,l1,l2,…,lT),孕妇的当前的状态与之前的身体状态有关,则健康状态转移矩阵为:
A=[aij]N×N (4)
其中,
aij=p(lr=qi|lr-1=qj),1≤r≤T (5)
表示状态转移概率,其中aij是与时间t独立的,且满足0≤aij≤1,
身体状态观测概率矩阵B
设O是对应的检测项目观测序列,O=(o1,o2,…,oT),则观测概率矩阵为
B=[bij]N×M (6)
其中,
bi(k)=p(ot=vk|lr=qi),1≤r≤T表示顾客身体健康状态与检测指标之间观测概率,其中bi(k)是与时间t独立的,且满足0≤bi(k)≤1,
初始孕妇身体状态分布π
描述了在初始状态时,孕妇身体健康与非健康状态之间的比例;
π=(πl) (7)
其中,
πi=P(lr=qi),1≤r≤T (8)
且满足0≤πi≤1,且
采用前向后向算法,对隐马尔科夫模型进行学习。前向学习算法过程如下:
第一步,确定前向概率αt(qi);
在给定隐马尔科夫模型λ中,前向概率是指到时刻t时孕妇某项检测指标为o1,o2,…,ot且孕妇的身体状态为qi的条件概率,记作
然后通过归纳法求解αt+1(qi)
递推可得:
那么,前向观测概率为
第二步确定后向概率;
在给定隐马尔科夫模型λ中,后向变量βt(i)是指在t时刻为状态qi的条件下,从t+1到T的部分孕妇检测指标序列为ot+1,ot+2,…,oT的条件概率,记作
通过归纳法求解βt(i)可得:
于是可以得出:
第三步执行EM算法的E步:
求Q函数
其中,是隐马尔科夫模型参数的当前估计值,λ是要极大化的隐马尔科夫模型参数;
P(O,L|λ)=πibi(ot)ai…b1(o1)a1 (16)
于是函数可以改写为
第四步执行EM算法的M步:
极大化Q函数由于要极大化的参数在公式中单独出现在三个项中,所以只需要对各项分别极大化即可,分别对每一项进行拉格朗日乘子法求解,可以找到使得公式取得最大值的条件,分别如下所示。采用Hadar等价变换,在隐马尔科夫模型中,状态序列为其观测过程为
Yt=[lt,lt-1,…,lt-(r-1)],1≤t≤T (18)
则可以由公式得出
第一项极大化条件:
第二项极大化条件:
第三项极大化条件:
实施例5:
根据实施例1或2或3或4所述的机器学习妊娠期糖尿病发病及风险病情程度预测系统,所述的风险性评估模块在获得模型中各个参数之后,给定任何孕妇的某项项目的检测指标,采用维特比算法就可以识别出每一个时刻的孕妇的身体状态,从而可以判断出当前孕妇患病的风险;
定义为单个身体状态序列中的最大值,则在时刻t兴趣模式为的身体状态概率最大值为
采用维特比算法,就可以得到某一个孕妇在某时刻的身体状态;
算法流程
初始化:
δ1(i)=πibi(o1) (23)
其中,0≤i≤N-1
递归计算:
其中,0≤i≤N-1
中断:
回溯最佳路径:
最佳的身体状态序列:
Y*=l2-r…lT (30)
通过上述方式,就可以根据孕妇的实时的检测项目具体指标,判断出孕妇当前的身体健康状态,从而判断出孕妇患病得风险。
实施例6:
根据实施例1或2或3或4或5所述的机器学习妊娠期糖尿病发病及风险病情程度预测系统,所述的专家系统诊断模块根据孕妇的风险性评估模块,通过分析不同检验指标,可以得出孕妇可能患有妊娠期糖尿病的概率,本发明采用BP神经网络方法评估各指标的风险性,从而对患病概率做出预测,BP神经网络包括三层,分别是输入层,隐含层和输出层;如图3,
输入层输入与妊娠期糖尿病有关的各个因素,分别为孕妇年龄(x1)、血糖风险(x2)、体脂比风险(x3)、工作性质(x4)、锻炼强度指标(x5),采用有监督学习算法进行训练集学习,根据给出正确的输入和输出对神经网络进行调整,让神经网络能做出正确的反应。学习训练样本表示为其中,为样本输入数据,为yi样本输出数据,N为训练集样本数量。通过学习调整各神经元的参数,让神经网络产生期望的结果;
其中,隐含神经元的功能函数为
其中,θ'为指定的阈值,w为权重,且f=1-ex/1+ex
输出层的功能函数为
其中,θ”为指定的阈值,u为权重,且f=1-eh/1+eh
实施例7:
根据实施例1或2或3或4或5或所述的机器学习妊娠期糖尿病发病及风险病情程度预测系统,其特征是:所述的显示输出模块根据孕妇的实际判断数据,做出相应的输出。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (1)

1.一种机器学习妊娠期糖尿病发病风险及病情程度预测系统,其组成包括:数据采集模块、数据预处理模块、机器学习模块、风险性评估模块、专家系统模块、显示输出模块,其特征是:所述的数据采集模块的输出端与数据预处理模块的输入端连接,所述的数据预处理模块的输出端与机器学习模块和专家系统模块的输入端连接,所述的机器学习模块的输出端与风险性评估模块的输入端连接,所述的风险性评估模块的输出端与专家系统模块输入端连接,专家系统模块的输出端与显示输出模块的输入端连接,数据采集模块负责采集孕妇的数据,包括对孕妇的年龄,身高,体重,血糖,怀孕周期数据的采集工作,其中,年龄,身高、工作性质和每周运动量为节点数据,体重、血糖和怀孕周期为流数据,所述的数据预处理模块负责数据的预处理工作,包含两部分工作,数据清洗、数据标准化,数据清洗负责清洗出无效数据和错误数据,数据标准化是指将用户的年龄,体重,血糖,怀孕周期数据,统一度量单位,统一格式,所述的机器学习模块负责分析单因素连续时间变量与妊娠期糖尿病之间的关系,该模块采用隐马尔科夫模型分析单因素的异常波动与妊娠期糖尿病之间的关系,其模型可以由一个五元组表示;
λ=(A,B,π,Q,V) (1)
身体状态集合Q
孕妇的身体状态是一个隐含变量,日常生活中不可能被直接观测出来,因此用隐马尔科夫模型中的隐含状态表示孕妇的身体健康状态,设Q是所有可能的身体健康状态的集合,则
Q={q0,q1} (2)
其中,q0表示孕妇身体处于健康状态,q1表示孕妇身体处于非健康状态;
检测指标集合V
在医疗诊断环节中,孕妇的检查指标是可以观测到的变量,因此,令孕妇的身体检测指标集合作为可观测状态集合,设V是某项检测项目所有可能检测结果的集合,则
V={v1,v2,…,vM} (3)
其中,M是可能的检测结果的数量;
身体状态转移矩阵A
设L是长度为T的身体健康状态序列,L=(l0,l1,l2,…,lT),孕妇的当前的状态与之前的身体状态有关,则身体状态转移矩阵A为:
A=[aij]N×N (4)
其中,
aij=p(lr=qi|lr-1=qj),1≤r≤T (5)
表示状态转移概率,其中aij是与时间t独立的,且满足0≤aij≤1,
身体状态观测概率矩阵B
设O是对应的检测项目观测序列,O=(o1,o2,…,oT),则观测概率矩阵为
B=[bi(k)]N×M (6)
其中,
bi(k)=p(ot=vk|lr=qi),1≤r≤T表示顾客身体健康状态与检测指标之间观测概率,其中bi(k)是与时间t独立的,且满足0≤bi(k)≤1,
初始孕妇身体状态分布π
描述了在初始状态时,孕妇身体健康与非健康状态之间的比例;
π=(πl) (7)
其中,
πi=P(lr=qi),1≤r≤T (8)
且满足0≤πi≤1,且
采用前向后向算法,对隐马尔科夫模型进行学习,前向学习算法过程如下:
第一步,确定前向概率αt(i);
在给定隐马尔科夫模型λ中,前向概率是指到时刻t时孕妇某项检测指标为o1,o2,…,ot且孕妇的身体状态为qi的条件概率,记作
然后通过归纳法求解αt+1(i)
递推可得:
那么,前向观测概率为
第二步确定后向概率;
在给定隐马尔科夫模型λ中,后向变量βt(i)是指在t时刻为状态qi的条件下,从t+1到T的部分孕妇检测指标序列为ot+1,ot+2,…,oT的条件概率,记作
通过归纳法求解βt(i)可得:
于是可以得出:
第三步执行EM算法的E步:
求Q函数
其中,是隐马尔科夫模型参数的当前估计值,λ是要极大化的隐马尔科夫模型参数;
P(O,L|λ)=πibi(ot)ai…b1(o1)a1 (16)
于是函数可以改写为
第四步执行EM算法的M步:
极大化Q函数由于要极大化的参数在公式中单独出现在三个项中,所以只需要对各项分别极大化即可,分别对每一项进行拉格朗日乘子法求解,可以找到使得公式取得最大值的条件,分别如下所示;采用Hadar等价变换,在隐马尔科夫模型中,状态序列为其观测过程为
Yt=[lt,lt-1,…,lt-(r-1)],1≤t≤T (18)
则可以由公式得出
第一项极大化条件:
第二项极大化条件:
第三项极大化条件:
所述的风险性评估模块在获得模型中各个参数之后,给定任何孕妇的某项项目的检测指标,采用维特比算法就可以识别出每一个时刻的孕妇的身体状态,从而可以判断出当前孕妇患病的风险;
定义t模式时为单个身体状态序列中的最大值,则在时刻t模式时检测为身体状态概率最大值为
采用维特比算法,就可以得到某一个孕妇在某时刻的身体状态;
算法流程
初始化:
δ1(i)=πibi(o1) (23)
其中,0≤i≤N-1
递归计算:
其中,0≤i≤N-1
中断:
回溯最佳路径:
最佳的身体状态序列:
Y*=l2-r…lT (30)
通过上述方式,就可以根据孕妇的实时的检测项目具体指标,判断出孕妇当前的身体健康状态,从而判断出孕妇患病的风险,所述的专家系统模块根据孕妇的风险性评估模块,通过分析不同检验指标,可以得出孕妇可能患有妊娠期糖尿病的概率,采用BP神经网络方法评估各指标的风险性,从而对患病概率做出预测,BP神经网络包括三层,分别是输入层,隐含层和输出层;
输入层输入与妊娠期糖尿病有关的各个因素,分别为孕妇年龄x1、血糖风险x2、体脂比风险x3、工作性质x4、锻炼强度指标x5,采用有监督学习算法进行训练集学习,根据给出正确的输入和输出对神经网络进行调整,让神经网络能做出正确的反应,学习训练样本表示为其中,为样本输入数据,yi为样本输出数据,N为训练集样本数量,通过学习调整各神经元的参数,让神经网络产生期望的结果;
其中,隐含神经元的功能函数为
其中,θ'为指定的阈值,w为权重,且f=1-ex/1+ex
输出层的功能函数为
其中,θ”为指定的阈值,u为权重,且f=1-eh/1+eh,所述的显示输出模块根据孕妇的实际判断数据,做出相应的输出。
CN201611168422.5A 2016-12-16 2016-12-16 一种机器学习妊娠期糖尿病发病风险及病情程度预测系统 Active CN106446595B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611168422.5A CN106446595B (zh) 2016-12-16 2016-12-16 一种机器学习妊娠期糖尿病发病风险及病情程度预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611168422.5A CN106446595B (zh) 2016-12-16 2016-12-16 一种机器学习妊娠期糖尿病发病风险及病情程度预测系统

Publications (2)

Publication Number Publication Date
CN106446595A CN106446595A (zh) 2017-02-22
CN106446595B true CN106446595B (zh) 2019-09-03

Family

ID=58217626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611168422.5A Active CN106446595B (zh) 2016-12-16 2016-12-16 一种机器学习妊娠期糖尿病发病风险及病情程度预测系统

Country Status (1)

Country Link
CN (1) CN106446595B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122587A (zh) * 2017-03-22 2017-09-01 上海商保通健康科技有限公司 基于大数据的分层式个性化健康趋势评估系统
CN107016243A (zh) * 2017-04-06 2017-08-04 浙江大学 糖尿病风险评估方法
CN107491638A (zh) * 2017-07-28 2017-12-19 深圳和而泰智能控制股份有限公司 一种基于深度学习模型的icu用户病情预测方法及终端设备
CN107742533A (zh) * 2017-09-13 2018-02-27 天津大学 一种基于食物营养素预测痛风的方法
CN108154918A (zh) * 2017-12-29 2018-06-12 广州英丹网络科技有限公司 一种基于大数据分析的糖尿病患者评估及管理系统
CN108766567A (zh) * 2018-04-17 2018-11-06 新乡医学院 妊娠期糖尿病和正常妊娠晚期判断胎儿体重的新方法
CN108847285B (zh) * 2018-05-09 2021-05-28 吉林大学 基于机器学习的孕前期及孕中期唐氏综合征筛查方法
CN109524118A (zh) * 2018-11-01 2019-03-26 上海海事大学 一种基于机器学习和体检数据的妊娠期糖尿病筛查方法
CN110033860B (zh) * 2019-02-27 2021-02-26 杭州贝安云科技有限公司 一种基于机器学习的遗传代谢病检出率提升方法
CN109954266A (zh) * 2019-03-21 2019-07-02 湖南仪峰安安网络科技股份有限公司 一种基于体征数据监测的运动养生闭环训练方法
CN110387414B (zh) * 2019-07-19 2022-09-30 广州市达瑞生物技术股份有限公司 一种利用外周血游离dna预测妊娠期糖尿病的模型
CN110808097A (zh) * 2019-10-30 2020-02-18 中国福利会国际和平妇幼保健院 一种妊娠期糖尿病预测系统及方法
CN111144473B (zh) * 2019-12-23 2024-04-23 中国医学科学院肿瘤医院 训练集构建方法、装置、电子设备及计算机可读存储介质
CN111312399A (zh) * 2020-02-24 2020-06-19 南京鼓楼医院 一种早期预测妊娠糖尿病模型的建立方法
WO2021171051A1 (en) * 2020-02-27 2021-09-02 The Chinese University Of Hong Kong Methods for monitoring and analyzing glucose variability of a glucose-insulin system
CN111816308B (zh) * 2020-07-13 2023-09-29 中国医学科学院阜外医院 一种通过面部图片分析预测冠心病发病风险的系统
CN112117006A (zh) * 2020-09-23 2020-12-22 重庆医科大学 基于集成学习的2型糖尿病肾脏疾病患病风险评估系统
CN112259222B (zh) * 2020-10-22 2022-06-10 南通市第二人民医院 一种妇产科高危产妇管理方法和装置
CN112244803A (zh) * 2020-10-30 2021-01-22 中国科学院合肥物质科学研究院 一种糖尿病足风险检测设备
CN112750028A (zh) * 2020-12-30 2021-05-04 北京知因智慧科技有限公司 基于实体抽取的事件文本的风险预警方法和装置
CN112582068B (zh) * 2020-12-31 2022-09-20 山东省妇幼保健院 一种用于妊娠期子痫症状的安全装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1745697A (zh) * 2005-07-21 2006-03-15 高春平 围产期个性化健康助理装置
CN102058435A (zh) * 2011-01-17 2011-05-18 北京工业大学 基于理化和血流动力学信息的妊娠期高血压风险监测装置
CN104063583A (zh) * 2014-06-06 2014-09-24 北京工业大学 基于动态物理学和理化因素的妊娠期糖尿病风险监测系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10119978B2 (en) * 2013-03-15 2018-11-06 Wallac Oy System and method for determining risk of diabetes based on biochemical marker analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1745697A (zh) * 2005-07-21 2006-03-15 高春平 围产期个性化健康助理装置
CN102058435A (zh) * 2011-01-17 2011-05-18 北京工业大学 基于理化和血流动力学信息的妊娠期高血压风险监测装置
CN104063583A (zh) * 2014-06-06 2014-09-24 北京工业大学 基于动态物理学和理化因素的妊娠期糖尿病风险监测系统

Also Published As

Publication number Publication date
CN106446595A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
CN106446595B (zh) 一种机器学习妊娠期糖尿病发病风险及病情程度预测系统
US11476000B2 (en) Methods and systems using mathematical analysis and machine learning to diagnose disease
CN107680676B (zh) 一种基于电子病历数据驱动的妊娠期糖尿病预测方法
CN110808097A (zh) 一种妊娠期糖尿病预测系统及方法
Li et al. Non-invasive monitoring of three glucose ranges based on ECG by using DBSCAN-CNN
CN111261282A (zh) 一种基于机器学习的脓毒症早期预测方法
Dai et al. Convolutional neural network based automatic screening tool for cardiovascular diseases using different intervals of ECG signals
CN104063583B (zh) 基于动态物理学和理化因素的妊娠期糖尿病风险监测系统
CN112971853B (zh) 一种基于人工智能分析电子胎心监测数据的方法及装置
CN112786203A (zh) 一种机器学习糖尿病视网膜病变发病风险预测方法及应用
CN115331803A (zh) 预测卵巢低反应和部署个体化卵巢刺激策略模型的构建方法和系统
Liang et al. A CNN-RNN unified framework for intrapartum cardiotocograph classification
Arain et al. Machine learning and disease prediction in obstetrics
Liang et al. Fully automatic classification of cardiotocographic signals with 1D-CNN and bi-directional GRU
CN117373595A (zh) 一种基于ai的内科患者个性化治疗方案生成系统
CN112932445A (zh) 基于大数据的儿童脑瘫脑神经损伤评估仪及其使用方法
Nsugbe et al. On the prediction of premature births in Hispanic labour patients using uterine contractions, heart beat signals and prediction machines
CN114141360A (zh) 基于惩罚cox回归的乳腺癌预测方法
Sancar et al. Body mass index estimation by using an adaptive neuro fuzzy inference system
Chen et al. Non-invasive triglyceride detection: Using a combination of complementary multivariate photoplethysmogram features
Signorini et al. Classification of fetal pathologies through fuzzy inference systems based on a multiparametric analysis of fetal heart rate
Zou et al. Using TensorFlow to Establish multivariable linear regression model to Predict Gestational Diabetes
Bahar et al. Model Structure of Fetal Health Status Prediction
CN113782210B (zh) 一种预测无创呼吸机治疗失败概率的方法
Shanmugam et al. A STUDY UTILIZING ADVANCED MACHINE LEARNING TECHNIQUES TO ANALYZE GESTATIONAL DIABETES MELLITUS AND ITS IMPLEMENTATIONS

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant