CN112992353A - 预产期精准预测方法、装置、计算机设备及存储介质 - Google Patents

预产期精准预测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112992353A
CN112992353A CN202110264626.3A CN202110264626A CN112992353A CN 112992353 A CN112992353 A CN 112992353A CN 202110264626 A CN202110264626 A CN 202110264626A CN 112992353 A CN112992353 A CN 112992353A
Authority
CN
China
Prior art keywords
data
model
medical data
preprocessing
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110264626.3A
Other languages
English (en)
Inventor
袁贞明
俞凯
邹旭
张艺超
吴英飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hele Technology Co ltd
Original Assignee
Hangzhou Hele Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hele Technology Co ltd filed Critical Hangzhou Hele Technology Co ltd
Priority to CN202110264626.3A priority Critical patent/CN112992353A/zh
Publication of CN112992353A publication Critical patent/CN112992353A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及预产期精准预测方法、装置、计算机设备及存储介质,该方法包括获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据;对所述初始数据进行预处理,以得到预处理后的数据;对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果;反馈所述预测结果至终端,以在终端进行显示;其中,所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的。本发明实现结合不同孕期的生理参数特点,获取不同孕期的相关特征并进行重要性分析,获取更加准确的预测结果。

Description

预产期精准预测方法、装置、计算机设备及存储介质
技术领域
本发明涉及人工智能技术领域,更具体地说是指预产期精准预测方法、装置、计算机设备及存储介质。
背景技术
EDD(精准预测分娩日期,Estimate Delivery date)即预产期有助于妊娠结局和临床决策,包括早产儿和足月儿的早期筛查,制定胎儿发育不良的措施,合理安排产前检查时间和分娩护理措施等,旨在保障分娩安全,提高产科工作效率。预产期的精准预测对孕妇和新生儿的生命安全及其健康结果都至关重要,目前临床上多采用基于LMP(末次月经,last menstrual period)和超声检查的方法推算预产期,如Naegele规则。然而此类方法具有明显的局限性,如LMP数据的获取主要依靠产妇回忆,难以保证LMP数据的可靠性,而月经周期不规律、口服避孕药和早孕出血等情况亦会影响对LMP的判断;而超声数据的获取需经专门培训的医务人员,且检查精度受其技术水平的影响。因此,现有的预产期预测的准确率较低,且易受医务人员个人因素的干扰,大约仅5%的新生儿在预产期当天出生。
互联网+时代下,机器学习模型以其高精度、高效率在在母胎医学领域中得到广泛的应用,旨在获得更加精准的预产期。一类研究致力于寻找更加有效的预产期“标志物”,如L和Russell Fung等人的研究,在基于LMP和超声数据的基础上,利用血液代谢物和胎儿生物测定数据以提高预测精度;而Schink T等人则利用医疗索赔数据来估计怀孕的开始时间,并由此推算预产期。此类研究虽然在一定程度上提高了预产期的精确度,但使用的计算模型较为单一,数据获取的成本较高,且方法的推广性较差,其实用性和科学性需经进一步的多中心、大样本的验证。另一类研究则是整合诊疗数据的挖掘数据方法,以获取孕期的相关特征,如Torres MT等人分析新生儿的脚、脸和耳朵的超声图像,并结合完全卷积网络、支持向量回归等模型实现预产期预测,但目前此类预测模型忽略了时间序列因素的影响,再者准确的预产期需要评估孕妇的身体状况,并通过判断孕妇各个阶段的胎儿发育状况来分析近期的趋势,综上所述,现有的方式并不能做到更加准确的预测预产期。
因此,有必要设计一种新的方法,实现结合不同孕期的生理参数特点,获取不同孕期的相关特征并进行重要性分析,获取更加准确的预测结果。
发明内容
本发明的目的在于克服现有技术的缺陷,提供预产期精准预测方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案:预产期精准预测方法,包括:
获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据;
对所述初始数据进行预处理,以得到预处理后的数据;
对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果;
反馈所述预测结果至终端,以在终端进行显示;
其中,所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的。
其进一步技术方案为:所述预产期预测模型是通过GBDT模型和GRU模型结合所得。
其进一步技术方案为:所述初始数据包括固定医疗数据和动态医疗数据,其中,所述固定医疗数据包括产前数据集以及妊娠早期数据集,所述动态医疗数据包括妊娠中晚期数据集。
其进一步技术方案为:所述对所述初始数据进行预处理,以得到预处理后的数据,包括:
对所述初始数据中的临床病例资料进行筛选和汇总,以得到汇总后的数据;
对汇总后的数据进行数据转换和特征提取,以得到关键特征;
对所述关键特征进行缺失值填补,以得到填补结果;
对所述填补结果进行归一化处理,以得到处理后的数据;
对处理后的数据进行异常值剔除,以得到预处理后的数据。
其进一步技术方案为:所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的,包括:
对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征;
对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征;
融合第一特征以及第二特征,以得到新特征;
构建GRU模型,利用所述新特征对所述GRU模型进行训练,采用预设定的评价指标评价训练后的所述GRU模型,以得到预产期预测模型。
其进一步技术方案为:所述对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征,包括:
对若干个医疗数据进行预处理后形成样本集内固定医疗数据分别通过XGBoost模型和RF模型计算对应的预测值,并对两个预测值进行求平均值,以得到第一平均值;
选择第一平均值大于预设的信息增益率阈值所对应的动态数据,以得到固定特征;
对若干个医疗数据进行预处理后形成样本集内动态医疗数据分别通过XGBoost模型和RF模型计算每个阶段的预测值,并计算每个阶段的预测值的平均值,以得到第二平均值;
选择第二平均值大于预设的信息增益率阈值所对应的动态数据,以得到动态特征;
其中,所述第一特征包括动态特征以及固定特征。
其进一步技术方案为:所述对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征,包括:
构建梯度提升树,并利用梯度提升树对若干个医疗数据进行预处理后形成样本集中的妊娠早期数据集生成第二特征;
其中,所述构建梯度提升树,包括:
计算梯度提升树的负梯度;
更新对应的基学习器;
对每轮产生的基学习器通过线性相加,以得到梯度提升树。
本发明还提供了预产期精准预测装置,包括:
数据获取单元,用于获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据;
预处理单元,用于对所述初始数据进行预处理,以得到预处理后的数据;
预测单元,用于对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果;
发送单元,用于反馈所述预测结果至终端,以在终端进行显示。
本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如上述的方法。
本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
本发明与现有技术相比的有益效果是:本发明通过获取医疗数据,并对医疗数据进行预处理后,输入由GBDT模型和GRU模型结合的预产期预测模型内进行自动预测,由此获取精准地预产期,实现结合不同孕期的生理参数特点,获取不同孕期的相关特征并进行重要性分析,获取更加准确的预测结果。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的预产期精准预测方法的应用场景示意图;
图2为本发明实施例提供的预产期精准预测方法的流程示意图;
图3为本发明实施例提供的预产期精准预测方法的子流程示意图;
图4为本发明实施例提供的预产期精准预测方法的子流程示意图;
图5为本发明实施例提供的预产期精准预测方法的子流程示意图;
图6为本发明实施例提供的预产期精准预测方法的子流程示意图;
图7为本发明实施例提供的预产期精准预测装置的示意性框图;
图8为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的预产期精准预测方法的应用场景示意图。图2为本发明实施例提供的预产期精准预测方法的示意性流程图。该预产期精准预测方法应用于服务器中。该服务器与终端进行数据交互,终端主要是集成有医疗系统,包括医生的就诊端以及病人的资料上传端等,服务器针对着终端输入的医疗数据进行预处理后在进行预产期精准预测,并及时反馈至终端。
产检、超声检查、实验室检查等诊疗数据是在妊娠期间呈现明显的时序性,因此妊娠期间相关的时序特征也与预产期计算密切相关。数字化医疗健康成为新趋势,人工智能技术也逐渐应用在孕产妇健康方面,预产期的精准预测的核心在于预产期回归模型的构建,预产期计算应考虑各因素间的相互相关系、比例权重及相关指标的时序关系,结合不同孕期的生理参数特点,获取不同孕期的相关特征并进行重要性分析,获取更加准确的预测结果。
图2是本发明实施例提供的预产期精准预测方法的流程示意图。如图2所示,该方法包括以下步骤S110至S140。
S110、获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据。
在本实施例中,初始数据是指包括产检病历、实验室检验、超声影像检查、住院病历病程记录等多源异构数据,并按照孕期进行划分后形成的数据。
具体地,初始数据主要包含产妇人口学资料、产前检查资料、实验室检验以及超声影像检查记录,根据孕期将数据分为产前数据集、妊娠早期数据集和妊娠中晚期数据集。另外,初始数据包括固定医疗数据和动态医疗数据,其中,所述固定医疗数据包括产前数据集以及妊娠早期数据集,所述动态医疗数据包括妊娠中晚期数据集。
在获取医疗数据时,按照以下顺序收集对应的数据:产前数据、妊娠早期数据、妊娠中晚期数据以及因变量。其中,产前数据集为怀孕前的固定数据即人工统计学资料和产前检查资料,输入变量包括年龄、出生日期、孕次、产次、身高、孕前体重、产前收缩压和舒张压、疾病史、末次月经、初潮、经期、周期、月经量、痛经、自然妊娠、血型、文化程度、所处社区等;妊娠早期数据集为孕早期(孕12周~孕15周)的固定医疗数据,医疗数据包含该时期的孕检数据和超声检查数据。其中妊娠早期数据集的孕检数据包括当前的体重、收缩压和舒张压、宫高、腹围、脉率、心率等;妊娠早期数据集的超声数据包括孕囊大小、胚芽、卵黄囊、顶臀径、双顶径、NT厚度等。妊娠中晚期数据集为孕24周至孕37周的动态医疗数据,医疗数据包含该时期的孕检数据、超声检查数据和实验室检查数据,医疗数据的时序分布如下表所示。其中妊娠中晚期数据集的孕检数据同步骤2;妊娠中晚期数据集的超声数据包括胎位、胎心、胎盘成熟度、羊水指数、脐血S/D、双顶径、胎儿头围、胎儿腹围、股骨长等。妊娠中晚期数据集的实验室检查数据(化验)包括血液检查、脂代谢、血糖和甲状腺相关数据。其中血液检查包括血红蛋白、红细胞压积、血小板、中性粒细胞、淋巴细胞、嗜酸性粒细胞等;脂代谢项目包括甘油三酯、总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇等;糖代谢项目为OGTT检查,包括空腹血糖、餐后1小时血糖、餐后2小时血糖;甲状腺相关项目包括游离三碘甲状腺原氨酸、游离甲状腺素、人促甲状腺激素、总三碘甲状腺原氨酸、总甲状腺素等;其他还包括尿酸、丙氨酸氨基转移酶、同型半胱氨酸、天门冬氨酸氨基转移酶等代谢化验项目,共计40余项,医疗数据获取的时序示意表如表1所示。
表1.时序数据示意表
Figure BDA0002971780460000061
Figure BDA0002971780460000071
因变量的收集具体是获取产时分娩数据中的新生儿出生时间,减去末次月经时间作为输出变量。
S120、对所述初始数据进行预处理,以得到预处理后的数据。
在本实施例中,预处理后的数据是指经过特征提取、缺失值填补、归一化等预处理后的特征。
在一实施例中,请参阅图3,上述的步骤S120可包括步骤S121~S125。
S121、对所述初始数据中的临床病例资料进行筛选和汇总,以得到汇总后的数据。
在本实施例中,汇总后的数据是指孕早期就诊、体检并后续继续就诊至分娩的完整临床病例资料。
具体地,选取孕早期在某一医院就诊、体检,并后续继续在某一医院就诊至分娩的完整临床病例资料,按照排除标准进行筛选后进行汇总,其中,排除标准包含医源性早产行为的;采用辅助生殖技术的;37周前就诊、体检次数小于3次;有严重的心、脑、血管、肾等内外科合并症及妊娠并发症;双胎以及多胎。
S122、对汇总后的数据进行数据转换和特征提取,以得到关键特征。
在本实施例中,关键特征是指阴道分娩史、剖宫产史、流产史以及甘油三脂等化验数转化成哑变量所形成的关键特征。
具体地,根据查询产妇具体分娩记录,将孕次和产次转化为阴道分娩史、剖宫产史、流产史;B超影像和疾病史以文本报告的形式,通过正则表达式方法提取;甘油三脂等化验数转化成哑变量x,以第三四分位数(Q3)为阈值,其中所采用的公式为
Figure BDA0002971780460000072
S123、对所述关键特征进行缺失值填补,以得到填补结果。
在本实施例中,填补结果是指采用拉格朗日插值法填补所述关键特征的缺失值所得的数据。
具体地,化验数据是预测模型较重要的数据,依据实验室检查的分布,筛去缺少化验1和化验2项目的记录,化验3可为空值;然后筛除单条记录中含30%以上其他缺失值的记录。
年龄、BMI等<1%的固定变量的缺失值,可通过人工校验原始数据直接填补;而妊娠中晚期的体检数据和超声数据等连续性变量采用拉格朗日插值法填补缺失值:
Figure BDA0002971780460000081
x2-x1<4week;y∈{Variables中晚期孕检特在,Variables中晚期超声特征}。其中x表示时间,y表示具体某个中晚期孕检特征或超声特征,其几何意义为(x1,y1)和(x2,y2)是曲线上的两个点,由一条直线y来近似拟合该曲线。线性插值的条件是填补数据前后区间的时间不超过4周,临床上通常要求产妇在妊娠中晚期每个2周进行一次产前综合检查。
S124、对所述填补结果进行归一化处理,以得到处理后的数据。
在本实施例中,处理后的数据是指归一化处理后的特征。
具体地,由于医疗数据具有不同的量纲和量纲单位,数值间的差距会对模型造成影响,因此需要对数据进行归一化处理,避免值域较大的特征影响其他特征,同时提升模型的收敛速度。采用min-max标准化,使得结果映射到[0,1]之间,具体为
Figure BDA0002971780460000082
模型得到预测结果后,需要对结果进行反归一化处理得到真实值。
S125、对处理后的数据进行异常值剔除,以得到预处理后的数据。
在本实施例中,采用拉依达准则进行异常值处理,即以给定的置信概率99.7%为标准,以3倍数据列标准差σ为依据,纳入预测模型的测量值的剩余误差大于3倍σ时,应予剔除。
具体地,|剩余误差|=|纳入预测模型的测量值-测量均值|>3σ,满足该公式的数据应当剔除。
S130、对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果。
在本实施例中,预测结果是指通过预产期预测模型预测所得的预产期。
具体地,所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的;其中,所述预产期预测模型是通过GBDT(梯度提升决策树,GradientBoosting Decision Tree)模型和GRU(门控循环单元结构,Gated Recurrent Unit)模型结合所得。
GBDT模型是一个加法模型,它串行地训练一组CART回归树,最终对所有回归树的预测结果加和,由此得到一个强学习器,每一颗新树都拟合当前损失函数的负梯度方向;GRU模型是LSTM(时间循环神经网络,Long Short-Term Memory)的一种效果很好的变体,它较LSTM的结构更加简单,而且效果也很好,因此也是当前非常流形的一种网络。GRU既然是LSTM的变体,因此也是可以解决RNN(循环神经网络,Recurrent Neural Network)网络中的长依赖问题。
具体地,以若干个医疗数据进行预处理后形成的样本集进行训练GBDT模型和GRU模型混合形成的预产期预测模型,医疗数据包括不同孕期的生理参数特点,从而获取的预产期预测模型能结合不同孕期的生理参数特点,获取不同孕期的相关特征并进行重要性分析,获取更加准确的预测结果。
在一实施例中,请参阅图4,上述的预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的,包括S131~S134。
S131、对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征。
在本实施例中,第一特征包括动态特征和固定特征,其中,动态特征是指对动态医疗数据进行特征选择所得的特征,固定特征是指对固定医疗数据进行特征选择所得的特征。
在一实施例中,请参阅图5,上述的步骤S131可包括步骤S1311~S1314。
S1311、对若干个医疗数据进行预处理后形成样本集内固定医疗数据分别通过XGBoost模型和RF模型计算对应的预测值,并对两个预测值进行求平均值,以得到第一平均值。
在本实施例中,第一平均值是指对固定医疗数据通过XGBoost(梯度提升,ExtremeGradient Boosting)模型和RF(随机森林,random forests)模型计算对应的预测值即梯度提升值XGB值和随机森林值RF值,并将这两个预测值进行求均值所得。
通过XGBoost和RF模型分别计算得到XGB值和RF值,并取其平均值作为固定资料特征的重要性指数Gain-ratiostatic;初步删去不重要的特征以提高计算速度和泛化能力。具体地,
Figure BDA0002971780460000101
Figure BDA0002971780460000102
S1312、选择第一平均值大于预设的信息增益率阈值所对应的动态数据,以得到固定特征。
在本实施例中,固定特征是指选择第一平均值大于信息增益率阈值VGain-ratio的变量小于最大信息增益变量max(VGain-ratio)的10%该阈值所对应的动态数据,其中,固定特征Variables={V|VGain-ratio>0.1×max(VGain-ratio)}。
S1313、对若干个医疗数据进行预处理后形成样本集内动态医疗数据分别通过XGBoost模型和RF模型计算每个阶段的预测值,并计算每个阶段的预测值的平均值,以得到第二平均值。
在本实施例中,第二平均值是指对动态医疗数据通过XGBoost模型和RF模型计算对应的预测值即梯度提升值XGB值和随机森林值RF值,并将这两个预测值进行求均值得到每个阶段的Gain-ratio,并计算每个阶段的预测值的平均值所得。
具体地,对于妊娠中晚期数据的数据,分别在24-28周、29-30周、31-32周、33-34周、35-36周、37周进行横断面研究,按照
Figure BDA0002971780460000103
Figure BDA0002971780460000104
的依次计算XGB值和RF值,得到每个阶段的Gain-ratio,再取其平均值作为时序资料特征的重要性指数,即
Figure BDA0002971780460000105
Figure BDA0002971780460000106
S1314、选择第二平均值大于预设的信息增益率阈值所对应的动态数据,以得到动态特征。
在本实施例中,动态特征是指选择第二平均值大于信息增益率阈值VGain-ratio的变量小于最大信息增益变量max(VGain-ratio)的10%该阈值所对应的动态数据,其中,动态特征Variables={V|VGain-ratio>0.1×max(VGain-ratio)}。
S132、对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征。
在本实施例中,第二特征是指针对固定医疗数据提取所得的特征。
具体地,利用GBDT模型对妊娠早期数据集进行训练,待训练完成后,使用相同的数据进行预测,预测结果为新的非时序特征即初步的预产期预测值。
在本实施例中,上述的步骤S132可包括:
构建梯度提升树,并利用梯度提升树对若干个医疗数据进行预处理后形成样本集中的妊娠早期数据集生成第二特征;
其中,请参阅图6,所述构建梯度提升树包括步骤S1321~S1323。
S1321、计算梯度提升树的负梯度。
具体地,初始化后,计算损失函数的负梯度在当前模型的值,在当前模型Fm(x)=Fm-1(x)的值近似替代残差,则负梯度rij的计算公式如下:
Figure BDA0002971780460000111
Figure BDA0002971780460000112
其中当前模型为Fm(x),训练样本为i(i=1,2,3...,n),迭代次数j(j=1,2,3...,m),损失函数为L(yi,F(xi))。具体的,m为树的个数,用损失函数的负梯度来拟合本轮损失的近似值,rij表示第j轮第i个样本的损失函数的负梯度。
S1322、更新对应的基学习器。
在本实施例中,使用基学习器hj(x)拟合损失函数的负梯度rj,求出使损失函数最小的最佳拟合值,从而进行模型更新,本轮的强学习器如下:
Figure BDA0002971780460000113
Figure BDA0002971780460000114
Fj(x)=Fj-1(x)+rjhj(xi)。其中,强学习器是指更新后选择最优的基学习器。具体地,hj(x)为基学习器;L(y,f(x))为损失函数,其中,y为预测真实值,f(x)为模型预测值;负梯度标号统一为rij
S1323对每轮产生的基学习器通过线性相加,以得到梯度提升树。
在本实施例中,最终梯度提升树是由每轮产生的基学习器通过线性相加的方式求得:
Figure BDA0002971780460000121
Fm(x)为当前模型,j为迭代次数,m为最大迭代次数。
S133、融合第一特征以及第二特征,以得到新特征。
在本实施例中,新特征是指第一特征以及第二特征进行融合所得的特征。
第二特征Feature2,与第一特征中的固定特征Featuresstatic和动态特征Featurestime_series进行特征融合,获得新特征Featuresnew:Featuresnew=Feature2∪Featuresstatic∪Featurestime_series
S134、构建GRU模型,利用所述新特征对所述GRU模型进行训练,采用预设定的评价指标评价训练后的所述GRU模型,以得到预产期预测模型。
在本实施例中,评价指标包括决定系数、平均绝对误差和均方误差。
具体地,融合Featurestime_series的Featuresnew具有明显的时间依赖性,GRU模型通过一个隐藏层中的更新门和控制门来共同决定模型的保留和遗忘的能力,通过迭代得到最终的预测结果。一个当前的输入xt,和上一个节点传递下来的隐状态ht-1,这个隐状态包含了之前节点的信息;rt=σ(Wr·[ht-1,xt]);zt=σ(Wz·[ht-1,xt]);其中zt和rt分别表示更新门和重置门。zt决定前一时刻的状态信息传输到当前状态的多少,zt越大表明前一时刻的状态信息传入到当前状态越多,rt决定前一状态有多少信息被写入到当前的候选集ht上,σ是Sigmoid激活函数。
上一时刻隐藏数据经过重置门控得到的重置数据与当前的输入xt相结合并通过tanh激活函数可以得到当前时刻的候选隐藏状态
Figure BDA0002971780460000124
最后结合rt=σ(Wr·[ht-1,xt]);zt=σ(Wz·[ht-1,xt])得到t时刻的隐藏状态ht;即
Figure BDA0002971780460000122
Figure BDA0002971780460000123
进一步得到GRU网络模型的输出,即预产期yt=σ(WO·ht)。
另外,以决定系数、平均绝对误差和均方误差对对各个模型(如XGBoost模型、RF模型和GRU模型)的性能进行评价,以评估模型的总体预测能力。
为了进一步评估基于GBDT模型和GRU模型结合形成的预产期预测模型的预测效果,将每种方法在预测预产期时的偏差作为预测可靠性的另一个关键指标。Dbias定义如下:Dbias=|Dreal-Dpredict|;其中Dreal是实际分娩日期,Dpredict是模型输出的预产期。通过统计不同Dbias的准确率,可以得到不同方法在实际应用中的性能和可用性。不同Dbias的准确率为
Figure BDA0002971780460000131
其中,N为孕妇总数,
Figure BDA0002971780460000132
为预测偏差小于Dbias的孕妇数。
S140、反馈所述预测结果至终端,以在终端进行显示。
将预测结果反馈至终端,医生可根据终端显示的预测结果对孕妇进行不同类型的产检。
本实施例使用了一个混合的模型,从电子病历中提取特征并预测孕妇的预产期,可实现预产期的精准预测,有助于待产孕妇合理安排分娩事宜,对保障分娩安全和提高分娩效率具有重要意义。GBDT模型和GRU模型结合的混合模型的预测精度优于其他预测方法,具有更好的泛化能力,且在处理时间序列数据时表现出比LSTM更好的性能,可以更好地服务和支持医务人员的决策。此外,基于电子病历数据集的预产期预测具有巨大的研究潜力。通过本方法可进一步探究与分娩时间密切相关的特征,为后续研究提供了参考。
本实施例提供的方法可作为一种产科门诊辅助系统,填补当前国内对预产期智能动态预测的空白,旨在对预产期进行更精准、更可靠、动态的预测,提前做好产前预备,为临床分娩治疗制定了指南以减少不良后果的发生概率,保障母婴健康安全。
以孕妇电子病历数据为基础,整合了基本体检数据、超声记录和化验记录,利用机器学习模型全方面挖掘和分析数据,不同于传统方法中单用某一阶段的数据,本研究结合不同孕期的生理参数特点,获取不同孕期的相关特征并进行重要性分析。结合了机器学习和时序模型的优点,契合孕妇怀孕时期的特征。机器学习模型用于在早期获取预产期,特征融合保证各个孕期数据的合理利用,同时GRU神经网络捕捉孕妇中后期孕妇的历次产检时生理特点,获取更加准确的预测结果。更加准确适宜的分娩日期预测,解决了原来预产期准确率低、特殊性弱等问题,该方法在孕中后期的动态预测能力以及系统的应用辅助医生评估胎儿的生长发育,方便孕妇个性化判断自身生理情况,制定临产措施。
上述的预产期精准预测方法,通过获取医疗数据,并对医疗数据进行预处理后,输入由GBDT模型和GRU模型结合的预产期预测模型内进行自动预测,由此获取精准地预产期,实现结合不同孕期的生理参数特点,获取不同孕期的相关特征并进行重要性分析,获取更加准确的预测结果。
图7是本发明实施例提供的一种预产期精准预测装置300的示意性框图。如图7所示,对应于以上预产期精准预测方法,本发明还提供一种预产期精准预测装置300。该预产期精准预测装置300包括用于执行上述预产期精准预测方法的单元,该装置可以被配置于服务器中。具体地,请参阅图7,该预产期精准预测装置300包括数据获取单元301、预处理单元302、预测单元303以及发送单元304。
数据获取单元301,用于获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据;预处理单元302,用于对所述初始数据进行预处理,以得到预处理后的数据;预测单元303,用于对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果;发送单元304,用于反馈所述预测结果至终端,以在终端进行显示。
在一实施例中,所述预处理单元302包括汇总子单元、特征提取子单元、填补子单元、归一化子单元以及剔除子单元。
汇总子单元,用于对所述初始数据中的临床病例资料进行筛选和汇总,以得到汇总后的数据;特征提取子单元,用于对汇总后的数据进行数据转换和特征提取,以得到关键特征;填补子单元,用于对所述关键特征进行缺失值填补,以得到填补结果;归一化子单元,用于对所述填补结果进行归一化处理,以得到处理后的数据;剔除子单元,用于对处理后的数据进行异常值剔除,以得到预处理后的数据。
在一实施例中,上述的装置还包括训练单元。
所述训练单元,用于通过若干个医疗数据进行预处理后形成样本集进行训练,以得到预产期预测模型,其中,所述预产期预测模型是通过GBDT模型和GRU模型结合所得。
在一实施例中,所述训练单元包括第一特征选择子单元、第二特征生成子单元、融合子单元以及模型处理子单元。
第一特征选择子单元,用于对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征;第二特征生成子单元,用于对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征;融合子单元,用于融合第一特征以及第二特征,以得到新特征;模型处理子单元,用于构建GRU模型,利用所述新特征对所述GRU模型进行训练,采用预设定的评价指标评价训练后的所述GRU模型,以得到预产期预测模型。
在一实施例中,所述第一特征选择子单元包括第一均值获取模块、第一选择模块、第二均值获取模块以及第二选择模块。
第一均值获取模块,用于对若干个医疗数据进行预处理后形成样本集内固定医疗数据分别通过XGBoost模型和RF模型计算对应的预测值,并对两个预测值进行求平均值,以得到第一平均值;第一选择模块,用于选择第一平均值大于预设的信息增益率阈值所对应的动态数据,以得到固定特征;第二均值获取模块,用于对若干个医疗数据进行预处理后形成样本集内动态医疗数据分别通过XGBoost模型和RF模型计算每个阶段的预测值,并计算每个阶段的预测值的平均值,以得到第二平均值;第二选择模块,用于选择第二平均值大于预设的信息增益率阈值所对应的动态数据,以得到动态特征;其中,所述第一特征包括动态特征以及固定特征。
在一实施例中,所述第二特征选择子单元用于构建梯度提升树,并利用梯度提升树对若干个医疗数据进行预处理后形成样本集中的妊娠早期数据集生成第二特征。具体地,所述构建梯度提升树,包括:计算梯度提升树的负梯度;更新对应的基学习器;对每轮产生的基学习器通过线性相加,以得到梯度提升树。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述预产期精准预测装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述预产期精准预测装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。
请参阅图8,图8是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图8,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种预产期精准预测方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种预产期精准预测方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据;对所述初始数据进行预处理,以得到预处理后的数据;对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果;反馈所述预测结果至终端,以在终端进行显示;
其中,所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的。
所述预产期预测模型是通过GBDT模型和GRU模型结合所得。
所述初始数据包括固定医疗数据和动态医疗数据,其中,所述固定医疗数据包括产前数据集以及妊娠早期数据集,所述动态医疗数据包括妊娠中晚期数据集。
在一实施例中,处理器502在实现所述对所述初始数据进行预处理,以得到预处理后的数据步骤时,具体实现如下步骤:
对所述初始数据中的临床病例资料进行筛选和汇总,以得到汇总后的数据;对汇总后的数据进行数据转换和特征提取,以得到关键特征;对所述关键特征进行缺失值填补,以得到填补结果;对所述填补结果进行归一化处理,以得到处理后的数据;对处理后的数据进行异常值剔除,以得到预处理后的数据。
在一实施例中,处理器502在实现所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的步骤时,具体实现如下步骤:
对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征;对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征;融合第一特征以及第二特征,以得到新特征;构建GRU模型,利用所述新特征对所述GRU模型进行训练,采用预设定的评价指标评价训练后的所述GRU模型,以得到预产期预测模型。
在一实施例中,处理器502在实现所述对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征步骤时,具体实现如下步骤:
对若干个医疗数据进行预处理后形成样本集内固定医疗数据分别通过XGBoost模型和RF模型计算对应的预测值,并对两个预测值进行求平均值,以得到第一平均值;选择第一平均值大于预设的信息增益率阈值所对应的动态数据,以得到固定特征;对若干个医疗数据进行预处理后形成样本集内动态医疗数据分别通过XGBoost模型和RF模型计算每个阶段的预测值,并计算每个阶段的预测值的平均值,以得到第二平均值;选择第二平均值大于预设的信息增益率阈值所对应的动态数据,以得到动态特征;
其中,所述第一特征包括动态特征以及固定特征。
在一实施例中,处理器502在实现所述对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征步骤时,具体实现如下步骤:
构建梯度提升树,并利用梯度提升树对若干个医疗数据进行预处理后形成样本集中的妊娠早期数据集生成第二特征。
在一实施例中,处理器502在实现所述构建梯度提升树步骤时,具体实现如下步骤:
计算梯度提升树的负梯度;更新对应的基学习器;对每轮产生的基学习器通过线性相加,以得到梯度提升树。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据;对所述初始数据进行预处理,以得到预处理后的数据;对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果;反馈所述预测结果至终端,以在终端进行显示;
其中,所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的。
所述预产期预测模型是通过GBDT模型和GRU模型结合所得。
所述初始数据包括固定医疗数据和动态医疗数据,其中,所述固定医疗数据包括产前数据集以及妊娠早期数据集,所述动态医疗数据包括妊娠中晚期数据集。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述初始数据进行预处理,以得到预处理后的数据步骤时,具体实现如下步骤:
对所述初始数据中的临床病例资料进行筛选和汇总,以得到汇总后的数据;对汇总后的数据进行数据转换和特征提取,以得到关键特征;对所述关键特征进行缺失值填补,以得到填补结果;对所述填补结果进行归一化处理,以得到处理后的数据;对处理后的数据进行异常值剔除,以得到预处理后的数据。
在一实施例中,所述处理器在执行所述计算机程序而实现所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的步骤时,具体实现如下步骤:
对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征;对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征;融合第一特征以及第二特征,以得到新特征;构建GRU模型,利用所述新特征对所述GRU模型进行训练,采用预设定的评价指标评价训练后的所述GRU模型,以得到预产期预测模型。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征步骤时,具体实现如下步骤:
对若干个医疗数据进行预处理后形成样本集内固定医疗数据分别通过XGBoost模型和RF模型计算对应的预测值,并对两个预测值进行求平均值,以得到第一平均值;选择第一平均值大于预设的信息增益率阈值所对应的动态数据,以得到固定特征;对若干个医疗数据进行预处理后形成样本集内动态医疗数据分别通过XGBoost模型和RF模型计算每个阶段的预测值,并计算每个阶段的预测值的平均值,以得到第二平均值;选择第二平均值大于预设的信息增益率阈值所对应的动态数据,以得到动态特征;
其中,所述第一特征包括动态特征以及固定特征。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征步骤时,具体实现如下步骤:
构建梯度提升树,并利用梯度提升树对若干个医疗数据进行预处理后形成样本集中的妊娠早期数据集生成第二特征。
在一实施例中,所述处理器在执行所述计算机程序而实现所述构建梯度提升树步骤时,具体实现如下步骤:
计算梯度提升树的负梯度;更新对应的基学习器;对每轮产生的基学习器通过线性相加,以得到梯度提升树。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.预产期精准预测方法,其特征在于,包括:
获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据;
对所述初始数据进行预处理,以得到预处理后的数据;
对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果;
反馈所述预测结果至终端,以在终端进行显示;
其中,所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的。
2.根据权利要求1所述的预产期精准预测方法,其特征在于,所述预产期预测模型是通过GBDT模型和GRU模型结合所得。
3.根据权利要求1所述的预产期精准预测方法,其特征在于,所述初始数据包括固定医疗数据和动态医疗数据,其中,所述固定医疗数据包括产前数据集以及妊娠早期数据集,所述动态医疗数据包括妊娠中晚期数据集。
4.根据权利要求1所述的预产期精准预测方法,其特征在于,所述对所述初始数据进行预处理,以得到预处理后的数据,包括:
对所述初始数据中的临床病例资料进行筛选和汇总,以得到汇总后的数据;
对汇总后的数据进行数据转换和特征提取,以得到关键特征;
对所述关键特征进行缺失值填补,以得到填补结果;
对所述填补结果进行归一化处理,以得到处理后的数据;
对处理后的数据进行异常值剔除,以得到预处理后的数据。
5.根据权利要求1所述的预产期精准预测方法,其特征在于,所述预产期预测模型是通过若干个医疗数据进行预处理后形成样本集进行训练所得的,包括:
对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征;
对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征;
融合第一特征以及第二特征,以得到新特征;
构建GRU模型,利用所述新特征对所述GRU模型进行训练,采用预设定的评价指标评价训练后的所述GRU模型,以得到预产期预测模型。
6.根据权利要求5所述的预产期精准预测方法,其特征在于,所述对若干个医疗数据进行预处理后形成样本集基于树的计算实时变量的信息增益率进行特征选择,以得到第一特征,包括:
对若干个医疗数据进行预处理后形成样本集内固定医疗数据分别通过XGBoost模型和RF模型计算对应的预测值,并对两个预测值进行求平均值,以得到第一平均值;
选择第一平均值大于预设的信息增益率阈值所对应的动态数据,以得到固定特征;
对若干个医疗数据进行预处理后形成样本集内动态医疗数据分别通过XGBoost模型和RF模型计算每个阶段的预测值,并计算每个阶段的预测值的平均值,以得到第二平均值;
选择第二平均值大于预设的信息增益率阈值所对应的动态数据,以得到动态特征;
其中,所述第一特征包括动态特征以及固定特征。
7.根据权利要求5所述的预产期精准预测方法,其特征在于,所述对若干个医疗数据进行预处理后形成样本集利用梯度提升树生成第二特征,包括:
构建梯度提升树,并利用梯度提升树对若干个医疗数据进行预处理后形成样本集中的妊娠早期数据集生成第二特征;
其中,所述构建梯度提升树,包括:
计算梯度提升树的负梯度;
更新对应的基学习器;
对每轮产生的基学习器通过线性相加,以得到梯度提升树。
8.预产期精准预测装置,其特征在于,包括:
数据获取单元,用于获取孕期的医疗数据,并按照孕期进行医疗数据的划分,以得到初始数据;
预处理单元,用于对所述初始数据进行预处理,以得到预处理后的数据;
预测单元,用于对预处理后的数据输入至预产期预测模型内进行预产期预测,以得到预测结果;
发送单元,用于反馈所述预测结果至终端,以在终端进行显示。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至7中任一项所述的方法。
CN202110264626.3A 2021-03-11 2021-03-11 预产期精准预测方法、装置、计算机设备及存储介质 Withdrawn CN112992353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110264626.3A CN112992353A (zh) 2021-03-11 2021-03-11 预产期精准预测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110264626.3A CN112992353A (zh) 2021-03-11 2021-03-11 预产期精准预测方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN112992353A true CN112992353A (zh) 2021-06-18

Family

ID=76335014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110264626.3A Withdrawn CN112992353A (zh) 2021-03-11 2021-03-11 预产期精准预测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112992353A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113921142A (zh) * 2021-09-07 2022-01-11 杭州和乐科技有限公司 早产风险预测方法、装置、计算机设备及存储介质
CN114266200A (zh) * 2022-02-24 2022-04-01 山东大学 二氧化氮浓度预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019041754A (ja) * 2017-08-31 2019-03-22 株式会社Nttドコモ 予測装置及び予測方法
CN110322695A (zh) * 2019-07-23 2019-10-11 内蒙古工业大学 一种基于深度学习的短时交通流预测方法
CN110996766A (zh) * 2017-07-19 2020-04-10 布鲁姆技术公司 监测子宫活动和评估早产风险
CN111243735A (zh) * 2019-09-10 2020-06-05 中国医科大学附属盛京医院(中国医科大学附属第二医院) 一种面向单胎瘢痕子宫产妇的医源性早产风险预测算法及评分系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110996766A (zh) * 2017-07-19 2020-04-10 布鲁姆技术公司 监测子宫活动和评估早产风险
JP2019041754A (ja) * 2017-08-31 2019-03-22 株式会社Nttドコモ 予測装置及び予測方法
CN110322695A (zh) * 2019-07-23 2019-10-11 内蒙古工业大学 一种基于深度学习的短时交通流预测方法
CN111243735A (zh) * 2019-09-10 2020-06-05 中国医科大学附属盛京医院(中国医科大学附属第二医院) 一种面向单胎瘢痕子宫产妇的医源性早产风险预测算法及评分系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113921142A (zh) * 2021-09-07 2022-01-11 杭州和乐科技有限公司 早产风险预测方法、装置、计算机设备及存储介质
CN114266200A (zh) * 2022-02-24 2022-04-01 山东大学 二氧化氮浓度预测方法及系统

Similar Documents

Publication Publication Date Title
Lu et al. Prediction of fetal weight at varying gestational age in the absence of ultrasound examination using ensemble learning
Salavati et al. The possible role of placental morphometry in the detection of fetal growth restriction
DeVore et al. 24‐segment sphericity index: a new technique to evaluate fetal cardiac diastolic shape
Chen et al. Artificial intelligence in obstetric ultrasound: an update and future applications
CN109671086A (zh) 一种基于三维超声的胎儿头部全自动分割方法
CN113077900B (zh) 糖尿病早期风险评估方法、装置、计算机设备及介质
KR102139856B1 (ko) 초음파 영상 처리 방법
JP7237147B2 (ja) バイオメトリック測定及び品質評価
JP2002523168A (ja) 胎盤および胎児健康診断用モニター
CN112992353A (zh) 预产期精准预测方法、装置、计算机设备及存储介质
Spairani et al. A deep learning mixed-data type approach for the classification of FHR signals
Das et al. Cardiotocograph-based labor stage classification from uterine contraction pressure during ante-partum and intra-partum period: a fuzzy theoretic approach
Liang et al. Fully automatic classification of cardiotocographic signals with 1D-CNN and bi-directional GRU
Arain et al. Machine learning and disease prediction in obstetrics
CN114176549B (zh) 基于生成式对抗网络的胎心率信号数据增强方法和装置
Wang et al. RU-Net: An improved U-Net placenta segmentation network based on ResNet
CN117954093A (zh) 极早产儿肺部血管发育评估方法和装置
US20230005133A1 (en) Automated placental measurement
Płotka et al. Deep learning for estimation of fetal weight throughout the pregnancy from fetal abdominal ultrasound
US20180365825A1 (en) Automated placental measurement
Gadagkar et al. Features based IUGR diagnosis using variational level set method and classification using artificial neural networks
CN116563224B (zh) 基于深度语义特征的影像组学胎盘植入预测方法及装置
CN111445553A (zh) 一种基于深度学习的体素内不相干运动成像加速方法及装置
WO2020103098A1 (zh) 超声成像方法、设备、存储介质,处理器及计算机设备
Anuwutnavin et al. Reference Ranges and Development Patterns of Fetal Myocardial Function Using Speckle Tracking Echocardiography in Healthy Fetuses at 17 to 24 Weeks of Gestation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210618

WW01 Invention patent application withdrawn after publication