CN111312341A - 华法林剂量预测方法及预测装置 - Google Patents

华法林剂量预测方法及预测装置 Download PDF

Info

Publication number
CN111312341A
CN111312341A CN202010051466.XA CN202010051466A CN111312341A CN 111312341 A CN111312341 A CN 111312341A CN 202010051466 A CN202010051466 A CN 202010051466A CN 111312341 A CN111312341 A CN 111312341A
Authority
CN
China
Prior art keywords
algorithm
warfarin
sample set
verification set
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010051466.XA
Other languages
English (en)
Other versions
CN111312341B (zh
Inventor
阳国平
裴奇
郭成贤
况赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Third Xiangya Hospital of Central South University
Original Assignee
Third Xiangya Hospital of Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Third Xiangya Hospital of Central South University filed Critical Third Xiangya Hospital of Central South University
Priority to CN202010051466.XA priority Critical patent/CN111312341B/zh
Publication of CN111312341A publication Critical patent/CN111312341A/zh
Application granted granted Critical
Publication of CN111312341B publication Critical patent/CN111312341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Toxicology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种华法林剂量预测方法及预测装置,包括:从数据库中提取样本集,对样本集进行规范化处理,将规范化处理后的样本集划分为若干组;依次选取其中一组为第一验证集,剩余的组为训练集,根据训练集及预设算法构建单模型,通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,根据同一预设算法对应的误差计算得到预设算法对应的精度;选取精度符合要求的算法作为最优算法;通过网格搜索对最优算法的参数进行调解;根据样本集及参数调解后的最优算法进行训练得到华法林剂量预测模型;获取用户信息,并将用户信息输入至华法林剂量预测模型中,得到与用户信息对应的华法林剂量。采用该方法能够提高预测准确性。

Description

华法林剂量预测方法及预测装置
技术领域
本发明涉及中华法林剂量预测方法及预测装置,属于药物检测技术领域。
背景技术
华法林(warfarin)是20世纪40年代美国Wisconsin大学合成的香豆素类口服抗凝血药,可通过抑制维生素K环氧化物还原酶的活性,阻断还原型维生素K的生成,进而抑制维生素K依赖性凝血因子II,VII,IX,X的活化而起到抗凝作用。华法林是最常用的口服抗凝药物,已上市超过60年,临床上广泛用于心房纤颤(atrial fibrillation AF),深静脉血栓(deep vein thrombosis DVT)等疾病,可有效降低该类患者的血栓栓塞风险。2010年,美国超过2500万张处方中用到华法林,华法林每年处方量相当于人口数的0.5-1.5%。华法林的临床问题主要在于其治疗窗窄,极易发生不良事件。一项纳入65岁以上的美国人的调查性研究表明,2007~2009年间,接近三分之一的药源性住院是服用华法林导致的,且其中有63.3%是因抗凝过度导致的出血事件而住院[8]。华法林治疗的患者每年大出血的发生率在0.4%到7.2%之间。小出血率高达每年15%。美国FDA的不良事件报告系统显示,华法林是引起严重不良事件最多的10种药物之一。华法林的主要药效学指标为国际标准化比值(international normalized ratio INR),当超出INR窗时表明抗凝过度,患者出血风险高,反之则表明抗凝不足,患者血栓栓塞风险高。因此在华法林的有效性和安全性与维持INR在治疗范围内密切相关。华法林临床使用中需频繁监测患者的INR变化,即使患者华法林剂量已达稳态,IINR检测周期也不超过4周。而过多的随访次数给患者使用带来了极大的不便利,降低了患者依从性,增加不良反应发生率。
华法林不良事件多发生在抗凝早期阶段,主要归因于其个体间剂量差异大,不同个体所需治疗剂量可相差20倍以上,且其抗凝作用可受遗传变异、种族差异和非遗传因素影响。传统的华法林初始给药方法为固定剂量法,并频繁监测INR进行剂量调整。但由于华法林的个体差异极大,传统的固定剂量法给药可能增大华法林用药初期的血栓或出血风险。近年来国内外发表了多项基于遗传学和环境因素的华法林个体化剂量预测模型,包括基于混合种族建立的模型,基于白种人群建立的模型,基于亚洲人群建立的模型等,这些模型约可解释华法林剂量个体差异的50%-60%[29]。在国外建立的众多模型中,国际华法林药物基因组协会(IWPC),Gage[16]及Wadelius[20]等建立的模型最具影响力,甚至在一定程度上推动了华法林个体化治疗的临床应用。但由于存在种族差异,中国人群平均华法林剂量显著低于白种人及非裔美国人,且中国人群对华法林的抗凝治疗更为敏感,为了安全抗凝,中国人群往往采用低抗凝强度标准,因此由多种族及白种人群建立的华法林初始剂量预测模型并不适用于中国人群。
基于亚洲人群建立的华法林初始剂量预测模型也较多,但存在以下几点缺陷,首先,多数研究采用回顾性数据建模,检测、评判及诊断标准并不统一;其次,由于各模型研究的目标INR范围、建模样本量、模型纳入的因素等存在差异,各模型的解释度差异较大,低至37.4%,高至74.3%;第三,Xu等虽通过前瞻性数据建模,但模型纳入因素较少,仅可解释38%的华法林剂量变异,并且该研究入选的适应症包含房颤,深静脉血栓,心脏瓣膜置换和肺栓塞等,模型的混杂因素较多,专一性相对较差;最后,目前的这些模型研究均停留在文献发表状态,尚无应用于临床的华法林初始剂量预测模型。因此,仍有必要利用前瞻性数据建立需要长期服用华法林的中国人群华法林初始剂量预测模型。
目前华法林剂量模型多基于多元线性回归方法(MLR),而华法林剂量与其变量之间的关系是复杂的非线性关系,如CYP2C9和VKORC1基因型之间的相互作用[39]。且MLR仅预测华法林在稳态条件下的剂量,预测极端值的能力较差,模型应用范围较窄。一项纳入22种华法林算法的meta分析中发现1492名需要华法林剂量≥7毫克/天的患者中剂量被低估率高达92.3%,平均低估2.3mg[40]。因此MLR可能不是准确预测这些华法林剂量的最可行方法,需要探寻一种更适用的建模方法。
发明内容
针对现有技术存在的上述问题,本发明的目的是提供一种能准确预测华法林剂量的华法林剂量预测方法及预测装置。
为实现上述发明目的,本发明采用的技术方案如下:
一种华法林剂量预测方法,所述方法包括:
从数据库中提取样本集,并对所述样本集进行规范化处理,将规范化处理后的样本集划分为若干组;
依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据所述训练集以及预设算法构建单模型,并通过当前所选取的所述第一验证集对所述单模型进行验证得到所述单模型的误差,并根据同一所述预设算法对应的误差计算得到所述预设算法对应的精度;
选取所述精度符合要求的算法作为最优算法;
通过网格搜索对所述最优算法的参数进行调解;
根据所述样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型;
获取用户信息,并将所述用户信息输入至所述华法林剂量预测模型中,得到与所述用户信息对应的华法林剂量。
在其中一个实施例中,所述对所述样本集进行规范化处理,包括:
将所述类别型数据转化为数值,并获取到数值出现频率最高的数值作为类别型缺失数据的值;
获取数值型数据的平均值作为数值型缺失数据的值;
通过独热编码代替无序值。
在其中一个实施例中,所述依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据所述训练集以及预设算法构建单模型,并通过当前所选取的所述第一验证集对所述单模型进行验证得到所述单模型的误差,并根据同一所述预设算法对应的误差计算得到所述预设算法对应的精度,包括:
按照顺序选取其中一组作为当前第一验证集,并将剩余的组作为当前训练集;
根据所述当前训练集以及预设算法构建单模型;
通过所述当前第一验证集对所述单模型进行验证得到所述单模型的当前误差;
按照顺序选取下一组作为当前第一验证集,并继续将剩余的组作为当前训练集计算得到下一当前误差,直至所划分的组均被作为当前第一验证集处理过;
计算所得到的所有当前误差的平均值作为所述预设算法对应的精度。
在其中一个实施例中,所述通过网格搜索对所述最优算法的参数进行调解,包括:
获取预先设置的参数的取值范围,并将所述参数的取值范围构建参数组合;
通过所述参数组合以及最优算法构建待调解算法;
选取使得所述待调解算法的精度符合要求的参数作为所述待调解算法的参数。
在其中一个实施例中,所述根据所述样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型之后,还包括:
获取第二验证集,将所述第二验证集输入至华法林剂量预测模型以对所述华法林剂量预测模型进行验证。
在其中一个实施例中,所述华法林剂量预测模型为稳定剂量预测模型,所述第二验证集的获取方式包括:
获取初始验证集,并对所述初始验证集中的数据进行规范化处理;
从规范化处理后的初始验证集中选取符合稳定剂量的数据,生成第二验证集。
在其中一个实施例中,所述将所述第二验证集输入至华法林剂量预测模型以对所述华法林剂量预测模型进行验证之后,还包括:
将所述第二验证集与所述样本集进行合并得到综合样本集;
通过合并后的综合样本集对验证后的所述华法林剂量预测模型进行优化。
一种华法林剂量预测装置,所述装置包括:
划分模块,用于从数据库中提取样本集,并对所述样本集进行规范化处理,将规范化处理后的样本集划分为若干组;
精度计算模块,用于依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据所述训练集以及预设算法构建单模型,并通过当前所选取的所述第一验证集对所述单模型进行验证得到所述单模型的误差,并根据同一所述预设算法对应的误差计算得到所述预设算法对应的精度;
算法选取模块,用于选取所述精度符合要求的算法作为最优算法;
参数调解模块,用于通过网格搜索对所述最优算法的参数进行调解;
训练模块,用于根据所述样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型;
预测模块,用于获取用户信息,并将所述用户信息输入至所述华法林剂量预测模型中,得到与所述用户信息对应的华法林剂量。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
与现有技术相比,本发明提供的华法林剂量预测方法及预测装置具备以下优势:
在进行华法林剂量预测模型的建设的时候,首先选取多种算法,并对样本集进行划分为第一验证集和训练集,根据训练集以及预设算法构建单模型,并通过第一验证集对单模型进行验证得到单模型的误差,且依次将所划分的样本集中的其他组作为第一验证集,剩余组作为训练集得到多个单模型的误差,通过该些误差可以计算得到预设算法的精度,从而可以选择到符合要求的算法作为最优算法,进而通过网格搜索对该最优算法的参数进行调解,然后通过样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型,这样可以选择最准确的算法进行预测,从而保证了算法的准确性,进而根据用户信息所预测的华法林剂量也是准确的。
附图说明
图1为一个实施例中华法林剂量预测方法的应用场景图;
图2为一个实施例中华法林剂量预测方法的流程示意图;
图3为图2所示实施例中的步骤S204的流程示意图;
图4为一个实施例中华法林剂量预测装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的华法林剂量预测方法,可以应用于如图1所示的应用环境中。其中,用户终端102通过网络与服务器104通过网络进行通信。服务器104可以接收用户终端102发送的用户信息,并将该用户信息输入至华法林剂量预测模型中得到与用户信息对应的华法林剂量。其中华法林剂量预测模型的生成方式可以包括:服务器104从数据库106中提取样本集,然后对该样本集进行规范化处理,将规范化处理后的样本集划分为若干组,依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据训练集以及预设算法构建单模型,并通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,并根据同一预设算法对应的误差计算得到预设算法对应的精度。从而可以选择到符合要求的算法作为最优算法,进而通过网格搜索对该最优算法的参数进行调解,然后通过样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型,这样可以选择最准确的算法进行预测,从而保证了算法的准确性,进而根据用户信息所预测的华法林剂量也是准确的。其中,用户终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种华法林剂量预测方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S202:从数据库中提取样本集,并对样本集进行规范化处理,将规范化处理后的样本集划分为若干组。
具体地,数据库中存储的样本集可以是预先收集的,例如预先收集的志愿者的试验号、年龄、性别、身高、体重、适应症、吸烟饮酒状况、合并疾病及合并用药信息、生化指标、CYP2C9及VKORC1基因型结果以及每一次随访或计划外访视的服用华法林剂量及服药后INR,每一次随访或计划外访视作为一个样本,按照随访时间及试验号顺序排列。
其中对样本集进行规范化处理,包括:将类别型数据转化为数值,并获取到数值出现频率最高的数值作为类别型缺失数据的值;获取数值型数据的平均值作为数值型缺失数据的值;通过独热编码代替无序值。
具体地,各项指标数据呈现方式不同,如“阴性”“微量”,“+”,“-”等表示方法,将其规范转化成0,1,2,3的数值;用数值平均值填充数值类缺失值,用最高频率值填充类别特征类缺失值;用独热编码代替基因型等无序值。因此对样本集中每一条数据的规范化处理,即将每一条数据中对应的数据转化为下文的格式:
试验号:由五个数字组成,前两位表示试验中心号,后三位表示在该中心的入组顺序。如01001,则表示01中心入组的001号受试者;
年龄:XX周岁;
性别:男/女;
身高:XXX厘米;
体重:XX.X公斤;
适应症:心房颤动/深静脉血栓;
吸烟情况:从不/已戒/吸烟;
饮酒情况:从不/已戒/饮酒;
合并疾病:疾病名称;
合并用药:药物名称、使用开始时间、使用结束时间;
生化指标:血常规(血红蛋白、白血球计数、血小板计数),尿常规(尿白细胞、酮体、尿蛋白、潜血、尿葡萄糖、酸碱度),大便潜血,肝肾功能(天门冬氨酸氨基转移酶、丙氨酸氨基转移酶、肌酐、总胆红素、尿素氮);
CYP2C9:□*1/*1、□*1/*2、□*1/*3、□*2/*2、□*2/*3、□*3/*3、□其他;
VKORC1 rs9923231:□rs9923231A/A、□rs9923231A/G、□rs9923231G/G、□其他;
华法林剂量:X.XX mg/d;
INR:X.X。
S204:依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据训练集以及预设算法构建单模型,并通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,并根据同一预设算法对应的误差计算得到预设算法对应的精度。
具体地,由于机器学习的算法有很多,因此需要选择符合要求的机器学习算法,即选择精度最好的一个机器学习算法作为我们模型训练的算法,其中此处机器学习算法包括但不限于:Ridge算法、Lasso算法、ElasticNet算法、PassiveAggressiveRegressor算法、KNeighborsRegressor算法、DecisionTreeRegressor算法、ExtraTreeRegressor算法、LinearSVR算法、SVR算法、AdaBoostRegressor算法、GradientBoostingRegressor算法、ExtraTreesRegressor算法、RandomForestRegressor算法、BaggingRegressor算法。
服务器首先将样本集划分为多份,例如可以划分为10份,然后选取其中一份作为第一验证集,剩余9份作为训练集,然后选取其中一个算法,例如Ridge算法,通过该9份训练集以及Ridge算法进行训练得到一个单模型,然后通过第一验证集计算该单模型的误差,即精度得到单模型误差。依次为基准进行循环,即将样本集中的另一份作为第一验证集,其他9份作为训练集,再次根据所选择的训练集以及Ridge算法进行训练得到一个单模型,并通过所选择的第一验证集计算该单模型的误差,直至样本集中的每一份均被作为第一验证集进行验证过,此时将所得到的单模型的误差计算平均值作为该算法的精度。可选地,精度可以是指预测值与真实值的差值的平均值,或者是该差值的倒数的平均值,在实际中可以根据要求进行处理。
S206:选取精度符合要求的算法作为最优算法。
具体地,当精度是指预测值与真实值的差值的平均值时,则获取精度最小的算法作为最优算法,当精度是指预测值与真实值的差值的倒数的平均值时,则获取精度最大的算法作为最优算法。
S208:通过网格搜索对最优算法的参数进行调解。
具体地,使用Grid Search(网格搜索)对几个敏感参数:loss,学习率,弱分类器数目,树最大深度,最小分裂数等参数进行最优参数搜索,即提前为超参数设定一组常用取值范围,网格搜索将穷举超参数取值组合,并选择使得预测INR值最接近真实值(精度最小)的超参数构建入算法。
S210:根据样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型。
具体地,在参数调解完成后,则服务器根据样本集中的所有数据以及参数调解后的最优算法进行训练得到华法林剂量预测模型,即将所有的数据进行训练以优化华法林剂量预测模型。
S212:获取用户信息,并将用户信息输入至华法林剂量预测模型中,得到与用户信息对应的华法林剂量。
具体地,在训练得到华法林剂量预测模型后,可以接收到用户终端发送的用户信息,然后按照上文的格式对该用户信息进行处理,并在处理后将用户信息输入至华法林剂量预测模型中,得到与用户信息对应的华法林剂量。
上述华法林剂量预测方法,在进行华法林剂量预测模型的建设的时候,首先选取多种算法,并对样本集进行划分为第一验证集和训练集,根据训练集以及预设算法构建单模型,并通过第一验证集对单模型进行验证得到单模型的误差,且依次将所划分的样本集中的其他组作为第一验证集,剩余组作为训练集得到多个单模型的误差,通过该些误差可以计算得到预设算法的精度,从而可以选择到符合要求的算法作为最优算法,进而通过网格搜索对该最优算法的参数进行调解,然后通过样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型,这样可以选择最准确的算法进行预测,从而保证了算法的准确性,进而根据用户信息所预测的华法林剂量也是准确的。
在其中一个实施例中,请参照图3,图3为图2所示实施例中的步骤S204的流程示意图,该步骤S204,即依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据训练集以及预设算法构建单模型,并通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,并根据同一预设算法对应的误差计算得到预设算法对应的精度,包括:
S302:按照顺序选取其中一组作为当前第一验证集,并将剩余的组作为当前训练集。
具体地,服务器在将样本集划分为多组后,例如服务器将样本集平均划分为多组,该划分过程并未根据样本集中的任何参数进行划分,而是随机地划分,以防止样本集划分的主观性导致最后训练的模型存在问题。
服务器将第一组作为当前第一验证集,将剩余的组作为当前训练集。例如假设划分得到样本集A1到样本集A10。则将样本集A1作为当前第一验证集,样本集A2到A10作为当前训练集。
S304:根据当前训练集以及预设算法构建单模型;通过当前第一验证集对单模型进行验证得到单模型的当前误差。
服务器根据当前训练集和预设算法构建单模型,其中构建方式即通过算法去学习当前训练集中的数据的特征,然后通过当前第一验证集对单模型进行验证得到单模型的当前误差。可选地服务器可以建立一个表格用于存储模型、训练样本集、第一验证集以及当前误差的关联关系,从而每一次构建单模型后,服务器均在该表格中增加一行,从而使得每次都可以存储当前误差。
S306:按照顺序选取下一组作为当前第一验证集,并继续将剩余的组作为当前训练集计算得到下一当前误差,直至所划分的组均被作为当前第一验证集处理过。
具体地,服务器在计算得到当前误差后,将当前误差进行存储。则继续选取下一组作为当前第一验证集,即选取样本集A2作为当前第一验证集,然后将剩余的组作为当前训练集,即将样本集A1以及样本集A3至A10作为当前训练集,从而服务器根据当前训练集,即样本集A1以及样本集A3至A10以及预设算法进行训练得到单模型,然后继续通过当前第一验证集,即样本集A2进行验证得到当前误差,并存储到上述表格中。服务器依次处理直至所划分的组均被作为当前第一验证集处理过进行处理过。
S308:计算所得到的所有当前误差的平均值作为预设算法对应的精度。
具体地,服务器在得到所有误差后,则计算所有的误差的平均值作为预设算法的精度。可选地,服务器可以依次轮流进行计算以得到其他的预设算法的精度,还可以通过多执行机的方法并发地得到其他预设算法的精度,此外,上述循环的过程还可以是并发执行的,即服务器获取到所划分的组的数量,以及服务器当前执行机的可用线程的数量,根据所划分的组的数量和可用线程的数量计算并发数,例如选取所划分的组的数量和可用线程的数量中较少的一个作为并发数,然后基于该并发数将所划分的组分配到对应的线程中,例如假设划分的组为10组,可用线程为5个,则每个线程对应处理2次,每一次均是上述步骤S302至步骤S308。最后,根据每个线程返回的单模型的误差计算得到算法的精度。每一个执行机可以计算一个算法的精度或者是计算多个算法的精度,其中还是根据算法的个数和可用执行机的个数来进行分配,例如算法的个数和可用执行机的个数比值,然后取整数作为每个执行机需要计算的算法的个数。
在其中一个实施例中,通过网格搜索对最优算法的参数进行调解,包括:获取预先设置的参数的取值范围,并将参数的取值范围构建参数组合;通过参数组合以及最优算法构建待调解算法;选取使得待调解算法的精度符合要求的参数作为待调解算法的参数。
其中几个敏感的参数包括:loss,学习率,弱分类器数目,树最大深度,最小分裂数,此处通过网格搜索主要是为了确定该几个敏感的参数,而对于其他的参数则还是通过样本集进行训练的方式来进行确定。其中该几个敏感的参数的取值范围可以预先设置,例如弱分类器数目n_estimators:100 200 500 1000;树最大深度max_depth 1 3 4 6;min_samples_leaf1 3 4 6;最小分裂数min_samples_split 1 3 4 6。根据该些参数的取值范围建立参数组合,例如上述四个参数,则组合可以包括4*4*4*4种,然后将该些参数组合带入至最优算法中,并输入样本集得到预测值,将最接近真实值的预测值对应的参数作为调解后的参数。然后基于该参数构建华法林剂量预测模型。
在其中一个实施例中,根据样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型之后,还包括:获取第二验证集,将第二验证集输入至华法林剂量预测模型以对华法林剂量预测模型进行验证。
在其中一个实施例中,华法林剂量预测模型为稳定剂量预测模型,第二验证集的获取方式包括:获取初始验证集,并对初始验证集中的数据进行规范化处理;从规范化处理后的初始验证集中选取符合稳定剂量的数据,生成第二验证集。
在其中一个实施例中,将第二验证集输入至华法林剂量预测模型以对华法林剂量预测模型进行验证之后,还包括:将第二验证集与样本集进行合并得到综合样本集;通过合并后的综合样本集对验证后的华法林剂量预测模型进行优化。
具体地,在华法林剂量预测模型生成之后,还需要对华法林剂量预测模型进行验证和优化,具体地,可以收集第二验证集,其中第二验证集的收集可以是在华法林电子化系统注册患者,收集他们的基线信息和随访期间(一个月)的给药剂量和INR值。随访完成后将数据整理为构建模型时的数据集形式。其中对INR预测模型,可以是收集全部受试者数据作为验证数据,预测模型预测精度及在准确度10%,20%,30%范围内,分别能预测多少百分比的受试者。而对于稳定剂量预测公式,则需筛选达到稳定剂量的受试者再进行后续操作。这样根据所预测的多少百分比的受试者来确定模型的准确性以完成模型的验证。
在验证完成后,如果模型的准确度不高,即不符合要求,则可以将新收集的受试者数据与之前的RCT研究数据集合并,作为新的数据集重新进行模型构建,并对比优化前后模型精度的变化,若精度更加优化,则将优化后的模型作为最终模型,且可选地,服务器可以定期获取到更新的第二验证集以对模型进行优化。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种华法林剂量预测装置,包括:划分模块100、精度计算模块200、算法选取模块300、参数调解模块400、训练模块500和预测模块600,其中:
划分模块100,用于从数据库中提取样本集,并对样本集进行规范化处理,将规范化处理后的样本集划分为若干组。
精度计算模块200,用于依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据训练集以及预设算法构建单模型,并通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,并根据同一预设算法对应的误差计算得到预设算法对应的精度。
算法选取模块300,用于选取精度符合要求的算法作为最优算法。
参数调解模块400,用于通过网格搜索对最优算法的参数进行调解。
训练模块500,用于根据样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型。
预测模块600,用于获取用户信息,并将用户信息输入至华法林剂量预测模型中,得到与用户信息对应的华法林剂量。
在其中一个实施例中,划分模块100包括:
转化单元,用于将类别型数据转化为数值,并获取到数值出现频率最高的数值作为类别型缺失数据的值。
第一替换单元,用于获取数值型数据的平均值作为数值型缺失数据的值。
第二替换单元,用于通过独热编码代替无序值。
在其中一个实施例中,精度计算模块200包括:
训练集确定单元,用于按照顺序选取其中一组作为当前第一验证集,并将剩余的组作为当前训练集。
建模单元,用于根据当前训练集以及预设算法构建单模型。
验证单元,用于通过当前第一验证集对单模型进行验证得到单模型的当前误差。
循环单元,用于按照顺序选取下一组作为当前第一验证集,并继续将剩余的组作为当前训练集计算得到下一当前误差,直至所划分的组均被作为当前第一验证集处理过。
精度输出单元,用于计算所得到的所有当前误差的平均值作为预设算法对应的精度。
在其中一个实施例中,参数调解模块400包括:
参数组合获取单元,用于获取预先设置的参数的取值范围,并将参数的取值范围构建参数组合。
构建单元,用于通过参数组合以及最优算法构建待调解算法。
参数输出单元,用于选取使得待调解算法的精度符合要求的参数作为待调解算法的参数。
在其中一个实施例中,上述华法林剂量预测装置还包括:
验证模块,用于获取第二验证集,将第二验证集输入至华法林剂量预测模型以对华法林剂量预测模型进行验证。
在其中一个实施例中,华法林剂量预测模型为稳定剂量预测模型,上述华法林剂量预测装置还包括:
规范化处理模块,用于获取初始验证集,并对初始验证集中的数据进行规范化处理。
验证集生成模块,用于从规范化处理后的初始验证集中选取符合稳定剂量的数据,生成第二验证集。
在其中一个实施例中,上述华法林剂量预测装置还包括:
合并模块,用于将第二验证集与样本集进行合并得到综合样本集。
优化模块,用于通过合并后的综合样本集对验证后的华法林剂量预测模型进行优化。
关于华法林剂量预测装置的具体限定可以参见上文中对于华法林剂量预测方法的限定,在此不再赘述。上述华法林剂量预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本集数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种华法林剂量预测方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:从数据库中提取样本集,并对样本集进行规范化处理,将规范化处理后的样本集划分为若干组;依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据训练集以及预设算法构建单模型,并通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,并根据同一预设算法对应的误差计算得到预设算法对应的精度;选取精度符合要求的算法作为最优算法;通过网格搜索对最优算法的参数进行调解;根据样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型;获取用户信息,并将用户信息输入至华法林剂量预测模型中,得到与用户信息对应的华法林剂量。
在一个实施例中,处理器执行计算机程序时所实现的对样本集进行规范化处理,包括:将类别型数据转化为数值,并获取到数值出现频率最高的数值作为类别型缺失数据的值;获取数值型数据的平均值作为数值型缺失数据的值;通过独热编码代替无序值。
在一个实施例中,处理器执行计算机程序时所实现的依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据训练集以及预设算法构建单模型,并通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,并根据同一预设算法对应的误差计算得到预设算法对应的精度,包括:按照顺序选取其中一组作为当前第一验证集,并将剩余的组作为当前训练集;根据当前训练集以及预设算法构建单模型;通过当前第一验证集对单模型进行验证得到单模型的当前误差;按照顺序选取下一组作为当前第一验证集,并继续将剩余的组作为当前训练集计算得到下一当前误差,直至所划分的组均被作为当前第一验证集处理过;计算所得到的所有当前误差的平均值作为预设算法对应的精度。
在一个实施例中,处理器执行计算机程序时所实现的通过网格搜索对最优算法的参数进行调解,包括:获取预先设置的参数的取值范围,并将参数的取值范围构建参数组合;通过参数组合以及最优算法构建待调解算法;选取使得待调解算法的精度符合要求的参数作为待调解算法的参数。
在一个实施例中,处理器执行计算机程序时所实现的根据样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型之后,还包括:获取第二验证集,将第二验证集输入至华法林剂量预测模型以对华法林剂量预测模型进行验证。
在一个实施例中,华法林剂量预测模型为稳定剂量预测模型,处理器执行计算机程序时所涉及的第二验证集的获取方式包括:获取初始验证集,并对初始验证集中的数据进行规范化处理;从规范化处理后的初始验证集中选取符合稳定剂量的数据,生成第二验证集。
在一个实施例中,处理器执行计算机程序时所实现的将第二验证集输入至华法林剂量预测模型以对华法林剂量预测模型进行验证之后,还包括:将第二验证集与样本集进行合并得到综合样本集;通过合并后的综合样本集对验证后的华法林剂量预测模型进行优化。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:从数据库中提取样本集,并对样本集进行规范化处理,将规范化处理后的样本集划分为若干组;依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据训练集以及预设算法构建单模型,并通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,并根据同一预设算法对应的误差计算得到预设算法对应的精度;选取精度符合要求的算法作为最优算法;通过网格搜索对最优算法的参数进行调解;根据样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型;获取用户信息,并将用户信息输入至华法林剂量预测模型中,得到与用户信息对应的华法林剂量。
在一个实施例中,计算机程序被处理器执行时所实现的对样本集进行规范化处理,包括:将类别型数据转化为数值,并获取到数值出现频率最高的数值作为类别型缺失数据的值;获取数值型数据的平均值作为数值型缺失数据的值;通过独热编码代替无序值。
在一个实施例中,计算机程序被处理器执行时所实现的依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据训练集以及预设算法构建单模型,并通过当前所选取的第一验证集对单模型进行验证得到单模型的误差,并根据同一预设算法对应的误差计算得到预设算法对应的精度,包括:按照顺序选取其中一组作为当前第一验证集,并将剩余的组作为当前训练集;根据当前训练集以及预设算法构建单模型;通过当前第一验证集对单模型进行验证得到单模型的当前误差;按照顺序选取下一组作为当前第一验证集,并继续将剩余的组作为当前训练集计算得到下一当前误差,直至所划分的组均被作为当前第一验证集处理过;计算所得到的所有当前误差的平均值作为预设算法对应的精度。
在一个实施例中,计算机程序被处理器执行时所实现的通过网格搜索对最优算法的参数进行调解,包括:获取预先设置的参数的取值范围,并将参数的取值范围构建参数组合;通过参数组合以及最优算法构建待调解算法;选取使得待调解算法的精度符合要求的参数作为待调解算法的参数。
在一个实施例中,计算机程序被处理器执行时所实现的根据样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型之后,还包括:获取第二验证集,将第二验证集输入至华法林剂量预测模型以对华法林剂量预测模型进行验证。
在一个实施例中,华法林剂量预测模型为稳定剂量预测模型,计算机程序被处理器执行时所涉及的第二验证集的获取方式包括:获取初始验证集,并对初始验证集中的数据进行规范化处理;从规范化处理后的初始验证集中选取符合稳定剂量的数据,生成第二验证集。
在一个实施例中,计算机程序被处理器执行时所实现的将第二验证集输入至华法林剂量预测模型以对华法林剂量预测模型进行验证之后,还包括:将第二验证集与样本集进行合并得到综合样本集;通过合并后的综合样本集对验证后的华法林剂量预测模型进行优化。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种华法林剂量预测方法,其特征在于,所述方法包括:
从数据库中提取样本集,并对所述样本集进行规范化处理,将规范化处理后的样本集划分为若干组;
依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据所述训练集以及预设算法构建单模型,并通过当前所选取的所述第一验证集对所述单模型进行验证得到所述单模型的误差,并根据同一所述预设算法对应的误差计算得到所述预设算法对应的精度;
选取所述精度符合要求的算法作为最优算法;
通过网格搜索对所述最优算法的参数进行调解;
根据所述样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型;
获取用户信息,并将所述用户信息输入至所述华法林剂量预测模型中,得到与所述用户信息对应的华法林剂量。
2.根据权利要求1所述的方法,其特征在于,所述对所述样本集进行规范化处理,包括:
将所述类别型数据转化为数值,并获取到数值出现频率最高的数值作为类别型缺失数据的值;
获取数值型数据的平均值作为数值型缺失数据的值;
通过独热编码代替无序值。
3.根据权利要求1所述的方法,其特征在于,所述依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据所述训练集以及预设算法构建单模型,并通过当前所选取的所述第一验证集对所述单模型进行验证得到所述单模型的误差,并根据同一所述预设算法对应的误差计算得到所述预设算法对应的精度,包括:
按照顺序选取其中一组作为当前第一验证集,并将剩余的组作为当前训练集;
根据所述当前训练集以及预设算法构建单模型;
通过所述当前第一验证集对所述单模型进行验证得到所述单模型的当前误差;
按照顺序选取下一组作为当前第一验证集,并继续将剩余的组作为当前训练集计算得到下一当前误差,直至所划分的组均被作为当前第一验证集处理过;
计算所得到的所有当前误差的平均值作为所述预设算法对应的精度。
4.根据权利要求1所述的方法,其特征在于,所述通过网格搜索对所述最优算法的参数进行调解,包括:
获取预先设置的参数的取值范围,并将所述参数的取值范围构建参数组合;
通过所述参数组合以及最优算法构建待调解算法;
选取使得所述待调解算法的精度符合要求的参数作为所述待调解算法的参数。
5.根据权利要求1所述的方法,其特征在于,所述根据所述样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型之后,还包括:
获取第二验证集,将所述第二验证集输入至华法林剂量预测模型以对所述华法林剂量预测模型进行验证。
6.根据权利要求5所述的方法,其特征在于,所述华法林剂量预测模型为稳定剂量预测模型,所述第二验证集的获取方式包括:
获取初始验证集,并对所述初始验证集中的数据进行规范化处理;
从规范化处理后的初始验证集中选取符合稳定剂量的数据,生成第二验证集。
7.根据权利要求5所述的方法,其特征在于,所述将所述第二验证集输入至华法林剂量预测模型以对所述华法林剂量预测模型进行验证之后,还包括:
将所述第二验证集与所述样本集进行合并得到综合样本集;
通过合并后的综合样本集对验证后的所述华法林剂量预测模型进行优化。
8.一种华法林剂量预测装置,其特征在于,所述装置包括:
划分模块,用于从数据库中提取样本集,并对所述样本集进行规范化处理,将规范化处理后的样本集划分为若干组;
精度计算模块,用于依次选取其中一组作为第一验证集,剩余的组作为训练集,并根据所述训练集以及预设算法构建单模型,并通过当前所选取的所述第一验证集对所述单模型进行验证得到所述单模型的误差,并根据同一所述预设算法对应的误差计算得到所述预设算法对应的精度;
算法选取模块,用于选取所述精度符合要求的算法作为最优算法;
参数调解模块,用于通过网格搜索对所述最优算法的参数进行调解;
训练模块,用于根据所述样本集以及参数调解后的最优算法进行训练得到华法林剂量预测模型;
预测模块,用于获取用户信息,并将所述用户信息输入至所述华法林剂量预测模型中,得到与所述用户信息对应的华法林剂量。
CN202010051466.XA 2020-01-17 2020-01-17 华法林剂量预测方法及预测装置 Active CN111312341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010051466.XA CN111312341B (zh) 2020-01-17 2020-01-17 华法林剂量预测方法及预测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010051466.XA CN111312341B (zh) 2020-01-17 2020-01-17 华法林剂量预测方法及预测装置

Publications (2)

Publication Number Publication Date
CN111312341A true CN111312341A (zh) 2020-06-19
CN111312341B CN111312341B (zh) 2022-06-28

Family

ID=71146784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010051466.XA Active CN111312341B (zh) 2020-01-17 2020-01-17 华法林剂量预测方法及预测装置

Country Status (1)

Country Link
CN (1) CN111312341B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112820392A (zh) * 2021-02-18 2021-05-18 江苏爱朋医疗科技股份有限公司 自调节的输液泵控制方法、系统及计算机介质
CN113035369A (zh) * 2021-03-10 2021-06-25 浙江大学 一种肾移植抗感染药物剂量预测模型的构建方法
CN115376649A (zh) * 2022-09-29 2022-11-22 中日友好医院(中日友好临床医学研究所) 用于鞘内阿片类镇痛药的剂量预测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105120955A (zh) * 2013-03-15 2015-12-02 瓦里安医疗系统国际股份公司 使用集成模型的放射治疗计划
CN107072624A (zh) * 2014-06-18 2017-08-18 Elekta股份有限公司 用于自动治疗计划的系统和方法
US20170270239A1 (en) * 2014-05-28 2017-09-21 Roland Grafstrom In vitro toxicogenomics for toxicity prediction
CN108831556A (zh) * 2018-06-24 2018-11-16 大连理工大学 一种连续性肾脏替代治疗过程中肝素剂量的预测方法
CN109754852A (zh) * 2019-01-08 2019-05-14 中南大学 基于电子病历的心血管疾病风险预测方法
CN110010252A (zh) * 2019-04-01 2019-07-12 上海交通大学医学院附属新华医院 华法林给药剂量预测方法及装置
CN110354406A (zh) * 2019-07-30 2019-10-22 安徽大学 一种放射治疗的三维剂量预测方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105120955A (zh) * 2013-03-15 2015-12-02 瓦里安医疗系统国际股份公司 使用集成模型的放射治疗计划
US20170270239A1 (en) * 2014-05-28 2017-09-21 Roland Grafstrom In vitro toxicogenomics for toxicity prediction
CN107072624A (zh) * 2014-06-18 2017-08-18 Elekta股份有限公司 用于自动治疗计划的系统和方法
CN108831556A (zh) * 2018-06-24 2018-11-16 大连理工大学 一种连续性肾脏替代治疗过程中肝素剂量的预测方法
CN109754852A (zh) * 2019-01-08 2019-05-14 中南大学 基于电子病历的心血管疾病风险预测方法
CN110010252A (zh) * 2019-04-01 2019-07-12 上海交通大学医学院附属新华医院 华法林给药剂量预测方法及装置
CN110354406A (zh) * 2019-07-30 2019-10-22 安徽大学 一种放射治疗的三维剂量预测方法和系统

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
KRISTINA PREUER 等: "DeepSynergy: predicting anti-cancer drug synergy with Deep Learning", 《BIOINFORMATICS》 *
孙雪 等: "华法林剂量预测模型的建立与验证的研究进展", 《中国临床药理学杂志》 *
张文雅 等: "基于交叉验证网格寻优支持向量机的产品销售预测", 《计算机系统应用》 *
浙江省统计局 编: "《数字的魅力 基于统计视野的浙江经济社会发展研究》", 31 July 2019, 浙江工商大学出版社 *
程熙 等编著: "《多尺度的不透水面信息遥感提取方法与应用》", 30 November 2015, 西南交通大学出版社 *
邹朗 等: "基因检测预测华法林给药剂量准确性的研究", 《中国医院药学杂志》 *
陈华编著: "《多核并行计算》", 31 December 2017, 中国石油大学出版社 *
黄栩: "基于机器学习算法建立用户流失预警模型", 《软件开发》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112820392A (zh) * 2021-02-18 2021-05-18 江苏爱朋医疗科技股份有限公司 自调节的输液泵控制方法、系统及计算机介质
CN113035369A (zh) * 2021-03-10 2021-06-25 浙江大学 一种肾移植抗感染药物剂量预测模型的构建方法
CN113035369B (zh) * 2021-03-10 2021-12-03 浙江大学 一种肾移植抗感染药物剂量预测模型的构建方法
CN115376649A (zh) * 2022-09-29 2022-11-22 中日友好医院(中日友好临床医学研究所) 用于鞘内阿片类镇痛药的剂量预测方法及装置
CN115376649B (zh) * 2022-09-29 2023-07-07 中日友好医院(中日友好临床医学研究所) 用于鞘内阿片类镇痛药的剂量预测方法及装置

Also Published As

Publication number Publication date
CN111312341B (zh) 2022-06-28

Similar Documents

Publication Publication Date Title
CN111312341B (zh) 华法林剂量预测方法及预测装置
Wick et al. A clinical risk prediction tool for 6-month mortality after dialysis initiation among older adults
US20220254493A1 (en) Chronic disease prediction system based on multi-task learning model
Postmus et al. The COACH risk engine: a multistate model for predicting survival and hospitalization in patients with heart failure
WO2021151327A1 (zh) 分诊数据处理方法、装置、设备及介质
CN107194138B (zh) 一种基于体检数据建模的空腹血糖预测方法
EP2274699A1 (en) Methods and systems for assessing clinical outcomes
Saffian et al. Warfarin dosing algorithms underpredict dose requirements in patients requiring≥ 7 mg daily: A systematic review and meta‐analysis
CN114724716A (zh) 进展为2型糖尿病的风险预测的方法、模型训练及装置
WO2021151295A1 (zh) 患者治疗方案的确定方法、装置、计算机设备及介质
US20140214333A1 (en) System and method for genomic data processing with an in-memory database system and real-time analysis
EP2759953A1 (en) System and method for genomic data processing with an in-memory database system and real-time analysis
CN109377388B (zh) 医保投保方法、装置、计算机设备和存储介质
CN112132624A (zh) 医疗理赔数据预测系统
CN110364268A (zh) 基于互联网的糖尿病患者健康管理系统及方法
CN110400613B (zh) 一种随访患者筛选方法、装置、可读介质及电子设备
CN112447270A (zh) 一种用药推荐方法、装置、设备及存储介质
CN110751996B (zh) 基于递归分区计算的高血压用药推荐模型及其构建方法
CN111221876A (zh) 数据降维处理方法、装置、计算机设备和存储介质
CN116403662A (zh) 一种基于大数据的研发过程及工艺模拟方法、系统及平台
Rospleszcz et al. Categorical variables with many categories are preferentially selected in bootstrap‐based model selection procedures for multivariable regression models
CN111883258B (zh) 一种构建ohss分度分型预测模型的方法
CN112037918B (zh) 一种融合并发症风险的慢病医保费用预测方法及相关设备
WO2023106960A1 (ru) Способ прогнозирования наступления медицинского события в здоровье человека
Vito et al. How to extract clinically useful information from large amount of dialysis related stored data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant