CN115732088A - 胃癌预后处理方法、装置、计算机设备及可读存储介质 - Google Patents
胃癌预后处理方法、装置、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN115732088A CN115732088A CN202111003853.7A CN202111003853A CN115732088A CN 115732088 A CN115732088 A CN 115732088A CN 202111003853 A CN202111003853 A CN 202111003853A CN 115732088 A CN115732088 A CN 115732088A
- Authority
- CN
- China
- Prior art keywords
- data
- prognosis
- processing
- gastric cancer
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本申请涉及医疗技术领域,特别是涉及一种胃癌预后处理方法、装置、计算机设备及可读存储介质。所述方法包括:获取待处理对象的对象数据;对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据;将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。采用本方法能够提升胃癌患者预后处理准确性。
Description
技术领域
本申请涉及医疗技术领域,特别是涉及一种胃癌预后处理方法、装置、计算机设备及可读存储介质。
背景技术
胃癌是最常见的消化道恶性肿瘤,胃癌的形态学与分子特征复杂,具有高度异质性,严重影响进展期患者的疗效和生存。有越来越多的证据表明,癌症特别是胃癌是一种高度复杂、渐变及多样性的疾病,患者可能罹患同一种癌症,却有不同的病理分型,不同的基因分子分型,接受同一种化疗方案,疗效与预后也大相径庭。随着基因二代测序技术的飞速发展及生物信息与大数据应用在肿瘤研究中取得的重大突破,人们对肿瘤异质性了解的更加深刻,并提出了新的以个体化医疗为基础的“精准医学(precision medicine)”的医疗模式。该模式按照传统的症状和体征以及疾病的分子分型对疾病进行分类,从分子层面找到精准药物及精准医疗策略,最终目的是为了实现对特种疾病的特定患者进行个性化的精准治疗。这种以基因检测为基础、个体化用药为核心,“量体裁药”式的新模式将最大程度地减少临床用药不当带来的副作用,从而实现治疗效果最大化以及医疗费用最低化。
上述方式仅是通过统计学的方式对胃癌患者进行预后处理分析,其得到只是大部分患者的统计结果,并不能准确的对各个患者进行预后分析处理。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升胃癌患者预后处理准确性的胃癌预后处理方法、装置、计算机设备及可读存储介质。
一种胃癌预后处理方法,所述方法包括:
获取待处理对象的对象数据;
对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据;
将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。
在其中一个实施例中,对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,包括:
对对象数据进行空值验证,判断对象数据是否完整;
当确定对象数据完整时,对对象数据中进行数据格式的验证,判断对象数据是否正确;
当确定对象数据正确时,则对对象数据进行去重处理,得到去重处理后的对象数据;
对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据,包括:
获取医疗术语标准化处理模板;
基于疗术语标准化处理模板,对去重处理后的对象数据进行文本内容的标准化转换,得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,对象数据包括用药数据以及临床检测数据;
对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,包括:
基于用药数据,得到所用药物的药效功能数据;
根据临床检测数据,得到待处理对象的患病类型数据;
将药效功能数据以及患病类型数据作为用于胃癌预后处理的预后处理数据。
在其中一个实施例中,预后处理数据包括待处理对象的年龄数据、肿瘤分期数据、肿瘤体积数据、表皮生长因子受体状态数据、免疫抑制分子数据、表观遗传学数据以及分子分型状态数据中至少一种。
在其中一个实施例中,获取待处理对象的对象数据,包括:
获取待处理对象的对象标识;
基于对象标识,从各医疗系统获取待处理对象的检查数据,得到待处理对象的对象数据。
在其中一个实施例中,预测模型的训练方式,包括:
获取胃癌预后训练集数据以及验证集数据;
构建初始预测模型;
基于训练集数据对初始预测模型进行训练,生成对应的训练结果;
根据训练结果,确定初始预测模型的模型损失;
基于模型损失对初始预测模型的模型参数进行更新,并对模型参数更新后的初始预测模型进行迭代训练,得到训练后的预测模型;
根据验证集数据,对训练后的预测模型进行验证,并在验证通过后得到训练完成的预测模型。
一种胃癌预后处理装置,所述装置包括:
对象数据获取模块,用于获取待处理对象的对象数据;
预处理模块,用于对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据;
预后处理模块,用于将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法的步骤。
上述胃癌预后处理方法、装置、计算机设备及可读存储介质,通过获取待处理对象的对象数据,然后对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,进一步将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。从而,可以通过预设模型对待处理对象的进行预后处理,相比于传统方式中通过统计分析的方式,可以使得预后处理更具针对性,可以提升预后处理的准确性。并且,在获取到对象数据后,先进行预处理,得到预后处理数据,然后再进行预后处理,可以去除获取到的用户数据中的无用信息,可以进一步提升预后处理的准确性。
附图说明
图1为一个实施例中胃癌预后处理方法的应用场景图;
图2为一个实施例中胃癌预后处理方法的流程示意图;
图3为一个实施例中预处理步骤的示意图;
图4为一个实施例中用药数据处理的示意图;
图5为一个实施例中诊疗数据处理的示意图;
图6为一个实施例中对象数据获取的示意图;
图7为另一个实施例中胃癌预后处理方法的流程示意图;
图8为又一个实施例中胃癌预后处理方法的流程示意图;
图9为一个实施例中胃癌预后处理装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的胃癌预后处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102可以采集待处理对象的对象数据,并存储至数据库中。服务器104可以从各终端对应的数据库中获取待处理对象的对象数据,并对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据。进一步,服务器104可以将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。其中,终端102可以是各种医疗系统所对应的终端,可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种胃癌预后处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,获取待处理对象的对象数据。
其中,对象数据是指胃癌预后处理中,待处理对象的数据,可以包括用户的个人基本信息数据以及患者医疗数据。
在本实施例中,个人基本信息数据可以包括但不限于性别、出生日期、婚姻状况、居住信息、职业信息、身份证号码、名族、国籍、受教育水平等信息数据。
患者医疗数据可以包括但不限于门诊登记数据、门诊诊断数据、门诊处方数据、门诊费用数据、化验数据、检查报告数据、病历信息数据、住院登记数据、住院诊断数据、住院医嘱数据、住院费用数据、手术信息数据、体征记录数据、化验报告数据以及检查报告数据。
在本实施例中,服务器可以从各医院系统中获取到待处理对象的对象数据,然后进行后续的处理。
步骤S204,对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据。
在本实施例中,服务器获取到的用户数据可以是多样性的,例如,,可以是图像表单数据,或者是文档文字数据,或者是音视频数据,数据格式以及数据类型其均可以并相同。服务器在获取到对象数据后,可以对对象数据进行预处理,以得到用于胃癌预后处理的预后处理数据。
在本实施例中,预后处理数据是指可以直接用于进行胃癌预后处理的数据,其是标准的数据,其可以包括胃癌预后处理中所包含的所有信息。
步骤S206,将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。
其中,预测模型是指用于对待处理对象进行预后预测的模型,可以是决策树、贝叶斯理论网络、多层感知神经网络和机器学习等算法建立胃癌预后的模型。
在本实施例中,服务器可以基于业务需求,确定对应类型的预测模型,并进行后续的处理。
在本实施例中,服务器可以将预处理后的预后处理数据输入预先训练的预测模型中,通过预测模型对各预后数据进行处理,得到对应的指标数据,例如,区间0-10为1,10-20为2,20-30为3,30-40为4,服务器输入预测模型的年龄数据可以是35,则其对应的指标数据可以是4,如果输入的年龄数据为20,则其对应的指标数据可以是2等。
在本实施例中,服务器可以基于预后处理数据,按区间划分对应的指标数据,并确定对应预后处理数据的指标数据。
在本实施例中,对于各预后处理数据,服务器均可以通过预测模型生成其对应的指标数据,并基于各指标数据,生成对应的胃癌预后处理结果。
上述胃癌预后处理方法中,通过获取待处理对象的对象数据,然后对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,进一步将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。从而,可以通过预设模型对待处理对象的进行预后处理,相比于传统方式中通过统计分析的方式,可以使得预后处理更具针对性,可以提升预后处理的准确性。并且,在获取到对象数据后,先进行预处理,得到预后处理数据,然后再进行预后处理,可以去除获取到的用户数据中的无用信息,可以进一步提升预后处理的准确性。
在其中一个实施例中,预后处理数据可以包括待处理对象的年龄数据、肿瘤分期数据、肿瘤体积数据、表皮生长因子受体状态数据、免疫抑制分子数据、表观遗传学数据以及分子分型状态数据中至少一种。
在本实施例中,服务器可以根据模型训练阶段得到的各个预后处理数据所对应的模型参数,计算得到胃癌预后处理结果。例如,预测模型为logist(P)=-34.033+0.050X1+0.415X2+0.498X3+0.316X4+1.696X5+0.031X6+0.039X7+1.019X8+1.953X9-1.863X10+2.665X11。其中,X1为待处理对象的年龄数据、X2为肿瘤分期(Tumor Node Metastasis,TNM)、X3表示肿瘤体积数据、X4表示表皮生长因子受体状态数据(Her2状态)、X5和X5表示免疫抑制分子数据(X5表示PD-1,程序性死亡受体1,X6表示PDL1,细胞程序性死亡-配体1)、X7表示是否接受手术、X8表示是否接受化疗、X9表示癌胚抗原(carcinoembryonic antigen,CEA)水平数据、X10表示糖类抗原199(Carbohydrate antigen199,CA199)水平数据、X11表示Lauren组织分型数据。其中,Lauren组织分型是一种影响预后的病理组织类型。
在其中一个实施例中,对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,可以包括:对对象数据进行空值验证,判断对象数据是否完整;当确定对象数据完整时,对对象数据中进行数据格式的验证,判断对象数据是否正确;当确定对象数据正确时,则对对象数据进行去重处理,得到去重处理后的对象数据;对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据。
在本实施例中,参考图3,服务器从数据源获取到对象数据后,如疾病诊断数据、处方数据、医嘱数据以及其他数据后,可以先对数据进行预处理或者进行数据清洗。
具体地,服务器可以先对各对象数据进行空值验证,判断各对象数据为完整数据或者是残缺数据,例如,用户信息是否完整,疾病诊断的诊断报告、音视频检查报告是否完整等。
在本实施例中,对于残缺数据,服务器可以对数据进行标准,并请求重新获取对应的数据。当用户数据为完整数据时,此时,服务器可以对用户数据进行错误数据的验证。例如,服务器可以通过对用户数据的数据格式进行验证,例如,对于检查报告,应当为TXT或者是Word格式的数据,对于CT数据或者是磁共振等数据,其应当是图像数据或者是影像数据,从而以判定用户数据的数据是否为错误数据。
在本实施例中,服务器可以剔除掉数据格式不正确的数据,得到正确数据格式的数据。
进一步,服务器可以基于数据大小、名称、数据格式类型等,对用户数据进行去重处理,删除重复的数据内容。
在本实施例中,服务器在对用户数据进行去重处理后,可以对各用户数据进行标准化处理,以得到用于胃癌预后处理的预后处理数据。
上述实施例中,通过对对象数据进行空值验证,可以保证数据的完整性,通过进行数据格式的验证,可以保障数据的准确性,通过对用户数据进行去重处理,可以去除重复的数据量,可以减少数据处理量,从而以达到提升处理效率的问题,并且,通过对用户数据进行标准化处理,使得得到的预后处理数据更加准确,可以提升后续数据处理的准确性。
在其中一个实施例中,对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据,可以包括:获取医疗术语标准化处理模板;基于疗术语标准化处理模板,对去重处理后的对象数据进行文本内容的标准化转换,得到用于胃癌预后处理的预后处理数据。
其中,疗术语标准化处理模板是指用于对医疗术语进行标准化转换的模板文件。
在真实的环境当中,同一个药的命名方式有很多,在药品名称里面带着品规信息的也有带着医保信息的,服务器可以将其统一标准到CFDA(家食品药品监督管理总局)发表的药品目录中,统一命名为CFDA目录名称,在CFDA的目录应用的同时,还做了解剖学、药理学、化学等的药品分类。
在本实施例中,疗术语标准化处理模板还可以包括但不限于国际疾病分类(international Classification of diseases,ICD)ICD-10、手术与操作ICD9CM3、ATC(Anatomical Therapeutic Chemical,药物的解剖学、治疗学及化学分类法)分类等。
在其中一个实施例中,服务器对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,还可以包括对对象数据进行筛选,并剔除不需要的用户数据,例如,检测模型所需使用的数据包括年龄数据、肿瘤分期数据、肿瘤体积数据、表皮生长因子受体状态数据、免疫抑制分子数据、表观遗传学数据以及分子分型状态数据,则服务器可以从用户数据中剔除掉除年龄数据、肿瘤分期数据、肿瘤体积数据、表皮生长因子受体状态数据、免疫抑制分子数据、表观遗传学数据以及分子分型状态数据等的其他数据,以得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,对象数据可以包括用药数据以及临床检测数据。
其中,用药数据也可以是指获取到的处方数据,可以包括具体的用药信息,例如,参考图4,可以是“(60片)(原研)格列齐特缓释片”“(F)格列齐特缓释片(乙自选)”等。
临床检测数据可以是指临床检测过程中的数据,例如,参考图5,可以包括“头晕检查;糖尿病”“眩晕检查;高血压病”等。
在本实施例中,对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,可以包括:基于用药数据,得到所用药物的药效功能数据;根据临床检测数据,得到待处理对象的患病类型数据;将药效功能数据以及患病类型数据作为用于胃癌预后处理的预后处理数据。
具体地,服务器可以对用药数据以及临床检测数据进行预处理,以得到对应的药效功能数据以及患病类型数据等。例如,继续参考图4,对于用药数据“(60片)(原研)格列齐特缓释片”、“(F)格列齐特缓释片(乙自选)”以及“(F)格列齐特缓释片(乙省基)”等数据,其均可以被处理为“格列齐特缓释片”,然后进一步处理为“A10H0”,对应表示为“降糖药”。继续参考图5,对于临床检测数据“头晕检查;糖尿病”、“0252619糖尿病”、“02型糖尿病”以及“0糖尿病1乏力查因2糖尿病”,其对应可以转换为“1型糖尿病E10.900”、“1型糖尿病性白内障E10.302+”、“1型糖尿病伴神经并发症E10.400”以及“1型糖尿病伴多并发症E10.700”,进而可以确定对应的患病类型数据为“E10糖尿病”。
进一步,服务器可以将得到的药效功能数据以及患病类型数据作为用于胃癌预后处理的预后处理数据,即将数据“A10H0”以及“E10糖尿病”等数据作为预后处理数据。
在其中一个实施例中,获取待处理对象的对象数据,可以包括:获取待处理对象的对象标识;基于对象标识,从各医疗系统获取待处理对象的检查数据,得到待处理对象的对象数据。
其中,对象标识是指示待处理对象唯一性的标识,可以包括但不限于待处理对象的患者ID、个人社保编号或者是身份证号等标识。
在本实施例中,医院的信息系统可以是多个,例如,参考图6,可以包括但不限于医院信息系统(Hospital Information System,HIS),实验室信息管理系统(LaboratoryInformation Management System,LIS),影像归档和通信系统(Picture Archiving andCommunication Systems,PACS),电子病历(Electronic Medical Record,EMR)系统等,服务器可以基于对象标识,通过医院ESB(Enterprise Service Bus,企业服务总线)消息总线或者ETL(Extract-Transform-Load,数据仓库技术)平台,从各医疗系统获取待处理对象的检查数据,存储指临床数据中心(SV CDR)中,并进行处理,例如,通过医学术语词典、知识库或者是自我学习(机器学习)等,输出对应的数据。
在本实施例中,服务器在获取到对象数据后,可以通过前文所述方法处理后,分析出人口学特征、区域疾病谱、疾病发展历程、患病就医模式、疾病诊治历程、医疗诊治行为、医疗支出、疾病资源分布等数据,得到数据挖掘下的应用和分析报告。
在其中一个实施例中,参考图7,服务器还可以通过数据监控系统进行全面监控。具体地,服务器可以进行数据监控以及异常处理监控。其中,数据监控包括对运行状态的全面监控以及运行日志的及时获取,异常处理监控包括异常状态等待模式以及异常检测智能回复。
在本实施例中,服务器还可以通过WEB监控平台实现远程控制、查看运行日志、查看医院信息、查看/修改配置信息以及进行ETL(一种定时功能,可以每日,每周等方式进行定时和周期性的运作)定时启动等处理操作。
在其中一个实施例中,预测模型的训练方式,可以包括:获取胃癌预后训练集数据以及验证集数据;构建初始预测模型;基于训练集数据对初始预测模型进行训练,生成对应的训练结果;根据训练结果,确定初始预测模型的模型损失;基于模型损失对初始预测模型的模型参数进行更新,并对模型参数更新后的初始预测模型进行迭代训练,得到训练后的预测模型;根据验证集数据,对训练后的预测模型进行验证,并在验证通过后得到训练完成的预测模型。
具体地,服务器可以获取500例患者的赝本数据,并将其分为胃癌预后训练集数据以及验证集数据。
进一步,服务器可以将训练集数据输入构建的初始预测模型中,对构建的初始预测性进行训练,并生成对应的训练结果。
进一步,服务器可以根据训练结果以及输入的训练集数据,确定初始预测模型的模型损失。可以通过LI损失函数或者L2损失函数进行损失值的计算。
在本实施例中,服务器可以基于模型损失对初始预测模型的模型参数进行更新,得到模型参数更新后的初始检测模型。
进一步,服务器可以对模型参数更新后的初始预测模型进行迭代训练,得到训练后的预测模型。
在本实施例中,服务器还可以根据验证集数据,对训练后的预测模型进行验证,生成对应的验证结果,并基于验证结果确定是否验证通过。
在本实施例中,服务器在确定验证通过后,完成模型的训练,并在确定验证不通过时,通过训练集数据,对模型继续进行训练,直至模型验证通过。
在其中一个实施例中,参考图8,胃癌预后处理可以分为四个部分,以下详细进行说明。
参考图8,对于第一部分,服务器可以建立数据输入模块,即数据库,服务器可以收集患者的一般信息并检测现有患者的病理状态,进一步检查患者的不同分子分型特点。
具体地,服务器可以获取进展期手术切除胃癌初治患者的数据,如临床分期、原发肿瘤、癌旁及正常胃黏膜组织标本、血液标本等数据,并建立精准分期、个体化治疗方案优选以及相关预后预测模型的大数据平台。
第二部分,服务器可以构建模型计算模块,根据C5.0决策树、贝叶斯理论网络、多层感知神经网络和机器学习等算法建立胃癌预后预测模型。
体地,服务器可以基于患者的数据,如一般信息以及病理状态等,结合人源肿瘤异种移植模型(Patient-Derived tumor Xenograft,PDX))验证结果,应用随机森林比较影响胃癌患者生存状态的因素重要性,结合不同模型特性,对胃癌分子分型和化疗方案选择影响胃癌患者预后的危险因素进行分析数据库及预后预测模型的建立。
第三部分,服务器可以根据胃癌预后预测模型,进行回归临床分析,验证各种预测因子,包括影像分期、病理分期、分子分型和化疗标志物等。
具体地,探索分子分型和化疗方案选择影响胃癌预后生存状态的因素,通过Cox比例风险回归法进行多因素分析之后,利用R软件绘制列线图,每位胃癌患者可通过列线图预测出生存概率,再绘制校准曲线评估列线图的精准度。R软件的生存(survival)和均方根(rms)两个软件包,计算列线图(Nomogram)。利用一致性指数(concordance index:C-index)衡量胃癌预后预测模型的精准度。说明决策树每个条件的产生规则及对应的生存概率。通过随机森林比较影响胃癌生存状态的因素重要性。结合不同模型特性,对分子分型和化疗方案选择影响胃癌患者预后的危险因素进行分析。
第四部分,服务器基于获取到患者的样本,基于预测模型,进行患者前瞻性验证,验证关键调控因子、胃癌分子分型、化疗敏感性、胃癌进展与患者预后的相关性,得到胃癌预后处理结果。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种胃癌预后处理装置,包括:对象数据获取模块100、预处理模块200以及预后处理模块300,其中:
对象数据获取模块100,用于获取待处理对象的对象数据。
预处理模块200,用于对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据。
预后处理模块300,用于将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。
在其中一个实施例中,预处理模块200,可以包括:
完整性验证子模块,用于对对象数据进行空值验证,判断对象数据是否完整。
正确性验证子模块,用于当确定对象数据完整时,对对象数据中进行数据格式的验证,判断对象数据是否正确。
去重处理子模块,用于当确定对象数据正确时,则对对象数据进行去重处理,得到去重处理后的对象数据。
标准化处理子模块,用于对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,标准化处理子模块,可以包括:
模板获取单元,用于获取医疗术语标准化处理模板。
标准转化单元,用于基于疗术语标准化处理模板,对去重处理后的对象数据进行文本内容的标准化转换,得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,对象数据可以包括用药数据以及临床检测数据。
在本实施例中,预处理模块200,可以包括:
药效功能确定子模块,用于基于用药数据,得到所用药物的药效功能数据。
患病类型确定子模块,用于根据临床检测数据,得到待处理对象的患病类型数据。
预后处理数据确定子模块,用于将药效功能数据以及患病类型数据作为用于胃癌预后处理的预后处理数据。
在其中一个实施例中,预后处理数据可以包括待处理对象的年龄数据、肿瘤分期数据、肿瘤体积数据、表皮生长因子受体状态数据、免疫抑制分子数据、表观遗传学数据以及分子分型状态数据中至少一种。
在其中一个实施例中,对象数据获取模块100,可以包括:
对象标识获取子模块,用于获取待处理对象的对象标识;
对象数据获取子模块,用于基于对象标识,从各医疗系统获取待处理对象的检查数据,得到待处理对象的对象数据。
在其中一个实施例中,上述装置还可以包括:
训练模块,用于对预测模型进行训练。
在本实施例中,训练模块可以包括:
数据获取子模块,用于获取胃癌预后训练集数据以及验证集数据。
模型构建子模块,用于构建初始预测模型。
训练结果生成子模块,用于基于训练集数据对初始预测模型进行训练,生成对应的训练结果。
模型损失确定子模块,用于根据训练结果,确定初始预测模型的模型损失。
模型参数更新子模块,用于基于模型损失对初始预测模型的模型参数进行更新,并对模型参数更新后的初始预测模型进行迭代训练,得到训练后的预测模型。
验证子模块,用于根据验证集数据,对训练后的预测模型进行验证,并在验证通过后得到训练完成的预测模型。
关于胃癌预后处理装置的具体限定可以参见上文中对于胃癌预后处理方法的限定,在此不再赘述。上述胃癌预后处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储对象数据、预后处理数据以及预后处理结果等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种胃癌预后处理方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取待处理对象的对象数据;对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据;将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。
在其中一个实施例中,处理器执行计算机程序时实现对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,可以包括:对对象数据进行空值验证,判断对象数据是否完整;当确定对象数据完整时,对对象数据中进行数据格式的验证,判断对象数据是否正确;当确定对象数据正确时,则对对象数据进行去重处理,得到去重处理后的对象数据;对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,处理器执行计算机程序时实现对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据,可以包括:获取医疗术语标准化处理模板;基于疗术语标准化处理模板,对去重处理后的对象数据进行文本内容的标准化转换,得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,对象数据可以包括用药数据以及临床检测数据。
在本实施例中,处理器执行计算机程序时实现对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,可以包括:基于用药数据,得到所用药物的药效功能数据;根据临床检测数据,得到待处理对象的患病类型数据;将药效功能数据以及患病类型数据作为用于胃癌预后处理的预后处理数据。
在其中一个实施例中,预后处理数据可以包括待处理对象的年龄数据、肿瘤分期数据、肿瘤体积数据、表皮生长因子受体状态数据、免疫抑制分子数据、表观遗传学数据以及分子分型状态数据中至少一种。
在其中一个实施例中,处理器执行计算机程序时实现获取待处理对象的对象数据,可以包括:获取待处理对象的对象标识;基于对象标识,从各医疗系统获取待处理对象的检查数据,得到待处理对象的对象数据。
在其中一个实施例中,处理器执行计算机程序时实现预测模型的训练方式,可以包括:获取胃癌预后训练集数据以及验证集数据;构建初始预测模型;基于训练集数据对初始预测模型进行训练,生成对应的训练结果;根据训练结果,确定初始预测模型的模型损失;基于模型损失对初始预测模型的模型参数进行更新,并对模型参数更新后的初始预测模型进行迭代训练,得到训练后的预测模型;根据验证集数据,对训练后的预测模型进行验证,并在验证通过后得到训练完成的预测模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待处理对象的对象数据;对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据;将预后处理数据输入预先训练完成的预测模型中,得到对应各预后处理数据的指标数据,并基于各指标数据,生成对应待处理对象的胃癌预后处理结果。
在其中一个实施例中,计算机程序被处理器执行时实现对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,可以包括:对对象数据进行空值验证,判断对象数据是否完整;当确定对象数据完整时,对对象数据中进行数据格式的验证,判断对象数据是否正确;当确定对象数据正确时,则对对象数据进行去重处理,得到去重处理后的对象数据;对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,计算机程序被处理器执行时实现对去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据,可以包括:获取医疗术语标准化处理模板;基于疗术语标准化处理模板,对去重处理后的对象数据进行文本内容的标准化转换,得到用于胃癌预后处理的预后处理数据。
在其中一个实施例中,对象数据可以包括用药数据以及临床检测数据。
在本实施例中,计算机程序被处理器执行时实现对对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,可以包括:基于用药数据,得到所用药物的药效功能数据;根据临床检测数据,得到待处理对象的患病类型数据;将药效功能数据以及患病类型数据作为用于胃癌预后处理的预后处理数据。
在其中一个实施例中,预后处理数据可以包括待处理对象的年龄数据、肿瘤分期数据、肿瘤体积数据、表皮生长因子受体状态数据、免疫抑制分子数据、表观遗传学数据以及分子分型状态数据中至少一种。
在其中一个实施例中,计算机程序被处理器执行时实现获取待处理对象的对象数据,可以包括:获取待处理对象的对象标识;基于对象标识,从各医疗系统获取待处理对象的检查数据,得到待处理对象的对象数据。
在其中一个实施例中,计算机程序被处理器执行时实现预测模型的训练方式,可以包括:获取胃癌预后训练集数据以及验证集数据;构建初始预测模型;基于训练集数据对初始预测模型进行训练,生成对应的训练结果;根据训练结果,确定初始预测模型的模型损失;基于模型损失对初始预测模型的模型参数进行更新,并对模型参数更新后的初始预测模型进行迭代训练,得到训练后的预测模型;根据验证集数据,对训练后的预测模型进行验证,并在验证通过后得到训练完成的预测模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种胃癌预后处理方法,其特征在于,所述方法包括:
获取待处理对象的对象数据;
对所述对象数据进行预处理,得到用于胃癌预后处理的预后处理数据;
将所述预后处理数据输入预先训练完成的预测模型中,得到对应各所述预后处理数据的指标数据,并基于各所述指标数据,生成对应所述待处理对象的胃癌预后处理结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,包括:
对所述对象数据进行空值验证,判断所述对象数据是否完整;
当确定所述对象数据完整时,对所述对象数据中进行数据格式的验证,判断所述对象数据是否正确;
当确定所述对象数据正确时,则对所述对象数据进行去重处理,得到去重处理后的对象数据;
对所述去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述去重处理后的对象数据进行标准化处理,得到用于胃癌预后处理的预后处理数据,包括:
获取医疗术语标准化处理模板;
基于所述疗术语标准化处理模板,对所述去重处理后的对象数据进行文本内容的标准化转换,得到用于胃癌预后处理的预后处理数据。
4.根据权利要求1所述的方法,其特征在于,所述对象数据包括用药数据以及临床检测数据;
所述对所述对象数据进行预处理,得到用于胃癌预后处理的预后处理数据,包括:
基于所述用药数据,得到所用药物的药效功能数据;
根据所述临床检测数据,得到所述待处理对象的患病类型数据;
将所述药效功能数据以及所述患病类型数据作为用于胃癌预后处理的预后处理数据。
5.根据权利要求1所述的方法,其特征在于,所述预后处理数据包括待处理对象的年龄数据、肿瘤分期数据、肿瘤体积数据、表皮生长因子受体状态数据、免疫抑制分子数据、表观遗传学数据以及分子分型状态数据中至少一种。
6.根据权利要求1所述的方法,其特征在于,所述获取待处理对象的对象数据,包括:
获取待处理对象的对象标识;
基于所述对象标识,从各医疗系统获取所述待处理对象的检查数据,得到所述待处理对象的对象数据。
7.根据权利要求1所述的方法,其特征在于,所述预测模型的训练方式,包括:
获取胃癌预后训练集数据以及验证集数据;
构建初始预测模型;
基于所述训练集数据对所述初始预测模型进行训练,生成对应的训练结果;
根据所述训练结果,确定所述初始预测模型的模型损失;
基于所述模型损失对所述初始预测模型的模型参数进行更新,并对所述模型参数更新后的初始预测模型进行迭代训练,得到训练后的预测模型;
根据所述验证集数据,对所述训练后的预测模型进行验证,并在验证通过后得到训练完成的预测模型。
8.一种胃癌预后处理装置,其特征在于,所述装置包括:
对象数据获取模块,用于获取待处理对象的对象数据;
预处理模块,用于对所述对象数据进行预处理,得到用于胃癌预后处理的预后处理数据;
预后处理模块,用于将所述预后处理数据输入预先训练完成的预测模型中,得到对应各所述预后处理数据的指标数据,并基于各所述指标数据,生成对应所述待处理对象的胃癌预后处理结果。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111003853.7A CN115732088A (zh) | 2021-08-30 | 2021-08-30 | 胃癌预后处理方法、装置、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111003853.7A CN115732088A (zh) | 2021-08-30 | 2021-08-30 | 胃癌预后处理方法、装置、计算机设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115732088A true CN115732088A (zh) | 2023-03-03 |
Family
ID=85290722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111003853.7A Pending CN115732088A (zh) | 2021-08-30 | 2021-08-30 | 胃癌预后处理方法、装置、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115732088A (zh) |
-
2021
- 2021-08-30 CN CN202111003853.7A patent/CN115732088A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Taylor et al. | Prediction of in‐hospital mortality in emergency department patients with sepsis: a local big data–driven, machine learning approach | |
US20190307335A1 (en) | Medical analysis and diagnostic system | |
US9934361B2 (en) | Method for generating healthcare-related validated prediction models from multiple sources | |
US20180121618A1 (en) | System and method for extracting oncological information of prognostic significance from natural language | |
JP6608295B2 (ja) | 被験者の健康状態を予測する方法およびシステム | |
Salod et al. | Comparison of the performance of machine learning algorithms in breast cancer screening and detection: A protocol | |
CN111710420A (zh) | 一种基于电子病历大数据的并发症发病风险预测方法、系统、终端以及存储介质 | |
JP2008532104A (ja) | 複数の医療関連アウトカムの予測を行い、インターベンション計画の評価を行い、更に同時にバイオマーカー因果性検証を行うことのできる、予測モデルを生成して適用する方法、そのシステム、及びそのコンピュータ・プログラム製品 | |
CN111180024B (zh) | 基于词频逆文档频率的数据处理方法、装置和计算机设备 | |
US20210057064A1 (en) | Systems and methods for federated searching and retrieval of medical records across disparate databases | |
WO2021151327A1 (zh) | 分诊数据处理方法、装置、设备及介质 | |
US20080294376A1 (en) | System and method for predicting medical condition | |
US11705231B2 (en) | System and method for computerized synthesis of simulated health data | |
CN112447270A (zh) | 一种用药推荐方法、装置、设备及存储介质 | |
CN113628751A (zh) | 胃癌预后预测方法、装置及电子设备 | |
Adekkanattu et al. | Prediction of left ventricular ejection fraction changes in heart failure patients using machine learning and electronic health records: a multi-site study | |
US20150019239A1 (en) | Identifying target patients for new drugs by mining real-world evidence | |
Valencia-Moreno et al. | Review of intelligent algorithms for breast cancer control: A Latin America perspective | |
CN111128330A (zh) | 电子病例报告表自动录入方法、装置以及相关设备 | |
CN115831298A (zh) | 基于医院管理信息系统的临床试验患者招募方法及装置 | |
CN115732088A (zh) | 胃癌预后处理方法、装置、计算机设备及可读存储介质 | |
Blake et al. | The cardiac analytics and innovation (cardiacai) data repository: an Australian data resource for translational cardiovascular research | |
JP2024510425A (ja) | 診断、治療、及び主要な日付を抽出するための機械学習モデル | |
KR20220082963A (ko) | 약물 감시 플랫폼 및 그것을 구비하는 컴퓨터의 제어방법 | |
CN112022124A (zh) | 生理监测方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |