CN113436733A - 一种基于融合经验的血透方案生成模型的特征构造方法 - Google Patents
一种基于融合经验的血透方案生成模型的特征构造方法 Download PDFInfo
- Publication number
- CN113436733A CN113436733A CN202110986394.2A CN202110986394A CN113436733A CN 113436733 A CN113436733 A CN 113436733A CN 202110986394 A CN202110986394 A CN 202110986394A CN 113436733 A CN113436733 A CN 113436733A
- Authority
- CN
- China
- Prior art keywords
- blood
- advanced
- indexes
- characteristic
- dialysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- External Artificial Organs (AREA)
Abstract
一种基于融合经验的血透方案生成模型的特征构造方法,包括数据准备;确定需要提取的进阶特征、以及进阶特征对应的指标;对进阶特征对应的指标做数据处理得到实际相关指标;根据医生对进阶特征的各个实际相关指标关注度的大小为实际相关指标设置权重大小;实际相关指标值乘以相应的权重并求和,得到进阶特征;m个进阶特征按第1到t次透析的顺序排列,构成时序矩阵A;通过加权的方式融入医生在时间维度方面的临床经验;构建变化程度特征;构建变化趋势特征;构建发展状态特征;本发明融入医生临床经验,将各进阶特征对应的指标做进一步融合,提取出更具临床实际意义的隐藏特征,在构建血透方案生成模型时,提高了模型在医学方面的可解释性。
Description
技术领域
本发明涉及一种模型特征构造方法,具体的说是一种基于融合经验的血透方案生成模型的特征构造方法。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是计算机科学的一个领域,旨在模拟人类的思维过程、学习能力和知识存储。人工智能提高了学习能力,提供了规模化的决策支持系统。人工智能的工作原理是:计算机会通过传感器(或人工输入的方式)来收集关于某个情景的事实,计算机将此信息与已存储的信息进行比较,以确定它的含义。计算机会根据收集来的信息计算各种可能的动作,然后预测哪种动作的效果最好。人工智能正在改变未来。
人工智能技术已渗透医学及其管理的各个领域,在使用AI技术生成血透方案方面,现有的血透方案生成模型构建技术存在以下缺陷:
(1)模型特征来源于患者电子病历,建模特征都是单一的关系,仅针对患者的单个特征做判断,没有融合医生经验。
(2)模型弱化医学解释,单从数值计算的角度解释,模型在医学方面的可解释性低。
(3)模型特征没有考虑时序数据,没有挖掘特征,不能刻画出数据随时间推移的变化情况。
血透方案的制定与调整与医生的临床经验、患者的历史血透记录、患者自开始维持性血液透析治疗起状态的变化等关系紧密,因此基于融合经验的特征构造来提取血透方案生成模型的建模特征,对提升基于AI技术生成血透方案的准确率有重要意义。
发明内容
为了解决上述技术问题,本发明提出一种基于融合经验的血透方案生成模型的特征构造方法,包括如下步骤:
步骤S0,:数据准备;收集患者信息,患者信息由多个指标构成,包括:患者的基础信息数据(年龄、性别、身高等)、病史数据(个人病史、原发病、家族病史等)、据当次透析最近一次的检验检查数据(血常规、血生化)、当次透析前体征数据(透前症状、透前血压、透前心率、透前体温等)、近期使用的透析方案数据。
步骤S1:确定需要提取的进阶特征、以及进阶特征对应的指标。进阶特征为医生希望从进阶特征对应的指标中获得更直观的描述性特征,如该患者是否血压异常,是否血糖异常。进阶特征对应的指标是医生在患者信息的多个指标中提取出的与进阶特征相关的指标。进阶特征对应的指标包括患者的基础信息数据(年龄、性别、身高等)、病史数据(个人病史、原发病、家族病史等)、据当次透析最近一次的检验检查数据(血常规、血生化)、当次透析前体征数据(透前症状、透前血压、透前心率、透前体温等)、近期使用的透析方案数据。进阶特征以数值形式表示,如医生想了解患者是否血压异常,则进阶特征可设为血压系数,数值越大,说明该患者血压异常的可能性越高。
例:进阶特征:血压系数;
进阶特征对应的指标:舒张压值、收缩压值、BMI、透前症状;
步骤S2:对进阶特征对应的指标做数据处理得到实际相关指标。
进阶特征对应的指标中,用数值描述的指标为连续型指标,如年龄、身高、体重等,对连续型指标做归一化处理,把数值取值范围压缩到0-1之间。
归一化处理是对每个连续型指标做相同处理:取出某个连续型指标取值的最大值max、最小值min,通过公式 x’=(x-min)/(max-min)得到该指标中每个取值x的新的取值x’,x’的取值范围在0-1之间。
进阶特征对应的指标中,用文字描述的指标为离散型指标,如性别、个人病史、透前症状等,对离散型指标做独热编码处理,处理后的离散型指标变为多个二值特征,有此特征记为1,无此特征记为0。
独热编码处理是对每个离散型指标做相同处理:把某个离散型指标的所有可能的n个取值转变成n个二值特征替代该指标,原先指标取值所对应的二值特征值记为1,其余二值特征值记为0。
步骤S3:根据医生对进阶特征的各个实际相关指标关注度的大小为实际相关指标设置权重大小,关注度越大的实际相关指标,其权重设置越大,各实际相关指标权重值的和为1。
例:进阶特征为血压系数的实际相关指标有:舒张压值、收缩压值、BMI、头晕(透前症状)、呕吐(透前症状)、恶心(透前症状)、冷汗(透前症状)、双眼发黑(透前症状);
血压系数的实际相关指标关注度大小排序:舒张压值=收缩压值>头晕(透前症状)=双眼发黑(透前症状)>BMI>呕吐(透前症状)>恶心(透前症状)>冷汗(透前症状);
根据实际相关指标的关注度的大小设置权重,各实际相关指标的权重的和为1。
步骤S4:实际相关指标值乘以相应的权重并求和,得到进阶特征。
例:血压系数的各实际相关指标的权重为:0.25、0.25、0.11、0.11、0.1、0.08、0.07、0.03,各实际相关指标的权重的和为1;血压系数=0.25*舒张压值的取值+0.25*收缩压值的取值+0.11*头晕的取值+0.11*双眼发黑的取值+0.1*BMI的取值+0.08*呕吐的取值+0.07*恶心的取值+0.03*冷汗的取值。
步骤S5:m个进阶特征按第1到t次透析的顺序排列,构成时序矩阵A:
表示第j次透析的第i个进阶特征值,其中i取值为1到m的自然数,j取值为1到t的自然数。显然地,第1次透析的时间距当次血透方案制定的时间最远,第t次透析的时间距当次血透方案制定的时间最近。A的第i行表示第i个进阶特征在不同次透析获得的值构成的进阶特征序列,A的第j列表示第j次透析获得的所有进阶特征的值构成的进阶特征组。
时序矩阵A加入了时间维度,能够更方便地融合医生经验构造特征,提高后续构造特征过程的运算效率。
步骤S6:在传统的血透方案制定流程中,医生的临床经验是制定血透方案的主要依据,对医生来说,距离当次血透方案制定时间越近的历史数据越有参考价值,因此,该步骤通过加权的方式融入医生在时间维度方面的临床经验。
根据医生对不同透析时间的进阶特征组的关注度大小,对不同透析时间的进阶特征组设置权重,关注度越大的进阶特征组对应的权重值越大,各进阶特征组权重的和为1。各进阶特征组权重与时序矩阵A中的各进阶特征组对应相乘,得到加权后的时序矩阵B。
其中表示第j次透析的进阶特征组的权重,表示第j次透析的第i个加权后的进阶特征值。加权后的时序矩阵B的第i行=,表示第i个加权后的进阶特征序列,加权后的时序矩阵B的第j列=,表示第j次透析的加权后的进阶特征组。
步骤S7:构建变化程度特征,用于描述每次透析较上一次透析的加权后的进阶特征的变化程度。
步骤S7.1:对加权后的时序矩阵B按列做一阶差分,得到变化程度矩阵C。
表示(第j+1次透析的第i个加权后的进阶特征值)减去(第j次透析的第i个加权后的进阶特征值)得到的第i个变化程度特征值,其中,i的取值为1到m的自然数,j的取值为1到t-1的自然数。变化程度矩阵C的第j列=,表示第j个变化程度特征组。
步骤S7.2:根据医生对不同透析时间的关注度大小,为变化程度矩阵C中各变化程度特征组设置权重,关注度越大的变化程度特征组对应的权重值越大,各变化程度特征组权重的和为1。各变化程度特征组权重与变化程度矩阵C中的各变化程度特征组对应相乘,得到加权后的变化程度矩阵D:
步骤S8:构建变化趋势特征,用于描述加权后的进阶特征序列的总体变化趋势。
步骤S9:构建发展状态特征,用于描述每次透析较上一次透析的加权后的进阶特征的状态稳定性。
从加权后的时序矩阵B中的第二列开始,每一列加权后的进阶特征组除以前一列加权后的进阶特征组,得到发展状态特征矩阵S:
步骤S10:将患者信息作为建模特征构建血透方案生成模型M1。另外,将通过加权后的时序矩阵B提取得到的加权后的变化程度矩阵D、变化趋势矩阵、发展状态特征矩阵S加入患者信息作为新的建模特征构建血透方案生成模型M2。
步骤S11:随机选取部分患者信息作为测试数据,构造出测试数据的进阶特征,进一步构造出加权后的变化程度特征、变化趋势特征、发展状态特征,加入测试数据中作为新的测试数据,测试数据通过血透方案生成模型M1生成血透方案P1,新的测试数据通过血透方案生成模型M2生成血透方案P2。
步骤S12:验证构造特征的有效性。血透方案P1、P2分别与测试数据的实际血透方案比较,计算P1的准确率和P2的准确率,通过准确率比较M1和M2效果。结果P1的准确率要明显高于P2的准确率,通过准确率的验证,加入构造特征的血透方案生成模型生成的血透方案比未加入构造特征的血透方案生成模型生成的血透方案准确率更高,效果更好。
有益效果:
(1)本发明方法根据医生经验从患者历次透析前记录的信息(包括:个人信息(年龄、性别、身高等)、病史数据(病史、原发病、家族病史等)、最近一次检验检查数据(肌酐、尿素氮、血红蛋白等)、透前数据(症状、血压、心率等))中提取出进阶特征,进阶特征能够刻画出医生通过经验判断患者更具体的情况,如是否血压异常、是否血糖异常、是否发生贫血等,它们的共通点是:这些具体情况虽有对应的指标做参照,也有正常值的参考范围,但因个体的差异,实际每个人的正常值范围是不确定的,因此需要医生结合患者实际症状、检查情况做进一步的判断,才能得出更准确的结果,而不是仅针对患者的某个指标做判断。
(2)相比以往的建模特征都是单一的关系,本发明方法融入医生临床经验,将各进阶特征对应的指标做进一步的融合,提取出更具临床实际意义的隐藏特征,提高了输入特征的意义,从而提高了模型在医学方面的可解释性,而不是弱化医学解释单从数值计算的角度解释模型。
(3)本发明方法通过提取出的进阶特征,结合时序数据,获得隐藏特征,隐藏特征能刻画出数据随时间推移的变化情况,如变化程度特征、变化趋势特征、发展状态特征。该部分属于对进阶特征的具体应用。
附图说明
图1为本发明流程示意图;
图2为本发明详细流程示意图。
具体实施方式
实施例1:如图1、2所示,本实施例提出一种基于融合经验的血透方案生成模型的特征构造方法,其特征在于包括如下步骤:
步骤S0:数据准备;收集患者信息,患者信息包括:患者的基础信息数据病史数据、据当次透析最近一次的检验检查数据、当次透析前体征数据、近期使用的透析方案数据;
进一步的,步骤S0中,患者的基础信息数据包括年龄、性别、身高;病史数据包括个人病史、原发病、家族病史;据当次透析最近一次的检验检查数据包括血常规、血生化;当次透析前体征数据包括透前症状、透前血压、透前心率、透前体温。
步骤S1:确定需要提取的进阶特征、以及进阶特征对应的指标;
进阶特征为医生希望从进阶特征对应的指标中获得更直观的描述性特征;进阶特征对应的指标是医生在患者信息的多个指标中提取出的与进阶特征相关的指标;进阶特征以数值形式表示;进阶特征对应的指标包括患者的基础信息数据(年龄、性别、身高等)、病史数据(个人病史、原发病、家族病史等)、据当次透析最近一次的检验检查数据(血常规、血生化)、当次透析前体征数据(透前症状、透前血压、透前心率、透前体温等)、近期使用的透析方案数据。
进一步的,步骤S1中,所述进阶特征包括血压系数;进阶特征对应的指标包括舒张压值、收缩压值、BMI、以及透前症状。
步骤S2:对进阶特征对应的指标做数据处理得到实际相关指标;
进阶特征对应的指标中,用数值描述的指标为连续型指标,对连续型指标做归一化处理,把数值取值范围压缩到0-1之间;
归一化处理是对每个连续型指标做相同处理:取出某个连续型指标取值的最大值max、最小值min,通过公式 x’=(x-min)/(max-min)得到该指标中每个取值x的新的取值x’,x’的取值范围在0-1之间;
进阶特征对应的指标中,用文字描述的指标为离散型指标,对离散型指标做独热编码处理,处理后的离散型指标变为多个二值特征,有此特征记为1,无此特征记为0;
独热编码处理是对每个离散型指标做相同处理:把某个离散型指标的所有可能的n个取值转变成n个二值特征替代该指标,原先指标取值所对应的二值特征值记为1,其余二值特征值记为0;
步骤S3:根据医生对进阶特征的各个实际相关指标关注度的大小为实际相关指标设置权重大小,关注度越大的实际相关指标,其权重设置越大,各实际相关指标权重值的和为1;
进一步的,步骤S3中,进阶特征的实际相关指标包括:血压系数的实际相关指标、血糖系数的实际相关指标、血脂系数的实际相关指标、贫血系数的实际相关指标、血磷系数的实际相关指标、血钾系数的实际相关指标、血钠系数的实际相关指标、血钙系数的实际相关指标、营养系数的实际相关指标。血压系数的实际相关指标包括舒张压值、收缩压值、BMI、透前症状;透前症状包括头晕、呕吐、恶心、冷汗、双眼发黑。血糖系数的实际相关指标包括空腹血糖、透前症状、个人病史;透前症状包括冷汗、心慌、饥饿感、面色苍白;个人病史包括糖尿病史。血脂系数的实际相关指标包括:甘油三酯、总胆固醇、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇、个人病史、BMI;个人病史包括高血脂史。贫血系数的实际相关指标包括:透前症状、红细胞、血红蛋白;透前症状包括耳鸣、头痛、头晕、心慌、面色苍白。血磷系数的实际相关指标包括:血磷、血钙、透前症状;透前症状包括抽搐、呕吐、恶心。血钾系数的实际相关指标包括:血钾、透前症状、个人病史、年龄;透前症状包括乏力、麻木、心跳缓慢、心律不齐;个人病史包括糖尿病史、酸中毒史。血钠系数的实际相关指标包括:血钠、血钾、透前症状;透前症状包括:口干、少尿、乏力、头晕、纳差。血钙系数的实际相关指标包括:血钙、甲状旁腺素、个人病史、透前症状;个人病史包括恶性肿瘤;透前症状包括:多尿、纳差、口干、恶心、呕吐、乏力、昏睡。营养系数的实际相关指标包括:BMI、血白蛋白、年龄、透前症状、前白蛋白、血红蛋白;透前症状包括乏力、头晕、双眼发黑、脸色发黄、纳差。
血压系数的实际相关指标关注度大小排序包括舒张压值=收缩压值>头晕(透前症状)=双眼发黑(透前症状)>BMI>呕吐(透前症状)>恶心(透前症状)>冷汗(透前症状); 血糖系数的实际相关指标关注度大小排序包括糖尿病史(个人病史)>空腹血糖>面色苍白(透前症状)>冷汗(透前症状) >心慌(透前症状) >饥饿感(透前症状);血脂系数的实际相关指标关注度大小排序包括:高血脂史(个人病史)>甘油三酯=总胆固醇> BMI>低密度脂蛋白胆固醇=高密度脂蛋白胆固醇;贫血系数的实际相关指标关注度大小排序包括红细胞=血红蛋白>面色苍白(透前症状)> 心慌(透前症状)>头晕(透前症状)=头痛(透前症状)=耳鸣;血磷系数的实际相关指标关注度大小排序包括血磷>血钙>抽搐(透前症状) >呕吐(透前症状) >恶心(透前症状);血钾系数的实际相关指标关注度大小排序包括酸中毒史(个人病史)>糖尿病史(个人病史)>血钾>麻木(透前症状)=心律不齐(透前症状) >乏力(透前症状) >心跳缓慢(透前症状) >年龄;血钠系数的实际相关指标关注度大小排序包括血钠>血钾>少尿(透前症状)>口干(透前症状)>头晕(透前症状)>乏力(透前症状)=纳差(透前症状);血钙系数的实际相关指标关注度大小排序包括血钙>甲状旁腺素=恶性肿瘤(个人病史)>昏睡(透前症状)>多尿(透前症状)>呕吐(透前症状)>恶心(透前症状)>纳差(透前症状)=口干(透前症状)=乏力(透前症状);营养系数的实际相关指标关注度大小排序包括:BMI>血白蛋白=前白蛋白=血红蛋白>脸色发黄(透前症状)>年龄>纳差(透前症状)>双眼发黑(透前症状)=头晕(透前症状)>乏力(透前症状)。
步骤S4:实际相关指标值乘以相应的权重并求和,得到进阶特征;
例:血压系数的各实际相关指标的权重为:0.25、0.25、0.11、0.11、0.1、0.08、0.07、0.03,各实际相关指标的权重的和为1;血压系数=0.25*舒张压值的取值+0.25*收缩压值的取值+0.11*头晕的取值+0.11*双眼发黑的取值+0.1*BMI的取值+0.08*呕吐的取值+0.07*恶心的取值+0.03*冷汗的取值。
步骤S5:m个进阶特征按第1到t次透析的顺序排列,构成时序矩阵A:
表示第j次透析的第i个进阶特征值,其中i取值为1到m的自然数,j取值为1到t的自然数;第1次透析的时间距当次血透方案制定的时间最远,第t次透析的时间距当次血透方案制定的时间最近;A的第i行表示第i个进阶特征在不同次透析获得的值构成的进阶特征序列,A的第j列表示第j次透析获得的所有进阶特征的值构成的进阶特征组;
步骤S6:通过加权的方式融入医生在时间维度方面的临床经验;
根据医生对不同透析时间的进阶特征组的关注度大小,对不同透析时间的进阶特征组设置权重,关注度越大的进阶特征组对应的权重值越大,各进阶特征组权重的和为1。各进阶特征组权重与时序矩阵A中的各进阶特征组对应相乘,得到加权后的时序矩阵B;
其中表示第j次透析的进阶特征组的权重,表示第j次透析的第i个加权后的进阶特征值。加权后的时序矩阵B的第i行=,表示第i个加权后的进阶特征序列,加权后的时序矩阵B的第j列=,表示第j次透析的加权后的进阶特征组;
步骤S7:构建变化程度特征,用于描述每次透析较上一次透析的加权后的进阶特征的变化程度;
进一步的,步骤S7构建变化程度特征包括如下子步骤:
步骤S7.1:对加权后的时序矩阵B按列做一阶差分,得到变化程度矩阵C;
表示(第j+1次透析的第i个加权后的进阶特征值)减去(第j次透析的第i个加权后的进阶特征值)得到的第i个变化程度特征值,其中,i的取值为1到m的自然数,j的取值为1到t-1的自然数。变化程度矩阵C的第j列=,表示第j个变化程度特征组;
步骤S7.2:根据医生对不同透析时间的关注度大小,为变化程度矩阵C中各变化程度特征组设置权重,关注度越大的变化程度特征组对应的权重值越大,各变化程度特征组权重的和为1;各变化程度特征组权重与变化程度矩阵C中的各变化程度特征组对应相乘,得到加权后的变化程度矩阵D:
步骤S8:构建变化趋势特征,用于描述加权后的进阶特征序列的总体变化趋势;
步骤S9:构建发展状态特征,用于描述每次透析较上一次透析的加权后的进阶特征的状态稳定性;
从加权后的时序矩阵B中的第二列开始,每一列加权后的进阶特征组除以前一列加权后的进阶特征组,得到发展状态特征矩阵S:
本发明方法通过提取出的进阶特征,结合时序数据,获得隐藏特征,隐藏特征能刻画出数据随时间推移的变化情况,隐藏特征包括变化程度特征、变化趋势特征、发展状态特征。该部分属于对进阶特征的具体应用。
本发明方法根据医生经验从患者历次透析前记录的信息(包括:个人信息(年龄、性别、身高等)、病史数据(病史、原发病、家族病史等)、最近一次检验检查数据(肌酐、尿素氮、血红蛋白等)、透前数据(症状、血压、心率等))中提取出进阶特征,进阶特征能够刻画出医生通过经验判断患者更具体的情况,如是否血压异常、是否血糖异常、是否发生贫血等,它们的共通点是:这些具体情况虽有进阶特征对应的指标做参照,也有正常值的参考范围,但因个体的差异,实际每个人的正常值范围是不确定的,因此需要医生结合患者实际症状、检查情况做进一步的判断,才能得出更准确的结果,而不是采用仅针对患者的单个指标做判断。
相比以往的建模特征都是单一的关系,本发明方法融入医生临床经验,将各进阶特征对应的指标做进一步的融合,提取出更具临床实际意义的隐藏特征,提高了输入特征的意义,从而提高了模型在医学方面的可解释性,而不是弱化医学解释单从数值计算的角度解释模型。
实施例2:如图1、2所示,本实施例在实施例1的基础上增加了验证构造特征的有效性的步骤,包括
步骤S10:将患者信息作为建模特征构建血透方案生成模型M1;另外,将通过加权后的时序矩阵B提取得到的加权后的变化程度矩阵D、变化趋势矩阵、发展状态特征矩阵S加入患者信息作为新的建模特征构建血透方案生成模型M2;
步骤S11:随机选取部分患者信息作为测试数据,构造出测试数据的进阶特征,进一步构造出加权后的变化程度特征、变化趋势特征、发展状态特征,加入测试数据中作为新的测试数据,测试数据通过血透方案生成模型M1生成血透方案P1,新的测试数据通过血透方案生成模型M2生成血透方案P2;
步骤S12:验证构造特征的有效性;
血透方案P1、P2分别与测试数据的实际血透方案比较,计算P1的准确率和P2的准确率,通过准确率比较M1和M2效果;结果P1的准确率要明显高于P2的准确率,通过准确率的验证,加入构造特征的血透方案生成模型生成的血透方案比未加入构造特征的血透方案生成模型生成的血透方案准确率更高,效果更好。
Claims (6)
1.一种基于融合经验的血透方案生成模型的特征构造方法,其特征在于包括如下步骤:
步骤S0:数据准备;收集患者信息,患者信息包括:患者的基础信息数据、病史数据、距当次透析最近一次的检验检查数据、当次透析前体征数据、近期使用的透析方案数据;
步骤S1:确定需要提取的进阶特征、以及进阶特征对应的指标;
进阶特征为医生希望从进阶特征对应的指标中获得更直观的描述性特征;进阶特征对应的指标是医生在患者信息中提取出的与进阶特征相关的信息;进阶特征以数值形式表示;
步骤S2:对进阶特征对应的指标做数据处理得到实际相关指标;
进阶特征对应的指标中,用数值描述的指标为连续型指标,对连续型指标做归一化处理,把数值取值范围压缩到0-1之间;
归一化处理是对每个连续型指标做相同处理:取出某个连续型指标取值的最大值max、最小值min,通过公式 x’=(x-min)/(max-min)得到该指标中每个取值x的新的取值x’,x’的取值范围在0-1之间;
进阶特征对应的指标中,用文字描述的指标为离散型指标,对离散型指标做独热编码处理,处理后的离散型指标变为多个二值特征,有此特征记为1,无此特征记为0;
独热编码处理是对每个离散型指标做相同处理:把某个离散型指标的所有可能的n个取值转变成n个二值特征替代该指标,原先指标取值所对应的二值特征值记为1,其余二值特征值记为0;
步骤S3:根据医生对进阶特征的各个实际相关指标关注度的大小设置实际相关指标设置权重大小,关注度越大的实际相关指标,其权重值越大,各实际相关指标权重值的和为1;
步骤S4:实际相关指标值乘以相应的权重并求和,得到进阶特征;
步骤S5:m个进阶特征按第1到t次透析的顺序排列,构成时序矩阵A:
表示第j次透析的第i个进阶特征值,其中i取值为1到m的自然数,j取值为1到t的自然数;第1次透析的时间距当次血透方案制定的时间最远,第t次透析的时间距当次血透方案制定的时间最近;A的第i行表示第i个进阶特征在不同次透析获得的值构成的进阶特征序列,A的第j列表示第j次透析获得的所有进阶特征的值构成的进阶特征组;
步骤S6:通过加权的方式融入医生在时间维度方面的临床经验;
根据医生对不同透析时间的进阶特征组的关注度大小,对不同透析时间的进阶特征组设置权重,关注度越大的进阶特征组对应的权重值越大,各进阶特征组权重的和为1;
各进阶特征组权重与时序矩阵A中的各进阶特征组对应相乘,得到加权后的时序矩阵B;
步骤S7:构建变化程度特征,用于描述每次透析较上一次透析的加权后的进阶特征的变化程度;
步骤S8:构建变化趋势特征,用于描述加权后的进阶特征序列的总体变化趋势;
步骤S9:构建发展状态特征,用于描述每次透析较上一次透析的加权后的进阶特征的状态稳定性;
从加权后的时序矩阵B中的第二列开始,每一列加权后的进阶特征组除以前一列加权后的进阶特征组,得到发展状态特征矩阵S:
。
2.根据权利要求1所述的基于融合经验的血透方案生成模型的特征构造方法,其特征在于还包括如下步骤:
步骤S10:将患者信息作为建模特征构建血透方案生成模型M1;另外,将通过加权后的时序矩阵B提取得到的加权后的变化程度矩阵D、变化趋势矩阵、发展状态特征矩阵S加入患者信息作为新的建模特征构建血透方案生成模型M2;
步骤S11:随机选取部分患者信息作为测试数据,构造出测试数据的进阶特征,进一步构造出加权后的变化程度特征、变化趋势特征、发展状态特征,加入测试数据中作为新的测试数据,测试数据通过血透方案生成模型M1生成血透方案P1,新的测试数据通过血透方案生成模型M2生成血透方案P2;
步骤S12:验证构造特征的有效性;
血透方案P1、P2分别与测试数据的实际血透方案比较,计算P1的准确率和P2的准确率,通过准确率比较M1和M2效果;结果P1的准确率要明显高于P2的准确率,通过准确率的验证,加入构造特征的血透方案生成模型生成的血透方案比未加入构造特征的血透方案生成模型生成的血透方案准确率更高,效果更好。
3.根据权利要求1基于融合经验的血透方案生成模型的特征构造方法,其特征在于步骤S7构建变化程度特征包括如下子步骤:
步骤S7.1:对加权后的时序矩阵B按列做一阶差分,得到变化程度矩阵C;
步骤S7.2:根据医生对不同透析时间的关注度大小,为变化程度矩阵C中各变化程度特征组设置权重,关注度越大的变化程度特征组对应的权重值越大,各变化程度特征组权重的和为1;各变化程度特征组权重与变化程度矩阵C中的各变化程度特征组对应相乘,得到加权后的变化程度矩阵D:
4.根据权利要求1基于融合经验的血透方案生成模型的特征构造方法,其特征在于:步骤S0中,患者的基础信息数据包括年龄、性别、身高;病史数据包括个人病史、原发病、家族病史;据当次透析最近一次的检验检查数据包括血常规、血生化;当次透析前体征数据包括透前症状、透前血压、透前心率、透前体温。
5.根据权利要求1基于融合经验的血透方案生成模型的特征构造方法,其特征在于:步骤S1中,所述进阶特征包括血压系数、血糖系数、血脂系数、贫血系数、血磷系数、血钾系数、血钠系数、血钙系数、营养系数;进阶特征血压系数对应的指标包括舒张压值、收缩压值、BMI、以及透前症状、个人病史;进阶特征血糖系数对应的指标包括空腹血糖、饭后血糖、透前症状、个人病史;进阶特征血脂系数对应的指标包括:甘油三酯、总胆固醇、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇、个人病史、BMI;进阶特征贫血系数对应的指标包括:透前症状、红细胞、血红蛋白;进阶特征血磷系数对应的指标包括:血磷、血钙、透前症状;进阶特征血钾系数对应的指标包括:血钾、透前症状、个人病史、年龄;进阶特征血钠系数对应的指标包括:血钠、血钾、透前症状;进阶特征血钙系数对应的指标包括:血钙、甲状旁腺素、个人病史、透前症状;进阶特征营养系数对应的指标包括:BMI、血白蛋白、年龄、透前症状、前白蛋白、血红蛋白。
6.根据权利要求1基于融合经验的血透方案生成模型的特征构造方法,其特征在于:步骤S3中,进阶特征的实际相关指标包括血压系数的实际相关指标、血糖系数的实际相关指标、血脂系数的实际相关指标、贫血系数的实际相关指标、血磷系数的实际相关指标、血钾系数的实际相关指标、血钠系数的实际相关指标、血钙系数的实际相关指标、营养系数的实际相关指标;
血压系数的实际相关指标包括舒张压值、收缩压值、BMI、透前症状;透前症状包括头晕、呕吐、恶心、冷汗、双眼发黑;
血糖系数的实际相关指标包括空腹血糖、透前症状、个人病史;透前症状包括冷汗、心慌、饥饿感、面色苍白;个人病史包括糖尿病史;
血脂系数的实际相关指标包括:甘油三酯、总胆固醇、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇、个人病史、BMI;个人病史包括高血脂史;
贫血系数的实际相关指标包括:透前症状、红细胞、血红蛋白;透前症状包括耳鸣、头痛、头晕、心慌、面色苍白;
血磷系数的实际相关指标包括:血磷、血钙、透前症状;透前症状包括抽搐、呕吐、恶心;
血钾系数的实际相关指标包括:血钾、透前症状、个人病史、年龄;透前症状包括乏力、麻木、心跳缓慢、心律不齐;个人病史包括糖尿病史、酸中毒史;
血钠系数的实际相关指标包括:血钠、血钾、透前症状;透前症状包括:口干、少尿、乏力、头晕、纳差;
血钙系数的实际相关指标包括:血钙、甲状旁腺素、个人病史、透前症状;个人病史包括恶性肿瘤;透前症状包括:多尿、纳差、口干、恶心、呕吐、乏力、昏睡;
营养系数的实际相关指标包括:BMI、血白蛋白、年龄、透前症状、前白蛋白、血红蛋白;透前症状包括乏力、头晕、双眼发黑、脸色发黄、纳差;
血压系数的实际相关指标关注度大小排序包括:舒张压值=收缩压值>头晕(透前症状)=双眼发黑(透前症状)>BMI>呕吐(透前症状)>恶心(透前症状)>冷汗(透前症状);
血糖系数的实际相关指标关注度大小排序包括:糖尿病史(个人病史)>空腹血糖>面色苍白(透前症状)>冷汗(透前症状) >心慌(透前症状) >饥饿感(透前症状);
血脂系数的实际相关指标关注度大小排序包括:高血脂史(个人病史)>甘油三酯=总胆固醇> BMI>低密度脂蛋白胆固醇=高密度脂蛋白胆固醇;
贫血系数的实际相关指标关注度大小排序包括:红细胞=血红蛋白>面色苍白(透前症状)> 心慌(透前症状)>头晕(透前症状)=头痛(透前症状)=耳鸣;
血磷系数的实际相关指标关注度大小排序包括:血磷>血钙>抽搐(透前症状) >呕吐(透前症状) >恶心(透前症状);
血钾系数的实际相关指标关注度大小排序包括:酸中毒史(个人病史)>糖尿病史(个人病史)>血钾>麻木(透前症状)=心律不齐(透前症状) >乏力(透前症状) >心跳缓慢(透前症状) >年龄;
血钠系数的实际相关指标关注度大小排序包括:血钠>血钾>少尿(透前症状)>口干(透前症状)>头晕(透前症状)>乏力(透前症状)=纳差(透前症状);
血钙系数的实际相关指标关注度大小排序包括:血钙>甲状旁腺素=恶性肿瘤(个人病史)>昏睡(透前症状)>多尿(透前症状)>呕吐(透前症状)>恶心(透前症状)>纳差(透前症状)=口干(透前症状)=乏力(透前症状);
营养系数的实际相关指标关注度大小排序包括:BMI>血白蛋白=前白蛋白=血红蛋白>脸色发黄(透前症状)>年龄>纳差(透前症状)>双眼发黑(透前症状)=头晕(透前症状)>乏力(透前症状)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110986394.2A CN113436733B (zh) | 2021-08-26 | 2021-08-26 | 一种基于融合经验的血透方案生成模型的特征构造方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110986394.2A CN113436733B (zh) | 2021-08-26 | 2021-08-26 | 一种基于融合经验的血透方案生成模型的特征构造方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113436733A true CN113436733A (zh) | 2021-09-24 |
CN113436733B CN113436733B (zh) | 2021-11-30 |
Family
ID=77798030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110986394.2A Active CN113436733B (zh) | 2021-08-26 | 2021-08-26 | 一种基于融合经验的血透方案生成模型的特征构造方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113436733B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110119081A1 (en) * | 2008-07-10 | 2011-05-19 | B.G. Informatica S.R.L. | Method For Defining And Interactively Managing A Treatment For Glycemic Level Control In A Diabetic Patient And Device That Carries Out Said Method |
CN109064460A (zh) * | 2018-08-01 | 2018-12-21 | 中国科学院合肥物质科学研究院 | 基于多时序属性元素深度特征的小麦重度病害预测方法 |
CN110021430A (zh) * | 2019-04-09 | 2019-07-16 | 科大讯飞股份有限公司 | 一种病灶的属性信息预测方法及装置 |
CN110516323A (zh) * | 2019-08-08 | 2019-11-29 | 合肥通用机械研究院有限公司 | 一种基于时序分析的压力管道损伤预测方法 |
CN110622182A (zh) * | 2018-09-04 | 2019-12-27 | 安徽中科智能感知产业技术研究院有限责任公司 | 基于多时序属性元素深度特征的小麦重度病害预测方法 |
CN111028913A (zh) * | 2019-11-29 | 2020-04-17 | 北京工业大学 | 血液透析治疗方案辅助决策方法 |
CN111222668A (zh) * | 2018-11-27 | 2020-06-02 | 北京京东尚科信息技术有限公司 | 仓库单量预测方法、装置、电子设备和可读存储介质 |
CN111724910A (zh) * | 2020-05-25 | 2020-09-29 | 北京和兴创联健康科技有限公司 | 一种适用于围手术期患者血液管理的检测评估方法 |
CN112508275A (zh) * | 2020-12-07 | 2021-03-16 | 国网湖南省电力有限公司 | 一种基于聚类和趋势指标的配电网线路负荷预测方法和设备 |
CN112735587A (zh) * | 2020-12-31 | 2021-04-30 | 复旦大学附属华山医院 | 血透患者残余肾功能监测及递增血透管控系统及方法 |
CN113240170A (zh) * | 2021-05-10 | 2021-08-10 | 中国地质大学(武汉) | 一种基于季节性循环神经网络的空气质量预测方法 |
CN113270192A (zh) * | 2021-04-19 | 2021-08-17 | 浙江大学 | 基于动静态数据结合与深度自编码器的血透风险预测系统 |
-
2021
- 2021-08-26 CN CN202110986394.2A patent/CN113436733B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110119081A1 (en) * | 2008-07-10 | 2011-05-19 | B.G. Informatica S.R.L. | Method For Defining And Interactively Managing A Treatment For Glycemic Level Control In A Diabetic Patient And Device That Carries Out Said Method |
CN109064460A (zh) * | 2018-08-01 | 2018-12-21 | 中国科学院合肥物质科学研究院 | 基于多时序属性元素深度特征的小麦重度病害预测方法 |
CN110622182A (zh) * | 2018-09-04 | 2019-12-27 | 安徽中科智能感知产业技术研究院有限责任公司 | 基于多时序属性元素深度特征的小麦重度病害预测方法 |
CN111222668A (zh) * | 2018-11-27 | 2020-06-02 | 北京京东尚科信息技术有限公司 | 仓库单量预测方法、装置、电子设备和可读存储介质 |
CN110021430A (zh) * | 2019-04-09 | 2019-07-16 | 科大讯飞股份有限公司 | 一种病灶的属性信息预测方法及装置 |
CN110516323A (zh) * | 2019-08-08 | 2019-11-29 | 合肥通用机械研究院有限公司 | 一种基于时序分析的压力管道损伤预测方法 |
CN111028913A (zh) * | 2019-11-29 | 2020-04-17 | 北京工业大学 | 血液透析治疗方案辅助决策方法 |
CN111724910A (zh) * | 2020-05-25 | 2020-09-29 | 北京和兴创联健康科技有限公司 | 一种适用于围手术期患者血液管理的检测评估方法 |
CN112508275A (zh) * | 2020-12-07 | 2021-03-16 | 国网湖南省电力有限公司 | 一种基于聚类和趋势指标的配电网线路负荷预测方法和设备 |
CN112735587A (zh) * | 2020-12-31 | 2021-04-30 | 复旦大学附属华山医院 | 血透患者残余肾功能监测及递增血透管控系统及方法 |
CN113270192A (zh) * | 2021-04-19 | 2021-08-17 | 浙江大学 | 基于动静态数据结合与深度自编码器的血透风险预测系统 |
CN113240170A (zh) * | 2021-05-10 | 2021-08-10 | 中国地质大学(武汉) | 一种基于季节性循环神经网络的空气质量预测方法 |
Non-Patent Citations (3)
Title |
---|
TÚLIO H. COSTA: "A safety engineering on the design of hemodialysis systems", 《2018 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS (ICCE)》 * |
李文宏 等: "不同血液净化模式对终末期糖尿病肾病患者胰岛素抵抗及微炎症状态的影响", 《山东医药》 * |
李玮 等: "血透信息化全流程再造方案设计", 《医学信息学杂志》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113436733B (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109805898B (zh) | 基于注意力机制时序卷积网络算法的危重症死亡预测方法 | |
EP3779994B1 (en) | Method of continuous prediction of patient severity of illness and mortality | |
CN111297329B (zh) | 预测糖尿病患者心血管并发症动态发病风险的方法及系统 | |
CN104484575A (zh) | 基于主成分分析的健康个性化改善方法 | |
CN114898873A (zh) | 一种糖尿病前期患者心血管疾病风险的预测方法及系统 | |
Kumar et al. | Hybrid Bijective soft set-Neural network for ECG arrhythmia classification | |
CN109166611A (zh) | 一种基于数据分析的睡眠按摩方法及系统 | |
CN113035319A (zh) | 糖尿病患者生活方式管理路径自动推荐方法及系统 | |
CN117894424B (zh) | 基于深度学习与强化学习构建t2dm患者药物方案的推荐系统 | |
Sharma et al. | Health Care Patient Monitoring using IoT and Machine Learning | |
CN113436733B (zh) | 一种基于融合经验的血透方案生成模型的特征构造方法 | |
Sushma et al. | Comparative Study of Naive Bayes, Gaussian Naive Bayes Classifier and Decision Tree Algorithms for Prediction of Heart Diseases | |
Oanh et al. | Predicting hypertension based on machine learning methods: A case study in northwest vietnam | |
CN115547502B (zh) | 基于时序数据的血透病人风险预测装置 | |
De Falco et al. | An Evolutionary Approach for Estimating the Blood Glucose by Exploiting Interstitial Glucose Measurements. | |
Gritsenko et al. | Current state and prospects for the development of digital medicine | |
Dogaru et al. | Big Data and Machine Learning Framework in Healthcare | |
EP2224363A2 (en) | Diagnostic support apparatus for diabetes and computer program product | |
Zhang et al. | Agent-based intelligent medical diagnosis system for patients | |
CN113990502A (zh) | 一种基于异构图神经网络的icu心衰预测系统 | |
Adawiyah et al. | Hospital Length of Stay Prediction based on Patient Examination Using General features | |
Haridas et al. | An Artificial Intelligence Approach for Predicting Different Types of Stroke | |
Gyuk et al. | Diabetes lifestyle support with improved glycemia prediction algorithm | |
JPH0644270A (ja) | フィットネス・プログラム選定装置 | |
Usha | An Exploiting Machine Learning Technique for Predicting Disease |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |