CN112037922A - 病理数据的分析方法、装置、计算机设备和存储介质 - Google Patents

病理数据的分析方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112037922A
CN112037922A CN202010941626.8A CN202010941626A CN112037922A CN 112037922 A CN112037922 A CN 112037922A CN 202010941626 A CN202010941626 A CN 202010941626A CN 112037922 A CN112037922 A CN 112037922A
Authority
CN
China
Prior art keywords
data
heart failure
feature data
feature
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010941626.8A
Other languages
English (en)
Inventor
贾文笑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010941626.8A priority Critical patent/CN112037922A/zh
Priority to PCT/CN2020/125152 priority patent/WO2021159761A1/zh
Publication of CN112037922A publication Critical patent/CN112037922A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请涉及数字医疗领域,提供一种病理数据的分析方法、装置、计算机设备和存储介质,方法包括:采集用户的病理数据;对病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据;获取与心衰发生风险相关的用户的结构化特征数据;对指定特征数据与结构化特征数据进行拼接处理,得到融合特征数据;将融合特征数据作为预设的注意力模块的输入,生成与融合特征数据中每一个融合特征一一对应的注意力权重,根据注意力权重对融合特征数据中每一个融合特征进行加权求和,得到输出结果;将输出结果输入至预设的分类模块,对输出结果进行归一化处理,生成与用户的心衰发生预测概率。本申请提高了预测用户心衰发生风险的处理效率与预测准确性。

Description

病理数据的分析方法、装置、计算机设备和存储介质
技术领域
本申请涉及数字医疗技术领域,具体涉及一种病理数据的分析方法、装置、计算机设备和存储介质。
背景技术
心力衰竭(heart failure)简称心衰,是指由于心脏的收缩功能和(或)舒张功能发生障碍,不能将静脉回心血量充分排出心脏,导致静脉系统血液淤积,动脉系统血液灌注不足,从而引起心脏循环障碍症候群,此种障碍症候群集中表现为肺淤血、腔静脉淤血。心衰并不是一个独立的疾病,而是心脏疾病发展的终末阶段,当治疗不当会影响健康甚至会威胁到生命。但如果能够及早发现到存在较大的心衰发生风险并及时采取有效的预防和治疗措施,这将对改善患者预后及病死率具有重要意义。然而,现有对于心衰发生的高风险人群的筛查仍基于传统的经验判断,通常是由医生通过用户的临床症状来进行相应的心衰发生风险的预测,这样的心衰发生风险的预测方式需要花费大量的时间去搜集和分析临床数据,耗时耗力,且必须依赖医生的个人经验,而不同医生之间的经验水平往往差距较大,从而导致对于心衰发生的预测准确性较低。
发明内容
本申请的主要目的为提供一种病理数据的分析方法、装置、计算机设备和存储介质,旨在解决现有的心衰发生风险的预测方式仍基于传统的经验判断,耗时耗力且预测准确性较低的技术问题。
本申请提出一种病理数据的分析方法,所述方法包括步骤:
采集用户的病理数据;
对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;
获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;
对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;
将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;
将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。
可选地,所述对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据的步骤,包括:
采用卷积神经网络对所述病理数据中的生理信号数据进行特征提取,得到与所述生理信号数据对应的生理信号特征数据;以及,
采用循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到对应的生命体征特征数据;以及,
采用中文自然语言处理技术对所述病理数据中的病例文本数据进行关键特征提取,得到对应的病例文本特征数据。
可选地,所述采用循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到对应的生命体征特征数据的步骤,包括:
采用所述循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到第一生命体征特征数据;
判断所述第一生命体征特征数据中是否存在缺失值;
若所述第一生命体征特征数据中存在缺失值,则获取所述第一生命体征特征数据中的数据缺失位置;
获取与指定数据缺失位置对应的上次特征观测值,以及获取所述第一生命体征特征数据的均值,其中,所述指定数据缺失位置为所有所述数据缺失位置的任意一个数据缺失位置;
根据所述上次特征观测值与所述均值,调用预设的计算公式计算出与所述指定数据缺失位置对应的指定填充值;使用所述指定填充值对所述指定数据缺失位置进行数据填充处理;
获取对所述第一生命体征特征数据中所有的数据缺失位置进行对应的数据填充处理后得到的第二生命体征特征数据;
将所述第二生命体征特征数据作为所述生命体征特征数据。
可选地,所述将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果的步骤之后,包括:
根据所述注意力权重,按照预设规则获取与每一类模态特征数据分别对应的重要性系数,其中,所述模态特征数据包括生理信号特征数据、生命体征特征数据、病例文本特征数据、实验室检查特征数据以及人口统计学特征数据;
将所有所述重要性系数按照数值从大到小的顺序进行排序,得到对应的排序结果;
根据所述排序结果,生成每一类所述模态特征数据对应于心衰发生风险的重要性预测报告;
展示所述重要性预测报告。
可选地,所述根据所述注意力权重,按照预设规则获取与每一类模态特征数据分别对应的重要性系数,其中,所述模态特征数据包括生理信号特征数据、生命体征特征数据、病例文本特征数据、实验室检查特征数据以及人口统计学特征数据的步骤,包括:
筛选出与每一个所述生理信号特征数据分别对应的第一注意力权重、与每一个所述生命体征特征数据分别对应的第二注意力权重、与每一个所述病例特征数据分别对应的第三注意力权重、与每一个所述实验室检查特征数据分别对应的第四注意力权重,以及与每一个所述人口统计学特征数据分别对应的第五注意力权重;
计算出所有所述第一注意力权重的第一平均值、所有所述第二注意力权重的第二平均值、所有所述第三注意力权重的第三平均值、所有所述第四注意力权重的第四平均值,以及所有所述第五注意力权重的第五平均值;
将所述第一平均值作为所述生理信号特征数据相对于心衰发生风险的第一重要性系数,将所述第二平均值作为所述生命体征特征数据相对于心衰发生风险的第二重要性系数,将所述第三平均值作为所述病例特征数据相对于心衰发生风险的第三重要性系数,将所述第四平均值作为所述实验室检查特征数据相对于心衰发生风险的第四重要性系数,以及将所述第五平均值作为所述人口统计学特征数据相对于心衰发生风险的第五重要性系数。
可选地,所述将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,得到与所述用户对应的心衰发生预测概率的步骤之后,包括:
获取预设的风险阈值;
判断所述心衰发生预测概率是否大于所述风险阈值;
若所述心衰发生预测概率大于所述风险阈值,则判定所述用户的心衰发生风险为高风险等级;
若所述心衰发生预测概率不大于所述风险阈值,判断所述心衰发生预测概率是否处于第一预设范围内;
若所述心衰发生预测概率处于第一预设范围内,则判定所述用户的心衰发生风险为中风险等级;
若所述心衰风险预测概率不处于第一预设范围内,则判定所述用户的心衰发生风险为低风险等级。
可选地,所述将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,得到对应的心衰风险预测概率的步骤之后,包括:
当所述用户的心衰发生风险为高风险等级状态或中风险等级状态时,生成预警信息,其中,所述预警信息包括所述心衰发生预测概率以及对应的风险等级信息;
获取与心衰预防相关的建议信息;以及,
获取所述用户的身份信息;
根据所述身份信息,将所述预警信息与所述建议信息发送至与所述身份信息对应的用户终端。
本申请还提供一种心衰发生风险预测装置,包括:
采集模块,用于采集用户的病理数据;
提取模块,用于对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;
第一获取模块,用于获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;
处理模块,用于对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;
第一生成模块,用于将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;
第二生成模块,用于将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中提供的病理数据的分析方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的病理数据的分析方法、装置、计算机设备和存储介质,本申请不再依据经验判断,而是会通过采集与心衰发生风险对应的多种模态的特征数据,并对所有模态的特征数据进行拼接处理。之后使用预设的注意力模块对拼接得到的融合特征数据进行处理,生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理来生成对应的注意力值,最后再使用预设的分类模块对该注意力值进行归一化处理,以生成与所述用户对应的心衰发生预测概率。本申请通过采集与心衰发生风险相关的用户的多种模态特征数据,并对该多种模态特征数据进行拼接处理,并基于注意力模块与分类模块对拼接处理后生成的融合特征数据进行数据分析处理,从而能够智能准确地生成用户的心衰发生预测概率,实现对于用户心衰发生风险的精准预测,有效地提高了预测用户心衰发生风险的处理效率。
附图说明
图1是本申请一实施例的病理数据的分析方法的流程示意图;
图2是本申请一实施例的心衰发生风险预测装置的结构示意图;
图3是本申请一实施例的计算机设备的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本方案可应用于智慧城市中的数字医疗领域,从而推动智慧城市的建设。
参照图1,本申请一实施例的病理数据的分析方法,包括:
S1:采集用户的病理数据;
S2:对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;
S3:获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;
S4:对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;
S5:将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;
S6:将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。
如上述步骤S1至S6所述,本方法实施例的执行主体为一种心衰发生风险预测装置。在实际应用中,上述心衰发生风险预测装置可以通过虚拟装置,例如软件代码实现,也可以通过写入或集成有相关执行代码的实体装置实现,且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。本实施例中的心衰发生风险预测装置能够智能准确地生成用户的心衰发生预测概率,实现对于用户心衰发生风险的精准预测,有效地提高了预测用户心衰发生风险的处理效率。具体地,首先采集用户的病理数据。其中,可以通过多个数据来源来采集用户在预设历史时间期间内的病理数据,对上述数据来源不作具体限定,例如可包括电子病历系统、用户的疾病拍摄或扫描文件,等等;以及对上述预设历史时间期间内不作具体限定,例如可为近两年。另外,上述病理数据至少可包括生理信号数据、生命体征数据与病例文本数据等数据。然后对上述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,上述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据。另外,对于不同模态的病理数据会对应采用不同的特征提取方式,具体的,可采用卷积神经网络提取出上述生理信号特征数据,采用循环神经网络提取出上述生命体征特征数据,以及采用中文自然语言处理技术提取出病例文本特征数据。此外,上述生理信号特征数据可包括心电特征数据等;上述生命体征数据可包括血压特征数据、心率特征数据与呼吸率特征数据等;上述病例文本特征数据包括与高血压、糖尿病、抗高血压治疗、家族病史、婚姻状况等相关联的特征数据。并获取与心衰发生风险相关的上述用户的结构化特征数据,其中,上述结构化特征数据包括实验室检查特征数据与人口统计学特征数据,上述实验室检查特征数据可包括血常规,尿常规等特征数据,上述人口统计学特征数据可包括年龄、性别和疾病史等特征数据。另外,由于上述结构化特征数据中的实验室检查特征数据与人口统计学特征数据属于不随时间变化的信息,因此可以直接提取得到该结构化特征数据,而无需经过特征提取的处理操作。上述病理数据还可包括用户实验室检查特征数据与人口统计学特征数据,从而可以直接从上述病理数据中获取上述结构化特征数据。之后对上述指定特征数据与上述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据。其中,可利用阶段集成学习算法来实现对于上述指定特征数据与上述结构化特征数据之间的数据拼接处理。在得到了上述融合特征数据后,再将上述融合特征数据作为预设的注意力模块的输入,通过上述注意力模块生成与上述融合特征数据中每一个融合特征一一对应的注意力权重,并根据上述注意力权重对上述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果。其中,计算注意力权重的过程包括:先计算融合特征数据中每一个融合特征的注意力得分,再使用softmax函数对每一个注意力得分进行数值转换,生成每一个融合特征的注意力权重,该注意力权重是指每个融合特征受关注程度的权重,且所有的注意力权重之和为1。具体地,可先通过公式ek,j=relu(Wahj+ba)计算出融合特征数据中每一个融合特征的注意力得分,ek,j为注意力得分,Wa与ba是模型的注意力层可学习的网络参数,hj为融合特征数据中的任意一个融合特征,relu为激活函数。在得到了注意力得分后,再通过公式
Figure BDA0002673843390000091
Figure BDA0002673843390000092
计算出与融合特征数据中每一个融合特征对应的注意力权重,即通过使用softmax函数对每一个ek,j进行归一化计算处理,以向每一个融合特征赋予对应的注意力权重,并得到所有注意力权重之和为1的注意力分布。另外,可通过公式
Figure BDA0002673843390000093
进行点乘处理,即根据注意力权重对融合特征数据中每一融合特征进行加权求和处理,生成与融合特征数据对应的Attention值,即上述输出结果。最后在得到了上述输出结果时候,将上述输出结果输入至预设的分类模块,通过上述分类模块对上述输出结果进行归一化处理,生成与上述用户对应的心衰发生预测概率。其中,可通过公式Oτ=sigmoid(WcC+bc),对注意力模块的输出结果进行归一化处理以生成最终的心衰发生预测概率。Oτ为心衰发生预测概率,且Oτ的范围在数值0~1之间,Wc与bc是分类模块可学习的网络参数,C为注意力模块的输出结果。本方案可应用于智慧城市中的数字医疗领域,从而推动智慧城市的建设。本申请通过采集与心衰发生风险相关的用户的多种模态特征数据,并对该多种模态特征数据进行拼接处理,并基于注意力模块与分类模块对拼接处理后生成的融合特征数据进行数据分析处理,从而能够智能准确地生成用户的心衰发生预测概率,实现对于用户心衰发生风险的精准预测,有效地提高了预测用户心衰发生风险的处理效率。
进一步地,上述注意力模块为训练生成的心衰发生风险预测模型中的注意力网络,上述分类模块为上述心衰发生风险预测模型中的分类器,且该心衰发生风险预测模型还可包括用于进行特征提取的特征提取网络。具体的,特征提取网络,以心衰患者数据的病理数据作为输入,经过特征提取处理后输出与心衰发生风险对应的特征数据。注意力网络,以与心衰发生风险对应的患者的特征数据及,与心衰发生风险对应的患者的结构化特征数据拼接起来得到的融合特征数据作为输入,输出注意力权重,并将融合特征数据与对应的注意力权重进行加权求和处理,得到输出结果,即注意力值。分类器,将注意力网络输出的注意力值作为输入,对该注意力值进行归一化处理,输出分类结果。通过获取采集预设数量的患者的病理数据作为训练样本,并将该训练样本作为初始模型中的输入层,以上述训练样本对应的真值标签作为初始模型的输出层,对上述初始模型进行训练,获得对应的特征提取模块、注意力模块与分类模块,从而最终生成上述心衰发生风险预测模型。其中,上述心衰发生风险预测模型的训练生成过程可参照现有的模型训练生成方式,在此不再赘述。另外,上述特征提取模块对应上述特征提取网络,上述注意力模块对应上述注意力网络,上述分类模块对应上述分类器。且上述训练样本还包括与心衰发生风险对应的结构化特征数据。
进一步地,本申请一实施例中,上述步骤S2,包括:
S200:采用卷积神经网络对所述病理数据中的生理信号数据进行特征提取,得到与所述生理信号数据对应的生理信号特征数据;以及,
S201:采用循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到对应的生命体征特征数据;以及,
S202:采用中文自然语言处理技术对所述病理数据中的病例文本数据进行关键特征提取,得到对应的病例文本特征数据。
如上述步骤S200至S202所述,对于病理数据中不同模态的数据,会对应使用相应的深度神经网络来对进行对于不同模态数据的特征提取,以提高对于病理数据的特征提取的准确性。上述对上述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据的步骤具体可包括:采用卷积神经网络对上述病理数据中的生理信号数据进行特征提取,得到与上述生理信号数据对应的生理信号特征数据。其中,对于生理信号数据,包括心电数据。由于生理信号数据属于高密度采样的时序波形数据,可通过使用卷积神经网络对该生理信号数据进行提取特征,并输出对应的生理信号特征数据。具体的,P=CNN(ECG),ECG代表用户的生理信号数据,例如心电数据,CNN代表卷积神经网络,P代表输出的与生理信号数据的对应的生理信号特征数据。以及同时采用循环神经网络对上述病理数据中的生命体征数据进行特征提取,得到对应的生命体征特征数据。其中,上述生命体征数据可包括血压、体温、呼吸等数据,由于生命体征数据属于低密度采样的不连续的波形数据,可通过循环神经网络对上述生命体征数据进行特征提取,并输出对应的生命体征特征数据。循环神经网络能够有效地考虑数据之间的时序依赖关系。具体的,Q=RNN(waveform),waveform代表用户的生命体征数据,RNN代表循环神经网络,例如可以包括LSTM或者GRU网络结构,Q代表输出的与生命体征数据对应的生命体征特征数据。以及同时采用中文自然语言处理(NLP)技术对上述病理数据中的病例文本数据进行关键特征提取,得到对应的病例文本特征数据。其中,对于文本数据,可以采用先进的NLP技术,根据预设的关键字信息,如包括高血压、糖尿病、抗高血压治疗、家族病史与婚姻状况等等,通过Embedding和RNN结合的方法自动抽取患者关键特征。具体的,V=Embedding(word),R=RNN(V),word代表用户的病例文本数据,Embedding代表词嵌入技术的处理,RNN代表循环神经网络,例如可以包括LSTM或者GRU网络结构。举例地,通过对上述生理信号特征数据P、生命体征特征数据Q以及病例文本特征数据R进行拼接处理,可得到相应的融合特征数据为:S=[P,Q,R]。本实施例根据病理数据中不同模态数据的数据特性,会对应使用相应的深度神经网络来对进行对于不同模态数据的特征提取,进而能够准确快捷地从病理数据中提取出所需的指定特征数据,使得后续能够根据该指定特征数据来准确快捷地进行对于用户的心衰发生风险的预测。
进一步地,本申请一实施例中,上述步骤S201,包括:
S2010:采用所述循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到第一生命体征特征数据;
S2011:判断所述第一生命体征特征数据中是否存在缺失值;
S2012:若所述第一生命体征特征数据中存在缺失值,则获取所述第一生命体征特征数据中的数据缺失位置;
S2013:获取与指定数据缺失位置对应的上次特征观测值,以及获取所述第一生命体征特征数据的均值,其中,所述指定数据缺失位置为所有所述数据缺失位置的任意一个数据缺失位置;
S2014:根据所述上次特征观测值与所述均值,调用预设的计算公式计算出与所述指定数据缺失位置对应的指定填充值;S2015:使用所述指定填充值对所述指定数据缺失位置进行数据填充处理;
S2016:获取对所述第一生命体征特征数据中所有的数据缺失位置进行对应的数据填充处理后得到的第二生命体征特征数据;
S2017:将所述第二生命体征特征数据作为所述生命体征特征数据。
如上述步骤S2010至S2017所述,在采用循环神经网络提取出生命体征特征数据后,后续还可对生命体征特征数据中出现的缺失数据进行填充处理,以实现对于生命体征特征数据的数据完善处理。具体地,上述采用循环神经网络对上述病理数据中的生命体征数据进行特征提取,得到对应的生命体征特征数据的步骤,包括:首先采用上述循环神经网络对上述病理数据中的生命体征数据进行特征提取,得到第一生命体征特征数据。然后判断上述第一生命体征特征数据中是否存在缺失值。如果上述第一生命体征特征数据中存在缺失值,则获取上述第一生命体征特征数据中的数据缺失位置。然后获取与指定数据缺失位置对应的上次特征观测值,以及获取上述第一生命体征特征数据的均值,其中,上述指定数据缺失位置为所有上述数据缺失位置的任意一个数据缺失位置。之后根据上述上次特征观测值与上述均值,调用预设的计算公式计算出与上述指定数据缺失位置对应的指定填充值。具体的,可通过计算公式
Figure BDA0002673843390000131
Figure BDA0002673843390000132
计算出上述指定填充值,其中,
Figure BDA0002673843390000133
是需要填充的缺失值,即上述指定填充值,
Figure BDA0002673843390000134
为与上述指定数据缺失位置对应的上次特征观测值,x’d为上述第一生命体征特征数据的均值(也可称为经验均值),
Figure BDA0002673843390000135
为掩码矩阵,表示当前的数据变量是否有被观测到,如果被观测到则值取1,如果未被观测到则值取0。举例地,如果在某个时刻,第d个数据变量被观测到,那么这个时刻这个变量等于这个观测值,而如果没有观测到,则表示为缺失数据或缺失值。
Figure BDA0002673843390000136
为与指定数据缺失位置对应的指定时间衰减因子,可通过公式Υt=exp(-max(0,Wγδt+bΥ))来求取时间衰减因子,其中,Υt为与循环神经网络对应的时间衰减因子,WΥ与bΥ为循环神经网络可学习的网络参数,δt为数据缺失位置距离上次观测值之间的时间间隔,且Υt最终会归一到数值0~1的范围内。另外,上述与指定数据缺失位置对应的指定填充值需要在上次特征观测值和均值之间平衡。通过加入时间衰减因子计算指定填充值时,如果指定数据缺失位置距离上次特征观测值越远,则均值的权重会更大一些;而如果指定数据缺失位置距离上次特征观测值比较近,那么上次特征观测值的权重会更大一些。在得到了上述指定填充值后,再使用上述指定填充值对上述指定数据缺失位置进行数据填充处理。之后获取对上述第一生命体征特征数据中所有的数据缺失位置进行对应的数据填充处理后得到的第二生命体征特征数据。最后在生成了上述第二生命体征特征数据后,再将上述第二生命体征特征数据作为上述生命体征特征数据。本实施例通过对生命体征特征数据中的确实值进行数据填充处理,实现了对于生命体征特征数据的数据完善处理,进而在后续能够基于经过数据完善处理后的生命体征特征数来进行对于用户的心衰发生风险的预测,有效地提高了后续生成的心衰发生预测概率的准确性。
进一步地,本申请一实施例中,上述步骤S5之后,包括:
S500:根据所述注意力权重,按照预设规则获取与每一类模态特征数据分别对应的重要性系数,其中,所述模态特征数据包括生理信号特征数据、生命体征特征数据、病例文本特征数据、实验室检查特征数据以及人口统计学特征数据;
S501:将所有所述重要性系数按照数值从大到小的顺序进行排序,得到对应的排序结果;
S502:根据所述排序结果,生成每一类所述模态特征数据对应于心衰发生风险的重要性预测报告;
S503:展示所述重要性预测报告。
如上述步骤S500至S503所述,在生成了与融合特征数据中每一个融合特征一一对应的注意力权重后,后续可以根据该注意力权重来智能地生成每一类模态特征数据对应于心衰发生风险的重要性预测结果。具体地,上述将上述融合特征数据作为预设的注意力模块的输入,通过上述注意力模块生成与上述融合特征数据中每一个融合特征一一对应的注意力权重,并根据上述注意力权重对上述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果的步骤之后包括:首先根据上述注意力权重,按照预设规则获取每一类模态特征数据的重要性系数,其中,上述模态特征数据包括生理信号特征数据、生命体征特征数据、病例文本特征数据、实验室检查特征数据以及人口统计学特征数据。另外,上述预设规则可指通过计算每一类模态特征数据对应的所有注意力权重的平均值,来得到与每一类模态特征数据分别对应的重要性系数。在得到了上述重要性系数后,再将所有上述重要性系数按照数值从大到小的顺序进行排序,得到对应的排序结果。然后根据上述排序结果,生成每一类模态特征数据对应于心衰发生风险的重要性预测报告。最后在得到了上述重要性预测报告时,再展示上述重要性预测报告。本实施例在获得了与每一类模态特征数据分别对应的重要性系数后,通过使用该重要性系数对每一类模态特征数据进行重要性排序后,从而可以直观清楚地了解到每一类模态特征数据与心衰发生风险的重要性结果,进而能够从所有模态特征数据中快速筛选出影响心衰发生风险的高价值,即重要性较高的目标模态特征数据,并可对目标模态特征数据投入更多的注意力资源。另外,如果存在某些模态特征数据对于心衰发生风险的重要性程度极低(如重要性参数小于某一预设阈值),则可以降低地这些无关信息的关注度,甚至过滤掉一部分无关信息,从而可以解决信息过载问题,提高后续求取用户对应的心衰发生预测概率的生成效率和预测准确性。
进一步地,本申请一实施例中,上述步骤S500,包括:
S5000:筛选出与每一个所述生理信号特征数据分别对应的第一注意力权重、与每一个所述生命体征特征数据分别对应的第二注意力权重、与每一个所述病例特征数据分别对应的第三注意力权重、与每一个所述实验室检查特征数据分别对应的第四注意力权重,以及与每一个所述人口统计学特征数据分别对应的第五注意力权重;
S5001:计算出所有所述第一注意力权重的第一平均值、所有所述第二注意力权重的第二平均值、所有所述第三注意力权重的第三平均值、所有所述第四注意力权重的第四平均值,以及所有所述第五注意力权重的第五平均值;
S5002:将所述第一平均值作为所述生理信号特征数据相对于心衰发生风险的第一重要性系数,将所述第二平均值作为所述生命体征特征数据相对于心衰发生风险的第二重要性系数,将所述第三平均值作为所述病例特征数据相对于心衰发生风险的第三重要性系数,将所述第四平均值作为所述实验室检查特征数据相对于心衰发生风险的第四重要性系数,以及将所述第五平均值作为所述人口统计学特征数据相对于心衰发生风险的第五重要性系数。
如上述步骤S5000至S5002所述,上述根据上述注意力权重,按照预设规则获取与每一类模态特征数据分别对应的重要性系数的步骤,具体可包括:首先筛选出与每一个上述生理信号特征数据分别对应的第一注意力权重、与每一个上述生命体征特征数据分别对应的第二注意力权重、与每一个上述病例特征数据分别对应的第三注意力权重、与每一个上述实验室检查特征数据分别对应的第四注意力权重,以及与每一个上述人口统计学特征数据分别对应的第五注意力权重。然后计算出所有上述第一注意力权重的第一平均值、所有上述第二注意力权重的第二平均值、所有上述第三注意力权重的第三平均值、所有上述第四注意力权重的第四平均值,以及所有上述第五注意力权重的第五平均值。最后将上述第一平均值作为上述生理信号特征数据相对于心衰发生风险的第一重要性系数,将上述第二平均值作为上述生命体征特征数据相对于心衰发生风险的第二重要性系数,将上述第三平均值作为上述病例特征数据相对于心衰发生风险的第三重要性系数,将上述第四平均值作为上述实验室检查特征数据相对于心衰发生风险的第四重要性系数,以及将上述第五平均值作为上述人口统计学特征数据相对于心衰发生风险的第五重要性系数。本实施例通过计算每一类模态特征数据包含的所有的注意力权重的平均值,能够智能快速地计算出每一类模态特征数据分别对应的重要性系数,有利于后续根据该重要性参数来智能快速地得到每一类模态特征数据对应于心衰发生风险的重要性程度,并可根据该重要性程度来从所有模态特征数据中快速筛选出影响心衰发生风险的高价值,即重要性较高的目标模态特征数据,从而可以对目标模态特征数据投入更多的注意力资源。
进一步地,本申请一实施例中,上述步骤S6之后,包括:
S600:获取预设的风险阈值;
S601:判断所述心衰发生预测概率是否大于所述风险阈值;
S602:若所述心衰发生预测概率大于所述风险阈值,则判定所述用户的心衰发生风险为高风险等级;
S603:若所述心衰发生预测概率不大于所述风险阈值,判断所述心衰发生预测概率是否处于第一预设范围内;
S604:若所述心衰发生预测概率处于第一预设范围内,则判定所述用户的心衰发生风险为中风险等级;
S605:若所述心衰风险预测概率不处于第一预设范围内,则判定所述用户的心衰发生风险为低风险等级。
如上述步骤S600至S605所述,在生成了与用户对应的心衰发生预测概率后,后续可根据该心衰发生预测概率来智能地生成相应的风险等级。具体地,上述将上述输出结果输入至预设的分类模块,通过上述分类模块对上述输出结果进行归一化处理,得到与上述用户对应的心衰发生预测概率的步骤之后,包括:首先获取预设的风险阈值。其中,对于上述风险阈值不作具体限定,可根据实际需求进行设置,例如可设置为0.8。然后判断上述心衰发生预测概率是否大于上述风险阈值。如果上述心衰发生预测概率大于上述风险阈值,则判定上述用户的心衰发生风险处于高风险等级,高风险等级代表用户的心衰发生风险至少大于平均风险的2倍。而如果上述心衰发生预测概率不大于上述风险阈值,判断上述心衰发生预测概率是否处于第一预设范围内。其中,对于上述第一预设范围不作具体限定,可根据实际需求进行设置,例如可设置为0.5-0.8。如果上述心衰发生预测概率处于第一预设范围内,则判定上述用户的心衰发生风险处于中风险等级。中风险等级代表用户的心衰发生风险略高于平均风险。而如果上述心衰发生预测概率不处于第一预设范围内,则判定上述用户的心衰发生风险处于低风险等级。低风险等级代表用户的心衰发生风险接近或低于平均风险。另外,还可以采用红、黄、绿三种颜色对上述的风险等级进行可视化显示,红色代表高风险等级、黄色代表中风险等级、绿色代表低风险等级。本实施例通过将上述心衰发生预测概率转化为对应的风险等级,从而能够智能地让用户更加直观地了解到当前的心衰发生风险的风险程度,以便后续能够智能快捷地采取相对应的预防处理措施。
进一步地,本申请一实施例中,上述步骤S6之后,包括:
S610:当所述用户的心衰发生风险为高风险等级状态或中风险等级状态时,生成预警信息,其中,所述预警信息包括所述心衰发生预测概率以及对应的风险等级信息;
S611:获取与心衰预防相关的建议信息;以及,
S612:获取所述用户的身份信息;
S613:根据所述身份信息,将所述预警信息与所述建议信息发送至与所述身份信息对应的用户终端。
如上述步骤S610至S613所述,在生成了与用户对应的心衰发生预测概率后,如果用户心衰发生风险处于高风险等级或中风险等级时,则后续可智能地为用户推送对应的预警信息与建议信息。具体地,上述将上述输出结果输入至预设的分类模块,通过上述分类模块对上述输出结果进行归一化处理,得到对应的心衰风险预测概率的步骤之后,包括:当上述用户的心衰发生风险为高风险等级状态或中风险等级状态时,生成预警信息,其中,上述预警信息包括上述心衰发生预测概率以及对应的风险等级信息。然后获取与心衰预防相关的建议信息。之后获取上述用户的身份信息。最后在获取了上述身份信息后,再根据上述身份信息,将上述预警信息与上述建议信息发送至与上述身份信息对应的用户终端。本实施例通过智能地将与用户相关的预警信息及建议信息发送至用户相关的用户终端,有利于用户能够及时了解自身的心衰病发的风险,并为用户提供相应的心衰预防的建议信息,提高了用户使用体验。
本申请实施例中的病理数据的分析方法还可以应用于区块链领域,如将上述心衰发生预测概率等数据存储于区块链上。通过使用区块链来对上述心衰发生预测概率进行存储和管理,能够有效地保证上述心衰发生预测概率的安全性与不可篡改性。
上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
参照图2,本申请一实施例中还提供了一种心衰发生风险预测装置,包括:
采集模块1,用于采集用户的病理数据;
提取模块2,用于对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;
第一获取模块3,用于获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;
处理模块4,用于对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;
第一生成模块5,用于将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;
第二生成模块6,用于将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。
本实施例中,上述心衰发生风险预测装置中的采集模块、提取模块、第一获取模块、处理模块、第一生成模块与第二生成模块的功能和作用的实现过程具体详见上述病理数据的分析方法中对应步骤S1至S6的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述提取模块,包括:
第一提取子模块,用于采用卷积神经网络对所述病理数据中的生理信号数据进行特征提取,得到与所述生理信号数据对应的生理信号特征数据;以及,
第二提取子模块,用于采用循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到对应的生命体征特征数据;以及,
第三提取子模块,用于采用中文自然语言处理技术对所述病理数据中的病例文本数据进行关键特征提取,得到对应的病例文本特征数据。
本实施例中,上述心衰发生风险预测装置中的第一提取子模块、第二提取子模块与第三提取子模块的功能和作用的实现过程具体详见上述病理数据的分析方法中对应步骤S200至S202的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第二提取子模块,包括:
提取单元,用于采用所述循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到第一生命体征特征数据;
判断单元,用于判断所述第一生命体征特征数据中是否存在缺失值;
第一获取单元,用于若所述第一生命体征特征数据中存在缺失值,则获取所述第一生命体征特征数据中的数据缺失位置;
第二获取单元,用于获取与指定数据缺失位置对应的上次特征观测值,以及获取所述第一生命体征特征数据的均值,其中,所述指定数据缺失位置为所有所述数据缺失位置的任意一个数据缺失位置;
计算单元,用于根据所述上次特征观测值与所述均值,调用预设的计算公式计算出与所述指定数据缺失位置对应的指定填充值;填充单元,用于使用所述指定填充值对所述指定数据缺失位置进行数据填充处理;
第三获取单元,用于获取对所述第一生命体征特征数据中所有的数据缺失位置进行对应的数据填充处理后得到的第二生命体征特征数据;
确定单元,用于将所述第二生命体征特征数据作为所述生命体征特征数据。
本实施例中,上述心衰发生风险预测装置中的提取单元、判断单元、第一获取单元、第二获取单元、计算单元、填充单元、第三获取单元与确定单元的功能和作用的实现过程具体详见上述病理数据的分析方法中对应步骤S2010至S2017的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述病理数据的分析装置,包括:
第二获取模块,用于根据所述注意力权重,按照预设规则获取与每一类模态特征数据分别对应的重要性系数,其中,所述模态特征数据包括生理信号特征数据、生命体征特征数据、病例文本特征数据、实验室检查特征数据以及人口统计学特征数据;
排序模块,用于将所有所述重要性系数按照数值从大到小的顺序进行排序,得到对应的排序结果;
第三生成模块,用于根据所述排序结果,生成每一类所述模态特征数据对应于心衰发生风险的重要性预测报告;
展示模块,用于展示所述重要性预测报告。
本实施例中,上述病理数据的分析装置中的第二获取模块、排序模块、第三生成模块与展示模块的功能和作用的实现过程具体详见上述病理数据的分析方法中对应步骤S500至S503的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第二获取模块,包括:
筛选子模块,用于筛选出与每一个所述生理信号特征数据分别对应的第一注意力权重、与每一个所述生命体征特征数据分别对应的第二注意力权重、与每一个所述病例特征数据分别对应的第三注意力权重、与每一个所述实验室检查特征数据分别对应的第四注意力权重,以及与每一个所述人口统计学特征数据分别对应的第五注意力权重;
计算子模块,用于计算出所有所述第一注意力权重的第一平均值、所有所述第二注意力权重的第二平均值、所有所述第三注意力权重的第三平均值、所有所述第四注意力权重的第四平均值,以及所有所述第五注意力权重的第五平均值;
确定子模块,用于将所述第一平均值作为所述生理信号特征数据相对于心衰发生风险的第一重要性系数,将所述第二平均值作为所述生命体征特征数据相对于心衰发生风险的第二重要性系数,将所述第三平均值作为所述病例特征数据相对于心衰发生风险的第三重要性系数,将所述第四平均值作为所述实验室检查特征数据相对于心衰发生风险的第四重要性系数,以及将所述第五平均值作为所述人口统计学特征数据相对于心衰发生风险的第五重要性系数。
本实施例中,上述病理数据的分析装置中的筛选子模块、计算子模块与确定子模块的功能和作用的实现过程具体详见上述病理数据的分析方法中对应步骤S5000至S5002的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述病理数据的分析装置,包括:
第三获取模块,用于获取预设的风险阈值;
第一判断模块,用于判断所述心衰发生预测概率是否大于所述风险阈值;
第一判定模块,用于若所述心衰发生预测概率大于所述风险阈值,则判定所述用户的心衰发生风险为高风险等级;
第二判断模块,用于若所述心衰发生预测概率不大于所述风险阈值,判断所述心衰发生预测概率是否处于第一预设范围内;
第二判定模块,用于若所述心衰发生预测概率处于第一预设范围内,则判定所述用户的心衰发生风险为中风险等级;
第三判定模块,用于若所述心衰风险预测概率不处于第一预设范围内,则判定所述用户的心衰发生风险为低风险等级。
本实施例中,上述病理数据的分析装置中的第三获取模块、第一判断模块、第一判定模块、第二判断模块、第二判定模块与第三判定模块的功能和作用的实现过程具体详见上述病理数据的分析方法中对应步骤S600至S605的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述病理数据的分析装置,包括:
第三生成模块,用于当所述用户的心衰发生风险为高风险等级状态或中风险等级状态时,生成预警信息,其中,所述预警信息包括所述心衰发生预测概率以及对应的风险等级信息;
第四获取模块,用于获取与心衰预防相关的建议信息;以及,
第五获取模块,用于获取所述用户的身份信息;
发送模块,用于根据所述身份信息,将所述预警信息与所述建议信息发送至与所述身份信息对应的用户终端。
本实施例中,上述病理数据的分析装置中的第三生成模块、第四获取模块、第五获取模块与发送模块的功能和作用的实现过程具体详见上述病理数据的分析方法中对应步骤S610至S613的实现过程,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中,该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储指定特征数据、结构化特征数据、融合特征数据、注意力权重、输出结果以及心衰发生预测概率等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备,用于将数字信号转换为光信号,使文字与图形在显示屏的屏幕上显示出来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置,用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种病理数据的分析方法。
上述处理器执行上述病理数据的分析方法的步骤:
采集用户的病理数据;
对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;
获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;
对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;
将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;
将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的装置、计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种病理数据的分析方法,具体为:
采集用户的病理数据;
对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;
获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;
对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;
将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;
将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。
综上所述,本申请实施例中提供的病理数据的分析方法、装置、计算机设备和存储介质,采集用户的病理数据;对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。本方案可应用于智慧城市中的数字医疗领域,从而推动智慧城市的建设。本申请实施例通过采集与心衰发生风险相关的用户的多种模态特征数据,并对该多种模态特征数据进行拼接处理,并基于注意力模块与分类模块对拼接处理后生成的融合特征数据进行数据分析处理,从而能够智能准确地生成用户的心衰发生预测概率,实现对于用户心衰发生风险的精准预测,有效地提高了预测用户心衰发生风险的处理效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种病理数据的分析方法,其特征在于,包括:
采集用户的病理数据;
对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;
获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;
对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;
将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;
将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。
2.根据权利要求1所述的病理数据的分析方法,其特征在于,所述对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据的步骤,包括:
采用卷积神经网络对所述病理数据中的生理信号数据进行特征提取,得到与所述生理信号数据对应的生理信号特征数据;以及,
采用循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到对应的生命体征特征数据;以及,
采用中文自然语言处理技术对所述病理数据中的病例文本数据进行关键特征提取,得到对应的病例文本特征数据。
3.根据权利要求2所述的病理数据的分析方法,其特征在于,所述采用循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到对应的生命体征特征数据的步骤,包括:
采用所述循环神经网络对所述病理数据中的生命体征数据进行特征提取,得到第一生命体征特征数据;
判断所述第一生命体征特征数据中是否存在缺失值;
若所述第一生命体征特征数据中存在缺失值,则获取所述第一生命体征特征数据中的数据缺失位置;
获取与指定数据缺失位置对应的上次特征观测值,以及获取所述第一生命体征特征数据的均值,其中,所述指定数据缺失位置为所有所述数据缺失位置的任意一个数据缺失位置;
根据所述上次特征观测值与所述均值,调用预设的计算公式计算出与所述指定数据缺失位置对应的指定填充值;使用所述指定填充值对所述指定数据缺失位置进行数据填充处理;
获取对所述第一生命体征特征数据中所有的数据缺失位置进行对应的数据填充处理后得到的第二生命体征特征数据;
将所述第二生命体征特征数据作为所述生命体征特征数据。
4.根据权利要求1所述的病理数据的分析方法,其特征在于,所述将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果的步骤之后,包括:
根据所述注意力权重,按照预设规则获取与每一类模态特征数据分别对应的重要性系数,其中,所述模态特征数据包括生理信号特征数据、生命体征特征数据、病例文本特征数据、实验室检查特征数据以及人口统计学特征数据;
将所有所述重要性系数按照数值从大到小的顺序进行排序,得到对应的排序结果;
根据所述排序结果,生成每一类所述模态特征数据对应于心衰发生风险的重要性预测报告;
展示所述重要性预测报告。
5.根据权利要求4所述的病理数据的分析方法,其特征在于,所述根据所述注意力权重,按照预设规则获取与每一类模态特征数据分别对应的重要性系数,其中,所述模态特征数据包括生理信号特征数据、生命体征特征数据、病例文本特征数据、实验室检查特征数据以及人口统计学特征数据的步骤,包括:
筛选出与每一个所述生理信号特征数据分别对应的第一注意力权重、与每一个所述生命体征特征数据分别对应的第二注意力权重、与每一个所述病例特征数据分别对应的第三注意力权重、与每一个所述实验室检查特征数据分别对应的第四注意力权重,以及与每一个所述人口统计学特征数据分别对应的第五注意力权重;
计算出所有所述第一注意力权重的第一平均值、所有所述第二注意力权重的第二平均值、所有所述第三注意力权重的第三平均值、所有所述第四注意力权重的第四平均值,以及所有所述第五注意力权重的第五平均值;
将所述第一平均值作为所述生理信号特征数据相对于心衰发生风险的第一重要性系数,将所述第二平均值作为所述生命体征特征数据相对于心衰发生风险的第二重要性系数,将所述第三平均值作为所述病例特征数据相对于心衰发生风险的第三重要性系数,将所述第四平均值作为所述实验室检查特征数据相对于心衰发生风险的第四重要性系数,以及将所述第五平均值作为所述人口统计学特征数据相对于心衰发生风险的第五重要性系数。
6.根据权利要求1所述的病理数据的分析方法,其特征在于,所述将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,得到与所述用户对应的心衰发生预测概率的步骤之后,包括:
获取预设的风险阈值;
判断所述心衰发生预测概率是否大于所述风险阈值;
若所述心衰发生预测概率大于所述风险阈值,则判定所述用户的心衰发生风险为高风险等级;
若所述心衰发生预测概率不大于所述风险阈值,判断所述心衰发生预测概率是否处于第一预设范围内;
若所述心衰发生预测概率处于第一预设范围内,则判定所述用户的心衰发生风险为中风险等级;
若所述心衰风险预测概率不处于第一预设范围内,则判定所述用户的心衰发生风险为低风险等级。
7.根据权利要求6所述的病理数据的分析方法,其特征在于,所述将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,得到对应的心衰风险预测概率的步骤之后,包括:
当所述用户的心衰发生风险为高风险等级状态或中风险等级状态时,生成预警信息,其中,所述预警信息包括所述心衰发生预测概率以及对应的风险等级信息;
获取与心衰预防相关的建议信息;以及,
获取所述用户的身份信息;
根据所述身份信息,将所述预警信息与所述建议信息发送至与所述身份信息对应的用户终端。
8.一种心衰发生风险预测装置,其特征在于,包括:
采集模块,用于采集用户的病理数据;
提取模块,用于对所述病理数据进行特征提取,得到与心衰发生风险相关的指定特征数据,其中,所述指定特征数据包括生理信号特征数据、生命体征特征数据以及病例文本特征数据;
第一获取模块,用于获取与心衰发生风险相关的所述用户的结构化特征数据,其中,所述结构化特征数据包括实验室检查特征数据与人口统计学特征数据;
处理模块,用于对所述指定特征数据与所述结构化特征数据进行拼接处理,得到拼接处理后的融合特征数据;
第一生成模块,用于将所述融合特征数据作为预设的注意力模块的输入,通过所述注意力模块生成与所述融合特征数据中每一个融合特征一一对应的注意力权重,并根据所述注意力权重对所述融合特征数据中每一个融合特征进行加权求和处理,得到对应的输出结果;
第二生成模块,用于将所述输出结果输入至预设的分类模块,通过所述分类模块对所述输出结果进行归一化处理,生成与所述用户对应的心衰发生预测概率。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010941626.8A 2020-09-09 2020-09-09 病理数据的分析方法、装置、计算机设备和存储介质 Pending CN112037922A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010941626.8A CN112037922A (zh) 2020-09-09 2020-09-09 病理数据的分析方法、装置、计算机设备和存储介质
PCT/CN2020/125152 WO2021159761A1 (zh) 2020-09-09 2020-10-30 病理数据的分析方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010941626.8A CN112037922A (zh) 2020-09-09 2020-09-09 病理数据的分析方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112037922A true CN112037922A (zh) 2020-12-04

Family

ID=73585157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010941626.8A Pending CN112037922A (zh) 2020-09-09 2020-09-09 病理数据的分析方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN112037922A (zh)
WO (1) WO2021159761A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113133767A (zh) * 2021-03-22 2021-07-20 浙江工业大学 一种结合波段提取和多特征融合的心电信号分类方法
CN113362953A (zh) * 2021-06-23 2021-09-07 平安国际智慧城市科技股份有限公司 身体风险预测方法、装置、计算机设备及存储介质
CN113349793A (zh) * 2021-03-30 2021-09-07 北京芯动卫士科技有限公司 一种基于分层注意力模型的心律失常分类方法
CN113470827A (zh) * 2021-06-30 2021-10-01 上海商汤智能科技有限公司 分类方法及装置、电子设备和存储介质
CN114067935A (zh) * 2021-11-03 2022-02-18 广西壮族自治区通信产业服务有限公司技术服务分公司 一种流行病调查方法、系统、电子设备及存储介质
CN115641932A (zh) * 2022-12-05 2023-01-24 北京百奥知医药科技有限公司 一种多源病例数据处理方法及装置
CN117095811A (zh) * 2023-08-04 2023-11-21 牛津大学(苏州)科技有限公司 基于电子医疗病例数据的预测方法、装置及存储介质
WO2024197627A1 (zh) * 2023-03-29 2024-10-03 深圳珞迦云脉医疗科技有限公司 心衰预警方法、装置、计算机设备和存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117238460A (zh) * 2023-09-18 2023-12-15 四川互慧软件有限公司 一种基于护理晨交班数据的病情监测方法和系统
CN117852324B (zh) * 2024-03-08 2024-05-10 云南云金地科技有限公司 一种基于数据孪生的场景构建方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109313732A (zh) * 2016-07-22 2019-02-05 爱德华兹生命科学公司 预测风险模型优化
CN110119775A (zh) * 2019-05-08 2019-08-13 腾讯科技(深圳)有限公司 医疗数据处理方法、装置、系统、设备和存储介质
CN111009327A (zh) * 2019-12-19 2020-04-14 京东方科技集团股份有限公司 一种风险预测方法、装置及系统、介质
US20200160998A1 (en) * 2018-11-21 2020-05-21 The Regents Of The University Of Michigan Predicting Intensive Care Transfers And Other Unforeseen Events Using Machine Learning
CN111292853A (zh) * 2020-01-15 2020-06-16 长春理工大学 基于多参数的心血管疾病风险预测网络模型及其构建方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12076119B2 (en) * 2018-04-26 2024-09-03 Vektor Medical, Inc. Bootstrapping a simulation-based electromagnetic output of a different anatomy
CN109192312B (zh) * 2018-08-20 2021-03-09 中国人民解放军总医院 一种心力衰竭患者不良事件智能管理系统及方法
CN110197724A (zh) * 2019-03-12 2019-09-03 平安科技(深圳)有限公司 预测糖尿病患病阶段的方法、装置及计算机设备
CN110874409A (zh) * 2019-10-22 2020-03-10 清华大学 病情分级预测系统、方法、电子设备及可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109313732A (zh) * 2016-07-22 2019-02-05 爱德华兹生命科学公司 预测风险模型优化
US20200160998A1 (en) * 2018-11-21 2020-05-21 The Regents Of The University Of Michigan Predicting Intensive Care Transfers And Other Unforeseen Events Using Machine Learning
CN110119775A (zh) * 2019-05-08 2019-08-13 腾讯科技(深圳)有限公司 医疗数据处理方法、装置、系统、设备和存储介质
CN111009327A (zh) * 2019-12-19 2020-04-14 京东方科技集团股份有限公司 一种风险预测方法、装置及系统、介质
CN111292853A (zh) * 2020-01-15 2020-06-16 长春理工大学 基于多参数的心血管疾病风险预测网络模型及其构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐子惠: "《医学人工智能导论》", 上海科学技术出版社, pages: 370 - 371 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113133767A (zh) * 2021-03-22 2021-07-20 浙江工业大学 一种结合波段提取和多特征融合的心电信号分类方法
CN113349793A (zh) * 2021-03-30 2021-09-07 北京芯动卫士科技有限公司 一种基于分层注意力模型的心律失常分类方法
CN113362953A (zh) * 2021-06-23 2021-09-07 平安国际智慧城市科技股份有限公司 身体风险预测方法、装置、计算机设备及存储介质
CN113470827A (zh) * 2021-06-30 2021-10-01 上海商汤智能科技有限公司 分类方法及装置、电子设备和存储介质
CN114067935A (zh) * 2021-11-03 2022-02-18 广西壮族自治区通信产业服务有限公司技术服务分公司 一种流行病调查方法、系统、电子设备及存储介质
CN114067935B (zh) * 2021-11-03 2022-05-20 广西壮族自治区通信产业服务有限公司技术服务分公司 一种流行病调查方法、系统、电子设备及存储介质
CN115641932A (zh) * 2022-12-05 2023-01-24 北京百奥知医药科技有限公司 一种多源病例数据处理方法及装置
WO2024197627A1 (zh) * 2023-03-29 2024-10-03 深圳珞迦云脉医疗科技有限公司 心衰预警方法、装置、计算机设备和存储介质
CN117095811A (zh) * 2023-08-04 2023-11-21 牛津大学(苏州)科技有限公司 基于电子医疗病例数据的预测方法、装置及存储介质
CN117095811B (zh) * 2023-08-04 2024-04-19 牛津大学(苏州)科技有限公司 基于电子医疗病例数据的预测方法、装置及存储介质

Also Published As

Publication number Publication date
WO2021159761A1 (zh) 2021-08-19

Similar Documents

Publication Publication Date Title
CN112037922A (zh) 病理数据的分析方法、装置、计算机设备和存储介质
CN110459324B (zh) 基于长短期记忆模型的疾病预测方法、装置和计算机设备
ȚĂRANU Data mining in healthcare: decision making and precision.
CN112908473B (zh) 基于模型的数据处理方法、装置、计算机设备和存储介质
WO2021151327A1 (zh) 分诊数据处理方法、装置、设备及介质
CN108305690A (zh) 神经系统疾病分诊方法及神经系统疾病的分诊系统
US20180211727A1 (en) Automated Evidence Based Identification of Medical Conditions and Evaluation of Health and Financial Benefits Of Health Management Intervention Programs
CN112117002A (zh) 结合虚拟现实技术的新型智能化心理评估干预系统、方法
CN113990482A (zh) 健康数据处理系统及方法
CN118280562B (zh) 知识图谱驱动的医疗大模型诊断方法
CN110111885A (zh) 属性预测方法、装置、计算机设备及计算机可读存储介质
CN113889262A (zh) 基于模型的数据预测方法、装置、计算机设备和存储介质
CN108937967A (zh) 一种基于vr技术的心理学记忆数据提升检测方法及系统
CN115116608A (zh) 疾病预测方法、装置、存储介质、设备及程序产品
Mandava MDensNet201-IDRSRNet: Efficient cardiovascular disease prediction system using hybrid deep learning
CN114550896A (zh) 基于人工神经网络的头晕患者急诊预检分诊决策方法、装置及模型
CN114203306A (zh) 医疗事件预测模型训练方法、医疗事件预测方法及装置
CN116344042B (zh) 基于多模态分析的认知储备干预提升方法及系统
CN113066531A (zh) 风险预测方法、装置、计算机设备及存储介质
CN117457185A (zh) 疾病预测方法、装置、设备及存储介质
Santos et al. Enabling ubiquitous data mining in intensive care-features selection and data pre-processing
Al-Shammary et al. Efficient ECG classification based on the probabilistic Kullback-Leibler divergence
Zhu et al. Design and development of a readmission risk assessment system for patients with cardiovascular disease
CN110070945A (zh) 一种基于大数据分析技术的数据脉象价值分析方法
Myrzakerimova et al. APPLICATION OF MATHEMATICAL MODELS IN THE DIAGNOSIS OF DISEASES OF INTERNAL ORGANS

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201204