CN112820368A - 重症患者数据集的构建方法、系统、设备和存储介质 - Google Patents
重症患者数据集的构建方法、系统、设备和存储介质 Download PDFInfo
- Publication number
- CN112820368A CN112820368A CN202110043894.2A CN202110043894A CN112820368A CN 112820368 A CN112820368 A CN 112820368A CN 202110043894 A CN202110043894 A CN 202110043894A CN 112820368 A CN112820368 A CN 112820368A
- Authority
- CN
- China
- Prior art keywords
- data
- critical
- severe
- patient
- diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Epidemiology (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请涉及一种重症患者数据集的构建方法、系统、设备和存储介质,在该方法中,通过根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;通过异构数据类型的编码表示,获取不同维度的重症数据类型;对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。通过搭建重症临床患者的数据集,能够精准预测重症患者疾病严重程度及临床结局,通过数据集分析死亡、住院费用、住院时间的风险因素,为重症临床患者的诊治提供大数据支持。
Description
技术领域
本申请涉及医疗领域,特别是涉及一种重症患者数据集的构建方法、系统、设备和存储介质。
背景技术
对重症监护病房(ICU)患者进行可靠的死亡率预测对于评估疾病的严重程度和判断新治疗和干预措施的价值至关重要,这可能有助于改善临床结果。目前已有多种疾病严重程度评分系统已被开发,以帮助医生判断患者的病情和预后。然而,最近的研究表明,只有12%的ICU使用这类死亡风险评估工具。这主要归因于两个主要因素。首先,实施这些评分通常需要临床医生花费大量的时间和精力收集数据,因为这些数据既不能在常规的危重症护理工作流程中获得,也不能在临床信息系统中随时获得。其次,传统的预测工具通常基于logistic回归模型的方法,这种方法对处理高维混杂的医疗数据有严格的限制,其准确性需要进一步提高。这种做法直接导致的结果是通常仅考虑到了某项指标第一次的检测结果,无法体现指标的变化趋势。同时由于刚刚入院,治疗效果未充分反应出来,即此时的数据还无法较准确反映患者的结局。
此外,尽管如今医学数据库建设已非常成熟,但医学大数据的提取和应用仍然是一大挑战。从目前的工作来看,大部分医疗机构日常收集和存储的数据并没有得到系统和全面的利用。主要原因是数据预处理是一项极具挑战性的任务。
发明内容
基于此,有必要针对上述技术问题,提供一种重症患者数据集的构建方法、系统、设备和存储介质。
第一方面,本发明实施例公开了一种重症患者数据集的构建方法,包括以下步骤:
根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;
将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;
通过异构数据类型的编码表示,获取不同维度的重症数据类型;
对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
进一步的,所述根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据,包括:
从所述重症临床医师的重症诊疗数据中进行全因特征的选取,完成对所述重症诊疗数据进行不同维度布局;
根据所述重症诊疗数据的维度特征,进行不同频率的数据采集;
将指定时间段内多次数据记录的所述重症诊疗数据,完成最大值、最小值和平均值的数据统计。
进一步的,所述将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取,包括:
在医嘱系统中检测到所述重症临床患者的病情级别,当达到病危级别时对所述重症临床患者的病情进行分析;
对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;
根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。
进一步的,所述对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建,包括:
对所述重症临床医师的医疗行为进行分析,将所述重症临床患者中最近一次的检测结果作为所述重症数据类型缺失值的填充;
通过对所述重症数据类型进行标准化处理,消除所述重症数据类型中指标之间的量纲影响,使得所述重症数据类型的指标之间具有可比性;
以所述重症数据类型中管理信息、生命体征、实验室检查、静脉用药记录、主要医疗诊断五个维度为基准,完成所述重症患者数据集的构建。
另一方面,本发明实施例还公开了一种重症患者数据集的构建系统,包括:
数据采集模块,用于根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;
数据选取模块,用于将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;
数据分类模块,用于通过异构数据类型的编码表示,获取不同维度的重症数据类型;
数据集处理模块,用于对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
进一步的,所述数据采集模块包括样本布局单元,所述样本布局单元用于:
从所述重症临床医师的重症诊疗数据中进行全因特征的选取,完成对所述重症诊疗数据进行不同维度布局;
根据所述重症诊疗数据的维度特征,进行不同频率的数据采集;
将指定时间段内多次数据记录的所述重症诊疗数据,完成最大值、最小值和平均值的数据统计。
进一步的,所述数据选取模块包括变量因子单元,所述变量因子单元用于:
在医嘱系统中检测到所述重症临床患者的病情级别,当达到病危级别时对所述重症临床患者的病情进行分析;
对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;
根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。
本发明实施例还公开了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;
将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;
通过异构数据类型的编码表示,获取不同维度的重症数据类型;
对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;
将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;
通过异构数据类型的编码表示,获取不同维度的重症数据类型;
对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
本申请的有益效果是:通过本发明实施例公开的重症患者数据集的构建方法、系统、设备和存储介质,在该方法中,通过根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;通过异构数据类型的编码表示,获取不同维度的重症数据类型;对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。根据对重症临床患者数据的采集、处理和分析,搭建出针对重症临床患者的数据集,通过搭建重症临床患者的数据集,能够精准预测重症患者疾病严重程度及临床结局,例如住院死亡率、住院时间、住院费用等,通过数据集分析死亡、住院费用、住院时间的风险因素,为重症临床患者的诊治提供大数据支持。
附图说明
图1为一个重症患者数据集的构建方法的流程示意图;
图2为一个实施例中初始样本处理的流程示意图;
图3为一个实施例中对病危特征数据处理的流程示意图;
图4为一个实施例中优化构建数据集的流程示意图;
图5为一个实施例中重症患者数据集的构建系统的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种重症患者数据集的构建方法,包括以下步骤:
步骤101,根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;
步骤102,将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;
步骤103,通过异构数据类型的编码表示,获取不同维度的重症数据类型;
步骤104,对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
具体地,根据对重症临床患者数据的采集、处理和分析,搭建出针对重症临床患者的数据集,通过搭建重症临床患者的数据集,能够精准预测重症患者疾病严重程度及临床结局,例如住院死亡率、住院时间、住院费用等,通过数据集分析死亡、住院费用、住院时间的风险因素,为重症临床患者的诊治提供大数据支持。在构建数据集的指标时,充分参考了重症患者的临床数据及相关预测研究的文献,并结合了重症临床专家的意见,通过医院现有重症患者临床科研数据库可获取的变量,拟定并提取了患者住院期间以下五个类别的数据,即管理数据、生命体征、实验室检查、静脉用药记录、主要医疗诊断。生命体征将记录每日最大值、最小值和平均值,住院期间的每一次实验室检查结果和静脉用药记录将被提取。本发明实施例中数据集纳入了2014年1月至2020年6月期间在医院出院的所有重症住院患者,包括12815名患者的17291次ICU住院的医疗数据,这些数据包括了数值型变量、离散型变量,时间三种变量类型,其中生命体征、实验室检查及静脉用药记录均为数值型连续变量。
在一个实施例中,如图2所示,初始样本处理的流程包括:
步骤201,从所述重症临床医师的重症诊疗数据中进行全因特征的选取,完成对所述重症诊疗数据进行不同维度布局;
步骤202,根据所述重症诊疗数据的维度特征,进行不同频率的数据采集;
步骤203,将指定时间段内多次数据记录的所述重症诊疗数据,完成最大值、最小值和平均值的数据统计。
具体地,本实施例中采用独热编码来表示分类特征。独热编码即One-Hot编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效,通过分类特征完成对所述重症诊疗数据进行不同维度布局。为提供数据采集的精准度,本实施例中进行不同频率的数据采集;例如,对于生命体征这类高频数据,系统以每小时一次的频率采样。对于指定时间段内,某个指标若有多次记录,数据库中记录最大值、最小值、平均值。
在一个实施例中,如图3所示,对病危特征数据处理的过程包括:
步骤301,在医嘱系统中检测到所述重症临床患者的病情级别,当达到病危级别时对所述重症临床患者的病情进行分析;
步骤302,对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;
步骤303,根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。
具体地,提出适合ICU数据集中纳入了一个特殊变量,即“病危”的结束时间。本实施例中用医学术语“病危”、“病重”描述患者病情的严重程度,如果在医嘱系统中检测到患者的病情级别“病危”停止,可能有两种情况:第一,患者病情好转,暂时脱离生命危险;第二,患者死亡或因病情危重家属放弃治疗,签字出院,这都预示着患者的不良结局。对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;根据临床经验,距离患者死亡时间越近的数据越能够反映死亡患者的特征,因此用于死亡率风险预测建模的最理想的数据采集时间窗为死亡结局前某一段时间内,根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。本实施例创造性的将这一概念引入到数据集构建中,使得我们可以基于病危结束时间为参考点选取特征作为模型输入,提高模型预测精准度。为了区分预后好的患者和预后差的患者,本实施例中更关注病危结束时这一时间段,这一时间段可能存在较大的患者特征差异,这是与现有技术中以患者从入院开始某一段时间内数据作为预测变量是完全不同的。
在一个实施例中,如图4所示,优化构建数据集的过程包括:
步骤401,对所述重症临床医师的医疗行为进行分析,将所述重症临床患者中最近一次的检测结果作为所述重症数据类型缺失值的填充;
步骤402,通过对所述重症数据类型进行标准化处理,消除所述重症数据类型中指标之间的量纲影响,使得所述重症数据类型的指标之间具有可比性;
步骤403,以所述重症数据类型中管理信息、生命体征、实验室检查、静脉用药记录、主要医疗诊断五个维度为基准,完成所述重症患者数据集的构建。
具体地,因为疾病种类和严重程度不同,相同检验项目重复检测的时间间隔差距极大。很难定义若干个时间节点所有的患者都做了相同的检测。因此,我们对该问题采用一种基于专业判断的特殊处理。我们分析医生的医疗行为,对于某个指标而言,他们总是在得到最新检测结果之前,往往参考最近一次的检测结果。若某天(假设为day1)内某个变量没有做检测,我们则将前一天(Day2)的数据复制到这一天,如果Day2仍然未做检测则一直往前搜索,直到找到最近的检测结果,然后复制到后面邻近的且没有检测结果的时间节点。若一直检索到入院当天仍然没有检测结果,则以正常值填充。理由如下:对于某个样本,若在连续时间段某项指标均缺失,我们认为是专业医生通过专业判读认为该患者在住院过程中不需要检测该项指标,其原因可能是:①患者该项指标是正常的概率极大;②患者该项指标对患者所患的疾病诊断和质量没有意义。基于以上两种情况,我们默认为该指标的结果是正常值。
此外,在进行数据集构建过程中,通常需要将采集的重症患者的数据标准化,利用标准化后得数据进行数据分析。不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。
所述重症患者数据集的构建中,以所述重症数据类型中管理信息、生命体征、实验室检查、静脉用药、主要医疗诊断五个维度进行后续的数据集应用。其中,所述管理信息包括患者编号、年龄、性别、体质指数、出/入ICU时间、入院时间、出院时间、此次住院总时长、此次住院总费用、临床结局等。该部分包含了患者个人信息和主要临床结果;生命体征作为患者病情危重程度的直接体现,几乎出现在所有疾病死亡率预测研究中,这也是目前医院广泛应用的早期预警评分中最主要的判断指标;实验室检查包括医院常规实验室检验项目,这些项目是每个重症患者必查项目,可在一定程度上反映了身体各个器官系统的功能状态。为尽量避免因人工选择特征而遗漏重要特征,本数据集纳入了检验项目的所有子项目如仅血常规单个检验项目中就包含了白细胞计数、红细胞计数、血小板计数等24个子项目;药物治疗是疾病主要的治疗手段,通过用药记录可以在一定程度上反映疾病的严重程度。对外科监护室的一项前瞻性观察性研究提示,使用血管活性药物患者死亡率较未暴露者显著增高,且不同血管活性药物对死亡率影响有差异,提示不同药物选择可能对患者结局有不同影响。因此,探究药物及其剂量与临床结局的关系可指导临床医生更加合理的选择药物。
本发明实施例中提取了所有患者病危结束前7天的数据,同一名患者如果有多次住院记录将被当作多个独立样本进行分析。患者出院转归结果为死亡的患者被认为是正样本,其他患者被认为是负样本。鉴于在临床真实环境中可能不会每天对某个实验室检查项目进行测量,这就造成近似“缺失值”的情况,采取了一种邻近值插补法。如某个变量在某一天没有记录,通过使用距离这一天最近的一次记录补充,若在7天内均无相关记录,则以正常值填充。对于某种静脉药物,若某一天无此药的相关记录,则剂量记为0。对于某个样本而言,若在7天内某一类型数据均缺失则删除该样本。此外,本发明实施例中将同一病人每一次ICU住院视为一个样本,从17291次ICU住院记录中提取出17291个样本中7天的数据,得到一个具有2297维特征的样本集,去除出现频次小于100的特征,留下了1899维特征。然后筛选出特征数量最多的前13000个样本纳入数据集,应用于危重患者住院死亡率预测,这些样本最少的具有104个未经填充处理的原始非空特征。删减样本后,保留的特征的出现频次几乎全部高于100,因删减样本产生新的频次少于100的特征只有四个,且最少的特征也有86维,这说明出现频次较高的特征也集中在特征数量较多的样本中。数据标准化有助于数据的进一步分析。这里采用标准差标准化,经过处理的数据符合标准正态分布。
通过选择深度神经网络来进行分类预测,构建了一个具有10个隐藏层的深度网络模型,每个隐藏层的节点数为256个,设置10%的失活率。实验中,通过用80%的数据作为训练集,10%的数据作为验证集,10%的数据作为测试集。测试集结果显示,本模型具有较高的可信度,能为临床医生预测病人临床结局提供重要帮助。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种重症患者数据集的构建系统,包括:数据采集模块501、数据选取模块502、数据分类模块503、数据集处理模块504,其中:
数据采集模块501,用于根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;
数据选取模块502,用于将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;
数据分类模块503,用于通过异构数据类型的编码表示,获取不同维度的重症数据类型;
数据集处理模块504,用于对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
在一个实施例中,如图5所示,所述数据采集模块501包括样本布局单元5011,所述样本布局单元5011用于:
从所述重症临床医师的重症诊疗数据中进行全因特征的选取,完成对所述重症诊疗数据进行不同维度布局;
根据所述重症诊疗数据的维度特征,进行不同频率的数据采集;
将指定时间段内多次数据记录的所述重症诊疗数据,完成最大值、最小值和平均值的数据统计。
在一个实施例中,如图5所示,所述数据选取模块502包括变量因子单元5021,所述变量因子单元5021用于:
在医嘱系统中检测到所述重症临床患者的病情级别,当达到病危级别时对所述重症临床患者的病情进行分析;
对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;
根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。
在一个实施例中,如图5所示,所述数据集处理模块504包括数据集优化单元5041,所述数据集优化单元5041用于:
对所述重症临床医师的医疗行为进行分析,将所述重症临床患者中最近一次的检测结果作为所述重症数据类型缺失值的填充;
通过对所述重症数据类型进行标准化处理,消除所述重症数据类型中指标之间的量纲影响,使得所述重症数据类型的指标之间具有可比性;
以所述重症数据类型中管理信息、生命体征、实验室检查、静脉用药记录、主要医疗诊断五个维度为基准,完成所述重症患者数据集的构建。
关于重症患者数据集的构建系统的具体限定可以参见上文中对于重症患者数据集的构建方法的限定,在此不再赘述。上述重症患者数据集的构建系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图6示出了一个实施例中计算机设备的内部结构图。如图6所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现权限异常检测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行权限异常检测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;通过异构数据类型的编码表示,获取不同维度的重症数据类型;对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从所述重症临床医师的重症诊疗数据中进行全因特征的选取,完成对所述重症诊疗数据进行不同维度布局;根据所述重症诊疗数据的维度特征,进行不同频率的数据采集;将指定时间段内多次数据记录的所述重症诊疗数据,完成最大值、最小值和平均值的数据统计。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:在医嘱系统中检测到所述重症临床患者的病情级别,当达到病危级别时对所述重症临床患者的病情进行分析;对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对所述重症临床医师的医疗行为进行分析,将所述重症临床患者中最近一次的检测结果作为所述重症数据类型缺失值的填充;通过对所述重症数据类型进行标准化处理,消除所述重症数据类型中指标之间的量纲影响,使得所述重症数据类型的指标之间具有可比性;以所述重症数据类型中管理信息、生命体征、实验室检查、静脉用药记录、主要医疗诊断五个维度为基准,完成所述重症患者数据集的构建。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;通过异构数据类型的编码表示,获取不同维度的重症数据类型;对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从所述重症临床医师的重症诊疗数据中进行全因特征的选取,完成对所述重症诊疗数据进行不同维度布局;根据所述重症诊疗数据的维度特征,进行不同频率的数据采集;将指定时间段内多次数据记录的所述重症诊疗数据,完成最大值、最小值和平均值的数据统计。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:在医嘱系统中检测到所述重症临床患者的病情级别,当达到病危级别时对所述重症临床患者的病情进行分析;对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对所述重症临床医师的医疗行为进行分析,将所述重症临床患者中最近一次的检测结果作为所述重症数据类型缺失值的填充;通过对所述重症数据类型进行标准化处理,消除所述重症数据类型中指标之间的量纲影响,使得所述重症数据类型的指标之间具有可比性;以所述重症数据类型中管理信息、生命体征、实验室检查、静脉用药记录、主要医疗诊断五个维度为基准,完成所述重症患者数据集的构建。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种重症患者数据集的构建方法,其特征在于,包括以下步骤:
根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;
将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;
通过异构数据类型的编码表示,获取不同维度的重症数据类型;
对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
2.根据权利要求1所述的重症患者数据集的构建方法,其特征在于,所述根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据,包括:
从所述重症临床医师的重症诊疗数据中进行全因特征的选取,完成对所述重症诊疗数据进行不同维度布局;
根据所述重症诊疗数据的维度特征,进行不同频率的数据采集;
将指定时间段内多次数据记录的所述重症诊疗数据,完成最大值、最小值和平均值的数据统计。
3.根据权利要求1所述的重症患者数据集的构建方法,其特征在于,所述将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取,包括:
在医嘱系统中检测到所述重症临床患者的病情级别,当达到病危级别时对所述重症临床患者的病情进行分析;
对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;
根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。
4.根据权利要求1所述的重症患者数据集的构建方法,其特征在于,所述对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建,包括:
对所述重症临床医师的医疗行为进行分析,将所述重症临床患者中最近一次的检测结果作为所述重症数据类型缺失值的填充;
通过对所述重症数据类型进行标准化处理,消除所述重症数据类型中指标之间的量纲影响,使得所述重症数据类型的指标之间具有可比性;
以所述重症数据类型中管理信息、生命体征、实验室检查、静脉用药记录、主要医疗诊断五个维度为基准,完成所述重症患者数据集的构建。
5.一种重症患者数据集的构建系统,其特征在于,包括:
数据采集模块,用于根据重症临床医师选取的重症诊疗数据,并从医疗数据库中获取重症临床患者的医疗特征数据;
数据选取模块,用于将所述重症临床患者的病危结束时间定义为变量因子,根据所述变量因子从所述重症诊疗数据和所述医疗特征数据中进行数据的选取;
数据分类模块,用于通过异构数据类型的编码表示,获取不同维度的重症数据类型;
数据集处理模块,用于对所述重症数据类型进行缺失值处理和标准化处理,通过所述重症数据类型的数据分析,完成重症患者数据集的构建。
6.根据权利要求5所述的重症患者数据集的构建系统,其特征在于,所述数据采集模块包括样本布局单元,所述样本布局单元用于:
从所述重症临床医师的重症诊疗数据中进行全因特征的选取,完成对所述重症诊疗数据进行不同维度布局;
根据所述重症诊疗数据的维度特征,进行不同频率的数据采集;
将指定时间段内多次数据记录的所述重症诊疗数据,完成最大值、最小值和平均值的数据统计。
7.根据权利要求5所述的重症患者数据集的构建系统,其特征在于,所述数据选取模块包括变量因子单元,所述变量因子单元用于:
在医嘱系统中检测到所述重症临床患者的病情级别,当达到病危级别时对所述重症临床患者的病情进行分析;
对所述重症临床患者的病危结束时间进行特征数据实时记录,并将所述病危结束时间定义为变量因子;
根据所述变量因子,将所述重症临床患者从病危级别达到临近死亡的时间段特征数据作为第一特征数据。
8.根据权利要求5所述的重症患者数据集的构建系统,其特征在于,所述数据集处理模块包括数据集优化单元,所述数据集优化单元用于:
对所述重症临床医师的医疗行为进行分析,将所述重症临床患者中最近一次的检测结果作为所述重症数据类型缺失值的填充;
通过对所述重症数据类型进行标准化处理,消除所述重症数据类型中指标之间的量纲影响,使得所述重症数据类型的指标之间具有可比性;
以所述重症数据类型中管理信息、生命体征、实验室检查、静脉用药记录、主要医疗诊断五个维度为基准,完成所述重症患者数据集的构建。
9.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110043894.2A CN112820368A (zh) | 2021-01-13 | 2021-01-13 | 重症患者数据集的构建方法、系统、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110043894.2A CN112820368A (zh) | 2021-01-13 | 2021-01-13 | 重症患者数据集的构建方法、系统、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112820368A true CN112820368A (zh) | 2021-05-18 |
Family
ID=75869261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110043894.2A Pending CN112820368A (zh) | 2021-01-13 | 2021-01-13 | 重症患者数据集的构建方法、系统、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112820368A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101554322A (zh) * | 2008-04-09 | 2009-10-14 | 陈敦金 | 产科危重症患者病情评估系统 |
CN106874663A (zh) * | 2017-01-26 | 2017-06-20 | 中电科软件信息服务有限公司 | 心脑血管疾病风险预测方法及系统 |
CN107491638A (zh) * | 2017-07-28 | 2017-12-19 | 深圳和而泰智能控制股份有限公司 | 一种基于深度学习模型的icu用户病情预测方法及终端设备 |
CN109766329A (zh) * | 2018-12-29 | 2019-05-17 | 湖南网数科技有限公司 | 一种支持交换共享的临床数据单元生成方法和装置 |
CN110827993A (zh) * | 2019-11-21 | 2020-02-21 | 北京航空航天大学 | 基于集成学习的早期死亡风险评估模型建立方法及装置 |
CN111387938A (zh) * | 2020-02-04 | 2020-07-10 | 华东理工大学 | 一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统 |
CN111640512A (zh) * | 2020-06-02 | 2020-09-08 | 戴松世 | 肾脏替代疗法启动策略评估方法、装置及电子设备 |
CN111657888A (zh) * | 2020-05-28 | 2020-09-15 | 首都医科大学附属北京天坛医院 | 重度急性呼吸窘迫综合症预警方法及系统 |
CN112086150A (zh) * | 2020-07-31 | 2020-12-15 | 新视焰医疗科技(苏州)有限公司 | 一种临床研究数据集成平台 |
-
2021
- 2021-01-13 CN CN202110043894.2A patent/CN112820368A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101554322A (zh) * | 2008-04-09 | 2009-10-14 | 陈敦金 | 产科危重症患者病情评估系统 |
CN106874663A (zh) * | 2017-01-26 | 2017-06-20 | 中电科软件信息服务有限公司 | 心脑血管疾病风险预测方法及系统 |
CN107491638A (zh) * | 2017-07-28 | 2017-12-19 | 深圳和而泰智能控制股份有限公司 | 一种基于深度学习模型的icu用户病情预测方法及终端设备 |
CN109766329A (zh) * | 2018-12-29 | 2019-05-17 | 湖南网数科技有限公司 | 一种支持交换共享的临床数据单元生成方法和装置 |
CN110827993A (zh) * | 2019-11-21 | 2020-02-21 | 北京航空航天大学 | 基于集成学习的早期死亡风险评估模型建立方法及装置 |
CN111387938A (zh) * | 2020-02-04 | 2020-07-10 | 华东理工大学 | 一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统 |
CN111657888A (zh) * | 2020-05-28 | 2020-09-15 | 首都医科大学附属北京天坛医院 | 重度急性呼吸窘迫综合症预警方法及系统 |
CN111640512A (zh) * | 2020-06-02 | 2020-09-08 | 戴松世 | 肾脏替代疗法启动策略评估方法、装置及电子设备 |
CN112086150A (zh) * | 2020-07-31 | 2020-12-15 | 新视焰医疗科技(苏州)有限公司 | 一种临床研究数据集成平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | A deep learning model for real-time mortality prediction in critically ill children | |
US20220330823A1 (en) | Systems and devices for telemetry monitoring management | |
Ge et al. | An Interpretable ICU Mortality Prediction Model Based on Logistic Regression and Recurrent Neural Networks with LSTM units. | |
CN110880362B (zh) | 一种大规模医疗数据知识挖掘与治疗方案推荐系统 | |
CN111710420B (zh) | 一种基于电子病历大数据的并发症发病风险预测方法、系统、终端以及存储介质 | |
Hosseinzadeh et al. | Assessing the predictability of hospital readmission using machine learning | |
García-Gallo et al. | A machine learning-based model for 1-year mortality prediction in patients admitted to an Intensive Care Unit with a diagnosis of sepsis | |
CN107785057B (zh) | 医疗数据处理方法、装置、存储介质和计算机设备 | |
JP2006500075A (ja) | 肺がん判別のための患者データマイニング | |
US20060259329A1 (en) | System and Method for Determining the Degree of Abnormality of a Patient's Vital Signs | |
US20170199965A1 (en) | Medical system and method for predicting future outcomes of patient care | |
CN111243753A (zh) | 一种面向医疗数据的多因素相关性交互式分析方法 | |
JP7161688B2 (ja) | 手術後感染予測装置、手術後感染予測装置生産方法、手術後感染予測方法およびプログラム | |
Saab et al. | Comparison of Machine Learning Algorithms for Classifying Adverse-Event Related 30-ay Hospital Readmissions: Potential Implications for Patient Safety | |
Higgins et al. | Benchmarking inpatient mortality using electronic medical record data: a retrospective, multicenter analytical observational study | |
CN113782197B (zh) | 基于可解释性机器学习算法的新冠肺炎患者转归预测方法 | |
Todd et al. | Improving mortality models in the ICU with high-frequency data | |
CN112820368A (zh) | 重症患者数据集的构建方法、系统、设备和存储介质 | |
WO2023106960A1 (ru) | Способ прогнозирования наступления медицинского события в здоровье человека | |
Chaddad et al. | Deep survival analysis with clinical variables for covid-19 | |
CN113902186A (zh) | 一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质 | |
Zhu et al. | Design and development of a readmission risk assessment system for patients with cardiovascular disease | |
Zhao et al. | Development and application of an intensive care medical data set for deep learning | |
Dyagilev et al. | Learning a severity score for sepsis: A novel approach based on clinical comparisons | |
CN117809841B (zh) | 一种基于大模型技术的皮肤专病患者管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |