CN113658654A - 一种基于电子病历数据的症状复杂度计算方法 - Google Patents

一种基于电子病历数据的症状复杂度计算方法 Download PDF

Info

Publication number
CN113658654A
CN113658654A CN202110974703.4A CN202110974703A CN113658654A CN 113658654 A CN113658654 A CN 113658654A CN 202110974703 A CN202110974703 A CN 202110974703A CN 113658654 A CN113658654 A CN 113658654A
Authority
CN
China
Prior art keywords
symptom
disease
duration
probability
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110974703.4A
Other languages
English (en)
Inventor
朱婷
张伟
刘瑞航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Priority to CN202110974703.4A priority Critical patent/CN113658654A/zh
Publication of CN113658654A publication Critical patent/CN113658654A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及电子病历领域,公开了一种基于电子病历数据的症状复杂度计算方法,包括以下步骤:a、建立症状特征:从数据库中获取病人的症状、持续时间、以及标识ID,并根据病人的标识ID将症状和持续时间对应到相应的病人;b、症状预处理:对病症进行统计,建立病人的病症矩阵,经预处理后输出该病症矩阵;c、症状复杂度计算:计算出经预处理后的病症矩阵中的病症概率以及该病症对应的持续时间概率,根据病症概率和持续时间概率构建病人的病症复杂度计算公式。本发明基于整个研究疾病所有人群队列,将其症状与持续时间关系提出来,将当前症状基于当前队列人群所有症状的表现,转换成向量,得出症状复杂和严重程度。

Description

一种基于电子病历数据的症状复杂度计算方法
技术领域
本发明涉及电子病历领域,具体涉及一种基于电子病历数据的症状复杂度计算方法。
背景技术
电子病历是医务人员利用医疗机构信息系统生成的文本、符号、图表、图形、数据、图像等数字信息,在医疗活动过程中进行存储、管理、传输和复制的一种病历。
在电子病历中存在大量文本用于描述病人的病症,但是可能一个病人当前入院时,其往往都伴随着多种疾病合并病症,比如主诊治在当前科室被判断患抑郁症,但是病人同时患有糖尿病,高血压等非主治疾病。这时在科研研究中很难控制这些合并疾病的相关病症对衡量主诊疾病症状复杂程度的影响,如果控制相关合并症变量,将这些并发疾病的病人删除,那么患病人群的队列样本数量就会大大减少,且缺乏多样性。
发明内容
本发明的目的在于提供一种基于电子病历数据的症状复杂度计算方法。
为实现上述发明目的,本发明所采用的技术方案是:一种基于电子病历数据的症状复杂度计算方法,包括以下步骤:
a、建立症状特征:从数据库中获取病人的症状、持续时间、以及标识ID,并根据病人的标识ID将症状和持续时间对应到相应的病人;
b、症状预处理:对病症进行统计,建立病人的病症矩阵,经预处理后输出该病症矩阵;
c、症状复杂度计算:计算出经预处理后的病症矩阵中的病症概率以及该病症对应的持续时间概率,根据病症概率和持续时间概率构建病人的病症复杂度计算公式。
进一步地,所述预处理包括以下步骤:
b1、人工检查;
b2、新建中间缓存变量,根据标识ID提取病人当前完整的病症矩阵;
b3、去除病症矩阵中的空白以及空值;
b4、对“症状伴症状”的内容进行症状拆分,添加到当前症状缓存症状库中,再将当前病人该症状及之前症状未声明的持续时间关系进行赋值;
b5、判断病症矩阵中是否存在症状冗余,若存在去除病症矩阵中的重复症状。
进一步地,所述病症概率的计算:对病人的病症进行统计,得出该病症在整个病症矩阵中出现的概率。
进一步地,所述持续时间概率的计算:
C101、统一持续时间的单位;
C102、获取同一个症状的持续时间的取值;
C103、得出当前症状出现该持续时间的概率。
进一步地,所述病症复杂度计算包括以下步骤:
C201、将每个症状的病症概率和该症状对应的持续时间概率进行相乘;
C202、将病症矩阵中的多个症状的病症概率与对应的持续时间概率的乘积进行相加,得到一列sym_final_score;
C203、将病症矩阵删除,增加sym_final_score列,sym_final_score列用于衡量病人症状严重以及复杂程度。
本发明的有益效果集中体现在:
本发明基于整个研究疾病所有人群队列,将其症状与持续时间关系提出来,将当前症状基于当前队列人群所有症状的表现,进行表示,转换成向量,计算出一个症状复杂值,用来衡量表示当前病人的症状严重与复杂程度,具有较强的多样性和实用性。
附图说明
图1是本发明计算方法整体流程图;
图2是本发明症状预处理流程图;
图3是本发明症状复杂度计算流程图。
具体实施方式
为了使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施例对本发明作进一步的详细说明。
如图1所示,一种基于电子病历数据的症状复杂度计算方法,包括以下步骤:
a、建立症状特征:从数据库中获得病人的症状、持续时间、以及标识ID,并根据病人的标识ID将症状和持续时间对应到相应的病人;例如抑郁症病人电子病历数据库,在该数据库中提取因抑郁症入院的病人队列的主诉信息,也就是病人的症状、持续时间、以及标识ID等。
b、症状预处理:对病症进行统计,建立病人的病症矩阵,经预处理后输出该病症矩阵;
如图2所示,预处理的具体步骤如下:
b1、人工检查:首先人工核对全部症状的合理性,是否存在文本或者表示异常的症状,其次对持续时间进行合理性判断是否出现例如罗马数字或者用字母表示的时间单位。其次,检查是否有隐私数据泄露,比如人名地点等;
b2、新建中间缓存变量,根据标识ID提取病人当前完整的病症矩阵;
b3、去除病症矩阵中的空白以及空值;
b4、对“症状伴症状”的内容进行症状拆分,添加到当前症状缓存症状库中,再将当前病人该症状及之前症状未声明的持续时间关系进行赋值,例如将“症状伴症状”单个症状拆成两个症状,然后将这个持续时间进行赋值给另一个症状,就是这两个症状的持续时间是一样的,(症状1伴症状2,持续时间)=(症状1,持续时间1)+(症状2,持续时间2);
b5、判断病症矩阵中是否存在症状冗余,若存在去除病症矩阵中的重复症状,例如伴“症状”、“症状”感等,以及去除重复症状。
c、症状复杂度计算:如图3所示,图中症状特征工程计算也就是症状复杂度计算,具体地,计算出经预处理后的病症矩阵中的病症概率以及该病症对应的持续时间概率,根据病症概率和持续时间概率构建病人的病症复杂度计算公式;
在该步骤中,所述病症概率的计算具体方法为:对病人的病症进行统计,包括8列症状数据和8列持续时间数据,构成8*2的16列的矩阵,得出该病症在整个疾病队列人群的病症矩阵中出现的概率;在本实施例中病症概率=出现该症状的病人总数/该人群队列病人总数。
同时所述持续时间概率的计算具体方法为:
C101、统一持续时间的单位;
C102、获取同一个症状的持续时间的取值;
C103、得出当前症状出现该持续时间的概率,在本实施例中持续时间概率=当前症状的持续时间次数/人群中出现该症状的所有持续时间次数。
其次,所述病症复杂度计算包括以下步骤:
C201、将每个症状的病症概率和该症状对应的持续时间概率进行相乘,在本实施例中,该步骤的乘积结果可用在后续的任务中,例如做药物推荐或者病人病因推理等;
C202、将病症矩阵中的多个症状的病症概率与对应的持续时间概率的乘积进行相加,得到一列sym_final_score;
C203、将病症矩阵删除,增加sym_final_score列,sym_final_score列用于衡量病人症状严重以及复杂程度,也就是说原来是一个8*2的16列的矩阵,变成8列的矩阵,转换后8列矩阵转换成一列sym_final_score向量。
本发明基于整个研究疾病所有人群队列,将其症状与持续时间关系提出来,将当前症状基于当前队列人群所有症状的表现,进行表示,转换成向量,计算出一个症状复杂值,用来衡量表示当前病人的症状严重与复杂程度,具有较强的多样性和实用性。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本申请所必须的。

Claims (5)

1.一种基于电子病历数据的症状复杂度计算方法,其特征在于:包括以下步骤:
a、建立症状特征:从数据库中获取病人的症状、持续时间、以及标识ID,并根据病人的标识ID将症状和持续时间对应到相应的病人;
b、症状预处理:对病症进行统计,建立病人的病症矩阵,经预处理后输出该病症矩阵;
c、症状复杂度计算:计算出经预处理后的病症矩阵中的病症概率以及该病症对应的持续时间概率,根据病症概率和持续时间概率构建病人的病症复杂度计算公式。
2.根据权利要求1所述的一种基于电子病历数据的症状复杂度计算方法,其特征在于:所述预处理包括以下步骤:
b1、人工检查;
b2、新建中间缓存变量,根据标识ID提取病人当前完整的病症矩阵;
b3、去除病症矩阵中的空白以及空值;
b4、对“症状伴症状”的内容进行症状拆分,添加到当前缓存症状库中,再将当前病人该症状及之前症状未声明的持续时间关系进行赋值;
b5、判断病症矩阵中是否存在症状冗余,若存在去除病症矩阵中的重复症状。
3.根据权利要求1所述的一种基于电子病历数据的症状复杂度计算方法,其特征在于:所述病症概率的计算:对病人的病症进行统计,得出该病症在整个病症矩阵中出现的概率。
4.根据权利要求1所述的一种基于电子病历数据的症状复杂度计算方法,其特征在于:所述持续时间概率的计算:
C101、统一持续时间的单位;
C102、获取同一个症状的持续时间的取值;
C103、得出当前症状出现该持续时间的概率。
5.根据权利要求1所述的一种基于电子病历数据的症状复杂度计算方法,其特征在于:所述病症复杂度计算包括以下步骤:
C201、将每个症状的病症概率和该症状对应的持续时间概率进行相乘;
C202、将病症矩阵中的多个症状的病症概率与对应的持续时间概率的乘积进行相加,得到一列sym_final_score;
C203、将病症矩阵删除,增加sym_final_score列,sym_final_score列用于衡量病人症状严重以及复杂程度。
CN202110974703.4A 2021-08-18 2021-08-18 一种基于电子病历数据的症状复杂度计算方法 Pending CN113658654A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110974703.4A CN113658654A (zh) 2021-08-18 2021-08-18 一种基于电子病历数据的症状复杂度计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110974703.4A CN113658654A (zh) 2021-08-18 2021-08-18 一种基于电子病历数据的症状复杂度计算方法

Publications (1)

Publication Number Publication Date
CN113658654A true CN113658654A (zh) 2021-11-16

Family

ID=78481782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110974703.4A Pending CN113658654A (zh) 2021-08-18 2021-08-18 一种基于电子病历数据的症状复杂度计算方法

Country Status (1)

Country Link
CN (1) CN113658654A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080171916A1 (en) * 2005-05-20 2008-07-17 Carlos Feder Practical computer program that diagnoses diseases in actual patients
CN108766561A (zh) * 2018-05-31 2018-11-06 平安医疗科技有限公司 病症信息处理方法、装置、计算机设备和存储介质
CN109545384A (zh) * 2018-11-21 2019-03-29 上海依智医疗技术有限公司 一种医学诊断方法及装置
CN109545350A (zh) * 2018-11-21 2019-03-29 上海依智医疗技术有限公司 一种导诊方法及装置
CN111599488A (zh) * 2020-05-19 2020-08-28 万达信息股份有限公司 一种智能问诊实现方法、系统和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080171916A1 (en) * 2005-05-20 2008-07-17 Carlos Feder Practical computer program that diagnoses diseases in actual patients
CN108766561A (zh) * 2018-05-31 2018-11-06 平安医疗科技有限公司 病症信息处理方法、装置、计算机设备和存储介质
CN109545384A (zh) * 2018-11-21 2019-03-29 上海依智医疗技术有限公司 一种医学诊断方法及装置
CN109545350A (zh) * 2018-11-21 2019-03-29 上海依智医疗技术有限公司 一种导诊方法及装置
CN111599488A (zh) * 2020-05-19 2020-08-28 万达信息股份有限公司 一种智能问诊实现方法、系统和存储介质

Similar Documents

Publication Publication Date Title
US20210183484A1 (en) Hierarchical cnn-transformer based machine learning
Lima et al. Deep neural network-estimated electrocardiographic age as a mortality predictor
WO2019196286A1 (zh) 疾病预测方法及装置、计算机装置及可读存储介质
US11631497B2 (en) Personalized device recommendations for proactive health monitoring and management
CN108875575B (zh) 基于多通道信号融合深度神经网络自动心律失常分析方法
CN108720831B (zh) 一种基于导联深度神经网络的自动心律失常分析方法
CN108766557B (zh) 基于通道信号融合神经网络的自动心律失常分析方法
CN108937912B (zh) 一种基于深度神经网络的自动心律失常分析方法
CN112289442A (zh) 预测疾病终点事件的方法、装置及电子设备
Wilson et al. Standard binary logistic regression model
CN113094477B (zh) 数据结构化方法、装置、计算机设备及存储介质
Li et al. Two-dimensional ECG-based cardiac arrhythmia classification using DSE-ResNet
Ma et al. Using the shapes of clinical data trajectories to predict mortality in ICUs
US20140019090A1 (en) Systems, methods, and logic for generating statistical research information
US20200082286A1 (en) Time series data analysis apparatus, time series data analysis method and time series data analysis program
EP4199002A1 (en) A computer implemented method and a system
Tasker Writing for PCCM: The 3,000-word structured clinical research report
CN114548100A (zh) 一种基于大数据技术的临床科研辅助方法与系统
CN113658654A (zh) 一种基于电子病历数据的症状复杂度计算方法
Noori et al. A comparative analysis for diabetic prediction based on machine learning techniques
CN114078576B (zh) 临床辅助决策方法、装置、设备及介质
CN112711579A (zh) 医疗数据的质量检测方法及装置、存储介质及电子设备
Welbers et al. Linking event archives to news: a computational method for analyzing the gatekeeping process
CN111400759A (zh) 访视时间表生成方法及装置、存储介质、电子设备
Shabbeer et al. Prediction of Sudden Health Crises Owing to Congestive Heart Failure with Deep Learning Models.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211116