CN113658654A - 一种基于电子病历数据的症状复杂度计算方法 - Google Patents
一种基于电子病历数据的症状复杂度计算方法 Download PDFInfo
- Publication number
- CN113658654A CN113658654A CN202110974703.4A CN202110974703A CN113658654A CN 113658654 A CN113658654 A CN 113658654A CN 202110974703 A CN202110974703 A CN 202110974703A CN 113658654 A CN113658654 A CN 113658654A
- Authority
- CN
- China
- Prior art keywords
- symptom
- disease
- duration
- probability
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000024891 symptom Diseases 0.000 title claims abstract description 118
- 238000004364 calculation method Methods 0.000 title claims abstract description 25
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 64
- 201000010099 disease Diseases 0.000 claims abstract description 61
- 239000011159 matrix material Substances 0.000 claims abstract description 37
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 10
- 238000007689 inspection Methods 0.000 claims description 3
- 238000002203 pretreatment Methods 0.000 description 2
- BALXUFOVQVENIU-KXNXZCPBSA-N pseudoephedrine hydrochloride Chemical compound [H+].[Cl-].CN[C@@H](C)[C@@H](O)C1=CC=CC=C1 BALXUFOVQVENIU-KXNXZCPBSA-N 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及电子病历领域,公开了一种基于电子病历数据的症状复杂度计算方法,包括以下步骤:a、建立症状特征:从数据库中获取病人的症状、持续时间、以及标识ID,并根据病人的标识ID将症状和持续时间对应到相应的病人;b、症状预处理:对病症进行统计,建立病人的病症矩阵,经预处理后输出该病症矩阵;c、症状复杂度计算:计算出经预处理后的病症矩阵中的病症概率以及该病症对应的持续时间概率,根据病症概率和持续时间概率构建病人的病症复杂度计算公式。本发明基于整个研究疾病所有人群队列,将其症状与持续时间关系提出来,将当前症状基于当前队列人群所有症状的表现,转换成向量,得出症状复杂和严重程度。
Description
技术领域
本发明涉及电子病历领域,具体涉及一种基于电子病历数据的症状复杂度计算方法。
背景技术
电子病历是医务人员利用医疗机构信息系统生成的文本、符号、图表、图形、数据、图像等数字信息,在医疗活动过程中进行存储、管理、传输和复制的一种病历。
在电子病历中存在大量文本用于描述病人的病症,但是可能一个病人当前入院时,其往往都伴随着多种疾病合并病症,比如主诊治在当前科室被判断患抑郁症,但是病人同时患有糖尿病,高血压等非主治疾病。这时在科研研究中很难控制这些合并疾病的相关病症对衡量主诊疾病症状复杂程度的影响,如果控制相关合并症变量,将这些并发疾病的病人删除,那么患病人群的队列样本数量就会大大减少,且缺乏多样性。
发明内容
本发明的目的在于提供一种基于电子病历数据的症状复杂度计算方法。
为实现上述发明目的,本发明所采用的技术方案是:一种基于电子病历数据的症状复杂度计算方法,包括以下步骤:
a、建立症状特征:从数据库中获取病人的症状、持续时间、以及标识ID,并根据病人的标识ID将症状和持续时间对应到相应的病人;
b、症状预处理:对病症进行统计,建立病人的病症矩阵,经预处理后输出该病症矩阵;
c、症状复杂度计算:计算出经预处理后的病症矩阵中的病症概率以及该病症对应的持续时间概率,根据病症概率和持续时间概率构建病人的病症复杂度计算公式。
进一步地,所述预处理包括以下步骤:
b1、人工检查;
b2、新建中间缓存变量,根据标识ID提取病人当前完整的病症矩阵;
b3、去除病症矩阵中的空白以及空值;
b4、对“症状伴症状”的内容进行症状拆分,添加到当前症状缓存症状库中,再将当前病人该症状及之前症状未声明的持续时间关系进行赋值;
b5、判断病症矩阵中是否存在症状冗余,若存在去除病症矩阵中的重复症状。
进一步地,所述病症概率的计算:对病人的病症进行统计,得出该病症在整个病症矩阵中出现的概率。
进一步地,所述持续时间概率的计算:
C101、统一持续时间的单位;
C102、获取同一个症状的持续时间的取值;
C103、得出当前症状出现该持续时间的概率。
进一步地,所述病症复杂度计算包括以下步骤:
C201、将每个症状的病症概率和该症状对应的持续时间概率进行相乘;
C202、将病症矩阵中的多个症状的病症概率与对应的持续时间概率的乘积进行相加,得到一列sym_final_score;
C203、将病症矩阵删除,增加sym_final_score列,sym_final_score列用于衡量病人症状严重以及复杂程度。
本发明的有益效果集中体现在:
本发明基于整个研究疾病所有人群队列,将其症状与持续时间关系提出来,将当前症状基于当前队列人群所有症状的表现,进行表示,转换成向量,计算出一个症状复杂值,用来衡量表示当前病人的症状严重与复杂程度,具有较强的多样性和实用性。
附图说明
图1是本发明计算方法整体流程图;
图2是本发明症状预处理流程图;
图3是本发明症状复杂度计算流程图。
具体实施方式
为了使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施例对本发明作进一步的详细说明。
如图1所示,一种基于电子病历数据的症状复杂度计算方法,包括以下步骤:
a、建立症状特征:从数据库中获得病人的症状、持续时间、以及标识ID,并根据病人的标识ID将症状和持续时间对应到相应的病人;例如抑郁症病人电子病历数据库,在该数据库中提取因抑郁症入院的病人队列的主诉信息,也就是病人的症状、持续时间、以及标识ID等。
b、症状预处理:对病症进行统计,建立病人的病症矩阵,经预处理后输出该病症矩阵;
如图2所示,预处理的具体步骤如下:
b1、人工检查:首先人工核对全部症状的合理性,是否存在文本或者表示异常的症状,其次对持续时间进行合理性判断是否出现例如罗马数字或者用字母表示的时间单位。其次,检查是否有隐私数据泄露,比如人名地点等;
b2、新建中间缓存变量,根据标识ID提取病人当前完整的病症矩阵;
b3、去除病症矩阵中的空白以及空值;
b4、对“症状伴症状”的内容进行症状拆分,添加到当前症状缓存症状库中,再将当前病人该症状及之前症状未声明的持续时间关系进行赋值,例如将“症状伴症状”单个症状拆成两个症状,然后将这个持续时间进行赋值给另一个症状,就是这两个症状的持续时间是一样的,(症状1伴症状2,持续时间)=(症状1,持续时间1)+(症状2,持续时间2);
b5、判断病症矩阵中是否存在症状冗余,若存在去除病症矩阵中的重复症状,例如伴“症状”、“症状”感等,以及去除重复症状。
c、症状复杂度计算:如图3所示,图中症状特征工程计算也就是症状复杂度计算,具体地,计算出经预处理后的病症矩阵中的病症概率以及该病症对应的持续时间概率,根据病症概率和持续时间概率构建病人的病症复杂度计算公式;
在该步骤中,所述病症概率的计算具体方法为:对病人的病症进行统计,包括8列症状数据和8列持续时间数据,构成8*2的16列的矩阵,得出该病症在整个疾病队列人群的病症矩阵中出现的概率;在本实施例中病症概率=出现该症状的病人总数/该人群队列病人总数。
同时所述持续时间概率的计算具体方法为:
C101、统一持续时间的单位;
C102、获取同一个症状的持续时间的取值;
C103、得出当前症状出现该持续时间的概率,在本实施例中持续时间概率=当前症状的持续时间次数/人群中出现该症状的所有持续时间次数。
其次,所述病症复杂度计算包括以下步骤:
C201、将每个症状的病症概率和该症状对应的持续时间概率进行相乘,在本实施例中,该步骤的乘积结果可用在后续的任务中,例如做药物推荐或者病人病因推理等;
C202、将病症矩阵中的多个症状的病症概率与对应的持续时间概率的乘积进行相加,得到一列sym_final_score;
C203、将病症矩阵删除,增加sym_final_score列,sym_final_score列用于衡量病人症状严重以及复杂程度,也就是说原来是一个8*2的16列的矩阵,变成8列的矩阵,转换后8列矩阵转换成一列sym_final_score向量。
本发明基于整个研究疾病所有人群队列,将其症状与持续时间关系提出来,将当前症状基于当前队列人群所有症状的表现,进行表示,转换成向量,计算出一个症状复杂值,用来衡量表示当前病人的症状严重与复杂程度,具有较强的多样性和实用性。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本申请所必须的。
Claims (5)
1.一种基于电子病历数据的症状复杂度计算方法,其特征在于:包括以下步骤:
a、建立症状特征:从数据库中获取病人的症状、持续时间、以及标识ID,并根据病人的标识ID将症状和持续时间对应到相应的病人;
b、症状预处理:对病症进行统计,建立病人的病症矩阵,经预处理后输出该病症矩阵;
c、症状复杂度计算:计算出经预处理后的病症矩阵中的病症概率以及该病症对应的持续时间概率,根据病症概率和持续时间概率构建病人的病症复杂度计算公式。
2.根据权利要求1所述的一种基于电子病历数据的症状复杂度计算方法,其特征在于:所述预处理包括以下步骤:
b1、人工检查;
b2、新建中间缓存变量,根据标识ID提取病人当前完整的病症矩阵;
b3、去除病症矩阵中的空白以及空值;
b4、对“症状伴症状”的内容进行症状拆分,添加到当前缓存症状库中,再将当前病人该症状及之前症状未声明的持续时间关系进行赋值;
b5、判断病症矩阵中是否存在症状冗余,若存在去除病症矩阵中的重复症状。
3.根据权利要求1所述的一种基于电子病历数据的症状复杂度计算方法,其特征在于:所述病症概率的计算:对病人的病症进行统计,得出该病症在整个病症矩阵中出现的概率。
4.根据权利要求1所述的一种基于电子病历数据的症状复杂度计算方法,其特征在于:所述持续时间概率的计算:
C101、统一持续时间的单位;
C102、获取同一个症状的持续时间的取值;
C103、得出当前症状出现该持续时间的概率。
5.根据权利要求1所述的一种基于电子病历数据的症状复杂度计算方法,其特征在于:所述病症复杂度计算包括以下步骤:
C201、将每个症状的病症概率和该症状对应的持续时间概率进行相乘;
C202、将病症矩阵中的多个症状的病症概率与对应的持续时间概率的乘积进行相加,得到一列sym_final_score;
C203、将病症矩阵删除,增加sym_final_score列,sym_final_score列用于衡量病人症状严重以及复杂程度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110974703.4A CN113658654A (zh) | 2021-08-18 | 2021-08-18 | 一种基于电子病历数据的症状复杂度计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110974703.4A CN113658654A (zh) | 2021-08-18 | 2021-08-18 | 一种基于电子病历数据的症状复杂度计算方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113658654A true CN113658654A (zh) | 2021-11-16 |
Family
ID=78481782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110974703.4A Pending CN113658654A (zh) | 2021-08-18 | 2021-08-18 | 一种基于电子病历数据的症状复杂度计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113658654A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080171916A1 (en) * | 2005-05-20 | 2008-07-17 | Carlos Feder | Practical computer program that diagnoses diseases in actual patients |
CN108766561A (zh) * | 2018-05-31 | 2018-11-06 | 平安医疗科技有限公司 | 病症信息处理方法、装置、计算机设备和存储介质 |
CN109545384A (zh) * | 2018-11-21 | 2019-03-29 | 上海依智医疗技术有限公司 | 一种医学诊断方法及装置 |
CN109545350A (zh) * | 2018-11-21 | 2019-03-29 | 上海依智医疗技术有限公司 | 一种导诊方法及装置 |
CN111599488A (zh) * | 2020-05-19 | 2020-08-28 | 万达信息股份有限公司 | 一种智能问诊实现方法、系统和存储介质 |
-
2021
- 2021-08-18 CN CN202110974703.4A patent/CN113658654A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080171916A1 (en) * | 2005-05-20 | 2008-07-17 | Carlos Feder | Practical computer program that diagnoses diseases in actual patients |
CN108766561A (zh) * | 2018-05-31 | 2018-11-06 | 平安医疗科技有限公司 | 病症信息处理方法、装置、计算机设备和存储介质 |
CN109545384A (zh) * | 2018-11-21 | 2019-03-29 | 上海依智医疗技术有限公司 | 一种医学诊断方法及装置 |
CN109545350A (zh) * | 2018-11-21 | 2019-03-29 | 上海依智医疗技术有限公司 | 一种导诊方法及装置 |
CN111599488A (zh) * | 2020-05-19 | 2020-08-28 | 万达信息股份有限公司 | 一种智能问诊实现方法、系统和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210183484A1 (en) | Hierarchical cnn-transformer based machine learning | |
Lima et al. | Deep neural network-estimated electrocardiographic age as a mortality predictor | |
WO2019196286A1 (zh) | 疾病预测方法及装置、计算机装置及可读存储介质 | |
US11631497B2 (en) | Personalized device recommendations for proactive health monitoring and management | |
CN108875575B (zh) | 基于多通道信号融合深度神经网络自动心律失常分析方法 | |
CN108720831B (zh) | 一种基于导联深度神经网络的自动心律失常分析方法 | |
CN108766557B (zh) | 基于通道信号融合神经网络的自动心律失常分析方法 | |
CN108937912B (zh) | 一种基于深度神经网络的自动心律失常分析方法 | |
CN112289442A (zh) | 预测疾病终点事件的方法、装置及电子设备 | |
Wilson et al. | Standard binary logistic regression model | |
CN113094477B (zh) | 数据结构化方法、装置、计算机设备及存储介质 | |
Li et al. | Two-dimensional ECG-based cardiac arrhythmia classification using DSE-ResNet | |
Ma et al. | Using the shapes of clinical data trajectories to predict mortality in ICUs | |
US20140019090A1 (en) | Systems, methods, and logic for generating statistical research information | |
US20200082286A1 (en) | Time series data analysis apparatus, time series data analysis method and time series data analysis program | |
EP4199002A1 (en) | A computer implemented method and a system | |
Tasker | Writing for PCCM: The 3,000-word structured clinical research report | |
CN114548100A (zh) | 一种基于大数据技术的临床科研辅助方法与系统 | |
CN113658654A (zh) | 一种基于电子病历数据的症状复杂度计算方法 | |
Noori et al. | A comparative analysis for diabetic prediction based on machine learning techniques | |
CN114078576B (zh) | 临床辅助决策方法、装置、设备及介质 | |
CN112711579A (zh) | 医疗数据的质量检测方法及装置、存储介质及电子设备 | |
Welbers et al. | Linking event archives to news: a computational method for analyzing the gatekeeping process | |
CN111400759A (zh) | 访视时间表生成方法及装置、存储介质、电子设备 | |
Shabbeer et al. | Prediction of Sudden Health Crises Owing to Congestive Heart Failure with Deep Learning Models. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211116 |