CN117542467B - 基于患者数据的专病标准数据库自动构建方法 - Google Patents
基于患者数据的专病标准数据库自动构建方法 Download PDFInfo
- Publication number
- CN117542467B CN117542467B CN202410028601.7A CN202410028601A CN117542467B CN 117542467 B CN117542467 B CN 117542467B CN 202410028601 A CN202410028601 A CN 202410028601A CN 117542467 B CN117542467 B CN 117542467B
- Authority
- CN
- China
- Prior art keywords
- data
- disease
- special
- patient
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 136
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 136
- 238000010276 construction Methods 0.000 title claims abstract description 16
- 238000011282 treatment Methods 0.000 claims abstract description 44
- 238000003062 neural network model Methods 0.000 claims abstract description 31
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 22
- 238000003759 clinical diagnosis Methods 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 230000002776 aggregation Effects 0.000 claims abstract description 4
- 238000004220 aggregation Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 16
- 238000003745 diagnosis Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 9
- 230000000306 recurrent effect Effects 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 claims description 3
- 238000011269 treatment regimen Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 15
- 238000011160 research Methods 0.000 description 5
- 208000005718 Stomach Neoplasms Diseases 0.000 description 4
- 206010017758 gastric cancer Diseases 0.000 description 4
- 201000011549 stomach cancer Diseases 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000006806 disease prevention Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明属于数据库技术领域,涉及基于患者数据的专病标准数据库自动构建方法,包括:建立专病标准数据集的数据库的结构模型;定义数据特征属性;数据汇聚与预处理;数据提取;对专病数据进行标注;利用循环神经网络模型对未标注的专病数据进行预测,得到每个文本数据的类别作为预测结果;将专病数据矩阵队列,输出到专病数据库的队列,持续写入到专病数据库。本发明基于临床诊疗数据自动构建专病标准数据库,能够解决医院在专病管理和临床决策方面的问题,能够获取标准化、准确的专病数据,为医院提供便捷的专病管理工具。
Description
技术领域
本发明属于数据库技术领域,具体而言,涉及基于患者数据的专病标准数据库自动构建方法。
背景技术
随着医学领域的不断发展和科技的进步,医院管理和临床决策也日益复杂和精细化。其中,专病管理成为了医疗服务的一个重要方面,特别是针对慢性疾病、罕见病和其他特殊疾病的管理。
医院在专病管理和临床决策方面存在较多的问题。医院标准化、准确的专病数据,为医院提供便捷的专病管理工具,帮助医生快速了解患者的病情、治疗方案和预后等信息,不同医疗机构和研究团队采用不同的数据标准和格式,导致数据的标准化程度不足,这使得数据的比较和整合变得困难,降低了数据库的质量和可用性。专病标准数据库可以作为临床决策支持系统的基础和依据,为医生提供科学、个性化的诊疗方案和治疗指导,提高医疗质量和患者满意度。专病标准数据库的质量取决于数据的准确性和完整性,现有数据库缺少一种专病标准数据库,且现有数据库存在数据错误、缺失或重复的问题,这可能导致错误的临床决策和科学研究结果。
发明内容
为了解决上述技术问题,本发明提供基于患者数据的专病标准数据库自动构建方法,包括:
获取专病标准数据集,结合电子病历基本数据集规范,建立专病标准数据集的数据库的结构模型;
定义数据特征属性;数据专用属性包括数据元名称、数据元标识、数据类型、数据表示格式、数据元值域与数据分类参考标准;
数据汇聚与预处理,包括:汇聚临床诊疗数据到患者数据仓库,对临床诊疗数据进行治理得到标准化数据;
数据提取,包括:利用自然语言处理与文本挖掘的方法从标准化数据中提取专病信息的特征属性,得到专病文本数据;
对标准化数据进行标注;
采用循环神经网络模型,自动构建专病数据库,包括:
对专病文本数据进行预处理,将预处理后的专病文本数据转化为向量,构建专病循环神经网络模型;
将每个时间步的向量作为输入信息输入循环神经网络模型进行序列建模;
利用标注后的专病数据对循环神经网络模型进行训练;
利用循环神经网络模型对未标注的专病数据进行预测,得到每个文本数据的类别作为预测结果;
将预测结果整理为专病数据矩阵队列,专病数据矩阵队列的行表示每个文本数据的预测结果,专病数据矩阵队列的列表示每个类别或任务的预测结果;
将专病数据矩阵队列,输出到专病数据库的队列,持续写入到专病数据库。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,专病标准数据集包括数据集名称、数据子集名称、数据元名称与值域。
进一步,数据库的结构模型,包括:通过一个根节点表示专病类型,每个子节点表示该专病类型下的病例或诊疗方案;通过使用表格来表示数据,在专病数据库中,使用关系模型建立多个表格来存储专病相关的数据;每个表格代表一个实体类,实体类包括病例与治疗方案,列代表人员信息,行代表人员信息的属性,通过定义表格之间的关系和外键约束,对数据进行联接和关联操作。
进一步,对临床诊疗数据进行治理包括数据清洗、转化与标准化数据处理,去除冗余信息与错误数据,统一数据格式与单位,以及进行编码处理。
进一步,临床诊疗数据包括临床诊断记录、病例报告与医疗文献;专病信息包括病种信息、病例特征、诊断标准与治疗方案;患者数据仓库分类数据包括病例数据、医嘱数据、检验数据、检查数据与手术数据。
进一步,专病信息的特征属性包括若干个维度,包括患者基本信息、体征数据、病例数据、手术数据、检验数据、检查数据、护理数据、医嘱数据、用药数据与输血数据。
进一步,汇聚临床诊疗数据,使用数据库管理系统构建专病数据库,数据库管理系统为MySQL系统或MongoDB系统。
进一步,循环神经网络模型为RNN模型;RNN模型包括输入层、隐藏层和输出层;输入层将专病文本数据的向量表示作为输入信息传递给RNN模型;专病文本数据通过预处理,对文本格式进行转化;隐藏层是捕捉序列数据中的上下文信息,输出层是一个全连接层,将RNN模型的输出转化为最终的预测结果,根据任务类型选择激活函数和损失函数,对于分类任务,使用交叉熵损失函数;对于回归任务,使用均方误差损失函数。
进一步,设为注意力单元的第/>个输出,/>为激活函数,/>为通道数;则循环神经网络模型的激活函数为:
。
进一步,设为损失函数,/>为样本数量,/>为第/>个样本的标签,/>为第/>个样本经循环神经网络模型处理后对应的输出,/>为对数函数,则循环神经网络模型的损失函数为:
。
本发明的有益效果是:本发明基于临床诊疗数据自动构建专病标准数据库,能够解决医院在专病管理和临床决策方面的问题,本发明能够获取标准化、准确的专病数据,为医院提供便捷的专病管理工具,有助于医生快速了解患者的病情、治疗方案和预后等信息;专病标准数据库可以作为临床决策支持系统的基础和依据,为医生提供科学、个性化的诊疗方案和治疗指导,提高医疗质量和患者满意度;利用构建好的专病标准数据库对大量的临床诊疗数据进行数据挖掘和分析,能够应用于临床决策支持系统、疾病预测和预防、临床研究和临床指南等领域,为医生和患者提供更准确、科学的诊疗方案和医学决策支持,提高疾病的预防和控制能力,提升医院的专病管理效能,改善临床决策水平,促进医疗质量的提升和医疗资源的合理利用。
附图说明
图1为本发明提供的基于患者数据的专病标准数据库自动构建方法的原理图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
作为一个实施例,如附图1所示,为解决上述技术问题,本实施例提供基于患者数据的专病标准数据库自动构建方法,包括:
获取专病标准数据集,结合电子病历基本数据集规范,建立专病标准数据集的数据库的结构模型;
定义数据特征属性;数据专用属性包括数据元名称、数据元标识、数据类型、数据表示格式、数据元值域与数据分类参考标准;
数据汇聚与预处理,包括:汇聚临床诊疗数据到患者数据仓库,对临床诊疗数据进行治理得到标准化数据;例如:汇聚患者诊疗数据,采用ETL汇聚临床数据到患者数据仓库,形成患者诊断数据、基本信息数据、检查数据、检验数据、病历数据等诊疗分类数据。
通过患者主索引,汇聚临床诊疗数据如门诊、急诊、住院等数据,按就诊时间汇聚本次就诊的门诊病历、处方、医嘱、药品、住院病历、诊断、检查、检验、病案首页等数据,所有这些数据汇聚在一起,就是患者数据。
数据治理得到标准化数据;对患者基本数据进行数据治理,对数据进行验证,包括:判断数据是否为空,验证数据是否有效,验证数据长度,对数据按照标准库进行标准转换,标准库如GB2261-1980标准库,如表1所示。
表1 标准库如GB2261-1980标准库
数据提取,包括:利用自然语言处理与文本挖掘的方法从标准化数据中提取专病信息的特征属性,得到专病文本数据;
对标准化数据进行标注;例如身份证号标签、性别标签、地址标签、电话标签,得到测试A为患者姓名标签,51********61为身份证号标签,女性别标签为,xx县为地址标签,189********9为电话标签,腹痛1天为症状表现标签,到医院就诊为行为标签。
采用循环神经网络模型,自动构建专病数据库,包括:
对专病文本数据进行预处理,将预处理后的专病文本数据转化为向量,构建专病循环神经网络模型;
将每个时间步的向量作为输入信息输入循环神经网络模型进行序列建模;
利用标注后的专病数据对循环神经网络模型进行训练;
利用循环神经网络模型对未标注的专病数据进行预测,得到每个文本数据的类别作为预测结果;
将预测结果整理为专病数据矩阵队列,专病数据矩阵队列的行表示每个文本数据的预测结果,专病数据矩阵队列的列表示每个类别或任务的预测结果;
例:专病数据矩阵队列,名称:胃癌;子集内容:患者基本信息、就诊记录、病史、体格检查、专科检查、诊断、检验、检查、手术治疗、病理、不良反应等。如表2、表3和表4所示。
表2 疾病(胃癌-基本信息)矩阵队列
表3 疾病(胃癌-就诊记录)矩阵队列
表4 疾病(胃癌-检验记录)矩阵队列
将专病数据矩阵队列,输出到专病数据库的队列,持续写入到专病数据库。
可选的,专病标准数据集包括数据集名称、数据子集名称、数据元名称与值域。
可选的,数据库的结构模型,包括:通过一个根节点表示专病类型,每个子节点表示该专病类型下的病例或诊疗方案;通过使用表格来表示数据,在专病数据库中,使用关系模型建立多个表格来存储专病相关的数据;每个表格代表一个实体类,实体类包括病例与治疗方案,列代表人员信息,行代表人员信息的属性,通过定义表格之间的关系和外键约束,对数据进行联接和关联操作。
可选的,对临床诊疗数据进行治理包括数据清洗、转化与标准化数据处理,去除冗余信息与错误数据,统一数据格式与单位,以及进行编码处理。
可选的,临床诊疗数据包括临床诊断记录、病例报告与医疗文献;专病信息包括病种信息、病例特征、诊断标准与治疗方案;患者数据仓库分类数据包括病例数据、医嘱数据、检验数据、检查数据与手术数据。
可选的,专病信息的特征属性包括若干个维度,包括患者基本信息、体征数据、病例数据、手术数据、检验数据、检查数据、护理数据、医嘱数据、用药数据与输血数据。
汇聚多个维度的专病信息特征数据,实现专病数据库的自动构建,有利于为临床和科研提供可靠的数据支持服务。
可选的,汇聚临床诊疗数据,使用数据库管理系统构建专病数据库,数据库管理系统为MySQL系统或MongoDB系统。
可选的,循环神经网络模型为RNN模型;RNN模型包括输入层、隐藏层和输出层;输入层将专病文本数据的向量表示作为输入信息传递给RNN模型;专病文本数据通过预处理,对文本格式进行转化;隐藏层是捕捉序列数据中的上下文信息,输出层是一个全连接层,将RNN模型的输出转化为最终的预测结果,根据任务类型选择激活函数和损失函数,对于分类任务,使用交叉熵损失函数;对于回归任务,使用均方误差损失函数。
在实际应用过程中,创建一个循环神经网络模型,定义输入层,添加一个或多个RNN层,可堆叠多层RNN以提高模型性能。RNN模型包括输入层、隐藏层和输出层;在输入层中,每个时间步将专病文本数据的向量表示作为输入信息输入RNN模型;在隐藏层中,使用LSTM或者GRU结构来捕捉序列数据中的上下文信息;输出层为一个全连接层;全连接层为分类层或者回归层。
输入层:负责将专病文本数据的向量表示作为输入信息传递给模型。专病文本数据的预处理步骤,包括文本分词、向量化等,以将文本转化为模型可接受的格式。
输入层的详细实现步骤:
(1)文本向量化:将专病文本数据转化为词向量或字符向量表示。通过使用词嵌入(Word Embeddings)技术,如Word2Vec、GloVe或使用预训练的深度学习模型(如BERT)来实现。每个词或字符将映射为一个固定长度的向量。
(2)时间步设置:将序列数据分为多个时间步(time steps)。每个时间步表示模型在处理序列数据时的一个时间点。例如,如果文本数据有100个词,可以将其分成10个时间步,每个时间步包含10个词。
(3)序列输入: 将每个时间步的向量表示作为输入信息传递给RNN模型。通过将每个时间步的向量依次输入到RNN模型中来实现。RNN模型将会根据序列的顺序来捕捉数据中的上下文信息。
隐藏层:用于捕捉序列数据中的上下文信息。在隐藏层中,通常使用LSTM(LongShort-Term Memory,长短期记忆)或GRU(Gated Recurrent Unit,门控循环神经网络)等结构来处理数据。这些结构具有记忆机制,可以有效地处理长序列,并防止梯度消失问题。
隐藏层中使用LSTM结构的实现步骤:
(1)LSTM结构选择:选择LSTM作为RNN模型的隐藏层结构。LSTM包括三个关键门控单元:遗忘门、输入门和输出门,可以帮助模型捕捉长期依赖关系。
(2)初始化隐藏状态: 在处理序列数据之前,需要初始化LSTM的隐藏状态。隐藏状态是LSTM用来存储先前时间步的信息的地方。
(3)时间步处理: 将每个时间步的输入数据和上一个时间步的隐藏状态输入到LSTM中。LSTM将根据输入数据和先前的隐藏状态来计算新的隐藏状态,同时生成一个输出。
(4)循环处理: 重复上述时间步处理过程,直到处理完整个序列。每个时间步的隐藏状态都包含了先前时间步的信息,因此模型能够捕捉到数据中的上下文信息。
输出层:负责将RNN模型的输出转化为最终的预测结果。输出层通常是一个全连接层,根据任务类型(分类或回归)来选择不同的激活函数和损失函数。
输出层的实现步骤:
(1)全连接层:在全连接层中,将隐藏层的输出连接到一个或多个神经元。这些神经元将计算出最终的预测值。
(2)激活函数:根据任务类型选择适当的激活函数。例如,对于分类任务,使用激活函数,对于回归任务,可以不使用激活函数。
可选的,设为注意力单元的第/>个输出,/>为激活函数,/>为通道数;则循环神经网络模型的激活函数为:
。
可选的,设为损失函数,/>为样本数量,/>为第/>个样本的标签,/>为第/>个样本经循环神经网络模型处理后对应的输出,/>为对数函数,则循环神经网络模型的损失函数为:
。
训练模型: 使用反向传播算法和优化器来训练模型。模型将根据损失函数优化参数,以使预测结果尽量接近真实值。根据循环神经网络模型的预测结果计算损失并进行反向传播,进而更新循环神经网络模型的参数。
本发明基于临床诊疗数据自动构建专病标准数据库,能够解决医院在专病管理和临床决策方面的问题,本发明能够获取标准化、准确的专病数据,为医院提供便捷的专病管理工具,有助于医生快速了解患者的病情、治疗方案和预后等信息;专病标准数据库可以作为临床决策支持系统的基础和依据,为医生提供科学、个性化的诊疗方案和治疗指导,提高医疗质量和患者满意度;利用构建好的专病标准数据库对大量的临床诊疗数据进行数据挖掘和分析,能够应用于临床决策支持系统、疾病预测和预防、临床研究和临床指南等领域,为医生和患者提供更准确、科学的诊疗方案和医学决策支持,提高疾病的预防和控制能力,提升医院的专病管理效能,改善临床决策水平,促进医疗质量的提升和医疗资源的合理利用。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.基于患者数据的专病标准数据库自动构建方法,其特征在于,包括:
获取专病标准数据集,结合电子病历基本数据集规范,建立专病标准数据集的数据库的结构模型,包括:通过一个根节点表示专病类型,每个子节点表示该专病类型下的病例或诊疗方案;通过使用表格来表示数据,在专病数据库中,使用关系模型建立多个表格来存储专病相关的数据;每个表格代表一个实体类,实体类包括病例与治疗方案,列代表人员信息,行代表人员信息的属性,通过定义表格之间的关系和外键约束,对数据进行联接和关联操作;
定义数据特征属性;数据专用属性包括数据元名称、数据元标识、数据类型、数据表示格式、数据元值域与数据分类参考标准;
数据汇聚与预处理,包括:汇聚临床诊疗数据到患者数据仓库,对临床诊疗数据进行治理得到标准化数据;
数据提取,包括:利用自然语言处理与文本挖掘的方法从标准化数据中提取专病信息的特征属性,得到专病文本数据;
对标准化数据进行标注;
采用循环神经网络模型,自动构建专病数据库,包括:
对专病文本数据进行预处理,将预处理后的专病文本数据转化为向量,构建专病循环神经网络模型;
将每个时间步的向量作为输入信息输入循环神经网络模型进行序列建模;
利用标注后的专病数据对循环神经网络模型进行训练;
利用循环神经网络模型对未标注的专病数据进行预测,得到每个文本数据的类别作为预测结果;
将预测结果整理为专病数据矩阵队列,专病数据矩阵队列的行表示每个文本数据的预测结果,专病数据矩阵队列的列表示每个类别或任务的预测结果;
将专病数据矩阵队列,输出到专病数据库的队列,持续写入到专病数据库。
2.根据权利要求1所述基于患者数据的专病标准数据库自动构建方法,其特征在于,专病标准数据集包括数据集名称、数据子集名称、数据元名称与值域。
3.根据权利要求1所述基于患者数据的专病标准数据库自动构建方法,其特征在于,对临床诊疗数据进行治理包括数据清洗、转化与标准化数据处理,去除冗余信息与错误数据,统一数据格式与单位,以及进行编码处理。
4.根据权利要求1所述基于患者数据的专病标准数据库自动构建方法,其特征在于,临床诊疗数据包括临床诊断记录、病例报告与医疗文献;专病信息包括病种信息、病例特征、诊断标准与治疗方案;患者数据仓库分类数据包括病例数据、医嘱数据、检验数据、检查数据与手术数据。
5.根据权利要求1所述基于患者数据的专病标准数据库自动构建方法,其特征在于,专病信息的特征属性包括若干个维度,包括患者基本信息、体征数据、病例数据、手术数据、检验数据、检查数据、护理数据、医嘱数据、用药数据与输血数据。
6.根据权利要求1所述基于患者数据的专病标准数据库自动构建方法,其特征在于,汇聚临床诊疗数据,使用数据库管理系统构建专病数据库,数据库管理系统为MySQL系统或MongoDB系统。
7.根据权利要求1所述基于患者数据的专病标准数据库自动构建方法,其特征在于,循环神经网络模型为RNN模型;RNN模型包括输入层、隐藏层和输出层;输入层将专病文本数据的向量表示作为输入信息传递给RNN模型;专病文本数据通过预处理,对文本格式进行转化;隐藏层是捕捉序列数据中的上下文信息,输出层是一个全连接层,将RNN模型的输出转化为最终的预测结果,根据任务类型选择激活函数和损失函数,对于分类任务,使用交叉熵损失函数;对于回归任务,使用均方误差损失函数。
8.根据权利要求1所述基于患者数据的专病标准数据库自动构建方法,其特征在于,设为注意力单元的第/>个输出,/>为激活函数,/>为通道数;则循环神经网络模型的激活函数为:
。
9.根据权利要求1所述基于患者数据的专病标准数据库自动构建方法,其特征在于,设为损失函数,/>为样本数量,/>为第/>个样本的标签,/>为第/>个样本经循环神经网络模型处理后对应的输出,/>为对数函数,则循环神经网络模型的损失函数为:
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410028601.7A CN117542467B (zh) | 2024-01-09 | 2024-01-09 | 基于患者数据的专病标准数据库自动构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410028601.7A CN117542467B (zh) | 2024-01-09 | 2024-01-09 | 基于患者数据的专病标准数据库自动构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117542467A CN117542467A (zh) | 2024-02-09 |
CN117542467B true CN117542467B (zh) | 2024-04-12 |
Family
ID=89794194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410028601.7A Active CN117542467B (zh) | 2024-01-09 | 2024-01-09 | 基于患者数据的专病标准数据库自动构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117542467B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117831701A (zh) * | 2024-03-01 | 2024-04-05 | 四川互慧软件有限公司 | 一种基于规则引擎的电子病例质控方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017151757A1 (en) * | 2016-03-01 | 2017-09-08 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Recurrent neural feedback model for automated image annotation |
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
CN113626413A (zh) * | 2021-08-16 | 2021-11-09 | 电子科技大学 | 一种专病数据库构建方法及系统 |
CN114818720A (zh) * | 2022-06-23 | 2022-07-29 | 北京惠每云科技有限公司 | 一种专病数据集构建方法、装置、电子设备及存储介质 |
CN117079757A (zh) * | 2023-07-12 | 2023-11-17 | 电子科技大学 | 一种基于多模态融合的自闭症特征数据库系统 |
CN117316466A (zh) * | 2023-11-28 | 2023-12-29 | 中国人民解放军总医院 | 一种基于知识图谱与自然语言处理技术的临床决策方法、系统及设备 |
-
2024
- 2024-01-09 CN CN202410028601.7A patent/CN117542467B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017151757A1 (en) * | 2016-03-01 | 2017-09-08 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Recurrent neural feedback model for automated image annotation |
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
CN113626413A (zh) * | 2021-08-16 | 2021-11-09 | 电子科技大学 | 一种专病数据库构建方法及系统 |
CN114818720A (zh) * | 2022-06-23 | 2022-07-29 | 北京惠每云科技有限公司 | 一种专病数据集构建方法、装置、电子设备及存储介质 |
CN117079757A (zh) * | 2023-07-12 | 2023-11-17 | 电子科技大学 | 一种基于多模态融合的自闭症特征数据库系统 |
CN117316466A (zh) * | 2023-11-28 | 2023-12-29 | 中国人民解放军总医院 | 一种基于知识图谱与自然语言处理技术的临床决策方法、系统及设备 |
Non-Patent Citations (6)
Title |
---|
Fabrication and characterization of strontium-hydroxyapatite/silk fibroin biocomposite nanospheres for bone-tissue engineering applications;Wang, LP (Wang, Liping); Pathak, JL (Pathak, Janak L.); Liang, DL (Liang, Dongliang); Zhong, NY (Zhong, Ningying); Guan, HB (Guan, Hongbing); Wan, MJ (Wan, Mianjia); Miao, GH (Miao, Guohou) ; Li, ZM (Li, Zhengmao); Ge, LH (Ge, Linhu);INTERNATIONAL JOURNAL OF BIOLOGICAL MACROMOLECULES;20220218(第1期);366-375 * |
Liang, DL (Liang, Dongliang) * |
Wang, LP (Wang, Liping) ; Pathak, JL (Pathak, Janak L.) * |
Workflow model based on colored and timed Petri nets;Li Li; Xiaobo Yue; Bozhao Yan; Kaiqing Zhou;;2011 International Conference on Consumer Electronics, Communications and Networks (CECNet);20110706(第7期);3795-8 * |
Zhong, NY (Zhong, Ningying) * |
基于多通道自注意力机制的电子病历实体关系抽取;宁尚明;滕飞;李天瑞;;计算机学报;20200515(第05期);164-177 * |
Also Published As
Publication number | Publication date |
---|---|
CN117542467A (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shickel et al. | Deep EHR: a survey of recent advances in deep learning techniques for electronic health record (EHR) analysis | |
US10929420B2 (en) | Structured report data from a medical text report | |
CN109920501B (zh) | 基于卷积神经网络和主动学习的电子病历分类方法及系统 | |
Darabi et al. | Taper: Time-aware patient ehr representation | |
US20240203599A1 (en) | Method and system of for predicting disease risk based on multimodal fusion | |
US20200265931A1 (en) | Systems and methods for coding health records using weighted belief networks | |
WO2020006495A1 (en) | Deep learning-based diagnosis and referral of diseases and disorders using natural language processing | |
JP6916310B2 (ja) | 人間参加型対話式モデル訓練 | |
CN117542467B (zh) | 基于患者数据的专病标准数据库自动构建方法 | |
CN109994216A (zh) | 一种基于机器学习的icd智能诊断编码方法 | |
Bardak et al. | Improving clinical outcome predictions using convolution over medical entities with multimodal learning | |
US20230178199A1 (en) | Method and system of using hierarchical vectorisation for representation of healthcare data | |
US20220293272A1 (en) | Machine-learning-based healthcare system | |
Wanyan et al. | Deep learning with heterogeneous graph embeddings for mortality prediction from electronic health records | |
CN118116611B (zh) | 基于多源医养大数据融合集成的数据库构建方法 | |
CN115995281A (zh) | 一种基于数据治理的专病数据库的数据检索方法及装置 | |
CN115482901A (zh) | 用于将医学文本报告分割到区段中的方法和设备 | |
Leng et al. | Bi-level artificial intelligence model for risk classification of acute respiratory diseases based on Chinese clinical data | |
Chen et al. | Entity relation extraction from electronic medical records based on improved annotation rules and BiLSTM-CRF | |
CN110060749B (zh) | 基于sev-sdg-cnn的电子病历智能诊断方法 | |
Lal et al. | NLP chatbot for Discharge Summaries | |
CN116227478A (zh) | 面向DRGs支付的诊断依据发现方法及系统 | |
Yanling et al. | Research on entity recognition and knowledge graph construction based on TCM medical records | |
Harerimana et al. | HSGA: A Hybrid LSTM-CNN Self-Guided Attention to predict the future diagnosis from discharge narratives | |
Nguyen-Chi et al. | Integration of AI and SNOMED CT in Chest X-Ray Diagnosis Software System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |