CN117059231A - 用于机器学习中医医案的方法及智能诊疗系统 - Google Patents
用于机器学习中医医案的方法及智能诊疗系统 Download PDFInfo
- Publication number
- CN117059231A CN117059231A CN202311300772.2A CN202311300772A CN117059231A CN 117059231 A CN117059231 A CN 117059231A CN 202311300772 A CN202311300772 A CN 202311300772A CN 117059231 A CN117059231 A CN 117059231A
- Authority
- CN
- China
- Prior art keywords
- traditional chinese
- chinese medicine
- data set
- neural network
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000003814 drug Substances 0.000 title claims abstract description 145
- 238000003745 diagnosis Methods 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000010801 machine learning Methods 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 67
- 238000003062 neural network model Methods 0.000 claims abstract description 60
- 238000012216 screening Methods 0.000 claims abstract description 4
- 229940079593 drug Drugs 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000013145 classification model Methods 0.000 claims description 6
- 208000024891 symptom Diseases 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 239000008280 blood Substances 0.000 claims description 3
- 210000004369 blood Anatomy 0.000 claims description 3
- 230000036760 body temperature Effects 0.000 claims description 3
- 238000009533 lab test Methods 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000001356 surgical procedure Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 10
- 210000000952 spleen Anatomy 0.000 description 5
- 208000019229 Spleen disease Diseases 0.000 description 4
- 208000016644 chronic atrophic gastritis Diseases 0.000 description 4
- 208000027140 splenic disease Diseases 0.000 description 4
- 208000018556 stomach disease Diseases 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000007721 medicinal effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000008155 medical solution Substances 0.000 description 1
- 230000009854 mucosal lesion Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/90—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pharmacology & Pharmacy (AREA)
- Alternative & Traditional Medicine (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种用于机器学习中医医案诊疗的模型训练方法,包括:采集中医医案及专科门诊电子病历;根据专科门诊电子病历的属性信息提取中医医案的结构化信息,生成带标签的中医数据集、不带标签的中医数据集;使用带标签数据集训练得到第一神经网络模型;将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,筛选训练值大于第一预定阈值的不带标签数据集作为候选数据集;使用带标签数据集和候选数据集训练得到第二神经网络模型。本发明通过第二次主动学习可以极大的减少人工介入的工作量,并实现模型自动选择能带来最大增益的样本进行训练,提高模型的性能。
Description
技术领域
本发明属于模型训练技术领域,尤其是涉及一种用于机器学习中医医案诊疗的模型训练方法、中医智能诊疗系统以及中医诊疗设备。
背景技术
目前,西医治疗由于其用药以及诊疗流程的规范性,在各医院门诊广泛应用,但是对于某些病症,西医并没有很好的医疗效果,比如主要针对一些不适症状的治疗,无明确的逆转效果,中医在一些病症方面,具有显著的医疗效果,比如中医药治疗慢性萎缩性胃炎效果就非常显著,不仅能明显缓解患者症状,还能延缓与逆转其黏膜病变,但是也是一部分中医,尤其是一些名中医治疗效果显著,而有的中医治疗方案普遍精准化不高,疗效评价水平也不客观化。
从现代信息技术角度来看,中医医疗领域的数据资源丰富,但中医文献及各类医书病案都缺少统一的结构数据,而且中医在诊疗上也有一定的个人主观性,因此一些诊疗方案难以复制、推广,通过训练模型用于疾病的诊断和治疗是解决上述问题主要手段,因此亟须一种中医诊疗模型训练方法训练中医诊疗模型用于患者的诊断和治疗,此外,由于中医诊疗的特殊性,要求机器学习具有高度的异构模型汇总能力,集成学习的方式能够很好的模拟中医中的“异病同治”和“同病异治”的特征,通过一定的规则生成多个学习器(即“弱学习器”),再采用集成策略对多个学习器进行组合,形成精度更好的“强学习器”,最后综合判断输出最终结果。
发明内容
有鉴于此,本发明旨在提出一种用于机器学习中医医案诊疗的模型训练方法、中医智能诊疗系统以及中医诊疗设备,以期解决上述部分技术问题中的至少之一。
为达到上述目的,本发明的技术方案是这样实现的:
本发明第一方面提供了一种用于机器学习中医医案诊疗的模型训练方法,包括以下步骤:
S1、采集中医医案及专科门诊电子病历;
S2、根据专科门诊电子病历的属性信息提取中医医案的结构化信息,生成带标签的中医数据集、不带标签的中医数据集;
S3、使用带标签数据集训练得到第一神经网络模型;
S4、将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,筛选训练值大于第一预定阈值的不带标签数据集作为候选数据集;
S5、使用带标签数据集和候选数据集训练得到第二神经网络模型。
进一步的,所述训练方法还包括以下步骤:
S6、计算第一神经网络模型和第二神经网络模型的性能差值;
如果性能差值大于第二预定阈值,则将候选数据集对应不带标签数据集的数据添加标签并转移至带标签的中医数据集;
如果性能差值小于第二预定阈值,则将候选数据集添加人工标注并转移至带标签的中医数据集;
S7、将步骤S6得到的带标签的中医数据集训练第一神经网络模型和第二神经网络模型中性能高的形成中医诊疗模型。
进一步的,所述S3中,使用带标签数据集训练得到第一神经网络模型包括以下步骤:
S31、使用自注意力模型对病情描述进行特征提取,其中自注意力操作定义为,,其中/>分别表示query和key特征,V表示value特征;
S32、将得到特征通过一个sigmoid模块和一层线性回归层,得到中医诊疗模型,其中将特征映射在0-1的范围内表示用某一味药的概率,线性回归层,表示某一味药物的剂量。
进一步的,所述S3中,使用带标签数据集训练得到第一神经网络模型,按照主题分类进行机器学习。
进一步的,所述不带标签的中医数据集包括缺失属性的病例数据;
所述第一神经网络模型为分类模型或者回归模型;
所述第二神经网络模型为分类模型或者回归模型。
进一步的,所述S4中,将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,训练值包括比较每一条不带标签的中医数据与对应的输出的相似度。
本发明第二方面提供了一种中医智能诊疗系统,包括:
数据采集模块,其被配置为采集中医医案及专科门诊电子病历;
数据结构化模块,其被配置为根据专科门诊电子病历的属性信息提取中医医案的结构化信息,生成带标签的中医数据集、不带标签的中医数据集;
第一神经网络模块,其被配置为使用带标签数据集训练得到第一神经网络模型;
候选数据集生成模块,其被配置为将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,筛选训练值大于第一预定阈值的不带标签数据集作为候选数据集;
第二神经网络模块,其被配置为使用带标签数据集和候选数据集训练得到第二神经网络模型;
模型性能分析模块,其被配置为计算第一神经网络模型和第二神经网络模型的性能差值。
进一步的,所述中医智能诊疗系统还包括:
数据集调整模块,其被配置为如果性能差值大于第二预定阈值,则将候选数据集对应不带标签数据集的数据添加标签并转移至带标签的中医数据集;
如果性能差值小于第二预定阈值,则将候选数据集添加人工标注并转移至带标签的中医数据集;
中医诊疗模块,其被配置为将数据集调整模块得到的带标签的中医数据集训练第一神经网络模型和第二神经网络模型中性能高的形成中医诊疗模型。
本发明第三方面提供了一种中医诊疗设备,包括:
中医智能诊疗系统,所述中医诊疗模型训练装置为第二方面所述的中医智能诊疗系统;
诊断模块,其被配置为采集患者就诊信息,并将就诊数据输入至中医诊疗模型生产诊断结果和治疗方案。
进一步的,所述患者就诊数据包括:
基本信息数据,患者姓名、性别、年龄等基本属性信息数据;
主诉信息数据,患者就诊时的主要症状和求医原因描述信息数据;
既往史信息数据,患者的疾病史和手术史等相关信息数据;
体格检查信息数据,通过检查得出的体征信息,如体温、脉搏数据;
实验室检查信息数据,相关检查项目如血常规、生化数据;
图像检查信息数据,CT、MRI等影像检查数据。
相对于现有技术,本发明所述的一种中医诊疗模型训练方法具有以下有益效果:
本发明所述的一种中医诊疗模型训练方法,第二次主动学习可以极大的减少人工介入的工作量,并实现模型自动选择能带来最大增益的样本进行训练,提高模型的性能。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例所述的训练方法流程示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
下面将参考附图并结合实施例来详细说明本发明。
如图1所示,一种用于机器学习中医医案诊疗的模型训练方法,包括以下步骤:
S1、采集中医医案及专科门诊电子病历;
S2、根据专科门诊电子病历的属性信息提取中医医案的结构化信息,生成带标签的中医数据集、不带标签的中医数据集;
S3、使用带标签数据集训练得到第一神经网络模型;
S4、将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,筛选训练值大于第一预定阈值的不带标签数据集作为候选数据集;
S5、使用带标签数据集和候选数据集训练得到第二神经网络模型。
训练方法还包括以下步骤:
S6、计算第一神经网络模型和第二神经网络模型的性能差值;
如果性能差值大于第二预定阈值,则将候选数据集对应不带标签数据集的数据添加标签并转移至带标签的中医数据集;
如果性能差值小于第二预定阈值,则将候选数据集添加人工标注并转移至带标签的中医数据集;
S7、将步骤S6得到的带标签的中医数据集训练第一神经网络模型和第二神经网络模型中性能高的形成中医诊疗模型。
S2中,根据专科门诊电子病历的属性信息提取中医医案的结构化信息,生成带标签的中医数据集、不带标签的中医数据集、测试数据集;
S3中,使用带标签数据集训练得到第一神经网络模型包括以下步骤:
S31、使用自注意力模型对病情描述进行特征提取,其中自注意力操作定义为,,其中/>分别表示query和key特征,V表示value特征;
S32、将得到特征通过一个sigmoid模块和一层线性回归层,得到中医诊疗模型,其中将特征映射在0-1的范围内表示用某一味药的概率,线性回归层,表示某一味药物的剂量。
S3中,使用带标签数据集训练得到第一神经网络模型,按照主题分类进行机器学习。
不带标签的中医数据集包括缺失属性的病例数据;
第一神经网络模型为分类模型或者回归模型;
第二神经网络模型为分类模型或者回归模型。
S4中,将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,训练值包括比较每一条不带标签的中医数据与对应的输出的相似度。
根据带标签的中医数据集、专科门诊电子病历、医疗历史文献数据构建统一视图的结构化中医数据库。
工作过程:
本发明以名中医的治疗慢性萎缩性胃炎医案为基点,纳入临床有效病例、中医学文献有效病例,建立中医干预的中医诊疗设备,模拟名老中医诊疗思维和用药特点,为临床慢性萎缩性胃炎患者提供个体化、精准化中医治疗方案。
主要以名中医治疗某一疾病的成功经验为基点,以现实世界中该疾病门诊有效病例和医学文献中关于该疾病中医治疗的有效病例为补充,建立中医干预该疾病的中医诊疗设备。
利用人工智能算法,发掘与总结针对该疾病的中医诊治规律及遣方用药规律,模拟名老中医诊疗思维和用药特点,为该疾病的中医个体化、精准化用药提供思路。
以名老中医宗修英的脾胃病医案为基点,纳入临床有效病例、中医学文献有效病例,建立中医干预CAG的人工智能诊疗系统,模拟名老中医诊疗思维和用药特点,为临床慢性萎缩性胃炎患者的提供个体化、精准化中医治疗方案。
S1、采集中医医案及专科门诊电子病历,中医医案及专科门诊电子病历的数据来源及收集,获取的数据资源如下:
a.历史数据:名老中医宗修英医案电子资料。
b.临床数据:多中心“脾胃专病”门诊开设以来治疗有效的CAG患者就医记录,包含门诊全部医疗数据。
c.医疗文献数据:对PubMed、EMbase数据库(医学专业数据库)中CAG中医文献进行提取和集成。
其中数据b和数据c作为人工智能算法中必需的数据对照。
针对中医数据的特征,我们采用基于现代诊疗文本中的“性别”、“年龄”、“病症”、“处方”等属性对中医病历进行自动提取,按照数据的属性信息形成结构,通过数据的结构提取和集成,将海量非结构化的中医数据生成统一的结构化数据库。系统通过主动学习机制选取名老中医宗修英医案中脾胃病病例、 “脾胃专病”门诊CAG患者电子病历、互联网中医文献的属性进行学习,自主构建特征库并实现实时、准确的结构提取。
从现代诊疗文本中自动提取结构化中医病历,系统自动提取发现了“性别”、“年龄”、“病症”、“处方”等属性结构。同时面向大量的历史数据(即名老中医宗修英医案中脾胃病记录),分析其在表述病例时的诊断特征和处方特征,从中提取与现代诊断CAG数据相同的属性。对于缺失属性较多的病例进行数据的填充和清洗,传统方式一般是在训练中直接将这些数据删除,但本发明运用主动学习的方式,充分利用这些数据帮助模型的训练。
我们设计了统一视图的中医数据提取与组织方法,包括面向属性的结构自动提取、面向主题的分类等技术,临床病历数据、医疗历史文献数据集成到一个统一的大数据管理和分析平台中,构建了统一视图下的结构化中医数据库。
利用主动学习的方式,获取传统医案中的高质量数据,得到具有因人而异的个性分析能力的诊疗方案,主动集成学习反馈器与主动学习探测器之间的互动形成了无缝融合的主动集成学习机制。具体来说,传统的集成学习是人工选取适当的模型集合作为集成学习的第一层算法输入,而我们提出的主动集成学习是分析外界目标的模式变化,当差异性达到第一预设阈值时,主动重构第一层算法。这使得集成模型伴随外界变化,始终处于自适应状态中。
在经过主动学习获取了样本后,系统将样本送入集成学习的第一层,即由卷积神经网络、决策树、贝叶斯等算法产生第一层的模型,并将其作为第二次的输入。第二层的强学习器则根据首层的输入模型再做第二次集成训练,从而得到更为准确的学习模型。为了保证模型的有效性,一般预留出部分病例作为测试数据集对中医诊疗模型进行验证。
第二次主动学习可以极大的减少人工介入的工作量,并实现模型自动选择能带来最大增益的样本进行训练,提高模型的性能。
一种中医诊疗模型训练装置,包括:
数据采集模块,其被配置为采集中医医案及专科门诊电子病历;
数据结构化模块,其被配置为根据专科门诊电子病历的属性信息提取中医医案的结构化信息,生成带标签的中医数据集、不带标签的中医数据集;
第一神经网络模块,其被配置为使用带标签数据集训练得到第一神经网络模型;
候选数据集生成模块,其被配置为将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,筛选训练值大于第一预定阈值的不带标签数据集作为候选数据集;
第二神经网络模块,其被配置为使用带标签数据集和候选数据集训练得到第二神经网络模型;
模型性能分析模块,其被配置为计算第一神经网络模型和第二神经网络模型的性能差值。
中医诊疗模型训练装置还包括:
数据集调整模块,其被配置为如果性能差值大于第二预定阈值,则将候选数据集对应不带标签数据集的数据添加标签并转移至带标签的中医数据集;
如果性能差值小于第二预定阈值,则将候选数据集添加人工标注并转移至带标签的中医数据集;
中医诊疗模块,其被配置为将数据集调整模块得到的带标签的中医数据集训练第一神经网络模型和第二神经网络模型中性能高的形成中医诊疗模型。
一种中医诊疗设备,包括:
中医诊疗模型训练装置,中医诊疗模型训练装置为上述的中医诊疗模型训练装置;
诊断模块,其被配置为采集患者就诊信息,并将就诊数据输入至中医诊疗模型生产诊断结果和治疗方案。
患者就诊数据包括:
基本信息数据,患者姓名、性别、年龄等基本属性信息数据;
主诉信息数据,患者就诊时的主要症状和求医原因描述信息数据;
既往史信息数据,患者的疾病史和手术史等相关信息数据;
体格检查信息数据,通过检查得出的体征信息,如体温、脉搏数据;
实验室检查信息数据,相关检查项目如血常规、生化数据;
图像检查信息数据,CT、MRI等影像检查数据。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用于机器学习中医医案诊疗的模型训练方法,其特征在于,包括以下步骤:
S1、采集中医医案及专科门诊电子病历;
S2、根据专科门诊电子病历的属性信息提取中医医案的结构化信息,生成带标签的中医数据集、不带标签的中医数据集;
S3、使用带标签数据集训练得到第一神经网络模型;
S4、将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,筛选训练值大于第一预定阈值的不带标签数据集作为候选数据集;
S5、使用带标签数据集和候选数据集训练得到第二神经网络模型。
2.根据权利要求1所述的模型训练方法,其特征在于,所述模型训练方法还包括以下步骤:
S6、计算第一神经网络模型和第二神经网络模型的性能差值;
如果性能差值大于第二预定阈值,则将候选数据集对应不带标签数据集的数据添加标签并转移至带标签的中医数据集;
如果性能差值小于第二预定阈值,则将候选数据集添加人工标注并转移至带标签的中医数据集;
S7、将步骤S6得到的带标签的中医数据集训练第一神经网络模型和第二神经网络模型中性能高的形成中医诊疗模型。
3.根据权利要求1所述的模型训练方法,其特征在于,所述S3中,使用带标签数据集训练得到第一神经网络模型包括以下步骤:
S31、使用自注意力模型对病情描述进行特征提取,其中自注意力操作定义为,,其中/>分别表示query和key特征,V表示value特征;
S32、将得到特征通过一个sigmoid模块和一层线性回归层,得到中医诊疗模型,其中将特征映射在0-1的范围内表示用某一味药的概率,线性回归层,表示某一味药物的剂量。
4.根据权利要求2所述的模型训练方法,其特征在于:所述S3中,使用带标签数据集训练得到第一神经网络模型,按照主题分类进行机器学习。
5.根据权利要求1所述的一种中医诊疗模型训练方法,其特征在于:所述不带标签的中医数据集包括缺失属性的病例数据;
所述第一神经网络模型为分类模型或者回归模型;
所述第二神经网络模型为分类模型或者回归模型。
6.根据权利要求2所述的模型训练方法,其特征在于:所述S4中,将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,训练值包括比较每一条不带标签的中医数据与对应的输出的相似度。
7.一种中医智能诊疗系统,其特征在于,包括:
数据采集模块,其被配置为采集中医医案及专科门诊电子病历;
数据结构化模块,其被配置为根据专科门诊电子病历的属性信息提取中医医案的结构化信息,生成带标签的中医数据集、不带标签的中医数据集;
第一神经网络模块,其被配置为使用带标签数据集训练得到第一神经网络模型;
候选数据集生成模块,其被配置为将不带标签数据集输入训练完毕的第一神经网络模型计算训练值,筛选训练值大于第一预定阈值的不带标签数据集作为候选数据集;
第二神经网络模块,其被配置为使用带标签数据集和候选数据集训练得到第二神经网络模型;
模型性能分析模块,其被配置为计算第一神经网络模型和第二神经网络模型的性能差值。
8.根据权利要求7所述的中医智能诊疗系统,其特征在于,所述中医智能诊疗系统还包括:
数据集调整模块,其被配置为如果性能差值大于第二预定阈值,则将候选数据集对应不带标签数据集的数据添加标签并转移至带标签的中医数据集;
如果性能差值小于第二预定阈值,则将候选数据集添加人工标注并转移至带标签的中医数据集;
中医诊疗模块,其被配置为将数据集调整模块得到的带标签的中医数据集训练第一神经网络模型和第二神经网络模型中性能高的形成中医诊疗模型。
9.一种中医诊疗设备,其特征在于,包括:
中医智能诊疗系统,所述中医智能诊疗系统为权利要求7-8任一所述的中医智能诊疗系统;
诊断模块,其被配置为采集患者就诊信息,并将就诊数据输入至中医诊疗模型生产诊断结果和治疗方案。
10.根据权利要求9所述的一种中医诊疗设备,其特征在于:所述患者就诊数据包括:
基本信息数据,患者姓名、性别、年龄等基本属性信息数据;
主诉信息数据,患者就诊时的主要症状和求医原因描述信息数据;
既往史信息数据,患者的疾病史和手术史等相关信息数据;
体格检查信息数据,通过检查得出的体征信息,如体温、脉搏数据;
实验室检查信息数据,相关检查项目如血常规、生化数据;
图像检查信息数据,CT、MRI等影像检查数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311300772.2A CN117059231B (zh) | 2023-10-10 | 2023-10-10 | 用于机器学习中医医案的方法及智能诊疗系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311300772.2A CN117059231B (zh) | 2023-10-10 | 2023-10-10 | 用于机器学习中医医案的方法及智能诊疗系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117059231A true CN117059231A (zh) | 2023-11-14 |
CN117059231B CN117059231B (zh) | 2023-12-22 |
Family
ID=88653888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311300772.2A Active CN117059231B (zh) | 2023-10-10 | 2023-10-10 | 用于机器学习中医医案的方法及智能诊疗系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117059231B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109785928A (zh) * | 2018-12-25 | 2019-05-21 | 平安科技(深圳)有限公司 | 诊疗方案推荐方法、装置及存储介质 |
CN110910976A (zh) * | 2019-10-12 | 2020-03-24 | 平安国际智慧城市科技股份有限公司 | 病历检测方法、装置、设备和存储介质 |
US20200125941A1 (en) * | 2017-10-19 | 2020-04-23 | Pure Storage, Inc. | Artificial intelligence and machine learning infrastructure |
CN111540468A (zh) * | 2020-04-21 | 2020-08-14 | 重庆大学 | 一种诊断原因可视化的icd自动编码方法与系统 |
CN113435200A (zh) * | 2021-06-22 | 2021-09-24 | 上海交通大学医学院附属仁济医院 | 实体识别模型训练、电子病历处理方法、系统及设备 |
CN115018865A (zh) * | 2022-06-30 | 2022-09-06 | 西安理工大学 | 一种基于迁移学习的医学图像分割方法 |
-
2023
- 2023-10-10 CN CN202311300772.2A patent/CN117059231B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200125941A1 (en) * | 2017-10-19 | 2020-04-23 | Pure Storage, Inc. | Artificial intelligence and machine learning infrastructure |
CN109785928A (zh) * | 2018-12-25 | 2019-05-21 | 平安科技(深圳)有限公司 | 诊疗方案推荐方法、装置及存储介质 |
CN110910976A (zh) * | 2019-10-12 | 2020-03-24 | 平安国际智慧城市科技股份有限公司 | 病历检测方法、装置、设备和存储介质 |
CN111540468A (zh) * | 2020-04-21 | 2020-08-14 | 重庆大学 | 一种诊断原因可视化的icd自动编码方法与系统 |
CN113435200A (zh) * | 2021-06-22 | 2021-09-24 | 上海交通大学医学院附属仁济医院 | 实体识别模型训练、电子病历处理方法、系统及设备 |
CN115018865A (zh) * | 2022-06-30 | 2022-09-06 | 西安理工大学 | 一种基于迁移学习的医学图像分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117059231B (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023202508A1 (zh) | 一种基于认知图谱的全科患者个性化诊疗方案推荐系统 | |
US20200303072A1 (en) | Method and system for supporting medical decision making | |
Huang et al. | A clinical decision support framework for heterogeneous data sources | |
CN109119130A (zh) | 一种基于云计算的大数据健康管理系统及方法 | |
JP6907831B2 (ja) | コンテキストベースの患者類似性の方法及び装置 | |
CN110111884B (zh) | 一种基于cmkmc的人机协同智慧医疗辅助决策系统 | |
CN116631562B (zh) | 一种生成电子病历出院记录的方法、装置及电子设备 | |
CN112466462B (zh) | 一种基于图深度学习的emr信息关联及演化方法 | |
CN106919804A (zh) | 基于临床数据的药物推荐方法、推荐装置及服务器 | |
CN112420141A (zh) | 一种中医健康评估系统及其应用 | |
CN116910172A (zh) | 基于人工智能的随访量表生成方法及系统 | |
CN114220514A (zh) | 互联网医院病人诊疗数据分析处理方法、设备及存储介质 | |
CN110739075A (zh) | 一种基于大数据的copd疾病辅助诊断监测系统 | |
CN112786190B (zh) | 一种多维数据融合的医疗健康诊疗方法 | |
CN117059231B (zh) | 用于机器学习中医医案的方法及智能诊疗系统 | |
Li et al. | Personalized intelligent syndrome differentiation guided by TCM consultation philosophy | |
CN116721730A (zh) | 一种基于数字疗法的患者全程管理系统 | |
CN107066816A (zh) | 基于临床数据的就医指导方法、装置及服务器 | |
JP2004130090A (ja) | コンピュータ援用患者診断決定支援システム | |
US20160371457A1 (en) | System and Method for Data Analyzing of Health-Related Data | |
CN112309519B (zh) | 基于多模型的电子病历用药结构化处理系统 | |
CN108538390A (zh) | 一种面向医学数据的增量式处理方法 | |
Priya et al. | A novel intelligent diagnosis and disease prediction algorithm in green cloud using machine learning approach | |
Wang et al. | A Doctors Behavior Aware and Domain Knowledge Driven Model for Medical Report Generation | |
Sharma et al. | An intelligent multi agent design in healthcare management system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |