CN109994201B - 一种基于深度学习的糖尿病与高血压概率计算系统 - Google Patents
一种基于深度学习的糖尿病与高血压概率计算系统 Download PDFInfo
- Publication number
- CN109994201B CN109994201B CN201910202701.6A CN201910202701A CN109994201B CN 109994201 B CN109994201 B CN 109994201B CN 201910202701 A CN201910202701 A CN 201910202701A CN 109994201 B CN109994201 B CN 109994201B
- Authority
- CN
- China
- Prior art keywords
- data
- diabetes
- hypertension
- probability
- digital
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010020772 Hypertension Diseases 0.000 title claims abstract description 53
- 206010012601 diabetes mellitus Diseases 0.000 title claims abstract description 52
- 238000004364 calculation method Methods 0.000 title claims abstract description 32
- 238000013135 deep learning Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000004140 cleaning Methods 0.000 claims abstract description 9
- 238000012821 model calculation Methods 0.000 claims abstract description 3
- 239000013598 vector Substances 0.000 claims description 65
- 230000004927 fusion Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 16
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Machine Translation (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种基于深度学习的糖尿病与高血压概率计算方法,包括:(1)采集用户体检数据后进行数据清洗和预处理,再对数据中的数字数据和文本数据分别进行编码操作,得到训练数据;(2)建立糖尿病与高血压多任务概率计算模型;(3)使用训练数据对上述多任务概率计算模型进行训练,根据模型计算的结果与糖尿病、高血压标签的重合情况对网络参数进行优化,直到模型收敛;(4)将需要计算糖尿病与高血压概率的体检数据进行清洗、预处理和编码操作后输入上述训练完的模型,计算得到糖尿病概率与高血压概率。利用本发明,可同时计算糖尿病与高血压疾病的概率,辅助医生进行更好的判断。
Description
技术领域
本发明属于大数据医疗与人工智能领域,尤其是涉及一种基于深度学习的糖尿病与高血压概率计算系统。
背景技术
随着糖尿病与高血压在人群中发病率越来越高,人们对自身的健康管理也变得越来越重视,因此医院与其他的体检机构当前已经积累了大量的电子体检数据,使得糖尿病与高血压的大数据分析成为了可能。
根据2017年发布的《中国2型糖尿病防治指南》的报告,成年人2型糖尿病达到了10.4%,60岁以上的老年人发病率在20%以上,而在这之中未确诊的糖尿病人群占总数的63%,而2017年“十二五”高血压抽样调查中显示,高血压的患病率更是达到了23%,防治这两种疾病已经到了刻不容缓的地步。
随着人们生活水平的提高、保健意识的增强,健康体检逐渐成为一种社会时尚,人们已经改变了只有在得病时才去医院的传统观念,定期体检已经被大多数人所接受。因此,医院积累了海量的电子体检数据,使大数据有了用武之地。
大数据医疗是当前的一个热点,是指通过大数据相关技术,分析医疗领域的数据并挖掘其中的知识从而大幅度提高医疗服务。在过去几十年中,大数据已经深深地影响了每一个企业,包括医疗保健行业。如今,大量的数据可以让医疗保健更加高效,更加个性化。
而另一方面近些年来的人工智能领域的也掀起了新的浪潮,在图像、自然语言、语音识别等不同的任务中都取得了非常杰出的成果。本发明中所涉及的为当前人工智能领域中前沿的技术模型的变式与衍生。因为糖尿病与高血压这两种疾病本身具有非常强的相关性,所以本文所述的方法是一种同时分析糖尿病与高血压疾病的多任务预测的创新。
发明内容
本发明提供了一种基于深度学习的糖尿病与高血压概率计算方法,可同时计算糖尿病与高血压疾病的概率,辅助医生进行更好的判断。
本发明的技术方案如下:
一种基于深度学习的糖尿病与高血压概率计算方法,包括以下步骤:
(1)采集用户体检数据后进行数据清洗和预处理,再对数据中的数字数据和文本数据分别进行编码操作,得到训练数据;
(2)建立糖尿病与高血压多任务概率计算模型,所述多任务概率计算模型包含由全连接层搭建的数字特征提取器和以BERT模型为主体的文本特征提取器;
(3)使用训练数据对上述多任务概率计算模型进行训练,根据模型计算的结果与糖尿病、高血压标签的重合情况对网络参数进行优化,直到模型收敛;
(4)将需要计算糖尿病与高血压概率的体检数据进行清洗、预处理和编码操作后输入上述训练完的模型,计算得到糖尿病概率与高血压概率。
步骤(1)中,所述数据清洗包括:筛选体检数据中糖尿病与高血压相关的检查项,对检查项缺失较多的体检数据进行删除,对检查项缺失较少的体检数据进行填补,得到M个数字数据和N个文本数据;所述的预处理包括对数字数据进行归一化处理,对文本数据建立相应的字典。
采用均值法、相邻值或数据分布采样法对检查项缺失较少的体检数据进行填补。
所述的编码操作的具体过程为:将数字数据生成M个K维且相互正交的基向量,基向量模长为1,将数字特征数值乘以对应的基向量,再将这些特征向量矢量相加,得到数字特征对应的向量,或直接以M个数字特征对应的数值得到数字特征对应的向量;将文本数据建立文本特征中的字典,使用word2vec方法(CBOW、skip-gram、GloVe等)预训练字向量,得到文本特征对应的L维字向量或字向量编码。
步骤(2)中所述的糖尿病与高血压多任务概率计算模型包括了全连接层搭建的数字特征提取器,以及以BERT为主体的文本特征提取器。
所述的全连接层搭建的数字特征提取器中的全连接层层数为2~4层,每一层的输入输出矩阵均为2维矩阵,且每一层全连接层后对输出进行降维操作。若某层的输入矩阵为d*k,d为特征数量,k为特征维度,则输出矩阵为
所述的BERT模型是目前自然语言处理领域中流行的,以Transformer Block为基本单元的纵向叠加而成的双向编码结构。Transformer Block的数量为L,且每一个Transformer Block对应有A个Multi-Head Attention和H的隐藏层。
作为优选,BERT Transformer Block数量L范围为12~24,Muti-Head Attention数量A的范围为12~16,隐藏层大小H范围为768~1024.
步骤(3)的具体步骤为:
(3-1)将训练数据中的数字特征向量和文本字向量分别输入数字特征提取器和文本特征提取器,得到特征提取后的向量V1与V2;
(3-2)将提取到的V1与V2使用全连接层或Transformer Block进行特征融合,得到最终的融合向量V3;
(3-3)将得到的融合向量V3通过两个softmax层计算概率,再使用两个BinaryCross Entropy Loss或两个Focal Loss计算与糖尿病、高血压标签的偏差;
(3-4)将步骤(3-3)计算得到的Loss,反向传播,使用优化算法SGD或Adam进行优化,收敛后得到最终的多任务预测模型。
所述的Binary Cross Entropy Loss的计算公式为:
所述的Focal Loss的计算公式为:
与现有技术相比,本发明具有以下有益效果:
1、本发明通过分别编码数字特征与文本特征并提取,最终融合到一个模型中综合考量,大大提高了相关任务的准确性。
2、本发明可根据全连接数字特征提取器中的权重,对每一个特征进行重要性分析,提高模型可解释性。
3、本模型考虑了高血压与糖尿病本身可能存在一定相关性,所以在模型输出设计中采用了多任务分类的方式,同时输出糖尿病、高血压的患病概率。
4、模型的文本特征编码器采用BERT模型,BERT模型在拟合能力和并行性方面,大大优于经典的循环神经网络模型。
附图说明
图1为本发明实施例一种基于深度学习的糖尿病与高血压概率计算方法的流程示意图;
图2为本发明实施例中糖尿病与高血压多任务概率计算模型的结构图;
图3为本发明实施例中BERT模型的Transformer Block结构图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,一种基于深度学习的糖尿病与高血压概率计算方法,包括:
S01,体检数据处理与编码
(1-1)数据清洗:
根据糖尿病与高血压预测任务,筛选出与糖尿病、高血压相关的检查项,将这些检查项分为数字特征(仅含数字)与文本特征。
每一条医疗记录对应多个与糖尿病、高血压相关的检查项,删去缺失检查数据过多的医疗记录,校对检查项中异常项。
医疗记录中的部分缺失的数字特征使用均值法、相邻值、数据分布采样法填补。
(1-2)数据预处理:
数字特征预处理-归一化:求得数字特征均值与方差,再将数字特征减去均值、除以方差,将数字特征的均值与方差控制为0和1.
文本特征预处理-建立字典:对文本数据中所有出现的汉字建立字典,统计字频,将字频少于5的字,从字典中删除。
(1-3)数据编码:
数字特征编码:生成M个与数字特征对应的相互正交的基向量,并控制其模长为1,将数字特征中的数值乘以其对应的基向量,即可得到数字特征对应的特征表示向量,这样既保证了不同数字特征之间相互独立,又保证了其模长在[0,1]之间,或直接以M个数字特征对应的数值得到数字特征对应的向量。
文本特征编码:对每一个文本字典中的字,随机生成它对应的L维字向量。使用word2vec方法,包括CBOW,Skip-Gram,GloVe等中的其中一种,在其他大量的文本语料或体检的文本数据中预训练字向量。
S02,建立糖尿病与高血压多任务概率计算模型
如图2所示,糖尿病与高血压多任务概率计算模型包括:图左侧虚线框与右侧虚线框中的两个特征提取器分支。左侧的全连接层提取器分支对数字特征进行编码操作,得到对数字部分的向量表达Hcls,而右侧BERT分支的使用L个Transformer Block对文本字向量进行编码操作,得到最终对文本部分的向量表达Hcls′。再使用一个全连接层或一个Transformer Block对两个向量表达融合,得到联合的向量表达V。再根据两个分类目标,使用全连接层映射到对应的类别,最后使用softmax层计算概率。
S03,训练糖尿病与高血压多任务概率计算模型
(3-1)将步骤(1-3)中编码的数字特征向量与文本字向量分别输入全连接层搭建的数字特征提取器与BERT模型的文本特征提取器,分别得到特征提取后的向量V1与V2。
(3-2)将步骤(3-1)中提取到的V1与V2,再使用全连接层或Transformer Block进行特征融合,得到最终的融合向量V3。
Transformer Block的结构如图3所示,Transformer Block中的输入向量首先输入Multi-Head Attention层,将输入向量使用全连接层映射到h组Q,K,V向量,对h组Q,K,V向量分别进行attention操作。所述的attention操作公式如下:
其中,Q,K,V分别对应的是Q,K,V向量,而dk为K向量的维度。
Multi-Head Attention将h组得到的计算结果拼接,使用全连接层得到Multi-Head Attention操作的向量。该向量与输入向量相加后,进行归一化操作的中间结果向量。该中间结果向量再进行一次全连接层操作后,与自身相加,并进行归一化操作,得到最终Transformer Block的输出向量。
(3-3)将步骤(3-2)得到的融合向量V3,通过两个softmax层计算概率,再使用两个Binary Cross Entropy Loss或focal loss计算与糖尿病、高血压标签的偏差。
本文所叙述的Binary Cross Entropy Loss的计算公式为:
本文所叙述的Focal Loss的计算公式为:
(3-4)将步骤(3-3)所计算的Loss,反向传播,使用优化算法SGD或Adam进行优化,收敛后得到最终的多任务预测模型。
S04,糖尿病、高血压多任务预测
(4-1)将需要预测糖尿病与高血压用户的体检数据根据步骤(1-3)中的流程同样进行清洗、预处理以及编码,得到数字特征对应的特征向量与文本字向量。
(4-2)将步骤(4-1)中得到的数字特征向量与文本字向量分别输入全连接层构成的数字特征提取器与BERT的文本特征提取器中,得到对应的编码向量V1′与V2′
(4-3)将步骤(4-2)中提取到的V1′与V2′,再使用全连接层或Transformer Block进行特征融合,得到最终的融合向量V3′。
(4-4)将步骤(4-3)中提取到的V′3,通过计算糖尿病和高血压的softmax层,分别计算对应的糖尿病患病概率与高血压概率。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于深度学习的糖尿病与高血压概率计算系统,其特征在于,包括存储在计算机上的糖尿病与高血压多任务概率计算模型,所述多任务概率计算模型包含由全连接层搭建的数字特征提取器和以BERT模型为主体的文本特征提取器;
所述数字特征提取器中全连接层的层数为2~4层,每一层的输入输出矩阵均为2维矩阵,且每一层全连接层后对输出进行降维操作;所述文本特征提取器中BERT模型是以Transformer Block为基本单元的纵向叠加而成的双向编码结构,Transformer Block的数量为12~24个,且每一个Transformer Block对应有12~16个Multi-Head Attention和768~1024个隐藏层;
所述糖尿病与高血压概率计算方法系统在计算概率时执行以下步骤:
(1)采集用户体检数据后进行数据清洗和预处理,再对数据中的数字数据和文本数据分别进行编码操作,得到训练数据;
(2)使用训练数据对上述多任务概率计算模型进行训练,根据模型计算的结果与糖尿病、高血压标签的重合情况对网络参数进行优化,直到模型收敛;具体步骤为:
(2-1)将训练数据中的数字特征向量和文本字向量分别输入数字特征提取器和文本特征提取器,得到特征提取后的向量V1与V2;
(2-2)将提取到的V1与V2使用全连接层或Transformer Block进行特征融合,得到最终的融合向量V3;
(2-3)将得到的融合向量V3通过两个softmax层计算概率,再使用两个Binary CrossEntropy Loss或两个Focal Loss计算与糖尿病、高血压标签的偏差;
(2-4)将步骤(2-3)计算得到的Loss,反向传播,使用优化算法SGD或Adam进行优化,收敛后得到最终的多任务预测模型;
(3)将需要计算糖尿病与高血压概率的体检数据进行清洗、预处理和编码操作后输入上述训练完的模型,计算得到糖尿病概率与高血压概率。
2.根据权利要求1所述的基于深度学习的糖尿病与高血压概率计算系统,其特征在于,步骤(1)中,所述数据清洗包括:筛选体检数据中糖尿病与高血压相关的检查项,对检查项缺失多的体检数据进行删除,对检查项缺失少的体检数据进行填补,得到M个数字数据和N个文本数据;所述的预处理包括对数字数据进行归一化处理,对文本数据建立相应的字典。
3.根据权利要求2所述的基于深度学习的糖尿病与高血压概率计算系统,其特征在于,采用均值法、相邻值或数据分布采样法对检查项缺失少的体检数据进行填补。
4.根据权利要求1所述的基于深度学习的糖尿病与高血压概率计算系统,其特征在于,步骤(1)中,所述的编码操作的具体过程为:将数字数据生成M个K维且相互正交的基向量,基向量模长为1,将数字特征数值乘以对应的基向量,再将这些特征向量矢量相加,得到数字特征对应的向量,或直接以M个数字特征对应的数值得到数字特征对应的向量;将文本数据建立文本特征中的字典,使用word2vec方法预训练字向量,得到文本特征对应的L维字向量或字向量编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910202701.6A CN109994201B (zh) | 2019-03-18 | 2019-03-18 | 一种基于深度学习的糖尿病与高血压概率计算系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910202701.6A CN109994201B (zh) | 2019-03-18 | 2019-03-18 | 一种基于深度学习的糖尿病与高血压概率计算系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109994201A CN109994201A (zh) | 2019-07-09 |
CN109994201B true CN109994201B (zh) | 2021-06-11 |
Family
ID=67129542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910202701.6A Active CN109994201B (zh) | 2019-03-18 | 2019-03-18 | 一种基于深度学习的糖尿病与高血压概率计算系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109994201B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111222317B (zh) * | 2019-10-16 | 2022-04-29 | 平安科技(深圳)有限公司 | 序列标注方法、系统和计算机设备 |
CN110991535A (zh) * | 2019-12-04 | 2020-04-10 | 中山大学 | 一种基于多类型医学数据的pCR预测方法 |
CN111180068A (zh) * | 2019-12-19 | 2020-05-19 | 浙江大学 | 一种基于多任务学习模型的慢病预测系统 |
CN112037910B (zh) * | 2020-08-31 | 2023-04-18 | 康键信息技术(深圳)有限公司 | 健康信息管理方法、装置、设备及存储介质 |
CN113539491B (zh) * | 2021-06-16 | 2022-05-13 | 武汉大学中南医院 | 基于深度学习的良性前列腺增生评估决策辅助系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6629272B1 (en) * | 2000-11-09 | 2003-09-30 | Agilent Technologies, Inc. | Method and apparatus for displaying eye diagram on an error performance analyzer |
CN101887523A (zh) * | 2010-06-21 | 2010-11-17 | 南京邮电大学 | 利用图片文字与局部不变特征检测图像垃圾邮件的方法 |
CN105024886A (zh) * | 2015-07-31 | 2015-11-04 | 浙江大学 | 一种基于用户元数据的快速Web服务QoS预测方法 |
CN105389470A (zh) * | 2015-11-18 | 2016-03-09 | 福建工程学院 | 一种中医针灸领域实体关系自动抽取的实现方法 |
CN106682411A (zh) * | 2016-12-22 | 2017-05-17 | 浙江大学 | 一种将体检诊断数据转化为疾病标签的方法 |
CN107220506A (zh) * | 2017-06-05 | 2017-09-29 | 东华大学 | 基于深度卷积神经网络的乳腺癌风险评估分析系统 |
CN107885764A (zh) * | 2017-09-21 | 2018-04-06 | 银江股份有限公司 | 基于多任务深度学习快速哈希车辆检索方法 |
CN107885853A (zh) * | 2017-11-14 | 2018-04-06 | 同济大学 | 一种基于深度学习的组合式文本分类方法 |
CN108765368A (zh) * | 2018-04-20 | 2018-11-06 | 平安科技(深圳)有限公司 | Mri病变位置检测方法、装置、计算机设备和存储介质 |
CN109243616A (zh) * | 2018-06-29 | 2019-01-18 | 东华大学 | 基于深度学习的乳腺电子病历联合关系抽取与结构化系统 |
-
2019
- 2019-03-18 CN CN201910202701.6A patent/CN109994201B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6629272B1 (en) * | 2000-11-09 | 2003-09-30 | Agilent Technologies, Inc. | Method and apparatus for displaying eye diagram on an error performance analyzer |
CN101887523A (zh) * | 2010-06-21 | 2010-11-17 | 南京邮电大学 | 利用图片文字与局部不变特征检测图像垃圾邮件的方法 |
CN105024886A (zh) * | 2015-07-31 | 2015-11-04 | 浙江大学 | 一种基于用户元数据的快速Web服务QoS预测方法 |
CN105389470A (zh) * | 2015-11-18 | 2016-03-09 | 福建工程学院 | 一种中医针灸领域实体关系自动抽取的实现方法 |
CN106682411A (zh) * | 2016-12-22 | 2017-05-17 | 浙江大学 | 一种将体检诊断数据转化为疾病标签的方法 |
CN107220506A (zh) * | 2017-06-05 | 2017-09-29 | 东华大学 | 基于深度卷积神经网络的乳腺癌风险评估分析系统 |
CN107885764A (zh) * | 2017-09-21 | 2018-04-06 | 银江股份有限公司 | 基于多任务深度学习快速哈希车辆检索方法 |
CN107885853A (zh) * | 2017-11-14 | 2018-04-06 | 同济大学 | 一种基于深度学习的组合式文本分类方法 |
CN108765368A (zh) * | 2018-04-20 | 2018-11-06 | 平安科技(深圳)有限公司 | Mri病变位置检测方法、装置、计算机设备和存储介质 |
CN109243616A (zh) * | 2018-06-29 | 2019-01-18 | 东华大学 | 基于深度学习的乳腺电子病历联合关系抽取与结构化系统 |
Non-Patent Citations (2)
Title |
---|
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding;Jacob Devlin等;《网页在线公开:https://arxiv.org/abs/1810.04805v1》;20181011;第1-14页 * |
面向3D CT影像处理的无监督推荐标注算法;冯浩哲等;《计算机辅助设计与图形学学报》;20190215;第31卷(第2期);第183-189页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109994201A (zh) | 2019-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109994201B (zh) | 一种基于深度学习的糖尿病与高血压概率计算系统 | |
CN111192680B (zh) | 一种基于深度学习和集成分类的智能辅助诊断方法 | |
CN107516110B (zh) | 一种基于集成卷积编码的医疗问答语义聚类方法 | |
CN109471895B (zh) | 电子病历表型抽取、表型名称规范化方法及系统 | |
WO2022227294A1 (zh) | 一种基于多模态融合的疾病风险预测方法和系统 | |
CN109697285B (zh) | 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法 | |
CN110020623B (zh) | 基于条件变分自编码器的人体活动识别系统及方法 | |
CN111881260B (zh) | 基于方面注意力和卷积记忆神经网络情感分析方法及装置 | |
CN109858032A (zh) | 融合Attention机制的多粒度句子交互自然语言推理模型 | |
CN109670177A (zh) | 一种基于lstm实现医学语义归一化的控制方法及控制装置 | |
CN111738003B (zh) | 命名实体识别模型训练方法、命名实体识别方法和介质 | |
WO2016192612A1 (zh) | 基于深度学习对医疗数据进行分析的方法及其智能分析仪 | |
CN109949929A (zh) | 一种基于深度学习大规模病历的辅助诊断系统 | |
CN110032739A (zh) | 中文电子病历命名实体抽取方法及系统 | |
CN110427486A (zh) | 身体病况文本的分类方法、装置及设备 | |
WO2022227203A1 (zh) | 基于对话表征的分诊方法、装置、设备及存储介质 | |
Bardak et al. | Improving clinical outcome predictions using convolution over medical entities with multimodal learning | |
CN112489769A (zh) | 基于深度神经网络的慢性病智慧中医诊断与药物推荐系统 | |
CN108920446A (zh) | 一种工程文本的处理方法 | |
CN111540470A (zh) | 一种基于bert迁移学习的社交网络抑郁倾向检测模型及其训练方法 | |
CN113868374A (zh) | 基于多头注意力机制的图卷积网络生物医学信息提取方法 | |
CN115762721A (zh) | 一种基于计算机视觉技术的医疗影像质控方法和系统 | |
CN112287665B (zh) | 基于自然语言处理和集成训练的慢病数据分析方法及系统 | |
CN114822734A (zh) | 基于循环卷积神经网络的中医病案分析方法 | |
CN115376638A (zh) | 一种基于多源健康感知数据融合的生理特征数据分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |