CN109243616A - 基于深度学习的乳腺电子病历联合关系抽取与结构化系统 - Google Patents

基于深度学习的乳腺电子病历联合关系抽取与结构化系统 Download PDF

Info

Publication number
CN109243616A
CN109243616A CN201810699364.1A CN201810699364A CN109243616A CN 109243616 A CN109243616 A CN 109243616A CN 201810699364 A CN201810699364 A CN 201810699364A CN 109243616 A CN109243616 A CN 109243616A
Authority
CN
China
Prior art keywords
electronic health
health record
mammary gland
relation extraction
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810699364.1A
Other languages
English (en)
Inventor
潘乔
陈德华
朱立峰
左铭
赵艳
王梅
俞春濡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Donghua University
National Dong Hwa University
Original Assignee
Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd, Donghua University filed Critical Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Priority to CN201810699364.1A priority Critical patent/CN109243616A/zh
Publication of CN109243616A publication Critical patent/CN109243616A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统,包括乳腺电子病历数据的结构化模块和乳腺电子病历数据的关系抽取模块,所述乳腺电子病历数据的结构化模块基于深度学习将大量非结构化的文本数据转化为评估算法可识别的结构化数据;所述乳腺电子病历数据的关系抽取模块基于深度学习建立电子病历结构化模型,得到评估结果。本发明能够有效提高乳腺电子病历中的结构化以及关系抽取的自动化和智能化水平。

Description

基于深度学习的乳腺电子病历联合关系抽取与结构化系统
技术领域
本发明涉及医疗设备技术领域,特别是涉及一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统。
背景技术
随着医疗信息化的快速发展,医疗机构在临床诊断的过程中产生了大量的原始电子病历数据,这些电子病历是记录患者诊断与治疗过程的重要信息,蕴含着丰富的知识。由于电子病历多为非结构化、叙述性文本,不能较好地存储、组织和管理病历中的临床信息,因此,未被结构化的电子病历文本很难被充分利用。所以目前对电子病历分析的研究主要集中在电子病历结构化的方面,通过对疾病的检查指标数据进行结构化,从杂乱、冗余、高复杂的非结构化电子病历数据获取规范、有价值的数据,最后利用人工智能算法对患者所患疾病进行诊断已成为研究热点。另外,如今大多数乳腺电子病历仍是由自然语言书写而成,海量错综复杂的半结构化,甚至是非结构化的数据挑战着医疗行业。这使得尽管病人的数据充足,但难以从这些数据中获取知识,也使得资源难以合理地分配,给整个医疗行业的发展带来了巨大的压力。就乳腺这一疾病而言,其患者的电子病历记录信息分散在叙述性医疗文本中,无法直接交由计算机识别分析。所以首要解决的问题就是实现中文文本的结构化。常规的中文文本结构化方法,传统的pipeline管道模型在生物医疗的结构化过程中也有大量的应用,它的主要特点之一是的基础上增加了实体间的关系抽取。首先通过结构化技术识别给定医疗临床文本中的实体,检查每个实体对,再使用关系分类模型来确定它们是否具有特定关系。仍存在如下问题:1)结构化实体抽取的过程中会产生的错误,可能传播到关系分类的任务中去,没有将结构化、关系分类这两个任务的之间的依赖考虑在内。2)在pipeline管道模型的基础上产生的联合实体关系抽取模型虽然在一定程度上通过同时处理两个子任务,来减少错误传播以及子任务之间的依赖问题,但这种模型大部分是基于特征的方法,需要大量的特征工程,并且还会遭受特征稀疏性问题,因为联合任务的组合特征空间明显大于其子任务的特征空间。常规结构化方法并不适用于乳腺电子病历报告的实体以及关系提取。
发明内容
本发明所要解决的技术问题是提供一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统,能够有效提高乳腺电子病历中的结构化以及关系抽取的自动化和智能化水平。
本发明解决其技术问题所采用的技术方案是:提供一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统,包括乳腺电子病历数据的结构化模块和乳腺电子病历数据的关系抽取模块,所述乳腺电子病历数据的结构化模块基于深度学习将大量非结构化的文本数据转化为评估算法可识别的结构化数据;所述乳腺电子病历数据的关系抽取模块基于深度学习建立电子病历结构化模型,得到评估结果。
所述乳腺电子病历数据的结构化模块首先选取较完整的乳腺电子病历文本数据进行数据清洗、分词和标注,形成初步的数据训练集文件;其次读取已标注的训练数据,依据文本的字符特征构建字向量,以字向量构建文本特征向量作为整个模型的输入;最后经过文本的预处理操作后,得到由字向量构建的文本特征向量,再利用神经网络模型进行进一步的特征抽取以及分类操作,获得非结构化文本中的实体。
所述乳腺电子病历数据的结构化模块根据医疗领域的分词算法得到更加准确的分词结果,再对词语或字进行相关标注以及词向量或字向量训练;其中,模型训练提供用于训练预测模型的算法支持,通过预配置的CNN和LSTM算法调用,同时实现一个自定义的模型类以及内部相应的接口函数用于网络模型训练;最后,通过模型训练生成能够进行结构化的模型,从而能够提取非结构化的乳腺电子病历中的疾病、症状、检查和治疗的实体。
在字向量训练时,模型中网络的输入是由每个乳腺电子病历的句子向量矩阵构成,而单个的句子向量矩阵由预先训练好的字向量构成;其中,字向量的构建利用Skip-gram模型作为基础,通过给定的中心字来预测上下文周围的字,通过大量的医疗评价语料集进行字向量训练。
所述乳腺电子病历数据的关系抽取模块首先把结构化之后的结果中的两组实体以及实体间的句子作为输入;其次利用所输入的训练集建立关系抽取模型,利用测试集检测模型性能;最后给定一份原始的乳腺电子病历报告文本,实验乳腺电子病历结构化以及关系抽取模型的可用性,得到结构化后的结果。
所述乳腺电子病历数据的关系抽取模块所要预测的实体间关系包括:因症状而采取检查、检查而发现某种症状、治疗施加于某种疾病、治疗恶化某种疾病和治疗改善了某种疾病;通过结构化获得的两个实体对应的编码向量,以及实体间的句子作为关系抽取CNN模型的输入;通过预先整理的实体间关系与预测的结果进行误差比较,从而生成有效的关系抽取网络,建立关系抽取预测模型,并利用测试集检测模型的性能。
所述乳腺电子病历数据的关系抽取模块基于机器学习的算法将生物医学NER视为序列标记问题,其中每个算法的目标是为给定输入句子找到最佳标签序列;通过把结构化也作为序列BIO标注任务,再利用编码层对输入的乳腺电子病历进行特征提取;将特征表示输入至结构化部分利用LSTM解码,将解码后的表示输入至Softmax层预测序列对应的标注;最后,将乳腺电子病历对应的表示与编码层的特征进行连接作为联合表示进行关系分类。
所述特征提取是采用Bi-LSTM网络实现的,具体为:将输入语句转换为字向量,将其输入Bi-LSTM层;对于给定的输入序列,针对每一个输入将其向量化成d维向量;前向LSTM采用从左向右的输入方式,针对每一字得出相应的输出,从而得到前向句子输出;后向LSTM采用从右向左的输入方式,针对每一个字得出相应的输出,得到后向句子输出;将得到的前向句子输出和后向句子输出相加,即得出Bi-LSTM的输出结果。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明针对乳腺疾病患者的电子病历,利用深度学习算法进行文本结构化,该结构化数据和关系抽取的准确度取得了比传统pipeline模型的结构化以及关系抽取方法更高的性能;相较于pipeline模型,深度学习通过神经网络编码层的输出进行模型参数共享,在训练时两个任务都会通过后向传播算法来更新共享参数来实现两个子任务之间的依赖。深度学习的高级特征抽取能力可以将文本的语义信息转化为一个低维高密度的特征向量,大大地降低了特征工程。所以通过深度学习的联合抽取可以获得更好的结构化以及关系分类效果。
附图说明
图1为本发明的总体框图;
图2为本发明中基于深度学习的文本字、词向量预处理模块框图;
图3为本发明中基于深度学习特征提取的流程图;
图4为本发明中利用深度学习算法进行实体标签预测以及关系抽取的流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种利用深度学习对乳腺电子病历的联合关系抽取与结构化,进而利用常规机器学习算法进行乳腺肿瘤风险性评估的分析系统,包括:1)乳腺电子病历数据的结构化模块,即基于深度学习的文本结构化模块。首先选取较完整的乳腺电子病历文本数据进行数据清洗、分词、标注,形成初步的数据训练集文件;其次读取已标注的训练数据,依据文本的字符特征构建字向量,以字向量构建文本特征向量作为整个模型的输入;最后经过文本的预处理操作后,得到由字向量构建的文本特征向量,还需要利用神经网络模型进行进一步的特征抽取以及分类操作,获得非结构化文本中的实体。该模块用于将大量非结构化的文本数据转化为评估算法可识别的结构化数据。2)乳腺电子病历数据的关系抽取模块,即基于深度学习的关系抽取模块。首先每一步把结构化之后的结果中的两组实体以及实体间的句子作为输入;其次利用所输入的训练集建立关系抽取模型,利用测试集检测模型性能;最后给定一份原始的乳腺电子病历报告文本,实验乳腺电子病历结构化以及关系抽取模型的可用性,得到结构化后的结果,即乳腺电子病历结构化数据以及实体间的关系。该模块用于建立电子病历结构化模型,得到评估结果。
结合图1,本实施方式的总体框架主要分为两大模块。首先,将所有的乳腺电子病历报告作为原始数据集,基于深度学习对原始数据集进行文本结构化,形成结构化的数据;其次,将结构化数据直接作为输入,采用CNN卷积神经网络模型,建立乳腺电子病历关系预测模型;最后,对于新的乳腺电子病历数据,可直接作为该模型的输入,得到结构化结果以及关系抽取的预测。
在文本结构化过程中,为解决传统的pipeline管道模型的基础上产生的联合实体关系抽取模型虽然在一定程度上通过同时处理两个子任务,来减少错误传播以及子任务之间的依赖问题,本实施方式提出了一种基于深度学习对乳腺电子病历的联合关系抽取与结构化的新方法。
结合图2,实现文本预处理。预处理模块主要负责将文本转换为嵌入字、词向量,方便模型的处理。其中,词特征将单词作为评价文本的基本组成单位,本实施方式中采用传统方式,利用Word2Vec工具进行词向量的训练。字特征将乳腺电子病历文本看作由多个单个字组成的文本序列,以字向量作为文本矩阵向量输入的基本组成单位。本实施方式提出的模型中网络的输入是由每个乳腺电子病历的句子向量矩阵构成,而单个的句子向量矩阵由预先训练好的字向量构成。使用字向量作为句子矩阵的基本组成结构,免除了使用传统词向量因分词误差,词法分析所带来的额外操作和文本噪音,从而使得构建的训练原始数据集输入更为精确和有效。字向量的构建借助google的开源工具Word2Vec,对其中的Skip-gram模型进行改进进而训练获取嵌入字向量。Word2Vec模型主要分为两个部分,第一部分是对模型的建立,第二部分将使用该模型获取字特征嵌入。本实施方式利用Skip-gram模型作为基础,通过给定的中心字来预测上下文周围的字,通过大量的医疗评价语料集进行字向量训练。
所述乳腺电子病历数据的关系抽取模块所要预测的实体间关系包括:TeAs(因症状而采取检查)、TeRS(检查而发现某种症状)、TrAD(治疗施加于某种疾病)、TrND(治疗恶化某种疾病)、TrID(治疗改善了某种疾病);通过结构化获得的两个实体对应的编码向量,以及实体间的句子作为关系抽取CNN模型的输入;通过预先整理的实体间关系与预测的结果进行误差比较,从而生成有效的关系抽取网络,建立关系抽取预测模型,并利用测试集检测模型的性能。
结合图3,构建深度学习神经网络模型以提取乳腺电子病历文本的特征。将输入的向量数据传入LSTM中,通过LSTM中的门机制,决定要存储、更新以及删除的信息。针对LSTM会有多种变化形式,本发明采用Bi-LSTM网络。将上文提到的输入语句“回声分布均匀”通过character Embedding层转换为字向量,保存为(e1,e2,e3,……en)格式,并将其输入Bi-LSTM层。对于给定的输入序列,针对每一个输入将其向量化成d维向量。前向LSTM采用从左向右的输入方式,针对每一字et得出相应的ht,整个句子输出htl(h1l,h2l,h3l,……hnl);后向LSTM采用从右向左的输入方式,针对每一个字et得出相应的ht,整个句子输出htr(h1r,h2r,h3r,……hnr);将htl和htr相加,即得出Bi-LSTM的输出结果ht。这种方式针对输入序列中的每一个点均保存了其前向、后向信息。
结合图4,基于深度学习提取的文本特征,实现乳腺电子病历的结构化以及关系抽取。基于机器学习的算法将生物医学NER视为序列标记问题,其中每个算法的目标是为给定输入句子找到最佳标签序列(大部分以BIO(开始,内部,外部)格式标注)。本发明首先把结构化也作为序列BIO标注任务,再利用编码层对输入的乳腺电子病历进行特征提取。其次,将特征表示输入至结构化部分利用LSTM解码,将解码后的表示输入至Softmax层预测序列对应的标注。最后,将乳腺电子病历对应的表示与编码层的特征进行连接作为联合表示进行关系分类。
电子病历报告的数据挖掘以及知识发现引起了医学界的广泛重视,通过对临床检查报告的实体、语义关系识别,是满足现代临床系统需求的前提。结合真实的乳腺电子病历文本数据,本发明基于深度学习的乳腺电子病历的联合关系抽取与结构化方法。实验证明,本发明采用的基于深度学习的乳腺电子病历报告的联合关系抽取与结构化方法相比传统的pipeline模型的精确率提高了约5%、10%;相比较Encoder-Decoder模型,本发明的模型也提高了1%、6%。所以,实验结果表明,本发明的模型在结构化以及关系抽取方面优于其他模型。

Claims (8)

1.一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统,其特征在于,包括乳腺电子病历数据的结构化模块和乳腺电子病历数据的关系抽取模块,所述乳腺电子病历数据的结构化模块基于深度学习将大量非结构化的文本数据转化为评估算法可识别的结构化数据;所述乳腺电子病历数据的关系抽取模块基于深度学习建立电子病历结构化模型,得到评估结果。
2.根据权利要求1所述的基于深度学习的乳腺电子病历联合关系抽取与结构化系统,其特征在于,所述乳腺电子病历数据的结构化模块首先选取较完整的乳腺电子病历文本数据进行数据清洗、分词和标注,形成初步的数据训练集文件;其次读取已标注的训练数据,依据文本的字符特征构建字向量,以字向量构建文本特征向量作为整个模型的输入;最后经过文本的预处理操作后,得到由字向量构建的文本特征向量,再利用神经网络模型进行进一步的特征抽取以及分类操作,获得非结构化文本中的实体。
3.根据权利要求2所述的基于深度学习的乳腺电子病历联合关系抽取与结构化系统,其特征在于,所述乳腺电子病历数据的结构化模块根据医疗领域的分词算法得到更加准确的分词结果,再对词语或字进行相关标注以及词向量或字向量训练;其中,模型训练提供用于训练预测模型的算法支持,通过预配置的CNN和LSTM算法调用,同时实现一个自定义的模型类以及内部相应的接口函数用于网络模型训练;最后,通过模型训练生成能够进行结构化的模型,从而能够提取非结构化的乳腺电子病历中的疾病、症状、检查和治疗的实体。
4.根据权利要求3所述的基于深度学习的乳腺电子病历联合关系抽取与结构化系统,其特征在于,在字向量训练时,模型中网络的输入是由每个乳腺电子病历的句子向量矩阵构成,而单个的句子向量矩阵由预先训练好的字向量构成;其中,字向量的构建利用Skip-gram模型作为基础,通过给定的中心字来预测上下文周围的字,通过大量的医疗评价语料集进行字向量训练。
5.根据权利要求1所述的基于深度学习的乳腺电子病历联合关系抽取与结构化系统,其特征在于,所述乳腺电子病历数据的关系抽取模块首先把结构化之后的结果中的两组实体以及实体间的句子作为输入;其次利用所输入的训练集建立关系抽取模型,利用测试集检测模型性能;最后给定一份原始的乳腺电子病历报告文本,实验乳腺电子病历结构化以及关系抽取模型的可用性,得到结构化后的结果。
6.根据权利要求5所述的基于深度学习的乳腺电子病历联合关系抽取与结构化系统,其特征在于,所述乳腺电子病历数据的关系抽取模块所要预测的实体间关系包括:因症状而采取检查、检查而发现某种症状、治疗施加于某种疾病、治疗恶化某种疾病和治疗改善了某种疾病;通过结构化获得的两个实体对应的编码向量,以及实体间的句子作为关系抽取CNN模型的输入;通过预先整理的实体间关系与预测的结果进行误差比较,从而生成有效的关系抽取网络,建立关系抽取预测模型,并利用测试集检测模型的性能。
7.根据权利要求5所述的基于深度学习的乳腺电子病历联合关系抽取与结构化系统,其特征在于,所述乳腺电子病历数据的关系抽取模块基于机器学习的算法将生物医学NER视为序列标记问题,其中每个算法的目标是为给定输入句子找到最佳标签序列;通过把结构化也作为序列BIO标注任务,再利用编码层对输入的乳腺电子病历进行特征提取;将特征表示输入至结构化部分利用LSTM解码,将解码后的表示输入至Softmax层预测序列对应的标注;最后,将乳腺电子病历对应的表示与编码层的特征进行连接作为联合表示进行关系分类。
8.根据权利要求6所述的基于深度学习的乳腺电子病历联合关系抽取与结构化系统,其特征在于,所述特征提取是采用Bi-LSTM网络实现的,具体为:将输入语句转换为字向量,将其输入Bi-LSTM层;对于给定的输入序列,针对每一个输入将其向量化成d维向量;前向LSTM采用从左向右的输入方式,针对每一字得出相应的输出,从而得到前向句子输出;后向LSTM采用从右向左的输入方式,针对每一个字得出相应的输出,得到后向句子输出;将得到的前向句子输出和后向句子输出相加,即得出Bi-LSTM的输出结果。
CN201810699364.1A 2018-06-29 2018-06-29 基于深度学习的乳腺电子病历联合关系抽取与结构化系统 Pending CN109243616A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810699364.1A CN109243616A (zh) 2018-06-29 2018-06-29 基于深度学习的乳腺电子病历联合关系抽取与结构化系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810699364.1A CN109243616A (zh) 2018-06-29 2018-06-29 基于深度学习的乳腺电子病历联合关系抽取与结构化系统

Publications (1)

Publication Number Publication Date
CN109243616A true CN109243616A (zh) 2019-01-18

Family

ID=65072300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810699364.1A Pending CN109243616A (zh) 2018-06-29 2018-06-29 基于深度学习的乳腺电子病历联合关系抽取与结构化系统

Country Status (1)

Country Link
CN (1) CN109243616A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785927A (zh) * 2019-02-01 2019-05-21 上海众恒信息产业股份有限公司 基于互联网一体化医疗平台的临床文档结构化处理方法
CN109830303A (zh) * 2019-02-01 2019-05-31 上海众恒信息产业股份有限公司 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法
CN109994201A (zh) * 2019-03-18 2019-07-09 浙江大学 一种基于深度学习的糖尿病与高血压概率计算方法
CN110232127A (zh) * 2019-06-17 2019-09-13 重庆紫光华山智安科技有限公司 文本分类方法及装置
CN110444259A (zh) * 2019-06-06 2019-11-12 昆明理工大学 基于实体关系标注策略的中医电子病历实体关系提取方法
CN111176980A (zh) * 2019-12-10 2020-05-19 哈尔滨工业大学(深圳) 调试环境和运行环境分离的数据分析方法、装置及系统
CN111222340A (zh) * 2020-01-15 2020-06-02 东华大学 基于多标准主动学习的乳腺电子病历实体识别系统
CN111563399A (zh) * 2019-02-14 2020-08-21 阿里巴巴集团控股有限公司 获取电子病历的结构化信息的方法及装置
CN111724897A (zh) * 2020-06-12 2020-09-29 电子科技大学 一种运动功能数据处理方法及系统
WO2020211275A1 (zh) * 2019-04-18 2020-10-22 五邑大学 基于预训练模型与微调技术的医疗文本关系抽取方法
CN112182412A (zh) * 2020-11-26 2021-01-05 南京吉拉福网络科技有限公司 用于推荐体检项目的方法、计算设备和计算机存储介质
CN112445789A (zh) * 2019-08-16 2021-03-05 北京大数医达科技有限公司 用于将目标文本转化成结构化数据的方法和装置
CN112466462A (zh) * 2020-11-26 2021-03-09 华侨大学 一种基于图深度学习的emr信息关联及演化方法
CN112542223A (zh) * 2020-12-21 2021-03-23 西南科技大学 一种从中文电子病历构建医疗知识图谱的半监督学习方法
CN112883736A (zh) * 2021-02-22 2021-06-01 零氪科技(北京)有限公司 医疗实体关系抽取方法和装置
CN113032469A (zh) * 2019-12-24 2021-06-25 医渡云(北京)技术有限公司 文本结构化模型训练、医疗文本结构化方法及装置
JP2021099774A (ja) * 2019-12-20 2021-07-01 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド ドキュメントのベクトル化表現方法、ドキュメントのベクトル化表現装置及びコンピュータ機器
CN114912887A (zh) * 2022-04-20 2022-08-16 深圳市医未医疗科技有限公司 一种基于电子病历的临床数据录入方法及录入装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202044A (zh) * 2016-07-07 2016-12-07 武汉理工大学 一种基于深度神经网络的实体关系抽取方法
CN106446526A (zh) * 2016-08-31 2017-02-22 北京千安哲信息技术有限公司 电子病历实体关系抽取方法及装置
CN107122416A (zh) * 2017-03-31 2017-09-01 北京大学 一种中文事件抽取方法
CN107220506A (zh) * 2017-06-05 2017-09-29 东华大学 基于深度卷积神经网络的乳腺癌风险评估分析系统
CN107239446A (zh) * 2017-05-27 2017-10-10 中国矿业大学 一种基于神经网络与注意力机制的情报关系提取方法
CN107797993A (zh) * 2017-11-13 2018-03-13 成都蓝景信息技术有限公司 一种基于序列标注的事件抽取方法
CN107943847A (zh) * 2017-11-02 2018-04-20 平安科技(深圳)有限公司 企业关系提取方法、装置及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202044A (zh) * 2016-07-07 2016-12-07 武汉理工大学 一种基于深度神经网络的实体关系抽取方法
CN106446526A (zh) * 2016-08-31 2017-02-22 北京千安哲信息技术有限公司 电子病历实体关系抽取方法及装置
CN107122416A (zh) * 2017-03-31 2017-09-01 北京大学 一种中文事件抽取方法
CN107239446A (zh) * 2017-05-27 2017-10-10 中国矿业大学 一种基于神经网络与注意力机制的情报关系提取方法
CN107220506A (zh) * 2017-06-05 2017-09-29 东华大学 基于深度卷积神经网络的乳腺癌风险评估分析系统
CN107943847A (zh) * 2017-11-02 2018-04-20 平安科技(深圳)有限公司 企业关系提取方法、装置及存储介质
CN107797993A (zh) * 2017-11-13 2018-03-13 成都蓝景信息技术有限公司 一种基于序列标注的事件抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨晨浩: "基于深度学习的中文电子病历实体修饰与关系抽取研究及算法平台开发", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785927A (zh) * 2019-02-01 2019-05-21 上海众恒信息产业股份有限公司 基于互联网一体化医疗平台的临床文档结构化处理方法
CN109830303A (zh) * 2019-02-01 2019-05-31 上海众恒信息产业股份有限公司 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法
CN111563399B (zh) * 2019-02-14 2023-04-28 阿里巴巴集团控股有限公司 获取电子病历的结构化信息的方法及装置
CN111563399A (zh) * 2019-02-14 2020-08-21 阿里巴巴集团控股有限公司 获取电子病历的结构化信息的方法及装置
CN109994201A (zh) * 2019-03-18 2019-07-09 浙江大学 一种基于深度学习的糖尿病与高血压概率计算方法
CN109994201B (zh) * 2019-03-18 2021-06-11 浙江大学 一种基于深度学习的糖尿病与高血压概率计算系统
WO2020211275A1 (zh) * 2019-04-18 2020-10-22 五邑大学 基于预训练模型与微调技术的医疗文本关系抽取方法
CN110444259A (zh) * 2019-06-06 2019-11-12 昆明理工大学 基于实体关系标注策略的中医电子病历实体关系提取方法
CN110444259B (zh) * 2019-06-06 2022-09-23 昆明理工大学 基于实体关系标注策略的中医电子病历实体关系提取方法
CN110232127A (zh) * 2019-06-17 2019-09-13 重庆紫光华山智安科技有限公司 文本分类方法及装置
CN110232127B (zh) * 2019-06-17 2021-11-16 重庆紫光华山智安科技有限公司 文本分类方法及装置
CN112445789A (zh) * 2019-08-16 2021-03-05 北京大数医达科技有限公司 用于将目标文本转化成结构化数据的方法和装置
CN111176980B (zh) * 2019-12-10 2023-04-25 哈尔滨工业大学(深圳) 调试环境和运行环境分离的数据分析方法、装置及系统
CN111176980A (zh) * 2019-12-10 2020-05-19 哈尔滨工业大学(深圳) 调试环境和运行环境分离的数据分析方法、装置及系统
JP2021099774A (ja) * 2019-12-20 2021-07-01 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド ドキュメントのベクトル化表現方法、ドキュメントのベクトル化表現装置及びコンピュータ機器
JP7194150B2 (ja) 2019-12-20 2022-12-21 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ドキュメントのベクトル化表現方法、ドキュメントのベクトル化表現装置及びコンピュータ機器
US11403468B2 (en) 2019-12-20 2022-08-02 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for generating vector representation of text, and related computer device
CN113032469A (zh) * 2019-12-24 2021-06-25 医渡云(北京)技术有限公司 文本结构化模型训练、医疗文本结构化方法及装置
CN113032469B (zh) * 2019-12-24 2024-02-20 医渡云(北京)技术有限公司 文本结构化模型训练、医疗文本结构化方法及装置
CN111222340A (zh) * 2020-01-15 2020-06-02 东华大学 基于多标准主动学习的乳腺电子病历实体识别系统
CN111724897B (zh) * 2020-06-12 2022-07-01 电子科技大学 一种运动功能数据处理方法及系统
CN111724897A (zh) * 2020-06-12 2020-09-29 电子科技大学 一种运动功能数据处理方法及系统
CN112182412A (zh) * 2020-11-26 2021-01-05 南京吉拉福网络科技有限公司 用于推荐体检项目的方法、计算设备和计算机存储介质
CN112466462B (zh) * 2020-11-26 2023-03-07 华侨大学 一种基于图深度学习的emr信息关联及演化方法
CN112466462A (zh) * 2020-11-26 2021-03-09 华侨大学 一种基于图深度学习的emr信息关联及演化方法
CN112542223A (zh) * 2020-12-21 2021-03-23 西南科技大学 一种从中文电子病历构建医疗知识图谱的半监督学习方法
CN112883736A (zh) * 2021-02-22 2021-06-01 零氪科技(北京)有限公司 医疗实体关系抽取方法和装置
CN114912887A (zh) * 2022-04-20 2022-08-16 深圳市医未医疗科技有限公司 一种基于电子病历的临床数据录入方法及录入装置

Similar Documents

Publication Publication Date Title
CN109243616A (zh) 基于深度学习的乳腺电子病历联合关系抽取与结构化系统
Gheisari et al. Deep learning: Applications, architectures, models, tools, and frameworks: A comprehensive survey
CN109920501A (zh) 基于卷积神经网络和主动学习的电子病历分类方法及系统
CN111222340B (zh) 基于多标准主动学习的乳腺电子病历实体识别系统
CN108628824A (zh) 一种基于中文电子病历的实体识别方法
Islam et al. A comprehensive survey on applications of transformers for deep learning tasks
CN106682411A (zh) 一种将体检诊断数据转化为疾病标签的方法
CN107491655A (zh) 基于机器学习的肝脏疾病信息智能咨询方法及系统
CN113707339B (zh) 一种多源异质数据库间概念对齐与内容互译方法及系统
CN112466462B (zh) 一种基于图深度学习的emr信息关联及演化方法
CN110428907A (zh) 一种基于非结构化电子病历的文本挖掘方法及系统
Xu et al. Intelligent emotion detection method based on deep learning in medical and health data
CN109241520A (zh) 一种基于分词和命名实体识别的多层误差反馈神经网络的句子主干分析方法及系统
Xu et al. Vision transformers for computational histopathology
CN116881336A (zh) 一种用于医学大数据的高效多模态对比深度哈希检索方法
CN113903422A (zh) 医疗影像诊断报告实体提取方法、装置及设备
Hao et al. Query-aware video encoder for video moment retrieval
Yang et al. Chinese named entity recognition of epidemiological investigation of information on COVID-19 based on BERT
CN112216379A (zh) 一种基于智能联合学习的疾病诊断系统
CN112749277B (zh) 医学数据的处理方法、装置及存储介质
CN110060749A (zh) 基于sev-sdg-cnn的电子病历智能诊断方法
Vijayaraju Image retrieval using image captioning
Marerngsit et al. A two-stage text-to-emotion depressive disorder screening assistance based on contents from online community
CN112115719A (zh) 基于多头注意力机制的中医医案命名实体识别方法及系统
Song Personalized image classification by semantic embedding and active learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190118