CN109710932A - 一种基于特征融合的医疗实体关系抽取方法 - Google Patents
一种基于特征融合的医疗实体关系抽取方法 Download PDFInfo
- Publication number
- CN109710932A CN109710932A CN201811575826.5A CN201811575826A CN109710932A CN 109710932 A CN109710932 A CN 109710932A CN 201811575826 A CN201811575826 A CN 201811575826A CN 109710932 A CN109710932 A CN 109710932A
- Authority
- CN
- China
- Prior art keywords
- feature
- sentence
- entity
- vector
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 47
- 230000004927 fusion Effects 0.000 title claims abstract description 23
- 239000013598 vector Substances 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000013528 artificial neural network Methods 0.000 claims abstract description 15
- 239000000284 extract Substances 0.000 claims abstract description 15
- 230000000306 recurrent effect Effects 0.000 claims abstract description 13
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000003058 natural language processing Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 4
- 238000013480 data collection Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 2
- 230000037431 insertion Effects 0.000 claims description 2
- 210000004218 nerve net Anatomy 0.000 claims description 2
- 206010020772 Hypertension Diseases 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 239000007939 sustained release tablet Substances 0.000 description 4
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 3
- HYIMSNHJOBLJNT-UHFFFAOYSA-N nifedipine Chemical compound COC(=O)C1=C(C)NC(C)=C(C(=O)OC)C1C1=CC=CC=C1[N+]([O-])=O HYIMSNHJOBLJNT-UHFFFAOYSA-N 0.000 description 3
- 229960001597 nifedipine Drugs 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 206010047513 Vision blurred Diseases 0.000 description 1
- 230000003187 abdominal effect Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- XXSMGPRMXLTPCZ-UHFFFAOYSA-N hydroxychloroquine Chemical compound ClC1=CC=C2C(NC(C)CCCN(CCO)CC)=CC=NC2=C1 XXSMGPRMXLTPCZ-UHFFFAOYSA-N 0.000 description 1
- 229960004171 hydroxychloroquine Drugs 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- FGIUAXJPYTZDNR-UHFFFAOYSA-N potassium nitrate Chemical compound [K+].[O-][N+]([O-])=O FGIUAXJPYTZDNR-UHFFFAOYSA-N 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开一种基于特征融合的医疗实体关系抽取方法,包括:通过远程监督结合规则的方法将知识库中实体对齐到医疗语料,构建实体对句子集合;基于卷积神经网络模型对句子进行词级别的向量编码,得到句子的整体特征向量表示;使用循环神经网络分别提取句子最短依存路径上的左右两个子树方向的特征,并进行拼接操作;将两部分分别提取的句子整体特征和依存句法特征进行融合,对得到的融合特征进行最终的关系抽取。本发明的方法在利用依存句法结构的前提下,引入实体间能够表达实体关系类型的实体类型特征、位置特征以及句子的整体特征,并与依存句法特征进行融合,更好的学习句子之间的语义关系,有助于减少噪音数据对医疗实体关系抽取的干扰,能够在一定程度上提升医疗实体关系抽取的准确性。
Description
技术领域
本发明属于自然语言处理领域,尤其涉及一种基于特征融合的医疗实体关系抽取算法。
背景技术
随着医疗大数据时代的来临,电子病历的知识挖掘和利用受到越来越多的关注。电子病历本身是一种半结构化的数据,其结构化的内容为计算机自动抽取和分析提供了便利,同时,非结构化数据的规模远大于结构化数据,并且蕴藏着丰富的医疗知识和患者的健康信息,充分识别电子病历中的这些知识将大大推动医疗事业的发展。
关系抽取是信息抽取的重要子任务,其主要目的是将非结构化或半结构化描述的自然语言文本转化成结构化数据,关系抽取主要负责从文本中识别出实体,抽取实体间的语义关系。电子病历中概念实体之间的关系是医疗知识的重要组成部分,对于获取医疗领域中疾病、治疗、检查之间的关系有着重要的意义。
基于传统方法的关系抽取方法分为三种:基于监督学习的关系抽取,基于半监督关系抽取和基于Bootstrap学习的关系抽取。其中,基于监督的关系抽取很大程度上依赖于特征表示,如词法、句法、语义特征等。
随着深度学习的发展,循环神经网络(RNN,Recurrent Neural Network),和卷积神经网络(CNN,Convolutional Neural Networks)被广泛应用于自然语言处理领域,并在多个研究方向上取得显著高于传统方法的成绩。许多研究工作倾向于使用神经网络模型去解决关系抽取问题。神经网络模型能够自动学习句子特征,无需依赖复杂的特征工程,使用神经网络模型来学习句子的语义特征已经成为主流。
句法分析是自然语言处理中的关键技术之一,其基本任务是确定句子的句法结构或者句子中词汇之间的依存关系。在关系抽取时,将句子中关系实体之间的依存句法关系应用于实体关系抽取中,可以帮我们明确两实体之间的关系结构,同时摒弃冗余的噪声信息的干扰。现有的基于最短依存路径的关系抽取方法直接将最短依存路径提取的句法作为输入而忽略了句子的整体特征,可能造成实体关系所需的重要信息的缺失。
发明内容
本发明针对现有技术中存在的不足之处,提出一种基于融合的医疗实体关系抽取算法。具体而言,将句子的整体特征与最短依存路径上的特征进行融合,并加入其他对关系识别有益的特征,如实体类型特征、位置特征等。能够在实体关系识别过程中充分利用最短依存路径对句子良好的表示性,结合句子的整体特征,更好的学习包括两个实体所在句子的语义特征,有助于减少噪音数据对实体关系抽取的干扰,能够在一定程度上提高医疗实体关系抽取的准确性。
本发明采用如下技术方案,一种基于特征融合的医疗实体关系抽取方法,该方法的实现过程如下:步骤一:获取初始已标注医疗关系抽取数据集构建实体关系知识库,将关系实体及其关系以三元组的形式存入关系知识库中。
步骤二:利用预处理后的未标注关系抽取数据集及知识库中的实体对,通过远程监督结合规则的方法将知识库中的实体对齐到未标注医疗关系抽取数据集,构建实体对句子组合。
步骤三:借助于自然语言处理工具LTP对关系数据集中的每个句子进行依存句法分析,并从依存路径上提取句子的最短依存路径。
步骤四:通过同义词林等来构建词语的同义词库、上位词库,针对最短依存路径上的词获取其上位词,同时基于同义词库对医疗实体进行消歧。
步骤五:对分词后的句子获取其词语本身特征、词性特征、实体类别和位置特征等。
步骤六:将句子中每个词映射为实值向量,并通过向量拼接的方式获得词语本身的词向量、位置向量、实体类别向量的融合向量。
步骤七:网络模型分为基于卷积神经网络的句子整体特征提取部分和基于循环神经网络的句子依存特征提取部分。分别使用卷积神经网络和循环神经网络提取句子的整体特征和最短依存路径特征,并将两个特征进行融合。
步骤八:将融合后的特征输入到分类器中对关系进行分类。
步骤四中通过查找WordNet、HowNet字典库获取关系实体特征词的同义词库和上位词词库,标识出关系实体特征词,并对实体的歧义进行消除。
步骤五中使用分词后的大量医疗数据集训练词向量,除Word2vec训练的词向量之外,其余特征受类别数量影响,向量表述过于稀疏,所以对这些特征采用随机初始化来表示。
步骤六中距离向量的获取,使用dist(l)进行初始化dist(l)=tanl(l/S),距离向量与词向量使用相同的维度,其中dist是相对距离为l时的距离向量,S是指句子中所有相对距离的最大值,dist1与dist2分别表示当前词与目标实体e1和e2的距离,则当前词的距离向量dist(i)是这两个向量的拼接。
步骤七中对于句子整体特征的获取,使用卷积神经网络获取。对给定的标注了实体的句子S=x1,x2,x3,…,xn,实体词为xe1,xe2,其中e1,e2∈[1,n]且e1≠e2,将句子中的每个词xi映射为d维实值向量wi,最后通过向量拼接的方式获得xi的词向量、位置向量、实体类别向量的融合向量,ri=[(wi)T,(widist1)T,(widist2)T,(witype)T]T,模型的输入在输入层和特征映射层被映射为一个二维矩阵[r1,r2,r3,…,r4],作为卷积层的输入,分别经过卷积和池化操作,获取句子的粗粒度特征。
步骤七中分别使用两个循环神经网络或循环神经网络的变体GRU对最短路径左右两个子树方向上的依存句法特征进行提取,沿最短路径两个子树的方向,分别使用三个通道的特征:最短依存路径上的词语信息、词性标注POS信息、WordNet上位词信息,每个通道中,将特征映射为词嵌入的形式来捕获特征,最后利用最大池化层从每个循环神经网络的结点收集信息,将不同通道的特征进行融合。
所述步骤七中在最后的特征融合阶段,将两部分别分提取的句子的整体特征和依存句法特征进行向量拼接作为整个模型提取的特征,将融合后的特征输入全连接神经网络,最后加一层SOFTMAX分类器,进行实体关系抽取。
因此,本发明具有如下优点:在利用依存句法结构的前提下,引入实体之间能够表达实体关系的实体类型特征、实体位置特征,以及句子的整体特征,并与依存句法特征进行融合,结合深度神经网络模型,更好的学习句子之间的语义关系,有利于减少噪音数据对实体关系抽取的干扰,能够在一定程度上提高医疗实体关系分类的准确性。
附图说明
图1为本发明提出的方法的整体流程图。
图2为医疗句子的依存句法分析图。
图3为算法中涉及的循环神经网络模型的结构。
具体实施方式
下面将详细描述本发明各个方面的特征和示例性实施例。下面的描述涵盖了许多具体细节,以便提供对本发明的全面理解。但是,对于本领域技术人员来说显而易见的是,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更清楚的理解。本发明绝不限于下面所提出的任何具体配置和算法,而是在不脱离本发明的精神的前提下覆盖了相关元素、部件和算法的任何修改、替换和改进。
如图1所示,本发明提供一种基于特征融合的医疗实体关系抽取方法,包括以下步骤:
步骤一:获取初始已标注医疗关系抽取数据集构建实体关系知识库,将关系实体及其关系以三元组的形式存入关系知识库中。
步骤二:利用预处理后的未标注关系抽取数据集及知识库中的实体对,通过远程监督结合规则的方法将知识库中的实体对齐到未标注医疗关系抽取数据集,构建实体对句子组合。
远程监督的提出基于以下假设:两个实体如果在知识库中存在某种关系,则包含两个实体的句子均能表示出这种关系。但是该方法的假设过于肯定,构造数据集的过程中会引入噪声数据。例如:在句子“患者既往有高血压病10余年,长期口服硝苯地平缓释片,血压控制尚可。”中,医疗实体“高血压病”和“硝苯地平缓释片”的关系是治疗改善了疾病(TrID)的关系,而在句子“既往有高血压病6年,血压最高160/100mmHg,长期口服硝苯地平缓释片降压治疗,血压控制情况不详。”中,因治疗结果未提及,医疗实体“高血压病”和“硝苯地平缓释片”的关系是治疗施加于疾病(TrAD)的关系。针对远程监督关系抽取可能引入的噪音问题,在远程监督的基础上结合了规则,针对每一类关系,挖掘出该类实体中的重要关系指示词,基于关系指示词和知识库,利用远程监督构造关系数据集。如:TrID关系指示词有:尚可、尚平稳、好转、恢复好等。
步骤三:将关系数据集输入到依存句法解析器(如哈工大LTP)中,生成依存句法树,并从依存路径上提取句子的最短依存路径。由于针对的是医疗数据,其中涉及许多医疗领域的专业术语,为了尽量避免在分词、词性标注、及句法分析中发生错误,在进行依存句法分析时加入了医疗实体词典。利用建立的医疗实体词典,使医疗词典中出现的词汇作为整体进行句法标注,这样既简化了句法树结构,又可以使后期得到的最短依存句法保持一定的完整的语义信息。对句子“病程中患者出现视物模糊,考虑羟氯喹副作用引起,故暂停用。”的句法分析结果如图2所示。
步骤四:通过同义词林等来构建词语的同义词库、上位词库,针对最短依存路径上的词获取其上位词,同时基于同义词库对医疗实体进行消歧。
通过查找WordNet、HowNet等字典库获取关系实体特征词的同义词库和上位词词库,标识出关系实体特征词,并对实体的歧义进行消除。
如在医疗文本中,症状实体“左上腹压痛”和“急性腹痛”的上位词均为“腹痛”。
步骤五:对分词后的句子获取其词语本身特征、词性特征、实体类别和位置特征等。
步骤六:将句子中每个词映射为实值向量,并通过向量拼接的方式获得词语本身的词向量、位置向量、实体类别向量的融合向量。形成诸如(w0,w1,w2,…,wn)形式的词序列形式。其中w的结表示为[Word,POS,NR,PO,TYPE]。使用分词后的大量医疗数据集训练词向量,除Word2vec训练的词向量之外,其余特征受类别数量影响,向量表述过于稀疏,所以对这些特征采用随机初始化来表示。
步骤七:网络模型分为基于卷积神经网络的句子整体特征提取部分和基于循环神经网络的句子依存特征提取部分。分别使用卷积神经网络和循环神经网络提取句子的整体特征和最短依存路径特征,并将两个特征进行融合。
距离向量的获取,使用dist(l)进行初始化dist(l)=tanl(l/S),距离向量与词向量使用相同的维度,其中dist是相对距离为l时的距离向量,S是指句子中所有相对距离的最大值,dist1与dist2分别表示当前词与目标实体e1和e2的距离,则当前词的距离向量dist(i)是这两个向量的拼接。
对于句子整体特征的获取,使用卷积神经网络获取。对给定的标注了实体的句子S=x1,x2,x3,…,xn(实体词为xe1,xe2,其中e1,e2∈[1,n]且e1≠e2),将句子中的每个词xi映射为d维实值向量wi,最后通过向量拼接的方式获得xi的词向量、位置向量、实体类别向量的融合向量,ri=[(wi)T,(widist1)T,(widist2)T,(witype)T]T,模型的输入在输入层和特征映射层被映射为一个二维矩阵[r1,r2,r3,…,r4],作为卷积层的输入,分别经过卷积和池化操作,获取句子的粗粒度特征。为防止过拟合问题,在模型的输入层和卷积层之间,加入dropout层。
步骤八:将融合后的特征输入到分类器中对关系进行分类。在最后的分类阶段,将融合后的句子特征和最短路径特征输入到全连接神经网络中,最后输入softmax分类器对医疗实体关系进行分类。
但是,需要明确,本发明并不局限于上文所描述并在图中示出的特定配置和处理。并且,为了简明起见,这里省略对已知方法技术的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神之后,做出各种改变、修改和添加,或者改变步骤之间的顺序。
本发明可以以其他的具体形式实现,而不脱离其精神和本质特征。例如,特定实施例中所描述的方法可以被修改,而系统体系结构并不脱离本发明的基本精神。因此,当前的实施例在所有方面都被看作是示例性的而非限定性的,本发明的范围由所附权利要求而非上述描述定义,并且,落入权利要求的含义和等同物的范围内的全部改变从而都被包括在本发明的范围之中。
Claims (7)
1.一种基于特征融合的医疗实体关系抽取方法,其特征在于,包括:
步骤一:获取初始已标注医疗关系抽取数据集构建实体关系知识库,将关系实体及其关系以三元组的形式存入关系知识库中;
步骤二:利用预处理后的未标注关系抽取数据集及知识库中的实体对,通过远程监督结合规则的方法将知识库中的实体对齐到未标注医疗关系抽取数据集,构建实体对句子组合;
步骤三:借助于自然语言处理工具LTP对关系数据集中的每个句子进行依存句法分析,并从依存路径上提取句子的最短依存路径;
步骤四:通过同义词林等来构建词语的同义词库、上位词库,针对最短依存路径上的词获取其上位词,同时基于同义词库对医疗实体进行消歧;
步骤五:对分词后的句子获取其词语本身特征、词性特征、实体类别和位置特征;
步骤六:将句子中每个词映射为实值向量,并通过向量拼接的方式获得词语本身的词向量、位置向量、实体类别向量的融合向量;
步骤七:网络模型分为基于卷积神经网络的句子整体特征提取部分和基于循环神经网络的句子依存特征提取部分;分别使用卷积神经网络和循环神经网络提取句子的整体特征和最短依存路径特征,并将两个特征进行融合;
步骤八:将融合后的特征输入到分类器中对关系进行分类。
2.根据权利要求1所述的一种基于特征融合的医疗实体关系抽取方法,其特征在于,所述步骤四中通过查找WordNet、HowNet字典库获取关系实体特征词的同义词库和上位词词库,标识出关系实体特征词,并对实体的歧义进行消除。
3.根据权利要求1所述的一种基于特征融合的医疗实体关系抽取方法,其特征在于,所述步骤五中使用分词后的大量医疗数据集训练词向量,除Word2vec训练的词向量之外,其余特征受类别数量影响,向量表述过于稀疏,所以对这些特征采用随机初始化来表示。
4.根据权利要求1所述的一种基于特征融合的医疗实体关系抽取方法,其特征在于,所述步骤六中距离向量的获取,使用dist(l)进行初始化dist(l)=tanl(l/S),距离向量与词向量使用相同的维度,其中dist是相对距离为l时的距离向量,S是指句子中所有相对距离的最大值,dist1与dist2分别表示当前词与目标实体e1和e2的距离,则当前词的距离向量dist(i)是这两个向量的拼接。
5.根据权利要求1所述的一种基于特征融合的医疗实体关系抽取方法,其特征在于,所述步骤七中对于句子整体特征的获取,使用卷积神经网络获取;对给定的标注了实体的句子S=x1,x2,x3,…,xn,实体词为xe1,xe2,其中e1,e2∈[1,n]且e1≠e2,将句子中的每个词xi映射为d维实值向量wi,最后通过向量拼接的方式获得xi的词向量、位置向量、实体类别向量的融合向量,ri=[(wi)T,(wi dist1)T,(wi dist2)T,(wi type)T]T,模型的输入在输入层和特征映射层被映射为一个二维矩阵[r1,r2,r3,…,r4],作为卷积层的输入,分别经过卷积和池化操作,获取句子的粗粒度特征。
6.根据权利要求1所述的一种基于特征融合的医疗实体关系抽取方法,其特征在于,所述步骤七中分别使用两个循环神经网络或循环神经网络的变体GRU对最短路径左右两个子树方向上的最短依存句法特征进行提取,沿最短路径两个子树的方向,分别使用三个通道的特征:最短依存路径上的词语信息、词性标注POS信息、WordNet上位词信息,每个通道中,将特征映射为词嵌入的形式来捕获特征,最后利用最大池化层从每个循环神经网络的结点收集信息,将不同通道的特征进行融合。
7.根据权利要求1所述的一种基于特征融合的医疗实体关系抽取方法,其特征在于,所述步骤七中在最后的特征融合阶段,将两部分别分提取的句子的整体特征和依存句法特征进行向量拼接作为整个模型提取的特征,将融合后的特征输入全连接神经网络,最后加一层SOFTMAX分类器,进行实体关系抽取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811575826.5A CN109710932A (zh) | 2018-12-22 | 2018-12-22 | 一种基于特征融合的医疗实体关系抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811575826.5A CN109710932A (zh) | 2018-12-22 | 2018-12-22 | 一种基于特征融合的医疗实体关系抽取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109710932A true CN109710932A (zh) | 2019-05-03 |
Family
ID=66257114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811575826.5A Pending CN109710932A (zh) | 2018-12-22 | 2018-12-22 | 一种基于特征融合的医疗实体关系抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109710932A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110196978A (zh) * | 2019-06-04 | 2019-09-03 | 重庆大学 | 一种关注关联词的实体关系抽取方法 |
CN110377753A (zh) * | 2019-07-01 | 2019-10-25 | 吉林大学 | 基于关系触发词与gru模型的关系抽取方法及装置 |
CN110472049A (zh) * | 2019-07-19 | 2019-11-19 | 上海联影智能医疗科技有限公司 | 疾病筛查文本分类方法、计算机设备和可读存储介质 |
CN111078895A (zh) * | 2019-12-18 | 2020-04-28 | 江南大学 | 基于去噪卷积神经网络的远程监督实体关系抽取方法 |
CN111223539A (zh) * | 2019-12-30 | 2020-06-02 | 同济大学 | 中文电子病历的关系抽取方法 |
CN111291556A (zh) * | 2019-12-17 | 2020-06-16 | 东华大学 | 基于实体义项的字和词特征融合的中文实体关系抽取方法 |
CN111339774A (zh) * | 2020-02-07 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 文本的实体关系抽取方法和模型训练方法 |
CN111597341A (zh) * | 2020-05-22 | 2020-08-28 | 北京慧闻科技(集团)有限公司 | 一种文档级关系抽取方法、装置、设备及存储介质 |
CN111625622A (zh) * | 2020-04-28 | 2020-09-04 | 北京中科智加科技有限公司 | 领域本体构建方法、装置、电子设备及存储介质 |
CN111898364A (zh) * | 2020-07-30 | 2020-11-06 | 平安科技(深圳)有限公司 | 神经网络关系抽取方法、计算机设备及可读存储介质 |
CN112599211A (zh) * | 2020-12-25 | 2021-04-02 | 中电云脑(天津)科技有限公司 | 一种医疗实体关系抽取方法及装置 |
CN112765370A (zh) * | 2021-03-29 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 知识图谱的实体对齐方法、装置、计算机设备和存储介质 |
CN112860904A (zh) * | 2021-04-06 | 2021-05-28 | 哈尔滨工业大学 | 一种融入外部知识的生物医疗关系抽取方法 |
CN113035362A (zh) * | 2021-02-26 | 2021-06-25 | 北京工业大学 | 一种基于语义图网络的医疗预测方法及系统 |
CN113130025A (zh) * | 2020-01-16 | 2021-07-16 | 中南大学 | 一种实体关系抽取方法、终端设备及计算机可读存储介质 |
CN113343694A (zh) * | 2021-04-29 | 2021-09-03 | 山东师范大学 | 一种医疗命名实体识别方法及系统 |
CN113360582A (zh) * | 2021-06-04 | 2021-09-07 | 中国人民解放军战略支援部队信息工程大学 | 基于bert模型融合多元实体信息的关系分类方法及系统 |
CN113393916A (zh) * | 2021-08-17 | 2021-09-14 | 浙江卡易智慧医疗科技有限公司 | 一种冠脉医疗报告结构关系提取的方法和装置 |
CN113515598A (zh) * | 2021-06-22 | 2021-10-19 | 国网电子商务有限公司 | 一种网络威胁情报文档实体关系提取方法及装置 |
CN113539491A (zh) * | 2021-06-16 | 2021-10-22 | 武汉大学中南医院 | 基于深度学习的良性前列腺增生评估决策辅助系统 |
CN113609868A (zh) * | 2021-09-01 | 2021-11-05 | 首都医科大学宣武医院 | 一种多任务问答驱动的医疗实体关系抽取方法 |
CN113609846A (zh) * | 2021-08-06 | 2021-11-05 | 首都师范大学 | 一种语句中实体关系的抽取方法及装置 |
CN113869056A (zh) * | 2021-10-14 | 2021-12-31 | 国网电子商务有限公司 | 一种基于远程监督的关系抽取方法及装置 |
CN114912887A (zh) * | 2022-04-20 | 2022-08-16 | 深圳市医未医疗科技有限公司 | 一种基于电子病历的临床数据录入方法及录入装置 |
CN115658924A (zh) * | 2022-11-14 | 2023-01-31 | 智慧眼科技股份有限公司 | 诊疗知识图谱构建方法及其应用方法、装置和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106484675A (zh) * | 2016-09-29 | 2017-03-08 | 北京理工大学 | 融合分布式语义和句义特征的人物关系抽取方法 |
CN106649275A (zh) * | 2016-12-28 | 2017-05-10 | 成都数联铭品科技有限公司 | 基于词性信息和卷积神经网络的关系抽取方法 |
CN107180247A (zh) * | 2017-05-19 | 2017-09-19 | 中国人民解放军国防科学技术大学 | 基于选择性注意力卷积神经网络的关系分类器及其方法 |
CN108363816A (zh) * | 2018-03-21 | 2018-08-03 | 北京理工大学 | 基于句义结构模型的开放式实体关系抽取方法 |
US20180232443A1 (en) * | 2017-02-16 | 2018-08-16 | Globality, Inc. | Intelligent matching system with ontology-aided relation extraction |
-
2018
- 2018-12-22 CN CN201811575826.5A patent/CN109710932A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106484675A (zh) * | 2016-09-29 | 2017-03-08 | 北京理工大学 | 融合分布式语义和句义特征的人物关系抽取方法 |
CN106649275A (zh) * | 2016-12-28 | 2017-05-10 | 成都数联铭品科技有限公司 | 基于词性信息和卷积神经网络的关系抽取方法 |
US20180232443A1 (en) * | 2017-02-16 | 2018-08-16 | Globality, Inc. | Intelligent matching system with ontology-aided relation extraction |
CN107180247A (zh) * | 2017-05-19 | 2017-09-19 | 中国人民解放军国防科学技术大学 | 基于选择性注意力卷积神经网络的关系分类器及其方法 |
CN108363816A (zh) * | 2018-03-21 | 2018-08-03 | 北京理工大学 | 基于句义结构模型的开放式实体关系抽取方法 |
Non-Patent Citations (4)
Title |
---|
CARTIC RAMAKRISHNAN; PABLO N. MENDES; RODRIGO A.T.S DA GAMA; GUI: "Joint Extraction of Compound Entities and Relationships from Biomedical Literature", 《IEEE》 * |
姚春华;刘潇;高弘毅;鄢秋霞: "基于句法语义特征的实体关系抽取技术", 《通信技术》 * |
张雄: "面向网络文本数据的实体关系抽取技术研究", 《CNKI优秀硕士学位论文全文库》 * |
杨锦锋;于秋滨;关毅;蒋志鹏: "电子病历命名实体识别和实体关系抽取研究综述", 《自动化学报》 * |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110196978A (zh) * | 2019-06-04 | 2019-09-03 | 重庆大学 | 一种关注关联词的实体关系抽取方法 |
CN110377753B (zh) * | 2019-07-01 | 2022-10-21 | 吉林大学 | 基于关系触发词与gru模型的关系抽取方法及装置 |
CN110377753A (zh) * | 2019-07-01 | 2019-10-25 | 吉林大学 | 基于关系触发词与gru模型的关系抽取方法及装置 |
CN110472049A (zh) * | 2019-07-19 | 2019-11-19 | 上海联影智能医疗科技有限公司 | 疾病筛查文本分类方法、计算机设备和可读存储介质 |
CN110472049B (zh) * | 2019-07-19 | 2023-01-24 | 上海联影智能医疗科技有限公司 | 疾病筛查文本分类方法、计算机设备和可读存储介质 |
CN111291556A (zh) * | 2019-12-17 | 2020-06-16 | 东华大学 | 基于实体义项的字和词特征融合的中文实体关系抽取方法 |
CN111291556B (zh) * | 2019-12-17 | 2021-10-26 | 东华大学 | 基于实体义项的字和词特征融合的中文实体关系抽取方法 |
CN111078895A (zh) * | 2019-12-18 | 2020-04-28 | 江南大学 | 基于去噪卷积神经网络的远程监督实体关系抽取方法 |
CN111078895B (zh) * | 2019-12-18 | 2023-04-18 | 江南大学 | 基于去噪卷积神经网络的远程监督实体关系抽取方法 |
CN111223539A (zh) * | 2019-12-30 | 2020-06-02 | 同济大学 | 中文电子病历的关系抽取方法 |
CN113130025A (zh) * | 2020-01-16 | 2021-07-16 | 中南大学 | 一种实体关系抽取方法、终端设备及计算机可读存储介质 |
CN113130025B (zh) * | 2020-01-16 | 2023-11-24 | 中南大学 | 一种实体关系抽取方法、终端设备及计算机可读存储介质 |
CN111339774A (zh) * | 2020-02-07 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 文本的实体关系抽取方法和模型训练方法 |
CN111339774B (zh) * | 2020-02-07 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 文本的实体关系抽取方法和模型训练方法 |
CN111625622A (zh) * | 2020-04-28 | 2020-09-04 | 北京中科智加科技有限公司 | 领域本体构建方法、装置、电子设备及存储介质 |
CN111597341B (zh) * | 2020-05-22 | 2024-01-26 | 北京慧闻科技(集团)有限公司 | 一种文档级关系抽取方法、装置、设备及存储介质 |
CN111597341A (zh) * | 2020-05-22 | 2020-08-28 | 北京慧闻科技(集团)有限公司 | 一种文档级关系抽取方法、装置、设备及存储介质 |
CN111898364A (zh) * | 2020-07-30 | 2020-11-06 | 平安科技(深圳)有限公司 | 神经网络关系抽取方法、计算机设备及可读存储介质 |
WO2021174774A1 (zh) * | 2020-07-30 | 2021-09-10 | 平安科技(深圳)有限公司 | 神经网络关系抽取方法、计算机设备及可读存储介质 |
CN111898364B (zh) * | 2020-07-30 | 2023-09-26 | 平安科技(深圳)有限公司 | 神经网络关系抽取方法、计算机设备及可读存储介质 |
CN112599211B (zh) * | 2020-12-25 | 2023-03-21 | 中电云脑(天津)科技有限公司 | 一种医疗实体关系抽取方法及装置 |
CN112599211A (zh) * | 2020-12-25 | 2021-04-02 | 中电云脑(天津)科技有限公司 | 一种医疗实体关系抽取方法及装置 |
CN113035362B (zh) * | 2021-02-26 | 2024-04-09 | 北京工业大学 | 一种基于语义图网络的医疗预测方法及系统 |
CN113035362A (zh) * | 2021-02-26 | 2021-06-25 | 北京工业大学 | 一种基于语义图网络的医疗预测方法及系统 |
CN112765370A (zh) * | 2021-03-29 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 知识图谱的实体对齐方法、装置、计算机设备和存储介质 |
CN112860904A (zh) * | 2021-04-06 | 2021-05-28 | 哈尔滨工业大学 | 一种融入外部知识的生物医疗关系抽取方法 |
CN113343694A (zh) * | 2021-04-29 | 2021-09-03 | 山东师范大学 | 一种医疗命名实体识别方法及系统 |
CN113343694B (zh) * | 2021-04-29 | 2023-04-07 | 山东师范大学 | 一种医疗命名实体识别方法及系统 |
CN113360582A (zh) * | 2021-06-04 | 2021-09-07 | 中国人民解放军战略支援部队信息工程大学 | 基于bert模型融合多元实体信息的关系分类方法及系统 |
CN113539491A (zh) * | 2021-06-16 | 2021-10-22 | 武汉大学中南医院 | 基于深度学习的良性前列腺增生评估决策辅助系统 |
CN113515598B (zh) * | 2021-06-22 | 2021-12-07 | 国网电子商务有限公司 | 一种网络威胁情报文档实体关系提取方法及装置 |
CN113515598A (zh) * | 2021-06-22 | 2021-10-19 | 国网电子商务有限公司 | 一种网络威胁情报文档实体关系提取方法及装置 |
CN113609846B (zh) * | 2021-08-06 | 2022-10-04 | 首都师范大学 | 一种语句中实体关系的抽取方法及装置 |
CN113609846A (zh) * | 2021-08-06 | 2021-11-05 | 首都师范大学 | 一种语句中实体关系的抽取方法及装置 |
CN113393916A (zh) * | 2021-08-17 | 2021-09-14 | 浙江卡易智慧医疗科技有限公司 | 一种冠脉医疗报告结构关系提取的方法和装置 |
CN113609868A (zh) * | 2021-09-01 | 2021-11-05 | 首都医科大学宣武医院 | 一种多任务问答驱动的医疗实体关系抽取方法 |
CN113869056A (zh) * | 2021-10-14 | 2021-12-31 | 国网电子商务有限公司 | 一种基于远程监督的关系抽取方法及装置 |
CN114912887A (zh) * | 2022-04-20 | 2022-08-16 | 深圳市医未医疗科技有限公司 | 一种基于电子病历的临床数据录入方法及录入装置 |
CN115658924A (zh) * | 2022-11-14 | 2023-01-31 | 智慧眼科技股份有限公司 | 诊疗知识图谱构建方法及其应用方法、装置和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109710932A (zh) | 一种基于特征融合的医疗实体关系抽取方法 | |
Mathews et al. | Semstyle: Learning to generate stylised image captions using unaligned text | |
Arora et al. | Character level embedding with deep convolutional neural network for text normalization of unstructured data for Twitter sentiment analysis | |
CN109284396A (zh) | 医学知识图谱构建方法、装置、服务器及存储介质 | |
Bhutani et al. | Learning to answer complex questions over knowledge bases with query composition | |
Zhu et al. | Knowledge-based question answering by tree-to-sequence learning | |
CN109543183A (zh) | 基于深度神经网络和标注策略的多标签实体-关系联合提取方法 | |
CN108182295A (zh) | 一种企业知识图谱属性抽取方法及系统 | |
CN111222049B (zh) | 语义增强的异构信息网络上Top-k相似度搜索方法 | |
CN105512209A (zh) | 一种基于特征自动学习的生物医学事件触发词识别方法 | |
CN111666758B (zh) | 中文分词方法、训练设备以及计算机可读存储介质 | |
CN109960728A (zh) | 一种开放域会议信息命名实体识别方法及系统 | |
CN113806563A (zh) | 面向多源异构建筑人文史料的建筑师知识图谱构建方法 | |
CN112989835B (zh) | 一种复杂医疗实体抽取方法 | |
CN112151183A (zh) | 一种基于Lattice LSTM模型的中文电子病历的实体识别方法 | |
Ren et al. | Detecting the scope of negation and speculation in biomedical texts by using recursive neural network | |
CN116719913A (zh) | 一种基于改进命名实体识别的医疗问答系统及其构建方法 | |
CN108021682A (zh) | 开放式信息抽取背景下一种基于维基百科的实体语义化方法 | |
CN104317882A (zh) | 一种决策级中文分词融合方法 | |
CN115545021A (zh) | 一种基于深度学习的临床术语识别方法与装置 | |
Yan et al. | Implicit emotional tendency recognition based on disconnected recurrent neural networks | |
CN112836062B (zh) | 一种文本语料库的关系抽取方法 | |
CN112800244B (zh) | 一种中医药及民族医药知识图谱的构建方法 | |
CN117235261A (zh) | 一种多模态方面级情感分析方法、装置、设备及存储介质 | |
CN116227594A (zh) | 面向多源数据的医疗行业高可信度知识图谱的构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190503 |