CN111276258B - 一种基于领域知识的药物致病关系抽取方法 - Google Patents

一种基于领域知识的药物致病关系抽取方法 Download PDF

Info

Publication number
CN111276258B
CN111276258B CN202010039800.XA CN202010039800A CN111276258B CN 111276258 B CN111276258 B CN 111276258B CN 202010039800 A CN202010039800 A CN 202010039800A CN 111276258 B CN111276258 B CN 111276258B
Authority
CN
China
Prior art keywords
word
vector
neural network
entities
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010039800.XA
Other languages
English (en)
Other versions
CN111276258A (zh
Inventor
杨志豪
李智恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN202010039800.XA priority Critical patent/CN111276258B/zh
Publication of CN111276258A publication Critical patent/CN111276258A/zh
Application granted granted Critical
Publication of CN111276258B publication Critical patent/CN111276258B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于生物医学文本挖掘技术领域,一种基于领域知识的药物致病关系抽取方法,包括以下步骤:(1)处理药物致病关系数据集,(2)构建领域知识集合,(3)根据领域知识构建实体‑关系图,(4)实例中词语的向量表示,(5)搭建KB‑GCN神经网络模型。本发明一种基于领域知识的药物致病关系抽取方法切实可行且结构清晰,具有参考价值。本发明适应于应用数据库中的领域知识从生物医学文本中自动的识别药物致病关系,将有助于构建药物致病数据库,辅助药物副作用预测等方面中的应用。

Description

一种基于领域知识的药物致病关系抽取方法
技术领域
本发明涉及一种基于领域知识的药物致病关系抽取方法,属于生物医学文本挖掘技术领域。
背景技术
药物致病是指人在服用某种药物期间由于药物副作用导致某种疾病或病症的过程。药物致病关系的研究在药物开发、测试及服用阶段受到广发的关注。同时,以比较毒理基因组学数据库为例,其中人为的收录了一些已知的药物导致疾病的关系信息。此外,仍然有许多药物致病关系的描述存在于大量的生物医学文献中。这些药物致病关系对于扩充病理毒理相关数据库、指导药物研发与测试具有重大的理论价值和使用价值。
通过人工方法阅读生物医学文献并从中抽取出药物致病关系,需要生物医学背景知识的支持。这种人工抽取的方法耗时耗力且成本昂贵。随着文本挖掘技术的发展,利用机器学习的方法可以自动地从海量生物医学文本中抽取出药物致病关系。机器学习将药物致病关系抽取任务看作一个分类问题,该方法可以通过对人工标注的有限数量的训练样本进行建模,通过多轮迭代的训练方法得到模型,并应用在测试语料上。机器学习方法与人工方法相比具有成本低、效率高的优势。但是,现有机器学习方法往往忽略了已有数据库中的领域知识,关系抽取的准确率和召回率都有待提升。
发明内容
针对现有技术中存在的不足,本发明目的是提供一种基于领域知识的药物致病关系抽取方法。该方法可以通过对人工标注的有限数量的训练样本进行建模,通过多轮迭代的训练方法得到模型,并应用在测试语料上,克服了人工抽取的方法耗时、耗力且成本昂贵的问题。
为了实现上述发明目的,解决已有技术中存在的问题,本发明采取的技术方案是:一种基于领域知识的药物致病关系抽取方法,包括以下步骤:
步骤1、处理药物致病关系数据集,从已有的药物致病关系抽取评测任务中收集药物致病关系数据集,数据集中已标注出药物实体和疾病实体,以句子为单位,将药物实体与疾病实体组成实体对,按照训练集中标注的关系,处理成句子级别的实例,再将实例进行去重,词干化,去停用词,确定每个词语相对于实体的位置信息,最终得到句子级别的训练集;
步骤2、构建领域知识集合,将训练实例中的药物实体和疾病实体进行统计,并在比较毒理基因组学数据库中找到相关实体信息,获得与训练集中的实体相关的药物实体和疾病实体,并组成药物-疾病关系对,由于比较毒理基因组学数据库中记录了药物和疾病的诱导关系,因此,组成的药物-疾病关系对为药物致病关系对;除此之外,比较毒理基因组学数据库中还记录了基因、蛋白质和药物、疾病之间的关系,抽取出所有的关系,以三元组的形式构建成领域知识集合;
步骤3、根据领域知识构建实体-关系图,对于每一个实例,首先利用命名实体识别工具识别出句子中的所有基因、蛋白质实体,识别出的基因、蛋白质实体和数据集中预标的药物、疾病实体由多个词语组成,对于多个词语组成的命名实体,在实例中用边将实体名称与组成该实体名称的词语连接起来,形成实体图;另外,将实例中的所有实体进行两两组队,若两个实体组成的实体对出现在领域知识集合中,则将实例中这两个实体之间构建一条边,由此,得到以实例中所有词语和实体名称短语为节点,实体内部和实体间的关系作为边的图;
步骤4、实例中词语的向量表示,利用无监督训练模型对实例中的词语进行分布式表示,将实例中的每个词语表示为向量形式,作为词向量,具体作法为:对于实例中的每个词语定义一个d维实数向量,每一维实数向量为一个变量,每个词语与其前后k个词组成词语序列,其中d、k为自然数,使用Skip-Gram模型,将d维实数向量作为Skip-Gram模型的输入变量,通过损失函数和求导公式对Skip-Gram模型中的参数与输入变量进行更新,最后,将更新后得到的d维实数向量作为当前词语的词向量;除了词语的词向量之外,词语的位置向量也很重要,根据步骤1得到的每个词语相对于实体的位置信息,随机初始化成位置向量,拼接在词向量后面,得到词语的向量表示;
步骤5、搭建KB-GCN神经网络模型,具体包括以下子步骤:
(a)、确定KB-GCN神经网络模型的整体结构,该模型由基于双向长短时记忆神经网络的句子序列编码层,基于图神经网络的关系图编码层及在特征融合层后置softmax分类层所构成,最终得到药物致病关系的预测结果;
(b)、搭建基于双向长短时记忆神经网络LSTM的编码层,该编码层包含一个正向和一个反向的长短时记忆神经网络结构,用于对词语进行编码,然后通过双向的长短时记忆神经网络的最终时刻的向量拼接得到编码后的文本特征表示,基于双向长短时记忆神经网络编码层对词语进行编码的过程通过公式(1)-(3)进行描述,
Figure BDA0002367321370000031
Figure BDA0002367321370000032
Figure BDA0002367321370000033
式中,LSTMf()表示正向的长短时记忆神经网络,LSTMb()表示反向的长短时记忆神经网络,wt emb为第t个词的向量表示,其中包括预训练的词向量和随机初始化的位置向量,hf t-1为第t-1个词的正向隐层表示,hb t+1为第t+1个词的反向隐层表示,
Figure BDA0002367321370000035
为第t个词的正向的隐层表示,ht b为第t个词的反向的隐层表示,Hs表示实例的句子序列向量;
(c)、搭建基于图神经网络的关系图编码层,该编码层包含两个图卷积神经网络GCN层,用于对结合领域知识构建的实体-关系图进行编码,该编码层的过程通过公式(4)进行描述,
Figure BDA0002367321370000034
式中,Aij表示图的邻接矩阵,W(l)表示权重矩阵,b(l)表示权重向量,ρ表示RELU激活函数,gi (l)为第l层图卷积神经网络中第i个节点的向量表示,由于图中的每个节点即为输入句子中的词语,得到每个节点的编码表示之后,对整个图沿句子长度进行最大池化操作,最终得到图的整体表示,通过公式(5)进行描述,
Gi=max(gi) (5)
式中,gi表示节点向量中的第i维度数值,Gi表示该维度数值中的最大值,将每一维度的表示进行拼接,即可得到图的整体表示Gs
(d)、对基于双向长短时记忆神经网络LSTM的编码层和基于图神经网络的关系图编码层得到的特征向量进行拼接,通过线性映射操作以及使用softmax函数进行归一化处理,得到该输入实例的分类结果,通过公式(6)进行描述,
ys=Softmax(W[Hs;Gs]) (6)
式中,ys表示KB-GCN神经网络模型的输出向量,向量的每个值表示该词语属于每个标签的概率,通过对输出向量ys进行argmax操作得到最终分类的预测结果。
本发明有益效果是:一种基于领域知识的药物致病关系抽取方法,包括以下步骤:(1)处理药物致病关系数据集,(2)构建领域知识集合,(3)根据领域知识构建实体-关系图,(4)实例中词语的向量表示,(5)搭建KB-GCN神经网络模型。与已有技术相比,本发明一种基于领域知识的药物致病关系抽取方法切实可行且结构清晰,具有参考价值。本发明适应于应用数据库中的领域知识从生物医学文本中自动的识别药物致病关系,将有助于构建药物致病数据库,辅助药物副作用预测等方面中的应用。
附图说明
图1是本发明方法步骤流程图。
图2是本发明中的KB-GCN神经网络模型图。
具体实施方式
下面结合附图对本发明作进一步说明。
如图1所示,一种基于领域知识的药物致病关系抽取方法,包括以下步骤:
步骤1、处理药物致病关系数据集,从已有的药物致病关系抽取评测任务中收集药物致病关系数据集,数据集中已标注出药物实体和疾病实体,以句子为单位,将药物实体与疾病实体组成实体对,按照训练集中标注的关系,处理成句子级别的实例,再将实例进行去重,词干化,去停用词,确定每个词语相对于实体的位置信息,最终得到句子级别的训练集;
步骤2、构建领域知识集合,将训练实例中的药物实体和疾病实体进行统计,并在比较毒理基因组学数据库中找到相关实体信息,获得与训练集中的实体相关的药物实体和疾病实体,并组成药物-疾病关系对,由于比较毒理基因组学数据库中记录了药物和疾病的诱导关系,因此,组成的药物-疾病关系对为药物致病关系对;除此之外,比较毒理基因组学数据库中还记录了基因、蛋白质和药物、疾病之间的关系,抽取出所有的关系,以三元组的形式构建成领域知识集合;
步骤3、根据领域知识构建实体-关系图,对于每一个实例,首先利用命名实体识别工具识别出句子中的所有基因、蛋白质实体,识别出的基因、蛋白质实体和数据集中预标的药物、疾病实体由多个词语组成,对于多个词语组成的命名实体,在实例中用边将实体名称与组成该实体名称的词语连接起来,形成实体图;另外,将实例中的所有实体进行两两组队,若两个实体组成的实体对出现在领域知识集合中,则将实例中这两个实体之间构建一条边,由此,得到以实例中所有词语和实体名称短语为节点,实体内部和实体间的关系作为边的图;
步骤4、实例中词语的向量表示,利用无监督训练模型对实例中的词语进行分布式表示,将实例中的每个词语表示为向量形式,作为词向量,具体作法为:对于实例中的每个词语定义一个d维实数向量,每一维实数向量为一个变量,每个词语与其前后k个词组成词语序列,其中d、k为自然数,使用Skip-Gram模型,将d维实数向量作为Skip-Gram模型的输入变量,通过损失函数和求导公式对Skip-Gram模型中的参数与输入变量进行更新,最后,将更新后得到的d维实数向量作为当前词语的词向量;除了词语的词向量之外,词语的位置向量也很重要,根据步骤1得到的每个词语相对于实体的位置信息,随机初始化成位置向量,拼接在词向量后面,得到词语的向量表示;
步骤5、搭建KB-GCN神经网络模型,具体包括以下子步骤:
(a)、确定KB-GCN神经网络模型的整体结构,该模型由基于双向长短时记忆神经网络的句子序列编码层,基于图神经网络的关系图编码层及在特征融合层后置softmax分类层所构成,最终得到药物致病关系的预测结果;
(b)、搭建基于双向长短时记忆神经网络LSTM的编码层,该编码层包含一个正向和一个反向的长短时记忆神经网络结构,用于对词语进行编码,然后通过双向的长短时记忆神经网络的最终时刻的向量拼接得到编码后的文本特征表示,基于双向长短时记忆神经网络编码层对词语进行编码的过程通过公式(1)-(3)进行描述,
Figure BDA0002367321370000061
Figure BDA0002367321370000062
Figure BDA0002367321370000063
式中,LSTMf()表示正向的长短时记忆神经网络,LSTMb()表示反向的长短时记忆神经网络,wt emb为第t个词的向量表示,其中包括预训练的词向量和随机初始化的位置向量,hf t-1为第t-1个词的正向隐层表示,hb t+1为第t+1个词的反向隐层表示,
Figure BDA0002367321370000065
为第t个词的正向的隐层表示,ht b为第t个词的反向的隐层表示,Hs表示实例的句子序列向量;
(c)、搭建基于图神经网络的关系图编码层,该编码层包含两个图卷积神经网络GCN层,用于对结合领域知识构建的实体-关系图进行编码,该编码层的过程通过公式(4)进行描述,
Figure BDA0002367321370000064
式中,Aij表示图的邻接矩阵,W(l)表示权重矩阵,b(l)表示权重向量,ρ表示RELU激活函数,gi (l)为第l层图卷积神经网络中第i个节点的向量表示,由于图中的每个节点即为输入句子中的词语,得到每个节点的编码表示之后,对整个图沿句子长度进行最大池化操作,最终得到图的整体表示,通过公式(5)进行描述,
Gi=max(gi) (5)
式中,gi表示节点向量中的第i维度数值,Gi表示该维度数值中的最大值,将每一维度的表示进行拼接,即可得到图的整体表示Gs
(d)、对基于双向长短时记忆神经网络LSTM的编码层和基于图神经网络的关系图编码层得到的特征向量进行拼接,通过线性映射操作以及使用softmax函数进行归一化处理,得到该输入实例的分类结果,通过公式(6)进行描述,
ys=Softmax(W[Hs;Gs]) (6)
式中,ys表示KB-GCN神经网络模型的输出向量,向量的每个值表示该词语属于每个标签的概率,通过对输出向量ys进行argmax操作得到最终分类的预测结果。

Claims (1)

1.一种基于领域知识的药物致病关系抽取方法,其特征在于包括以下步骤:
步骤1、处理药物致病关系数据集,从已有的药物致病关系抽取评测任务中收集药物致病关系数据集,数据集中已标注出药物实体和疾病实体,以句子为单位,将药物实体与疾病实体组成实体对,按照训练集中标注的关系,处理成句子级别的实例,再将实例进行去重,词干化,去停用词,确定每个词语相对于实体的位置信息,最终得到句子级别的训练集;
步骤2、构建领域知识集合,将训练实例中的药物实体和疾病实体进行统计,并在比较毒理基因组学数据库中找到相关实体信息,获得与训练集中的实体相关的药物实体和疾病实体,并组成药物-疾病关系对,由于比较毒理基因组学数据库中记录了药物和疾病的诱导关系,因此,组成的药物-疾病关系对为药物致病关系对;除此之外,比较毒理基因组学数据库中还记录了基因、蛋白质和药物、疾病之间的关系,抽取出所有的关系,以三元组的形式构建成领域知识集合;
步骤3、根据领域知识构建实体-关系图,对于每一个实例,首先利用命名实体识别工具识别出句子中的所有基因、蛋白质实体,识别出的基因、蛋白质实体和数据集中预标的药物、疾病实体由多个词语组成,对于多个词语组成的命名实体,在实例中用边将实体名称与组成该实体名称的词语连接起来,形成实体图;另外,将实例中的所有实体进行两两组队,若两个实体组成的实体对出现在领域知识集合中,则将实例中这两个实体之间构建一条边,由此,得到以实例中所有词语和实体名称短语为节点,实体内部和实体间的关系作为边的图;
步骤4、实例中词语的向量表示,利用无监督训练模型对实例中的词语进行分布式表示,将实例中的每个词语表示为向量形式,作为词向量,具体作法为:对于实例中的每个词语定义一个d维实数向量,每一维实数向量为一个变量,每个词语与其前后k个词组成词语序列,其中d、k为自然数,使用Skip-Gram模型,将d维实数向量作为Skip-Gram模型的输入变量,通过损失函数和求导公式对Skip-Gram模型中的参数与输入变量进行更新,最后,将更新后得到的d维实数向量作为当前词语的词向量;除了词语的词向量之外,词语的位置向量也很重要,根据步骤1得到的每个词语相对于实体的位置信息,随机初始化成位置向量,拼接在词向量后面,得到词语的向量表示;
步骤5、搭建KB-GCN神经网络模型,具体包括以下子步骤:
(a)、确定KB-GCN神经网络模型的整体结构,该模型由基于双向长短时记忆神经网络的句子序列编码层,基于图神经网络的关系图编码层及在特征融合层后置softmax分类层所构成,最终得到药物致病关系的预测结果;
(b)、搭建基于双向长短时记忆神经网络LSTM的编码层,该编码层包含一个正向和一个反向的长短时记忆神经网络结构,用于对词语进行编码,然后通过双向的长短时记忆神经网络的最终时刻的向量拼接得到编码后的文本特征表示,基于双向长短时记忆神经网络编码层对词语进行编码的过程通过公式(1)-(3)进行描述,
Figure FDA0002367321360000021
Figure FDA0002367321360000022
Figure FDA0002367321360000023
式中,LSTMf()表示正向的长短时记忆神经网络,LSTMb()表示反向的长短时记忆神经网络,wt emb为第t个词的向量表示,其中包括预训练的词向量和随机初始化的位置向量,
Figure FDA0002367321360000024
为第t-1个词的正向隐层表示,hb t+1为第t+1个词的反向隐层表示,
Figure FDA0002367321360000025
为第t个词的正向的隐层表示,ht b为第t个词的反向的隐层表示,Hs表示实例的句子序列向量;
(c)、搭建基于图神经网络的关系图编码层,该编码层包含两个图卷积神经网络GCN层,用于对结合领域知识构建的实体-关系图进行编码,该编码层的过程通过公式(4)进行描述,
Figure FDA0002367321360000031
式中,Aij表示图的邻接矩阵,W(l)表示权重矩阵,b(l)表示权重向量,ρ表示RELU激活函数,gi (l)为第l层图卷积神经网络中第i个节点的向量表示,由于图中的每个节点即为输入句子中的词语,得到每个节点的编码表示之后,对整个图沿句子长度进行最大池化操作,最终得到图的整体表示,通过公式(5)进行描述,
Gi=max(gi) (5)
式中,gi表示节点向量中的第i维度数值,Gi表示该维度数值中的最大值,将每一维度的表示进行拼接,即可得到图的整体表示Gs
(d)、对基于双向长短时记忆神经网络LSTM的编码层和基于图神经网络的关系图编码层得到的特征向量进行拼接,通过线性映射操作以及使用softmax函数进行归一化处理,得到该输入实例的分类结果,通过公式(6)进行描述,
ys=Softmax(W[Hs;Gs]) (6)
式中,ys表示KB-GCN神经网络模型的输出向量,向量的每个值表示该词语属于每个标签的概率,通过对输出向量ys进行argmax操作得到最终分类的预测结果。
CN202010039800.XA 2020-01-15 2020-01-15 一种基于领域知识的药物致病关系抽取方法 Active CN111276258B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010039800.XA CN111276258B (zh) 2020-01-15 2020-01-15 一种基于领域知识的药物致病关系抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010039800.XA CN111276258B (zh) 2020-01-15 2020-01-15 一种基于领域知识的药物致病关系抽取方法

Publications (2)

Publication Number Publication Date
CN111276258A CN111276258A (zh) 2020-06-12
CN111276258B true CN111276258B (zh) 2022-10-14

Family

ID=71000280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010039800.XA Active CN111276258B (zh) 2020-01-15 2020-01-15 一种基于领域知识的药物致病关系抽取方法

Country Status (1)

Country Link
CN (1) CN111276258B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814460B (zh) * 2020-07-06 2021-02-09 四川大学 基于外部知识的药物相互作用关系抽取方法及系统
CN112101031B (zh) * 2020-08-25 2022-03-18 厦门渊亭信息科技有限公司 一种实体识别方法、终端设备及存储介质
CN112017735B (zh) * 2020-09-04 2023-08-22 平安科技(深圳)有限公司 基于关系抽取及知识推理的药物发现方法、装置及设备
CN112149411A (zh) * 2020-09-22 2020-12-29 常州大学 一种抗生素临床使用领域本体构建方法
CN112216396B (zh) * 2020-10-14 2022-11-22 复旦大学 一种基于图神经网络预测药物-副作用关系的方法
CN112364880B (zh) * 2020-11-30 2022-06-14 腾讯科技(深圳)有限公司 基于图神经网络的组学数据处理方法、装置、设备及介质
CN115631852B (zh) * 2022-11-02 2024-04-09 北京大学重庆大数据研究院 证型推荐方法、装置、电子设备及非易失性存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408642A (zh) * 2018-08-30 2019-03-01 昆明理工大学 一种基于距离监督的领域实体属性关系抽取方法
CN109446338A (zh) * 2018-09-20 2019-03-08 大连交通大学 基于神经网络的药物疾病关系分类方法
CN109902171A (zh) * 2019-01-30 2019-06-18 中国地质大学(武汉) 基于分层知识图谱注意力模型的文本关系抽取方法及系统
CN110083838A (zh) * 2019-04-29 2019-08-02 西安交通大学 基于多层神经网络与外部知识库的生物医学语义关系提取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408642A (zh) * 2018-08-30 2019-03-01 昆明理工大学 一种基于距离监督的领域实体属性关系抽取方法
CN109446338A (zh) * 2018-09-20 2019-03-08 大连交通大学 基于神经网络的药物疾病关系分类方法
CN109902171A (zh) * 2019-01-30 2019-06-18 中国地质大学(武汉) 基于分层知识图谱注意力模型的文本关系抽取方法及系统
CN110083838A (zh) * 2019-04-29 2019-08-02 西安交通大学 基于多层神经网络与外部知识库的生物医学语义关系提取方法

Also Published As

Publication number Publication date
CN111276258A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
CN111276258B (zh) 一种基于领域知识的药物致病关系抽取方法
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN111914558B (zh) 基于句袋注意力远程监督的课程知识关系抽取方法及系统
CN106776711B (zh) 一种基于深度学习的中文医学知识图谱构建方法
CN110019843B (zh) 知识图谱的处理方法及装置
CN112712118A (zh) 一种面向医疗文本数据的过滤方法及系统
CN112084790A (zh) 一种基于预训练卷积神经网络的关系抽取方法及系统
CN109753660B (zh) 一种基于lstm的中标网页命名实体抽取方法
CN110532398B (zh) 基于多任务联合神经网络模型的家族图谱自动构建方法
CN110750635B (zh) 一种基于联合深度学习模型的法条推荐方法
CN107818084B (zh) 一种融合点评配图的情感分析方法
CN109492105B (zh) 一种基于多特征集成学习的文本情感分类方法
CN107480194B (zh) 多模态知识表示自动学习模型的构建方法及系统
CN110717332A (zh) 基于非对称孪生网络的新闻与案件相似度计算方法
CN111581368A (zh) 一种基于卷积神经网络的面向智能专家推荐的用户画像方法
CN112989033B (zh) 基于情绪类别描述的微博情绪分类方法
CN115952292B (zh) 多标签分类方法、装置及计算机可读介质
CN114077673A (zh) 一种基于btbc模型的知识图谱构建方法
CN111581974A (zh) 一种基于深度学习的生物医学实体识别方法
CN114021584B (zh) 基于图卷积网络和翻译模型的知识表示学习方法
CN113946657A (zh) 一种基于知识推理的电力业务意图自动识别方法
CN114638362A (zh) 一种知识图谱构建方法及装置
CN112069825B (zh) 面向警情笔录数据的实体关系联合抽取方法
Sa et al. An English flipped classroom teaching model based on big data analysis
CN111782964B (zh) 一种社区帖子的推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant