CN113420552B - 一种基于强化学习的生物医学多事件抽取方法 - Google Patents

一种基于强化学习的生物医学多事件抽取方法 Download PDF

Info

Publication number
CN113420552B
CN113420552B CN202110788532.6A CN202110788532A CN113420552B CN 113420552 B CN113420552 B CN 113420552B CN 202110788532 A CN202110788532 A CN 202110788532A CN 113420552 B CN113420552 B CN 113420552B
Authority
CN
China
Prior art keywords
word
vector
reinforcement learning
module
event extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202110788532.6A
Other languages
English (en)
Other versions
CN113420552A (zh
Inventor
赵卫中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central China Normal University
Original Assignee
Central China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central China Normal University filed Critical Central China Normal University
Priority to CN202110788532.6A priority Critical patent/CN113420552B/zh
Publication of CN113420552A publication Critical patent/CN113420552A/zh
Application granted granted Critical
Publication of CN113420552B publication Critical patent/CN113420552B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于强化学习的生物医学多事件抽取方法,将具有实体标注的句子通过词嵌入模块导入学习模块中,并对词进行预先训练,本发明的有益效果是:通过利用强化学习框架建模生物医学事件抽取的两个子任务,将两个任务分别作为主要任务和辅助任务,并通过强化学习的奖励机制建模了两个任务之间的交互关系,提高了事件抽取效率;通过利用强化学习框架,将已抽取的事件映射为向量保存在环境信息中,可以很好的帮助后续的事件抽取任务,从而提高模型在多事件抽取任务中的表现;通过在学习模块中引入外部知识库,有效地获取了这些特殊词语的外部知识库信息,从而加强了文本的表示,有利于后续的事件抽取任务。

Description

一种基于强化学习的生物医学多事件抽取方法
技术领域
本发明涉及生物医学技术领域,具体为一种基于强化学习的生物医学多事件抽取方法。
背景技术
近年来,生物医学领域的发展日新月异,相关科研文献增长的速度远远超过我们人类的阅读能力,研究者们通常需要花费大量的时间、精力去查找和阅读文献,以了解跟踪生物医学领域的最新研究进展,因此,如何自动从海量的生物医学文献中挖掘出对生物医学研究者有用的信息,并以结构化的方式进行展示成为了一个值得研究的问题。生物医学事件抽取是将非结构化的生物医学文本数据转化为生物医学事件的结构化表示,广泛应用于生物医学领域的知识获取和知识图谱构建等应用中,然而,由于生物医学事件中生物实体之间关系的复杂性,一种有效的事件提取方法在生物医学领域仍然亟待开发。
生物医学事件抽取的概念源自于事件抽取,通用领域中通常会将事件抽取划分为触发词识别和元素检测两个任务,传统的方法都是按顺序执行这两个任务,综合目前国内外研究,事件抽取的主要研究方法分为基于规则、基于统计机器学习和基于深度学习方法三大类,基于规则的方法在特定领域内能取得较高的性能,但移植性较差,相对于基于规则的方法,统计机器学习与领域无关,无需太多领域专家的指导,系统移植性较好,但是在统计机器学习方法中,提取的特征的质量往往决定着系统的性能,而复杂的特征工程又是极其复杂和耗时的,因此自动提取特征的端到端的深度学习方法已成为事件抽取的主流研究方法,然而目前的这些方法仍然具有两个主要的缺点:1、对于生物医学领域的专有名词、缩写等词表示信息不够充分,无法很好的建模生物医学文本;2、一个句子中存在多个事件在生物医学领域是一个很普遍的现象,现有的方法在处理这种多事件问题时效率低下。
发明内容
本发明的目的在于提供一种基于强化学习的生物医学多事件抽取方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案一种基于强化学习的生物医学多事件抽取方法,包括以下步骤:
S1、将具有实体标注的句子通过词嵌入模块导入学习模块中,并对词进行预先训练,然后通过词性嵌入模块对句子中的每一个单词进行词性标注,并将其映射为向量,通过实体类型嵌入模块对标注后单词Xt的实体类型查找,并对其进行向量分配,然后将获取到的外部知识映射为一个向量导入外部知识嵌入模块中,通过学习模块将输入的句子X转换成一个新的词序列(W1,...,W2,...Wn),并输入到事件抽取模块中;
S2、通过强化学习智能体依次扫描输入句子中的单词,并根据RL中的随机策略将事件类型分配给相应的单词,当强化学习agent识别出一个触发词后,将这个词的词向量和当前的环境信息联接作为当前的状态St,并将作为agent的输入,然后agent根据当前的状态信息,输出决策行动at,表示对于当前触发词,模型预测出的事件类型;
S3、将表示行动的向量at和表示当前触发词的向量wt与句子中的每个词向量联接得到一个新的句子表示X=(W1,...,W2,...Wn),将其作为一个BiLSTM-CRF模块的输入,完成给定触发词的元素检测;
S4、模型预测的结果与训练集的真实标注将用于计算一个奖励值,用来评估当前模型采取的决策的好坏,同时,预测的结果还被映射为一个向量Lt并保存在环境信息中,最后对结构化事件进行输出;
所述学习模块由词嵌入模块、词性嵌入模块、实体类型嵌入模块和外部知识嵌入模块组成;
所述词嵌入模块用于通过查找预先训练好的词,并将其嵌入模型,同时对初始化词嵌入向量,并在整个框架的训练过程中进行微调;
所述词性嵌入模块用于通过斯坦福标注工具对给定句子中的每个单词进行词性标注,并将其映射为向量,同时在模型训练过程中进行微调;
所述实体类型嵌入模块用于根据实体类型查找嵌入表,并对每个单词分Xt配一个随机初始化的向量,并在整个框架的训练过程中进行微调;
所述外部知识嵌入模块采用基因本体和蛋白质本体作为外部知识库,并针对生物医学事件进行任务抽取,同时将获取到的外部知识映射为一个向量,并将该向量知识嵌入到外部知识库中。
作为优选,所述强化学习智能体内部包含有强化学习框架,且所述强化学习框架用于对整个事件抽取过程进行建模。
作为优选,所述强化学习框架由行动决策A、状态S、策略π和奖励R四个部分组成。
与现有技术相比,本发明的有益效果是:
1.通过利用强化学习框架建模生物医学事件抽取的两个子任务,将两个任务分别作为主要任务和辅助任务,并通过强化学习的奖励机制建模了两个任务之间的交互关系,提高了事件抽取效率;
2.通过利用强化学习框架,将已抽取的事件映射为向量保存在环境信息中,可以很好的帮助后续的事件抽取任务,从而提高模型在多事件抽取任务中的表现;
3.通过在学习模块中引入外部知识库,有效地获取了这些特殊词语的外部知识库信息,从而加强了文本的表示,有利于后续的事件抽取任务。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明生物医学多事件抽取方法的流程图。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种技术方案:一种基于强化学习的生物医学多事件抽取方法,包括以下步骤:
S1、将具有实体标注的句子通过词嵌入模块导入学习模块中,并对词进行预先训练,然后通过词性嵌入模块对句子中的每一个单词进行词性标注,并将其映射为向量,通过实体类型嵌入模块对标注后单词Xt的实体类型查找,并对其进行向量分配,然后将获取到的外部知识映射为一个向量导入外部知识嵌入模块中,通过学习模块将输入的句子X转换成一个新的词序列(W1,...,W2,...Wn),并输入到事件抽取模块中;
S2、通过强化学习智能体依次扫描输入句子中的单词,并根据RL中的随机策略将事件类型分配给相应的单词,当强化学习agent识别出一个触发词后,将这个词的词向量和当前的环境信息联接作为当前的状态St,并将作为agent的输入,然后agent根据当前的状态信息,输出决策行动at,表示对于当前触发词,模型预测出的事件类型;
S3、将表示行动的向量at和表示当前触发词的向量wt与句子中的每个词向量联接得到一个新的句子表示X=(W1,...,W2,...Wn),将其作为一个BiLSTM-CRF模块的输入,完成给定触发词的元素检测;
S4、模型预测的结果与训练集的真实标注将用于计算一个奖励值,用来评估当前模型采取的决策的好坏,同时,预测的结果还被映射为一个向量Lt并保存在环境信息中,最后对结构化事件进行输出;
所述学习模块由词嵌入模块、词性嵌入模块、实体类型嵌入模块和外部知识嵌入模块组成;
所述词嵌入模块用于通过查找预先训练好的词,并将其嵌入模型,同时对初始化词嵌入向量,并在整个框架的训练过程中进行微调;
所述词性嵌入模块用于通过斯坦福标注工具对给定句子中的每个单词进行词性标注,并将其映射为向量,同时在模型训练过程中进行微调;
所述实体类型嵌入模块用于根据实体类型查找嵌入表,并对每个单词分Xt配一个随机初始化的向量,并在整个框架的训练过程中进行微调;
所述外部知识嵌入模块采用基因本体和蛋白质本体作为外部知识库,并针对生物医学事件进行任务抽取,同时将获取到的外部知识映射为一个向量,并将该向量知识嵌入到外部知识库中。
其中,所述强化学习智能体内部包含有强化学习框架,且所述强化学习框架用于对整个事件抽取过程进行建模。
其中,所述强化学习框架由行动决策A、状态S、策略π和奖励R四个部分组成。
具体的,当模型的输入是一个生物医学文本中的句子X,它由N个单词组成,即X=(x1,...,x2,...,xn),在表示学习模块中,每个单词xt被映射为一个向量wt,其由词嵌入、词性嵌入、实体类型嵌入和外部知识嵌入四部分信息组成:对于每个单词xt,通过查找预先训练好的词嵌入模型初始化词嵌入向量,并在整个框架的训练过程中进行微调,在本发明中采用预训练模型BioBERT作为词嵌入模型;对于给定的句子,使用斯坦福标注工具给句中的每个单词进行词性标注,并将其映射为向量,在模型训练过程中进行微调;由于实体标注能够提供某些线索来识别事件触发词和元素,因此实体类型(包括类型“None”)的嵌入也被用来丰富单词的语义信息,对于每个单词xt,通过根据实体类型查找嵌入表来分配一个随机初始化向量,并在整个框架的训练过程中进行微调;针对生物医学事件抽取任务,主要使用了基因本体和蛋白质本体作为外部知识库,可以为跨所有物种的基因或蛋白质的属性提供更详细的描述,为了更方便地获取这些外部知识库提供的额外信息,还使用QuickGOAPI和ProteinsAPI来从相应的知识库中查询生物医学实体的属性,对于每个实体,主要选择实体类型和本体定义两种类型的属性,同时还将获取到的外部知识映射为一个向量作为这个词的外部知识嵌入,通过学习模块将输入的句子x转换成一个新的词表示序列(W1,...,W2,...Wn),并输入到事件抽取模块中用于事件抽取,同时还可以学习信息更丰富的词性表示,
由于强化学习智能体中包含有强化学习框架,可以通过强化学习框架来建模整个事件抽取过程,因为在事件抽取的过程中,触发词识别的结果会直接影响到后续元素检测任务的表现,因此在我们的模型中,触发词识别被作为主要任务,而元素检测作为其附属任务,在主任务中,强化学习智能体(Agent)依次扫描输入句子中的单词,并根据RL中的随机策略将事件类型(包括“None”)分配给相应的单词,如果当前单词被识别为事件触发词,则启动一个附属任务来完成已识别触发词的元素检测,并利用元素检测的结果来计算主任务中所采取行动的奖励,否则,如果预测的事件类型为“None”,Agent将跳转到下一个令牌以进行后续触发器识别,整个事件抽取的过程如下:
当强化学习agent识别出一个触发词后,将这个词的词向量和当前的环境信息(用于表示之前已经抽取到的事件信息)联接作为当前的状态St,并将作为agent的输入,然后agent根据当前的状态信息,输出决策行动at,表示对于当前触发词,模型预测出的事件类型,随后,将表示行动的向量at和表示当前触发词的向量wt与句子中的每个词向量联接得到一个新的句子表示X=(W1,...,W2,...Wn),将其作为一个BiLSTM-CRF模块的输入,完成给定触发词的元素检测,然后模型预测的结果与训练集的真实标注将用于计算一个奖励值,用来评估当前模型采取的决策的好坏,同时,预测的结果还被映射为一个向量Lt并保存在环境信息中,用于帮助后续的事件抽取;通过使用奖励机制和向量Lt,附属任务元素检测的结果能够反馈到触发词识别的过程中,在强化学习框架下,智能体agent被训练采取能获得更高的奖励的行动,这将在给定的输入句子中得出更好的生物医学事件抽取结果,强化学习框架主要由:行动(决策)A、状态S、策略π和奖励R四个部分组成,每个组成部分的细节描述如下:
行动(决策)A:在t时刻,行动at是表示当前单词wt所触发的生物医学事件的类型,在本方法中,每个行动都是从A={Note}UT中选择的,其中{Note}表示当前词不是触发词,t是事件类型的集合;
状态S:在t时刻,状态st∈S是由当前单词的词表示wt;最近一次采取的行动at(at≠None);表示上一次事件抽取结果的向量Lt;上一时刻的状态st-1;且st由st=f(ws[wt;at;Lt;st-1])公式得到,其中f(.)是一个由MLP实现的非线性函数,ws是在模型训练过程中可以学习的权重矩阵;
策略P:用于触发词识别的随机策略π:S→A,定义了一个行动的概率分布:at~π(atst)=softmax(Wπst),其中softmax(.)的参数在模型的训练过程中被优化;
奖励R:在采取了行动at后,环境首先给出了一个基础奖励rt b,通过判断预测的事件类型at是否在句子x中,来估计最终奖励,基础奖励的定义为:
如果at=None,强化学习agent将跳到下一个标记,并在下一时刻采取一个新的主任务决策,同时保持环境信息中的at和Lt不改变,否则,agent将在确定的事件触发词下,为相应的元素检测启动一个附属任务,随后,模型预测的结果和训练集提供的标准标注Y用于计算一个最终奖励,用于评估事件抽取结果的好坏,计算公式如下:
其中g(.)是指示函数,如果里面的断言为真时,输出1,否则输出0,为了得到最策略,采用一种策略梯度算法对模型进行训练,可以使预期的累积优
奖励最大化,在每个时间步长t,强化学习agent按照策略π对预测的行动轨迹进行采样,累积奖励可按如下方式计算:
其中θn.t表示在t时刻的策略π的参数,y表示折损因子,然后使用REINFORCE算法,用策略分布中的行动采样轨迹近似计算公式中的期望值,并在训练过程中优化策略更新参数的梯度计算公式如下:
其中b表示阈值,它被设定为以前所有奖励的平均值。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (3)

1.一种基于强化学习的生物医学多事件抽取方法,其特征在于,包括以下步骤:
S1、将具有实体标注的句子通过词嵌入模块导入学习模块中,并对词进行预先训练,然后通过词性嵌入模块对句子中的每一个单词进行词性标注,并将其映射为向量,通过实体类型嵌入模块对标注后单词Xt的实体类型查找,并对其进行向量分配,然后将获取到的外部知识映射为一个向量导入外部知识嵌入模块中,通过学习模块将输入的句子X转换成一个新的词序列(W1,...,W2,...Wn),并输入到事件抽取模块中;
S2、通过强化学习智能体依次扫描输入句子中的单词,并根据RL中的随机策略将事件类型分配给相应的单词,当强化学习agent识别出一个触发词后,将这个词的词向量和当前的环境信息联接作为当前的状态St,并将作为agent的输入,然后agent根据当前的状态信息,输出决策行动at,表示对于当前触发词,模型预测出的事件类型;
S3、将表示行动的向量at和表示当前触发词的向量wt与句子中的每个词向量联接得到一个新的句子表示X=(W1,...,W2,...Wn),将其作为一个BiLSTM-CRF模块的输入,完成给定触发词的元素检测;
S4、模型预测的结果与训练集的真实标注将用于计算一个奖励值,用来评估当前模型采取的决策的好坏,同时,预测的结果还被映射为一个向量Lt并保存在环境信息中,最后对结构化事件进行输出;
所述学习模块由词嵌入模块、词性嵌入模块、实体类型嵌入模块和外部知识嵌入模块组成;
所述词嵌入模块用于通过查找预先训练好的词,并将其嵌入模型,同时对初始化词嵌入向量,并在整个框架的训练过程中进行微调;
所述词性嵌入模块用于通过斯坦福标注工具对给定句子中的每个单词进行词性标注,并将其映射为向量,同时在模型训练过程中进行微调;
所述实体类型嵌入模块用于根据实体类型查找嵌入表,并对每个单词分Xt配一个随机初始化的向量,并在整个框架的训练过程中进行微调;
所述外部知识嵌入模块采用基因本体和蛋白质本体作为外部知识库,并针对生物医学事件进行任务抽取,同时将获取到的外部知识映射为一个向量,并将该向量知识嵌入到外部知识库中。
2.根据权利要求1所述的一种基于强化学习的生物医学多事件抽取方法,其特征在于:所述强化学习智能体内部包含有强化学习框架,且所述强化学习框架用于对整个事件抽取过程进行建模。
3.根据权利要求2所述的一种基于强化学习的生物医学多事件抽取方法,其特征在于:所述强化学习框架由行动决策A、状态S、策略π和奖励R四个部分组成。
CN202110788532.6A 2021-07-13 2021-07-13 一种基于强化学习的生物医学多事件抽取方法 Expired - Fee Related CN113420552B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110788532.6A CN113420552B (zh) 2021-07-13 2021-07-13 一种基于强化学习的生物医学多事件抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110788532.6A CN113420552B (zh) 2021-07-13 2021-07-13 一种基于强化学习的生物医学多事件抽取方法

Publications (2)

Publication Number Publication Date
CN113420552A CN113420552A (zh) 2021-09-21
CN113420552B true CN113420552B (zh) 2023-09-15

Family

ID=77720765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110788532.6A Expired - Fee Related CN113420552B (zh) 2021-07-13 2021-07-13 一种基于强化学习的生物医学多事件抽取方法

Country Status (1)

Country Link
CN (1) CN113420552B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113987104B (zh) * 2021-09-28 2024-06-21 浙江大学 一种基于本体指导的生成式事件抽取方法
CN114254128A (zh) * 2021-12-29 2022-03-29 中山大学 基于多源异构数据的垂直领域知识图谱构建方法及系统
CN116992861B (zh) * 2023-09-25 2023-12-08 四川健康久远科技有限公司 基于数据处理的医疗服务智慧处理方法及系统
CN118246556B (zh) * 2024-05-28 2024-11-12 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于强化学习的类型推断方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347807A (zh) * 2019-05-20 2019-10-18 平安科技(深圳)有限公司 问题信息处理方法及装置
CN111797241A (zh) * 2020-06-17 2020-10-20 北京北大软件工程股份有限公司 基于强化学习的事件论元抽取方法及装置
CN112069811A (zh) * 2020-08-24 2020-12-11 武汉大学 多任务交互增强的电子文本事件抽取方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9135241B2 (en) * 2010-12-08 2015-09-15 At&T Intellectual Property I, L.P. System and method for learning latent representations for natural language tasks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347807A (zh) * 2019-05-20 2019-10-18 平安科技(深圳)有限公司 问题信息处理方法及装置
CN111797241A (zh) * 2020-06-17 2020-10-20 北京北大软件工程股份有限公司 基于强化学习的事件论元抽取方法及装置
CN112069811A (zh) * 2020-08-24 2020-12-11 武汉大学 多任务交互增强的电子文本事件抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向金融知识图谱的实体和关系联合抽取算法;胡扬;闫宏飞;陈翀;;重庆理工大学学报(自然科学)(第05期);全文 *

Also Published As

Publication number Publication date
CN113420552A (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN113420552B (zh) 一种基于强化学习的生物医学多事件抽取方法
CN110737758B (zh) 用于生成模型的方法和装置
CN112364174A (zh) 基于知识图谱的病人病历相似度评估方法及系统
WO2021139247A1 (zh) 医学领域知识图谱的构建方法、装置、设备及存储介质
CN111243699A (zh) 基于字词信息融合的中文电子病历实体抽取方法
CN111143574A (zh) 一种基于少数民族文化知识图谱的查询及可视化系统构建方法
CN116932722A (zh) 一种基于跨模态数据融合的医学视觉问答方法及系统
CN112420151A (zh) 一种超声报告后结构化解析方法、系统、设备和介质
CN111145914B (zh) 一种确定肺癌临床病种库文本实体的方法及装置
CN113221571B (zh) 基于实体相关注意力机制的实体关系联合抽取方法
CN116258147A (zh) 一种基于异构图卷积的多模态评论情感分析方法及系统
CN112926323B (zh) 基于多级残差卷积与注意力机制的中文命名实体识别方法
CN115796161A (zh) 一种实体关系联合抽取方法及系统
CN114841151A (zh) 基于分解-重组策略的医学文本实体关系联合抽取方法
CN116701665A (zh) 基于深度学习的中医古籍知识图谱构建方法
CN114021569B (zh) 一种基于深度学习的生物医学实体识别和关系预测的方法
CN112836019B (zh) 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质
CN117312559B (zh) 基于树结构信息感知的方面级情感四元组抽取方法及系统
CN116386148B (zh) 基于知识图谱引导的小样本动作识别方法及系统
CN116401373B (zh) 一种试题知识点的标注方法、存储介质及设备
CN115879450B (zh) 一种逐步文本生成方法、系统、计算机设备及存储介质
CN113361277A (zh) 基于注意力机制的医学命名实体识别建模方法
CN117033631A (zh) 一种基于跨度级别和对抗训练的双向情感三元组抽取方法
CN117933380B (zh) 一种电力行业科研知识抽取方法及系统
CN111310459B (zh) 机器学习组件的训练方法及装置、中文分词方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20230915

CF01 Termination of patent right due to non-payment of annual fee