CN111008279B - 一种实体关系抽取方法及装置 - Google Patents

一种实体关系抽取方法及装置 Download PDF

Info

Publication number
CN111008279B
CN111008279B CN201911179314.1A CN201911179314A CN111008279B CN 111008279 B CN111008279 B CN 111008279B CN 201911179314 A CN201911179314 A CN 201911179314A CN 111008279 B CN111008279 B CN 111008279B
Authority
CN
China
Prior art keywords
word
word sequence
sequence information
decoding
copying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911179314.1A
Other languages
English (en)
Other versions
CN111008279A (zh
Inventor
曾祥荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN201911179314.1A priority Critical patent/CN111008279B/zh
Publication of CN111008279A publication Critical patent/CN111008279A/zh
Application granted granted Critical
Publication of CN111008279B publication Critical patent/CN111008279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种实体关系抽取方法,包括:将预处理的词序列信息输入神经网络;对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;抽取所有关系三元组,并在预设时刻结束。采用本发明所公开的方案,能够解决实体关系抽取中实体重叠的问题。

Description

一种实体关系抽取方法及装置
技术领域
本发明涉及信息处理技术领域,特别涉及一种实体关系抽取方法及装置。
背景技术
随着互联网技术的快速发展,信息呈爆炸式增长,如何准确高效地从这些文本中抽取出有效信息成为一个亟需解决的需求,现有的基于神经网络的实体关系抽取方法主要由以下步骤构成:首先是对文本进行标注,给其中的每个词标记上一个预先定义好的标签;然后构建神经网络模型,使其对输入的每个词预测一个标签,使用标注好的数据对模型进行训练;最后使用训练好的神经网络对输入句子的每个词进行标签预测,并根据每个词的标签来搜集关系三元组。
现有的方法是基于序列标注实现的,每个词只能被标记一个标签,不能参与多个关系的三元组,因而无法解决实体重叠问题。
发明内容
本发明提供一种实体关系抽取方法及装置,用以解决实体关系抽取时的实体重叠问题。
本发明提供一种实体关系抽取方法,包括:
将预处理的词序列信息输入神经网络;
对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;
对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;
抽取所有关系三元组,并在预设时刻结束。
上述技术方案的有益效果为:通过融合拷贝机制,采用生成的方式获取出入词序列中的关系三元组,输入词序列中的词可以被拷贝多次,因而一个词可以参与多个关系三元组,从而解决了实体关系抽取中实体重叠的问题。
具体的,所述得到输入词序列信息的编码表示,包括:
对输入词序列进行定义;
对所述输入词序列进行词向量预处理,得到词向量矩阵;
对所述词向量矩阵中的词向量进行计算,得到所述输入词序列信息的编码表示。
具体的,所述利用拷贝机制进行解码,得到三元组,包括:
定义解码器的解码时刻;
通过计算,得到解码器在解码时刻的输出向量和隐状态;
对所述输出向量进行分类操作,得到所述三元组中的两个相关实体的关系以及两个相关实体。
具体的,所述得到所述三元组中的两个相关实体的关系以及两个相关实体,包括:
对输出向量进行分类操作,得到预测的关系;
对所述输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体;
对所述输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体。
具体的,所述抽取所有关系三元组,并在预设时间结束,包括:
解码时刻小于所述预设时刻,继续抽取三元组;
解码时刻等于所述预设时刻,结束抽取,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
本发明提供一种实体关系抽取装置,包括:
输入模块,用于将预处理的词序列信息输入神经网络;
编码模块,用于对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;
解码模块,用于对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;
抽取模块,用于抽取所有关系三元组,并在预设时刻结束。
具体的,所述编码模块,包括:
词序列定义单元,用于对输入词序列进行定义;
预处理单元,用于对所述输入词序列进行词向量预处理,得到词向量矩阵;
编码计算单元,用于对所述词向量矩阵中的词向量进行计算,得到所述输入词序列信息的编码表示。
具体的,所述解码模块,包括:
时刻定义单元,用于定义解码器的解码时刻;
解码计算单元,用于通过计算,得到解码器在解码时刻的输出向量和隐状态;
分类单元,用于对所述输出向量进行分类操作,得到所述三元组中的两个相关实体以及两个相关实体的关系。
具体的,所述分类单元,包括:
分类子单元,用于对输出向量进行分类操作,得到预测的关系;
第一复制子单元,用于对所述输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体;
第二复制子单元,用于对所述输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体。
具体的,所述抽取模块,包括:
判断单元,用于解码时刻小于所述预设时刻,继续抽取三元组;
所述判断单元,还用于解码时刻等于所述预设时刻,结束抽取,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种实体关系抽取方法的流程图;
图2为本发明实施例中一种实体关系抽取装置的框图;
图3为本发明实施例中一种实体关系抽取装置的框图;
图4为本发明实施例中一种实体关系抽取装置的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明一实施例中一种实体关系抽取方法流程图,如图1所示,该方法可被实施为以下步骤S11-S14:
S11:将预处理的词序列信息输入神经网络;
S12:对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;
S13:对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;
S14:抽取所有关系三元组,并在预设时刻结束。
实体关系抽取是指从给定的词序列(通常是句子)中抽取出所有关系三元组,关系三元组(简称三元组)包含了一个关系以及相关的两个实体,例如“(国籍,姚明,中国)”就是一个关系三元组,表示“姚明”的“国籍”是“中国”;实体重叠问题是指两个(或者多个)三元组之间会出现共享实体(共享一个或者两个)的情况,例如三元组“(国籍,姚明,中国)”与“(职业,姚明,篮球运动员)”就存在实体重叠;将预处理信息输入神经网络,神经网络利用拷贝机制直接生成各个关系三元组,通过这种方法,解决了实体关系抽取中的实体重叠问题。
上述技术方案的有益效果为:通过融合拷贝机制,采用生成的方式获取出入词序列中的关系三元组,输入词序列中的词可以被拷贝多次,因而一个词可以参与多个关系三元组,从而解决了实体关系抽取中实体重叠的问题。
在一个实施例中,所述得到输入词序列信息的编码表示,包括:
对输入词序列进行定义;
对所述输入词序列进行词向量预处理,得到词向量矩阵;
对所述词向量矩阵中的词向量进行计算,得到所述输入词序列信息的编码表示。
例如,定义x=[x1,...,xn]为输入词序列,对此输入序列进行词向量预处理,得到词向量矩阵X=[v1...vn],其中vn表示第n个词的向量,通过编码器中的编码计算单元对词向量进行计算,得到输入词序列信息的编码表示,输入词序列信息的编码表示由以下公式得到:
其中,为第n个词的编码表示,/>为输入词序列信息的编码表示,f()为编码计算单元。
上述技术方案的有益效果为:通过上述技术方案可以提高实体关系抽取中的准确性。
在一个实施例中,利用拷贝机制进行解码,得到三元组,包括:
定义解码器的解码时刻;
通过计算,得到解码器在解码时刻的输出向量和隐状态;
对所述输出向量进行分类操作,得到所述三元组中的两个相关实体的关系以及两个相关实体。
例如,定义t是解码时刻,t=1,2,3…,T,其中T是3的整数倍,通过解码器中的解码计算单元进行计算,得到解码器在t时刻的输出向量和隐状态/>输出向量/>和隐向量由以下公式得到:
其中,ut表示t时刻解码器的输入,它是上一时刻的输出向量,g()为解码计算单元,需要说明的是u0是随机初始化的可学习向量。
在一个实施例中,得到所述三元组中的两个相关实体的关系以及两个相关实体,包括:
对输出向量进行分类操作,得到预测的关系;
对所述输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体;
对所述输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体。
如果t%3=1,进行关系预测,首先定义一共有m个待分类的关系,然后使用softmax分类器获取所预测的关系,预测的关系由以下公式得到:
其中,Wl和bl是随机初始化的可学习参数,需要说明的是t%3=1是指t除以3的余数是1;
如果t%3=2,利用拷贝机制,对输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体,使用softmax分类器选择需要拷贝的实体,此实体由以下公式的得到:
其中,We和be是随机初始化的可学习参数,需要说明的是t%3=2是指t除以3的余数是2;
如果t%3=0,利用拷贝机制,对输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体,使用softmax分类器选择需要拷贝的实体,此实体由以下公式的得到:
其中,We和be是随机初始化的可学习参数,需要说明的是t%3=0是指t除以3的余数是0。
上述技术方案的有益效果为:通过利用拷贝机制,输入词序列中的词可以进行多次拷贝,一个词可以参与多个关系三元组。
在一个实施例中,抽取所有关系三元组,并在预设时间结束,包括:
解码时刻小于所述预设时刻,继续抽取三元组;
解码时刻等于所述预设时刻,结束抽取,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
例如,当t<T时,持续抽取三元组中的两个相关实体的关系以及两个相关实体;
当t=T时,结束抽取过程,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
上述技术方案的有益效果为:通过对解码时刻与预测时刻进行判断,可以抽取出所有的三元组。
图2为本发明一实施例中一种实体关系抽取装置的框图,如图2所示,该装置包括如下模块:
输入模块21,用于将预处理的词序列信息输入神经网络;
编码模块22,用于对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;
解码模块23,用于对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;
抽取模块24,用于抽取所有关系三元组,并在预设时刻结束。
在一个实施例中,如图3所示,编码模块22,包括:
词序列定义单元31,用于对输入词序列进行定义;
预处理单元32,用于对所述输入词序列进行词向量预处理,得到词向量矩阵;
编码计算单元33,用于对所述词向量矩阵中的词向量进行计算,得到所述输入词序列信息的编码表示。
在一个实施例中,如图4所示,解码模块23,包括:
时刻定义单元41,用于定义解码器的解码时刻;
解码计算单元42,用于通过计算,得到解码器在解码时刻的输出向量和隐状态;
分类单元43,用于对所述输出向量进行分类操作,得到所述三元组中的两个相关实体以及两个相关实体的关系。
在一个实施例中,分类单元43,包括:
分类子单元,用于对输出向量进行分类操作,得到预测的关系;
第一复制子单元,用于对所述输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体;
第二复制子单元,用于对所述输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体。
在一个实施例中,抽取模块,包括:
判断单元,用于解码时刻小于所述预设时刻,继续抽取三元组;
所述判断单元,还用于解码时刻等于所述预设时刻,结束抽取,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种实体关系抽取方法,其特征在于,包括:
将预处理的词序列信息输入神经网络;
对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;
对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;
抽取所有关系三元组,并在预设时刻结束;
所述得到输入词序列信息的编码表示,包括:
对输入词序列进行定义;
对所述输入词序列进行词向量预处理,得到词向量矩阵;
对所述词向量矩阵中的词向量进行计算,得到所述输入词序列信息的编码表示;
输入词序列信息的编码表示由以下公式得到:
其中,为第/>个词的编码表示,/>为输入词序列信息的编码表示,/>为编码计算单元,/>为预处理后词向量矩阵的第n个词的向量。
2.如权利要求1所述的方法,其特征在于,所述利用拷贝机制进行解码,得到三元组,包括:
定义解码器的解码时刻;
通过计算,得到解码器在解码时刻的输出向量和隐状态;
对所述输出向量进行分类操作,得到所述三元组中的两个相关实体的关系以及两个相关实体。
3.如权利要求2所述的方法,其特征在于,所述得到所述三元组中的两个相关实体的关系以及两个相关实体,包括:
对输出向量进行分类操作,得到预测的关系;
对所述输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体;
对所述输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体。
4.如权利要求1所述的方法,其特征在于,所述抽取所有关系三元组,并在预设时间结束,包括:
解码时刻小于所述预设时刻,继续抽取三元组;
解码时刻等于所述预设时刻,结束抽取,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
5.一种实体关系抽取装置,其特征在于,包括:
输入模块,用于将预处理的词序列信息输入神经网络;
编码模块,用于对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;
解码模块,用于对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;
抽取模块,用于抽取所有关系三元组,并在预设时刻结束;
所述编码模块,包括:
词序列定义单元,用于对输入词序列进行定义;
预处理单元,用于对所述输入词序列进行词向量预处理,得到词向量矩阵;
编码计算单元,用于对所述词向量矩阵中的词向量进行计算,得到所述输入词序列信息的编码表示;
输入词序列信息的编码表示由以下公式得到:
其中,为第/>个词的编码表示,/>为输入词序列信息的编码表示,/>为编码计算单元,/>为预处理后词向量矩阵的第n个词的向量。
6.如权利要求5所述的装置,其特征在于,所述解码模块,包括:
时刻定义单元,用于定义解码器的解码时刻;
解码计算单元,用于通过计算,得到解码器在解码时刻的输出向量和隐状态;
分类单元,用于对所述输出向量进行分类操作,得到所述三元组中的两个相关实体以及两个相关实体的关系。
7.如权利要求6所述的装置,其特征在于,所述分类单元,包括:
分类子单元,用于对输出向量进行分类操作,得到预测的关系;
第一复制子单元,用于对所述输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体;
第二复制子单元,用于对所述输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体。
8.如权利要求5所述的装置,其特征在于,所述抽取模块,包括:
判断单元,用于解码时刻小于所述预设时刻,继续抽取三元组;
所述判断单元,还用于解码时刻等于所述预设时刻,结束抽取,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
CN201911179314.1A 2019-11-27 2019-11-27 一种实体关系抽取方法及装置 Active CN111008279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911179314.1A CN111008279B (zh) 2019-11-27 2019-11-27 一种实体关系抽取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911179314.1A CN111008279B (zh) 2019-11-27 2019-11-27 一种实体关系抽取方法及装置

Publications (2)

Publication Number Publication Date
CN111008279A CN111008279A (zh) 2020-04-14
CN111008279B true CN111008279B (zh) 2023-11-14

Family

ID=70112097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911179314.1A Active CN111008279B (zh) 2019-11-27 2019-11-27 一种实体关系抽取方法及装置

Country Status (1)

Country Link
CN (1) CN111008279B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183023A (zh) * 2020-09-28 2021-01-05 云知声智能科技股份有限公司 一种多关系抽取方法和终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304911A (zh) * 2018-01-09 2018-07-20 中国科学院自动化研究所 基于记忆神经网络的知识抽取方法以及系统和设备
CN109408812A (zh) * 2018-09-30 2019-03-01 北京工业大学 一种基于注意力机制的序列标注联合抽取实体关系的方法
CN109902145A (zh) * 2019-01-18 2019-06-18 中国科学院信息工程研究所 一种基于注意力机制的实体关系联合抽取方法和系统
CN110196913A (zh) * 2019-05-23 2019-09-03 北京邮电大学 基于文本生成式的多实体关系联合抽取方法和装置
WO2019174422A1 (zh) * 2018-03-16 2019-09-19 北京国双科技有限公司 实体关联关系的分析方法及相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304911A (zh) * 2018-01-09 2018-07-20 中国科学院自动化研究所 基于记忆神经网络的知识抽取方法以及系统和设备
WO2019174422A1 (zh) * 2018-03-16 2019-09-19 北京国双科技有限公司 实体关联关系的分析方法及相关装置
CN109408812A (zh) * 2018-09-30 2019-03-01 北京工业大学 一种基于注意力机制的序列标注联合抽取实体关系的方法
CN109902145A (zh) * 2019-01-18 2019-06-18 中国科学院信息工程研究所 一种基于注意力机制的实体关系联合抽取方法和系统
CN110196913A (zh) * 2019-05-23 2019-09-03 北京邮电大学 基于文本生成式的多实体关系联合抽取方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的简历信息实体抽取方法;黄胜;李伟;张剑;;计算机工程与设计(12);全文 *

Also Published As

Publication number Publication date
CN111008279A (zh) 2020-04-14

Similar Documents

Publication Publication Date Title
US11934956B2 (en) Regularizing machine learning models
US10380236B1 (en) Machine learning system for annotating unstructured text
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
CN113312500B (zh) 一种面向大坝安全运行的事件图谱构建方法
CN107632981B (zh) 一种引入源语组块信息编码的神经机器翻译方法
CN107844481B (zh) 识别文本检错方法及装置
CN109753661B (zh) 一种机器阅读理解方法、装置、设备及存储介质
CN111858843B (zh) 一种文本分类方法及装置
CN114818721B (zh) 一种结合序列标注的事件联合抽取模型与方法
CN110245227B (zh) 文本分类的融合分类器的训练方法及设备
CN110968689A (zh) 罪名及法条预测模型的训练方法以及罪名及法条预测方法
CN114973228A (zh) 基于轮廓特征增强的金属零件表面文本识别方法及系统
CN111008279B (zh) 一种实体关系抽取方法及装置
CN112183655A (zh) 文档多标签分类方法和装置
CN111010595B (zh) 一种新节目推荐的方法及装置
CN110008880B (zh) 一种模型压缩方法及装置
KR102265947B1 (ko) 기계 학습 기반 정보 제공 방법 및 장치
CN115204144A (zh) 一种基于异构图卷积网络的篇章级事件提取方法及系统
CN116127060A (zh) 一种基于提示词的文本分类方法及系统
CN114241253A (zh) 违规内容识别的模型训练方法、系统、服务器及存储介质
CN116757159B (zh) 一种端到端的多任务联合篇章级事件抽取方法及系统
CN116108145B (zh) 基于预训练的风控分析方法及装置
US20230131259A1 (en) Apparatus and method of training machine learning model, and apparatus and method for summarizing document using the same
CN113076956B (zh) 一种图像描述生成方法、系统、介质及电子设备
CN114357179A (zh) 实体关系联合抽取方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant