CN107943784A - 基于生成对抗网络的关系抽取方法 - Google Patents

基于生成对抗网络的关系抽取方法 Download PDF

Info

Publication number
CN107943784A
CN107943784A CN201711063765.XA CN201711063765A CN107943784A CN 107943784 A CN107943784 A CN 107943784A CN 201711063765 A CN201711063765 A CN 201711063765A CN 107943784 A CN107943784 A CN 107943784A
Authority
CN
China
Prior art keywords
mrow
msub
text
relation
arbiter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711063765.XA
Other languages
English (en)
Other versions
CN107943784B (zh
Inventor
刘兵
蒋方玲
蒋黎明
龚向坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of South China
Original Assignee
University of South China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of South China filed Critical University of South China
Priority to CN201711063765.XA priority Critical patent/CN107943784B/zh
Publication of CN107943784A publication Critical patent/CN107943784A/zh
Application granted granted Critical
Publication of CN107943784B publication Critical patent/CN107943784B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于生成对抗网络的关系抽取方法,包括准备训练文本和待分析文本;对训练文本和待分析文本进行分词和句法分析;将得到的分词和句法分析结果转换为句法分析树图像;对生成器和判别器进行训练得到生成对抗网络模型;采用生成对抗网络对待分析文本进行关系抽取。本发明简化了其他基于深度学习方法的输入数据处理过程,放弃了相对繁琐的向量化过程,输入数据处理相对简单,利用的特征相对目前基于深度学习的关系抽取方法更丰富,关系识别过程模拟人的思维模式,将生成对抗网络应用到关系抽取中,充分发挥生成对抗网络的自动学习图像中特征的能力,提高关系抽取的效果,而且方法简单可靠。

Description

基于生成对抗网络的关系抽取方法
技术领域
本发明具体涉及一种基于生成对抗网络的关系抽取方法。
背景技术
随着信息技术的迅速发展,互联网上的资源爆炸式增长。互联网中社交媒体数据、百科、论坛、专业文献、新闻等非结构化文本数据包含了丰富的领域知识信息。众多领域专家利用互联网上的文本数据构建结构化的领域知识库,以指导领域内业务问题的推理决策。知识库包含了领域相关实体以及实体间的关系,利用关系抽取技术从海量非结构化的文本中识别抽取领域实体的语义关系是构建知识库的关键步骤。
目前关系抽取的方法主要分为两类:基于规则的方法以及基于机器学习的方法。基于规则的方法主要利用人类的经验和总结设置特定的规则,抽取文本中的实体关系。基于规则的方法规则的设定费时费力,需要专业的领域人才设置规则。规则在不同领域数据上的迁移能力较弱,需要针对每一个领域数据编写适当的规则。基于机器学习的方法目前主要有基于特征的方法、基于核函数的方法、基于深度学习的方法。基于特征的方法和基于核函数的方法需要人工选择大量对关系抽取有辨别性的特征,定义特征模板,抽取特征,工作相对繁琐。基于深度学习的方法将文本特征信息映射为向量,利用CNN、RNN等模型学习实体间关系的特征进行识别分类。相对于传统方法,基于深度学习的方法模拟人的思维方式,性能上有一定的提升。但其特征的向量化过程相对复杂,同时普遍没有考虑对关系抽取有一定影响的文本整体结构信息。
发明内容
本发明的目的在于提供一种方法简单可靠、将对关系抽取有判别性的特征图像化处理的基于生成对抗网络的关系抽取方法。
本发明提供的这种基于生成对抗网络的关系抽取方法,包括如下步骤:
S1.准备训练文本和待分析文本;所述训练文本中的实体和实体间的关系已经标注,待分析文本中的实体已经进行了标注;
S2.采用自然语言处理工具对训练文本和待分析文本进行分词和句法分析;
S3.采用图形绘制工具将步骤S2得到的分词和句法分析结果转换为句法分析树图像;
S4.采用步骤S3获取的训练文本的句法分析树图像和标注的文本中实体间的关系,对生成器和判别器进行相互竞争的迭代训练,从而得到训练好的生成对抗网络模型;
S5.采用步骤S4得到的生成对抗网络,输入步骤S3获取的待分析文本的句法分析树图像,对待分析文本进行关系抽取。
步骤S2所述的自然语言处理工具为Stanford Parser或者具有类似功能的自然语言处理工具。
步骤S3所述的图形绘制工具为Graphviz或者具有类似功能的图形绘制工具。
步骤S4所述的对生成器和判别器进行相互竞争的迭代训练,具体为采用随机梯度下降法对生成器和判别器进行相互竞争的迭代训练。
所述的采用随机梯度下降法对生成器和判别器进行相互竞争的迭代训练,具体为采用如下步骤进行训练:
A.生成m组训练文本及相应的句法分析树图像;
B.初始化判别器D和生成器G,并且每一次迭代中均包括依次判别器D的训练和生成器G的训练;
C.采用m个噪声向量和m个训练样本的句法分析树图像作为输入,采用如下公式计算梯度,并在判别器D的原有参数上增加计算得到的梯度更新判别器D的参数:
式中zi表示第i个噪声向量,xi表示第i个训练样本,Dy(xi)表示第i个训练样本判断为关系y的概率,实体间的关系的个数定义为Nr,yr表示第r种关系;Nr+1表示判别器的输入图像是生成器生成的假图像;Dy r(x)表示输入图像x中的实体间的关系是yr关系的概率;表示用于更新判别器D的梯度;
D.采用m个噪声向量作为输入,采用如下公式计算梯度,并在生成器G的原有参数上增加计算得到的梯度并更新生成器G的参数:
式中,表示用于更新生成器G的梯度;G(zi)表示第i个噪声向量经过G后生成的图像;
E.以下式为目标函数,重复步骤C和D,直至训练完成,从而得到最终的训练模型:
本发明提供的这种基于生成对抗网络的关系抽取方法,简化了其他基于深度学习方法的输入数据处理过程,放弃了相对繁琐的向量化过程,将对关系抽取有判别性的词汇特征、句法特征、词汇相对位置、上下文信息、句子整体结构信息图像化,作为生成对抗网络的输入,模型的输入数据处理相对简单,利用的特征相对目前基于深度学习的关系抽取方法更丰富,关系识别过程模拟人的思维模式,将生成对抗网络应用到关系抽取中,充分发挥生成对抗网络的自动学习图像中特征的能力,提高关系抽取的效果,而且本发明方法简单可靠。
附图说明
图1为本发明方法的方法流程图。
图2为本发明的实施例中的句法分析树图像的示意图。
具体实施方式
如图1所示为本发明方法的方法流程图:本发明提供的这种基于生成对抗网络的关系抽取方法,包括如下步骤:
S1.准备训练文本和待分析文本;所述训练文本中的实体和实体间的关系已经进行了标注,待分析文本中的实体已经进行了标注;
S2.采用自然语言处理工具对训练文本和待分析文本进行分词和句法分析;自然语言处理工具可以采用Stanford Parser或者具有类似功能的自然语言处理工具;
S3.采用图形绘制工具将步骤S2得到的分词和句法分析结果转换为句法分析树图像;图形绘制工具可以采用Graphviz或者具有类似功能的图形绘制工具;
S4.采用步骤S3获取的训练文本的句法分析树图像和标注的文本中实体间的关系,对生成器和判别器进行相互竞争的迭代训练,从而得到训练好的生成对抗网络模型;
采用多层卷积层、平均化池、softmax全连接层实现判别器D,每一个卷积层后做批量归一化和指数线性单元处理。采用多层反卷积层实现生成器G。在判别器D中,输入数据经过多层卷积层做卷积操作,将输入数据映射到隐层空间,继而经过全连接层,融合学习到的特征,最后利用softmax实现分类;
对于一个给定的图像,其实体间对应的关系定义为y,实体间的关系的个数定义为Nr,yr表示第r种关系。Nr+1表示判别器的输入图像是生成器生成的假图像,表示输入图像x中的实体间的关系是yr关系的概率;
随机噪声z作为生成器的输入,生成器生成句法分析树图像语料生成的句法分析树图像x和生成器生成的图像作为判别器的输入,对于语料生成的句法分析树图像x,判别器输出两个实体间最有可能的某一种关系yr,对于生成器生成的句法分析树图像,判别器判定两个实体间是生成的假图像,输出通过判别器的类别判定,最终实现关系的抽取;
对生成器和判别器进行相互竞争的迭代训练,具体为采用随机梯度下降法对生成器和判别器进行相互竞争的迭代训练,具体包括如下步骤进行训练:
A.生成m组训练文本及相应的句法分析树图像;
B.初始化判别器D和生成器G,并且每一次迭代中均包括依次判别器D的训练和生成器G的训练;
C.采用m个噪声向量和m个训练样本的句法分析树图像作为输入,采用如下公式计算梯度,并在判别器D的原有参数上增加计算得到的梯度更新判别器D的参数:
式中zi表示第i个噪声向量,xi表示第i个训练样本,Dy(xi)表示第i个训练样本判断为关系y的概率,实体间的关系的个数定义为Nr,yr表示第r种关系;Nr+1表示判别器的输入图像是生成器生成的假图像;Dy r(x)表示输入图像x中的实体间的关系是yr关系的概率;表示用于更新判别器D的梯度;
D.采用m个噪声向量作为输入,采用如下公式计算梯度,并在生成器G的原有参数上增加计算得到的梯度并更新生成器G的参数:
式中,表示用于更新生成器G的梯度;G(zi)表示第i个噪声向量经过G后生成的图像;
E.以下式为目标函数,重复步骤C和D,直至训练完成,从的得到最终的训练模型:
以下结合一个具体实施例对本发明进行进一步说明:
对于要输入的句子文本利用Stanford Parser进行分词。比如说例句“人们喜欢美丽的花儿”的分词结果是“人们喜欢美丽的花儿。”
对分词后的结果利用Stanford Parser进行句法分析。比如说例句“人们喜欢美丽的花儿。”句法分析结果是
利用图形绘制工具Graphviz将Stanford Parser的句法分析结果转化为PNG格式句法分析树图像,生成的句法分析树图像作为判别器的输入。如图2所示是语句“人们喜欢美丽的花儿”的句法分析树图像。
采用多层卷积层、平均化池、softmax全连接层实现判别器D。每一个卷积层后做批量归一化和指数线性单元处理。采用多层反卷积层实现生成器G。如表1所示的网络结构可以作为生成器G和判别器D的一种具体实现。
表1
句法分析树图像在判别器D中经过多层卷积层做卷积操作,将输入数据映射到隐层空间,继而经过全连接层,融合学习到的特征,最后利用softmax实现分类;从而实现对待分析文本的关系抽取。
本发明所提出的方法是有监督的深度学习方法。需要少量的带标签的数据输入生成对抗网络模型中,通过正反向传播和模型参数的自动更新逐渐达到目标函数,得到训练好的模型。设定整个训练过程需要训练迭代的次数,以正态分布初始化噪声向量,取一定数量的带有关系标签的文本数据(比如说2000个句子)生成句法分析树图像。将生成的句法分析树图像,图像中实体间关系类别和噪声向量作为判别器输入,经过判别器网络处理后,计算梯度,更新判别器的参数。取和判别器训练相同数目的噪声向量输入生成器,生成器生成句法分析树图像,交由判别器判断,判别器给出判断,通过计算梯度反馈给生成器,更新生成器的参数。经过相互迭代训练,判别器的判别能力越来越强,生成器生成的图像也越来越真,达到训练的迭代次数后,训练过程终止。得到的判别器即可用于待分析文本的关系抽取。
如图2所示的句法分析树图像,输入训练好的判别器,经过多层卷积层、平均化池、全连接、softmax操作后,判别器判定实体“人们”和“花儿”间的关系是“喜欢”。

Claims (5)

1.一种基于生成对抗网络的关系抽取方法,包括如下步骤:
S1.准备训练文本和待分析文本;所述训练文本中的实体和实体间的关系已经标注,待分析文本中的实体已经进行了标注;
S2.采用自然语言处理工具对训练文本和待分析文本进行分词和句法分析;
S3.采用图形绘制工具将步骤S2得到的分词和句法分析结果转换为句法分析树图像;
S4.采用步骤S3得到的训练文本的句法分析树图像和标注的文本中实体间的关系,对生成器和判别器进行相互竞争的迭代训练,从而得到训练好的生成对抗网络模型;
S5.采用步骤S4得到的生成对抗网络,输入步骤S3获取的待分析文本的句法分析树图像,对待分析文本进行关系抽取。
2.根据权利要求1所述的基于生成对抗网络的关系抽取方法,其特征在于步骤S2所述的自然语言处理工具为Stanford Parser或者具有类似功能的自然语言处理工具。
3.根据权利要求2所述的基于生成对抗网络的关系抽取方法,其特征在于步骤S3所述的图形绘制工具为Graphviz或者具有类似功能的图形绘制工具。
4.根据权利要求3所述的基于生成对抗网络的关系抽取方法,其特征在于步骤S4所述的对生成器和判别器进行相互竞争的迭代训练,具体为采用随机梯度下降法对生成器和判别器进行相互竞争的迭代训练。
5.根据权利要求4所述的基于生成对抗网络的关系抽取方法,其特征在于所述的采用随机梯度下降法对生成器和判别器进行相互竞争的迭代训练,具体为采用如下步骤进行训练:
A.生成m组训练文本及相应的句法分析树图像;
B.初始化判别器D和生成器G,并且每一次迭代中均包括依次判别器D的训练和生成器G的训练;
C.采用m个噪声向量和m个训练样本的句法分析树图像作为输入,采用如下公式计算梯度,并在判别器D的原有参数上增加计算得到的梯度更新判别器D的参数:
<mrow> <mo>&amp;dtri;</mo> <msub> <mi>&amp;theta;</mi> <mi>d</mi> </msub> <mfrac> <mn>1</mn> <mi>m</mi> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <mo>&amp;lsqb;</mo> <msub> <mi>logD</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <msup> <mi>x</mi> <mi>i</mi> </msup> <mo>)</mo> </mrow> <mo>+</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <msubsup> <mi>D</mi> <mi>y</mi> <mrow> <msub> <mi>N</mi> <mi>r</mi> </msub> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>(</mo> <mrow> <mi>G</mi> <mrow> <mo>(</mo> <msup> <mi>z</mi> <mi>i</mi> </msup> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow>
式中zi表示第i个噪声向量,xi表示第i个训练样本,Dy(xi)表示第i个训练样本判断为关系y的概率,实体间的关系的个数定义为Nr,yr表示第r种关系;Nr+1表示判别器的输入图像是生成器生成的假图像;Dy r(x)表示输入图像x中的实体间的关系是yr关系的概率;表示用于更新判别器D的梯度;
D.采用m个噪声向量作为输入,采用如下公式计算梯度,并在生成器G的原有参数上增加计算得到的梯度并更新生成器G的参数:
<mrow> <mo>&amp;dtri;</mo> <msub> <mi>&amp;theta;</mi> <mi>g</mi> </msub> <mfrac> <mn>1</mn> <mi>m</mi> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msub> <mi>logD</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <mi>G</mi> <mo>(</mo> <msup> <mi>z</mi> <mi>i</mi> </msup> <mo>)</mo> <mo>)</mo> </mrow> <mo>)</mo> </mrow>
式中,表示用于更新生成器G的梯度;G(zi)表示第i个噪声向量经过G后生成的图像;
E.以下式为目标函数,重复步骤C和D,直至训练完成,从而得到最终的训练模型:
<mrow> <mtable> <mtr> <mtd> <mrow> <msub> <mi>maxV</mi> <mi>D</mi> </msub> <mrow> <mo>(</mo> <mi>D</mi> <mo>,</mo> <mi>G</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>E</mi> <mrow> <mi>x</mi> <mo>~</mo> <msub> <mi>P</mi> <mrow> <mi>d</mi> <mi>a</mi> <mi>t</mi> <mi>a</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> </msub> </mrow> </msub> <mo>&amp;lsqb;</mo> <msup> <msub> <mi>logD</mi> <mi>y</mi> </msub> <mi>r</mi> </msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <mo>+</mo> <msub> <mi>E</mi> <mrow> <mi>z</mi> <mo>~</mo> <mi>P</mi> <mi>z</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>)</mo> </mrow> </mrow> </msub> <mo>&amp;lsqb;</mo> <mi>log</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <msup> <msub> <mi>D</mi> <mi>y</mi> </msub> <mrow> <mi>N</mi> <mi>r</mi> <mo>+</mo> <mn>1</mn> </mrow> </msup> <mo>(</mo> <mrow> <mi>G</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>maxV</mi> <mi>G</mi> </msub> <mrow> <mo>(</mo> <mi>D</mi> <mo>,</mo> <mi>G</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>E</mi> <mrow> <mi>z</mi> <mo>~</mo> <mi>P</mi> <mi>z</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>)</mo> </mrow> </mrow> </msub> <mo>&amp;lsqb;</mo> <mi>log</mi> <mrow> <mo>(</mo> <msup> <msub> <mi>D</mi> <mi>y</mi> </msub> <mi>r</mi> </msup> <mo>(</mo> <mrow> <mi>G</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> </mtable> <mo>.</mo> </mrow>
CN201711063765.XA 2017-11-02 2017-11-02 基于生成对抗网络的关系抽取方法 Expired - Fee Related CN107943784B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711063765.XA CN107943784B (zh) 2017-11-02 2017-11-02 基于生成对抗网络的关系抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711063765.XA CN107943784B (zh) 2017-11-02 2017-11-02 基于生成对抗网络的关系抽取方法

Publications (2)

Publication Number Publication Date
CN107943784A true CN107943784A (zh) 2018-04-20
CN107943784B CN107943784B (zh) 2020-12-29

Family

ID=61934192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711063765.XA Expired - Fee Related CN107943784B (zh) 2017-11-02 2017-11-02 基于生成对抗网络的关系抽取方法

Country Status (1)

Country Link
CN (1) CN107943784B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145938A (zh) * 2018-06-26 2019-01-04 阿里巴巴集团控股有限公司 一种使用分类器进行分类的方法和装置
CN109598000A (zh) * 2018-12-28 2019-04-09 百度在线网络技术(北京)有限公司 语义关系识别方法、装置、计算机设备和存储介质
CN109710923A (zh) * 2018-12-06 2019-05-03 浙江大学 基于跨媒体信息的跨语言实体匹配方法
CN110162298A (zh) * 2019-05-14 2019-08-23 深圳市行知网络科技有限公司 基于人工智能的代码自动生成方法与装置
CN110457677A (zh) * 2019-06-26 2019-11-15 平安科技(深圳)有限公司 实体关系识别方法及装置、存储介质、计算机设备
WO2019242627A1 (zh) * 2018-06-19 2019-12-26 华为技术有限公司 一种数据处理方法及其装置
CN110705310A (zh) * 2019-09-20 2020-01-17 北京金山数字娱乐科技有限公司 一种文章生成的方法和装置
CN110852066A (zh) * 2018-07-25 2020-02-28 清华大学 一种基于对抗训练机制的多语言实体关系抽取方法及系统
CN111310454A (zh) * 2020-01-17 2020-06-19 北京邮电大学 一种基于领域迁移的关系抽取方法及装置
CN111523308A (zh) * 2020-03-18 2020-08-11 大箴(杭州)科技有限公司 中文分词的方法、装置及计算机设备
CN111651528A (zh) * 2020-05-11 2020-09-11 北京理工大学 基于生成式对抗网络的开放式实体关系抽取方法
CN112347742A (zh) * 2020-10-29 2021-02-09 青岛科技大学 基于深度学习生成文档图像集的方法
CN112487815A (zh) * 2020-11-27 2021-03-12 北京百度网讯科技有限公司 核心实体抽取方法、判别器训练方法、装置以及电子设备
WO2021254499A1 (zh) * 2020-06-19 2021-12-23 北京灵汐科技有限公司 编辑模型生成、人脸图像编辑方法、装置、设备及介质
CN115859991A (zh) * 2023-02-28 2023-03-28 智慧眼科技股份有限公司 一种实体抽取方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930042A (zh) * 2012-11-13 2013-02-13 五邑大学 一种倾向性文本自动分类系统及其实现方法
US20170147635A1 (en) * 2015-11-20 2017-05-25 International Business Machines Corporation Semantic Graph Augmentation for Domain Adaptation
CN107016406A (zh) * 2017-02-24 2017-08-04 中国科学院合肥物质科学研究院 基于生成式对抗网络的病虫害图像生成方法
CN107239722A (zh) * 2016-03-25 2017-10-10 佳能株式会社 用于从医疗文档中提取诊断对象的方法和装置
CN107248134A (zh) * 2017-04-25 2017-10-13 李晓妮 一种文本文档中的信息隐藏方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930042A (zh) * 2012-11-13 2013-02-13 五邑大学 一种倾向性文本自动分类系统及其实现方法
US20170147635A1 (en) * 2015-11-20 2017-05-25 International Business Machines Corporation Semantic Graph Augmentation for Domain Adaptation
CN107239722A (zh) * 2016-03-25 2017-10-10 佳能株式会社 用于从医疗文档中提取诊断对象的方法和装置
CN107016406A (zh) * 2017-02-24 2017-08-04 中国科学院合肥物质科学研究院 基于生成式对抗网络的病虫害图像生成方法
CN107248134A (zh) * 2017-04-25 2017-10-13 李晓妮 一种文本文档中的信息隐藏方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YI WU 等: "Adversarial Training for Relation Extraction", 《PROCEEDINGS OF THE 2017 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING》 *
蒋方玲: "地名本体实体与关系抽取研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019242627A1 (zh) * 2018-06-19 2019-12-26 华为技术有限公司 一种数据处理方法及其装置
CN109145938A (zh) * 2018-06-26 2019-01-04 阿里巴巴集团控股有限公司 一种使用分类器进行分类的方法和装置
CN110852066B (zh) * 2018-07-25 2021-06-01 清华大学 一种基于对抗训练机制的多语言实体关系抽取方法及系统
CN110852066A (zh) * 2018-07-25 2020-02-28 清华大学 一种基于对抗训练机制的多语言实体关系抽取方法及系统
CN109710923B (zh) * 2018-12-06 2020-09-01 浙江大学 基于跨媒体信息的跨语言实体匹配方法
CN109710923A (zh) * 2018-12-06 2019-05-03 浙江大学 基于跨媒体信息的跨语言实体匹配方法
CN109598000A (zh) * 2018-12-28 2019-04-09 百度在线网络技术(北京)有限公司 语义关系识别方法、装置、计算机设备和存储介质
CN110162298A (zh) * 2019-05-14 2019-08-23 深圳市行知网络科技有限公司 基于人工智能的代码自动生成方法与装置
CN110457677B (zh) * 2019-06-26 2023-11-17 平安科技(深圳)有限公司 实体关系识别方法及装置、存储介质、计算机设备
CN110457677A (zh) * 2019-06-26 2019-11-15 平安科技(深圳)有限公司 实体关系识别方法及装置、存储介质、计算机设备
CN110705310A (zh) * 2019-09-20 2020-01-17 北京金山数字娱乐科技有限公司 一种文章生成的方法和装置
CN110705310B (zh) * 2019-09-20 2023-07-18 北京金山数字娱乐科技有限公司 一种文章生成的方法和装置
CN111310454A (zh) * 2020-01-17 2020-06-19 北京邮电大学 一种基于领域迁移的关系抽取方法及装置
CN111310454B (zh) * 2020-01-17 2022-01-07 北京邮电大学 一种基于领域迁移的关系抽取方法及装置
CN111523308B (zh) * 2020-03-18 2024-01-26 大箴(杭州)科技有限公司 中文分词的方法、装置及计算机设备
CN111523308A (zh) * 2020-03-18 2020-08-11 大箴(杭州)科技有限公司 中文分词的方法、装置及计算机设备
CN111651528A (zh) * 2020-05-11 2020-09-11 北京理工大学 基于生成式对抗网络的开放式实体关系抽取方法
WO2021254499A1 (zh) * 2020-06-19 2021-12-23 北京灵汐科技有限公司 编辑模型生成、人脸图像编辑方法、装置、设备及介质
CN112347742B (zh) * 2020-10-29 2022-05-31 青岛科技大学 基于深度学习生成文档图像集的方法
CN112347742A (zh) * 2020-10-29 2021-02-09 青岛科技大学 基于深度学习生成文档图像集的方法
CN112487815B (zh) * 2020-11-27 2023-06-27 北京百度网讯科技有限公司 核心实体抽取方法、装置以及电子设备
CN112487815A (zh) * 2020-11-27 2021-03-12 北京百度网讯科技有限公司 核心实体抽取方法、判别器训练方法、装置以及电子设备
CN115859991A (zh) * 2023-02-28 2023-03-28 智慧眼科技股份有限公司 一种实体抽取方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN107943784B (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN107943784A (zh) 基于生成对抗网络的关系抽取方法
CN107133220B (zh) 一种地理学科领域命名实体识别方法
CN107239446B (zh) 一种基于神经网络与注意力机制的情报关系提取方法
CN107766324B (zh) 一种基于深度神经网络的文本一致性分析方法
CN107273355A (zh) 一种基于字词联合训练的中文词向量生成方法
CN107967318A (zh) 一种采用lstm神经网络的中文短文本主观题自动评分方法和系统
CN107978373A (zh) 一种基于共训练的半监督生物医学事件抽取方法
CN109189925A (zh) 基于点互信息的词向量模型和基于cnn的文本分类方法
CN106980608A (zh) 一种中文电子病历分词和命名实体识别方法及系统
CN107153642A (zh) 一种基于神经网络识别文本评论情感倾向的分析方法
CN105868184A (zh) 一种基于循环神经网络的中文人名识别方法
CN106570148A (zh) 一种基于卷积神经网络的属性抽取方法
CN109977199B (zh) 一种基于注意力池化机制的阅读理解方法
CN106503055A (zh) 一种从结构化文本到图像描述的生成方法
CN106445919A (zh) 一种情感分类方法及装置
CN106354710A (zh) 一种神经网络关系抽取方法
CN107526834A (zh) 联合词性与词序的相关因子训练的word2vec改进方法
CN112084299B (zh) 一种基于bert语义表示的阅读理解自动问答方法
CN108197294A (zh) 一种基于深度学习的文本自动生成方法
CN107301165A (zh) 一种试题难度分析方法及系统
CN106570521A (zh) 多语言场景字符识别方法及识别系统
CN107153640A (zh) 一种面向初等数学领域的分词方法
CN107729312A (zh) 基于序列标注建模的多粒度分词方法及系统
CN113343690B (zh) 一种文本可读性自动评估方法及装置
CN110427616A (zh) 一种基于深度学习的文本情感分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201229

Termination date: 20211102

CF01 Termination of patent right due to non-payment of annual fee