CN113051922A - 一种基于深度学习的三元组抽取方法及系统 - Google Patents

一种基于深度学习的三元组抽取方法及系统 Download PDF

Info

Publication number
CN113051922A
CN113051922A CN202110422948.6A CN202110422948A CN113051922A CN 113051922 A CN113051922 A CN 113051922A CN 202110422948 A CN202110422948 A CN 202110422948A CN 113051922 A CN113051922 A CN 113051922A
Authority
CN
China
Prior art keywords
entity
sentence
text corpus
vector
triple
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110422948.6A
Other languages
English (en)
Inventor
刘新亮
马蕾
张梦琪
郝瀚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN202110422948.6A priority Critical patent/CN113051922A/zh
Publication of CN113051922A publication Critical patent/CN113051922A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于深度学习的三元组抽取方法及系统,其方法包括:步骤S1:获取文本语料库,并进行预处理;步骤S2:利用预训练语言模型对文本语料库进行处理,获得句子的字符向量;步骤S3:将字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到句子的标签序列,从而识别句子的实体及其类型;步骤S4:根据实体及其类型,构建实体信息向量;将字符向量和实体信息向量相加作为主体,输入关系客体模型,根据文本语料库中预先定义的关系,得到对应的客体,由此构造三元组。本发明提供的方法通过二进制标记框架,作为特定关系客体标记器来根据识别出的主体在给定关系的情况下识别对应的客体,并结合实体识别以构建主体,有效解决三元组中重叠关系的问题。

Description

一种基于深度学习的三元组抽取方法及系统
技术领域
本发明涉及知识图谱实体关系抽取领域,具体涉及一种基于深度学习的三元组抽取方法及系统。
背景技术
信息抽取是从自然语言文本中抽取实体、属性、关系以及事件等事实类信息的文本处理技术,其任务包括命名实体识别、关系抽取以及事件抽取。实体关系抽取作为信息抽取领域的重要研究课题,其主要目的是从结构化及半结构化文本句子中抽取实体以及实体对之间的语义关系,形成结构化的信息以便存储和取用。目前,基于深度学习的实体关系抽取技术,在特征提取和模型的精确度上已经逐渐超过了传统基于特征和核函数的方法。
早期的实体关系抽取采用了流水线方法,训练一个模型提取实体,另一个模型对它们之间的关系进行分类,在实体对的组合中,大多实体对是没有关系链接的,这便存在很多负例,也就造成了关系分类的不平衡,这种方法忽略了两个模型之间的依赖并且造成了误差传播问题。例如在句子“猕猴桃的产地是陕西省的省会西安市”中,存在三元组(猕猴桃,产地,陕西省)、(猕猴桃,产地,西安市),这两个三元组存在重叠关系“产地”,其中存在共享的实体,而传统的抽取方法未能有效的解决三元组中重叠关系的问题。
发明内容
为了解决上述技术问题,本发明提供一种基于深度学习的三元组抽取方法及系统。
本发明技术解决方案为:一种基于深度学习的三元组抽取方法,包括:
步骤S1:获取文本语料库,并进行预处理;
步骤S2:利用预训练语言模型对所述文本语料库进行处理,获得句子的字符向量;
步骤S3:将所述字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到所述句子的标签序列,从而识别所述句子的实体及其类型;
步骤S4:根据所述实体及其类型,构建实体信息向量;将所述字符向量和所述实体信息向量相加作为主体,输入关系客体模型,根据所述文本语料库中预先定义的关系,得到对应的客体,由此构造三元组。
本发明与现有技术相比,具有以下优点:
本发明提供的方法通过二进制标记框架,作为特定关系客体标记器来根据识别出的主体在给定关系的情况下识别对应的客体,并结合实体识别以构建主体,有效解决三元组中重叠关系的问题,可以极大地提高三元组抽取的效率,为自动构建知识图谱提供有效方案。
附图说明
图1为本发明实施例中一种基于深度学习的三元组抽取方法的流程图;
图2为本发明实施例中一种基于深度学习的三元组抽取方法中步骤S3:将字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到句子的标签序列,从而识别句子的实体及其类型的流程图;
图3本发明实施例中一种基于深度学习的三元组抽取方法中步骤S4:根据实体及其类型,构建实体信息向量;将字符向量和实体信息向量相加作为主体,输入关系客体模型,根据文本语料库中预先定义的关系,得到对应的客体,由此构造三元组的流程图;
图4本发明实施例中三元组抽取方法的流程示意图;
图5本发明实施例中一种基于深度学习的三元组抽取系统的结构框图。
具体实施方式
本发明提供了一种基于深度学习的三元组抽取方法,通过二进制标记框架,作为特定关系客体标记器来根据识别出的主体在给定关系的情况下识别对应的客体,并结合实体识别以构建主体,有效解决三元组中重叠关系的问题。
为了使本发明的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本发明进一步详细说明。
实施例一
如图1所示,本发明实施例提供的一种基于深度学习的三元组抽取方法,包括下述步骤:
步骤S1:获取文本语料库,并进行预处理;
步骤S2:利用预训练语言模型对文本语料库进行处理,获得句子的字符向量;
步骤S3:将字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到句子的标签序列,从而识别句子的实体及其类型;
步骤S4:根据实体及其类型,构建实体信息向量;将字符向量和实体信息向量相加作为主体,输入关系客体模型,根据文本语料库中预先定义的关系,得到对应的客体,由此构造三元组。
在一个实施例中,上述步骤S1:获取文本语料库,并进行预处理,具体包括:
本发明实施例使用python爬虫技术在相关网站爬取文本数据,形成语料库。通过人工标注,以获得每个句子中所有的三元组,并提取三元组中的关系,作为预先定义好的语料库的关系,作为后续构造三元组的基础。将语料库中文本数据划分为训练集和测试集,将训练集用于训练下述模型,将测试集用于验证训练好的模型。
在一个实施例中,上述步骤S2:利用预训练语言模型对文本语料库进行处理,获得句子的字符向量,具体包括:
构建一条包含n个字的句子S=(s1,s2,...sn),以S作为输入,经过预训练语言模型对S进行上下文信息编码,输出句子的字符向量X=(x1,x2,...xn);其中,xi为第i个字的向量。
本发明实施例使用预先训练好的BERT编码器,作为预训练语言模型,对句子S进行上下文信息编码,得到句子的字符向量。
如图2所示,在一个实施例中,上述步骤S3:将字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到句子的标签序列,从而识别句子的实体及其类型,具体包括:
步骤S31:将句子的字符向量X=(x1,x2,...xn),经过前馈LSTM得到隐状态
Figure BDA0003028527070000031
经过后馈LSTM得到隐状态
Figure BDA0003028527070000032
将正反向输出的隐状态进行拼接,得到完整的隐状态序列
Figure BDA0003028527070000033
输出概率矩阵P;
在本步骤中,将句子的字符向量X=(x1,x2,...xn),输入BiLSTM神经网络,BiLSTM神经网络包括前馈LSTM和后馈LSTM;其中,单项LSTM的计算过程如下述公式(1)~(6)所示:
ft=σ(Wf·[ht-1,xt]+bf) (1)
it=σ(Wi·[ht-1,xt]+bi) (2)
Figure BDA0003028527070000034
Figure BDA0003028527070000035
ot=σ(Wo[ht-1,xt]+bo) (5)
ht=ot·tanh(Ct) (6)
其中,对于t时刻,ht、xt分别表示隐层状态及输入字;ft、it、ot分别表示记忆细胞中遗忘门、输入门、输出门,W表示权重,b表示偏置;σ表示激励函数Sigmoid;tanh表示双曲正切函数。
字符向量经过前馈LSTM得到隐状态
Figure BDA0003028527070000041
经过后馈LSTM得到隐状态
Figure BDA0003028527070000042
将正反向输出的隐状态进行拼接,得到完整的隐状态序列
Figure BDA0003028527070000043
输出概率矩阵P。
步骤S32:将概率矩阵P输入CRF模型,得到句子的标签序列y=(y1,y2,..,yn),识别标签序列,从而得到句子的实体及其类型。
将概率矩阵P输入CRF模型,得到句子的标签序列y=(y1,y2,..,yn),计算公式(7)~(8)如下所示:
Figure BDA0003028527070000044
y*=arg max S(X,y) (8)
其中,X为句子的字符向量;i为标签个数,A为转移矩阵,其中Ayi,y+1表示从第yi个标签到第yi+1个标签的转移得分;y*表示计算得出的概率值最大的序列。根据标签序列,可以识别得到句子所包含的所有实体及其类型。
如图3所示,在一个实施例中,上述步骤S4:根据实体及其类型,构建实体信息向量;将字符向量和实体信息向量相加作为主体,输入关系客体模型,根据文本语料库中预先定义的关系,得到对应的客体,由此构造三元组,具体包括:
步骤S41:根据实体及其类型,利用预训练语言模型构建实体信息向量
Figure BDA0003028527070000045
其中,
Figure BDA0003028527070000046
表示第k个实体的信息向量;
Figure BDA0003028527070000047
表示在BERT预训练模型中检测到的第k个实体的编码表示向量,为使
Figure BDA0003028527070000048
和xi相加成为可能,需要将其维度保持一致,因此将第k个实体的开始和结束标记之间的平均向量作为
Figure BDA0003028527070000049
由此构建句子的实体信息向量
Figure BDA00030285270700000410
例如,如图4所示,由句子“猕猴桃的产地是陕西省的省会西安市”中可识别得到实体:“猕猴桃”、“陕西省”和“西安市”,并分别构建其对应的实体向量信息:
Figure BDA00030285270700000411
Figure BDA00030285270700000412
步骤S42:将xi
Figure BDA00030285270700000413
相加,作为三元组中的主体,输入关系客体模型,根据文本语料库中预先定义的关系,然后通过全连接层,得出在该关系下,客体的头尾索引位置的概率p;
将xi
Figure BDA0003028527070000051
相加,作为三元组中的主体,输入关系客体模型,并根据文本语料库中预先定义的关系,如图4所示,“省会”、“作用”、“产地”等,作为预先从文本语料库中提取到的关系,经由关系客体模型进行客体的判断。关系客体模型由一组特定于关系的客体二进制标记器组成,每个字符的关系客体标注器的计算如下述公式(9)~(10)所示:
Figure BDA0003028527070000052
Figure BDA0003028527070000053
其中,
Figure BDA0003028527070000054
分别表示输入序列中第i个字符的头和尾索引位置的概率,W、b为关系客体模型参数。
步骤S43:当概率p大于预设的阈值时,将索引位置标记为1,小于则标记为0;采用最近的起止对匹配原理,根据标记为1的索引位置,得出对应的客体;即可根据主体、关系及其客体,构成一个三元组。
在图4中,由于关系“作用”并不存在句子“猕猴桃的产地是陕西省的省会西安市”中,因此在检测主体“猕猴桃”和候选客体“陕西省”之间的关系时候,关系“作用”不成立,关系“作用”的客体标注器不会识别“陕西省”的跨度,即“陕西省”的头尾索引位置都标记为零。
“产地”这个关系存在于句子“猕猴桃的产地是陕西省的省会西安市”中,因此在“猕猴桃”和“陕西省”之间,因此关系“产地”的客体标注器,会根据候选客体“陕西省”的头尾索引位置为1的标记,从而识别出客体“陕西省”跨度,以此识别出对应的客体“陕西省,以构建三元组(猕猴桃,产地,陕西省)。同样地,还可识别出“猕猴桃”基于关系“产地”的客体“西安市”,以构建三元组(猕猴桃,产地,西安市)。同理,对主体“陕西省”,基于关系“省会”,可以识别出其对应的客体“西安市”,构成三元组(陕西省,省会,西安市)。由此,完成对句子“猕猴桃的产地是陕西省的省会西安市”中的三元组抽取过程。
本发明提供的方法通过二进制标记框架,作为特定关系客体标记器来根据识别出的主体在给定关系的情况下识别对应的客体,并结合实体识别以构建主体,有效解决三元组中重叠关系的问题,可以极大地提高三元组抽取的效率,为自动构建知识图谱提供有效方案。
实施例二
如图5所示,本发明实施例提供了一种基于深度学习的三元组抽取系统,包括下述模块:
获取文本语料库模块51,用于获取文本语料库,并进行预处理;
获取句子的字符向量模块52,用于利用预训练语言模型对所述文本语料库进行处理,获得句子的字符向量;
获取实体及其类型模块53,用于将字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到句子的标签序列,从而识别句子的实体及其类型;
构造三元组模块54,用于根据实体及其类型,构建实体信息向量;将字符向量和实体信息向量相加作为主体,输入关系客体模型,根据文本语料库中预先定义的关系,得到对应的客体,由此构造三元组。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。

Claims (5)

1.一种基于深度学习的三元组抽取方法,其特征在于,包括:
步骤S1:获取文本语料库,并进行预处理;
步骤S2:利用预训练语言模型对所述文本语料库进行处理,获得句子的字符向量;
步骤S3:将所述字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到所述句子的标签序列,从而识别所述句子的实体及其类型;
步骤S4:根据所述实体及其类型,构建实体信息向量;将所述字符向量和所述实体信息向量相加作为主体,输入关系客体模型,根据所述文本语料库中预先定义的关系,得到对应的客体,由此构造三元组。
2.根据权利要求1所述的基于深度学习的三元组抽取方法,其特征在于,所述步骤S2:利用预训练语言模型对所述文本语料库进行处理,获得句子的字符向量,具体包括:
构建一条包含n个字的句子S=(s1,s2,...sn),以S作为输入,经过所述预训练语言模型对S进行上下文信息编码,输出所述句子的字符向量X=(x1,x2,...xn);其中,xi为第i个字的向量。
3.根据权利要求1所述的基于深度学习的三元组抽取方法,其特征在于,所述步骤S3:将所述字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到所述句子的标签序列,从而识别所述句子的实体及其类型,具体包括:
步骤S31:将所述句子的字符向量X=(x1,x2,...xn),经过前馈LSTM得到隐状态
Figure FDA0003028527060000011
经过后馈LSTM得到隐状态
Figure FDA0003028527060000012
将正反向输出的隐状态进行拼接,得到完整的隐状态序列
Figure FDA0003028527060000013
输出概率矩阵P;
步骤S32:将所述概率矩阵P输入CRF模型,得到所述句子的标签序列y=(y1,y2,..,yn),识别所述标签序列,从而得到所述句子的实体及其类型。
4.根据权利要求1所述的基于深度学习的三元组抽取方法,其特征在于,所述步骤S4:根据所述实体及其类型,构建实体信息向量;将所述字符向量和所述实体信息向量相加作为主体,输入关系客体模型,根据所述文本语料库中预先定义的关系,得到对应的客体,由此构造三元组,具体包括:
步骤S41:根据所述实体及其类型,利用所述预训练语言模型构建实体信息向量
Figure FDA0003028527060000021
其中,
Figure FDA0003028527060000022
表示第k个实体的信息向量;
步骤S42:将xi
Figure FDA0003028527060000023
相加,作为三元组中的主体,输入关系客体模型,根据所述文本语料库中预先定义的关系,然后通过全连接层,得出在所述关系下,客体的头尾索引位置的概率p;
步骤S43:当所述概率p大于预设的阈值时,将所述索引位置标记为1,小于则标记为0;采用最近的起止对匹配原理,根据所述标记为1的所述索引位置,得出对应的客体;即可根据所述主体、关系及其客体,构成一个三元组。
5.一种基于深度学习的三元组抽取系统,其特征在于,包括下述模块:
获取文本语料库模块,用于获取文本语料库,并进行预处理;
获取句子的字符向量模块,用于利用预训练语言模型对所述文本语料库进行处理,获得句子的字符向量;
获取实体及其类型模块,用于将所述字符向量经过BiLSTM神经网络以及CRF模型进行处理,得到所述句子的标签序列,从而识别所述句子的实体及其类型;
构造三元组模块,用于根据所述实体及其类型,构建实体信息向量;将所述字符向量和所述实体信息向量相加作为主体,输入关系客体模型,根据所述文本语料库中预先定义的关系,得到对应的客体,由此构造三元组。
CN202110422948.6A 2021-04-20 2021-04-20 一种基于深度学习的三元组抽取方法及系统 Pending CN113051922A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110422948.6A CN113051922A (zh) 2021-04-20 2021-04-20 一种基于深度学习的三元组抽取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110422948.6A CN113051922A (zh) 2021-04-20 2021-04-20 一种基于深度学习的三元组抽取方法及系统

Publications (1)

Publication Number Publication Date
CN113051922A true CN113051922A (zh) 2021-06-29

Family

ID=76519531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110422948.6A Pending CN113051922A (zh) 2021-04-20 2021-04-20 一种基于深度学习的三元组抽取方法及系统

Country Status (1)

Country Link
CN (1) CN113051922A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113282757A (zh) * 2021-07-14 2021-08-20 国网电子商务有限公司 基于电商领域表示模型的端到端三元组提取方法及系统
CN113626553A (zh) * 2021-07-15 2021-11-09 人民网股份有限公司 一种基于预训练模型的级联二进制中文实体关系提取方法
CN113901825A (zh) * 2021-11-22 2022-01-07 东北大学 一种基于主动深度学习的实体关系联合抽取方法及系统
TWI807400B (zh) * 2021-08-27 2023-07-01 台達電子工業股份有限公司 產生實體關係抽取模型的裝置及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304552A (zh) * 2018-02-01 2018-07-20 浙江大学 一种基于知识库特征抽取的命名实体链接方法
CN110889276A (zh) * 2019-11-07 2020-03-17 广东工业大学 复数融合特征提取指针式抽取三元组信息的方法、系统及计算机介质
CN111428036A (zh) * 2020-03-23 2020-07-17 浙江大学 一种基于生物医学文献的实体关系挖掘方法
CN111832287A (zh) * 2020-07-22 2020-10-27 广东工业大学 一种实体关系联合抽取方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304552A (zh) * 2018-02-01 2018-07-20 浙江大学 一种基于知识库特征抽取的命名实体链接方法
CN110889276A (zh) * 2019-11-07 2020-03-17 广东工业大学 复数融合特征提取指针式抽取三元组信息的方法、系统及计算机介质
CN111428036A (zh) * 2020-03-23 2020-07-17 浙江大学 一种基于生物医学文献的实体关系挖掘方法
CN111832287A (zh) * 2020-07-22 2020-10-27 广东工业大学 一种实体关系联合抽取方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHEPEI,WEI: "《A Novel Hierarchical Binary Tagging Framework for Joint Extraction of Entities and Relations》", 《HTTPS://ARXIV.ORG/ABS/1909.03227V1》, pages 2 *
王华锋;王久阳;: "一种基于Roberta的中文实体关系联合抽取模型", 北方工业大学学报, no. 02 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113282757A (zh) * 2021-07-14 2021-08-20 国网电子商务有限公司 基于电商领域表示模型的端到端三元组提取方法及系统
CN113626553A (zh) * 2021-07-15 2021-11-09 人民网股份有限公司 一种基于预训练模型的级联二进制中文实体关系提取方法
CN113626553B (zh) * 2021-07-15 2024-02-20 人民网股份有限公司 一种基于预训练模型的级联二进制中文实体关系提取方法
TWI807400B (zh) * 2021-08-27 2023-07-01 台達電子工業股份有限公司 產生實體關係抽取模型的裝置及方法
CN113901825A (zh) * 2021-11-22 2022-01-07 东北大学 一种基于主动深度学习的实体关系联合抽取方法及系统
CN113901825B (zh) * 2021-11-22 2024-05-03 东北大学 一种基于主动深度学习的实体关系联合抽取方法及系统

Similar Documents

Publication Publication Date Title
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN111709241B (zh) 一种面向网络安全领域的命名实体识别方法
CN111966917B (zh) 一种基于预训练语言模型的事件检测与摘要方法
CN111985239B (zh) 实体识别方法、装置、电子设备及存储介质
CN107729309B (zh) 一种基于深度学习的中文语义分析的方法及装置
CN113051922A (zh) 一种基于深度学习的三元组抽取方法及系统
CN113312501A (zh) 基于知识图谱的安全知识自助查询系统的构建方法及装置
CN111209401A (zh) 网络舆情文本信息情感极性分类处理系统及方法
CN110309331A (zh) 一种基于自监督的跨模态深度哈希检索方法
CN110263325B (zh) 中文分词系统
CN111639171A (zh) 一种知识图谱问答方法及装置
CN111159485B (zh) 尾实体链接方法、装置、服务器及存储介质
CN111274804A (zh) 基于命名实体识别的案件信息提取方法
CN113505200B (zh) 一种结合文档关键信息的句子级中文事件检测的方法
CN112163089B (zh) 一种融合命名实体识别的高技术文本分类方法及系统
CN112559723A (zh) 一种基于深度学习的faq检索式问答构建方法及系统
CN112905736A (zh) 一种基于量子理论的无监督文本情感分析方法
CN114153978A (zh) 模型训练方法、信息抽取方法、装置、设备及存储介质
CN112100212A (zh) 一种基于机器学习和规则匹配的案件情节抽取方法
CN115599899A (zh) 基于飞行器知识图谱的智能问答方法、系统、设备及介质
CN117171333A (zh) 一种电力文件问答式智能检索方法及系统
CN116522165B (zh) 一种基于孪生结构的舆情文本匹配系统及方法
CN113641809A (zh) 一种基于XLNet-BiGRU-CRF的智能问答方法
CN116304064A (zh) 一种基于抽取式的文本分类方法
CN116680407A (zh) 一种知识图谱的构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210629