CN117540035A - 一种基于实体类型信息融合的rpa知识图谱构建方法 - Google Patents

一种基于实体类型信息融合的rpa知识图谱构建方法 Download PDF

Info

Publication number
CN117540035A
CN117540035A CN202410027166.6A CN202410027166A CN117540035A CN 117540035 A CN117540035 A CN 117540035A CN 202410027166 A CN202410027166 A CN 202410027166A CN 117540035 A CN117540035 A CN 117540035A
Authority
CN
China
Prior art keywords
entity
entity type
representation
rpa
type information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410027166.6A
Other languages
English (en)
Other versions
CN117540035B (zh
Inventor
裴学良
陈伟雄
刘雨欣
于星晨
卜晨阳
吴信东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Sigao Intelligent Technology Co ltd
Original Assignee
Anhui Sigao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Sigao Intelligent Technology Co ltd filed Critical Anhui Sigao Intelligent Technology Co ltd
Priority to CN202410027166.6A priority Critical patent/CN117540035B/zh
Publication of CN117540035A publication Critical patent/CN117540035A/zh
Application granted granted Critical
Publication of CN117540035B publication Critical patent/CN117540035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于实体类型信息融合的RPA知识图谱构建方法包括步骤:基于翻译规则的知识表示模型对实体类型进行训练;将实体类型的表示和关系实例输入至实体对编码模块,得到融合实体类型信息的实体对表示;使用伪标签生成模块将融合实体类型信息的实体对表示映射到用于表达语义关系的空间,并且为未标记数据生成伪标签;利用标记数据的关系标签和生成的伪标签训练关系分类器,得到训练好的关系分类器;利用训练好的关系分类器进行关系抽取。本发明有益效果是:减少了实体类型不匹配的噪音产生,从而建立更高质量RPA知识图谱。

Description

一种基于实体类型信息融合的RPA知识图谱构建方法
技术领域
本发明涉及知识图谱构建领域,尤其涉及一种基于实体类型信息融合的RPA知识图谱构建方法。
背景技术
机器人流程自动化RPA(Robotic Process Automation, RPA)广义上是指以软件机器人为基础的业务流程自动化技术。RPA技术中,机器人可以在制定的业务规则执行特定的脚本,实现业务人员的操作并与系统交互。RPA机器人不仅能代替大量人工重复操作,而且还能实现全天24小时不间断的在线处理业务工作。近几年RPA技术被广泛用于多个科学领域,例如财务、医疗和法律等。
RPA技术中集成了屏幕抓取、鼠标点击模拟技术、键盘输入模拟技术等多种技术,从而将一段具有规则、需要重复的执行的业务流程变成一段逻辑完整且可自动化执行的流程文件。目前,已经出现了一批优秀的RPA企业及其研发的RPA平台,例如国内的讯飞RPA、国际上的Automation AnyWhere和Blue Prisim;但几乎所有的RPA技术都是面向企业级客户,而不面向个人开发者。其次,RPA技术的基础工作需要人工描述业务流程以提炼业务规则,由于现有的描述方法众多且不统一,导致同一个业务流程,甲公司的RPA模型无法为乙公司所复用,增加了二次开发成本。
知识图谱技术通过复杂的知识领域通过数据挖掘等技术帮助企业自动构建行业图谱,摆脱原始的人工输入。
通过对RPA的流程描述进行如关系抽取等知识图谱构建技术,建立其RPA的知识图谱,以便达到对信息和知识的有效组织,从而减少重复的人工输入流程。
一般知识图谱中,三元组的关系潜在地限制了头尾实体的类型。目前基于聚类的开放域关系抽取方法存在如下问题:无法捕捉到关系类型对头尾实体类型的约束。如果不能捕捉到这种约束,会导致以下两种情况。
情况一是将表达不同关系的句子聚类到一起,产生实体类型不匹配的噪音,而这两个句子本可以通过实体类型进行区分。
情况二是虽然将表达相同关系的句子聚类到一起,但是由于句子中的实体众多,下游任务无法准确抽取出对应的三元组。而当使用基于聚类的关系抽取技术来对RPA流程描述文字进行RPA知识图谱构建时,常常会遇到以上两个情况,因为RPA的流程描述通常会出现高密度的实体和关系,例如“数据查询步骤打开浏览器并根据配置文件的网址信息查询并访问网址”中,就包含了“数据查询步骤”“浏览器”、“配置文件”、“网址信息”四个类型的实体和“打开”、“查询”和“访问”三种关系。再例如句子“数据处理步骤中调用python程序根据配置文件类型信息对结果Excel文件信息进行筛选处理”,由于句中的实体众多,聚类结束后得到的三元组是(python程序,筛选处理,配置文件),这显然是不符合原句的逻辑的。
但是如果能充分考虑实体类型信息,例如“配置文件”属于“可读写文件”,而不能与关系“筛选处理”匹配,从而避免尝试如上的错误的三元组。
发明内容
为了解决未能充分考虑实体类型信息而无法准确抽取任务三元组信息,本发明提出了一种基于实体类型信息融合的RPA知识图谱构建方法,包括以下步骤:
S1、基于翻译规则的知识表示模型对实体类型进行训练;
S2、将实体类型的表示和关系实例输入至实体对编码模块,得到融合实体类型信息的实体对表示;
S3、使用伪标签生成模块将融合实体类型信息的实体对表示映射到用于表达语义关系的空间,并且为未标记数据生成伪标签;
S4、利用标记数据的关系标签和生成的伪标签训练关系分类器,得到训练好的关系分类器;
S5、利用训练好的关系分类器进行关系抽取。
本发明提供的有益效果是:与现有技术相比,本发明提出的技术方案中将知识图谱的关系抽取技术引入RPA领域并且充分利用了实体类型信息。通过将实体类型的表示和关系实例输入到实体对编码模块,获得融合实体类型信息的实体对表示,进而将实体类型信息融合到表示中以捕捉关系对头尾实体类型的约束信息,减少实体类型不匹配的噪音产生,从而建立更高质量RPA知识图谱。
附图说明
图1是本发明方法流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
请参考图1,图1是本发明系统结构的示意图;本发明提供的一种基于实体类型信息融合的RPA知识图谱构建方法,具体包括以下步骤:
S1、基于翻译规则的知识表示模型对实体类型进行训练;
步骤S1具体如下:
S11、对每个实体类型,随机生成一个固定维度的实体类型向量,并将实体类型向量拼接到实体对表示的后面;
S12、使用基于翻译规则的知识表示模型对所述实体类型向量进行优化训练,获得知识增强后的实体类型向量。
需要说明的是,对于实体类型这一信息的使用,本发明提出两种策略。
一种是使用随机生成策略,对每个实体类型随机生成一个固定维度的实体类型向量,将向量拼接到实体对表示的后面。
然而基于随机生成策略得到的向量仅能起到类型区分的作用。受 word2vec和基于翻译规则的知识表示模型的启发,本方法进一步提出第二种优化学习策略,使用知识表示模型对实体类型向量进行优化训练,获得知识增强后的实体类型向量。经过知识增强后的实体类型向量,不仅可以标识实体类别,还可以进行复杂运算,包含更加丰富的信息。
本发明中使用基于翻译规则的知识表示模型进行训练,将实体类型统一映射到实体类型空间,可以让具有相同特点的实体类型聚簇,从而获得包含更丰富语义的实体类型表示。
知识表示模型的训练数据为实体类型三元组
对于标记数据,实体类型对通过将标记数据中三元组(h,r,t)的头尾实体h,t替换为对应实体类型type htype t获得。
对于未标记数据,初次训练时都看作是新的关系类型,实体类型对相同的记为一种关系。经过一次迭代后,关系分类器会为每个未标记数据输出一个预测关系类型标签,此时即可将预测标签作为未标记数据的关系标签来辅助知识表示模型进行实体类型训练。
由于关系分类器预测的准确性并不能保证,所以将设定一个置信度阈值,只有高于这个阈值的关系类型标签才会被采纳形成实体类型三元组。
经过处理后,将有很多重复的实体类型三元组,只保留一部分进行训练。
出现频次最高的三元组保留一百条数据,其他的三元组按照对应比例进行保留,保证参与预训练的实体类型三元组数据分布与之前一致。
所述基于翻译规则的知识表示模型采用TransH模型。
使用实体类型替换为原有的三元组实体,得分函数公式如下:
其中,实体类型表示为type h为头实体,type t为尾实体,为实体关系。
经过训练后,实体类型训练模块可以获得知识增强后的实体类型向量计算公式如下:
其中,表示头实体的实体类型向量;/>表示尾实体的实体类型向量;Z(·,·)表示由实体类型训练模块Z获得的向量对;/>表示头实体的实体类型;/>表示尾实体的实体类型。
S2、将实体类型的表示和关系实例输入至实体对编码模块,得到融合实体类型信息的实体对表示;
步骤S2具体如下:
S21、获取关系实例s i,所述关系实例包括1个句子x i,两个标记实体对位置的实体跨度e he t,以及对应的实体类型type htype t
S22、所述实体对编码模块对实体跨度内的序列表示进行最大池化操作:
其中,h starth end分别表示实体跨度起始处和结束处的嵌入表示,h ent表示单个实体的嵌入表示;
需要说明的是,实体对编码模块采用编码器,其旨在映射关系实例/>到低维向量稠密空间,获得一个固定长度的实体对表示/>,编码关系实例的上下文信息和实体类型信息。
为了使得每个实例表达的关系类型可以通过它们的上下文来反映,可以采用 CNN或者 BERT 模型作为编码器的实现。
本模块采用BERT作为编码器的实现,因为它相较于CNN能提取到更丰富的上下文信息,且能够解决长时间依赖问题并提高计算效率。
S23、将头、尾实体表示进行拼接,得到最终融合实体类型信息的实体对表示,如下式:
其中/>和/>表示头、尾实体的类型嵌入,/>表示连接操作符。
基于上述设置,实体对编码模块不仅可以编码上下文信息,还将实体类型信息融入,使得模型可以捕获关系对实体类型的约束信息。
S3、使用伪标签生成模块将融合实体类型信息的实体对表示映射到用于表达语义关系的空间,并且为未标记数据生成伪标签;
所述伪标签生成模块包括一个非线性编码器g和一个非线性解码器d
对于标记数据,所述非线性编码器在关系标签的监督下,使中心损失函数将聚集到它的关系质心,其中/>=g(h i);
对于未标记数据,将实体对表示用非线性编码器g映射后得到新语义空间下的表示向量,并在此基础上使用Kmeans聚类算法进行聚类,聚类后的每个簇的类就是未标记实例获得的伪标签。
具体来说,伪标签生成模块主要包括一个非线性编码器和一个非线性解码器/>,它们都由前馈神经网络构成的,具体包括一个全连接层、两个隐藏层和一个输出层。
编码器的作用为将融合实体类型信息的实体对表示映射到用于表达语义关系的空间,并在此空间中将表达相同关系的实体对表示聚集在一起,表达不同关系的实体对表示远离,公式如下:
=g(h i)
对于标记数据,在关系标签的监督下,使用中心损失函数将/>聚集到它的关系质心。损失函数如下:
其中,是解码器模块,此解码器的作用是将/>映射回原来的空间。/>表示度量重构误差的最小二乘损失。/>是用来平衡重构误差和中心损失的超参数。
对于未标记数据,将实体对表示用非线性编码器映射后得到新语义空间下的表示向量,再在此基础上使用 Kmeans聚类算法进行聚类,聚类后每个簇的类别就是未标记实例获得的伪标签/>
S4、利用标记数据的关系标签和生成的伪标签训练关系分类器,得到训练好的关系分类器;
所述关系分类器包括两个,分别为第一关系分类器和第二关系分类器/>
所述生成的伪标签用于训练第一关系分类器
所述标记数据的关系标签用于训练第二关系分类器
具体的说,两个分类器各由一个输入层、一个输出层和一个softmax层构成。它们将原始关系实例转换成一个实值向量,以得到输入关系实例属于一个关系/>的概率。
基于聚类生成的伪标签用于训练关系第一关系分类器/>,通过细化实体对表ℎ来编码更丰富的上下文信息。
第一关系分类器的学习基于如下假设:如果一对关系实例来自同一个聚类,那么第一关系分类器/>将输出相似的分布,反之亦然。
为了描述输出的分布信息,首先定义用表示两个实例/>和/>是否属于同一聚簇。来自同一聚簇的实例对,定义损失/>
使用 KL 散度来度量两个分布间的“距离”,其中表示假设P是个常数,此时是一个一元函数。对于来自不同簇的实例/>和/>,那么它们的输出分布预计也是不同的,此处使用 hinge 损失函数,具体计算公式如下:
其中,为超参数。因此,整体损失函数如下:
由于使用标记数据来引导实体对表示向其关系质心进行聚集会对预定义的关系产生聚类偏差,因此很难直接为新的关系生成高质量的伪标签/>
为了减少伪标签错误所带来的负面影响,使用第二关系分类器对预定义关系的关系实例进行分类。
第二关系分类器的损失函数/>定义如下:
最终使用联合损失函数来优化实体对表示/>,/>的定义如下:
S5、利用训练好的关系分类器进行关系抽取。
最后,本发明的关键点如下:
实体的类型信息隐藏了关系类型对头实体和尾实体的类型约束,如果不能捕捉到这种约束,会导致以下两种情况。
情况一是将表达不同关系的句子聚类到一起,产生实体类型不匹配的噪音,而这两个句子本可以通过实体类型进行区分。
情况二是虽然将表达相同关系的句子聚类到一起,但是由于句子中的实体众多,下游任务无法准确抽取出对应的三元组。
本发明通过将实体类型的表示和关系实例输入到实体对编码模块,获得融合实体类型信息的实体对表示,进而将实体类型信息融合到表示中。
每个给定的关系实例,包括一个句子/>,两个标记实体对位置的实体跨度/>,以及头尾实体的对应实体类型/>和/>
实体对编码器旨在映射关系实例/>到低维向量稠密空间,获得一个固定长度的实体对表示/>,编码关系实例的上下文信息和实体类型信息。
为了使得每个实例表达的关系类型可以通过它们的上下文来反映,可以采用 CNN或者 BERT 模型作为编码器的实现。
本发明采用 BERT 作为实体对编码器的实现,因为它相较于CNN能提取到更丰富的上下文信息,且能够解决长时间依赖问题并提高计算效率。
使用如下公式对实体跨度内的序列表示进行最大池化操作:
其中,、/>分别表示实体跨度起始处和结束处的嵌入表示,/>表示单个实体的嵌入表示。
最后将头尾实体表示与实体类型表示进行拼接获得最终代表关系实例的实体对表示,拼接公式如下 :
其中和/>表示头尾实体的类型嵌入,⊕表示连接操作符。基于上述设置,实体对编码模块不仅可以编码上下文信息,还将实体类型信息融入,使得模型可以捕获关系对实体类型的约束信息。
综合来看,本发明的有益效果是:与现有技术相比,本发明提出的技术方案中将知识图谱的关系抽取技术引入RPA领域并且充分利用了实体类型信息。通过将实体类型的表示和关系实例输入到实体对编码模块,获得融合实体类型信息的实体对表示,进而将实体类型信息融合到表示中以捕捉关系对头尾实体类型的约束信息,减少实体类型不匹配的噪音产生,从而建立更高质量RPA知识图谱。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:包括以下步骤:
S1、基于翻译规则的知识表示模型对实体类型进行训练;
S2、将实体类型的表示和关系实例输入至实体对编码模块,得到融合实体类型信息的实体对表示;
S3、使用伪标签生成模块将融合实体类型信息的实体对表示映射到用于表达语义关系的空间,并且为未标记数据生成伪标签;
S4、利用标记数据的关系标签和生成的伪标签训练关系分类器,得到训练好的关系分类器;
S5、利用训练好的关系分类器进行关系抽取。
2.如权利要求1所述的一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:步骤S1具体如下:
S11、对每个实体类型,随机生成一个固定维度的实体类型向量,并将实体类型向量拼接到实体对表示的后面;
S12、使用基于翻译规则的知识表示模型对所述实体类型向量进行优化训练,获得知识增强后的实体类型向量。
3.如权利要求1所述的一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:所述基于翻译规则的知识表示模型采用TransH模型。
4.如权利要求3所述的一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:所述TransH模型的得分函数如下:
其中,实体类型表示为type h为头实体,type t为尾实体,/>为实体关系。
5.如权利要求4所述的一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:所述TransH模型的损失函数如下:
其中,/>表示实体类型三元组集合,/>表示通过负采样获得的实体类型三元组的负样本集合,/>中的每个三元组都不在/>中,/>是一个超参数,用于修正正负样本的间隔。
6.如权利要求4所述的一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:增强后的实体类型向量如下:
其中,表示头实体的实体类型向量;/>表示尾实体的实体类型向量;Z(·,·)表示由实体类型训练模块Z获得的向量对;/>表示头实体的实体类型;/>表示尾实体的实体类型。
7.如权利要求4所述的一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:步骤S2具体如下:
S21、获取关系实例s i,所述关系实例包括1个句子x i,两个标记实体对位置的实体跨度e he t,以及对应的实体类型type htype t
S22、所述实体对编码模块对实体跨度内的序列表示进行最大池化操作:
其中,h starth end分别表示实体跨度起始处和结束处的嵌入表示,h ent表示单个实体的嵌入表示;
S23、将头、尾实体表示进行拼接,得到最终融合实体类型信息的实体对表示,如下式:
其中和/>表示头、尾实体的类型嵌入,/>表示连接操作符。
8.如权利要求7所述的一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:所述伪标签生成模块包括一个非线性编码器g和一个非线性解码器d
对于标记数据,所述非线性编码器在关系标签的监督下,使中心损失函数将聚集到它的关系质心,其中/>=g(h i);
对于未标记数据,将实体对表示用非线性编码器g映射后得到新语义空间下的表示向量,并在此基础上使用Kmeans聚类算法进行聚类,聚类后的每个簇的类就是未标记实例获得的伪标签。
9.如权利要求8所述的一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:所述中心损失函数如下式:
其中,d为解码器,是用来平衡重构误差和中心损失的超参数。
10.如权利要求9所述一种基于实体类型信息融合的RPA知识图谱构建方法,其特征在于:所述关系分类器包括两个,分别为第一关系分类器和第二关系分类器/>
所述生成的伪标签用于训练第一关系分类器
所述标记数据的关系标签用于训练第二关系分类器
CN202410027166.6A 2024-01-09 2024-01-09 一种基于实体类型信息融合的rpa知识图谱构建方法 Active CN117540035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410027166.6A CN117540035B (zh) 2024-01-09 2024-01-09 一种基于实体类型信息融合的rpa知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410027166.6A CN117540035B (zh) 2024-01-09 2024-01-09 一种基于实体类型信息融合的rpa知识图谱构建方法

Publications (2)

Publication Number Publication Date
CN117540035A true CN117540035A (zh) 2024-02-09
CN117540035B CN117540035B (zh) 2024-05-14

Family

ID=89788426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410027166.6A Active CN117540035B (zh) 2024-01-09 2024-01-09 一种基于实体类型信息融合的rpa知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN117540035B (zh)

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860908A (zh) * 2021-01-27 2021-05-28 云南电网有限责任公司电力科学研究院 基于多源异构电力设备数据的知识图谱自动化构建方法
CN113744891A (zh) * 2021-09-15 2021-12-03 浙江工商大学 一种药品知识图谱表示学习方法
CN113886605A (zh) * 2021-10-25 2022-01-04 支付宝(杭州)信息技术有限公司 一种知识图谱处理方法和系统
CN114003729A (zh) * 2021-10-20 2022-02-01 河海大学 一种融合实体类型和关系路径信息的知识图谱补全方法
CN114091464A (zh) * 2022-01-24 2022-02-25 南京万得资讯科技有限公司 一种融合五维特征的高普适性多对多关系三元组抽取方法
WO2022041294A1 (zh) * 2020-08-26 2022-03-03 华南理工大学 一种结合知识库中的三元组和实体类型的生成问题方法
WO2022057669A1 (zh) * 2020-09-16 2022-03-24 浙江大学 基于结构化上下文信息的知识图谱预训练方法
CN114328980A (zh) * 2022-03-14 2022-04-12 来也科技(北京)有限公司 结合rpa及ai的知识图谱构建方法、装置、终端及存储介质
US20220147836A1 (en) * 2020-11-06 2022-05-12 Huazhong University Of Science And Technology Method and device for text-enhanced knowledge graph joint representation learning
CN114580638A (zh) * 2022-02-14 2022-06-03 中国人民解放军战略支援部队信息工程大学 基于文本图增强的知识图谱表示学习方法及系统
WO2022116417A1 (zh) * 2020-12-03 2022-06-09 平安科技(深圳)有限公司 三元组信息提取方法、装置、设备及计算机可读存储介质
CN115366157A (zh) * 2022-10-24 2022-11-22 北京奔驰汽车有限公司 工业机器人维护方法及装置
CN115600605A (zh) * 2022-10-31 2023-01-13 陕西师范大学(Cn) 一种中文实体关系联合抽取方法、系统、设备及存储介质
CN116010622A (zh) * 2023-01-31 2023-04-25 湖南视觉伟业智能科技有限公司 融合实体类型的bert知识图谱补全方法及系统
WO2023065545A1 (zh) * 2021-10-19 2023-04-27 平安科技(深圳)有限公司 风险预测方法、装置、设备及存储介质
CN116028647A (zh) * 2023-02-07 2023-04-28 中科乐听智能技术(济南)有限公司 基于知识图谱的融合教育智能评语方法及系统
US20230196127A1 (en) * 2021-05-11 2023-06-22 Xi'an Jiaotong University Method and device for constructing legal knowledge graph based on joint entity and relation extraction
CN116521882A (zh) * 2023-05-30 2023-08-01 中国人民解放军战略支援部队信息工程大学 基于知识图谱的领域长文本分类方法及系统
CN116821351A (zh) * 2023-03-14 2023-09-29 国网甘肃省电力公司信息通信公司 一种基于跨度信息的端到端电力知识图谱关系抽取方法
WO2023184226A1 (zh) * 2022-03-30 2023-10-05 京东方科技集团股份有限公司 一种物品推荐方法、物品知识图谱、模型训练方法及装置

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022041294A1 (zh) * 2020-08-26 2022-03-03 华南理工大学 一种结合知识库中的三元组和实体类型的生成问题方法
WO2022057669A1 (zh) * 2020-09-16 2022-03-24 浙江大学 基于结构化上下文信息的知识图谱预训练方法
US20220147836A1 (en) * 2020-11-06 2022-05-12 Huazhong University Of Science And Technology Method and device for text-enhanced knowledge graph joint representation learning
WO2022116417A1 (zh) * 2020-12-03 2022-06-09 平安科技(深圳)有限公司 三元组信息提取方法、装置、设备及计算机可读存储介质
CN112860908A (zh) * 2021-01-27 2021-05-28 云南电网有限责任公司电力科学研究院 基于多源异构电力设备数据的知识图谱自动化构建方法
US20230196127A1 (en) * 2021-05-11 2023-06-22 Xi'an Jiaotong University Method and device for constructing legal knowledge graph based on joint entity and relation extraction
CN113744891A (zh) * 2021-09-15 2021-12-03 浙江工商大学 一种药品知识图谱表示学习方法
WO2023065545A1 (zh) * 2021-10-19 2023-04-27 平安科技(深圳)有限公司 风险预测方法、装置、设备及存储介质
CN114003729A (zh) * 2021-10-20 2022-02-01 河海大学 一种融合实体类型和关系路径信息的知识图谱补全方法
WO2023071845A1 (zh) * 2021-10-25 2023-05-04 支付宝(杭州)信息技术有限公司 知识图谱处理
CN113886605A (zh) * 2021-10-25 2022-01-04 支付宝(杭州)信息技术有限公司 一种知识图谱处理方法和系统
CN114091464A (zh) * 2022-01-24 2022-02-25 南京万得资讯科技有限公司 一种融合五维特征的高普适性多对多关系三元组抽取方法
CN114580638A (zh) * 2022-02-14 2022-06-03 中国人民解放军战略支援部队信息工程大学 基于文本图增强的知识图谱表示学习方法及系统
CN114328980A (zh) * 2022-03-14 2022-04-12 来也科技(北京)有限公司 结合rpa及ai的知识图谱构建方法、装置、终端及存储介质
WO2023184226A1 (zh) * 2022-03-30 2023-10-05 京东方科技集团股份有限公司 一种物品推荐方法、物品知识图谱、模型训练方法及装置
CN115366157A (zh) * 2022-10-24 2022-11-22 北京奔驰汽车有限公司 工业机器人维护方法及装置
CN115600605A (zh) * 2022-10-31 2023-01-13 陕西师范大学(Cn) 一种中文实体关系联合抽取方法、系统、设备及存储介质
CN116010622A (zh) * 2023-01-31 2023-04-25 湖南视觉伟业智能科技有限公司 融合实体类型的bert知识图谱补全方法及系统
CN116028647A (zh) * 2023-02-07 2023-04-28 中科乐听智能技术(济南)有限公司 基于知识图谱的融合教育智能评语方法及系统
CN116821351A (zh) * 2023-03-14 2023-09-29 国网甘肃省电力公司信息通信公司 一种基于跨度信息的端到端电力知识图谱关系抽取方法
CN116521882A (zh) * 2023-05-30 2023-08-01 中国人民解放军战略支援部队信息工程大学 基于知识图谱的领域长文本分类方法及系统

Also Published As

Publication number Publication date
CN117540035B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
WO2020093761A1 (zh) 一种面向软件缺陷知识的实体、关系联合抽取方法
CN115526236A (zh) 一种基于多模态对比学习的文本网络图分类方法
CN116383399A (zh) 一种事件舆情风险预测方法及系统
CN112926337A (zh) 一种结合重构句法信息的端到端方面级情感分析方法
CN115563314A (zh) 多源信息融合增强的知识图谱表示学习方法
CN116484024A (zh) 一种基于知识图谱的多层次知识库构建方法
CN114332519A (zh) 一种基于外部三元组和抽象关系的图像描述生成方法
Huang et al. Improving log-based anomaly detection by pre-training hierarchical transformers
CN116245107B (zh) 电力审计文本实体识别方法、装置、设备及存储介质
CN113869055A (zh) 基于深度学习的电网项目特征属性识别方法
CN115757325B (zh) 一种xes日志智能转换方法及系统
CN117540035B (zh) 一种基于实体类型信息融合的rpa知识图谱构建方法
CN116821351A (zh) 一种基于跨度信息的端到端电力知识图谱关系抽取方法
CN116561264A (zh) 一种基于知识图谱的智能问答系统的构建方法
CN114756679A (zh) 基于交谈注意力机制的中文医学文本实体关系联合抽取方法
CN113076421A (zh) 一种社交噪音文本实体关系抽取优化方法及系统
Jian et al. An improved memory networks based product model classification method
Han et al. Knowledge enhanced graph inference network based entity-relation extraction and knowledge graph construction for industrial domain
CN112698833B (zh) 一种基于局部和全局特征的特征依恋代码味道检测方法
CN117807999B (zh) 基于对抗学习的域自适应命名实体识别方法
Ma et al. Clip-based cycle alignment hashing for unsupervised vision-text retrieval
WO2024021334A1 (zh) 关系抽取方法、计算机设备及程序产品
CN114996407B (zh) 基于包重构的远程监督关系抽取方法及系统
Zhen et al. User Alignment Across Social Networks Based On ego-Network Embedding
CN111402012B (zh) 一种基于迁移学习的电商缺陷产品识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant