CN113590578B - 跨语言知识单元迁移方法、装置、存储介质及终端 - Google Patents

跨语言知识单元迁移方法、装置、存储介质及终端 Download PDF

Info

Publication number
CN113590578B
CN113590578B CN202110693347.9A CN202110693347A CN113590578B CN 113590578 B CN113590578 B CN 113590578B CN 202110693347 A CN202110693347 A CN 202110693347A CN 113590578 B CN113590578 B CN 113590578B
Authority
CN
China
Prior art keywords
knowledge
units
language
modeling
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110693347.9A
Other languages
English (en)
Other versions
CN113590578A (zh
Inventor
吴旭
吴京宸
颉夏青
管子键
邱莉榕
杨金翠
孙利娟
张勇东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202110693347.9A priority Critical patent/CN113590578B/zh
Publication of CN113590578A publication Critical patent/CN113590578A/zh
Application granted granted Critical
Publication of CN113590578B publication Critical patent/CN113590578B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种跨语言知识单元迁移方法,包括:获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库;针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果;针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果;将第一建模结果与第二建模结果拼接后,生成拼接结果;根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元;计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。因此,由于本申请通过对知识单元的语义层次进行建模,并对不同语言的向量空间进行线性转换,从而可以实现跨语言知识单元的迁移。

Description

跨语言知识单元迁移方法、装置、存储介质及终端
技术领域
本发明涉及自然语言处理技术领域,特别涉及一种跨语言知识单元迁移方法、装置、存储介质及终端。
背景技术
伴随互联网的发展,数据信息量爆炸式增长,数据冗杂,规模庞大,为解决这一系列问题,旨在描述现实世界中存在的实体以及实体之间关系的知识图谱技术孕育而生。为了获得更加完善的知识图谱,可以采用将多个不同语言知识库融合的方法,得到一个包含更多信息和实体的多语言的知识图谱。在这种知识图谱中存在一些已知的跨语言链接,将多种语言指向的同一实体连接起来,即实体对齐。例如在中文知识图谱中有一个实体“海上钢琴师”,英文知识图谱中有一个实体“TheLegendof1900”,如果仅是通过英汉翻译,他们得到的意思并不相同,但这两个知识单元实际都是指向的同一个电影,即他们是等同的知识单元。但是这些跨语言链接并不是大量存在于知识图谱中,仍然有许多不同语言的知识单元对之间并没有这样的链接。因此现在有大量工作在于研究多语言之间知识单元迁移问题,旨在找到更优的跨语言知识图谱知识单元迁移方法。
不同语种知识在互联网中深度融合,形成的多语言知识库一方面弥补了单语言知识图谱知识不完备的问题,另一方面又为不同语言的知识重叠和知识互补研究带来了新的挑战。因此将迁移学习的思想就利用到跨语言知识图谱研究中,其核心思想是利用已知的跨语言对齐语料,基于语义特征表示和跨语言迁移模型来实现从一种语言到另一种语言的迁移学习,构建出语义丰富的跨语言知识图谱(Cross-lingual Knowledge Graphs)。跨语言知识图谱作为大数据时代的知识引擎,能够提升数据获取速率,降低知识应用门槛,提高知识利用效率,更好地服务于人工智能的各个领域。跨语言知识图谱存储两方面的知识:一是单语知识(Monolingual Knowledge),以三元组形式记录的实体、关系、描述信息等,二是跨语言知识关联(Cross-lingual Knowledge Association),用于匹配人类语言中的单一语言知识。而对跨语言领域知识的迁移更有助于多语言者工作学习和网络空间的内容治理。
近年来,基于嵌入的技术越来越收到研究者的关注,受词嵌入的启发,知识图谱嵌入是将实体、属性和关系等编码到一个低维的空间中,表示为向量(或矩阵、张量),通过嵌入之间转换关系的有效计算,完成对知识迁移。虽然基于嵌入的技术可以帮助提高单语知识的完整性,但对于跨语言知识在很大程度上还未被深度探索,匹配同一实体的语际链接(Inter-Lingual Links,ILLs)和表示相同关系的三元组对齐(Triple-Wise Alignment,TWA)问题,都对解决多语言知识库的知识融合和独立演化问题有着巨大帮助,因此,不少研究者投身于跨语言知识的迁移学习中。找到一种通用且易于掌握的技术来实现跨语言知识迁移是十分必要的,由于以下几个原因,使得这种语际知识转换比单语实体链接更加困难:(1)各语言表达习惯和书写方式的不同;(2)各语言实体含义范围不尽相同;(3)跨语言已知对齐知识只占知识库的一小部分。
发明内容
本申请实施例提供了一种跨语言知识单元迁移方法、装置、存储介质及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本申请实施例提供了一种跨语言知识单元迁移方法,方法包括:
获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库;
针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果;
针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果;
将第一建模结果与第二建模结果拼接后,生成拼接结果;
根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元;
计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。
可选的,知识单元由模部分和相位部分组成;
针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果,包括:
根据模部分的损失函数将两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到模部分嵌入;
将模部分嵌入确定为第一建模结果。
可选的,针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果,包括:
根据相位部分的损失函数将两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到相位部分嵌入;
将相位部分嵌入确定为第二建模结果。
可选的,将第一建模结果与第二建模结果拼接后,生成拼接结果,包括:
将模部分嵌入与相位部分嵌入进行拼接,生成不同语言知识图谱各自的知识单元嵌入表示;
将不同语言知识图谱各自的知识单元嵌入表示确定为拼接结果。
可选的,模部分和/或相位部分嵌入与其对应的向量空间中是通过知识模型将知识单元嵌入到极坐标系中;
其中,极坐标系中径向坐标和角坐标分别对应于模部分和相位部分,知识模型将每个知识单元e表示为[em;ep],其中em和ep分别由模部分和相位部分生成,[·;·]表示两个向量的拼接。
可选的,计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移,包括:
根据模部分和/或相位部分的距离函数计算转换后的知识单元的距离;
根据转换后的知识单元的距离评估置信度;
根据置信度的大小得到目标对齐知识单元;
根据目标对齐知识单元预测知识图谱的潜在关系;
基于潜在关系预测知识图谱中的链路,并补全知识图谱中不完备的图谱。
可选的,转换后的知识单元为两种不同语言各自的知识图谱的向量空间转换矩阵。
第二方面,本申请实施例提供了一种跨语言知识单元迁移装置,装置包括:
数据信息获取模块,用于获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库;
第一建模结果生成模块,用于针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果;
第二建模结果生成模块,用于针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果;
建模结果拼接模块,用于将第一建模结果与第二建模结果拼接后,生成拼接结果;
空间向量转换模块,用于根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元;
知识单元迁移模块,用于计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。
第三方面,本申请实施例提供一种计算机存储介质,计算机存储介质存储有多条指令,指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供一种终端,可包括:处理器和存储器;其中,存储器存储有计算机程序,计算机程序适于由处理器加载并执行上述的方法步骤。
本申请实施例提供的技术方案可以包括以下有益效果:
在本申请实施例中,跨语言知识单元迁移装置首先获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库,然后针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果,再针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果,并将第一建模结果与第二建模结果拼接后,生成拼接结果;根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元,最后计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。由于本申请通过对知识单元的语义层次进行建模,并对不同语言的向量空间进行线性转换,从而可以实现跨语言知识单元的迁移。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本申请实施例提供的一种跨语言知识单元迁移方法的流程示意图;
图2是本申请实施例提供的一种知识模型将知识单元嵌入极坐标系的示例图;
图3是本申请实施例提供的一种跨语言知识单元迁移过程的过程示意图;
图4是本申请实施例提供的另一种跨语言知识单元迁移方法的流程示意图;
图5是本申请实施例提供的一种跨语言知识单元迁移装置的装置示意图;
图6是本申请实施例提供的一种终端的结构示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请提供了一种跨语言知识单元迁移方法、装置、存储介质及终端,以解决上述相关技术问题中存在的问题。本申请提供的技术方案中,由于本申请通过对知识单元的语义层次进行建模,并对不同语言的向量空间进行线性转换,从而可以实现跨语言知识单元的迁移,下面采用示例性的实施例进行详细说明。
下面将结合附图1-附图4,对本申请实施例提供的跨语言知识单元迁移方法进行详细介绍。该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的跨语言知识单元迁移装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。其中,本申请实施例中的跨语言知识单元迁移装置可以为用户终端,包括但不限于:个人电脑、平板电脑、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中用户终端可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的终端设备等。
请参见图1,为本申请实施例提供了一种跨语言知识单元迁移方法的流程示意图。如图1所示,本申请实施例的方法可以包括以下步骤:
S101,获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库;
其中,知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形。跨语言知识对齐种子库是预先设定的多语言知识库。
在本申请实施例中,对于一个多语言知识库KB,使用表示语言集,/>表示任意两个语言的无序组合。对于任一语言/>GL表示由L语言构成的知识图谱KG,EL和RL分别表示GL中的实体(属性值)集和关系(属性名)集。T=(h,r,t)表示GL中的一个三元组,其中h,t∈EL,r∈RL。h,r,t分别表示头KUh,关系r,尾KUt的嵌入向量。对于/>表示L1和L2中已对齐的三元组的对齐集。对齐集通常是多语言知识库的很小一部分,在特定的应用场景中,需要对这部分知识进行扩充,借助语料丰富的通用语言知识图谱实现对语料稀疏的小语种知识图谱迁移扩展,这正是本申请的主要工作。
进一步地,本申请是通过基于语义层次感知的跨语言知识单元迁移模型进行整体处理,该模型由两个部分组成,一部分是对每种语言实现基于语义层次感知的知识模型,另一部分是利用现有的少量对齐集学习跨语言转换的迁移模型,迁移模型包括对齐模型以及距离计算和置信度计算的相关函数。
在一种可能的实现方式中,在进行跨语言知识单元迁移时,首先获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库。
S102,针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果;
通常,将单语知识图谱中的知识单元根据语义层次的不同分为了两类,层次结构不同级别的知识单元,即不同语义层次的知识单元,例如:“哺乳动物”和“狗”、“树”和“棕榈树”。层次结构相同级别的知识单元,即同一语义层次的知识单元。例如:“狗”和“猫”、“棕榈树”和“杨树”。
在本申请实施例中,知识单元由模部分和相位部分组成,再生成第一建模结果时,根据模部分的损失函数将两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到模部分嵌入,然后将模部分嵌入确定为第一建模结果。
S103,针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果;
在本申请实施例中,生成第二建模结果时,首先根据相位部分的损失函数将两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到相位部分嵌入,然后将相位部分嵌入确定为第二建模结果。
具体的,模部分和/或相位部分嵌入与其对应的向量空间中是通过知识模型将知识单元嵌入到极坐标系中。其中,极坐标系中径向坐标和角坐标分别对应于模部分和相位部分,知识模型将每个知识单元e表示为[em;ep],其中em和ep分别由模部分和相位部分生成,[·;·]表示两个向量的拼接。
S104,将第一建模结果与第二建模结果拼接后,生成拼接结果;
在本申请实施例中,在进行拼接时,首先将模部分嵌入与相位部分嵌入进行拼接,生成不同语言知识图谱各自的知识单元嵌入表示,然后将不同语言知识图谱各自的知识单元嵌入表示确定为拼接结果。
例如图2所示,为知识模型处理时的一个简单示例,用em(e为h或t)和rm表示知识单元的模部分的嵌入,用ep(e为h或t)和rp表示知识单元的相位部分的嵌入。在极坐标系中,径向坐标用于对不同语义层次的知识单元建模,角度坐标用于对同一语义层次的知识单元建模,两者组合实现语义层次感知的知识单元建模。
在图2中,模部分的嵌入主要是对不同语义层次的知识单元进行建模,受“树”数据结构的启发,我们可以将具有关系的不同层次的知识单元看作“树”的各个“叶子”节点,用节点(知识单元)的深度来建模不同层次的知识单元,因此,模量信息可以对上述不同语义层次的知识单元进行建模。
模量的大小反应树的深度,模量越大,表明该节点距离根节点的距离越远;模量越小,表明该节点距离根节点的距离越近。hm和tm的向量表示为hm和tm,则模部分可以表示为:
其中,/>
相应的距离函数为:
其中,||·||2表示l2范数,dr,m(hm,rm)表示在关系r下,头知识单元h和尾知识单元t的模部分的距离。允许知识单元的嵌入项为负,不允许关系的嵌入项为负,即[rm]i>0,因为知识单元的嵌入可以帮助预测两个知识单元之间是否存在关系。对于正例三元组(h,r,t1)和负例三元组(h,r,t2),目标是最小化dr,m(hm,t1m),最大化dr,m(hm,t2m),使得dr,m(hm,t2m)尽可能地大于dr,m(hm,t1m),以最大差异化正负三元组。此外,考虑到树结构的特性,层次结构较高的知识单元的模量尽可能得小,这样更接近于树的根。
如果只使用模部分来表示知识图谱,那么同一语义层次的知识单元中的知识单元都将具有相同的模量,这使得这些知识单元很难被区分,因此,需要一个新的模块来对同一语义层次的知识单元进行建模。
在图2中,相位部分的嵌入主要是对同一语义层次上的知识单元进行建模。受同一圆上的点(即具有相同的模量)可以相对于圆心具有不同的角度的启发,我们可以将同一语义层次上的知识单元看到是同一圆上不同相位上的节点,以此来建模类别(2)中的知识单元。hp和tp的向量表示为hp和tp,则相位部分可以表示为:(hp+rp)mod 2π=tp,,其中,hp,rp,tp∈[0,2π)k (3)相应的距离函数为:dr,p(hp,tp)=||sin((hp+rp-tp)/2)||1 (4)
其中,||·|||1表示l1范数,sin(·)表示为每个输入的元素进行正弦函数操作,由于相位具有周期性,因此这里使用正弦函数来测量相位之间的距离,dr,p(hp,tp)表示在关系r下,头知识单元h和尾知识单元t的相位部分的距离。
综上,结合模部分的嵌入与相位部分的嵌入,可以将知识模型表示如下:
知识模型的距离函数为:
其中,为模型学习得到的参数。相应的得分函数为:
fr(h,t)==-dr(h,t)=-dr,m(hm,tm)-λdr,p(hp,tp) (7)
当两个知识单元具有相同的模量时,模部分dr,m(hm,tm)=0,但相位部分dr,p(hp,tp)可以相差很大。通过模部分和相位部分的线性叠加可以建模类别(1)和(2)中的知识单元,实现基于语义层次的建模。
采用了关于对dr,m(hm,tm)的优化,即在dr,m(hm,tm)中加入混合偏差(mixturebias)[22],以此来提高SHACUT知识模型的性能,优化后的dr,m(hm,tm)如下所示:
其中,-rm<r′m<1是和rm维度相同的向量。
为了得到更好的训练结果,使用的负采样损失函数和自我对抗训练方法,最终单语知识模型的损失函数为:
其中,γ为margin,σ(·)是激活函数sigmoid函数,(h′i,r,t′i)为负例三元组,h′i和t′i不同时为负例。负采样三元组的概率分布如下,其中α是采样温度:
对于的跨语言知识迁移的知识模型的损失函数,即为两种语言各自的知识模型损失函数之和:SKM=Sa,KM+Sb,KM
S105,根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元;
其中,该步骤通过迁移模型进行处理,迁移模型包括对齐模型以及距离计算和置信度计算的相关函数。
通常,迁移模型(Transfer Model,TM)是为了构造三元组对 在各自向量空间之间的变换,将跨语言对齐问题看作不同嵌入空间的拓扑变换,基于知识模型得到的各语言三元组嵌入空间,推导得到向量空间之间的线性变换,通过计算变换后知识单元的距离和置信度,得到新的对齐知识单元,从而进行链路预测和图谱补全。
在本申请实施例中,转换后的知识单元为两种不同语言各自的知识图谱的向量空间转换矩阵。
例如,给出一个k×k的平方矩阵是知识单元向量从La到Lb的线性转换,k为知识单元嵌入空间的维度,对齐模型的损失函数如下:
考虑到各语言三元组中关系的嵌入空间的差异,引入关系向量的线性变换矩阵其形状与知识单元间线性变换矩阵/>相同,则此时的对齐模型的损失函数如下:
对于跨语言知识图谱以及对齐种子库/>首先分别对各自语言的KG进行基于语义层次建模的嵌入表示,再通过对齐种子的链接训练得到/>的向量空间转换矩阵,SHACUT的目标是最小化损失函数:
S=SKM+αSTM (13)
其中α是SKM和STM的权重超参数。
在实际应用中,跨语言对等体的查找通常是通过计算潜在对等体之间的距离来评估对齐的置信度,置信度越高就表明搜索到的目标知识单元是源知识单元的对等体的可能性越高,知识单元对的置信度con∈(0,1]:
根据置信度大小,得到新的对齐知识单元,通过新的对齐知识单元可以预测源KG可能存在的潜在关系,实现“实体-关系-实体”、“实体-属性名-属性值”等的链路预测以及知识不完备的图谱补全,从而完成跨语言知识单元迁移。
S106,计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。
在本申请实施例中,在计算时,首先根据模部分和/或相位部分的距离函数计算转换后的知识单元的距离,再根据转换后的知识单元的距离评估置信度,然后根据置信度的大小得到目标对齐知识单元,并根据目标对齐知识单元预测知识图谱的潜在关系,最后基于潜在关系预测知识图谱中的链路,并补全知识图谱中不完备的图谱。
例如图3所示,图3是本申请跨语言知识单元迁移过程的过程示意图,首先通过知识图谱中知识单元的不同语义层次,再将不同语言的知识图谱嵌入各自的向量空间,然后利用种子对齐库,挖掘出跨语言向量空间之间的转换,最后通过计算知识单元距离和置信度,完成链路预测和图谱补全,实现跨语言实体、关系、属性等知识单元。
在本申请实施例中,跨语言知识单元迁移装置首先获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库,然后针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果,再针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果,并将第一建模结果与第二建模结果拼接后,生成拼接结果;根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元,最后计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。由于本申请通过对知识单元的语义层次进行建模,并对不同语言的向量空间进行线性转换,从而可以实现跨语言知识单元的迁移。
请参见图4,为本申请实施例提供了另一种跨语言知识单元迁移方法的流程示意图。如图4所示,本申请实施例的方法可以包括以下步骤:
S201,获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库;
S202,知识单元由模部分和相位部分组成;根据模部分的损失函数将两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到模部分嵌入;
S203,根据相位部分的损失函数将两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到相位部分嵌入;
S204,将模部分嵌入与相位部分嵌入进行拼接,生成不同语言知识图谱各自的知识单元嵌入表示;
S205,将不同语言知识图谱各自的知识单元嵌入表示确定为拼接结果;
S206,根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元;
S207,根据模部分和/或相位部分的距离函数计算转换后的知识单元的距离;
S208,根据转换后的知识单元的距离评估置信度;
S209,根据置信度的大小得到目标对齐知识单元;
S210,根据目标对齐知识单元预测知识图谱的潜在关系;
S211,基于潜在关系预测知识图谱中的链路,并补全知识图谱中不完备的图谱。
在本申请实施例中,跨语言知识单元迁移装置首先获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库,然后针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果,再针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果,并将第一建模结果与第二建模结果拼接后,生成拼接结果;根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元,最后计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。由于本申请通过对知识单元的语义层次进行建模,并对不同语言的向量空间进行线性转换,从而可以实现跨语言知识单元的迁移。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参见图5,其示出了本发明一个示例性实施例提供的跨语言知识单元迁移装置的结构示意图。该跨语言知识单元迁移装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置1包括数据信息获取模块10、第一建模结果生成模块20、第二建模结果生成模块30、建模结果拼接模块40、空间向量转换模块50、知识单元迁移模块60。
数据信息获取模块10,用于获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库;
第一建模结果生成模块20,用于针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果;
第二建模结果生成模块30,用于针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果;
建模结果拼接模块40,用于将第一建模结果与第二建模结果拼接后,生成拼接结果;
空间向量转换模块50,用于根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元;
知识单元迁移模块60,用于计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。
需要说明的是,上述实施例提供的跨语言知识单元迁移装置在执行跨语言知识单元迁移方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的跨语言知识单元迁移装置与跨语言知识单元迁移方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请实施例中,跨语言知识单元迁移装置首先获取待分类的目标图像,然后将目标图像输入预先训练的跨语言知识单元迁移模型中;其中,预先训练的跨语言知识单元迁移模型是基于基础网络与辅助网络训练生成的,辅助网络用来优化基础网络的损失函数,最后输出目标图像对应的多个标签类别。由于本申请通过辅助网络优化基础网络的损失函数以生成新的损失函数,从而实现了模型训练时特征之间的解耦,增大了标签类别之间的差异性,进一步降低了模型的学习难度,使得模型学习到了更多不同的特征,从而提升了模型分类的准确度。
本发明还提供一种计算机可读介质,其上存储有程序指令,该程序指令被处理器执行时实现上述各个方法实施例提供的跨语言知识单元迁移方法。本发明还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个方法实施例的跨语言知识单元迁移方法。
请参见图6,为本申请实施例提供了一种终端的结构示意图。如图6所示,终端1000可以包括:至少一个处理器1001,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。
其中,通信总线1002用于实现这些组件之间的连接通信。
其中,用户接口1003可以包括显示屏(Display)、摄像头(Camera),可选用户接口1003还可以包括标准的有线接口、无线接口。
其中,网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集,以及调用存储在存储器1005内的数据,执行电子设备1000的各种功能和处理数据。可选的,处理器1001可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1001中,单独通过一块芯片进行实现。
其中,存储器1005可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器1005包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图6所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及跨语言知识单元迁移应用程序。
在图6所示的终端1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的跨语言知识单元迁移应用程序,并具体执行以下操作:
获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库;
针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果;
针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果;
将第一建模结果与第二建模结果拼接后,生成拼接结果;
根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元;
计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。
在一个实施例中,处理器1001在执行针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果时,具体执行以下操作:
根据模部分的损失函数将两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到模部分嵌入;
将模部分嵌入确定为第一建模结果。
在一个实施例中,处理器1001在执行针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果时,具体执行以下操作:
根据相位部分的损失函数将两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到相位部分嵌入;
将相位部分嵌入确定为第二建模结果。
在一个实施例中,处理器1001在执行将第一建模结果与第二建模结果拼接后,生成拼接结果时,具体执行以下操作:
将模部分嵌入与相位部分嵌入进行拼接,生成不同语言知识图谱各自的知识单元嵌入表示;
将不同语言知识图谱各自的知识单元嵌入表示确定为拼接结果。
在一个实施例中,处理器1001在执行计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移时,具体执行以下操作:
根据模部分和/或相位部分的距离函数计算转换后的知识单元的距离;
根据转换后的知识单元的距离评估置信度;
根据置信度的大小得到目标对齐知识单元;
根据目标对齐知识单元预测知识图谱的潜在关系;
基于潜在关系预测知识图谱中的链路,并补全知识图谱中不完备的图谱。
在本申请实施例中,跨语言知识单元迁移装置首先获取两种不同语言各自的知识图谱,并获取两种不同语言对应的跨语言知识对齐种子库,然后针对知识图谱中不同语义层次的知识单元建模后得到第一建模结果,再针对知识图谱中同一语义层次的知识单元建模后得到第二建模结果,并将第一建模结果与第二建模结果拼接后,生成拼接结果;根据拼接结果以及跨语言知识对齐种子库,并通过对齐模型的损失函数将知识单元各自的向量空间进行线性转换,生成转换后的知识单元,最后计算转换后的知识单元的距离和置信度进行跨语言知识单元迁移。由于本申请通过对知识单元的语义层次进行建模,并对不同语言的向量空间进行线性转换,从而可以实现跨语言知识单元的迁移。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种跨语言知识单元迁移方法,其特征在于,所述方法包括:
获取两种不同语言各自的知识图谱,并获取所述两种不同语言对应的跨语言知识对齐种子库;
针对所述知识图谱中不同语义层次的知识单元建模后得到第一建模结果;
针对所述知识图谱中同一语义层次的知识单元建模后得到第二建模结果;
将所述第一建模结果与所述第二建模结果拼接后,生成拼接结果;
根据所述拼接结果以及所述跨语言知识对齐种子库,并通过对齐模型的损失函数将所述知识单元各自的向量空间进行线性转换,生成转换后的知识单元;
计算所述转换后的知识单元的距离和置信度进行跨语言知识单元迁移。
2.根据权利要求1所述的方法,其特征在于,所述知识单元由模部分和相位部分组成;
所述针对所述知识图谱中不同语义层次的知识单元建模后得到第一建模结果,包括:
根据所述模部分的损失函数将所述两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到模部分嵌入;
将所述模部分嵌入确定为第一建模结果。
3.根据权利要求2所述的方法,其特征在于,所述针对所述知识图谱中同一语义层次的知识单元建模后得到第二建模结果,包括:
根据所述相位部分的损失函数将所述两种不同语言各自的知识图谱的知识单元嵌入到与其对应的向量空间中,得到相位部分嵌入;
将所述相位部分嵌入确定为第二建模结果。
4.根据权利要求3所述的方法,其特征在于,所述将所述第一建模结果与所述第二建模结果拼接后,生成拼接结果,包括:
将所述模部分嵌入与所述相位部分嵌入进行拼接,生成不同语言知识图谱各自的知识单元嵌入表示;
将所述不同语言知识图谱各自的知识单元嵌入表示确定为拼接结果。
5.根据权利要求2或3所述的方法,其特征在于,
所述模部分和/或相位部分嵌入与其对应的向量空间中是通过知识模型将所述知识单元嵌入到极坐标系中;
其中,所述极坐标系中径向坐标和角坐标分别对应于所述模部分和所述相位部分,所述知识模型将每个所述知识单元e表示为[em;ep],其中em和ep分别由所述模部分和所述相位部分生成,[·;·]表示两个向量的拼接。
6.根据权利要求4所述的方法,其特征在于,所述计算所述转换后的知识单元的距离和置信度进行跨语言知识单元迁移,包括:
根据所述模部分和/或相位部分的距离函数计算所述转换后的知识单元的距离;
根据所述转换后的知识单元的距离评估置信度;
根据所述置信度的大小得到目标对齐知识单元;
根据所述目标对齐知识单元预测所述知识图谱的潜在关系;
基于所述潜在关系预测所述知识图谱中的链路,并补全所述知识图谱中不完备的图谱。
7.根据权利要求6所述的方法,其特征在于,所述转换后的知识单元为所述两种不同语言各自的知识图谱的向量空间转换矩阵。
8.一种跨语言知识单元迁移装置,其特征在于,所述装置包括:
数据信息获取模块,用于获取两种不同语言各自的知识图谱,并获取所述两种不同语言对应的跨语言知识对齐种子库;
第一建模结果生成模块,用于针对所述知识图谱中不同语义层次的知识单元建模后得到第一建模结果;
第二建模结果生成模块,用于针对所述知识图谱中同一语义层次的知识单元建模后得到第二建模结果;
建模结果拼接模块,用于将所述第一建模结果与所述第二建模结果拼接后,生成拼接结果;
空间向量转换模块,用于根据所述拼接结果以及所述跨语言知识对齐种子库,并通过对齐模型的损失函数将所述知识单元各自的向量空间进行线性转换,生成转换后的知识单元;
知识单元迁移模块,用于计算所述转换后的知识单元的距离和置信度进行跨语言知识单元迁移。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1-7任意一项的方法步骤。
10.一种终端,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1-7任意一项的方法步骤。
CN202110693347.9A 2021-06-22 2021-06-22 跨语言知识单元迁移方法、装置、存储介质及终端 Active CN113590578B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110693347.9A CN113590578B (zh) 2021-06-22 2021-06-22 跨语言知识单元迁移方法、装置、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110693347.9A CN113590578B (zh) 2021-06-22 2021-06-22 跨语言知识单元迁移方法、装置、存储介质及终端

Publications (2)

Publication Number Publication Date
CN113590578A CN113590578A (zh) 2021-11-02
CN113590578B true CN113590578B (zh) 2023-12-26

Family

ID=78244243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110693347.9A Active CN113590578B (zh) 2021-06-22 2021-06-22 跨语言知识单元迁移方法、装置、存储介质及终端

Country Status (1)

Country Link
CN (1) CN113590578B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115270826B (zh) * 2022-09-30 2023-01-24 北京澜舟科技有限公司 多语言翻译模型构建方法、翻译方法及计算机存储介质
CN116257643B (zh) * 2023-05-09 2023-08-25 鹏城实验室 跨语言实体对齐方法、装置、设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990579A (zh) * 2019-10-30 2020-04-10 清华大学 跨语言的医学知识图谱构建方法、装置与电子设备
CN112199511A (zh) * 2020-09-28 2021-01-08 西南电子技术研究所(中国电子科技集团公司第十研究所) 跨语言多来源垂直领域知识图谱构建方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3616083A4 (en) * 2017-04-23 2021-01-13 Nuance Communications, Inc. MULTILINGUAL SEMANTIC ANALYZER BASED ON TRANSFERRED LEARNING
US11386276B2 (en) * 2019-05-24 2022-07-12 International Business Machines Corporation Method and system for language and domain acceleration with embedding alignment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990579A (zh) * 2019-10-30 2020-04-10 清华大学 跨语言的医学知识图谱构建方法、装置与电子设备
CN112199511A (zh) * 2020-09-28 2021-01-08 西南电子技术研究所(中国电子科技集团公司第十研究所) 跨语言多来源垂直领域知识图谱构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的领域知识对齐模型研究:知识网络视角;余传明;李浩男;安璐;;情报学报(05);全文 *

Also Published As

Publication number Publication date
CN113590578A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN113590578B (zh) 跨语言知识单元迁移方法、装置、存储介质及终端
CN112445876B (zh) 融合结构、属性和关系信息的实体对齐方法和系统
AU2019226135A1 (en) Natural language processing for language-driven synthesis of 3d scenes
WO2022140900A1 (zh) 个人知识图谱构建方法、装置及相关设备
US20220059186A1 (en) Method and apparatus for detecting molecule binding site, electronic device, and storage medium
CN109712108B (zh) 一种基于多样鉴别性候选框生成网络的针对视觉定位方法
CN110472002A (zh) 一种文本相似度获取方法和装置
CN110874536B (zh) 语料质量评估模型生成方法和双语句对互译质量评估方法
WO2023207059A1 (zh) 一种视觉问答任务处理方法、系统、电子设备及存储介质
CN108665055A (zh) 一种图说生成方法及装置
CN113254716B (zh) 视频片段检索方法、装置、电子设备和可读存储介质
CN111046158A (zh) 问答匹配方法及模型训练方法、装置、设备、存储介质
CN115221846A (zh) 一种数据处理方法及相关设备
CN115455171A (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
CN115221369A (zh) 视觉问答的实现方法和基于视觉问答检验模型的方法
CN114330717A (zh) 数据处理方法以及装置
Zhang et al. Hybrid feature CNN model for point cloud classification and segmentation
US11669541B2 (en) Data interpretation apparatus, method, and program, data integration apparatus, method, and program, and digital city establishing system
US20230117973A1 (en) Data processing method and apparatus
US20230153335A1 (en) Searchable data structure for electronic documents
CN116432611A (zh) 文稿写作辅助方法、系统、终端及存储介质
WO2023173552A1 (zh) 目标检测模型的建立方法、应用方法、设备、装置及介质
CN114021541A (zh) 演示文稿生成方法、装置、设备及存储介质
CN112732423A (zh) 流程迁移方法、装置、设备及介质
CN112989024A (zh) 文本内容的关系提取方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant