CN113569052A - 知识图谱的表示学习方法及装置 - Google Patents

知识图谱的表示学习方法及装置 Download PDF

Info

Publication number
CN113569052A
CN113569052A CN202110182294.4A CN202110182294A CN113569052A CN 113569052 A CN113569052 A CN 113569052A CN 202110182294 A CN202110182294 A CN 202110182294A CN 113569052 A CN113569052 A CN 113569052A
Authority
CN
China
Prior art keywords
target
information attribute
information
under
learned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110182294.4A
Other languages
English (en)
Other versions
CN113569052B (zh
Inventor
张子恒
陈曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110182294.4A priority Critical patent/CN113569052B/zh
Publication of CN113569052A publication Critical patent/CN113569052A/zh
Application granted granted Critical
Publication of CN113569052B publication Critical patent/CN113569052B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了知识图谱的表示学习方法及装置,属于人工智能技术领域。方法包括:获取知识图谱中的各个待学习目标分别对应的初始表示向量,各个待学习目标中包括至少一个第一目标,任一第一目标对应的初始表示向量基于任一第一目标对应的模态信息获取;基于各个待学习目标分别对应的初始表示向量,对各个待学习目标进行表示学习,得到各个待学习目标分别对应的目标表示向量。在此过程中,各个待学习目标中包括至少一个第一目标,第一目标对应的初始表示向量是根据第一目标对应的模态信息获取的,能够较好地表征第一目标,可靠性较高,知识图谱的表示学习的学习效果较好,有利于提高利用学习到的表示向量执行知识图谱下游任务的性能。

Description

知识图谱的表示学习方法及装置
技术领域
本申请实施例涉及人工智能技术领域,特别涉及一种知识图谱的表示学习方法及装置。
背景技术
知识图谱(Knowledge Graph)以结构化的方式描述客观世界中存在的各种实体及它们之间的关系。随着人工智能技术的发展和应用,知识图谱逐渐成为关键技术之一,现已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。为了有效地利用知识图谱中的知识,研究人员提出了知识图谱的表示学习方法。知识图谱的表示学习方法旨在将知识图谱中的实体和关系表示成低维的向量,从而将实体和关系之间的计算转化为向量间的数值计算。
相关技术中,对知识图谱中的各个实体和各个关系进行随机初始化,得到各个实体和各个关系分别对应的初始表示向量,然后在随机初始化的初始表示向量的基础上进行表示学习,得到各个实体和各个关系分别对应的目标表示向量。
在上述过程中,随机初始化的初始表示向量的可靠性较差,依据随机初始化的初始表示向量进行表示学习的学习效果不佳,最终学习到的目标表示向量的准确性较差,利用最终学习到的目标表示向量执行知识图谱下游任务(如,知识预测、知识补全、知识问答)的性能较差。
发明内容
本申请实施例提供了一种知识图谱的表示学习方法及装置,可用于提高表示学习的学习效果,提高最终学习到的目标表示向量的准确性。所述技术方案如下:
一方面,本申请实施例提供了一种知识图谱的表示学习方法,所述方法包括:
获取知识图谱中的各个待学习目标分别对应的初始表示向量,所述各个待学习目标中包括至少一个第一目标,所述至少一个第一目标中的任一第一目标对应的初始表示向量基于所述任一第一目标对应的模态信息获取,所述任一第一目标对应的模态信息包括所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息,任一待学习目标为所述知识图谱中的一个实体或一个关系;
基于所述各个待学习目标分别对应的初始表示向量,对所述各个待学习目标进行表示学习,得到所述各个待学习目标分别对应的目标表示向量。
另一方面,提供了一种知识图谱的表示学习装置,所述装置包括:
获取单元,用于获取知识图谱中的各个待学习目标分别对应的初始表示向量,所述各个待学习目标中包括至少一个第一目标,所述至少一个第一目标中的任一第一目标对应的初始表示向量基于所述任一第一目标对应的模态信息获取,所述任一第一目标对应的模态信息包括所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息,任一待学习目标为所述知识图谱中的一个实体或一个关系;
表示学习单元,用于基于所述各个待学习目标分别对应的初始表示向量,对所述各个待学习目标进行表示学习,得到所述各个待学习目标分别对应的目标表示向量。
在一种可能实现方式中,所述获取单元,还用于基于所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息,获取所述任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,所述任一第一目标具有的各个目标信息属性的集合为所述指定信息属性集中的一个信息属性子集;基于所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述任一第一目标对应的初始表示向量。
在一种可能实现方式中,所述获取单元,还用于响应于所述指定信息属性集中不包括参考信息属性子集,对所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,得到所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的基础特征向量,所述参考信息属性子集由除所述任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成;将所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的基础特征向量作为所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量。
在一种可能实现方式中,所述获取单元,还用于响应于所述指定信息属性集中包括参考信息属性子集,对所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,得到所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的基础特征向量,所述参考信息属性子集由除所述任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成;按照目标方式,获取所述任一第一目标在所述参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量;基于所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的基础特征向量和所述任一第一目标在所述参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量,得到所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量。
在一种可能实现方式中,所述获取单元,还用于对于所述参考信息属性子集中的任一参考信息属性,在所述至少一个第一目标中的除所述任一第一目标外的其他的第一目标中,确定与所述任一参考信息属性匹配的第一目标,所述与所述任一参考信息属性匹配的第一目标为具有的各个目标信息属性中包括所述任一参考信息属性的第一目标;基于所述与所述任一参考信息属性匹配的第一目标在所述任一参考信息属性下对应的基础特征向量,确定统计特征向量,将所述统计特征向量作为所述任一第一目标在所述任一参考信息属性下对应的基础特征向量;其中,所述与所述任一参考信息属性匹配的第一目标在所述任一参考信息属性下对应的基础特征向量通过对所述与所述任一参考信息属性匹配的第一目标在所述任一参考信息属性下对应的信息进行特征提取得到。
在一种可能实现方式中,所述获取单元,还用于对于所述参考信息属性集中的任一参考信息属性,将与所述任一参考信息属性匹配的指定特征向量作为所述任一第一目标在所述任一参考信息属性下对应的基础特征向量。
在一种可能实现方式中,所述获取单元,还用于对所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量进行加噪处理,得到所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的加噪特征向量;对所述任一第一目标在所述指定信息属性集中各个信息属性下分别对应的加噪特征向量进行编码处理,得到所述任一第一目标对应的初始表示向量。
在一种可能实现方式中,所述获取单元,还用于调用目标自编码模型,基于所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述任一第一目标对应的初始表示向量。
在一种可能实现方式中,所述获取单元,还用于调用初始自编码模型,基于样本目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述样本目标对应的初始表示向量;调用所述初始自编码模型对所述样本目标对应的初始表示向量进行解码处理,得到所述样本目标在所述指定信息属性集中的各个信息属性下分别对应的解码特征向量;
所述装置还包括:
训练单元,用于基于所述样本目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量和所述样本目标在所述指定信息属性集中的各个信息属性下分别对应的解码特征向量,对所述初始自编码模型进行训练,得到所述目标自编码模型。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现上述任一所述的知识图谱的表示学习方法。
另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以实现上述任一所述的知识图谱的表示学习方法。
另一方面,还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述任一所述的知识图谱的表示学习方法。
本申请实施例提供的技术方案至少带来如下有益效果:
在本申请实施例中,各个待学习目标分别对应的初始表示向量中包括至少一个第一目标对应的初始表示向量,第一目标对应的初始表示向量是根据第一目标对应的模态信息获取的,第一目标对应的初始表示向量能够从模态信息的角度较好地表征第一目标,可靠性较高。基于此,基于各个待学习目标分别对应的初始表示向量对各个待学习目标进行表示学习的学习效果较好,最终学习到的各个待学习目标分别对应的目标表示向量的准确性较高,有利于提高利用最终学习到的目标表示向量执行知识图谱下游任务的性能。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种知识图谱的表示学习方法的实施环境的示意图;
图2是本申请实施例提供的一种知识图谱的表示学习方法的流程图;
图3是本申请实施例提供的一种获取任一第一目标对应的初始表示向量的过程的流程图;
图4是本申请实施例提供的一种训练得到目标自编码模型的过程的流程图;
图5是本申请实施例提供的一种基于随机初始化的初始表示向量进行表示学习可能出现的问题的示意图;
图6是本申请实施例提供的一种基于模态信息的知识图谱的表示学习过程的示意图;
图7是本申请实施例提供的一种知识图谱的表示学习装置的示意图;
图8是本申请实施例提供的一种知识图谱的表示学习装置的示意图;
图9是本申请实施例提供的一种终端的结构示意图;
图10是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
为了便于理解本申请实施例的技术过程,下面对本申请实施例所涉及的一些名词进行解释。
信息属性:每一种信息的来源或者形式,都可以称为一种信息属性。例如,信息的形式有语音、图片、文字等;信息的来源有多种多样的传感器,如雷达、红外、加速度计等。以上的每一种都可以称为一种信息属性。信息属性还可以称为模态。
多信息属性机器学习:旨在通过机器学习的方法实现处理和理解多信息属性的信息的能力。目前比较热门的研究方向是图像、视频、音频、语义之间的多信息属性机器学习。
知识图谱(Knowledge Graph):是一种揭示实体之间关系的语义网络,也是一种基于图的数据结构。在知识图谱中采用三元组表示实体与实体的关系,三元组可以表示为<头实体,关系,尾实体>。
知识图谱的表示学习:旨在将知识图谱嵌入到低维向量空间中,将实体和关系都表示为低维的向量。通过知识图谱的表示学习可以有效解决知识图谱数据量大而导致的计算复杂度高的问题。
示例性地,本申请实施例提供的知识图谱的表示学习方法能够应用于人工智能技术领域,为人工智能技术领域提供先验知识。接下来对人工智能技术进行介绍。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
其中,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如,常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供了一种知识图谱的表示学习方法的实施环境,请参考图1,其示出了本申请实施例提供的知识图谱的表示学习方法的实施环境的示意图。该实施环境包括:终端11和服务器12。
本申请实施例提供的知识图谱的表示学习方法可以由终端11执行,也可以由服务器12执行,还可以由终端11和服务器12共同执行,本申请实施例对此不加以限定。
在示例性实施例中,对于本申请实施例提供的知识图谱的表示学习方法由终端11执行的情况,终端11在学习到知识图谱中的各个待学习目标分别对应的目标表示向量后,能够将各个待学习目标分别对应的目标表示向量发送至服务器12,服务器12能够存储或应用各个待学习目标分别对应的目标表示向量。在示例性实施例中,对于本申请实施例提供的知识图谱的表示学习方法由服务器12执行的情况,服务器12在学习到知识图谱中的各个待学习目标分别对应的目标表示向量后,能够将各个待学习目标分别对应的目标表示向量发送至终端11,终端11能够存储或应用各个待学习目标分别对应的目标表示向量。
在示例性实施例中,对于本申请实施例提供的知识图谱的表示学习方法由终端11和服务器12共同执行的情况,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12承担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。
在一种可能实现方式中,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如个人计算机(Personal Computer,PC)、手机、智能手机、个人数字助手(Personal DigitalAssistant,PDA)、可穿戴设备、掌上电脑(Pocket PC,PPC)、平板电脑、智能车机、智能电视、智能音箱等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
基于上述图1所示的实施环境,本申请实施例提供一种知识图谱的表示学习方法,以该方法应用于终端11为例。如图2所示,本申请实施例提供的方法包括如下步骤201和步骤202:
在步骤201中,获取知识图谱中的各个待学习目标分别对应的初始表示向量,各个待学习目标中包括至少一个第一目标,至少一个第一目标中的任一第一目标对应的初始表示向量基于任一第一目标对应的模态信息获取,任一第一目标对应的模态信息包括任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息。
其中,任一待学习目标为知识图谱中的一个实体或一个关系。
本申请实施例中的知识图谱是指需要进行表示学习,以学习到各个实体以及各个关系分别对应的目标表示向量的任一知识图谱。本申请实施例对知识图谱的构建方式以及应用领域不加以限定。示例性地,知识图谱由专业人员构建得到,知识图谱的应用领域为医学领域、游戏领域等。在不同应用领域中,知识图谱中所涉及到的实体以及关系也会有所不同。
示例性地,在游戏领域中,知识图谱能够刻画游戏中的实体(如,虚拟形象、道具等)之间丰富的语义关联,从而使得知识图谱可以作为游戏各种应用场景的辅助信息源,例如,可以基于游戏领域的知识图谱进行游戏、道具等的推荐。示例性地,在医学领域,知识图谱能够刻画医学中的实体(如,药物、医生等)之间的丰富的语义关联,从而使得知识图谱可以作为医学各种应用场景的辅助信息源,例如,可以基于医学领域的知识图谱实现医学知识问答、医学关系抽取等下游任务。
知识图谱可以为很多人工智能应用提供先验知识,帮助提升AI模型的性能,例如,基于知识图谱的医疗问答系统的性能往往要好于基于预设模版的医疗问答系统。知识图谱的表示学习则可以很好地帮助下游任务利用这些先验知识,用等维度向量表征的实体和关系可以通过向量空间来表达语义信息。目前,很多自研的知识图谱规模越来越大,并且知识图谱中包含的信息的信息属性(也称为模态)也更加丰富,例如,知识图谱中包含某些药物或医生的图像,将这些图像信息/视觉信息应用到表示学习中可以让实体/关系向量的表达性越强,给下游任务带来的提升也就越高。此外,对于知识图谱本身,有效的表示学习还可以帮助识别发现知识图谱中缺失的实体和关系,进一步起到知识挖掘的作用。
知识图谱的基本构成单元为三元组,每个三元组均由头实体、尾实体以及二者之间的关系构成。每个三元组中的头实体和尾实体均可称为实体。因此,知识图谱中具有多个实体和多个关系。知识图谱的表示学习的目的为获取知识图谱中的各个实体以及各个关系分别对应的目标表示向量,目标表示向量是指学习好地用于对知识图谱中的实体和关系进行表征的表示向量。通常情况下,目标表示向量是指低维的表示向量。
在本申请实施例中,将知识图谱中的每个实体和每个关系均称为一个待学习目标,也就是说,任一待学习目标为知识图谱中的一个实体或一个关系。基于此,获取知识图谱中的各个实体以及各个关系分别对应的目标表示向量的过程即为获取知识图谱中的各个待学习目标分别对应的目标表示向量的过程。
知识图谱中的各个待学习目标中包括至少一个第一目标。至少一个第一目标为知识图谱中的各个待学习目标中满足参考条件的待学习目标。示例性地,知识图谱中的各个待学习目标可能均满足参考条件,也就是说,每个待学习目标均为一个第一目标,此种情况下,第一目标的数量与待学习目标的数量相同。示例性地,知识图谱中的各个待学习目标还可能部分满足参考条件,也就是说,各个待学习目标中存在至少一个第二目标不满足参考条件,此种情况下,至少一个第一目标是指部分的待学习目标,至少一个第一目标和至少一个第二目标合起来构成各个待学习目标。各个待学习目标均满足参考条件还是部分满足参考条件,这与知识图谱的实际情况以及参考条件的设置有关,本申请实施例对此不加以限定。
在一种可能实现方式中,满足参考条件的待学习目标是指具有的各个信息属性中至少存在一个信息属性处于指定信息属性集中的待学习目标。指定信息属性集是为对知识图谱进行准确地表示学习而预先设定的信息属性集。对于知识图谱中的不同的待学习目标而言,指定信息属性集均相同。需要说明的是,不同的知识图谱可能相同的指定信息属性集,也可能对应不同的指定信息属性集,本申请实施例对此不加以限定。
示例性地,某一待学习目标具有某一信息属性是指该待学习目标具有在该信息属性下对应的信息。例如,实体A具有图像这一信息属性是指实体A具有在图像这一信息属性下的信息(即具有图像信息)。信息属性是指信息的形式或来源,每种信息属性均代表一种信息的形式或者一种信息的来源。示例性地,任一实体或任一关系可能具有的信息属性包括但不限于图像、文本描述、数值化属性、时序属性、音频、视频等。示例性地,信息属性还可以称为模态。
若某一待学习目标具有的各个信息属性中至少存在一个信息属性处于指定信息属性集中,则将该待学习目标作为一个第一目标。本申请实施例中,知识图谱中的各个待学习目标中包括至少一个第一目标。至少第一目标中的任一第一目标对应的初始表示向量基于该任一第一目标对应的模态信息获取。
任一第一目标对应的模态信息包括任一第一目标在该任一第一目标具有的各个目标信息属性下分别对应的信息。在示例性实施例中,任一第一目标具有的各个目标信息属性是指该任一第一目标具有的全部信息属性中处于指定信息属性集中的各个信息属性。根据任一第一目标在该任一第一目标具有的各个目标信息属性下分别对应的信息,即可得到该任一第一目标对应的模态信息。
示例性地,由于任一第一目标具有的各个目标属性是指该任一第一目标具有的全部信息属性中处于指定信息属性集中的各个信息属性,所以任一第一目标具有的各个目标属性均处于指定信息属性集中,也即任一第一目标具有的各个目标属性的集合为指定信息属性集中的一个信息属性子集。
需要说明的是,每个第一目标均具有至少一个目标信息属性,不同的第一目标具有的目标信息属性可能部分或完全相同,也可能完全不同,本申请实施例对此不加以限定。每个第一目标具有的各个目标信息属性的集合均为指定信息属性集中的一个信息属性子集。
本申请实施例对指定信息属性集中的信息属性的数量不加以限定。指定信息属性集中的任意数量的信息属性均可以构成指定信息属性集中的一个信息属性子集。不同的第一目标具有的各个目标信息属性的集合可能为指定信息属性集中的不同信息属性子集。例如,指定信息属性集中包括三个信息属性,分别为图像、文本描述和视频;第一目标A具有两个目标信息属性,分别为图像和视频;第一目标B具有两个目标信息属性,分别为图像和文本描述。第一目标A具有的两个目标信息属性的集合为指定信息属性集中的{图像,视频}这个信息属性子集;第一目标B具有的两个目标信息属性的集合为指定信息属性集中的{图像、文本描述}这一信息属性子集。
各个待学习目标中包括至少一个第一目标,获取知识图谱中的各个待学习目标分别对应的初始表示向量的过程中,需要获取至少一个第一目标对应的初始表示向量。接下来,以至少一个第一目标中的任一第一目标为例,介绍获取任一第一目标对应的初始表示向量的过程。
在一种可能实现方式中,参见图3,获取任一第一目标对应的初始表示向量的过程包括以下步骤301和步骤302:
步骤301:基于任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息,获取任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,任一第一目标具有的各个目标信息属性的集合为指定信息属性集中的一个信息属性子集。
任一第一目标对应的初始表示向量基于该任一第一目标对应的模态信息获取,任一第一目标对应的模态信息包括该任一第一目标在该任一第一目标具有的各个目标信息属性下分别对应的信息。根据任一第一目标对应的模态信息,即可得知该任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息。
获取任一第一目标对应的初始表示向量需要依据该任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,所以,在基于任一第一目标对应的模态信息,获取任一第一目标对应的初始表示向量的过程中,需要根据任一第一目标在任一第一目标具有的各个目标属性下分别对应的信息,获取任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量。
任一第一目标具有的各个目标信息属性与指定信息集的关系为:任一第一目标具有的各个目标信息属性的集合为指定信息属性集中的一个信息属性子集。也就是说,指定信息属性集中包括一个信息属性子集与任一第一目标具有的各个目标属性的集合相同。在示例性实施例中,在获取任一第一目标对应的初始表示向量的过程中,将由除任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成的集合称为参考信息属性子集。需要说明的是,参考信息属性子集中的参考信息属性的数量可能为一个或多个,本申请实施例对此不加以限定。参考信息属性子集中的每个参考信息属性均为除任一第一目标具有的各个目标信息属性外的其他的信息属性。
示例性地,指定信息属性集中可能包括参考信息属性子集,也可能不包括参考信息属性子集,在指定信息属性集的不同情况下,基于任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息,获取任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量的实现过程也有所不同。
示例性地,对于指定信息属性集中不包括参考信息属性子集的情况,基于任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息,获取任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量的实现过程包括以下步骤1和步骤2:
步骤1:对任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,得到任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量,参考信息属性子集由除任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成。
通过对任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,能够得到该任一第一目标在该任一第一目标具有的各个目标信息属性下分别对应的基础特征向量。通过特征提取得到的基础特征向量用于表征基础的特征。
在一种可能实现方式中,对任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取的过程通过调用特征提取模型实现。对任一第一目标在不同目标信息属性下对应的信息进行特征提取调用的特征提取模型可以相同,也可以不同,本申请实施例对此不加以限定。示例性地,假设对于任一第一目标而言,目标信息属性为图像和文本描述,则调用图像特征提取模型对该任一第一目标对应的图像信息(即该任一第一目标在图像这一目标信息属性下对应的信息)进行特征提取,调用文本特征提取模型对该任一第一目标对应的文本描述信息(即该任一第一目标在文本描述这一目标信息属性下对应的信息)进行特征提取。
本申请实施例对特征提取模型的模型结构不加以限定,示例性地,图像特征提取模型为图像分类模型(如,残差网络152(Residual Network 152,ResNet 152))中用于对图像信息进行特征提取的部分模型;文本特征提取模型为文本分类模型(如,text2vec(自然语言处理模型))中用于对文本描述信息进行特征提取的部分模型。
步骤2:将任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量作为任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量。
当指定信息属性集中不包括参考信息属性子集时,说明指定信息属性集中仅包括与该任一第一目标具有的各个目标信息属性的集合相同的一个信息属性子集,此种情况下,在获取任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量后,能够直接将该任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量作为该任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量。
示例性地,对于指定信息属性集中包括参考信息属性子集的情况,基于任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息,获取任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量的实现过程包括以下步骤a至步骤c:
步骤a:对任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,得到任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量,参考信息属性子集由除任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成。
该步骤a的实现方式参见上述步骤1,此处不再赘述。
步骤b:按照目标方式,获取任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量。
由于指定信息属性集中包括参考信息属性子集,所以,还需要获取任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量。
获取任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量的过程可视为补全任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量的过程。目标方式用于指示任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量的获取方式,目标方式可以根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定。
以参考信息属性子集中的各个参考信息属性中的任一参考信息属性为例进行说明,在一种可能实现方式中,获取任一第一目标在任一参考信息属性下对应的基础特征向量的方式包括但不限于以下两种:
方式a:将与任一参考信息属性匹配的指定特征向量作为任一第一目标在任一参考信息属性下对应的基础特征向量。
与任一参考信息属性匹配的指定特征向量根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定,示例性地,与任一参考信息属性匹配的指定特征向量为零向量,此时,任一第一目标在任一参考信息属性下对应的基础特征向量为零向量。此种方式在多信息属性机器学习中较为常用,可以作为缺失信息属性数据的补充算法。
需要说明的是,与不同参考信息属性匹配的指定特征向量可以相同,也可以不同,本申请实施例对此不加以限定。示例性地,与各个参考信息属性匹配的指定特征向量均为零向量。
方式b:在至少一个第一目标中的除任一第一目标外的其他的第一目标中,确定与任一参考信息属性匹配的第一目标,与任一参考信息属性匹配的第一目标为具有的各个目标信息属性中包括任一参考信息属性的第一目标;基于与任一参考信息属性匹配的第一目标在任一参考信息属性下对应的基础特征向量,确定统计特征向量,将统计特征向量作为任一第一目标在任一参考信息属性下对应的基础特征向量。
其中,与任一参考信息属性匹配的第一目标在任一参考信息属性下对应的基础特征向量通过对与任一参考信息属性匹配的第一目标在任一参考信息属性下对应的信息进行特征提取得到。
与任一参考信息属性匹配的第一目标为具有的各个目标信息属性中包括该任一参考信息属性的第一目标。通过判断至少一个第一目标中的除任一第一目标外的其他的第一目标中,某一第一目标具有的各个目标信息属性中是否包括该任一参考信息属性,即可确定该第一目标是否为一个与任一参考信息属性匹配的第一目标。与任一参考信息属性匹配的第一目标的数量为一个或多个,本申请实施例对此不加以限定。
需要说明的是,由于参考信息属性子集中的每个参考信息属性均为除任一第一目标具有的各个目标信息属性外的信息属性,所以该任一第一目标具有的各个目标属性中不包括该任一参考信息属性,也就是说,与任一参考信息属性匹配的第一目标是从至少一个第一目标中的除该任一第一目标外的其他的第一目标中确定的。例如,假设当前待获取初始表示向量的任一第一目标为第一目标A,知识图谱中的各个待学习目标中包括三个第一目标,分别为第一目标A、第一目标B和第一目标C,则在第一目标B和第二目标C中,确定与任一参考信息属性匹配的第一目标。与任一参考信息属性匹配的第一目标包括第一目标B和第一目标C中的至少一个。
本申请实施例以存在与任一参考信息属性匹配的第一目标为例进行说明,若不存在与任一参考信息属性匹配的第一目标,则可以根据方式a,获取该任一第一目标在该任一参考信息属性下对应的基础特征向量。
需要进一步说明的是,与任一参考信息属性匹配的第一目标根据第一目标具有的各个目标信息属性以及任一参考信息属性的实际情况有关,与不同的参考信息属性匹配的第一目标可能相同,也可能不同。
在确定出与任一参考信息属性匹配的第一目标后,基于与任一参考信息属性匹配的第一目标在该任一参考信息属性下对应的基础特征向量,确定统计特征向量,进而通过将统计特征向量作为任一第一目标在任一参考信息属性下对应的基础特征向量,得到任一第一目标在任一参考信息属性下对应的基础特征向量。
由于与任一参考信息属性匹配的第一目标具有的各个目标信息属性中包括该任一参考信息属性,所以与任一参考信息属性匹配的第一目标具有在任一参考信息属性下对应的信息,进而能够通过对与任一参考信息属性匹配的第一目标在任一参考信息属性下对应的信息进行特征提取得到与任一参考信息属性匹配的第一目标在任一参考信息属性下对应的基础特征向量。
在示例性实施例中,基于与任一参考信息属性匹配的第一目标在该任一参考信息属性下对应的基础特征向量,确定统计特征向量的方式为:对与任一参考信息属性匹配的第一目标在该任一参考信息属性下对应的基础特征向量进行降维处理,得到至少一个降维向量;统计各个降维向量中的众数向量或者中位数向量;将众数向量或者中位数向量对应的基础特征向量作为统计特征向量。示例性地,对基础特征向量进行降维处理的方式为主成分分析(Principal Component Analysis,PCA)降维。此种方式下,统计特征向量是指结合统计信息确定出的,利用统计特征向量补充该任一参考信息属性下的数据的可靠性较高。
在另一种示例性实施例中,基于与任一参考信息属性匹配的第一目标在该任一参考信息属性下对应的基础特征向量,确定统计特征向量的方式为:计算与任一参考信息属性匹配的第一目标在该任一参考信息属性下对应的基础特征向量的平均向量,将平均向量作为统计特征向量。
需要说明的是,以上方式a和方式b仅以任一参考信息属性为例进行说明,对于各个参考信息属性均可以按照上述方式进行处理,从而获取任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量。示例性地,获取任一第一目标在不同参考信息属性下对应的基础特征向量所利用的方式可以相同,也可以不同,本申请实施例对此不加以限定。
需要进一步说明的是,以上方式a和方式b仅为示例性举例,本申请实施例并不局限于此,还可以根据其他方式获取第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量。
步骤c:基于任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量和任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量,得到任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量。
指定信息属性集除包括与任一第一目标具有的各个目标信息属性的集合相同的一个信息属性子集外,还包括参考信息属性子集。在得到任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量和任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量后,即可得到任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量。
步骤302:基于任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取任一第一目标对应的初始表示向量。
无论指定信息属性集是否包括参考信息属性子集,均能够获取任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,然后在任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取任一第一目标对应的初始表示向量。任一第一目标对应的初始表示向量是在考虑任一第一目标对应的模态信息的基础上得到的初始的向量,任一第一目标对应的初始表示向量能够对任一第一目标进行较好的初始表征。
在示例性实施例中,基于任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取任一第一目标对应的初始表示向量的方式包括不限于以下两种:
方式一:直接对任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量进行编码处理,得到任一第一目标对应的初始表示向量。
在此种方式一下,获取任一第一目标对应的初始表示向量的效率较高。
指定信息属性集中的信息属性的数量为一个或多个。在一种可能实现方式中,对于指定信息属性集中的信息属性的数量为一个的情况,对任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量进行编码处理,得到任一第一目标对应的初始表示向量的过程为:直接将该任一第一目标在指定信息属性集中的一个信息属性下对应的一个基础特征向量编码成指定维数的向量,将该指定维数的向量作为该任一第一目标对应的初始表示向量。
指定维数用于对任一第一目标对应的初始表示向量的维数进行限定,指定维数根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定。
在一种可能实现方式中,对于指定信息属性集中的信息属性的数量为多个的情况,对任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量进行编码处理,得到任一第一目标对应的初始表示向量的过程为:对任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量进行级联,得到级联向量;将级联向量编码成指定维数的向量,将该指定维数的向量作为该任一第一目标对应的初始表示向量。此种方式下的编码处理可视为一种联合编码处理。
方式二:对任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量进行加噪处理,得到任一第一目标在指定信息属性集中的各个信息属性下分别对应的加噪特征向量;对任一第一目标在指定信息属性集中各个信息属性下分别对应的加噪特征向量进行编码处理,得到任一第一目标对应的初始表示向量。
在此种方式二下,用于进行编码处理的是任一第一目标在指定信息属性集中各个信息属性下分别对应的加噪特征向量,根据此种方式下二获取的初始表示向量的可靠性较高。
本申请实施例对加噪处理的方式不加以限定,示例性地,加噪处理的方式包括随机调换和随机归零中的至少一种。其中,随机调换是指将任一第一目标在指定信息属性集中的任一信息属性下对应的基础特征向量中任意两个位置的数值进行调换,对于加噪处理的方式包括随机调换的情况,随机调换的操作可以执行一次或多次,本申请实施例对此不加以限定。随机归零是指将任一第一目标在指定信息属性集中的任一信息属性下对应的基础特征向量中任意位置的数值进行归零,对于加噪处理的方式包括随机归零的情况,随机归零的操作可以执行一次或多次,本申请实施例对此不加以限定。
对任一第一目标在指定信息属性集中各个信息属性下分别对应的加噪特征向量进行编码处理的实现方式参见方式一下对任一第一目标在指定信息属性集中各个信息属性下分别对应的基础特征向量进行编码处理的实现方式,此处不再赘述。
在一种可能实现方式中,基于任一第一目标在指定信息属性集中各个信息属性下分别对应的基础特征向量,获取任一第一目标对应的初始表示向量的过程通过调用目标自编码模型实现,上述方式一和方式二的处理过程均通过调用目标自编码模型实现。
目标自编码模型是指训练好的自编码模型,自编码模型是一套具有自动编码功能的神经网络模型,该模型可以将输入的向量经过非线性映射编码到低维空间(编码部分),之后再将低维向量通过非线性映射还原到原始输入(解码部分)。自编码模型中的非线性映射利用非线性变换单元执行,利用非线性变换单元能够学习到更加精炼的低维表达,对于输入的表达能力更强。
在调用目标自编码模型,基于任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取任一第一目标对应的初始表示向量之前,需要先训练得到目标自编码模型。在一种可能实现方式中,参见图4,训练得到目标自编码模型的过程包括以下步骤401至步骤403:
步骤401:调用初始自编码模型,基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取样本目标对应的初始表示向量。
初始自编码模型是指待训练的自编码模型。样本目标是指用于对初始自编码模型进行训练的目标,示例性地,样本目标是指样本实体以及样本关系中的至少一种,以保证训练得到的目标自编码模型在知识图谱的表示学习中的处理效果。
样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量的获取方式参见获取任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量的方式,此处不再赘述。需要说明的是,样本目标在样本目标具有的各个样本信息属性下分别对应的基础特征向量通过调用特征提取模型对样本目标在样本目标具有的各个样本信息属性下分别对应的信息进行特征提取得到的情况,特征提取模型的模型参数可以是固定的,不在训练得到目标自编码模型的过程中进行更新,也可以在训练得到目标自编码模型的过程中进行微调,本申请实施例对此不加以限定。
调用初始自编码模型,基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取样本目标对应的初始表示向量的实现过程参见基于任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取任一第一目标对应的初始表示向量的两种实现方式,此处不再赘述。
步骤402:调用初始自编码模型对样本目标对应的初始表示向量进行解码处理,得到样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量。
自编码模型除了能够基于输入的向量得到编码向量外,还能够对编码向量进行解码处理,解码处理的过程是指对输入的向量进行还原的过程。输入的向量对应哪几个信息属性,解码后输出的向量就对应哪几个信息属性。本申请实施例中,调用初始自编码模型对样本目标对应的初始表示向量进行解码处理,能够得到样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量。
步骤403:基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量和样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量,对初始自编码模型进行训练,得到目标自编码模型。
样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量是输入的向量,样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量是输出的向量,基于二者之间的差异,能够对初始自编码模型进行训练。
在一种可能实现方式中,基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量和样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量,对初始自编码模型进行训练的过程为:基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量和样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量,获取损失函数;利用损失函数更新初始自编码模型的参数。示例性地,初始自编码模型的参数包括编码部分的参数和解码部分的参数。其中,编码部分用于基于输入的向量,获取初始表示向量;解码部分用于对初始表示向量进行解码处理。
示例性地,基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量和样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量,对初始自编码模型进行训练的具体过程与指定信息属性集中的信息属性的数量以及初始自编码模型的编码部分的处理过程、解码部分的处理过程有关。
示例性地,指定信息属性集中的信息属性的数量为一个,初始自编码模型的编码部分的处理过程为直接将样本目标在指定信息属性集中的一个信息属性下对应的一个基础特征向量编码成指定维数的向量;初始自编码模型的解码部分的处理过程为:对样本目标对应的初始表示向量进行解码处理,得到样本目标在指定信息属性集中的一个信息属性下对应的一个解码特征向量。此种情况下,基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量和样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量,对初始自编码模型进行训练的过程利用公式1实现:
enc,dec=arg min L(X,dec(enc(X))) (公式1)
其中,enc表示初始自编码模型中的编码部分的参数;dec表示初始自编码模型中的解码部分的参数;X表示样本目标在指定信息属性集中的一个信息属性下对应的一个基础特征向量;enc(X)表示样本目标对应的初始表示向量;dec(enc(X))表示样本目标在指定信息属性集中的一个信息属性下对应的一个解码特征向量;L(X,dex(enc(X)))表示X和dec(enc(X))之间的损失函数,示例性地,X和dec(enc(X))之间的损失函数是指X和dec(enc(X))之间的均方误差(Mean Square Error,MSE)损失函数。
示例性地,指定信息属性集中的信息属性的数量为一个,初始自编码模型的编码部分的处理过程为先对样本目标在指定信息属性集中的一个信息属性下对应的一个基础特征向量进行加噪处理,得到一个加噪特征向量,然后再将一个加噪特征向量编码成指定维数的向量;初始自编码模型的解码部分的处理过程为:对样本目标对应的初始表示向量进行解码,得到样本目标在指定信息属性集中的一个信息属性下对应的一个解码特征向量。此种情况下,基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量和样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量,对初始自编码模型进行训练的过程利用公式2实现:
enc,dec=arg min L(X,dec(enc(X′))) (公式2)
其中,X′表示对基础特征向量X进行加噪处理后得到的加噪特征向量,enc(X′)表示样本目标对应的初始表示向量;dec(enc(X′)表示样本目标在指定信息属性集中的一个信息属性下对应的一个解码特征向量;L(X,dec(enc(X′)))表示X和dec(enc(X′))之间的损失函数;其余参数的含义参见对公式1的介绍,此处不再赘述。此种情况下的初始自编码模型是一种去噪自编码模型,其本质就是在原输入向量中增加噪声,并约束模型将含有噪音的输入向量还原成纯净向量(不含噪声)。
示例性地,指定信息属性集中的信息属性的数量为多个,初始自编码模型的编码部分的处理过程为先对样本目标在指定信息属性集中的多个信息属性下对应的多个基础特征向量进行加噪处理,得到多个加噪特征向量,然后再对多个加噪特征向量进行级联,得到级联向量,将级联向量编码成指定维数的向量;初始自编码模型的解码部分的处理过程为:对样本目标对应的初始表示向量进行解码,得到样本目标在指定信息属性集中的多个信息属性下对应的多个解码特征向量。此种情况下,基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量和样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量,对初始自编码模型进行训练的过程利用公式3实现:
enc,dec=arg min∑i∈(1,n)L(Xi,deci(enc(∑j∈(1,n)X′j))) (公式3)
其中,i,j分别表示从指定信息属性集中的第1到第n(n为不小于1的整数)个信息属性中的第i个信息属性和第j个信息属性;Xi表示样本目标在指定信息属性集中的第i个信息属性下的基础特征向量;X′j表示样本目标在指定信息属性集中的第j个信息属性下的加噪特征向量;∑j∈(1,n)X′j表示样本目标在指定信息属性集中的各个信息属性下分别对应的加噪特征向量之间的级联向量;enc(∑j∈(1,n)X′j)表示对级联向量进行编码后得到的样本目标对应的初始表示向量;deci(enc(∑j∈(1,n)X′j))表示对初始表示向量进行解码后得到的样本目标在指定信息属性集中的第i个信息属性下对应的解码特征向量;L(Xi,deci(enc(∑j∈(1,n)X′j)))表示Xi和deci(enc(∑j∈(1,n)X′j))之间的损失函数。
根据公式3可以得知自编码模型中的编码部分将在指定信息属性集中的所有信息属性下分别对应的加噪特征向量编码为一个初始表示向量,而解码部分将这个初始表示向量重构为在指定信息属性集中的各个信息属性下分别对应的解码特征向量。用于对自编码模型进行参数更新的损失函数是在指定信息属性集中的多个信息属性下分别确定的损失函数之和。示例性地,在训练阶段中,一组同批次的数据的输入向量对应的信息属性是一致的,以保证自编码模型的训练准确性。
先利用信息属性数据补充方式,得到在指定信息属性集中的各个信息属性下分别对应的基础特征向量,然后利用添加噪音的方式(对每个信息属性独立添加)得到在指定信息属性集中的各个信息属性下分别对应的加噪特征向量,之后利用在加噪特征向量的基础上得到的解码特征向量和未加噪的基础特征向量之间的损失函数对自编码模型的参数进行更新,得到最优的enc,dec,也即得到最优的编码部分的参数以及解码部分的参数。
对于基于公式3实现训练过程的情况,在去噪自编码模型的基础上,引入了多信息属性的信息的编码。自编码模型具有编码并重构多信息属性的信息的能力。具体来说,将在多个信息属性下的加噪特征向量级联后输入自编码模型进行联合编码,然后再将编码得到的多模态表征(即初始表示向量)分别解码为在原始的指定信息属性集中的各个信息属性下的解码特征向量。
在示例性实施例中,目标自编码模型是对初始自编码模型的参数更新一次获多次得到的,不同次更新过程中,利用的样本目标可能相同,也可能不同,本申请实施例对此不加以限定。在训练过程满足训练终止条件时,得到目标自编码模型。示例性地,训练过程满足训练终止条件包括但不限于以下任一种:自编码模型的参数的更新次数达到次数阈值;损失函数收敛;损失函数小于损失阈值。
需要说明的是,以上所述仅以至少一个第一目标中的任一第一目标为例,介绍了基于该任一第一目标对应的模态信息,获取该任一第一目标对应的初始表示向量的过程。对于至少一个第一目标中的各个第一目标,均能够根据上述方式,基于各个第一目标分别对应的模态信息,获取各个第一目标分别对应的初始表示向量。
知识图谱中的各个待学习目标中可能仅包括至少一个第一目标,也可能除包括至少一个第一目标外,还包括至少一个第二目标。对于知识图谱中的各个待学习目标中仅包括至少一个第一目标的情况,在根据上述内容介绍的方式获取到至少一个第一目标对应的初始表示向量后,即可得到知识图谱中的各个待学习目标分别对应的初始表示向量,进而执行步骤202。
对于知识图谱中的各个待学习目标中除包括至少一个第一目标外,还包括至少一个第二目标的情况,除了根据上述内容介绍的方式获取至少一个第一目标对应的初始表示向量外,还需要获取至少一个第二目标对应的初始表示向量,进而根据至少一个第一目标对应的初始表示向量和至少一个第二目标对应的初始表示向量,得到知识图谱中的各个待学习目标分别对应的初始表示向量并执行步骤202。
至少一个第二目标是指各个待学习目标中不满足参考条件的待学习目标,本申请实施例对获取至少一个第二目标对应的初始表示向量的方式不加以限定。示例性地,获取至少一个第二目标对应的初始表示向量的方式为:随机初始化至少一个第二目标对应的初始表示向量。本申请实施例对随机初始化至少一个第二目标对应的初始表示向量的具体实现方式不加以限定。示例性地,随机初始化的过程依据的是至少一个第二目标自身,如,某一第二目标为实体“中国”,则随机初始化该第二目标对应的初始表示向量的过程中依据的是“中国”这两个文字。
在步骤202中,基于各个待学习目标分别对应的初始表示向量,对各个待学习目标进行表示学习,得到各个待学习目标分别对应的目标表示向量。
在得到各个待学习目标分别对应的初始表示向量后,需要基于各个待学习目标分别对应的初始表示向量,对各个待学习目标进行表示学习。通过对知识图谱中的各个待学习目标进行表示学习,能够获取到知识图谱中的各个实体以及各个关系分别对应的目标表示向量。目标表示向量即为在知识图谱中的三元组的约束下最终学习到的表示向量。
在一种可能实现方式中,基于各个待学习目标分别对应的初始表示向量,对各个待学习目标进行表示学习,得到各个待学习目标分别对应的目标表示向量的过程为:调用知识图谱表示学习模型,基于各个待学习目标分别对应的初始表示向量,对各个待学习目标进行表示学习,得到各个待学习目标分别对应的目标表示向量。
知识图谱表示学习模型用于根据各个待学习目标分别对应的初始表示向量,在知识图谱中的三元组的约束下,学习各个待学习目标分别对应的目标表示向量。
本申请实施例对知识图谱表示学习模型的类型不加以限定,示例性地,知识图谱表示学习模型的类型包括但不限于TransX(翻译)系列模型、bilinear(双线性)系列模型、图神经网络模型和图卷积神经网络模型等。其中,TransX(翻译)系列模型包括TransE模型、TransH模型、TransR模型和TransD模型等。bilinear系列模型包括RESCAL模型(一种双线性模型)、DistMult模型(一种双线性模型)、全息嵌入(Holographic Embeddings,HolE)模型和复杂嵌入(Complex Embeddings,ComplEx)模型等。本申请实施例基于模态信息获取第一目标的初始表示向量的过程与知识图谱表示学习模型并不耦合,能够兼容多个知识图谱表示学习模型。
相关技术在利用知识图谱表示学习模型进行表示学习的过程中,大多是随机初始化实体向量以及关系向量,虽然模型在训练阶段可以自己学习到不错的实体向量和关系向量,但是会加大模型训练的难度,并且会放大模型训练到全局次优的概率。本申请实施例中,各个待学习目标分别对应的初始表示向量中包括至少一个第一目标的初始表示向量是通过考虑模态信息得到的,比随机初始化的向量更有意义,有利于提高表示学习的效果。
以TransE模型为例进行简单介绍。对于知识图谱中的一组三元组(h,r,t),其中,h是头实体,t是尾实体,r是它们之间的关系,这三者都以向量形式表示,TransE模型约束它们三者向量表示满足h+r=t的关系,即头实体经过关系的翻译可以得到尾实体。反之,如果三者不构成三元组,如h+r'≠t,则要尽可能相互远离。TransE模型在表示学习过程中所利用的损失函数如公式4所示:
Figure BDA0002941762320000251
其中,dpos表示三元组正样本对应的距离值;dneg表示三元组负样本对应的距离值;距离值的计算公式为
Figure BDA0002941762320000252
margin表示惩罚项,用来控制向量空间内正负样本的距离间距。
相关技术中,公式4中的h和t作为实体向量,它们的初始表示向量是随机初始化的,因此可能会出现如图5中的一个问题,随机初始化E1和E2可能会导致整个表示学习错位,但是其学习到的关系向量R却可以和正确学习到的R’完全一致(在向量空间内方向和长度完全一致),正确的表示向量应该是E1’和E2’。本申请实施例利用考虑模态信息得到的初始表示向量去初始化h和t,这样随机性的概率会小很多,并且对于模态信息的引入可以使得近义实体最初在向量空间内尽量接近。例如,在考虑模态信息的基础上,“自行车”和“摩托车”的初始表示向量会在向量空间中更接近,而即使可能都有相同的关系<人,骑,自行车>、<人,骑,马>,“自行车”和“马”的初始表示向量就还是会离的比较远。
在得到知识图谱中的各个待学习目标分别对应的目标表示向量后,即得到知识图谱中的各个实体以及各个关系分别对应的目标表示向量,利用目标表示向量,能够为知识图谱的下游任务提供良好的先验知识,进而提升下游任务的处理性能。在一种可能实现方式中,在得到各个待学习目标分别对应的目标表示向量后,利用各个待学习目标分别对应的目标表示向量执行目标任务,目标任务是指知识图谱下游任务,示例性地,目标任务包括但不限于知识预测(或称为链接预测)、知识补全和知识问答等。
示例性地,本申请实施例提供的知识图谱的表示学习方法是一种基于模态信息的知识图谱的表示学习方法。如图6所示,基于模态信息的知识图谱的表示学习过程共包括三个过程:过程1、模态信息去噪自编码过程;过程2、知识图谱表示学习过程;过程3、知识应用过程。
在模态信息去噪自编码过程中,以模态信息包括图像信息和文本描述信息为例,实体“电话”具有图像信息和文本描述信息。对图像信息进行特征提取,得到图像特征向量;对文本描述信息进行特征提取,得到文本特征向量;对图像特征向量和文本特征向量分别进行加噪处理,得到加噪图像特征向量和加噪文本特征向量;对加噪图像特征向量和加噪文本特征向量的级联向量进行编码处理,得到初始表示向量;对初始表示向量进行解码,能够得到实体“电话”在图像这一信息属性下对应的图像解码特征向量以及在文本描述这一信息属性下对应的文本解码特征向量。解码特征向量是未加噪的特征向量。
在知识图谱表示学习过程中,调用知识图谱表示学习模型,在基于模态信息去噪自编码过程得到的初始表示向量的基础上对知识图谱中的各个实体以及各个关系进行表示学习,得到各个实体以及各个关系分别对应的目标表示向量。学习完成后,在知识应用过程中,利用各个实体以及各个关系分别对应的目标表示向量执行知识相关的下游任务,如,知识预测、知识补全和知识问答等。
在图6所示的过程中,首先将模态信息通过无监督的方式进行建模得到初始表示向量,并且由于自编码模型的特性,不同信息属性下的信息(如,图像信息和文本描述信息)可以进行交互学习使得初始表示向量更有表达性,并且引入去噪训练方式,使得自编码模型的鲁棒性更高。在知识图谱表示学习过程中,用上一过程得到的初始表示向量来初始化表示向量,使得知识图谱表示学习模型在训练开始之初就可以引入模态信息,方便之后的模型优化。
以链接预测任务为例,介绍一下具体任务以及模态信息的引入可以做到哪些改进提高。链接预测是一种根据知识图谱中已经存在的实体和关系去预测缺失的实体或关系的任务,是一种有前途的、广泛研究的、旨在解决知识图谱不完整的任务。在实际任务中,可能由于数据的不全面或者标注错误导致实体或关系并不完整,因此链接预测任务可以帮助补全知识图谱。示例性地,根据已经存在的实体,预测缺失的关系的任务利用公式5进行表示:
Figure BDA0002941762320000261
根据公式5可以得知,根据已经存在的实体,预测缺失的关系的任务是在现有关系中挑选最能满足h+r=t这一要求的关系r’。
以链接预测任务为例,研究引入模态信息的知识图谱的表示学习方法和相关技术中的知识图谱的表示学习方法的差异。采用的数据集是公开数据集FB15k(一种知识表示的数据集),采用的知识图谱表示学习模型为TransX系列模型。利用MR(Mean Rank,平均排名)和Hits@10作为评价指标。其中,MR表示对预测结果进行排序,正确的结果的名次的均值,MR越小说明表示学习的效果越好;Hits@10表示对预测结果进行排序,正确的结果排进Top10的概率,Hits@10越大说明表示学习的效果越好。实验结果如表1所示。
表1
模型 模态信息 最大轮次 MR Hits@10
TransE 1000 175.171 0.452
TransE 图像信息和文本描述信息 1000 68.556 0.580
TransH 1000 204.861 0.410
TransH 图像信息和文本描述信息 1000 99.999 0.522
TransR 1000 745.566 0.268
TransR 图像信息和文本描述信息 1000 649.058 0.304
TransD 1000 479.107 0.342
TransD 图像信息和文本描述信息 1000 369.990 0.443
根据表1可以得知,在引入包括图像信息和文本描述信息这两种额外信息属性下的信息的模态信息后,TransE、TransH、TransR和TransD这四个知识图谱表示学习模型均相较于没有模态信息的版本有了一定的性能提升。这也就证明了,在知识图谱的表示学习中,适当合理地引入模态信息,可以帮助提升整体的模型性能。
此外,为了验证针对长尾实体的链接预测效果,针对性地设计了一组实验,该实验中,在模型测试的时候选取对应三元组数量小于5的实体(即长尾实体)作为该实验的头实体,在给定关系的情况下,预测尾实体。实验结果如表2所示。
表2
Figure BDA0002941762320000271
Figure BDA0002941762320000281
表2中的improv.表示基于模态信息的知识图谱的表示学习方法相较于相关技术中的知识图谱的表示学习方法提升的数值,例如,对于TransE模型,基于模态信息的知识图谱的表示学习方法帮助MR数值降低了12.35,即正确结果的排序上升了12.35位;基于模态信息的知识图谱的表示学习方法帮助Hits@10提升了0.135,即正确结果出现在模型预测Top10中的概率上升了0.135。根据表2的实验结果可以得出结论:基于模态信息的知识图谱的表示学习方法可以对长尾实体有更好的建模学习效果。
相对于相关技术中依据随机初始化的初始表示向量实现的知识图谱的表示学习方法,引入模态信息至少能起到以下两个方面的效果:
1、帮助解决长尾实体和关系的预测性能差的问题。因为知识图谱本身数据分布存在长尾的情况,那么这些长尾实体和关系本身的三元组数据就很少,再叠加表示学习方法本身的随机初始化问题,造成该部分实体的链接预测效果比较差。本申请实施例中加入模态信息,可以为这部分长尾实体和关系的编码带来更多有效信息(如图像信息/文本描述信息),从而较大程度上提高针对长尾实体的链接预测效果。
2、对于复杂关系预测可以起到部分消歧作用。当知识图谱中存在一对多或者多对多的情况时,相关技术中的知识图谱的表示学习算法可能会混淆部分实体的表示向量。例如,存在三元组<人,骑,摩托车>、<人,骑,自行车>、<人,骑,马>,可能会认为摩托车、自行车和马有差不多的实体向量。本申请实施例通过引入模态信息(如,图像信息)能够起到很好地区分和消歧的效果,对于在关系三元组中相近的实体或关系可以通过模态信息进行区分,从而提升模型对于相近但不同实体或关系的编码表示。
本申请实施例中,提出了一种基于模态信息的知识图谱的表示学习方法。具体来说,引入了一种模态信息自编码模块,基于模态信息(如,图像信息和文本描述信息等)获取到更有效的初始表示向量,之后再将初始表示向量作为知识图谱表示学习模型的依据,继续后续的表示学习得到最终的目标表示向量。这样的知识图谱的表示学习方法可以在实际应用中提高知识的准确性和模型的鲁棒性。并且,该知识图谱表示学习方法可以适用多种知识图谱表示学习模型,具有很好的可拓展性。
在本申请实施例中,各个待学习目标分别对应的初始表示向量中包括至少一个第一目标对应的初始表示向量,第一目标对应的初始表示向量是根据第一目标对应的模态信息获取的,第一目标对应的初始表示向量能够从模态信息的角度较好地表征第一目标,可靠性较高。基于此,基于各个待学习目标分别对应的初始表示向量对各个待学习目标进行表示学习的学习效果较好,最终学习到的各个待学习目标分别对应的目标表示向量的准确性较高,有利于提高利用最终学习到的目标表示向量执行知识图谱下游任务的性能。
参见图7,本申请实施例提供了一种知识图谱的表示学习装置,该装置包括:
获取单元701,用于获取知识图谱中的各个待学习目标分别对应的初始表示向量,各个待学习目标中包括至少一个第一目标,至少一个第一目标中的任一第一目标对应的初始表示向量基于任一第一目标对应的模态信息获取,任一第一目标对应的模态信息包括任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息,任一待学习目标为知识图谱中的一个实体或一个关系;
表示学习单元702,用于基于各个待学习目标分别对应的初始表示向量,对各个待学习目标进行表示学习,得到各个待学习目标分别对应的目标表示向量。
在一种可能实现方式中,获取单元701,还用于基于任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息,获取任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,任一第一目标具有的各个目标信息属性的集合为指定信息属性集中的一个信息属性子集;基于任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取任一第一目标对应的初始表示向量。
在一种可能实现方式中,获取单元701,还用于响应于指定信息属性集中不包括参考信息属性子集,对任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,得到任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量,参考信息属性子集由除任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成;将任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量作为任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量。
在一种可能实现方式中,获取单元701,还用于响应于指定信息属性集中包括参考信息属性子集,对任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,得到任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量,参考信息属性子集由除任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成;按照目标方式,获取任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量;基于任一第一目标在任一第一目标具有的各个目标信息属性下分别对应的基础特征向量和任一第一目标在参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量,得到任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量。
在一种可能实现方式中,获取单元701,还用于对于参考信息属性子集中的任一参考信息属性,在至少一个第一目标中的除任一第一目标外的其他的第一目标中,确定与任一参考信息属性匹配的第一目标,与任一参考信息属性匹配的第一目标为具有的各个目标信息属性中包括任一参考信息属性的第一目标;基于与任一参考信息属性匹配的第一目标在任一参考信息属性下对应的基础特征向量,确定统计特征向量,将统计特征向量作为任一第一目标在任一参考信息属性下对应的基础特征向量;其中,与任一参考信息属性匹配的第一目标在任一参考信息属性下对应的基础特征向量通过对与任一参考信息属性匹配的第一目标在任一参考信息属性下对应的信息进行特征提取得到。
在一种可能实现方式中,获取单元701,还用于对于参考信息属性集中的任一参考信息属性,将与任一参考信息属性匹配的指定特征向量作为任一第一目标在任一参考信息属性下对应的基础特征向量。
在一种可能实现方式中,获取单元701,还用于对任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量进行加噪处理,得到任一第一目标在指定信息属性集中的各个信息属性下分别对应的加噪特征向量;对任一第一目标在指定信息属性集中各个信息属性下分别对应的加噪特征向量进行编码处理,得到任一第一目标对应的初始表示向量。
在一种可能实现方式中,获取单元701,还用于调用目标自编码模型,基于任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取任一第一目标对应的初始表示向量。
在一种可能实现方式中,获取单元701,还用于调用初始自编码模型,基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取样本目标对应的初始表示向量;调用初始自编码模型对样本目标对应的初始表示向量进行解码处理,得到样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量;
参见图8,该装置还包括:
训练单元703,用于基于样本目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量和样本目标在指定信息属性集中的各个信息属性下分别对应的解码特征向量,对初始自编码模型进行训练,得到目标自编码模型。
在本申请实施例中,各个待学习目标分别对应的初始表示向量中包括至少一个第一目标对应的初始表示向量,第一目标对应的初始表示向量是根据第一目标对应的模态信息获取的,第一目标对应的初始表示向量能够从模态信息的角度较好地表征第一目标,可靠性较高。基于此,基于各个待学习目标分别对应的初始表示向量对各个待学习目标进行表示学习的学习效果较好,最终学习到的各个待学习目标分别对应的目标表示向量的准确性较高,有利于提高利用最终学习到的目标表示向量执行知识图谱下游任务的性能。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在示例性实施例中,本申请实施例提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行,以实现上述任一种知识图谱的表示学习方法。该计算机设备可以为终端,也可以为服务器。
图9是本申请实施例提供的一种终端的结构示意图。该终端可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端包括有:处理器901和存储器902。
处理器901可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器901可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(Central ProcessingUnit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器901可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器901还可以包括AI处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器901所执行以实现本申请中方法实施例提供的知识图谱的表示学习方法。
在一些实施例中,终端还可选包括有:外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地,外围设备包括:射频电路904、显示屏905、摄像头组件906、音频电路907、定位组件908和电源909中的至少一种。
外围设备接口903可被用于将输入/输出(Input/Output,I/O)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中,处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上;在一些其他实施例中,处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路904用于接收和发射射频(Radio Frequency,RF)信号,也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路904包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或无线保真(Wireless Fidelity,WiFi)网络。在一些实施例中,射频电路904还可以包括近距离无线通信(Near Field Communication,NFC)有关的电路,本申请对此不加以限定。
显示屏905用于显示用户界面(User Interface,UI)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时,显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时,显示屏905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏905可以为一个,设置在终端的前面板;在另一些实施例中,显示屏905可以为至少两个,分别设置在终端的不同表面或呈折叠设计;在另一些实施例中,显示屏905可以是柔性显示屏,设置在终端的弯曲表面上或折叠面上。甚至,显示屏905还可以设置成非矩形的不规则图形,也即异形屏。显示屏905可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等材质制备。
摄像头组件906用于采集图像或视频。可选地,摄像头组件906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及虚拟现实(Virtual Reality,VR)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器901进行处理,或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路907还可以包括耳机插孔。
定位组件908用于定位终端的当前地理位置,以实现导航或基于位置的服务(Location Based Service,LBS)。定位组件908可以是基于美国的全球定位系统(GlobalPositioning System,GPS)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源909用于为终端中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于:加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。
加速度传感器911可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号,控制显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器912可以检测终端的机体方向及转动角度,陀螺仪传感器912可以与加速度传感器911协同采集用户对终端的3D动作。处理器901根据陀螺仪传感器912采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器913可以设置在终端的侧边框和/或显示屏905的下层。当压力传感器913设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在显示屏905的下层时,由处理器901根据用户对显示屏905的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器914用于采集用户的指纹,由处理器901根据指纹传感器914采集到的指纹识别用户的身份,或者,由指纹传感器914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器901授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置在终端的正面、背面或侧面。当终端上设置有物理按键或厂商Logo时,指纹传感器914可以与物理按键或厂商Logo集成在一起。
光学传感器915用于采集环境光强度。在一个实施例中,处理器901可以根据光学传感器915采集的环境光强度,控制显示屏905的显示亮度。具体地,当环境光强度较高时,调高显示屏905的显示亮度;当环境光强度较低时,调低显示屏905的显示亮度。在另一个实施例中,处理器901还可以根据光学传感器915采集的环境光强度,动态调整摄像头组件906的拍摄参数。
接近传感器916,也称距离传感器,通常设置在终端的前面板。接近传感器916用于采集用户与终端的正面之间的距离。在一个实施例中,当接近传感器916检测到用户与终端的正面之间的距离逐渐变小时,由处理器901控制显示屏905从亮屏状态切换为息屏状态;当接近传感器916检测到用户与终端的正面之间的距离逐渐变大时,由处理器901控制显示屏905从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图9中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图10是本申请实施例提供的一种服务器的结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器1001和一个或多个存储器1002,其中,该一个或多个存储器1002中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1001加载并执行,以实现上述各个方法实施例提供的知识图谱的表示学习方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由计算机设备的处理器加载并执行,以实现上述任一种知识图谱的表示学习方法。
在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact DiscRead-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一种知识图谱的表示学习方法。
需要说明的是,本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以上示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种知识图谱的表示学习方法,其特征在于,所述方法包括:
获取知识图谱中的各个待学习目标分别对应的初始表示向量,所述各个待学习目标中包括至少一个第一目标,所述至少一个第一目标中的任一第一目标对应的初始表示向量基于所述任一第一目标对应的模态信息获取,所述任一第一目标对应的模态信息包括所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息,任一待学习目标为所述知识图谱中的一个实体或一个关系;
基于所述各个待学习目标分别对应的初始表示向量,对所述各个待学习目标进行表示学习,得到所述各个待学习目标分别对应的目标表示向量。
2.根据权利要求1所述的方法,其特征在于,所述至少一个第一目标中的任一第一目标对应的初始表示向量的获取方式,包括:
基于所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息,获取所述任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,所述任一第一目标具有的各个目标信息属性的集合为所述指定信息属性集中的一个信息属性子集;
基于所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述任一第一目标对应的初始表示向量。
3.根据权利要求2所述的方法,其特征在于,所述基于所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息,获取所述任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,包括:
响应于所述指定信息属性集中不包括参考信息属性子集,对所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,得到所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的基础特征向量,所述参考信息属性子集由除所述任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成;
将所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的基础特征向量作为所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量。
4.根据权利要求2所述的方法,其特征在于,所述基于所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息,获取所述任一第一目标在指定信息属性集中的各个信息属性下分别对应的基础特征向量,包括:
响应于所述指定信息属性集中包括参考信息属性子集,对所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息进行特征提取,得到所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的基础特征向量,所述参考信息属性子集由除所述任一第一目标具有的各个目标信息属性外的至少一个参考信息属性构成;
按照目标方式,获取所述任一第一目标在所述参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量;
基于所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的基础特征向量和所述任一第一目标在所述参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量,得到所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量。
5.根据权利要求4所述的方法,其特征在于,所述按照目标方式,获取所述任一第一目标在所述参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量,包括:
对于所述参考信息属性子集中的任一参考信息属性,在所述至少一个第一目标中的除所述任一第一目标外的其他的第一目标中,确定与所述任一参考信息属性匹配的第一目标,所述与所述任一参考信息属性匹配的第一目标为具有的各个目标信息属性中包括所述任一参考信息属性的第一目标;
基于所述与所述任一参考信息属性匹配的第一目标在所述任一参考信息属性下对应的基础特征向量,确定统计特征向量,将所述统计特征向量作为所述任一第一目标在所述任一参考信息属性下对应的基础特征向量;
其中,所述与所述任一参考信息属性匹配的第一目标在所述任一参考信息属性下对应的基础特征向量通过对所述与所述任一参考信息属性匹配的第一目标在所述任一参考信息属性下对应的信息进行特征提取得到。
6.根据权利要求4所述的方法,其特征在于,所述按照目标方式,获取所述任一第一目标在所述参考信息属性子集中的各个参考信息属性下分别对应的基础特征向量,包括:
对于所述参考信息属性集中的任一参考信息属性,将与所述任一参考信息属性匹配的指定特征向量作为所述任一第一目标在所述任一参考信息属性下对应的基础特征向量。
7.根据权利要求2-6任一所述的方法,其特征在于,所述基于所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述任一第一目标对应的初始表示向量,包括:
对所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量进行加噪处理,得到所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的加噪特征向量;
对所述任一第一目标在所述指定信息属性集中各个信息属性下分别对应的加噪特征向量进行编码处理,得到所述任一第一目标对应的初始表示向量。
8.根据权利要求2-6任一所述的方法,其特征在于,所述基于所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述任一第一目标对应的初始表示向量,包括:
调用目标自编码模型,基于所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述任一第一目标对应的初始表示向量。
9.根据权利要求8所述的方法,其特征在于,所述调用目标自编码模型,基于所述任一第一目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述任一第一目标对应的初始表示向量之前,所述方法还包括:
调用初始自编码模型,基于样本目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量,获取所述样本目标对应的初始表示向量;
调用所述初始自编码模型对所述样本目标对应的初始表示向量进行解码处理,得到所述样本目标在所述指定信息属性集中的各个信息属性下分别对应的解码特征向量;
基于所述样本目标在所述指定信息属性集中的各个信息属性下分别对应的基础特征向量和所述样本目标在所述指定信息属性集中的各个信息属性下分别对应的解码特征向量,对所述初始自编码模型进行训练,得到所述目标自编码模型。
10.一种知识图谱的表示学习装置,其特征在于,所述装置包括:
获取单元,用于获取知识图谱中的各个待学习目标分别对应的初始表示向量,所述各个待学习目标中包括至少一个第一目标,所述至少一个第一目标中的任一第一目标对应的初始表示向量基于所述任一第一目标对应的模态信息获取,所述任一第一目标对应的模态信息包括所述任一第一目标在所述任一第一目标具有的各个目标信息属性下分别对应的信息,任一待学习目标为所述知识图谱中的一个实体或一个关系;
表示学习单元,用于基于所述各个待学习目标分别对应的初始表示向量,对所述各个待学习目标进行表示学习,得到所述各个待学习目标分别对应的目标表示向量。
CN202110182294.4A 2021-02-09 2021-02-09 知识图谱的表示学习方法及装置 Active CN113569052B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110182294.4A CN113569052B (zh) 2021-02-09 2021-02-09 知识图谱的表示学习方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110182294.4A CN113569052B (zh) 2021-02-09 2021-02-09 知识图谱的表示学习方法及装置

Publications (2)

Publication Number Publication Date
CN113569052A true CN113569052A (zh) 2021-10-29
CN113569052B CN113569052B (zh) 2024-07-26

Family

ID=78161111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110182294.4A Active CN113569052B (zh) 2021-02-09 2021-02-09 知识图谱的表示学习方法及装置

Country Status (1)

Country Link
CN (1) CN113569052B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114596552A (zh) * 2022-03-09 2022-06-07 阿波罗智能技术(北京)有限公司 信息处理方法、训练方法、装置、设备、车辆及介质
US20230214450A1 (en) * 2021-12-31 2023-07-06 Dell Products L.P. Method, electronic device, and computer program product for training model
CN117610254A (zh) * 2023-11-20 2024-02-27 中国科学院文献情报中心 面向有机太阳能电池领域实验方案设计的坐标分析方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140272914A1 (en) * 2013-03-15 2014-09-18 William Marsh Rice University Sparse Factor Analysis for Learning Analytics and Content Analytics
CN111160564A (zh) * 2019-12-17 2020-05-15 电子科技大学 一种基于特征张量的中文知识图谱表示学习方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140272914A1 (en) * 2013-03-15 2014-09-18 William Marsh Rice University Sparse Factor Analysis for Learning Analytics and Content Analytics
CN111160564A (zh) * 2019-12-17 2020-05-15 电子科技大学 一种基于特征张量的中文知识图谱表示学习方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHAO ZHANG 等: "Regions, periods, activities: Uncovering urban dynamics via cross-modal representation learning", 《WWW \'17: PROCEEDINGS OF THE 26TH INTERNATIONAL CONFERENCE ON WORLD WIDE WEB》, 3 April 2017 (2017-04-03), pages 361, XP058581158, DOI: 10.1145/3038912.3052601 *
盛泳潘: "面向知识图谱的学习算法研究与应用", 《中国博士学位论文全文数据库信息科技辑》, 15 January 2021 (2021-01-15), pages 138 - 295 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230214450A1 (en) * 2021-12-31 2023-07-06 Dell Products L.P. Method, electronic device, and computer program product for training model
CN114596552A (zh) * 2022-03-09 2022-06-07 阿波罗智能技术(北京)有限公司 信息处理方法、训练方法、装置、设备、车辆及介质
CN117610254A (zh) * 2023-11-20 2024-02-27 中国科学院文献情报中心 面向有机太阳能电池领域实验方案设计的坐标分析方法
CN117610254B (zh) * 2023-11-20 2024-09-10 中国科学院文献情报中心 面向有机太阳能电池领域实验方案设计的坐标分析方法

Also Published As

Publication number Publication date
CN113569052B (zh) 2024-07-26

Similar Documents

Publication Publication Date Title
CN111091166B (zh) 图像处理模型训练方法、图像处理方法、设备及存储介质
CN111325726A (zh) 模型训练方法、图像处理方法、装置、设备及存储介质
CN110135336B (zh) 行人生成模型的训练方法、装置及存储介质
CN111476783B (zh) 基于人工智能的图像处理方法、装置、设备及存储介质
CN111243668B (zh) 分子结合位点检测方法、装置、电子设备及存储介质
CN113569052B (zh) 知识图谱的表示学习方法及装置
CN112749728A (zh) 学生模型训练方法、装置、计算机设备及存储介质
CN110147533B (zh) 编码方法、装置、设备及存储介质
WO2022042120A1 (zh) 目标图像提取方法、神经网络训练方法及装置
CN110807325A (zh) 谓词识别方法、装置及存储介质
CN110503160B (zh) 图像识别方法、装置、电子设备及存储介质
CN111930964B (zh) 内容处理方法、装置、设备及存储介质
CN111598160A (zh) 图像分类模型的训练方法、装置、计算机设备及存储介质
CN111753498A (zh) 文本处理方法、装置、设备及存储介质
CN111581958A (zh) 对话状态确定方法、装置、计算机设备及存储介质
CN113705302A (zh) 图像生成模型的训练方法、装置、计算机设备及存储介质
CN113569042A (zh) 文本信息分类方法、装置、计算机设备及存储介质
CN113821658A (zh) 对编码器进行训练的方法、装置、设备及存储介质
CN113723164A (zh) 获取边缘差异信息的方法、装置、设备及存储介质
CN113763931B (zh) 波形特征提取方法、装置、计算机设备及存储介质
CN115223248A (zh) 手部姿态识别方法、手部姿态识别模型的训练方法及装置
CN115130456A (zh) 语句解析、匹配模型的训练方法、装置、设备及存储介质
CN112037305B (zh) 对图像中的树状组织进行重建的方法、设备及存储介质
CN114328815A (zh) 文本映射模型的处理方法、装置、计算机设备及存储介质
CN112989134A (zh) 节点关系图的处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant