CN116975625A - 一种推荐模型训练方法、装置及电子设备 - Google Patents

一种推荐模型训练方法、装置及电子设备 Download PDF

Info

Publication number
CN116975625A
CN116975625A CN202310576392.5A CN202310576392A CN116975625A CN 116975625 A CN116975625 A CN 116975625A CN 202310576392 A CN202310576392 A CN 202310576392A CN 116975625 A CN116975625 A CN 116975625A
Authority
CN
China
Prior art keywords
vector
attribute
entity
box
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310576392.5A
Other languages
English (en)
Inventor
许泽众
屈垠岑
陈华钧
张文
戴泽林
陈强
郭威
熊飞宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Tmall Technology Co Ltd
Original Assignee
Zhejiang Tmall Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Tmall Technology Co Ltd filed Critical Zhejiang Tmall Technology Co Ltd
Priority to CN202310576392.5A priority Critical patent/CN116975625A/zh
Publication of CN116975625A publication Critical patent/CN116975625A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种推荐模型训练方法,包括:将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据;以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型;其中,对应所述属性值的特征向量表达为盒向量,该盒向量称为属性盒向量,对应所述实体的特征向量表达为点向量,该点向量称为实体点向量。该处理过程训练获得的推荐模型,可实现三元组数据中各元素之间的相互关系表达更加清楚、明晰,符合不同元素的特点;进一步地,推荐模型可通过进一步训练,获得能够精确表达用户兴趣特征向量的三阶向量转换模型,该模型可向用户进行精准推荐。

Description

一种推荐模型训练方法、装置及电子设备
技术领域
本发明涉及推荐系统领域,具体涉及一种推荐模型训练方法、装置、电子设备及计算机存储介质。
背景技术
随着互联网技术的飞速发展,网络信息资源数量呈现指数式增长,用户面对海量的数据信息时,往往会出现信息过载的问题。此种情形下,推荐模型作为一种信息过滤系统,能够将用户感兴趣的信息及时呈现给用户,因而备受追捧。
然而,随着网络信息资源和用户数量不断的大量增长,对于推荐模型的任务复杂程度和技术处理难度也会同样增加;因此,推荐模型需要不断的进行训练优化。现有的推荐模型训练过程中,往往过多依赖于推荐算法自身优化、或者过分侧重根据模型使用数据的不同,如用户历史偏好数据、推荐对象数据进行模型优化。通过上述过程处理获得的推荐模型通常缺乏精确刻画用户兴趣的能力,并且模型工作效率低、模型学习训练结果的推荐效果差。因此,提供一种模型学习训练结果精准度高、推荐效果好的推荐模型训练方法成为亟待解决的技术问题。
发明内容
有鉴于现有技术的上述缺陷,本申请实施例提供一种推荐模型训练方法和装置、电子设备以及计算机存储介质,以解决现有的推荐模型训练方法,其模型学习训练结果无法精确刻画用户兴趣的问题。
本申请第一方面提供一种推荐模型训练方法,包括:将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据;以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型;其中,对应所述属性值的特征向量表达为盒向量,该盒向量称为属性盒向量;对应所述实体的特征向量表达为点向量,该点向量称为实体点向量。
可选的,所述方法还包括:使用所述一阶向量转换模型,获得对应各个元素的初始特征向量;根据下述训练目标对所述一阶向量转换模型进行训练获得二阶向量转换模型:所述实体对应的各个属性值所生成的属性盒向量,根据实体与该属性值之间的属性关系进行关系映射运算,获得映射后属性盒向量;所述实体点向量落入或者接近该实体的各个相关属性值的映射后属性盒向量的交集形成的交集区域。
可选的,所述方法还包括:获得目标用户的行为数据;根据所述目标用户的行为数据,在对应所述目标用户的行为所涉及的各实体中,选择部分实体作为训练实体,其余实体作为校验实体;采用所述二阶向量转换模型,获取目标训练实体的各个相关属性值根据属性关系进行关系映射运算后获得的映射后属性盒向量的交集形成的目标交集区域;对所述目标用户的各目标训练实体的各目标交集区域进行第一运算处理,生成对应所述目标用户的初阶兴趣特征向量,所述初阶兴趣特征向量表达为盒向量;以所述校验实体落入或者接近所述初阶兴趣特征向量表达的盒向量的区域作为训练目标,对所述二阶向量转换模型进行训练,获得三阶向量转换模型。
可选的,所述三元组数据包括第一元素、第二元素和第三元素,其中,第二元素为属性关系元素,第一元素、第三元素分别可以为实体元素或者属性值元素,形成的三元组数据类型包括如下类型中的任意一种或者多种:第一实体-属性关系-第二实体三元组数据、第一属性值-属性关系-第二属性值三元组数据、实体-属性关系-属性值三元组数据。
可选的,所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型,所述训练目标包括:根据所述三元组数据的类型,使通过所述向量转换模型获得的三元组数据中第一元素对应的向量,能够通过与所述属性关系对应的向量之间的转移运算,获得第三元素对应的向量。
可选的,若所述三元组数据的类型为第一实体-属性关系-第二实体三元组数据,则所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标的步骤中,针对该类型三元组数据要求达成如下训练目标:所生成的对应于所述第一实体的点向量,通过与所述属性关系对应的特征向量的关系映射运算,能够获得所述第二实体,或者接近所述第二实体并达到预设的阈值范围内。
可选的,为达成所述训练目标,对于每组第一实体-属性关系-第二实体三元组数据,分别进行如下处理:获得所述第一实体-属性关系-第二实体三元组数据中,对应所述第一实体的第一实体点向量和对应所述第二实体的第二实体点向量;将所述第一实体点向量,与所述属性关系对应的特征向量进行关系映射处理,获得映射后第一实体点向量;根据第一距离函数,计算所述映射后第一实体点向量与所述第二实体点向量的距离;根据所述映射后第一实体点向量与所述第二实体点向量的距离,以预设的训练标准,判断所述距离是否符合训练目标;对各组第一实体-属性关系-第二实体三元组数据进行上述处理后,将各组数据是否符合训练目标的情况,作为对所述向量转换模型进行调整的依据。
可选的,若所述三元组数据的类型为第一属性值-属性关系-第二属性值三元组数据,则所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标的步骤中,针对该类型三元组数据要求达成如下训练目标:所生成的对应于所述第一属性的盒向量,通过与所述属性关系向量的关系映射运算,能够获得符合如下条件的转移盒向量:所述转移盒向量与所述第二属性的盒向量的向量空间位置一致或者接近到预设的阈值范围内,并且,与所述第二属性的盒向量的尺寸规格一致或者接近到预设的阈值范围内。
可选的,所述属性关系向量包括关系映射分量和规格缩放分量。
可选的,为达成所述训练目标,对于每组第一属性值-属性关系-第二属性值三元组数据,分别进行如下处理:获得所述第一属性值-属性关系-第二属性值三元组数据中,对应所述第一属性值的第一属性盒向量和对应所述第二属性值的第二属性盒向量;将所述第一属性盒向量,与所述属性关系对应的特征向量进行关系映射处理,获得映射后第一属性盒向量;根据第二距离函数,计算所述映射后第一属性盒向量与所述第二属性盒向量的距离;根据所述映射后第一属性盒向量与所述第二属性盒向量的距离,以预设的训练标准,判断第一属性盒向量与所述第二属性盒向量的距离是否符合训练目标;对各组第一属性值-属性关系-第二属性值三元组数据进行上述处理,并将各组数据是否符合训练目标的情况,作为对所述向量转换模型进行调整的依据。
可选的,若所述三元组数据的类型为实体-属性关系-属性值三元组数据,则所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标的步骤中,针对该三元组数据要求达成如下训练目标:所生成的对应于所述实体的点向量,通过与所述属性关系向量的关系映射运算,能够落入所述属性值的属性盒向量范围内或者接近所述属性值的属性盒向量到预定的阈值范围内。
可选的,为达成所述训练目标,对于每组实体-属性关系-属性值三元组数据,分别进行如下处理:获得所述实体-属性关系-属性值三元组数据中,对应所述实体的实体点向量和对应所述属性值的属性盒向量;将所述实体点向量,与所述属性关系对应的特征向量进行关系映射处理,获得映射后实体点向量;根据第三距离函数,计算所述映射后实体点向量与所述属性盒向量的距离关系;根据所述映射后实体点向量与所述属性盒向量的距离关系,以预设的训练标准,判断实体点向量与所述属性盒向量的距离是否符合训练目标;对各组实体-属性关系-属性值三元组数据进行上述处理后,将各组数据是否符合训练目标的情况,作为对所述一阶向量转换模型进行调整的依据。
可选的,所述盒向量包括:中心点向量和关键点向量。
可选的,所述使用所述一阶向量转换模型,获得对应各个元素的初始特征向量,包括所述实体点向量和所述属性盒向量。
可选的,所述对所述一阶向量转换模型进行训练获得二阶向量转换模型,包括:获得各个实体的点向量,以及各个实体对应的属性盒向量根据属性关系进行关系映射运算获得的映射后属性盒向量;将各个所述映射后属性盒向量,根据所述映射后属性盒向量的关键点向量进行筛选排序处理,获得所述映射后属性盒向量的交集区域;以各个所述实体点向量落入所述映射后属性盒向量的交集区域,或者接近所述映射后属性盒向量的交集区域达到预定的阈值范围为训练目标,获得所述二阶向量转换模型。
可选的,所述以所述校验实体落入或者接近所述初阶兴趣特征向量表达的盒向量的区域作为训练目标,对所述二阶向量转换模型进行训练,获得三阶向量转换模型,包括:根据第三距离函数,计算所述目标用户的校验实体点向量与所述目标用户的兴趣特征向量的距离;根据所述目标用户的校验实体点向量与所述目标用户的兴趣特征向量的距离,判断各个校验实体点向量与所述兴趣特征向量的距离是否符合训练目标;将上述步骤获得的结果,作为对所述二阶向量转换模型进行调整的依据。
本申请第二方面提供一种推荐模型训练装置,包括:处理单元,被配置为将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据;构建单元,被配置为以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型;其中,对应所述属性值的特征向量表达为盒向量,该盒向量称为属性盒向量;对应所述实体的特征向量表达为点向量,该点向量称为实体点向量。
本申请实施例还提供一种电子设备,包括:存储器,用于存储程序;处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如上第一方面以及第一方面各种可能的设计中任一所述的方法。
本申请实施例还提供一种计算机可读存储介质,指令,当其在计算机上运行时,使得计算机执行如上第一方面以及第一方面各种可能的设计中任一所述的方法。
与现有技术相比,本申请实施例具有以下优点:
将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据;以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型,该一阶向量转换模型即可以作为推荐模型;其中,对应所述属性值的特征向量表达为盒向量,该盒向量称为属性盒向量;对应所述实体的特征向量表达为点向量;该点向量称为实体点向量;由于上述处理过程中,通过将所搜集的信息进行向量化表达,并且属性值的特征向量表达为属性盒向量、实体的特征向量表达为属性点向量,可以实现三元组数据中各元素之间的相互关系表达更加清楚、明晰,符合不同元素的特点,从而使模型能够更好的反映现实中的各个实体、属性值、属性关系之间的真实关系。
进一步地,该处理过程训练获得的推荐模型,可通过进一步训练,获得能够精确表达用户兴趣特征向量的三阶向量转换模型,该模型作为推荐模型,可以向用户进行精准推荐。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本申请实施例中的推荐模型训练方法的应用场景示意图;
图2是本申请第一实施例的一种推荐模型训练方法的流程图;
图3是本申请第一实施例的现有知识图谱向量化表达的展示效果图;
图4是本申请第一实施例的三元组数据示意图;
图5是本申请第一实施例的根据三元组数据类型进行关系映射运算的示意图;
图6是本申请第一实施例的根据三元组数据类型计算向量距离的示意图;
图7是本申请第一实施例的获得映射后属性盒向量的交集区域的示意图;
图8是本申请第一实施例的获取目标用户的初阶兴趣特征向量的示意图;
图9是本申请第二实施例的一种推荐模型训练装置的结构示意图;
图10是本申请第三实施例提供的电子设备的逻辑结构示意图。
具体实施方式
为使本申请的目的、优点和特征更加清楚,以下结合附图和具体实施方式对本申请提出的一种推荐模型训练方法作进一步详细说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性,以及特定的顺序或先后次序。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,术语“多个”是指两个或两个以上。术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。术语“包括”和“具有”以及他们的任何变形,旨在覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,对本申请一个或多个实施例涉及的名词术语进行解释。
知识图谱(Knowledge Graph,KG),是一种叫做语义网络的知识库,即具有有向图结构的一个知识库,通常用于以符号形式描述物理世界中的概念及其相互关系。该图谱由实体(item)、属性关系(relation)和属性值(tag)组成,由上述实体(item)、属性关系(relation)和属性值(tag)形成的三元组可以表示现实场景中各种实体之间的关系。其中,实体(item),又可称为节点,可以是一个人、地点、事件、物品等概念;属性值(tag)是指对实体或节点的分类或标记,用于描述实体的特征或属性;属性关系(relation)是指实体或节点之间的关系或连接。通过定义实体之间的关系,可以构建一个有向图,可表示不同实体之间的联系。
接下来,为了便于理解本申请的各实施例,对实施例的应用背景进行说明。
伴随着互联网数据信息化的发展,用户能够接触到的数据信息数量庞大、内容繁杂。当用户面对海量的数据信息时,需要花费大量的时间及精力进行内容浏览及筛选,才能获得符合自身需求的信息。如何对用户呈现感兴趣的信息,如何满足用户迅速而准确的获取需求信息成为一大研究热点。推荐模型作为一种信息过滤系统,能够将数据信息进行过滤,将用户需求信息及时呈现给用户,因此备受追捧。
知识图谱作为近年来新兴的一种辅助信息,它的出现为推荐模型在大数据环境下的设计提供新的思路;基于知识图谱的推荐模型作为目前研究热点,能够实现上述迅速准确的获取用户需求信息,因此备受关注。现有的基于知识图谱推荐模型的工作过程中,往往采用用户的历史数据、如历史购买行为数据、历史点击浏览行为数据,或者用户当前的搜索行为数据,如搜索输入关键词,推荐模型在信息数据库中基于知识图谱进行信息查询及匹配,获得与用户需求匹配的推荐信息,并将其曝光展示给用户。上述过程大多是基于知识图谱和用户历史数据进行搜索、匹配,但这些推荐模型缺乏精确刻画用户兴趣的能力,进而导致模型推荐对象与用户兴趣的匹配度低、推荐模型的推荐效果差。因此,提供一种推荐模型的训练方法,以提高模型推荐的准确性、合理性、进而提升推荐模型的工作效率、可信赖性以及用户满意度成为当前亟待解决的技术问题。
有鉴于此,本申请实施例提供一种推荐模型的训练方法,以用于推荐模型具有训练需求的各个领域。本申请实施例的推荐模型可应用于诸多领域场景中,例如新闻推荐、音乐推荐、电商购物等。为了便于理解,本申请实施例均以购物商品推荐的场景为例,进行详细说明。
此外,本申请实施例提供的一种推荐模型训练方法、装置、电子设备以及计算机存储介质,旨在能够获得可精确描述用户兴趣特征、推荐效果好的推荐模型;自然地,本申请训练获得的推荐模型能够实现用户推荐对象的获取。本申请对具体应用领域不作限制,仅仅是为了叙述方便,以下以商品购物推荐模型作为典型的应用场景,并围绕该场景说明本申请提供的上述方法。以下通过具体的实施例分别介绍推荐模型训练方法、装置、电子设备以及计算机存储介质。
为了便于理解本申请的方法实施例,对其应用场景进行介绍。请参考图1,图1为本申请方法实施例的应用场景示意图。可以应用于云服务端,该应用场景为一种示意性的举例说明,并不作为限定其应用场景的具体描述。
如图1所示,在该应用场景中设置有客户端101和云服务端102。在本实施例中,客户端101与云服务端102之间直接通过网络通信建立连接,客户端程序运行于客户端101上,服务端程序运行于云服务端102的服务器上。
客户端101(client)也可以称为用户端或工作站(workstation),与服务端相对应,接受服务端的控制和管理,在本实施例的实现方案中,客户端可以理解为运行某个具体应用的客户端设备,如手机,平板电脑(pad),也可以更具体的理解为是某个用于为用户提供本地服务的应用程序(application,APP)。客户端设备还可以是车载设备、可穿戴设备,端设备,逻辑实体,或者网关,基站,控制器等通信设备,或者物联网设备,如传感器,电表,水表等物联网(internet of things,IoT)设备。在客户端101和云服务端102,需要建立特定的通信连接,从而为用户提供各类服务。在本申请各实施例中,客户端101用于获取搜集的信息,该搜集的信息能在服务端的服务器中转化为向量。
云服务端102具有较高的运算能力。云服务端102的服务器具有高速的处理器(central processing unit,CPU)运算能力、长时间的可靠运行、强大的输入/输出(input/output,I/O)外部数据吞吐能力以及更好的扩展性。服务器102可以是单个服务器,也可以是服务器集群。云服务端102为布置向量转换模型的一端。当然,本申请的向量转换模型也可直接布置于客户端101,本实施例作为一种示意,并非实际限定。具体实施时,云服务端102的服务器中设置有向量转换模型,服务器用于接收客户端101搜集的信息,并将信息提供给推荐模型的训练使用。通过对该推荐模型的训练,能够获得用于用户推荐使用的推荐模型,如一阶向量转换模型、二阶向量转换模型、三阶向量转换模型。进一步地,上述经训练后的推荐模型能够用于获取推荐对象,并将推荐对象以页面内容形式通过网络通信连接传输给客户端101,以用于客户端101向目标用户进行展示。
客户端101可以与云服务端102进行通信。客户端101与云服务端102可以利用各种通信系统进行通信,例如可以是利用有线通信系统或无线通信系统。无线通信系统例如可以是全球移动通信(global system for mobile communications,GSM)系统、码分多址(code division multiple access,CDMA)系统、宽带码分多址(wideband code divisionmultiple access,WCDMA)系统、通用分组无线服务(general packet radio service,GPRS)、长期演进(long term evolution,LTE)系统、LTE频分双工(frequency divisionduplex,FDD)系统、LTE时分双工(time division duplex,TDD)、通用移动通信系统(universal mobile telecommunication system,UMTS)、全球互联微波接入(worldwideinteroperability for microwave access,WiMAX)通信系统、未来的第五代(5thgeneration,5G)系统或新无线(new radio,NR)、卫星通信系统等。
在本实施例中,客户端101主要用于获取搜集的信息,通过网络通信连接传输给云服务端102的服务器;云服务端102的服务器上布置有推荐模型,如向量转换模型,服务器将获取的搜集信息进行处理,以用于所述推荐模型的训练输入,进而获得一阶向量转换模型、二阶向量转换模型、三阶向量转换模型等;进一步地,上述推荐模型能够用于推荐对象获取,并将推荐对象以页面内容形式网络传输给客户端101,以展示给目标用户。需要理解的是,本申请实施例的推荐模型作为一种信息过滤系统,能够将数据信息进行过滤,将用户感兴趣的信息,如候选商品实体信息及时呈现给用户。
第一实施例
以下介绍本申请提供的方法实施例。请参照图2,图2是本申请实施例提供的一种推荐模型训练方法的示意性流程图。以下结合图2,介绍本申请实施例提供的推荐模型训练方法的整体情况。图2所示方法包括以下步骤:
步骤S201:将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据。
本步骤用于获取所搜集的信息形成的三元组数据,或者,也可理解为获得所搜集的信息的合理初始化表示。
在本实施例中,作为典型的方式,知识图谱作为信息转换表达的工具,在向量转换模型中根据知识图谱能够将任意信息转化为向量进行初始化表示。需要理解的是,采用知识图谱的表示方式为反映实体、属性值、属性关系上述各元素彼此之间联系的表示方式。知识图谱作为有向图结构的知识库,用于以向量符号形式描述事物之间的概念及相关关系。因此,在本申请实施例中,通过将所搜集的信息采用知识图谱方式进行表示,能够以向量符号形式描述所搜集的信息中的概念及概念间的连接关系,即,反映实体(item)、属性值(tag)、属性关系(relation)彼此之间联系。换言之,该步骤中知识图谱作为信息转换的工具,通过借助知识图谱能够获得所搜集的信息的合理的初始化表示。具体实施时,上述形成反映实体、属性值、属性关系彼此之间联系的三元组数据的过程是在知识图谱中进行,最终能够获得实体(item)和属性值(tag,或者称为属性)的合适表示。
在本实施例中,所搜集的信息中的实体(item)可以是一个人、地点、事件、物品等概念,例如“舞会”、“长裙”。所搜集的信息中的属性值用于描述上述实体的特征或属性,例如用于描述“长裙”的属性值“红色”。上述属性值能够作为对实体的分类或标记依据。所搜集的信息中的属性关系用于描述连接关系,可以表示不同实体之间的连接关系、还可以表示实体与属性值之间的连接关系、还可以描述不同属性值之间的连接关系。举例来说,若所搜集的信息为“红色长裙用于舞会使用”,其中“用于…使用”作为属性关系,即表示实体“红色长裙”与实体“舞会”之间的连接关系;若所搜集的信息为“由Q导演的电影《W》”,其中“由…导演的”作为属性关系,即表示实体“Q”与属性值“电影《W》”之间的连接关系;当然,根据所搜集的信息的不同,若所搜集的信息为“由Q编剧指导的电影《W》”,那么实体“Q”与属性值“电影《W》”之间表示连接关系的属性关系为“由…编剧指导”。由此也可理解,根据属性关系的不同,将所搜集的信息形成反应实体、属性值、属性关系彼此之间联系的三元组数据也会存在差异。那么,为了将所搜集的信息对应三元组数据的实体、属性值、属性关系彼此之间的相互关系表达的更加清楚、清晰,将获得所搜集的信息的合理初始化表示显得尤为必要。
所述搜集的信息为所述推荐模型自动搜集的信息;在本实施例为商品购物推荐模型作为应用场景的情形下,所述搜集的信息来源包括用户信息、购物应用平台信息、商品信息等;例如,实体:用户A、商品B、地点1、事件1等;属性值:红色、零售价、下单次数、复购率等;属性关系:购买、点击、关注、退款、查单、查询、关键词搜索等。需要理解的是,在应用场景不同的情形下,所搜集的信息来源以及所搜集的信息内容会存在差异,但并不影响本申请实施例的推荐模型训练方法的具体实施;所述搜集的信息采用知识图谱方式进行转化,可获得所述向量转换模型可识别的向量化特征表达。进一步地,上述所搜集的信息还可包括目标用户的行为数据,该目标用户为具有对象推荐需求的用户,对于目标用户的行为数据在本实施例的具体使用,可参考后续步骤的描述。
在本实施例中,所述将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据的过程中,作为知识图谱元素的实体、属性值、属性关系在所述知识图谱中的表达方式不同;即,所述实体、属性值、属性关系在所述知识图谱中的向量符号不同,该符号代表向量的具体表示方式,上述实体、属性值、属性关系的向量在表达方式上差异显著;因此,采用不同的向量符号能够便于将不同知识图谱元素进行区分,并且将元素之间的连接关系直观地呈现。
以二维向量空间为例进行说明,上述实体对应的实体点向量“p”的坐标表现形式为(a1,a2),其中,“a1”用于表示在第一向量维度(X轴)上对应坐标值,“a2”用于表示在第二向量维度(Y轴)上对应的坐标值。属性值对应的属性盒向量“b”的坐标表现形式为(m1,m2;n1,n2),其中,(m1,m2)用于表示该属性盒向量的中心点向量“Cen(b)”、(n1,n2)用于表示该属性盒向量的关键点向量“Off(b)”,即规格大小分量;上述作为规格大小分量的关键点向量结合中心点向量能够在向量空间中描述该盒向量所对应的盒向量区域以及区域大小。属性关系对应的双向量“r”的坐标表现形式为(M1,M2;N1,N2)、其中,(M1,M2)用于表示组成该双向量的关系映射分量、(N1,N2)用于表示组成该双向量的规格缩放分量。需要理解的是,本申请实施例中,在向量空间中,上述属性关系对应的双向量同样为盒向量,为了便于将两者进行区分,在本申请实施例中用不同的名称加以区别,但本质上两者在向量空间的呈现形式一致,均为盒向量。
具体实施时,在知识图谱中,将实体元素通过代表点向量(point的形式)的符号“○”进行表示,该点向量称为实体点向量,示意性的,一个点向量“p1”的坐标为(1,2);将属性值元素通过代表盒向量(矩形box的形式)的符号进行表示,该盒向量称为属性盒向量,示意性的,一个盒向量“b1”的坐标为(15,10;2,1),其中,(15,10)代表这个盒向量“b1”的中心点向量“Cen(b1)”、(2,1)代表这个盒向量“b1”的关键点向量“Off(b1)”,即该中心点坐标(15,10)到该矩形盒向量“b1”的盒向量顶点(矩形角点)的距离,即规格大小分量;为了便于理解根据规格大小分量计算盒向量的顶点坐标,进行详细说明,该盒向量的矩形右上角的顶点坐标可表示为(15+2,10+1),该盒向量的矩形右下角的顶点坐标可表示为(15+2,10-1),该盒向量的矩形左上角的顶点坐标可表示为(15-2,10+1),该盒向量的矩形左下角的顶点坐标可表示为(15-2,10-1)。将属性关系元素通过代表双向量的符号“→”进行表示,示意性的,该属性关系的双向量的坐标为(5,7;4,3),其中,(5,7)代表组成该双向量的关系映射分量、(4,3)代表组成该双向量的规格缩放分量。
需要理解的是,上述显式化的知识图谱各元素的向量符号代表特征向量,以便于本申请实施例所涉及到的各个模型,如向量转换模型、一阶向量转换模型、二阶向量转换模型、三阶向量转换模型进行识别处理。当然,本申请实施例还可以为多维向量空间,在具体实施的时候,需要预先设定一个非负整数代表上述模型所在空间的维度,例如100。那么,一个点向量“p”即被表示成一个100维的向量(k1,k2…k100),每个k代表对应维度的坐标数值,没有范围限制;盒向量“b”被表示成一个200维的向量(m1,m2…m100;n1,n2…n100),每个m和n都是一个坐标数值,其中(m1,m2…m100)代表了该向量所表示的盒向量(矩形区域)的中心点向量,记为Cen(b);(n1,n2…n100)代表了中心点坐标在每个维度方向上的最远距离(距离坐标),即矩形区域的中心点向量的坐标到矩形区域顶点坐标的距离,记为Off(b)。需要理解的是,对于使用盒向量表示的属性值元素而言,组成该属性值对应的盒向量的关键点向量(规格大小分量),要求向量坐标数值为正值(因为表示范围不能为负值),而作为向量空间中代表属性关系的双向量,其本质同样为盒向量,但对于使用盒向量表示的属性关系而言,其关系映射分量的坐标数值可以为正值也可以为负值。为了便于理解,本申请实施例均以二维向量空间为例进行说明。
所述知识图谱能够以向量化的方式反映所述实体、属性值、属性关系彼此之间的内在连接关系。即,在所述知识图谱中,由所述实体、属性值、属性关系形成对应所述搜集的信息的三元组数据能够将信息的内在连接关系显式清晰地表达。需要理解的是,一般情况下,采用知识图谱进行信息表示时,常见的是将与实体、属性值、用户兴趣等相关的信息,在知识图谱中统一建模为点向量(point的形式)的形式,如二维空间的点坐标的形式。为了便于理解,请参考图3的示意,图3为现有知识图谱向量化表达的展示效果图。如图3所示,该知识图谱中的实体用代表点向量的符号“○”表示,包括item1、item2、item3、item4、item5;属性值用代表点向量的符号表示,包括tag1、tag2、tag3、tag4、tag5;进一步地,上述代表实体的点向量“○”与代表属性值的点向量/>之间的属性关系(连接关系),通过有向线条进行表示。然而,采用此种知识图谱将实体、属性值统一建模为点向量(点坐标)的形式,无法清晰直观的反应各实体、属性值、属性关系之间的相互关系;也无法直观的获得用户兴趣特征与实体之间的对应关系,并且通过此种形式所形成的用户兴趣特征的描述准确度较低,进而导致所获得的推荐模型的推荐结果在用户侧的推荐效果不佳。因此,在本实施例中,将所搜集的信息进行向量化表示时,根据所搜集的信息中信息数据类型,即实体、属性值、属性关系的数据类型,将所搜集的信息中不同类型的数据使用不同的方式来表示。具体来说,将对应属性值的特征向量表达为盒向量(box的形式),该盒向量称为属性盒向量;对应实体的特征向量表达为点向量(point的形式),该点向量称为实体点向量。需要理解的是,在同一空间维度,上述属性盒向量的坐标、实体点向量的坐标,其坐标表现方式不同。
为了便于理解,参照图4的示意。具体实施时,将所搜集的信息中的实体经过知识图谱的向量化表达,将实体以点向量(point的形式)的方式进行表示。例如,商品实体(item):商品1(item1)、商品2(item2)、商品3(item3)等,如图4中所示均用符号“○”表示,在同一向量空间,商品1(item1)、商品2(item2)、商品3(item3)的点向量坐标存在显著差异。在本实施例中,将所搜集的信息中的属性值信息经过知识图谱的向量化表达,将属性值信息以盒向量(box的形式)的方式进行表示。例如,商品属性值(tag):红色(tag1)、裙装(tag2)、粉红色(tag3),零售价(tag4)、复购率(tag5)等如图4中所示均用符号表示,在同一向量空间,商品属性值(tag):红色(tag1)、裙装(tag2)、粉红色(tag3),零售价(tag4)、复购率(tag5)的属性盒向量存在显著差异。将属性关系(relation)以双向量(有向箭头的形式)的方式进行表示。例如,属性关系(relation):购买(r1)、点击(r2)、关注(r3)、查询(r4)、关键词搜索(r5)等如图4中所示均用符号“→”表示,在同一向量空间,属性关系(relation):购买(r1)、点击(r2)、关注(r3)、查询(r4)、关键词搜索(r5)的双向量存在显著差异。需要理解的是,采用属性盒向量(box embedding)的建模方式所表示的属性值,能够满足一个属性值(tag)对应多个实体(item)的现实要求。即,在现实中的各个实体、属性值、属性关系之间的真实关系中,作为对实体进行分类或者标记依据的属性值,其自身具有连接关系的实体数量庞大,属性值与实体间并非一一对应关系。举例来说,作为商品属性值(tag1)的“红色”,与该属性值(tag1)具有属性关系的商品实体和商品属性值的数量除图4中所示出的属性关系“购买(r1)、查询(r4)”之外,还有数量众多的其他属性关系,该图4作为一种示意性举例,并非实际限定。
在本实施例中,将所搜集的信息中的属性关系经过知识图谱的显示化表达中,上述属性关系以双向量方式进行表示时,该双向量包含关系映射分量和规格缩放分量。对于上述关系映射分量和规格缩放分量的具体描述,可参考后续步骤。具体实施时,将所搜集的信息中的商品实体与商品实体之间的属性关系、商品实体与商品属性值之间的属性关系、商品属性值与商品属性值之间的属性关系,均可经过知识图谱的向量化表达。为了便于理解,请参考图4的示意。图4为本申请实施例的将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据的示意图。其中,将所搜集的信息中对应实体(item)的信息“商品实体(item):商品1(item1)、商品2(item2)、商品3(item3)等”用点向量“○”的符号表示,例如,商品1(item1)的点向量的坐标为(1、2)、商品2(item2)的点向量的坐标为(11、50);将所搜集的信息中对应属性值(tag)的信息“商品属性值(tag):红色(tag1)、裙装(tag2)、粉红色(tag3),零售价(tag4)、复购率(tag5)等”用盒向量的符号表示,例如,红色(tag1)的盒向量的坐标为(15,10;2,1)、裙装(tag2)的盒向量的坐标为(3,3;2,5);将所搜集的信息中属性关系(relation)的信息“购买(r1)、点击(r2)、关注(r3)、查询(r4)、关键词搜索(r5)等”用双向量“→”的符号表示,例如,关键词搜索(r5)的双向量的坐标为(10,0;3,2)、查询(r4)的双向量的坐标为(5,5;8,7)等。通过图4的三元组数据示意图,能够将所搜集的信息中各个实体、属性值、属性关系彼此之间联系进行初步的反映。参考图4进行举例说明,第一组三元组数据【item1“○”、r1、tag1/>】的向量坐标用于描述“所购买的商品1的颜色为红色”的语义信息;第二组三元组数据【tag1/>r4、tag3/>】的向量坐标用于描述“根据商品属性值红色进行查询,获得商品属性值粉红色”的语义信息;第三组三元组数据【item1“○”、r5、item2“○”】的向量坐标用于描述“根据商品1进行关键词搜索,获得商品2”的语义信息。通过将所搜集的信息形成了数量众多的三元组数据。上述数量众多的三元组数据可以作为向量转换模型的训练用的数据集。
进一步地,该图4中还示出了目标用户和候选推荐对象(候选item),对于图4中目标用户和候选推荐对象的作用,在后续步骤中进行详细说明。需要理解的是,上述用于描述实体特征的属性值,作为对实体进行分类或标记的依据,与该属性值具有连接关系(属性关系)的实体,除所搜集的信息中的实体、还可以有其他实体;与该属性值具有连接关系的属性值,除所搜集的信息中的属性值,还可以有其他属性值。即,属性值作为分类或标记的依据,与该属性值在不同属性关系下对应的实体、属性值数量众多。举例来说,所搜集的信息中包括实体1、属性值1、属性关系1、其中,属性值1与实体1根据属性关系1相连接;由于属性值1可作为推荐模型数据中实体的分类依据,在推荐模型一侧属性值1所代表的实体,包含上述实体1,也可包含除实体1之外的与所搜集的信息无关的其他实体。
所述将所搜集的信息形成反应实体、属性值、属性关系的彼此之间联系的三元组数据,包括根据所述所搜集的信息的数据类型,形成数据类型对应的实体、属性值、属性关系的三元组数据。为了便于理解,进行举例说明。推荐模型所搜集的信息为“电影《W》,由…导演的,Q”;根据搜集的信息中信息的数据类型,将“电影《W》”作为实体可被向量化处理为点向量、表示连接关系的“由…导演的”作为属性关系可被向量化处理为双向量、表示属性值的“Q”将通过box embedding进行向量化处理为盒向量(box向量)。
具体来说,将三元组数据中表示属性值的“Q”向量化处理为该盒向量(box向量)的中心点向量,将属性关系“由…导演的”的双向量进行向量化处理得到关系映射分量和规格缩放分量,该关系映射分量和规格缩放分量,用于后续步骤中对该盒向量(box向量)进行投影变换的关系映射运算。即,属性关系用于后续步骤中的盒向量(box向量)的投影变换。为了便于理解,做出进一步解释说明,将三元组数据中表示属性值(tag)的向量通过boxembedding(矩形嵌入)向量化处理为盒向量(box的形式),该盒向量为矩形形状的向量,其目的在于,使用盒向量(box的形式)相较于点向量(point的形式)形式的向量而言,该盒向量能够囊括与该属性值相关所有实体点向量。如前所述,该盒向量(box的形式)能够代表用户宽泛的兴趣特征,因此,在此基础上对其进行组合可以得到用户精确的兴趣特征表示。例如,某个用户喜欢的是“红色的舞会长裙”,其中,“红色”、“舞会”、“长裙”均作为属性值可以表示为矩形状的盒向量。通过将上述三个代表“红色”、“舞会”、“长裙”盒向量进行向量的交集运算,即可得到代表用户精确兴趣的“红色的舞会长裙”的盒向量。
其中,所述三元组数据包括第一元素、第二元素和第三元素,其中,第二元素为属性关系元素,第一元素、第三元素分别可以为实体元素或者属性值元素,形成的三元组数据类型包括如下类型:第一实体-属性关系-第二实体三元组数据、第一属性值-属性关系-第二属性值三元组数据、实体-属性关系-属性值三元组数据。在一个训练用的数据集中,三元组数据可以包括这三种类型的一种或者多种。需要理解的是,上述三元组数据中的第一实体、第二实体分别代表不同的实体元素;同理,第一属性值、第二属性值分别代表不同的属性值元素。
具体实施时,上述三种类型的三元组数据,分别被表示为:IRI三元组,(item-relation-item);TRT三元组,(tag-relation-tag);IRT三元组,(item-relation-tag)。其中,第一实体-属性关系-第二实体三元组数据用IRI三元组表示、第一属性值-属性关系-第二属性值三元组数据用TRT三元组表示、实体-属性关系-属性值三元组数据用IRT三元组表示。为了便于理解,可参考图5中的示意,图5为本申请实施例的根据三元组数据的类型进行关系映射运算的示意图。在图5中,实体元素用点向量进行表示;属性值元素用矩形的盒向量进行表示;属性关系元素用双向量的有向箭头进行表示。
通过上述步骤S201获得了所搜集的信息的初始化表示。
步骤S202:以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型;其中,对应所述属性值的特征向量表达为盒向量,该盒向量称为属性盒向量;对应所述实体的特征向量表达为点向量,该点向量称为实体点向量。
本步骤用于对向量转换模型进行一阶训练,获得一阶向量转换模型。
在本实施例中,向量转换模型作为推荐模型的初始模型,通过将向量转换模型进行一阶训练,能够获得作为推荐模型的一阶向量转换模型。
其中,所述生成的特征向量为对应所述三元组数据中所述实体元素、和/或所述属性值元素的特征向量经过关系映射运算处理所获得的向量;换而言之,用于步骤S202中的生成的特征向量,需要根据步骤S201中获取的所搜集的信息形成的三元组数据进行关系映射运算处理,才能用于对向量转换模型进行一阶训练,具体将三元组数据进行关系映射运算处理的过程,参见下文详细介绍。
具体实施时,在所述三元组数据中,对应所述实体元素的特征向量表达为点向量、该点向量称为实体点向量,对应所述属性值的特征向量表达为盒向量、该盒向量称为属性盒向量,对应所述属性关系的特征向量表达为双向量。与之对应的,根据所述实体元素的点向量经过关系映射运算处理处理获得的仍为点向量;根据所述属性值元素的盒向量经过关系映射运算处理处理获得的仍为盒向量。
其中,所述属性关系向量包括关系映射分量和规格缩放分量。上述属性关系的关系映射分量用于表示向量平移旋转的方向,关系映射分量不同,在关系映射运算过程中向量的平移程度和旋转方向不同;上述规格缩放分量用于表示向量变形的程度;所述盒向量包括:中心点向量和关键点向量。上述中心点向量为所述盒向量矩形中心点的特征向量;所述关键点向量为所述盒向量矩形中心点到矩形角点的范围向量。
在本实施例中,上述点向量可以为二维空间的坐标点的向量、还可为多维空间的坐标点向量;上述盒向量可以为二维空间的矩形所对应的向量、还可以为多维空间多边矩形体所对应的向量。为了便于理解,本实施例以二维空间的坐标点向量、二维空间的矩形所对应的盒向量为例进行说明。例如,商品1(item1)点向量的坐标为(10,20);商品属性值:红色(tag1)的盒向量的坐标为“(15,50;5,1)”,其中,“(15,50)”为该盒向量的中心点向量,(5,1)为该盒向量的关键点向量。应当说明,上述维度是数学含义上的维度,并不是物理空间意义上的维度,实际模型中使用的维度数是非常高的,维度越高往往越能胜任复杂的推荐任务。
所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型,所述训练目标包括:根据所述三元组数据的类型,使通过所述向量转换模型获得的三元组数据中第一元素对应的向量,能够通过与所述属性关系对应的向量之间的转移运算,获得第三元素对应的向量。
在本实施例中,上述向量转换模型进行一阶训练的过程为根据三元组数据的类型所完成的训练。即,根据第一元素的具体类型,将第一元素对应的向量通过与属性关系对应的向量之间的转移运算,获得第三元素对应的向量的过程。具体实施时,通过将作为第一元素的实体元素对应的点向量或属性值元素对应的盒向量,通过与属性关系对应的双向量之间的转移运算,能获第三元素对应的向量。具体实施时,上述三种类型的三元组数据使用不同方式进行关系映射运算的训练。上述关系映射运算为给定一个点向量或盒向量、以及给定一个属性关系向量,获得另外一个向量的过程。为了便于理解,可参考图5的示意,图5为根据三元组数据类型进行关系映射运算的示意图。
若所述三元组数据的类型为第一实体-属性关系-第二实体三元组数据,则所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标的步骤中,针对该三元组数据要求达成如下训练目标:所生成的对应于所述第一实体的点向量,通过与所述属性关系对应的特征向量的关系映射运算,能够获得所述第二实体,或者接近所述第二实体并达到预设的阈值范围内。
为了便于理解,结合图4并继续参考图5中的示意。上述第一实体-属性关系-第二实体三元组数据对应图5中的IRI三元组。上述第一实体在图中用代表实体元素点向量的“V1”表示,该实体元素点向量的“V1”的坐标为(10,12)、第二实体在图中用代表实体元素点向量的“V2”表示,该实体元素点向量的“V2”的坐标为(15,15)、属性关系在图中用代表双向量的“r5”表示,该双向量的“r5”的坐标为“(10,0;3,2)”,其中,“(10,0)”用于表示关系映射分量、“(3,2)”用于表示规格缩放分量。在图4中,代表实体item1的“V1”点向量与代表实体item2的“V2”点向量之间,存在的连接关系(属性关系)为“r5”。参照图5的示意,将第一实体元素的点向量“V1”的坐标,经过属性关系“r5”的向量进行关系映射运算,能够计算获得映射后第一实体点向量“V2’”的向量坐标,上述映射后第一实体点向量“V2’”的坐标需要与第二实体元素的点向量“V2”的坐标相对应;需要理解的是,上述映射后第一实体点向量“V2’”为计算获得的向量坐标,第二实体元素的点向量“V2”为表示“item2”的实际向量坐标。对于IRI三元组数据而言,要求经过属性关系映射之后的两个实体点向量(item point)接近,即映射后第一实体点向量“V2’”的坐标与实际的第二实体元素的点向量“V2”的坐标的差值达到预设的阈值范围内,或者,映射后第一实体点向量“V2’”的坐标与第二实体元素的点向量“V2”的坐标保持一致。上述坐标的差值达到预设的阈值范围,为推荐模型根据实际需求设定的模型参数,可以根据实际训练情况进行参数调整。
在本实施例中,点向量的关系映射运算处理的公式如下:
h=t+Cen(r) 公式1-1
其中,t代表被映射的点向量,Cen(r)代表该属性关系的关系映射分量,h代表计算获得的映射后点向量。
上述计算获得映射后第一实体点向量“V2’”坐标的具体过程为:依据公式1-1,公式中的“t”为第一实体元素的点向量“V1”的向量坐标,“Cen(r)”为属性关系“r5”的关系映射分量,“h”为映射后第一实体点向量“V2’”的向量坐标。
具体实施时,将代表第一实体的实体元素点向量的“V1”的坐标为(10,12),根据代表属性关系“r5”的坐标“(10,0;3,2)中的关系映射分量(10,0)”进行向量位移,计算获得代表映射后第一实体点向量“V2’”的坐标(14.5,14.5)。需要理解的是,在IRI三元组数据的关系映射运算中,所生成的对应于所述第一实体的点向量,具体通过与所述属性关系的关系映射分量的特征向量进行所述关系映射运算。换而言之,上述属性关系的规格缩放分量在IRI三元组数据的情形下,不用于关系映射运算的计算使用。
为达成所述训练目标,对于每组第一实体-属性关系-第二实体三元组数据,分别进行如下处理:
获得所述第一实体-属性关系-第二实体三元组数据中,对应所述第一实体的第一实体点向量和对应所述第二实体的第二实体点向量;
将所述第一实体点向量,与所述属性关系对应的特征向量进行关系映射处理,获得映射后第一实体点向量;
根据第一距离函数,计算所述映射后第一实体点向量与所述第二实体点向量的距离;
根据所述映射后第一实体点向量与所述第二实体点向量的距离,以预设的训练标准,判断所述距离是否符合训练目标;
对各组第一实体-属性关系-第二实体三元组数据进行上述处理后,将各组数据是否符合训练目标的情况,作为对所述向量转换模型进行调整的依据。
在本实施例中,第一距离函数(Point-point的距离)的计算公式如下:
DPP(a,b)=||a–b||1 公式1-2
其中,a,b分别表示需要计算距离的两个点向量的坐标,DPP代表计算两点之间的距离值,||x||1代表范数,即取两个点向量的绝对值再将每个维度上的值相加。上式的整体含义为将两个向量按位相减得到结果向量,并将其取绝对值之后,将所有维度上的值相加,得到的数字即可用来衡量两个点之间的距离。
需要理解的是,针对IRI三元组类型的向量转换模型进行一阶训练的过程中,向量转换模型自身存储有对应第一实体的第一实体点向量“V1”的坐标(10,12)、第二实体的第二实体点向量“V2”的坐标(15,15)、以及反应第一实体点向量“V1”与第二实体点向量“V2”之间连接关系的属性关系“r5”的坐标“(10,0;3,2)”。通过将第一实体点向量“V1”的坐标(10,12)根据属性关系“r5”的双向量(10,0;3,2)中的关系映射分量“(10,0)”进行向量位移,能够计算获得与上述第一实体点向量“V1”的坐标(10,12)对应的映射后第一实体点向量“V2’”坐标(14.5,14.5)。上述第一距离函数采用点到点的距离函数,通过计算映射后第一实体点向量“V2’”的坐标(14.5,14.5)与第二实体点向量“V2”的坐标(15,15)之间的距离,判断映射后第一实体点向量“V2’”的坐标(14.5,14.5)与第二实体点向量“V2”的坐标(15,15)之间的距离是否符合训练目标,在上述距离不符合预设的训练标准的情况下,对向量转换模型进行模型参数的调整;在上述距离符合预设的训练标准的情况下,将此时的向量转换模型作为一阶向量转换模型。需要理解的是,映射后第一实体点向量“V2’”的坐标与第二实体点向量“V2”的坐标之间的距离能反应两者之间的相似程度,相似程度的差值用距离表示,若距离小于预设训练目标,则向量转换模型收敛。
为了便于理解映射后第一实体点向量“V2’”的坐标与第二实体点向量“V2”的坐标之间的距离,请参考图6的示意,图6为根据三元组数据类型计算向量距离的示意图,根据图6的示意,映射后第一实体点向量“V2’”的坐标(14.5,14.5)与第二实体点向量“V2”的坐标(15,15)之间的距离,即图中所示出的item2’与item2,item2’的坐标(14.5,14.5)与item2的坐标(15,15)之间距离,在图6中用point-to-point的距离进行表示。
若所述三元组数据的类型为包括第一属性值-属性关系-第二属性值三元组数据,则所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标的步骤中,针对该类型三元组数据要求达成如下训练目标:所生成的对应于所述第一属性的盒向量,通过与所述属性关系向量的关系映射运算,能够获得符合如下条件的转移盒向量:所述转移盒向量与所述第二属性的盒向量的向量空间位置一致或者接近到预设的阈值范围内,并且,与所述第二属性的盒向量的尺寸规格一致或者接近到预设的阈值范围内。
为了便于理解,结合图4并继续参考图5中的示意。上述第一属性值-属性关系-第二属性值三元组数据对应图5中的TRT三元组。上述第一属性值在图中用代表第一属性值元素的盒向量“b1”表示,该属性盒向量“b1”的坐标为(3,3;2,5),其中,“(3,3)”为该盒向量的中心点向量,“(2,5)”为该盒向量的关键点向量;第二属性值在图中用代表第二属性值元素的盒向量“b3”表示,该属性盒向量“b3”的坐标为(18,13;6,2),其中,“(18、13)”为该盒向量的中心点向量,“(6,2)”为该盒向量的关键点向量;属性关系在图中用代表双向量的“r4”表示,该属性关系“r4”的双向量的坐标为“(5,5;8,7)”,其中,“(5,5)”用于表示关系映射分量、“(8,7)”用于表示规格缩放分量。
在图4中,代表属性值1(tag1)的盒向量“b1”与代表属性值3(tag3)的盒向量“b3”之间,存在的连接关系(属性关系)为“r4”。参照图5的示意,将第一属性值元素的盒向量“b1”经过属性关系“r4”的向量进行关系映射运算,能够计算获得映射后第一属性盒向量“b3’”,即转移盒向量;该映射后第一属性值盒向量“b3’”(转移盒向量)与实际的第二属性值元素的盒向量“b3”相对应;同理,上述映射后第一属性值盒向量“b3’”(转移盒向量)为计算获得的向量,第二属性值元素的盒向量“b3”为表示“tag3”的实际向量。对于TRT三元组而言,要求经过关系映射和缩减box边界大小之后的两个属性值盒向量(tag box)一致,即要求映射后第一属性盒向量“b3’”(转移盒向量)与第二属性值元素的盒向量“b3”在向量空间位置一致或者接近到在预设的阈值范围内,并且,与所述第二属性的盒向量的尺寸规格一致或者接近到预设的阈值范围内。换而言之,要求将与盒向量“b1”对应的矩形向量经过属性关系的关系映射运算,所计算获得的映射后第一属性盒向量“b3’”(转移盒向量)能够与第二属性值元素的盒向量“b3”在向量空间位置中接近或者保持一致,并且,在尺寸规格上接近或保持一致。
在本实施例中,盒向量的关系映射运算处理的公式如下:
Cen(h)=Cen(t)+Cen(r) 公式1-3
Off(h)=Off(t)+Off(r) 公式1-4
其中,Cen(h),Off(h)为盒向量对应的计算结果;Cen(h)表示计算获得的映射后盒向量的中心点向量,Off(h)表示计算获得的映射后盒向量的关键点向量(规格大小分量)。Cen(t)表示被映射盒向量的中心点向量,Off(t)表示被映射盒向量的关键点向量(规格大小分量),Cen(r)表示属性关系的关系映射分量,Off(r)表示属性关系的规格缩放分量。上述公式的含义为,使用属性关系“r”的两个分量(关系映射分量和规格缩放分量)对被映射盒向量“t”代表的区域进行位移、缩放其区域大小,获得映射后盒向量“h”。
上述计算获得映射后第一属性盒向量“b3’”(转移盒向量)的坐标的具体过程为:依据公式1-3和公式1-4,公式中的“Cen(t)”为第一属性值元素的盒向量“b1”的中心点向量“(18、13),公式中的“Off(t)”为第一属性值元素的盒向量“b1”的关键点向量“(6,2)”,公式中的“Cen(r)”为属性关系“r4”的关系映射分量,公式中的“Off(r)”为属性关系“r4”的规格缩放分量,公式中的“Cen(h)”为计算获得的映射后第一属性盒向量“b3’”的中心点向量,公式中的“Off(h)”为计算获得的映射后第一属性盒向量“b3’”的关键点向量。
具体实施时,将代表第一属性值元素的盒向量“b1”的坐标(3,3;2,5)中的中心点向量“(3,3)”,根据代表属性关系“r4”的坐标“(5,5;8,7)”中的关系映射分量“(5,5)”进行平移旋转,计算获得映射后第一属性盒向量“b3’”的中心点向量(11,5);将代表第一属性值元素的盒向量“b1”的坐标(3,3;2,5)中的关键点向量“(2,5)”,根据代表属性关系“r4”的坐标“(5,5;8,7)”中的规格缩放分量“(8,7)”进行缩放变换,计算获得映射后第一属性盒向量“b3’”的关键点向量“(3,3)”;由此获得映射后第一属性盒向量“b3’”的坐标为“(11,5;3,3)”。需要理解的是,在TRT三元组数据的关系映射中,所生成的对应于所述第一属性的盒向量,具体是通过将第一属性值元素的盒向量中的中心点向量,根据所述属性关系的关系映射分量进行平移旋转、将所述第一属性值元素的盒向量中的关键点向量,根据所述属性关系的规格缩放分量进行缩放变换,完成的所述关系映射运算。换而言之,上述属性关系的关系映射分量和规格缩放分量,分别针对第一属性值元素的盒向量中的中心点向量、关键点向量进行单独计算使用。
为达成所述训练目标,对于每组第一属性值-属性关系-第二属性值三元组数据,分别进行如下处理:
获得所述第一属性值-属性关系-第二属性值三元组数据中,对应所述第一实属性值的第一属性盒向量和对应所述第二属性值的第二属性盒向量;
将所述第一属性盒向量,与所述属性关系对应的特征向量进行关系映射处理,获得映射后第一属性盒向量;
根据第二距离函数,计算所述映射后第一属性盒向量与所述第二属性盒向量的距离;
根据所述映射后第一属性盒向量与所述第二属性盒向量的距离,以预设的训练标准,判断映射后第一属性盒向量与所述第二属性盒向量的距离是否符合训练目标;
对各组第一属性值-属性关系-第二属性值三元组数据进行上述处理,并将各组数据是否符合训练目标的情况,作为对所述一阶向量转换模型进行调整的依据。
需要理解的是,针对TRT三元组类型的向量转换模型进行一阶训练的过程中,向量转换模型自身存储有对应第一属性值的第一属性盒向量“b1”的坐标、第二属性值的第二属性盒向量“b3”的坐标,以及反应第一属性盒向量“b1”与第二属性盒向量“b3”之间连接关系的属性关系“r4”的坐标。通过第一属性盒向量“b1”的坐标根据属性关系“r4”双向量的坐标进行向量间的关系映射处理,能够获得与上述第一属性盒向量“b1”对应的映射后第一属性盒向量“b3’”的坐标。上述第二距离函数为盒到盒距离函数(box-box的距离),通过计算映射后第一属性盒向量“b3’”的坐标与第二属性盒向量“b3”的坐标之间的距离,判断映射后第一属性盒向量“b3’”坐标与第二属性盒向量“b3”坐标之间的距离是否符合训练目标,在上述距离不符合预设的训练标准的情况下,对向量转换模型进行模型参数的调整;在上述距离符合预设的训练标准的情况下,将此时的向量转换模型作为一阶向量转换模型。需要理解的是,映射后第一属性盒向量“b3’”坐标与第二属性盒向量“b3”坐标之间的距离能反应两者之间的相似程度,即,向量空间位置的相似程度以及尺寸规格的相似程度,上述两种相似程度的用距离表示,若距离小于预设训练目标,则向量转换模型收敛。
其中,第二距离函数(box-box的距离)的计算公式如下:
DBB(a,b)=||Cen(a)–Cen(b)||1+||Off(a)–Off(b)||1公式1-5
其中,DBB代表计算获得的两个盒向量之间的距离,a,b分别表示需要计算距离的两个盒向量,Cen(x)表示盒向量x的中心点向量、Off(x)表示盒向量x的关键点向量。
为了便于理解映射后第一属性盒向量“b3’”(转移盒向量)坐标与第二属性盒向量“b3”坐标之间的距离,请参考图6的示意,图6为根据三元组数据类型计算向量距离的示意图。根据图6的示意,映射后第一属性盒向量“b3’”的坐标(11,5;3,3)与第二属性盒向量“b3”的坐标(18,13;6,2),即图6中所示出的“tag2’”与“tag2”;“tag1”表示第一属性盒向量“b1”;“tag2’”坐标(11,5;3,3)与“tag2”坐标(18,13;6,2)之间的距离用图6中的box-to-box的距离表示。
若所述三元组数据的类型为包括实体-属性关系-属性值三元组数据,则所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标的步骤中,针对该三元组数据要求达成如下训练目标:所生成的对应于所述实体的点向量,通过与所述属性关系向量的关系映射运算,能够落入所述属性值的属性盒向量范围内或者接近所述属性值的属性盒向量到预定的阈值范围内。
为了便于理解,结合图4并继续参考图5中的示意。上述实体-属性关系-属性值三元组数据对应图5中的IRT三元组。上述实体的在图中用代表实体元素点向量的“V1”表示,该实体元素点向量的“V1”的坐标为(10,12);属性值在图中用代表属性值元素的盒向量“b1”表示,该属性盒向量“b1”的坐标为(3,3;2,5),其中,“(3,3)”为该盒向量的中心点向量,“(2,5)”为该盒向量的关键点向量;属性关系在图中用向量“r1”表示,该属性关系“r1”的双向量的坐标为“(10,0;3,2)”,其中,“(10,0)”用于表示关系映射分量、“(3,2)”用于表示规格缩放分量。
在图4中,代表实体1(item1)的点向量“V1”与代表属性值1(tag1)的盒向量“b1”,存在的连接关系(属性关系)为“r1”。参照图5的示意,将实体元素点向量的“V1”经过属性关系“r1”的向量进行关系映射运算,能够计算获得映射后实体点向量“V1’”,将映射后实体点向量“V1’”能够落入属性值的属性盒向量“b1”对应的映射后盒向量范围内或者接近属性值的属性盒向量“b1”对应的映射后盒向量到预定的阈值范围内作为训练目标。对于IRT三元组而言,要求映射后实体点向量(item point)能够落在映射后属性盒向量(tag box)之内,即,映射后实体点向量“V1’”能够落入属性值的属性盒向量“b1”对应的映射后盒向量范围内或至少接近到预定的阈值范围内。
上述计算获得映射后实体点向量“V1’”的坐标的具体过程为:将代表实体元素点向量的“V1”的坐标(10,12),根据代表属性关系“r1”的坐标“(10,0;3,2))”中的关系映射分量“(10,0)”进行平移旋转,获得映射后实体点向量“V1’”坐标(-10,12),该计算过程参照公式1-1;将代表属性盒向量“b1”坐标的(3,3;2,5)中的中心点向量(3,3),根据属性关系“r1”的坐标“(10,0;3,2)”中的关系映射分量“(10,0)”进行平移旋转,获得映射后的属性盒向量“b1’”的中心点向量的坐标(-22,33);将代表属性盒向量“b1”坐标的(3,3;2,5)中的关键点向量(2,5),根据属性关系“r1”的坐标“(10,0;3,2)”中的规格缩放分量“(3,2)”进行缩放变换,获得映射后的属性盒向量“b1’”的关键点向量“(9,7)”;由此获得映射后的属性盒向量“b1’”的坐标(-22,33;9,7),该计算过程参照公式1-3和公式1-4。将所计算获得的映射后实体点向量“V1’”坐标(-10,12),能够落入计算获得的映射后的属性盒向量“b1’”的坐标(-22,33;9,7)范围内,或者至少接近映射后的属性盒向量“b1’”的坐标(-22,33;9,7)到预定的阈值范围内作为训练目标。
为达成所述训练目标,对于每组实体-属性关系-属性值三元组数据,分别进行如下处理:
获得所述实体-属性关系-属性值三元组数据中,对应所述实体的实体点向量和对应所述属性值的属性值盒向量;
将所述实体点向量,与所述属性关系对应的特征向量进行关系映射处理,获得映射后实体点向量;
根据第三距离函数,计算所述映射后实体点向量与所述属性值盒向量的距离关系;
根据所述映射后实体点向量与所述属性值盒向量的距离关系,以预设的训练标准,判断实体点向量与所述属性值盒向量的距离是否符合训练目标;
对各组实体-属性关系-属性值三元组数据进行上述处理后,将各组数据是否符合训练目标的情况,作为对所述一阶向量转换模型进行调整的依据。
其中,第三距离函数(Point-box的距离)计算公式如下:
DPB(a,b)=Din(a,b)+Dout(a,b)公式1-6
其中,a代表点向量,b代表盒向量,Din代表衡量点向量到盒向量的中心点向量的距离,Dout代表点向量到盒向量的关键点向量(盒边界线上最近点)的距离。
对应公式1-6中,上述衡量点向量到盒向量的中心点向量的距离Din的计算公式如下:
Din(a,b)=||Cen(b)-Min(bmax–Max(bmin,a))||1公式1-7
对应公式1-6中,上述点向量到盒向量的关键点向量(盒边界线上最近点)的距离Dout的计算公式如下:
Dout(a,b)=||Max(a-bmax,0)||1+||Min(bmin-a,0)||1公式1-8
上述公式1-7、1-8中,Cen(b)表示盒向量的中心点向量;Min(x)表示所输入的点向量和盒向量按照维度取最小值组成的一个新的向量;Max(x)表示所输入的点向量和盒向量按照维度取最大值组成的一个新的向量;bmax表示使用Cen(b)加减Off(b)得到的该盒向量表示区域中坐标最大的点(二维上可以理解为盒向量矩形区域的右上角顶点);bmin表示使用Cen(b)加减Off(b)得到的该盒向量表示区域中坐标最小的点(二维上可以理解为盒向量矩形区域的左下角顶点)。为例便于理解,以二维向量空间进行举例说明。点向量坐标为(1,51),盒向量的坐标为(15,50;5,1),该盒向量的中心点坐标为(15,50);在第一坐标维度(x轴),将上述点向量坐标为(1,51)与上述盒向量的中心点坐标为(15,50)进行坐标数值比较,确定出最小值为“1”;相应的,在第二坐标维度(y轴),确定出最小值为“50”,根据最小值为“1”和最小值为“50”组成一个新的向量Min(x)“(1,50)”。同理,在在第一坐标维度(x轴)、在第二坐标维度(y轴)能够确定出最大值组成的一个新向量Max(x)“(15,51)”。依据距离Din和距离Dout进而计算获得Point-box的距离。
需要理解的是,针对IRT三元组类型的向量转换模型进行一阶训练的过程中,向量转换模型自身存储有对应上实体点向量的“V1”的坐标(10,12)、属性值元素的盒向量“b1”的坐标(3,3;2,5)、以及反应实体点向量的“V1”与属性值元素的盒向量“b1”之间连接关系的属性关系“r1”双向量的坐标“(10,0;3,2)”。通过将实体点向量的“V1”的坐标(10,12)根据属性关系“r1”的双向量的坐标“(10,0;3,2)”进行向量间的关系映射处理,能够获得与上述实体点向量的“V1”的坐标对应的映射后实体点向量“V1’”的坐标(-10,12);进一步地,通过将属性值元素的盒向量“b1”的坐标(3,3;2,5)根据属性关系“r1”的双向量的坐标“(10,0;3,2)”进行向量间的关系映射处理,能够获得与上述属性值元素的盒向量“b1”对应的映射后的属性盒向量“b1’”的坐标(-22,33;9,7)。上述第三距离函数为点到盒距离函数(point-box的距离),通过计算映射后实体点向量“V1’”的坐标(-10,12)与映射后的属性盒向量“b1’”的坐标(-22,33;9,7)之间的距离,判断映射后实体点向量“V1’”的坐标与映射后的属性盒向量“b1’”的坐标之间的距离是否符合训练标准,在上述距离不符合预设的训练标准的情况下,对向量转换模型进行模型参数的调整。
若上述距离满足映射后实体点向量“V1’”的坐标能够落入或者接近映射后的属性盒向量“b1’”的坐标的情况下,则满足训练目标,将此时的向量转换模型作为一阶向量转换模型。为了便于理解映射后实体点向量“V1’”的坐标与映射后的属性盒向量“b1’”的坐标之间的距离,请参考图6的示意,图6为根据三元组数据类型计算向量距离的示意图。需要理解的是,该图中,tag box即为属性值元素的盒向量“b1”;概念box即为映射后的属性盒向量“b1’”;具体实施时,将属性值盒向量“b1”的中心点向量和关键点向量根据属性关系“r1”的关系映射处理(关系投影),获得与属性值盒向量“b1”对应的概念box;将实体点向量的“V1”根据属性关系“r1”映射处理,获得映射后实体点向量“V1’”(图6中示为item),根据点到盒距离函数,计算出映射后实体点向量“V1’”与概念box之间的point-to-box之间的距离。
通过上述步骤S202获得了用于用户推荐的一阶向量转换模型。
使用上述一阶向量转换模型,已经可以进行对象推荐;这是由于,该模型已经反映了知识库中提供的现实实际的内容,这样,当需要获取某个实体的某个属性关系下的属性值时,通过该模型转换后的向量就可以了解这些向量彼此之间的关系,就可以据此进行推荐,也就是,根据已知的知识库内容获得的该一阶向量转换模型,用来生成其他实体、属性、属性关系的向量,也能大概率的反映相互之间的真实关系,从而实现推荐。
进一步地,在上述一阶向量转换模型的基础上,进行进一步的训练,还可以获得更为精准的模型。进一步训练的方法包括:
步骤S301,使用所述一阶向量转换模型,获得对应各个元素的初始特征向量。
其中,所述使用所述一阶向量转换模型,获得对应各个元素的初始特征向量,包括实体点向量和属性盒向量。需要理解的是,上述初始特征向量中的实体点向量和属性盒向量为步骤S202中经过转移运算所获得的映射后实体点向量、映射后属性盒向量。例如,映射后第一实体点向量“V2’”、映射后第一属性盒向量“b3’”。具体实施时,本步骤所获得的映射后属性盒向量的数量为一个或多个,为了便于理解,参考图7的示意,图7为获得映射后属性盒向量的交集区域的示意图。如图所示,上述获得初始特征向量包括“b2”、“b3”、“b4”、“V2”,该“b2”、“b3”、“b4”为经过步骤S202的处理所获得的映射后的属性盒向量、“V2”为经过步骤S202的处理所获得的映射后的实体点向量。
步骤S302,根据下述训练目标对所述一阶向量转换模型进行训练获得二阶向量转换模型:所述实体对应的各个属性值所生产的属性盒向量,根据实体与该属性值之间的属性关系进行关系映射运算,获得映射后属性盒向量;所述实体点向量落入或者接近该实体的各个相关属性值的映射后属性盒向量的交集形成的交集区域。
需要理解的是,根据上述一阶向量转换模型,获得二阶向量转换模型的过程为模型的训练优化过程,在获得二阶向量转换模型的过程中,能够获得映射后属性盒向量的交集形成的交集区域。具体实施时,训练目标是为了使实体item落入或者接近其相关的tag交集形成的交集box中。
其中,所述对所述一阶向量转换模型进行训练获得二阶向量转换模型,包括:
获得各个实体的点向量,以及各个实体对应的属性盒向量根据属性关系进行关系映射运算获得的映射后属性盒向量;
将各个所述映射后属性盒向量,根据所述映射后属性盒向量的关键点向量进行筛选排序,获得所述映射后属性盒向量的交集区域;
以各个所述实体点向量落在所述映射后属性盒向量的交集区域,或者接近所述映射后属性盒向量的交集区域达到预定的阈值范围为训练目标,获所述二阶向量转换模型。
在本实施例中,获得映射后属性盒向量的交集区域的具体过程为:将步骤S301中获得的映射后的属性盒向量“b2”、“b3”、“b4”分别经过各自的属性关系的关系映射运算,例如,将映射后的属性盒向量“b2”经过属性关系“r2”的关系映射运算,得到与之对应的映射后盒向量“B2”;将映射后的属性盒向量“b3”经过属性关系“r1”的关系映射运算,得到与之对应的映射后盒向量“B3”;将映射后的属性盒向量“b4”经过属性关系“r3”的关系映射运算,得到与之对应的映射后盒向量“B4”;将上述各个映射后属性盒向量“B2”、“B3”、“B4”在每一个向量维度上,根据关键点向量的具体数值进行筛选排序,进而获得映射属性盒向量的交集区域。对上述根据关键点向量的具体数值进行筛选排序进行详细说明,如前所述,盒向量的关键点向量用于表示盒向量中心点向量(矩形中心点)到矩形顶点的矩形区域范围。由此可以理解,将表示盒向量矩形的矩形第一角点(右上角点)的坐标,作为box最大点;将表示盒向量矩形的矩形第二角点(左下角点)的坐标,作为box最小点。
获得映射属性盒向量的交集区域的矩形第一角点坐标、第二角点坐标的公式如下:
其中,表示映射后盒向量的矩形第一角点;/>表示映射后盒向量的矩形第二角点;Bmin,Bmax,Max(x)和Min(x)的含义与之前在介绍point-box距离公式(公式1-6至公式1-8)中的含义一致。例如,将多个映射后盒向量的中心点向量,根据第一坐标维度(x轴)的坐标数值比较,获得x轴的最大值和最小值;同时,根据第二坐标维度(y轴)的坐标数值比较,获得y轴的最大值和最小值;将x轴和y轴各自的最大值组成一个新的向量,将x轴和y轴各自的最小值组成一个新的向量;其中,由x轴和y轴各自的最大值组成的新的向量为上述/>由x轴和y轴各自的最小值组成的新的向量为上述/>
同时,由于盒向量在向量空间根据盒向量的中心点向量中心对称,因此,可根据Bmin,Bmax在此处可以反推得到Cen(B)和Off(B),其公式如下:
Cen(B)=(Bmin+Bmax)/2 公式1-11
Off(B)=(Bmax-Bmin)/2 公式1-12
其中,Cen(B)表示映射属性盒向量的交集区域的中心点向量,Off(B)表示映射属性盒向量的交集区域的关键点向量。
本实施例中,映射后属性盒向量“B2”、“B3”、“B4”均对应有各自的box最大点和box最小点。例如,映射后属性盒向量“B2”的box最大点的坐标为(12,22)、box最小点的坐标为(6,10),其中,坐标值“12”为第一坐标维度的具体数值、“22”为第二坐标维度的具体数值;映射后属性盒向量“B3”的box最大点的坐标为(10,100)、box最小点的坐标为(4,60);映射后属性盒向量“B4”的box最大点的坐标为(60,40)、box最小点的坐标为(2,6);在第一坐标维度上,选取各个映射后属性盒向量“B2”、“B3”、“B4”中,各个box最大点的坐标中最大和最小的数值,取出作为映射后属性盒向量的交集区域(box交集区域)在该维度上的坐标值;同理,在第二坐标维度上,选取各个映射后属性盒向量“B2”、“B3”、“B4”中,各个box最小点的坐标中最大的数值,取出作为映射后属性盒向量的交集区域(box交集区域)在该维度上的坐标值。由此获得映射后属性盒向量的交集区域(box交集区域)的矩形第一角点(右上角点)和矩形第二角点(左下角点)的坐标。
如图7所示,映射后属性盒向量的交集区域作为盒向量,该盒向量在图7中,在图中用符号表示。需要理解的是,上述获得映射后属性盒向量的交集区域(box交集区域)的过程为向量交集运算的过程,任意两个box向量的交集运算得到的仍为矩形box向量,这种交集运算的特性允许在任意数据的盒向量之间进行交集运算。
在一阶向量转换模型训练完成的基础上,进一步进行上述训练,要求向量转换模型经过本轮训练后,能够达到步骤S302的训练目标,即经过转移运算所获得的映射后实体点向量落入步骤S302的所述的映射后属性盒向量的交集区域(box交集区域)中,或者接近box交集区域达到预定的阈值范围;通过上述训练,可以在一阶向量转换模型的基础上,获得向量转换效果更好的二阶向量转换模型,从而实现更合理的推荐效果。
进一步地,在上述二阶向量转换模型的基础上,可以进一步训练,获得三阶向量转换模型;该三阶向量转换模型,可以直接针对用户进行对象推荐。
所述方法还包括:
步骤S401,获得目标用户的行为数据。
目标用户的行为数据包括目标用户的行为对象实体、行为对象属性值、行为对象属性关系;例如,目标用户点击、购买的相关行为数据,该行为数据中包行为对象商品、行为对象商品属性值、以及行为对象商品属性关系。上述目标用户的行为数据可以从目标用户的行为数据交互历史中获取;为了便于理解,继续参考图4中的示意,如图4所示,在目标用户的行为数据交互历史中,用户的行为对象实体,包括商品1(item1)、商品2(item2)、商品3(item3);与上述行为对象实体具有属性关系的行为对象属性值,包括tag1、tag2、tag3,tag4、tag5,上述行为对象实体与行为对象属性值之间的行为对象属性关系,包括r1、r2、r3、r4、r5。
步骤S402,根据所述目标用户的行为数据,在对应所述目标用户的行为所涉及的各实体中,选择部分实体作为训练实体,其余实体作为校验实体。
在本实施例的二阶向量转换模型进行训练的过程中,是基于目标用户的行为数据,包括目标用户的行为对象实体、行为对象属性值、行为对象属性关系的数据所完成的模型训练。需要理解的是,上述的数据作为二阶向量转换模型的输入数据,由于该数据是目标用户交互历史中的数据,因此在模型训练过程中,能够将部分数据作为训练数据,部分数据作为校验数据,以提高模型精确表达用户兴趣特征的准确性。具体实施时,在目标用户的行为对象实体中,选择部分实体作为训练实体,其余实体作为校验实体。
为了便于理解,进行举例说明。根据目标用户的行为数据,目标用户的行为对象实体共计10个,在上述10个行为对象实体中选择6个实体作为训练实体,其余剩下的4个实体作为校验实体。例如,将item1、item2…item6作为训练实体、将item7…item10作为校验实体。
步骤S403,采用所述二阶向量转换模型,获取目标训练实体的各个相关属性值根据属性关系进行关系映射运算后获得的映射后属性盒向量的交集形成的目标交集区域。
在本实施例中,所述目标训练实体为所述训练实体中选定的实体;并且,与所述目标训练实体相对应,能够形成关联的所述目标交集区域。即,本申请实施例中,所选定的目标训练实体能够形成与之对应的目标交集区域。举例来说,在训练实体item1、item2…item6中,选定item1作为目标训练实体,那么,将与item1相关的属性值根据属性关系的关系映射运算,能够获得与item1对应的目标交集区域“box交集区域1”;在训练实体item1、item2…item6中,选定item2作为目标训练实体,那么,将与item2相关的属性值根据属性关系的关系映射运算,能够获得与item2对应的目标交集区域“box交集区域2”;上述将属性值的属性盒向量根据属性关系进行关系映射运算的过程,请参考前述步骤的描述,此处不再赘述。
为了便于理解参考图8的示意,图8为本申请实施例获取目标用户的初阶兴趣特征向量的示意图。上述获取的交集形成的目标交集区域作为盒向量,该盒向量在图8中,在图中用符号表示,该盒向量同样由中心点向量和关键点向量组成;并且与目标用户的目标训练实体item1、item2…item6的各个相关属性值根据属性关系进行关系映射运算后获得的映射后属性盒向量的交集形成的目标交集区域分别有“b交集区域1”、“b交集区域2”…“b交集区域n=6”。
步骤S404,对所述目标用户的各目标训练实体的各目标交集区域进行第一运算处理,生成对应所述目标用户的初阶兴趣特征向量,所述初阶兴趣特征向量表达为盒向量。
上述第一运算处理包括:均值运算或方差运算等向量运算;本实施例以均值运算作为示意性举例。
为了便于理解,进行举例示意。假设用户交互过3个兴趣商品,这三个兴趣商品属性交集的盒向量分别为B1,B2,B3,那么表示目标用户的兴趣特征表达向量的盒向量I的第一运算处理的公式如下:
Cen(I)=(Cen(B1)+Cem(B2)+Cen(B3))/3 公式1-13
Off(I)=(Off(B1)+Off(B2)+Off(B3))/3 公式1-14
其中,Cen(Bx)表示兴趣商品属性交集的盒向量的中心点向量、Off(Bx)表示兴趣商品属性交集的盒向量的关键点向量、Cen(I)表示目标用户的兴趣特征表达向量对应盒向量I的中心点向量、Off(I)表示目标用户的兴趣特征表达向量对应盒向量I的关键点向量。
所述目标用户的初阶兴趣特征向量作为所述目标用户的兴趣特征表达向量,能够用于表示所述目标用户的兴趣特征。在本实施例中,参照图8的示意,上述目标用户的初阶兴趣特征(box初阶兴趣特征向量)用符号表示。通过将目标交集区域分别有“box交集区域1”、“box交集区域2”…“box交集区域n=6”整体进行向量的均值运算,进而获得目标用户的初阶兴趣特征(box初阶兴趣特征向量)。
需要理解的是,对于推荐模型而言,其本质在于捕捉用户兴趣并以此进行项目推荐,例如,商品推荐。现有的推荐模型往往缺乏精确刻画用户兴趣的能力,并且现有的用户兴趣特征表示方式在向量空间中也不能满足一对多的需求;即,不能将用户兴趣特征对应的多个商品实体进行同时展示。然而,在本实施例的目标用户的初阶兴趣特征的表示方式中,采用box embedding方式进行建模用户的初阶兴趣特征,所获得的目标用户的初阶兴趣特征的精准化程度高、并且基于该精确化的目标用户的初阶兴趣特征所推荐的项目显著性好。
步骤S405,以所述校验实体落入或者接近所述初阶兴趣特征向量表达的盒向量的区域作为训练目标,对所述二阶向量转换模型进行训练,获得三阶向量转换模型。
在本实施例中,对应图8的示意,上述校验实体作为候选对象(候选item)用点向量的符号表示;上述校验实体作为验证条件,通过校验实体的点向量(候选item)落入或者接近目标用户的初阶兴趣特征(box初阶兴趣特征向量)的盒向量作为训练目标,对上述二阶向量转换模型进行训练;在满足校验实体(候选item)落入或者接近目标用户的初阶兴趣特征(box初阶兴趣特征向量)时,将此时的二阶向量转换模型作为三阶向量转换模型。需要理解的是,经过第一运算处理获得的目标用户的初阶兴趣特征向量,仍为盒向量。
其中,所述以所述校验实体落入或者接近所述初阶兴趣特征向量表达的盒向量的区域作为训练目标,对所述二阶向量转换模型进行训练,获得三阶向量转换模型,包括:
根据所述第三距离函数,计算所述目标用户的校验实体点向量与所述目标用户的兴趣特征向量的距离;
根据所述目标用户的校验实体点向量与所述目标用户的兴趣特征向量的距离,判断各个校验实体点向量与所述兴趣特征向量的距离是否符合训练目标;
将上述步骤获得的结果,作为对所述二阶向量转换模型进行调整的依据。
具体实施时,通过根据点到盒距离函数(point-box的距离),计算作为校验实体的点向量与目标用户的初阶兴趣特征(box初阶兴趣特征向量)之间的距离,在上述距离满足训练目标的情况下才能获得三阶向量转换模型。
通过本实施例的上述推荐模型训练方法,将所搜集的信息进行向量化表达,并且属性值的特征向量表达为盒向量(属性盒向量)、实体的特征向量表达为点向量(实体点向量),可以实现三元组数据中各元素之间的相互关系表达更加清楚、明晰;进一步地,该处理过程训练获得的推荐模型,可精确刻画用户兴趣特征、并且模型推荐效果好。
第二实施例
上述第一实施例提供一种推荐模型训练方法,与之相对应的,本申请第二实施例还提供了一种推荐模型训练装置,由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关的技术特征的细节部分以及实现效果部分请参见上述提供的方法实施例的对应说明即可,下述对装置实施例的描述仅仅是示意性的。
请参考图9理解该实施例,图9为本实施例提供的推荐模型训练装置的单元框图,如图9所示,本实施例提供的装置900包括:
处理单元901,被配置为将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据。
构建单元902,被配置为以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型;其中,对应所述属性值的特征向量表达为盒向量,该盒向量称为属性盒向量;对应所述实体的特征向量表达为点向量,该点向量称为实体点向量。
第三实施例
在上述的实施例中,提供了多种方法以及各方法对应的装置,此外,本申请实施例还提供与上述方法实施例和装置实施例相对应的电子设备实施例,由于电子设备实施例基本相似于方法实施例,所以描述得比较简单,相关的技术特征的细节部分以及实现的效果请参见上述提供的方法实施例的对应说明即可,下述对电子设备实施例的描述仅仅是示意性的。该电子设备实施例如下:
请参考图10理解上述电子设备,图10为电子设备的示意图。本实施例提供的电子设备包括:在本实施例中,如图10所示,本实施例提供的电子设备包括:处理器1001和存储器1002、通信总线1003和通信接口1004。所述处理器1001,用于执行所述一条或多条计算机指令,以实现上述各方法实施例的各步骤。所述存储器1002用于存储数据处理的一条或多条计算机指令。所述通信总线1003,用于连接挂载在其上的处理器1001、存储器1002。所述通信接口1004,用于为处理器1001、存储器1002提供连接接口。
第四实施例
在上述的实施例中,提供了多种方法以及各方法对应的装置,此外,本申请实施例还提供用于实现上述方法的计算机可读存储介质。本申请提供的计算机可读存储介质实施例描述得比较简单,相关部分请参见上述方法实施例的对应说明即可,下述描述的实施例仅仅是示意性的。本实施例提供的计算机可读存储介质上存储有计算机指令,该指令被处理器执行时实现上述方法实施例所示的步骤,在此不再赘述。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。

Claims (10)

1.一种推荐模型训练方法,其特征在于,包括:
将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据;
以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型;其中,对应所述属性值的特征向量表达为盒向量,该盒向量称为属性盒向量;对应所述实体的特征向量表达为点向量,该点向量称为实体点向量。
2.根据权利要求1所述的推荐模型训练方法,其特征在于,所述方法还包括:
使用所述一阶向量转换模型,获得对应各个元素的初始特征向量;
根据下述训练目标对所述一阶向量转换模型进行训练获得二阶向量转换模型:所述实体对应的各个属性值所生成的属性盒向量,根据实体与该属性值之间的属性关系进行关系映射运算,获得映射后属性盒向量;所述实体点向量落入或者接近该实体的各个相关属性值的映射后属性盒向量的交集形成的交集区域。
3.根据权利要求2所述的推荐模型训练方法,其特征在于,所述方法还包括:
获得目标用户的行为数据;
根据所述目标用户的行为数据,在对应所述目标用户的行为所涉及的各实体中,选择部分实体作为训练实体,其余实体作为校验实体;
采用所述二阶向量转换模型,获取目标训练实体的各个相关属性值根据属性关系进行关系映射运算后获得的映射后属性盒向量的交集形成的目标交集区域;
对所述目标用户的各目标训练实体的各目标交集区域进行第一运算处理,生成对应所述目标用户的初阶兴趣特征向量,所述初阶兴趣特征向量表达为盒向量;
以所述校验实体落入或者接近所述初阶兴趣特征向量表达的盒向量的区域作为训练目标,对所述二阶向量转换模型进行训练,获得三阶向量转换模型。
4.根据权利要求1所述的推荐模型训练方法,其特征在于,所述三元组数据包括第一元素、第二元素和第三元素,其中,第二元素为属性关系元素,第一元素、第三元素分别可以为实体元素或者属性值元素,形成的三元组数据类型包括如下类型中的任意一种或者多种:第一实体-属性关系-第二实体三元组数据、第一属性值-属性关系-第二属性值三元组数据、实体-属性关系-属性值三元组数据。
5.根据权利要求4所述的推荐模型训练方法,其特征在于,所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型,所述训练目标包括:根据所述三元组数据的类型,使通过所述向量转换模型获得的三元组数据中第一元素对应的向量,能够通过与所述属性关系对应的向量之间的转移运算,获得第三元素对应的向量。
6.根据权利要求4所述的推荐模型训练方法,其特征在于,若所述三元组数据的类型为第一实体-属性关系-第二实体三元组数据,则所述以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标的步骤中,针对该类型三元组数据要求达成如下训练目标:所生成的对应于所述第一实体的点向量,通过与所述属性关系对应的特征向量的关系映射运算,能够获得所述第二实体,或者接近所述第二实体并达到预设的阈值范围内。
7.根据权利要求6所述的推荐模型训练方法,其特征在于,为达成所述训练目标,对于每组第一实体-属性关系-第二实体三元组数据,分别进行如下处理:
获得所述第一实体-属性关系-第二实体三元组数据中,对应所述第一实体的第一实体点向量和对应所述第二实体的第二实体点向量;
将所述第一实体点向量,与所述属性关系对应的特征向量进行关系映射处理,获得映射后第一实体点向量;
根据第一距离函数,计算所述映射后第一实体点向量与所述第二实体点向量的距离;
根据所述映射后第一实体点向量与所述第二实体点向量的距离,以预设的训练标准,判断所述距离是否符合训练目标;
对各组第一实体-属性关系-第二实体三元组数据进行上述处理后,将各组数据是否符合训练目标的情况,作为对所述向量转换模型进行调整的依据。
8.一种推荐模型训练装置,其特征在于,包括:
处理单元,被配置为将所搜集的信息形成反映实体、属性值、属性关系彼此之间联系的三元组数据;
构建单元,被配置为以生成的特征向量反映所述三元组数据中各个元素的相互关系为训练目标,对向量转换模型进行一阶训练,获得一阶向量转换模型;其中,对应所述属性值的特征向量表达为盒向量,该盒向量称为属性盒向量;对应所述实体的特征向量表达为点向量,该点向量称为实体点向量。
9.一种电子设备,其特征在于,包括处理器和存储器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有一条或多条计算机指令,其特征在于,该指令被处理器执行以实现如权利要求1-7中任一项所述的方法。
CN202310576392.5A 2023-05-17 2023-05-17 一种推荐模型训练方法、装置及电子设备 Pending CN116975625A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310576392.5A CN116975625A (zh) 2023-05-17 2023-05-17 一种推荐模型训练方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310576392.5A CN116975625A (zh) 2023-05-17 2023-05-17 一种推荐模型训练方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN116975625A true CN116975625A (zh) 2023-10-31

Family

ID=88473818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310576392.5A Pending CN116975625A (zh) 2023-05-17 2023-05-17 一种推荐模型训练方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116975625A (zh)

Similar Documents

Publication Publication Date Title
US20230005178A1 (en) Method and apparatus for retrieving target
US10409856B2 (en) Approaches for associating terms with image regions
US9269049B2 (en) Methods, apparatus, and systems for using a reduced attribute vector of panel data to determine an attribute of a user
CN110162711B (zh) 一种基于网络嵌入法的资源智能推荐方法及系统
CN111353862B (zh) 商品的推荐方法和装置、电子设备和存储介质
Li et al. Densely constrained depth estimator for monocular 3d object detection
Paleti et al. Approaching the cold-start problem using community detection based alternating least square factorization in recommendation systems
CN114565916A (zh) 目标检测模型训练方法、目标检测方法以及电子设备
Xu et al. Feature-preserving simplification framework for 3D point cloud
Gültekin et al. Smart location-based mobile shopping Android application
US9342577B2 (en) Preference-based data representation framework
Xie et al. Similarity search of spatiotemporal scenario data for strategic air traffic management
CN116975625A (zh) 一种推荐模型训练方法、装置及电子设备
Wang et al. A study of 3D model similarity based on surface bipartite graph matching
CN110992109B (zh) 基于关联规则的房地产客户分析方法、装置及存储介质
CN114491086A (zh) 服饰个性化搭配推荐方法、系统、电子设备及存储介质
CN114332472A (zh) 一种基于图神经网络的数据处理方法及装置
CN110136258B (zh) 一种环境空间标识的确定方法、装置、设备及存储介质
CN114429384A (zh) 基于电商平台的产品智能推荐方法及系统
CN111428741B (zh) 网络社区的发现方法、装置、电子设备及可读存储介质
CN113327154A (zh) 基于大数据的电商用户讯息推送方法及系统
Guiming et al. Internet of things control mechanism based on controlled object information perception and multimode image signal processing
KR20210065551A (ko) 제품과 사용자의 매칭을 위한 전자 장치 및 이를 포함하는 매칭 시스템
Antanas et al. Relational kernel-based grasping with numerical features
Tamas Hierarchical Clustering based on IndoorGML Document

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination