CN111198988B - 业务推荐方法、训练方法、装置、计算机设备和存储介质 - Google Patents
业务推荐方法、训练方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111198988B CN111198988B CN201911360935.XA CN201911360935A CN111198988B CN 111198988 B CN111198988 B CN 111198988B CN 201911360935 A CN201911360935 A CN 201911360935A CN 111198988 B CN111198988 B CN 111198988B
- Authority
- CN
- China
- Prior art keywords
- vector
- service
- attribute
- user
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000013598 vector Substances 0.000 claims abstract description 775
- 230000006399 behavior Effects 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 13
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 8
- 238000013499 data model Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及数据分析领域,通过根据目标用户的画像标签获取候选业务,实现将候选业务推荐给目标用户,推荐准确度较高,提高了用户的体验度。尤其涉及一种业务推荐方法、训练方法、装置、计算机设备和存储介质,该业务推荐方法包括:获取目标用户的身份标识,根据身份标识获取目标用户对应的画像标签;基于向量查询模型,根据画像标签确定目标用户对应的用户向量;获取候选的业务标签,基于向量查询模型,确定业务标签对应的候选业务向量;计算业务标签对应的候选业务向量与用户向量之间的向量距离,若向量距离不大于预设阈值,将候选业务向量对应的候选业务推送至目标用户的终端。
Description
技术领域
本申请涉及数据分析领域,尤其涉及一种业务推荐方法、训练方法、装置、计算机设备和存储介质。
背景技术
产品及内容推荐是人工智能的一个重要落地场景,现有的产品或内容推荐方法主要是基于用户相似度或基于物品相似度的协同过滤。
这些方法大都是基于用户历史上与多款产品产生交互的数据基础上,在应用推广初期,包含用户与产品的对应关系的数据往往较为稀疏,导致现有技术往往不能很好地应用于这种场景。另外,在使用协同过滤方法中,需要人为定义距离,不管是使用余弦距离还是其他距离进行估算,往往都带有主观性。
发明内容
本申请提供了一种业务推荐方法、训练方法、装置、计算机设备和存储介质,根据画像标签向目标用户推荐候选业务,推荐准确度较高。
第一方面,本申请提供了一种业务推荐方法,所述方法包括:
获取目标用户的身份标识,根据所述身份标识获取所述目标用户对应的画像标签;
基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量;
获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量;
计算所述业务标签对应的候选业务向量与所述用户向量之间的向量距离,若所述向量距离不大于预设阈值,将所述候选业务向量对应的候选业务推送至所述目标用户的终端。
第二方面,本申请还提供了一种向量查询模型的训练方法,所述训练方法包括:
确定初始的向量查询模型;
获取多个样本用户的画像标签和业务购买记录,根据各所述样本用户的画像标签和业务购买记录构建各样本用户的关系图谱,所述关系图谱包括所述画像标签对应的属性三元组和所述业务购买记录对应的业务三元组,其中所述属性三元组包括用户标签、属性标签和属性值标签;所述业务三元组包括用户标签、业务标签以及用于表示所述用户标签和所述业务标签之间关系的购买行为标签;
基于所述初始的向量查询模型,确定所述属性三元组、业务三元组中各标签对应的向量,得到所述属性三元组对应的属性三元向量和所述业务三元组对应的业务三元向量;
基于所述属性三元向量、所述业务三元向量的三元向量约束条件,调整所述初始的向量查询模型的模型参数,所述模型参数与所述属性三元向量、所述业务三元向量中的各分量对应。
第三方面,本申请还提供了一种业务推荐装置,所述装置包括:
画像标签获取模块,用于获取目标用户的身份标识,根据所述身份标识获取所述目标用户对应的画像标签;
用户向量查询模块,用于基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量;
业务向量查询模块,用于获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量;
业务推荐模块,用于计算所述业务标签对应的候选业务向量与所述用户向量之间的向量距离,若所述向量距离不大于预设阈值,将所述候选业务向量对应的候选业务推送至所述目标用户的终端。
第四方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的业务推荐方法和/或训练方法。
第五方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的业务推荐方法和/或训练方法。
本申请公开了一种业务推荐方法、训练方法、装置、计算机设备和存储介质,通过获取目标用户的身份标识,根据身份标识获取目标用户对应的画像标签,可以保证在数据稀疏的场景下也可以获取用户的相关数据;基于向量查询模型,根据画像标签确定目标用户对应的用户向量,实现将离散的画像标签转换到连续的向量空间,可以充分挖掘标签数据的非线性关系;通过获取候选的业务标签,基于向量查询模型,可以确定业务标签对应的候选业务向量;计算业务标签对应的候选业务向量与用户向量之间的向量距离,可以实现将候选业务向量与用户向量相互结合使用,避免主观定义距离,若向量距离不大于预设阈值,将候选业务向量对应的候选业务推送至目标用户的终端,推荐准确度高,可以提高用户的体验度。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的实施例提供的一种业务推荐方法的示意流程图;
图2是图1中确定用户向量的子步骤示意流程图;
图3是本申请的实施例提供的一种关系图谱的场景示意图;
图4是本申请的实施例提供的另一种关系图谱的场景示意图;
图5是本申请的实施例提供的获取用户向量的场景示意图
图6是本申请的实施例提供的获取候选业务向量的场景示意图;
图7是本申请的实施例提供的向目标用户推荐候选业务的场景示意图;
图8是本申请实施例提供的一种向量查询模型的训练方法的示意流程图;
图9为图8中调整模型参数的子步骤示意流程图;
图10为本申请实施例提供的一种业务推荐装置的示意性框图;
图11为图10中业务推荐装置的子模块的示意性框图;
图12为本申请实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请的实施例提供了一种业务推荐方法、训练方法、装置、计算机设备和存储介质。其中,该业务推荐方法可以应用于服务器中,实现根据用户的画像标签向用户推荐候选业务;该训练方法可以应用于服务器或终端中,可以实现根据三元向量约束条件调整初始的向量查询模型的模型参数,得到训练好的向量查询模型。
其中,服务器可以为独立的服务器,也可以为服务器集群。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
如图1所示,业务推荐方法包括步骤S10至步骤S40。
步骤S10、获取目标用户的身份标识,根据所述身份标识获取所述目标用户对应的画像标签。
具体地,服务器通过终端获取目标用户的身份标识,根据所述身份标识获取所述目标用户对应的画像标签。
示例性的,所述服务器监测到有用户登陆终端时,将所述终端对应的用户标记为目标用户。
示例性的,所述身份标识可以包括目标用户的姓名、性别、身份证号、手机号、终端设备账号或终端ID等。
示例性的,所述终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
在一些实施例中,当有用户使用终端的APP或网页时,所述服务器将所述终端对应的用户标记为目标用户。所述终端可以通过与所述服务器后端接口对应的前端埋点采集所述目标用户输入的数据,例如所述目标用户输入的姓名、性别或终端ID等身份标识。所述终端将前端埋点采集的数据发送给所述服务器,所述服务器可以得到所述目标用户的身份标识。
通过在终端采集数据,服务器可以快速获取目标用户的身份标识,不易察觉,避免目标用户的反感。
具体地,所述服务器将所述目标用户的身份标识输入大数据模型,获取与所述身份标识对应的画像标签,得到所述目标用户对应的画像标签。
需要说明的是,大数据模型可以通过降维、回归、聚类、分类和关联等操作处理所述目标用户的身份标识。通过一系列操作处理,大数据模型可以输出若干所述身份标识对应的画像标签。
示例性的,大数据模型根据所述身份标识中的用户姓名、用户性别、身份证、手机号、终端设备账号或终端ID进行分析,得到所述目标用户对应的标签集合,例如所述目标用户的职业为IT开发员、性别为男、年龄为30岁、终端操作系统为安卓系统、兴趣爱好为玩游戏等。
可以理解的,在所述目标用户对应的标签集合中,每个标签分别描述了所述目标用户的一个维度,各个维度之间相互联系,共同构成对所述目标用户的一个整体描述。
示例性的,在所述目标用户的标签集合中,所述服务器选取至少一个标签作为所述目标用户对应的画像标签。例如,将用户A性别为男和用户A年龄为30岁两个标签作为所述目标用户对应的画像标签。
通过大数据模型,可以根据身份标识获取用于描述所述目标用户的一些特征属性的画像标签,保证在数据稀疏的场景下也可以通过大数据模型获取与所述目标用户相关的数据。
步骤S20、基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量。
可以理解的是,所述向量查询模型是训练好的向量查询模型,通过所述向量查询模型,可以查询到标签对应的向量。
示例性的,所述服务器根据所述画像标签,查询所述画像标签在所述训练好的向量查询模型中对应的向量,得到所述目标用户对应的用户向量。
具体地,在查询所述画像标签对应的向量之前,还需要将所述画像标签用关系图谱进行表示,然后将所述画像标签对应的关系图谱输入所述训练好的向量查询模型,可以得到所述画像标签对应的向量,即用户向量。
示例性的,关系图谱用G(V,E,T)表示,其中的V和T分别表示相邻的头节点和尾节点,E代表关系或边。
可以理解的,关系图谱包括相邻的头节点、尾节点与头节点和尾节点之间的边,也可以包括多对相邻的头节点、尾节点和多个边。例如,相邻的两个头节点、尾节点可以是用户标签和属性值标签,边可以是用户标签与属性值标签之间的属性标签。
将离散的画像标签经向量查询模型转换到连续的向量空间,可以利用嵌入空间内的向量距离,实现充分挖掘出画像标签内在的非线性关系。
请参阅图2,步骤S20中于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量,包括以下步骤S21至步骤S23。
步骤S21、根据所述目标用户的画像标签生成所述目标用户对应的关系图谱,所述关系图谱包括若干属性三元组,各所述属性三元组各自包括用户标签、属性标签和属性值标签,所述属性标签用于表示所述用户标签与所述属性值标签之间的关系。
需要说明的是,所述关系图谱中属性三元组的个数与所述目标用户的画像标签的个数一一对应。若所述目标用户只有一个画像标签,则所述关系图谱包括一个属性三元组;若所述目标用户有多个画像标签,则所述关系图谱包括多个属性三元组。
示例性的,所述属性三元组包括用户标签、属性标签和属性值标签。例如,对于“用户A性别为男”这一画像标签,在属性三元组中,可以表示为(用户A,性别,性别为男),其中“用户A”是用户标签,“性别”是属性标签,“性别为男”是属性值标签。
在一些实施例中,如图3所示,将“用户A性别为男”这一画像标签生成关系图谱。得到的关系图谱包括一个属性三元组(用户A,性别,性别为男),其中头节点V1表示用户标签“用户A”,尾节点T1表示属性值标签“性别为男”,边E1表示属性标签“性别”,边E1用于表示头节点V1和尾节点T1之间的属性。
在另一些实施例中,如图4所示,将“用户A性别为男”和将“用户A年龄为30岁”两个画像标签生成关系图谱;得到的关系图谱包括两个属性三元组:(用户A,性别,性别为男)和(用户A,年龄,年龄为30岁),其中头节点V1表示用户标签用户A,尾节点T1表示属性值标签“性别为男”,边E1表示属性标签“性别”;头节点V2表示用户标签“用户A”,尾节点T2表示属性值标签“年龄为30岁”,边E2表示属性标签“年龄”。
步骤S22、基于所述向量查询模型,查询各所述属性三元组中的属性标签对应的属性向量和各所述属性三元组中的属性值标签对应的属性值向量。
具体地,属性三元组通过所述训练好的向量查询模型,可以得到所述属性三元组对应的属性三元向量。示例性的,属性三元组(用户标签,属性标签,属性值标签)对应的属性三元向量为(V,E,T)。
其中,属性三元组包括三个标签,属性三元向量包括三个向量,而且属性三元组中的标签与属性三元向量的向量一一对应。
在向量空间中,各属性三元组对应的属性三元向量有如下的三元向量约束条件:
V+E=T,
式中,V表示用户向量,E表示属性向量,T表示属性值向量。
可以理解的是,各所述属性三元组中的属性标签在所述训练好的向量查询模型中查询对应的向量,得到所述属性标签对应的属性向量;同样,可以得到各所述属性三元组中的属性值标签对应的属性值向量。
在一些实施例中,所述服务器将所述关系图谱中的标签:“性别”、“性别为男”、“年龄”、“年龄为30岁”分别输入所述训练好的向量查询模型中,得到所述标签对应的向量。例如,属性标签“性别”对应的属性向量为E1,属性值标签“性别为男”对应的属性值向量为T1,属性标签“年龄”对应的属性向量为E2,属性值标签“年龄为30岁”对应的属性值向量为T2。
需要说明的是,将每个属性三元组中的用户标签输入所述训练好的向量查询模型,可以得到该用户标签对应的一个用户向量,例如画像标签“用户A性别为男”中的用户向量为V1,画像标签“用户A年龄为30岁”中的用户向量为V2。
可以理解的是,虽然画像标签“用户A性别为男”和画像标签“用户A年龄为30岁”中的用户标签都是“用户A”,但是根据三元向量约束条件得到的用户向量是不一样的,例如用户向量V1、V2。
通过将目标用户的属性三元组输入训练好的向量查询模型中,可以快速得到属性三元组对应的属性三元向量,实现将目标用户的画像标签转换成向量,可以挖掘画像标签之间的非线性关系。
步骤S23、根据各所述属性向量和各所述属性值向量确定所述目标用户对应的用户向量。
具体地,由于上述得到各属性三元组对应的属性三元向量,其中各属性三元向量都包括一个用户向量且各属性三元向量中的用户向量是不相同的,因此所述服务器需要根据属性三元向量的三元向量约束条件确定所述目标用户对应的用户向量。
示例性的,在属性三元向量的三元向量约束条件中有V=T-E的关系,因此所述服务器可以根据各所述属性向量和各所述属性值向量确定所述目标用户对应的用户向量。
具体地,若所述目标用户对应的关系图谱包括一个属性三元组,所述服务器计算所述属性值向量与属性向量之间的向量差,得到所述目标用户对应的用户向量。
在一些实施例中,若所述目标用户对应的关系图谱包括一个属性三元组,例如属性三元组(用户A,性别,性别为男)对应的属性三元向量为(V1,E1,T1)。所述服务器根据所述属性三元向量中的属性值向量T1与属性向量E1之间的向量差T1-E1,得到所述属性三元向量中的用户向量V1=T1-E1。
具体地,若所述目标用户对应的关系图谱包括多个属性三元组,所述服务器分别计算每一所述属性三元组中属性值向量与属性向量之间的向量差,对各所述属性三元组对应的向量差取均值,得到所述目标用户对应的用户向量。
在一些实施例中,如图5所示,图5是获取用户向量的场景示意图。若所述目标用户对应的关系图谱包括两个属性三元组,例如属性三元组(用户A,性别,性别为男)和(用户A,年龄,年龄为30岁),对应的属性三元向量分别为(V1,E1,T1)和(V2,E2,T2)。所述服务器分别计算所述属性值向量T1与属性向量E1之间的向量差以及所述属性值向量T2与属性向量E2之间的向量差,然后对各向量差取均值,得到所述目标用户对应的用户向量。
通过根据三元向量约束条件,可以通过属性三元向量中的属性向量与属性值向量之间的向量差计算得到目标用户的用户向量。
步骤S30、获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量。
示例性的,所述服务器可以通过数据库获取多个业务标签,将所述业务标签作为候选的业务标签。所述业务标签可以用业务三元组表示,例如业务标签“用户A购买航空延误险”对应的业务三元组为(用户A,购买,航空延误险),其中“用户A”是用户标签,“购买”是购买行为标签,“航空延误险”是购买业务标签。
需要说明的是,从所述候选的业务标签中可以确定业务标签对应的候选业务向量,进而得到向所述目标用户推荐的候选业务。
具体地,基于所述向量查询模型,所述服务器获取所述向量查询模型中与所述业务标签对应的业务三元向量,所述业务三元向量包括购买行为向量和购买业务向量。
示例性的,所述服务器将获取的所述候选的业务标签输入所述向量查询模型中进行查询,得到所述业务标签对应的业务三元向量。例如业务标签对应的业务三元向量(Vuser,Ebuy,Tproduct),其中分量Vuser表示用户向量,分量Ebuy表示购买行为向量,分量Tproduct表示购买业务向量。
在一些实施例中,所述服务器将业务三元组(用户A,购买,航空延误险)输入所述向量查询模型中进行查询,得到所述业务三元组对应的业务三元向量为其中表示用户标签“用户A”对应的用户向量,购买行为标签“购买”对应的购买行为向量,Tp1roduct表示购买业务标签“航空延误险”对应的购买业务向量。
具体地,所述服务器根据所述业务标签对应的购买行为向量和购买业务向量,生成所述业务标签对应的候选业务向量。
在本申请的实施例中,将业务标签对应的候选业务向量定义为所述业务标签对应的购买行为向量和购买业务向量之间的向量差。
示例性的,所述服务器根据所述购买业务向量与所述购买行为向量之间的向量差,确定所述候选业务标签对应的候选业务向量。例如,若所述候选业务向量为S,购买行为向量为Ebuy,分量表示购买业务向量为Tproduct,则根据所述购买业务向量Tproduct和所述购买行为向量Ebuy之间的向量差Tproduct-Ebuy,可以得到所述候选业务向量S=Tproduct-Ebuy。
在另一些实施例中,如图6所示,图6是获取候选业务向量的场景示意图。
示例性的,若业务标签有多个,例如所述多个业务标签对应的业务三元组分别为(用户A,购买,航空延误险)、(用户B,购买,车辆车损险)、(用户A,购买,车辆涉水险),各业务三元组对应的业务三元向量分别为则所述服务器可以得到所述多个业务标签对应的候选业务向量分别为
可以理解的,每一业务标签都有对应的候选业务向量,通过候选业务向量可以获取与业务标签对应的候选业务。
示例性的,业务标签“用户A购买航空延误险”对应候选业务向量SA,通过候选业务向量SA可以获取与该候选业务向量SA对应的候选业务,例如“航空延误险”。在向目标用户推荐业务时,可以将候选业务“航空延误险”推荐给目标用户。
通过在向量查询模型中查询业务标签对应的业务三元向量,可以得到业务标签对应的购买行为向量和购买业务向量,进而根据购买行为向量和购买业务向量计算得到业务标签对应的候选业务向量,可以实现将候选业务向量对应的候选业务推荐给目标用户。
步骤S40、计算所述业务标签对应的候选业务向量与所述用户向量之间的向量距离,若所述向量距离不大于预设阈值,将所述候选业务向量对应的候选业务推送至所述目标用户的终端。
请参阅图7,图7是向目标用户推荐候选业务的场景示意图。
具体地,上述得到所述目标用户对应的用户向量V0,所述业务标签对应的候选业务向量可以包括SA、SB、SC。所述服务器根据距离算法计算所述业务标签对应的候选业务向量与所述用户向量之间的向量距离,并生成所述目标用户对应的候选业务向量表。
示例性的,距离算法可以包括欧式距离、曼哈顿距离、切比雪夫距离或闵可夫斯基距离等,其中欧式距离是最容易直观理解的距离度量方法。在本申请的实施例中,根据欧式距离算法计算候选业务向量与用户向量之间的向量距离。
可以理解的,通过欧式距离算法计算任意两个向量之间的距离,可以得到任意两个向量之间的相似度。若两个向量的距离越小,则说明两个向量越相似;若两个向量的距离越大,则说明两个向量的相似性越弱。
在一些实施例中,若用户向量V0为(x1,y1),候选业务向量SA为(x2,y2);根据欧式距离算法,计算用户向量V0和候选业务向量SA之间的距离,得到的距离d12如下所示:
若用户向量V0与候选业务向量SA之间的距离d12越小,则用户向量V0与候选业务向量SA相似度越高,说明候选业务向量SA对应的候选业务与目标用户越匹配。
类似的,用户向量V0分别与候选业务向量SB、候选业务向量SC、候选业务向量SD进行计算欧式距离,得到的距离分别为d13、d14、d15。
具体地,所述服务器根据各候选业务向量对应的距离生成所述目标用户对应的候选业务向量表,如表1所示:
表1为候选业务向量表
候选业务向量 | 距离 |
SA | d12 |
SB | d13 |
SC | d14 |
SD | d15 |
具体地,所述服务器根据预设阈值对所述候选业务向量对应的向量距离进行筛选,若所述向量距离不大于预设阈值,将所述候选业务向量对应的候选业务推送至所述目标用户的终端。
示例性的,所述预设阈值可以是0.5。
在一些实施例中,所述服务器对各候选业务向量对应的向量距离进行升序排序后,将向量距离大于0.5的候选业务向量删除。例如,若距离d13和距离d15大于0.5,则将候选业务向量SB和候选业务向量SD从所述候选业务向量表中删除,得到新的候选业务向量表,如表2所示:
表2为候选业务向量表
候选业务向量 | 距离 |
SA | d12 |
SC | d14 |
表中,距离d12与距离d14都不大于0.5,且d12<d14。
将向量距离大于预设阈值的候选业务向量过滤,可以去除与用户向量的向量距离过大的候选业务向量,使剩余的候选业务向量都与用户向量有较大的相似度,保证后续对目标用户进行候选业务的精准推荐,提高推荐准确率。
具体地,所述服务器可以根据所述候选业务向量表中的候选业务向量得到对应的候选业务,生成所述目标用户对应的候选业务列表。
由于候选业务向量是由业务标签经所述向量查询模型查询得到的,业务标签与候选业务一一对应,因此可以根据业务标签得到候选业务向量对应的候选业务。示例性的,在候选业务列表中,候选业务分量SA对应的候选业务为A,候选业务分量SC对应的候选业务为C,如表3所示:
表3为候选业务列表
候选业务分量 | 候选业务 |
SA | A |
SC | C |
在一些实施例中,所述服务器将所述候选业务列表中的候选业务A和候选业务C向所述目标用户对应的终端发送,以将候选业务A和候选业务C推荐给目标用户。
通过计算候选业务向量与用户向量之间的向量距离,可以得到目标用户对应的候选业务列表,可以确保候选业务列表中的候选业务与目标用户是匹配,保证推荐的候选业务符合目标用户的需求,提高了用户体验度。
上述实施例提供的业务推荐方法,通过获取目标用户的身份标识,可以查询到目标用户的画像标签;通过向量查询模型,得到目标用户的关系图谱对应的属性三元向量,通过属性三元向量中的属性向量与属性值向量可以计算得到目标用的用户向量,实现将画像标签转换成连续的向量,可以充分挖掘画像标签内在的非线性关系;根据向量查询模型得到业务标签对应的购买行为向量与购买业务向量,计算得到业务标签对应的候选业务向量,可以提高后续的业务推荐的准确度;通过计算候选业务向量与用户向量之间的向量距离,得到候选业务向量表,将向量距离不大于预设阈值的候选业务向量对应的候选业务推送至目标用户的终端,保证推荐的候选业务符合目标用户的需求,提高了用户的体验度。
请参阅图8,图8是本申请的实施例提供一种向量查询模型的训练方法的示意性流程图。所述训练方法,包括步骤S101至步骤S104。
步骤S101、确定初始的向量查询模型。
示例性的,所述初始的向量查询模型用于查询任一关系图谱中的头节点、尾节点以及边对应的向量,可以获取属性三元组对应的属性三元向量以及业务三元组对应的业务三元向量。
示例性的,所述服务器将样本用户对应的标签构建成关系图谱,将关系图谱输入所述初始的向量查询模型中,得到所述关系图谱对应的三元向量。所述向量查询模型的训练过程就是根据三元向量约束条件对所述向量查询模型中三元向量对应的参数进行调整,得到训练好的向量查询模型。
其中,所述三元向量约束条件是指三元向量中各个分量的向量约束关系。例如所述三元向量为(V,E,T),则所述三元向量中的3个分量满足所述三元向量约束条件V+E=T。
步骤S102、获取多个样本用户的画像标签和业务购买记录,根据各所述样本用户的画像标签和业务购买记录构建各样本用户的关系图谱,所述关系图谱包括所述画像标签对应的属性三元组和所述业务购买记录对应的业务三元组,其中所述属性三元组包括用户标签、属性标签和属性值标签;所述业务三元组包括用户标签、购买业务标签以及用于表示所述用户标签和所述购买业务标签之间关系的购买行为标签。
具体地,所述服务器可以通过终端获取多个样本用户的画像标签与业务购买记录。
示例性的,画像标签可以包括:用户A性别为男、用户A年龄为30岁、用户A职业为IT开发员、用户A爱好玩游戏、用户B性别为女、用户B年龄为25岁、用户B喜欢看电视、用户B喜欢网上购物、用户C性别为女、用户C年龄为28岁、用户C喜欢看浏览新闻、用户C喜欢旅行等等。
示例性的,业务购买记录可以包括:用户A购买汽车车票、用户A购买飞机机票、用户B购买高铁车票、用户B购买人身寿险、用户C购买人身意外险、用户C购买飞机机票、用户C购买航空延误险等等。
具体地,所述服务器将根据各所述样本用户的画像标签和业务购买记录构建各样本用户的关系图谱。
其中,所述关系图谱包括所述画像标签对应的属性三元组和所述业务购买记录对应的业务三元组。
示例性的,画像标签“用户A年龄为30岁”对应的属性三元组为(用户A,年龄,年龄为30岁);画像标签“用户B喜欢看电视”对应的属性三元组为(用户B,喜欢,看电视);业务购买记录“用户A购买汽车车票”对应的业务三元组为(用户A,购买,汽车车票);业务购买记录“用户B购买人身寿险”对应的业务三元组为(用户B,购买,人身寿险)。
需要说明的,属性三元组包括用户标签、属性标签和属性值标签。可以理解的,在属性三元组(用户A,年龄,年龄为30岁)中,“用户A”是用户标签,“年龄”是属性标签,“年龄为30岁”是属性值标签。
需要说明的,业务三元组包括用户标签、购买业务标签以及用于表示所述用户标签和所述购买业务标签之间关系的购买行为标签。可以理解的,在业务三元组(用户B,购买,人身寿险)中,“用户B”是用户标签,“购买”是购买行为标签,“人身寿险”是购买业务标签。
步骤S103、基于所述初始的向量查询模型,确定所述属性三元组、业务三元组中各标签对应的向量,得到所述属性三元组对应的属性三元向量和所述业务三元组对应的业务三元向量。
具体地,将上述得到的样本用户的属性三元组和业务三元组分别输入所述初始的向量查询模型,得到所述属性三元组对应的属性三元向量与所述业务三元组对应的业务三元向量。
示例性的,属性三元组(用户标签,属性标签,属性值标签)对应的属性三元向量为(V,E,T);业务三元组(用户标签,购买行为标签,购买业务标签)对应的业务三元向量为(Vuser,Ebuy,Tproduct)。
在一些实施例中,属性三元组(用户A,年龄,年龄为30岁)对应的属性三元向量为(V1,E1,T1),其中V1表示用户标签“用户A”对应的用户向量,E1表示属性标签“年龄”对应的属性向量,T1表示属性值标签“年龄为30岁”对应的属性值向量。
在一些实施例中,业务三元组为(用户A,购买,航空延误险)对应的业务三元向量为其中表示用户标签“用户A”对应的用户向量,表示购买行为标签“购买”对应的购买行为向量,表示购买业务标签“航空延误险”对应的购买业务向量。
步骤S104、基于所述属性三元向量、所述业务三元向量的三元向量约束条件,调整所述初始的向量查询模型的模型参数,所述模型参数与所述属性三元向量、所述业务三元向量中的各分量对应。
示例性的,所述属性三元向量、所述业务三元向量的三元向量约束条件可以用V+E=T表示。
具体地,根据所述三元向量约束条件调整所述初始的向量查询模块中模型参数。示例性的,可以通过调整所述属性三元向量中的V,E,T三个分量和调整所述业务三元向量中的Vuser,Ebuy,Tproduct三个分量。
请参阅图9,图9是基于所述属性三元向量、所述业务三元向量的三元向量约束条件,调整所述初始的向量查询模型的模型参数的示意流程图,包括步骤S1041至步骤S1044。
步骤S1041、基于所述初始的向量查询模型,确定所述属性三元向量对应的负样本属性三元向量和所述业务三元向量对应的负样本业务三元向量。
在一些实施例中,将上述得到的N个属性三元组输入向量查询模型中,进行i轮迭代学习,其中,0<i<N。在第k轮迭代学习中随机抽取j个属性三元向量,然后根据每个属性三元向量构造所述属性三元组对应的负样本属性三元向量。其中,0<k<i,0<j≤N。
具体地,根据一个在所述属性三元向量中没有出现过的属性值分量替换所述属性三元向量中的属性值分量,得到所述属性三元向量对应的负样本属性三元向量。示例性的,若第k轮迭代学习抽取得到的j个属性三元向量(V1,E1,T1),···,(Vj,Ej,Tj);对每个属性三元向量分别构造负样本属性三元向量,用向量X替换向量T,得到所述属性三元向量对应的负样本属性三元向量分别为(V1,E1,X1),···,(Vj,Ej,Xj)。
步骤S1042、计算所述属性三元向量的向量偏差和所述业务三元向量的向量偏差,以及所述负样本属性三元向量的向量偏差和所述负样本业务三元向量的向量偏差。
示例性的,根据范数公式,所述服务器分别计算所述属性三元向量的向量偏差和所述业务三元向量的向量偏差,以及所述负样本属性三元向量的向量偏差和所述负样本业务三元向量的向量偏差。
其中,所述向量偏差为三元向量中的头节点向量和边向量之和与尾节点向量之间的Lp范数距离。例如,在三元向量(V,E,T)中,V是头节点向量,E是边向量,T是尾节点向量。
Lp范数距离的计算公式为:
D=||T-(V+E)||p,
式中,p表示各个元素绝对值p次方和的1/p次方。
示例性的,若属性三元向量为(V1,E1,T1),该属性三元向量对应的负样本属性三元向量为(V1,E1,X1)。根据范数公式,所述属性三元向量的向量偏差D1为:
D1=||T1-(V1+E1)||p,
所述负样本属性三元向量(V1,E1,X1)的向量偏差D2为:
D2=||X1-(V1+E1)||p。
所述负样本业务三元向量D4为:
步骤S1043、若所述属性三元向量的向量偏差大于所述负样本属性三元向量的向量偏差,则根据所述属性三元向量调整所述初始的向量查询模型中与所述属性三元向量对应的模型参数。
示例性的,若属性三元向量(V1,E1,T1)的向量偏差D1为0.8,该属性三元向量(V1,E1,T1)对应的负样本属性三元向量(V1,E1,X1)的向量偏差D2为0.5,说明所述属性三元向量的向量偏差大于所述负样本属性三元向量的向量偏差,则所述服务器根据所述属性三元向量调整所述初始的向量查询模型中与所述属性三元向量对应的模型参数。
在一些实施例中,若所述属性三元向量的向量偏差大于所述负样本属性三元向量的向量偏差,根据随机梯度下降算法调整所述初始的向量查询模型中与所述属性三元向量对应的模型参数。
需要说明的是,随机梯度下降(stochastic gradientdescent)算法是根据目标函数的负梯度方向对参数进行调整,沿着目标函数的梯度的相反方向不断更新参数直到达到目标函数的极值点。随机梯度下降算法的公式如下:
f′=f-λ×L,
式中,f表示当前目标函数值,λ表示学习速率,L表示下降梯度值,f′表示下一步的目标函数值。
具体地,所述服务器根据随机梯度下降算法调整所述属性三元向量中各分量的参数,得到调整后的属性三元向量。
在一些实施例中,根据随机梯度下降算法对属性三元向量(V1,E1,T1)中的各个分量进行调整,得到调整后的属性三元向量(V1′,E1′,T1′),各个分量的计算公式如下:
V1′=V1-λ×L,
E1′=E1-λ×L,
T1′=T1-λ×L,
式中,L表示下降梯度值,L=|D1+Mmargin-D2|;Mmargin是一个设定的参数,取值为1;λ表示学习速率。
根据调整后的得到的属性三元向量(V1′,E1′,T1′)替换与原来的属性三元向量(V1,E1,T1),以更新所述初始的向量查询模型中的模型参数。
在对抽取的j个属性三元向量进行分量调整后,进行第k+1轮迭代学习,重新执行上述步骤S1041、S1042、S1043,直至所述初始的向量查询模型的迭代学习次数达到i轮或达到预设次数时,停止训练,得到训练好的向量查询模型。
步骤S1044、若所述业务三元向量的向量偏差大于所述负样本业务三元向量的向量偏差,则根据所述业务三元向量调整所述初始的向量查询模型中与所述业务三元向量对应的模型参数。
示例性的,若业务三元向量的向量偏差D3为0.3,该业务三元向量对应的负样本业务三元向量的向量偏差D2为0.1,说明所述业务三元向量的向量偏差大于所述负样本业务三元向量的向量偏差,则所述服务器根据所述业务三元向量调整所述初始的向量查询模型中与所述业务三元向量对应的模型参数。
示例性的,若所述业务三元向量的向量偏差大于所述负样本业务三元向量的向量偏差,所述服务器根据随机梯度下降算法调整所述初始的向量查询模型中与所述业务三元向量对应的模型参数。
具体地,根据随机梯度下降算法调整所述业务三元向量中各分量,得到调整后的业务三元向量。
式中,L表示下降梯度值,L=|D3+Mmargin-D4|;λ表示学习速率。
在对抽取的j个业务三元向量进行分量调整后,进行第k+1轮迭代学习,重新执行上述步骤S1041、S1042、S1044,直至所述初始的向量查询模型的迭代学习次数达到i轮或达到预设次数时,停止训练,得到训练好的向量查询模型。
上述实施例提供的训练方法,通过根据样本用户的画像标签和业务购买记录构建关系图谱,进而得到画像标签对应的属性三元组和业务购买记录对应的业务三元组;通过初始的向量查询模型,可以得到属性三元组对应的属性三元向量和业务三元组对应的业务三元向量,并根据属性三元向量、所业务三元向量的三元向量约束条件调整初始的向量查询模型的模型参数,得到训练好的向量查询模型;根据训练好的向量查询模型可以查询得到画像标签对应的属性三元向量以及查询得到业务标签的购买行为向量和购买业务向量。
通过构造属性三元向量对应的负样本属性三元向量和构造业务三元向量对应的负样本业务三元向量,可以计算出各个三元向量的向量偏差;通过判断属性三元向量的向量偏差和负样本属性三元向量的向量偏差的大小,以及判断业务三元向量的向量偏差和负样本业务三元向量的向量偏差的大小,根据不符合条件的属性三元向量、业务三元向量调整初始的向量查询模型中的模型参数,可以节省训练时间,保证训练的有效性;通过随机梯度下降算法调整属性三元向量和业务三元向量中各个分量,可以提高训练好的向量查询模型的准确度和鲁棒性。
请参阅图10,图10是本申请的实施例还提供一种业务推荐装置200的示意性框图,该业务推荐装置用于执行前述的业务推荐方法和/或训练方法。其中,该业务推荐装置可以配置于服务器或终端中。
如图10所示,该业务推荐装置200,包括:画像标签获取模块201、用户向量查询模块202、业务向量查询模块203和业务推荐模块204。
画像标签获取模块201,用于获取目标用户的身份标识,根据所述身份标识获取所述目标用户对应的画像标签。
用户向量查询模块202,用于基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量。
在一些实施例中,如图11所示,该用户向量查询模块202,包括:三元组生成子模块2021、向量查询子模块2022和用户向量确定子模块2023。
三元组生成子模块2021,用于根据所述目标用户的画像标签生成所述目标用户对应的关系图谱,所述关系图谱包括若干属性三元组,各所述属性三元组各自包括用户标签、属性标签和属性值标签,所述属性标签用于表示所述用户标签与所述属性值标签之间的关系。
向量查询子模块2022,用于基于所述向量查询模型,查询各所述属性三元组中的属性标签对应的属性向量和各所述属性三元组中的属性值标签对应的属性值向量。
用户向量确定子模块2023,用于根据各所述属性向量和各所述属性值向量确定所述目标用户对应的用户向量;若所述目标用户对应的关系图谱包括一个属性三元组,计算所述属性值向量与属性向量之间的向量差,得到所述目标用户对应的用户向量;若所述目标用户对应的关系图谱包括多个属性三元组,分别计算每一所述属性三元组中属性值向量与属性向量之间的向量差,对各所述属性三元组对应的向量差取均值,得到所述目标用户对应的用户向量。
业务向量查询模块203,用于获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量。
在一些实施例中,如图11所示,该候选业务向量查询模块203,包括:三元向量获取子模块2031和业务向量获取子模块2032。
三元向量获取子模块2031,用于基于所述向量查询模型,获取所述向量查询模型中与所述业务标签对应的业务三元向量,所述业务三元向量包括购买行为向量和购买业务向量。
业务向量获取子模块2032,用于根据所述业务标签对应的购买行为向量和购买业务向量,生成所述业务标签对应的候选业务向量;用于根据所述购买业务向量与所述购买行为向量之间的向量差,确定所述候选业务标签对应的候选业务向量。
业务推荐模块204,用于计算所述业务标签对应的候选业务向量与所述用户向量之间的向量距离,若所述向量距离不大于预设阈值,将所述候选业务向量对应的候选业务推送至所述目标用户的终端。
在一些实施例中,如图10所示,该业务推荐装置200,还包括:模型确定模块205、样本获取模块206、向量确定模块207和参数调整模块208。
模型确定模块205,用于确定初始的向量查询模型。
样本获取模块206,用于获取多个样本用户的画像标签和业务购买记录,根据各所述样本用户的画像标签和业务购买记录构建各样本用户的关系图谱,所述关系图谱包括所述画像标签对应的属性三元组和所述业务购买记录对应的业务三元组,其中所述属性三元组包括用户标签、属性标签和属性值标签;所述业务三元组包括用户标签、购买业务标签以及用于表示所述用户标签和所述购买业务标签之间关系的购买行为标签。
向量确定模块207,用于基于所述初始的向量查询模型,确定所述属性三元组、业务三元组中各标签对应的向量,得到所述属性三元组对应的属性三元向量和所述业务三元组对应的业务三元向量。
参数调整模块208,用于基于所述属性三元向量、所述业务三元向量的三元向量约束条件,调整所述初始的向量查询模型的模型参数,所述模型参数与所述属性三元向量、所述业务三元向量中的各分量对应。
在一些实施例中,如图11所示,该参数调整模块208,包括:负样本确定子模块2081、向量偏差计算子模块2082、第一参数调整子模块2083和第二参数调整子模块2084。
负样本确定子模块2081,用于基于所述初始的向量查询模型,确定所述属性三元向量对应的负样本属性三元向量和所述业务三元向量对应的负样本业务三元向量。
向量偏差计算子模块2082,用于计算所述属性三元向量的向量偏差和所述业务三元向量的向量偏差,以及所述负样本属性三元向量的向量偏差和所述负样本业务三元向量的向量偏差。
第一参数调整子模块2083,用于若所述属性三元向量的向量偏差大于所述负样本属性三元向量的向量偏差,则根据所述属性三元向量调整所述初始的向量查询模型中与所述属性三元向量对应的模型参数。
第二参数调整子模块2084,用于若所述业务三元向量的向量偏差大于所述负样本业务三元向量的向量偏差,则根据所述业务三元向量调整所述初始的向量查询模型中与所述业务三元向量对应的模型参数。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
上述的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图12所示的计算机设备上运行。
请参阅图12,图12是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器。
请参阅图12,该计算机设备包括通过系统总线连接的处理器和存储器,其中,存储器可以包括非易失性存储介质和内存储器。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种业务推荐方法和/或训练方法。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取目标用户的身份标识,根据所述身份标识获取所述目标用户对应的画像标签;基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量;获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量;计算所述业务标签对应的候选业务向量与所述用户向量之间的向量距离,若所述向量距离不大于预设阈值,将所述候选业务向量对应的候选业务推送至所述目标用户的终端。
在一个实施例中,所述处理器在实现基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量时,用于实现:
根据所述目标用户的画像标签生成所述目标用户对应的关系图谱,所述关系图谱包括若干属性三元组,各所述属性三元组各自包括用户标签、属性标签和属性值标签,所述属性标签用于表示所述用户标签与所述属性值标签之间的关系;基于所述向量查询模型,查询各所述属性三元组中的属性标签对应的属性向量和各所述属性三元组中的属性值标签对应的属性值向量;根据各所述属性向量和各所述属性值向量确定所述目标用户对应的用户向量。
在一个实施例中,所述处理器在实现根据各所述属性向量和各所述属性值向量确定所述目标用户对应的用户向量时,用于实现:
若所述目标用户对应的关系图谱包括一个属性三元组,计算所述属性值向量与属性向量之间的向量差,得到所述目标用户对应的用户向量;若所述目标用户对应的关系图谱包括多个属性三元组,分别计算每一所述属性三元组中属性值向量与属性向量之间的向量差,对各所述属性三元组对应的向量差取均值,得到所述目标用户对应的用户向量。
在一个实施例中,所述处理器在实现获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量时,用于实现:
基于所述向量查询模型,获取所述向量查询模型中与所述业务标签对应的业务三元向量,所述业务三元向量包括购买行为向量和购买业务向量;根据所述业务标签对应的购买行为向量和购买业务向量,生成所述业务标签对应的候选业务向量。
在一个实施例中,所述处理器在实现根据所述业务标签对应的购买行为向量和购买业务向量,生成所述业务标签对应的候选业务向量时,用于实现:
根据所述购买业务向量与所述购买行为向量之间的向量差,确定所述候选业务标签对应的候选业务向量。
在一个实施例中,所述处理器在实现向量查询模型的训练方法时,用于实现:
确定初始的向量查询模型;获取多个样本用户的画像标签和业务购买记录,根据各所述样本用户的画像标签和业务购买记录构建各样本用户的关系图谱,所述关系图谱包括所述画像标签对应的属性三元组和所述业务购买记录对应的业务三元组,其中所述属性三元组包括用户标签、属性标签和属性值标签;所述业务三元组包括用户标签、购买业务标签以及用于表示所述用户标签和所述购买业务标签之间关系的购买行为标签;基于所述初始的向量查询模型,确定所述属性三元组、业务三元组中各标签对应的向量,得到所述属性三元组对应的属性三元向量和所述业务三元组对应的业务三元向量;基于所述属性三元向量、所述业务三元向量的三元向量约束条件,调整所述初始的向量查询模型的模型参数,所述模型参数与所述属性三元向量、所述业务三元向量中的各分量对应。
在一个实施例中,所述处理器在实现基于所述属性三元向量、所述业务三元向量的三元向量约束条件,调整所述初始的向量查询模型的模型参数时,用于实现:
基于所述初始的向量查询模型,确定所述属性三元向量对应的负样本属性三元向量和所述业务三元向量对应的负样本业务三元向量;计算所述属性三元向量的向量偏差和所述业务三元向量的向量偏差,以及所述负样本属性三元向量的向量偏差和所述负样本业务三元向量的向量偏差;若所述属性三元向量的向量偏差大于所述负样本属性三元向量的向量偏差,则根据所述属性三元向量调整所述初始的向量查询模型中与所述属性三元向量对应的模型参数;若所述业务三元向量的向量偏差大于所述负样本业务三元向量的向量偏差,则根据所述业务三元向量调整所述初始的向量查询模型中与所述业务三元向量对应的模型参数。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项业务推荐方法和/或训练方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字卡(Secure Digital Card,SD Card),闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种业务推荐方法,其特征在于,包括:
获取目标用户的身份标识,根据所述身份标识获取所述目标用户对应的画像标签;
基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量;
获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量;
计算所述业务标签对应的候选业务向量与所述用户向量之间的向量距离,若所述向量距离不大于预设阈值,将所述候选业务向量对应的候选业务推送至所述目标用户的终端;
所述基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量,包括:根据所述目标用户的画像标签生成所述目标用户对应的关系图谱,所述关系图谱包括若干属性三元组,各所述属性三元组各自包括用户标签、属性标签和属性值标签,所述属性标签用于表示所述用户标签与所述属性值标签之间的关系;基于所述向量查询模型,查询各所述属性三元组中的属性标签对应的属性向量和各所述属性三元组中的属性值标签对应的属性值向量;根据各所述属性向量和各所述属性值向量确定所述目标用户对应的用户向量;
所述获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量,包括:基于所述向量查询模型,获取所述向量查询模型中与所述业务标签对应的业务三元向量,所述业务三元向量包括购买行为向量和购买业务向量;根据所述业务标签对应的购买行为向量和购买业务向量,生成所述业务标签对应的候选业务向量。
2.根据权利要求1所述的业务推荐方法,其特征在于,所述根据各所述属性向量和各所述属性值向量确定所述目标用户对应的用户向量,包括:
若所述目标用户对应的关系图谱包括一个属性三元组,计算所述属性值向量与属性向量之间的向量差,得到所述目标用户对应的用户向量;
若所述目标用户对应的关系图谱包括多个属性三元组,分别计算每一所述属性三元组中属性值向量与属性向量之间的向量差,对各所述属性三元组对应的向量差取均值,得到所述目标用户对应的用户向量。
3.根据权利要求1所述的业务推荐方法,其特征在于,所述根据所述业务标签对应的购买行为向量和购买业务向量,生成所述业务标签对应的候选业务向量,包括:
根据所述购买业务向量与所述购买行为向量之间的向量差,确定所述候选业务标签对应的候选业务向量。
4.一种向量查询模型的训练方法,其特征在于,所述训练方法用于训练权利要求1至3任一项中的向量查询模型,所述训练方法包括:
确定初始的向量查询模型;
获取多个样本用户的画像标签和业务购买记录,根据各所述样本用户的画像标签和业务购买记录构建各样本用户的关系图谱,所述关系图谱包括所述画像标签对应的属性三元组和所述业务购买记录对应的业务三元组,其中所述属性三元组包括用户标签、属性标签和属性值标签;所述业务三元组包括用户标签、购买业务标签以及用于表示所述用户标签和所述购买业务标签之间关系的购买行为标签;
基于所述初始的向量查询模型,确定所述属性三元组、业务三元组中各标签对应的向量,得到所述属性三元组对应的属性三元向量和所述业务三元组对应的业务三元向量;
基于所述属性三元向量、所述业务三元向量的三元向量约束条件,调整所述初始的向量查询模型的模型参数,所述模型参数与所述属性三元向量、所述业务三元向量中的各分量对应。
5.根据权利要求4所述的训练方法,其特征在于,所述基于所述属性三元向量、所述业务三元向量的三元向量约束条件,调整所述初始的向量查询模型的模型参数,包括:
基于所述初始的向量查询模型,确定所述属性三元向量对应的负样本属性三元向量和所述业务三元向量对应的负样本业务三元向量;
计算所述属性三元向量的向量偏差和所述业务三元向量的向量偏差,以及所述负样本属性三元向量的向量偏差和所述负样本业务三元向量的向量偏差;
若所述属性三元向量的向量偏差大于所述负样本属性三元向量的向量偏差,则根据所述属性三元向量调整所述初始的向量查询模型中与所述属性三元向量对应的模型参数;
若所述业务三元向量的向量偏差大于所述负样本业务三元向量的向量偏差,则根据所述业务三元向量调整所述初始的向量查询模型中与所述业务三元向量对应的模型参数。
6.一种业务推荐装置,其特征在于,包括:
画像标签获取模块,用于获取目标用户的身份标识,根据所述身份标识获取所述目标用户对应的画像标签;
用户向量查询模块,用于基于向量查询模型,根据所述画像标签确定所述目标用户对应的用户向量;
业务向量查询模块,用于获取候选的业务标签,基于所述向量查询模型,确定所述业务标签对应的候选业务向量;
业务推荐模块,用于计算所述业务标签对应的候选业务向量与所述用户向量之间的向量距离,若所述向量距离不大于预设阈值,将所述候选业务向量对应的候选业务推送至所述目标用户的终端;
所述用户向量查询模块包括:三元组生成子模块、向量查询子模块和用户向量确定子模块;
所述三元组生成子模块,用于根据所述目标用户的画像标签生成所述目标用户对应的关系图谱,所述关系图谱包括若干属性三元组,各所述属性三元组各自包括用户标签、属性标签和属性值标签,所述属性标签用于表示所述用户标签与所述属性值标签之间的关系;
所述向量查询子模块,用于基于所述向量查询模型,查询各所述属性三元组中的属性标签对应的属性向量和各所述属性三元组中的属性值标签对应的属性值向量;
所述用户向量确定子模块,用于根据各所述属性向量和各所述属性值向量确定所述目标用户对应的用户向量;
所述业务向量查询模块包括:三元向量获取子模块和业务向量获取子模块;
所述三元向量获取子模块,用于基于所述向量查询模型,获取所述向量查询模型中与所述业务标签对应的业务三元向量,所述业务三元向量包括购买行为向量和购买业务向量;
所述业务向量获取子模块,用于根据所述业务标签对应的购买行为向量和购买业务向量,生成所述业务标签对应的候选业务向量。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现:
如权利要求1至3中任一项所述的业务推荐方法,和/或
如权利要求4至5中任一项所述的训练方法。
8. 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现:
如权利要求1至3中任一项所述的业务推荐方法,和/或
如权利要求4至5中任一项所述的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911360935.XA CN111198988B (zh) | 2019-12-25 | 2019-12-25 | 业务推荐方法、训练方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911360935.XA CN111198988B (zh) | 2019-12-25 | 2019-12-25 | 业务推荐方法、训练方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111198988A CN111198988A (zh) | 2020-05-26 |
CN111198988B true CN111198988B (zh) | 2023-05-02 |
Family
ID=70746607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911360935.XA Active CN111198988B (zh) | 2019-12-25 | 2019-12-25 | 业务推荐方法、训练方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111198988B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111932310A (zh) * | 2020-08-14 | 2020-11-13 | 工银科技有限公司 | 一种银行产品的潜在对公客户挖掘方法及装置 |
CN112487039B (zh) * | 2020-12-16 | 2024-04-30 | 平安养老保险股份有限公司 | 一种数据处理方法、装置、设备及可读存储介质 |
CN113157725A (zh) * | 2021-04-22 | 2021-07-23 | 北京小米移动软件有限公司 | 推荐模型的确定方法、装置、设备及存储介质 |
CN112967134B (zh) * | 2021-05-19 | 2021-09-21 | 北京轻松筹信息技术有限公司 | 网络训练方法、风险用户识别方法、装置、设备及介质 |
CN114091830A (zh) * | 2021-10-26 | 2022-02-25 | 上海淇玥信息技术有限公司 | 业务处理方法、装置和电子设备 |
CN114238767B (zh) * | 2021-12-20 | 2024-07-02 | 中国平安财产保险股份有限公司 | 业务推荐方法、装置、计算机设备和存储介质 |
CN114722729B (zh) * | 2022-06-01 | 2022-09-13 | 中科航迈数控软件(深圳)有限公司 | 一种刀具自动推荐方法、装置、终端及存储介质 |
CN115391659A (zh) * | 2022-09-02 | 2022-11-25 | 中国第一汽车股份有限公司 | 新闻推荐方法、装置、电子设备及计算机可读存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102456203B (zh) * | 2010-10-22 | 2015-10-14 | 阿里巴巴集团控股有限公司 | 确定候选产品链表的方法及相关装置 |
CN107391577B (zh) * | 2017-06-20 | 2020-04-03 | 中国科学院计算技术研究所 | 一种基于表示向量的作品标签推荐方法和系统 |
CN110309405B (zh) * | 2018-03-08 | 2022-09-30 | 腾讯科技(深圳)有限公司 | 一种项目推荐方法、装置及存储介质 |
CN109189944A (zh) * | 2018-09-27 | 2019-01-11 | 桂林电子科技大学 | 基于用户正负反馈画像编码的个性化景点推荐方法及系统 |
CN110163647B (zh) * | 2019-03-14 | 2023-06-27 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及装置 |
-
2019
- 2019-12-25 CN CN201911360935.XA patent/CN111198988B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111198988A (zh) | 2020-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111198988B (zh) | 业务推荐方法、训练方法、装置、计算机设备和存储介质 | |
CN108182279B (zh) | 基于文本特征的对象分类方法、装置和计算机设备 | |
CN108805598B (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
WO2020048084A1 (zh) | 资源推荐方法、装置、计算机设备及计算机可读存储介质 | |
CN111798273A (zh) | 产品的购买概率预测模型的训练方法及购买概率预测方法 | |
CN109033101B (zh) | 标签推荐方法及装置 | |
CN106339507B (zh) | 流媒体消息推送方法和装置 | |
CN109360048A (zh) | 订单生成方法、系统、计算机设备和存储介质 | |
US9977995B2 (en) | Image clustering method, image clustering system, and image clustering server | |
CN110245687B (zh) | 用户分类方法以及装置 | |
US20160357845A1 (en) | Method and Apparatus for Classifying Object Based on Social Networking Service, and Storage Medium | |
KR20160057475A (ko) | 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법 | |
Lan et al. | Matrix recovery from quantized and corrupted measurements | |
US20200098031A1 (en) | Product recommending apparatus and non-transitory computer readable medium | |
CN110020022B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN109426831B (zh) | 图片相似匹配及模型训练的方法、装置及计算机设备 | |
US10936964B2 (en) | Method and apparatus for estimating multi-ranking using pairwise comparison data | |
CN106157156A (zh) | 一种基于用户社区的协作推荐系统 | |
CN107291845A (zh) | 一种基于预告片的电影推荐方法及系统 | |
CN104199818A (zh) | 一种基于分类的社会化推荐方法 | |
CN110717097A (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN113704623A (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN105260458A (zh) | 一种用于显示装置的视频推荐方法及显示装置 | |
CN102722732A (zh) | 一种基于数据二阶统计量建模的图像集合匹配方法 | |
CN113934937A (zh) | 一种内容智能推荐方法、装置、终端和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |