CN110033351B - 一种相似度的确定方法及装置 - Google Patents

一种相似度的确定方法及装置 Download PDF

Info

Publication number
CN110033351B
CN110033351B CN201910298868.7A CN201910298868A CN110033351B CN 110033351 B CN110033351 B CN 110033351B CN 201910298868 A CN201910298868 A CN 201910298868A CN 110033351 B CN110033351 B CN 110033351B
Authority
CN
China
Prior art keywords
user data
target product
similarity
weight value
preset dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910298868.7A
Other languages
English (en)
Other versions
CN110033351A (zh
Inventor
黄楷
王千
梁新敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Information Technology Co Ltd
Original Assignee
Miaozhen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miaozhen Information Technology Co Ltd filed Critical Miaozhen Information Technology Co Ltd
Priority to CN201910298868.7A priority Critical patent/CN110033351B/zh
Publication of CN110033351A publication Critical patent/CN110033351A/zh
Application granted granted Critical
Publication of CN110033351B publication Critical patent/CN110033351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons

Abstract

本申请提供了一种相似度的确定方法及装置,其中,该确定方法包括:获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据;基于每个预设维度,分别对第一用户数据和第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于第二用户数据的第一权重值;利用第一权重值和第二权重值,计算得到第一目标产品和第二目标产品之间的相似度;将相似度发送至第一目标产品对应的商家服务器。通过本申请的确定方法能够提高计算第一目标产品与第二目标产品之间的相似度的效率,实时性较佳。

Description

一种相似度的确定方法及装置
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种相似度的确定方法及装置。
背景技术
随着电商、广告行业的发展,产品相似性越来越成为人们感兴趣的话题。产品相似性准确率的提高,对于电商行业中的推荐系统,广告行业的精准投放,这类的功能有着重大的指导意义。例如,在确定用户的目标产品时,可以根据该目标产品查找相似度较高的相似产品,并将相似产品推荐给用户。
通常,通过调查问卷方式获得用户对某一个产品及其相似产品的联想,或者,通过搜索联想的方式,从各大搜索引擎获得产品搜索词,进而确定相似产品。
但是,上述两种方法数据筛选量较大,导致查找与目标产品相似的产品较慢,有一定的延时性。
发明内容
有鉴于此,本申请实施例的目的在于提供一种相似度的确定方法及装置,能够提高计算第一目标产品与第二目标产品之间的相似度的效率,实时性较佳。
第一方面,本申请实施例提供了一种相似度的确定方法,其中,包括:
获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据;
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第一权重值;
利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度;
将所述相似度发送至所述第一目标产品对应的商家服务器。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第二权重值,包括:
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到所述第一用户数据在各预设维度上各元素类型对应的第一子用户数据,以及得到所述第二用户数据在各预设维度上各元素类型对应的第二子用户数据;
对于每个预设维度,在该预设维度上,分别对该预设维度对应的所述第一子用户数据和所述第二子用户数据进行归一化处理,以将对所述第一子用户数据进行归一化处理的结果作为所述第一权重值,以及将对所述第二子用户数据进行归一化处理的结果作为所述第二权重值。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,还包括:
根据所述第一目标产品与至少一个第二目标产品之间的相似度,对所述至少一个第二目标产品按照相似度由高到低进行排列;
按照相似度由高到低的顺序,选择预设数量的第二目标产品;
将所述预设数量的第二目标产品推荐给所述第一用户数据对应的客户端。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度,包括:
针对同一元素类型,计算所述第一权重值和所述第二权重值之间的差值;
根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度。
结合第一方面的第三种可能的实施方式,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度,包括:
针对每个差值,对该差值进行平方运算,得到第一转换值;
对得到的所有的第一转换值进行求和计算,得到第二转换值;
将所述第二转换值进行开方运算并求倒数,得到所述第一目标产品和所述第二目标产品之间的相似度。
第二方面,本申请实施例还提供了一种相似度的确定装置,其中,包括:
获取模块,用于获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据;
确定模块,用于基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第一权重值;
计算模块,用于利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度;
发送模块,用于将所述相似度发送至所述第一目标产品对应的商家服务器。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述确定模块,具体用于:
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到所述第一用户数据在各预设维度上各元素类型对应的第一子用户数据,以及得到所述第二用户数据在各预设维度上各元素类型对应的第二子用户数据;
对于每个预设维度,在该预设维度上,分别对该预设维度对应的所述第一子用户数据和所述第二子用户数据进行归一化处理,以将对所述第一子用户数据进行归一化处理的结果作为所述第一权重值,以及将对所述第二子用户数据进行归一化处理的结果作为所述第二权重值。
结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,还包括:
推荐模块,用于根据所述第一目标产品与至少一个第二目标产品之间的相似度,对所述至少一个第二目标产品按照相似度由高到低进行排列;
按照相似度由高到低的顺序,选择预设数量的第二目标产品;
将所述预设数量的第二目标产品推荐给所述第一用户数据对应的客户端。
结合第二方面,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述计算模块包括:
计算单元,用于针对同一元素类型,计算所述第一权重值和所述第二权重值之间的差值;
确定单元,用于根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度。
结合第二方面的第三种可能的实施方式,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述确定单元,具体用于:
针对每个差值,对该差值进行平方运算,得到第一转换值;
对得到的所有的第一转换值进行求和计算,得到第二转换值;
将所述第二转换值进行开方运算并求倒数,得到所述第一目标产品和所述第二目标产品之间的相似度。
本申请实施例提供的一种相似度的确定方法及装置,其中,该确定方法包括首先获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据;然后基于每个预设维度,分别对第一用户数据和第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于第二用户数据的第一权重值;最后利用第一权重值和第二权重值,计算得到第一目标产品和第二目标产品之间的相似度;将相似度发送至第一目标产品对应的商家服务器。本申请实施例的确定方法通过对第一目标产品相关的第一用户数据和第二目标产品相关的第二用户数据进行分类,在对分类后的第一用户数据和第二用户数据按照预设计算方法进行计算,得到第一目标产品与第二目标产品的相似度,能够提高计算第一目标产品与第二目标产品之间的相似度的效率,实时性较佳。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种相似度的确定方法的流程图;
图2示出了本申请实施例所提供的另一种相似度的确定方法的流程图;
图3示出了本申请实施例所提供的一种相似度的确定装置的结构示意图;
图4示出了本申请实施例所提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,通过调查问卷方式获得用户对某一个产品及其相似产品的联想,或者,通过搜索联想的方式,从各大搜索引擎获得产品搜索词,进而确定相似产品。但是,上述两种方法均受用户的主观思想的影响,导致确定目标产品的相似产品精确度较低。针对上述问题,本申请实施例提供的一种相似度的确定方法及装置,可以能够提高计算第一目标产品与第二目标产品之间的相似度的效率,实时性较佳。
为便于对本申请实施例进行理解,首先对本申请实施例所公开的一种相似度的确定方法进行详细介绍。
在具体实施中,可以预先根据产品所属的行业类型,将所有的产品进行分类。厂商可以仅选取与自身产品所属的行业类型相同的其他产品,并将自身产品作为第一目标产品,将与自身产品所属的行业类型相同的其他产品作为第二目标产品,按照本申请实施例提供的相似度的确定方法,来确定第一目标产品和第二目标产品之间的相似度。
如图1所示,为本申请实施例以服务器为执行主体时,第一目标产品和第二目标产品之间的相似度的确定方法的流程图,具体步骤如下:
S101,获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据。
这里,可以实时获取与第一目标产品相关的第一用户,以及与第二目标产品相关的第二用户。
其中,第一目标产品相关的第一用户可以包括购买过第一目标产品的用户,关注第一目标产品的用户,浏览过第一目标产品的用户等。
通过第一用户注册时填写的数据,可以获取与第一目标产品相关的第一用户数据。其中,该第一用户数据可以包括地域、年龄、性别等。
同样的,获取与第二目标产品相关的第二用户数据的方法,与上述获取与第一目标产品相关的第一用户数据的方法相同,获取与第二目标产品相关的第二用户数据的方法不再进行详细阐述。
S102,基于每个预设维度,分别对第一用户数据和第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于第二用户数据的第一权重值;
在具体实施中,可以预先设置多个预设维度,例如地域维度、年龄维度、性别维度等。
基于每个预设维度,分别对第一用户数据和第二用户数据进行划分,以得到第一用户数据在各预设维度上各元素类型对应的第一子用户数据,以及得到第二用户数据在各预设维度上各元素类型对应的第二子用户数据。
其中,每个预设维度包括至少一个元素类型,例如地域维度包括的元素类型可以有河北类、河南类、山东类等;年龄维度包括的元素类型可以有第一类(年龄处于18-25岁范围内)、第二类(年龄处于26-35岁范围内)、第三类(年龄处于36-45岁范围内)等;性别维度包括的元素类型有男性类和女性类。
对于每个预设维度,在该预设维度上,分别对该预设维度对应的第一子用户数据和第二子用户数据进行归一化处理,以将对第一子用户数据进行归一化处理的结果作为第一权重值,以及将对第二子用户数据进行归一化处理的结果作为第二权重值。
这里,将每个预设维度对应的第一子用户数据和第二子用户数据分别进行归一化处理,也即,计算各元素类型包括的用户数据相对于第一用户数据的第一权重值,以及各元素类型包括的用户数据相对于第二用户数据的第二权重值。
例如,在按照预设维度将第一目标产品相关的第一用户数据进行划分之后,得到性别维度中男性类的数量为100,性别维度中女性类的数量为300,进行归一化处理时,计算男性类对应的第一权重值为100/(100+300)=0.25,计算女性类对应的第一权重值为300/(100+300)=0.75。其中,元素类型可以根据厂商不同需求进行调整。
同样的,每个预设维度的各元素类型包括的用户数据相对于第一用户数据的第一权重值,以及各元素类型包括的用户数据相对于第二用户数据的第二权重值的计算方法,均与上述第一目标产品中男性类对应的第一权重值的计算方法相同,在此不做过多赘述。
值得说明的是,若厂商对某个维度增加其关注度,可以将其对应的第一权重值和第二权重值增加倍数,以达到对该维度的特别关注。
S103,利用第一权重值和第二权重值,计算得到第一目标产品和第二目标产品之间的相似度。
在具体实施中,得到第一权重值和第二权重值之后,针对同一元素类型,计算第一权重值和第二权重值之间的差值;将每个差值进行平方运算,得到第一转换值;对得到的所有的第一转换值进行求和计算,得到第二转换值;将第二转换值进行开方运算并求倒数,得到第一目标产品和第二目标产品之间的相似度。
例如,计算出第一目标产品的北京类对应的第一权重值为0.5,上海类对应的第一权重值为0.5,年龄维度的第一类对应的第一权重值为0.3,年龄维度的第二类对应的第一权重值为0.7,男性类对应的第一权重值为0.5,女性类对应的第一权重值为0.5;以及第二目标产品的北京类对应的第二权重值为0.2,上海类对应的第二权重值为0.8,年龄维度的第二类对应的第二权重值为0.9,年龄维度的第二类对应的第二权重值为0.1,男性类对应的第二权重值为0.2,女性类对应的第二权重值为0.8。
利用上述数据计算第一目标产品和第二目标产品的相似度时,如下公式:
Figure BDA0002027542630000091
则,上述第一目标产品和第二目标产品的相似度为1/1.039。
值得说明的是,若第一目标产品和第二目标产品属于同一行业类型,则,该第一目标产品和第二目标产品的相似度即为上述得到的数值;若第一目标产品和第二目标产品不属于同一行业类型,则将分母,也即1.039加1,1/2.039为第一目标产品和第二目标产品的相似度。
S104,将相似度发送至第一目标产品对应的商家服务器。
在具体实施中,计算得到第一目标产品和第二目标产品的相似度之后,将该相似度发送至第一目标产品对应的商家服务器,以使得第一目标产品对应的厂商根据该相似度制定营销手段等。
本申请实施例的确定方法通过对第一目标产品相关的第一用户数据和第二目标产品相关的第二用户数据进行分析,确定出第一目标产品与第二目标产品的相似度,能够提高计算第一目标产品与第二目标产品之间的相似度的效率,实时性较佳。
如图2所示,为本申请实施例提供的根据相似度的推荐方法,其中,具体步骤如下:
S201,根据第一目标产品与至少一个第二目标产品之间的相似度,对至少一个第二目标产品按照相似度由高到低进行排列;
S202,按照相似度由高到低的顺序,选择预设数量的第二目标产品;
S203,将预设数量的第二目标产品推荐给第一用户数据对应的客户端。
在具体实施中,某些网商的后台服务器可以利用上述方法将第一目标产品与至少一个第二目标产品进行对比,计算第一目标产品与至少一个第二目标产品之间的相似度,并且根据计算得到的相似度对至少一个第二目标产品按照相似度由高到低进行排列。
在识别到用户访问或关注,甚至购买了第一目标产品时,网商的后台服务器可以按照相似度由高到低的顺序,选择出预设数量的第二目标产品,并将该预设数量的第二目标产品推荐给第一用户数据对应的客户端,以使得用户可以从预设数量的第二目标产品中选择产品,提升了用户的体验度;同时增加了第二目标产品的曝光率。
基于同一发明构思,本申请实施例还提供了与相似度的确定方法对应的相似度的确定装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述相似度的确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图3所示,本申请又一实施例所提供的相似度的确定装置包括:
获取模块301,用于获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据;
确定模块302,用于基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第一权重值;
计算模块303,用于利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度;
发送模块304,用于将所述相似度发送至所述第一目标产品对应的商家服务器。
在一种实施方式中,上述确定模块302,具体用于:
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到所述第一用户数据在各预设维度上各元素类型对应的第一子用户数据,以及得到所述第二用户数据在各预设维度上各元素类型对应的第二子用户数据;
对于每个预设维度,在该预设维度上,分别对该预设维度对应的所述第一子用户数据和所述第二子用户数据进行归一化处理,以将对所述第一子用户数据进行归一化处理的结果作为所述第一权重值,以及将对所述第二子用户数据进行归一化处理的结果作为所述第二权重值。
在另一种实施方式中,上述相似度的确定装置还包括:
推荐模块305,用于根据所述第一目标产品与至少一个第二目标产品之间的相似度,对所述至少一个第二目标产品按照相似度由高到低进行排列;
按照相似度由高到低的顺序,选择预设数量的第二目标产品;
将所述预设数量的第二目标产品推荐给所述第一用户数据对应的客户端。
在又一种实施方式中,上述计算模块303包括:
计算单元3031,用于针对同一元素类型,计算所述第一权重值和所述第二权重值之间的差值;
确定单元3032,用于根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度。
在再一种实施方式中,上述确定单元3032具体用于:
针对每个差值,对该差值进行平方运算,得到第一转换值;
对得到的所有的第一转换值进行求和计算,得到第二转换值;
将所述第二转换值进行开方运算并求倒数,得到所述第一目标产品和所述第二目标产品之间的相似度。
图4描述了本发明实施例提供的一种电子设备400的结构,该电子设备400包括:至少一个处理器401,至少一个网络接口404或者其他用户接口403,存储器405,至少一个通信总线402。通信总线402用于实现这些组件之间的连接通信。该电子设备400可选的包含用户接口403,包括显示器(例如,触摸屏、LCD、CRT、全息成像(Holographic)或者投影(Projector)等),键盘或者点击设备(例如,鼠标,轨迹球(trackball),触感板或者触摸屏等)。
存储器405可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器405的一部分还可以包括非易失性随机存取存储器(NVRAM)。
在一些实施方式中,存储器405存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
操作系统4051,包含各种系统程序,用于实现各种基础业务以及处理基于硬件的任务;
应用程序模块4052,包含各种应用程序,例如桌面(launcher)、媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。
在本发明实施例中,通过调用存储器405存储的程序或指令,处理器401用于:
获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据;
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第一权重值;
利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度;
将所述相似度发送至所述第一目标产品对应的商家服务器。
可选地,处理器401执行的方法中,所述基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第二权重值,包括:
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到所述第一用户数据在各预设维度上各元素类型对应的第一子用户数据,以及得到所述第二用户数据在各预设维度上各元素类型对应的第二子用户数据;
对于每个预设维度,在该预设维度上,分别对该预设维度对应的所述第一子用户数据和所述第二子用户数据进行归一化处理,以将对所述第一子用户数据进行归一化处理的结果作为所述第一权重值,以及将对所述第二子用户数据进行归一化处理的结果作为所述第二权重值。
可选地,处理器401执行的方法中,还包括:
根据所述第一目标产品与至少一个第二目标产品之间的相似度,对所述至少一个第二目标产品按照相似度由高到低进行排列;
按照相似度由高到低的顺序,选择预设数量的第二目标产品;
将所述预设数量的第二目标产品推荐给所述第一用户数据对应的客户端。
可选地,处理器401执行的方法中,所述利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度,包括:
针对同一元素类型,计算所述第一权重值和所述第二权重值之间的差值;
根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度。
可选地,处理器401执行的方法中,所述根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度,包括:
针对每个差值,对该差值进行平方运算,得到第一转换值;
对得到的所有的第一转换值进行求和计算,得到第二转换值;
将所述第二转换值进行开方运算并求倒数,得到所述第一目标产品和所述第二目标产品之间的相似度。
本申请实施例所提供的相似度的确定方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述相似度的确定方法,从而能够能够提高计算第一目标产品与第二目标产品之间的相似度的效率,实时性较佳。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (6)

1.一种相似度的确定方法,其特征在于,包括:
获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据,第一目标产品相关的第一用户包括购买过第一目标产品的用户,关注第一目标产品的用户,浏览过第一目标产品的用户;
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第二权重值;
利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度;
将所述相似度发送至所述第一目标产品对应的商家服务器;
所述利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度,包括:
针对同一元素类型,计算所述第一权重值和所述第二权重值之间的差值;
根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度;
所述根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度,包括:
针对每个差值,对该差值进行平方运算,得到第一转换值;
对得到的所有的第一转换值进行求和计算,得到第二转换值;
将所述第二转换值进行开方运算并求倒数,得到所述第一目标产品和所述第二目标产品之间的相似度。
2.根据权利要求1所述的确定方法,其特征在于,所述基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第二权重值,包括:
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到所述第一用户数据在各预设维度上各元素类型对应的第一子用户数据,以及得到所述第二用户数据在各预设维度上各元素类型对应的第二子用户数据;
对于每个预设维度,在该预设维度上,分别对该预设维度对应的所述第一子用户数据和所述第二子用户数据进行归一化处理,以将对所述第一子用户数据进行归一化处理的结果作为所述第一权重值,以及将对所述第二子用户数据进行归一化处理的结果作为所述第二权重值。
3.根据权利要求1所述的确定方法,其特征在于,还包括:
根据所述第一目标产品与至少一个第二目标产品之间的相似度,对所述至少一个第二目标产品按照相似度由高到低进行排列;
按照相似度由高到低的顺序,选择预设数量的第二目标产品;
将所述预设数量的第二目标产品推荐给所述第一用户数据对应的客户端。
4.一种相似度的确定装置,其特征在于,包括:
获取模块,用于获取与第一目标产品相关的第一用户数据,以及与第二目标产品相关的第二用户数据,第一目标产品相关的第一用户包括购买过第一目标产品的用户,关注第一目标产品的用户,浏览过第一目标产品的用户;
确定模块,用于基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到组成该预设维度的各元素类型包括的用户数据相对于所述第一用户数据的第一权重值,以及组成该预设维度的各元素类型包括的用户数据相对于所述第二用户数据的第二权重值;
计算模块,用于利用所述第一权重值和第二权重值,计算得到所述第一目标产品和所述第二目标产品之间的相似度;
发送模块,用于将所述相似度发送至所述第一目标产品对应的商家服务器;
所述计算模块包括:
计算单元,用于针对同一元素类型,计算所述第一权重值和所述第二权重值之间的差值;
确定单元,用于根据得到的所有的差值,确定所述第一目标产品和所述第二目标产品之间的相似度;
所述确定单元,具体用于:
针对每个差值,对该差值进行平方运算,得到第一转换值;
对得到的所有的第一转换值进行求和计算,得到第二转换值;
将所述第二转换值进行开方运算并求倒数,得到所述第一目标产品和所述第二目标产品之间的相似度。
5.根据权利要求4所述的确定装置,其特征在于,所述确定模块,具体用于:
基于每个预设维度,分别对所述第一用户数据和所述第二用户数据进行划分,以得到所述第一用户数据在各预设维度上各元素类型对应的第一子用户数据,以及得到所述第二用户数据在各预设维度上各元素类型对应的第二子用户数据;
对于每个预设维度,在该预设维度上,分别对该预设维度对应的所述第一子用户数据和所述第二子用户数据进行归一化处理,以将对所述第一子用户数据进行归一化处理的结果作为所述第一权重值,以及将对所述第二子用户数据进行归一化处理的结果作为所述第二权重值。
6.根据权利要求4所述的确定装置,其特征在于,还包括:
推荐模块,用于根据所述第一目标产品与至少一个第二目标产品之间的相似度,对所述至少一个第二目标产品按照相似度由高到低进行排列;
按照相似度由高到低的顺序,选择预设数量的第二目标产品;
将所述预设数量的第二目标产品推荐给所述第一用户数据对应的客户端。
CN201910298868.7A 2019-04-15 2019-04-15 一种相似度的确定方法及装置 Active CN110033351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910298868.7A CN110033351B (zh) 2019-04-15 2019-04-15 一种相似度的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910298868.7A CN110033351B (zh) 2019-04-15 2019-04-15 一种相似度的确定方法及装置

Publications (2)

Publication Number Publication Date
CN110033351A CN110033351A (zh) 2019-07-19
CN110033351B true CN110033351B (zh) 2021-09-10

Family

ID=67238406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910298868.7A Active CN110033351B (zh) 2019-04-15 2019-04-15 一种相似度的确定方法及装置

Country Status (1)

Country Link
CN (1) CN110033351B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111009299A (zh) * 2019-12-17 2020-04-14 武汉海云健康科技股份有限公司 相似药品推荐方法及系统、服务器及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456203B (zh) * 2010-10-22 2015-10-14 阿里巴巴集团控股有限公司 确定候选产品链表的方法及相关装置
CN103559758B (zh) * 2013-11-06 2015-12-30 上海煦荣信息技术有限公司 一种智能化的售货系统及售货方法
CN106651533A (zh) * 2016-12-29 2017-05-10 合肥华凌股份有限公司 一种基于用户行为的个性化商品推荐方法及装置
CN108090807B (zh) * 2017-12-13 2021-06-22 北京星选科技有限公司 信息推荐方法及装置
CN109087177B (zh) * 2018-08-21 2021-05-25 北京京东尚科信息技术有限公司 向目标用户推荐商品的方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN110033351A (zh) 2019-07-19

Similar Documents

Publication Publication Date Title
EP3893154A1 (en) Recommendation model training method and related apparatus
US9965522B2 (en) Mobile application search ranking
US8655949B2 (en) Correlated information recommendation
US20180096073A1 (en) Recommendations Based On User Preference And Activities
US20140032475A1 (en) Systems And Methods For Determining Customer Brand Commitment Using Social Media Data
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
WO2013131025A2 (en) Product cycle analysis using social media data
US10031976B2 (en) Personalization platform
US20170061502A1 (en) Unified cross-channel advertisement platform
US10937070B2 (en) Collaborative filtering to generate recommendations
US9679316B2 (en) Selecting diverse product titles to display on a website
EP2778979A1 (en) Search result ranking by brand
US20130179418A1 (en) Search ranking features
US20210192549A1 (en) Generating analytics tools using a personalized market share
WO2014110950A1 (en) Method and device for pushing information
CN106296270A (zh) 商品推荐方法及装置
US20130080437A1 (en) System and method for providing statistics for user submissions
CN110033351B (zh) 一种相似度的确定方法及装置
WO2014138392A2 (en) Content item audience selection
WO2019161718A1 (zh) 归因方法和装置
US11132700B1 (en) Identifying direct and indirect effects in A/B tests
CN108932658B (zh) 数据处理方法、装置和计算机可读存储介质
CN104331823B (zh) 确定发布信息中关键词保留价格的方法及装置
US20160140454A1 (en) User Interest Learning through Hierarchical Interest Graphs
WO2022156589A1 (zh) 一种直播点击率的确定方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant