CN108038730A - 产品相似度判断方法、装置及服务器集群 - Google Patents

产品相似度判断方法、装置及服务器集群 Download PDF

Info

Publication number
CN108038730A
CN108038730A CN201711404168.9A CN201711404168A CN108038730A CN 108038730 A CN108038730 A CN 108038730A CN 201711404168 A CN201711404168 A CN 201711404168A CN 108038730 A CN108038730 A CN 108038730A
Authority
CN
China
Prior art keywords
product
attribute
similarity
attribute information
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711404168.9A
Other languages
English (en)
Inventor
王殿志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201711404168.9A priority Critical patent/CN108038730A/zh
Publication of CN108038730A publication Critical patent/CN108038730A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种产品相似度判断方法、装置及服务器集群,当需要判断产品之间的相似度,以便据此向用户推荐可能感兴趣的相似产品,或实现对大量产品的分类管理等,本发明实施例将获得产品的至少一个属性信息,即可能影响用户选择产品的因素,或影响用户分类的因素,比如笔记本电脑的CPU、硬盘、内存、尺寸、厚度等属性信息,之后,确定每个属性信息对应的当前属性权重,即反映相应属性信息影响用户喜好具有该属性信息的产品的概率,从而基于至少一个属性信息及其对应的当前属性权重,能够更加准确地计算出多个产品之间的相似度,进而提高基于产品相似度计算结果的应用可靠性。

Description

产品相似度判断方法、装置及服务器集群
技术领域
本申请主要涉及相似度计算领域,更具体地说是涉及一种产品相似度判断方法、装置及服务器集群。
背景技术
随着大数据技术的发展,企业通常会跟踪用户对产品的使用情况,来完善产品的设计,调整产品的经营策略,扩大客户群体等,从而使企业获得更多效益以及市场竞争优势。
在实际应用中,企业通常会对用户使用不同产品的行为信息以及用户所属群体特征等数据进行分析,并结合分析结果,为用户推荐可能感兴趣的相似产品,或实现产品分类管理等。
现有技术中,通常是通过计算产品名称以及描述内容等文本信息的相似度,确定产品相似度,然而,由于产品名称以及描述内容等信息往往并不能真实反映产品信息,这将会影响产品相似度计算的准确性,进而影响基于产品相似度实现的产品推荐或产品归类等应用的可靠性。
发明内容
有鉴于此,本发明提供了一种产品相似度判断方法、装置及服务器集群,通过利用能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率的属性权重,实现产品相似度计算,提高了产品相似度计算的准确性,进而提高了基于产品相似度计算结果的应用可靠性。
为了实现上述发明目的,本申请提供了以下技术方案:
一种产品相似度判断方法,所述方法包括:
获取产品的至少一个属性信息;
确定所述至少一个属性信息对应的当前属性权重,所述当前属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率;
基于所述至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度。
可选的,所述基于所述至少一个属性信息和对应的当前属性权重,计算所述多个产品之间的相似度,包括:
获取所述至少一个属性信息对应的属性值;
利用各产品的所述当前属性权重,对相应属性信息的属性值进行加权运算;
基于加权运算结果,对多个产品进行相似度计算,得到所述多个产品之间的相似度。
可选的,所述方法还包括:
对产品的至少一个属性信息进行归一化处理,得到所述产品的属性向量;
相应地,所述基于所述至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度,包括:
利用产品的所述当前属性权重,对所述产品的属性向量中对应的属性元素进行加权运算;
利用加权运算结果,得到所述产品的加权属性向量;
计算多个产品的加权属性向量之间的距离,所述距离表示所述多个产品之间的相似度。
可选的,所述方法还包括:
接收到针对任一属性信息对应的当前属性权重的调整指令;
响应所述调整指令,得到所述属性信息对应的调整后的属性权重;
利用调整后的属性权重,更新所述多个产品之间的相似度,并确定所述多个产品的相似度变化信息。
可选的,所述产品包括第一产品以及至少一个第二产品,则所述基于所述至少一个属性信息和对应的所述当前属性权重,计算多个产品之间的相似度,包括:
利用所述第一产品和所述第二产品分别对应的至少一个属性信息,以及所述至少一个属性信息对应的所述当前属性权重,计算所述至少一个第二产品与所述第一产品的相似度;
选择所述相似度达到预设阈值的第二产品输出。
本发明实施例还提供了一种产品相似度判断装置,所述装置包括:
属性信息获取模块,用于获取产品的至少一个属性信息;
属性权重确定模块,用于确定所述至少一个属性信息对应的当前属性权重,所述当前属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率;
相似度计算模块,用于基于所述至少一个属性信息和对应的所述当前属性权重,计算多个产品之间的相似度。
可选的,所述相似度计算模块包括:
属性值获取单元,用于获取所述至少一个属性信息对应的属性值;
第一加权运算单元,用于利用各产品的所述当前属性权重,对相应属性信息的属性值进行加权运算;
第一相似度计算单元,用于基于加权运算结果,对多个产品进行相似度计算,得到所述多个产品之间的相似度。
可选的,所述装置还包括:
调整指令接收模块,用于接收到针对任一属性信息对应的当前属性权重的调整指令;
调整模块,用于响应所述调整指令,得到所述属性信息对应的调整后的属性权重;
更新模块,用于利用调整后的属性权重,更新所述多个产品之间的相似度,并确定所述多个产品的相似度变化信息。
可选的,所述产品包括第一产品以及至少一个第二产品,则所述相似度计算模块包括:
第二相似度计算单元,用于利用所述当前属性权重,计算所述至少一个第二产品与所述第一产品的相似度;
选择输出单元,用于选择所述相似度达到预设阈值的第二产品输出。
本发明实施例还提供了一种服务器集群,所述服务器集群包括;
通信接口;
存储器,用于存储实现如上所述的产品相似度判断方法的计算机程序;
处理器,用于加载并执行实现以下步骤的所述计算机程序:
获取产品的至少一个属性信息;
确定所述至少一个属性信息对应的当前属性权重,所述当前属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率;
基于所述至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度。
由此可见,与现有技术相比,本发明提供了一种产品相似度判断方法、装置及服务器集群,当需要判断产品之间的相似度,以便据此向用户推荐可能感兴趣的相似产品,或实现对大量产品的分类管理等,本发明实施例将获得产品的至少一个属性信息,即可能影响用户选择产品的因素,或影响用户分类的因素,比如笔记本电脑的CPU、硬盘、内存、尺寸、厚度等属性信息,之后,确定每个属性信息对应的当前属性权重,即反映相应属性信息影响用户喜好具有该属性信息的产品的概率,从而基于至少一个属性信息及其对应的当前属性权重,能够更加准确地计算出多个产品之间的相似度,进而提高基于产品相似度计算结果的应用可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种产品相似度判断方法的流程图;
图2为本发明实施例提供的另一种产品相似度判断方法的流程图;
图3为本发明实施例提供的一种产品相似度判断装置的结构图;
图4为本发明实施例提供的另一种产品相似度判断装置的结构图;
图5为本发明实施例提供的又一种产品相似度判断装置的结构图;
图6为本发明实施例提供的一种服务器集群的硬件结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种产品相似度判断方法、装置及服务器集群,当需要判断产品之间的相似度,以便据此向用户推荐可能感兴趣的相似产品,或实现对大量产品的分类管理等,本发明实施例将获得产品的至少一个属性信息,即可能影响用户选择产品的因素,或影响用户分类的因素,比如笔记本电脑的CPU、硬盘、内存、尺寸、厚度等属性信息,之后,确定每个属性信息对应的当前属性权重,即反映相应属性信息影响用户喜好具有该属性信息的产品的概率,从而基于至少一个属性信息及其对应的当前属性权重,能够更加准确地计算出多个产品之间的相似度,进而提高基于产品相似度计算结果的应用可靠性。
为了使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,为本发明实施例提供的一种产品相似度判断方法的流程图,该方法可以包括:
步骤S11,获取产品的至少一个属性信息;
在本发明实施例中,确定需要计算相似度的产品后,可以先选择出产品中影响用户选择或产品分类等因素的至少一个属性,再获取各产品的该至少一个属性对应的属性信息。可见,对于不同类型的产品,选择的属性不同,获取的至少一个属性信息的内容通常也是不同的。
以笔记本电脑为例,预先确定的至少一个属性可以包括尺寸、厚度、CPU、内存、硬盘、颜色等属性中的一个或多个组合,则属性信息可以是产品相应属性的数值或数据。若产品是水杯,确定的至少一个属性可以包括材质、容量、颜色、形状等属性中的一个或多个组合。本发明实施例对获取的至少一个属性信息的内容不作限定,可以基于产品的不同而不同,本发明实施例在此不再一一列举。
步骤S12,确定该至少一个属性信息对应的当前属性权重;
需要说明的是,对于各属性信息对应的当前属性权重,可以根据经验设定,也可以根据用户在选择产品时的喜好或倾向等条件设定,其能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率,本发明实施例对各属性信息对应的当前属性权重设定方式以及具体数值不做限定,通常情况下,对于任意产品,若获取的至少一个属性信息对应的当前属性权重总和为1,各属性信息对应的当前属性权重通常是不大于1的数值。
仍以上述笔记本电脑为例,若用户A在选择笔记本电脑时,更加看重CPU、内存和硬盘,对于尺寸、厚度、颜色等属性要求不是特别高,那么,CPU、内存和硬盘这些属性对应的当前属性权重的数值比较大,而尺寸、厚度、颜色这些属性对应的当前属性权重的数值比较小。而对于用户B来说,更加看重笔记本电脑的厚度、尺寸以及内存,那么,这几个属性对应的当前属性权重的数值就比较大,而另外几个属性对应的当前属性权重的数值比较小。
可见,用户越看重哪个属性,其对应的当前属性权重的数值越大,也就是说,哪个属性对用户喜好该记笔记电脑的影响越大,该属性对应的当前属性权重的数值越大,两者具体对应关系不作限定,可以采用预设对应关系表或关系函数确定。
在本发明实施例中,若基于用户在选择产品时的喜好或倾向等条件,设定各属性信息对应的当前属性权重,可以按照上述方式实现,那么,在这种情况下,对于同一类产品的至少一个属性信息,获取的相应的当前属性权重可能会有所不同,从而导致后续据此完成的相似度计算结果也可能会有所差异,也就是说,对于不同用户来说,计算得到的产品相似度可能会不同,这样,当需要为用户推荐相似产品时,即便不同用户当前浏览产品相同,为其推荐的相似产品也可能不同,满足了不同用户个性化需求。
当然,若本发明实施例采用经验设定方式,确定产品各属性信息对应的当前属性权重,由于该设定通常可以由当前应用平台的工作人员设定,也就是说,对于不同用户来说,对同一产品的属性信息的当前属性权重通常是相同的。
步骤S13,基于该至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度。
在本发明实施例中,为了实现产品之间的相似度计算,对于每一个产品的至少一个属性信息来说,可以获取该至少一个属性信息对应的属性值,并利用该产品的当前属性权重,对该产品相应的属性信息的属性值进行加权运算,比如计算当前属性权重与对应属性值得乘积,得到该产品的加权运算结果(如至少一个属性值分别与对应当前属性权重的乘积,得到的至少一个乘积结果),从而利用各产品的加权运算结果,计算多个产品的相似度。
可选的,可以利用每一个产品得到的至少一个加权运算结果,得到该产品的加权属性向量,通过计算各产品的加权属性向量之间的距离,来确定各产品之间的相似度。其中,各产品的加权属性向量之间的距离越小,通常表明相应产品之间的相似度越高;反之,各产品的加权属性向量之间的距离越大,通常表明相应产品之间的相似度越低。
需要说明的,本发明实施例对计算产品相似度时采用的相似度算法不作限定,可以是余弦相似度算法、欧氏距离素算法等等,本发明实施例在此不再一一详述。
由此可见,在本发明实施例中,由于产品的属性信息是客观信息,其并不存在产品描述、产品名称等文本信息的不准确性,从而提高了基于产品的属性信息,实现产品相似度计算的准确性,而且,本发明实施例在计算产品相似度时,考虑到了产品属性影响用户喜爱产品的概率,从而使其能够得到体现用户主观感受的产品相似度计算结果。
这样,在该方法用于向用户推荐产品的场景时,能够推荐更加满足用户喜好的相似产品;而将该方法应用到产品分类的场景时,能够得到满足用户个人分类标准的产品分类结果,大大提高了用户体验。
如图2所示,为本发明实施例提供的另一种产品相似度判断方法的流程图,该方法可以包括:
步骤S21,确定产品预设的至少一个属性以及对应的当前属性权重;
可选的,以产品推荐场景为例,可以通过获取用户在应用平台的产品浏览历史数据,预测用户对各产品属性的敏感度,即各产品属性影响用户对产品喜好的概率,从而计算出该产品属性的属性权重,但并不局限于这种计算方法。
可见,在本发明实施例中,可以在确定产品预设的至少一个属性,即影响用户选择产品或产品分类的因素,按照上述方法计算出各属性对应的当前属性权重。当然,也可以如上述实施例描述内容,在获取各产品的至少一个属性信息后,再确定各属性信息对应的当前属性权重,本发明实施例对确定各属性的当前属性权重的执行阶段不作限定。
步骤S22,获取多个产品的至少一个属性对应的属性信息;
在实际应用中,当用户正在浏览产品A时,可以获取产品A的至少一个属性对应的属性信息之外,还可以获取该产品的描述信息,比如产品功能、名称等文本信息,并据此在当前应用平台中初步筛选出相匹配的至少一个产品B(本文中产品A、产品B仅表示两个产品,可能是同一产品类型的产品),通常是与产品A的产品类型相同的至少一个产品B,并获取产品B的至少一个属性对应的属性信息。
若用户需要对应用平台上的大量产品进行分类,此时进行按照功能等要求完成粗略分类之后,对于每一大类产品,可以按照产品相似度进行精细分类,此时,可以获取待分类的多个产品的至少一个属性对应的属性信息。本发明实施例对这种场景中产品初步分类方法不作限定。
步骤S23,对每个产品的至少一个属性信息进行归一化处理,得到该产品的属性向量;
在本发明实施例中,获取的产品的属性信息通常是相应属性的参数,比如尺寸的具体大小、内存大小、硬盘大小、CPU型号等,通过对其进行归一化处理,可以得到各属性信息对应的量化值。本发明实施例对具体归一化处理方法不作限定,比如,可以将实际属性信息采用如min-max标准化(即极值处理法)等方法进行归一化处理,但并不局限于此。
其中,经过归一化处理,得到每个产品的至少一个属性信息对应的量化值后,可以将同一产品的至少一个量化值构成一个属性向量,因此,对于多个产品,可以得到多个属性向量,每一个属性向量的元素是该产品的属性信息的量化值。
步骤S24,利用产品的当前属性权重,对该产品的属性向量中对应的属性元素进行加权运算;
具体的,对于任意一个产品来的属性向量来说,可以对其包含的每个属性元素进行加权运算处理,对应的加权属性元素,如将属性元素与对应的当前属性权重进行乘积运算,并将运算结果作为该属性元素的加权属性元素。
步骤S25,利用加权运算结果,得到该产品的加权属性向量;
本发明实施例可以将由上述运算得到的至少一个加权属性元素,更新相应的属性向量中的属性元素,得到新的属性向量,即加权属性向量。
步骤S26,计算多个产品的加权属性向量之间的距离,确定多个产品之间的相似度;
在本发明实施例中,可以通过计算得到的距离表示多个产品之间的相似度,即该距离可以作为不同产品之间的相似性量度。关于距离与相似度之间的对应关系,可以预设设定相应的关系表,或构建相应的关系函数,本发明实施例对此不做限定。
需要说明的是,本发明实施例对步骤S206采用的具体算法不做限定,可以是欧式距离、曼哈顿距离、夹角余弦、汉明距离、标准化欧式距离、切比雪夫距离等算法实现,本发明实时在此不再一一详述。
步骤S27,接收到针对产品的任一属性对应的当前属性权重的调整指令;
在本发明实施例中,由于产品属性的属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率,通过调整该属性权重,能够直观反映用户喜好对产品相似度影响,即反映产品属性对不同产品相似度影响程度。
基于此,用户可以针对任一属性的当前属性权重发送调整指令,来改变该当前属性权重的数值,本发明实施例对该调整指令的生成方式不作限定,可以通过输出的属性权重调整界面,选择出待调整属性权重,再控制该待调整属性权重的数值增大或减小,从而生成相应的调整指令,实现对上述产品相似度计算过程中,相应当前属性权重的调整。
当然,本发明实施例也可以预先制定属性权重调整规则,当需要查看不同属性对不同产品相似度的影响程度,可以直接触发“调整属性权重”这一按钮,生成相应的调整指令,从而触发预设属性权重调整规则执行预设操作等等,本发明实施例对该属性权重调整规则的内容不做限定,其可以包括对产品的至少一个属性的当前属性权重的调整顺序以及调整方向等内容。
步骤S28,响应该调整指令,得到该属性对应的调整后的属性权重;
步骤S29,利用调整后的属性权重,更新多个产品之间的相似度,并确定多个产品的相似度变化信息。
其中,关于利用调整后的属性权重,更新多个产品之间的相似度的过程,与上述基于产品的至少一个属性信息和对应的当前属性权重,实现多个产品的相似度计算的过程类似,本发明实施例在此不再赘述。
在完成对产品相似度的更新后,可以获取多个产品的相似度变化信息,来确定上述对属性的当前属性权重的调整,对产品相似度的影响,具体可以说是被调整当前属性权重的属性对不同产品相似度影响程序。而且,由于上述对至少一个属性的当前属性权重的调整,可以根据用户喜好实现,因此,得到的相似度变化信息也反映了用户喜好对产品相似度的影响,为企业对产品分类管理或推荐提供的有效指导。
为了更加清楚解释本发明提供的产品相似度判断方案,本发明在此将以产品推荐为例进行说明,但并不局限于这一应用场景。假设用户正在使用购物客户端浏览第一产品的相关信息,此时,该购物客户端对应的应用服务器可以提取该第一产品的特征信息,预测该用户对第一产品属性的敏感度,即用户挑选第一产品时关注的是哪个属性,从而计算出第一产品的至少一个属性的当前属性权重,之后,确定与第一产品的产品类型相同的至少一个第二产品,获取第一产品以及第二产品分别对应的至少一个属性信息,从而按照上述方法,利用第一产品以及第二产品分别对应的至少一个属性信息,以及至少一个属性信息对应的当前属性权重,计算至少一个第二产品与第一产品的相似度,之后,选择出相似度达到预设阈值的第二产品输出,即选择与第一产品相似度最高的第二产品推荐给用户,从而给用户提供更多产品选择对象,不需要用户再一个产品一个产品查看,大大提高了用户体验,
其中,由于在进行产品相似度计算时,考虑了产品的属性信息以及产品属性对用户喜好的影响,保证了产品相似度计算结果的准确性,提高了向用户推荐产品的可靠性。
如图3所示,为本发明实施例提供的一种产品相似度判断装置的结构图,该装置可以包括:
属性信息获取模块310,用于获取产品的至少一个属性信息;
其中,至少一个属性信息可以包括可能影响用户选择产品或产品分类的至少一个产品属性的数据,比如笔记本电脑的尺寸、厚度、CPU、内存、硬盘、颜色等数据,可以根据具体产品确定,本发明实施例对其包含的内容不做限定。
属性权重确定模块320,用于确定所述至少一个属性信息对应的当前属性权重;
其中,该当前属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率。在本发明实施例中,可以根据经验设定产品各属性的属性权重,也可以根据用户喜好设定,具体可以参照上述方法实施例相应部分的描述,本实施例在此不再赘述。
相似度计算模块330,用于基于至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度。
在本发明实施例中,可以利用各产品的属性信息以及对应的当前属性权重,构成该产品的权重属性向量,从而通过计算各产品的权重属性向量之间的距离,来确定相应产品之间的相似度,具体计算过程可以参照上述方法实施例相应部分的描述,但并不局限于这一种产品相似度计算方法。
可选的,如图4所示,该相似度计算模块330可以包括:
属性值获取单元331,用于获取所述至少一个属性信息对应的属性值;
本发明实施例可以采用归一化处理方法,对各产品的至少一个属性信息进行量化处理,将得到各属性信息对应的量化值作为属性值,具体归一化处理方法不作限定。
第一加权运算单元332,用于利用各产品的所述当前属性权重,对相应属性信息的属性值进行加权运算;
其中,加权运算可以是当前属性权重与对应的属性值之间的乘积运算。
第一相似度计算单元333,用于基于加权运算结果,对多个产品进行相似度计算,得到所述多个产品之间的相似度。
需要说明的是,关于第一相似度计算单元具体的产品相似度计算过程可以参照上述方法实施例相应部分的描述,本实施例在此不再赘述。
此外,若上述产品包括第一产品和第二产品,通常第一产品和第二产品的产品类型相同,上述相似度计算模块330可以包括:
第二相似度计算单元,用于利用所述当前属性权重,计算所述至少一个第二产品与所述第一产品的相似度;
选择输出单元,用于选择所述相似度达到预设阈值的第二产品输出。
基于此,在产品推荐应用场景中,可以通过上述方式准确计算出与用户浏览的第一产品相似度较高的至少一个第二产品,并推荐给用户,帮助用户更快更准确挑选符合喜好的目标产品。
作为本发明另一实施例,该装置还可以包括:
归一化处理模块,用于对产品的至少一个属性信息进行归一化处理,得到所述产品的属性向量;
相应地,相似度计算模块330可以包括:
第二加权运算单元,用于利用产品的所述当前属性权重,对所述产品的属性向量中对应的属性元素进行加权运算;
向量确定单元,用于利用加权运算结果,得到所述产品的加权属性向量;
第三相似度计算单元,用于计算多个产品的加权属性向量之间的距离,所述距离表示所述多个产品之间的相似度。
可选的,如图5所示,在上述各实施例的基础上,该装置还可以包括:
调整指令接收模块340,用于接收到针对任一属性信息对应的当前属性权重的调整指令;
调整模块350,用于响应所述调整指令,得到所述属性信息对应的调整后的属性权重;
更新模块360,用于利用调整后的属性权重,更新所述多个产品之间的相似度,并确定所述多个产品的相似度变化信息。
结合上述方法实施例相应部分的描述,本发明可以通过调整各属性的当前属性权重,反映用户喜好对产品相似度的影响,即反映相应属性对不同产品的相似度影响程度,从而通过这种方式确定出用户主观感受的产品相似度,能够为用户推荐更加符合用户喜好的相似产品。
上述产品相似度判断装置可以包括处理器和存储器,上述属性信息获取模块、属性权重确定模块、相似度计算模块、属性值获取单元、第一加权运算单元、第一相似度计算单元、调整指令接收模块、调整模块以及更新模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来获取产品的至少一个属性信息,并利用该至少一个属性信息以及对应的当前属性权重,准确计算出多个产品之间的相似度。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行实现上述产品相似度判断方法,具体步骤可以参照上述方法实施例相应部分的描述,本实施例在此不再详述。
本发明实施例提供了一种处理器,该处理器用于运行计算机程序,其中,该计算机程序运行时执行上述产品相似度判断方法,具体步骤可以参照上述方法实施例相应部分的描述,本实施例在此不再详述。
如图6所示,为本发明实施例提供的一种服务器集群的硬件结构图,该服务器集群可以包括:
通信接口610;
存储器620,用于存储实现如上所述的产品相似度判断方法的计算机程序;
处理器630,用于加载并执行实现以下步骤的所述计算机程序:
获取产品的至少一个属性信息;
确定所述至少一个属性信息对应的当前属性权重,所述当前属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率;
基于所述至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度。
可选的,处理器还可以执行实现以下步骤的计算机程序:
获取所述至少一个属性信息对应的属性值;
利用各产品的所述当前属性权重,对相应属性信息的属性值进行加权运算;
基于加权运算结果,对多个产品进行相似度计算,得到所述多个产品之间的相似度。
可选的,处理器还可以执行实现以下步骤的计算机程序:
对产品的至少一个属性信息进行归一化处理,得到所述产品的属性向量;
利用产品的所述当前属性权重,对所述产品的属性向量中对应的属性元素进行加权运算;
利用加权运算结果,得到所述产品的加权属性向量;
计算多个产品的加权属性向量之间的距离,所述距离表示所述多个产品之间的相似度。
可选的,处理器还可以执行实现以下步骤的计算机程序:
接收到针对任一属性信息对应的当前属性权重的调整指令;
响应所述调整指令,得到所述属性信息对应的调整后的属性权重;
利用调整后的属性权重,更新所述多个产品之间的相似度,并确定所述多个产品的相似度变化信息。可选的,处理器还可以执行实现以下步骤的计算机程序:
利用所述第一产品和所述第二产品分别对应的至少一个属性信息,以及所述至少一个属性信息对应的所述当前属性权重,计算所述至少一个第二产品与所述第一产品的相似度;
选择所述相似度达到预设阈值的第二产品输出。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、服务器集群。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,关于上述各实施例中,诸如第一、第二等之类的关系术语仅仅用来将一个操作、单元或模块与另一个操作、单元或模块区分开来,而不一定要求或者暗示这些单元、操作或模块之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或者系统中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置以及服务器集群而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种产品相似度判断方法,其特征在于,所述方法包括:
获取产品的至少一个属性信息;
确定所述至少一个属性信息对应的当前属性权重,所述当前属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率;
基于所述至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度。
2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个属性信息和对应的当前属性权重,计算所述多个产品之间的相似度,包括:
获取所述至少一个属性信息对应的属性值;
利用各产品的所述当前属性权重,对相应属性信息的属性值进行加权运算;
基于加权运算结果,对多个产品进行相似度计算,得到所述多个产品之间的相似度。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对产品的至少一个属性信息进行归一化处理,得到所述产品的属性向量;
相应地,所述基于所述至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度,包括:
利用产品的所述当前属性权重,对所述产品的属性向量中对应的属性元素进行加权运算;
利用加权运算结果,得到所述产品的加权属性向量;
计算多个产品的加权属性向量之间的距离,所述距离表示所述多个产品之间的相似度。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述方法还包括:
接收到针对任一属性信息对应的当前属性权重的调整指令;
响应所述调整指令,得到所述属性信息对应的调整后的属性权重;
利用调整后的属性权重,更新所述多个产品之间的相似度,并确定所述多个产品的相似度变化信息。
5.根据权利要求1所述的方法,其特征在于,所述产品包括第一产品以及至少一个第二产品,则所述基于所述至少一个属性信息和对应的所述当前属性权重,计算多个产品之间的相似度,包括:
利用所述第一产品和所述第二产品分别对应的至少一个属性信息,以及所述至少一个属性信息对应的所述当前属性权重,计算所述至少一个第二产品与所述第一产品的相似度;
选择所述相似度达到预设阈值的第二产品输出。
6.一种产品相似度判断装置,其特征在于,所述装置包括:
属性信息获取模块,用于获取产品的至少一个属性信息;
属性权重确定模块,用于确定所述至少一个属性信息对应的当前属性权重,所述当前属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率;
相似度计算模块,用于基于所述至少一个属性信息和对应的所述当前属性权重,计算多个产品之间的相似度。
7.根据权利要求6所述的装置,其特征在于,所述相似度计算模块包括:
属性值获取单元,用于获取所述至少一个属性信息对应的属性值;
第一加权运算单元,用于利用各产品的所述当前属性权重,对相应属性信息的属性值进行加权运算;
第一相似度计算单元,用于基于加权运算结果,对多个产品进行相似度计算,得到所述多个产品之间的相似度。
8.根据权利要求6或7任意一项所述的装置,其特征在于,所述装置还包括:
调整指令接收模块,用于接收到针对任一属性信息对应的当前属性权重的调整指令;
调整模块,用于响应所述调整指令,得到所述属性信息对应的调整后的属性权重;
更新模块,用于利用调整后的属性权重,更新所述多个产品之间的相似度,并确定所述多个产品的相似度变化信息。
9.根据权利要求6所述的装置,其特征在于,所述产品包括第一产品以及至少一个第二产品,则所述相似度计算模块包括:
第二相似度计算单元,用于利用所述当前属性权重,计算所述至少一个第二产品与所述第一产品的相似度;
选择输出单元,用于选择所述相似度达到预设阈值的第二产品输出。
10.一种服务器集群,其特征在于,所述服务器集群包括;
通信接口;
存储器,用于存储实现如权利要求1-5任意一项所述的产品相似度判断方法的计算机程序;
处理器,用于加载并执行实现以下步骤的所述计算机程序:
获取产品的至少一个属性信息;
确定所述至少一个属性信息对应的当前属性权重,所述当前属性权重能够反映相应属性信息影响用户喜好具有该属性信息的产品的概率;
基于所述至少一个属性信息和对应的当前属性权重,计算多个产品之间的相似度。
CN201711404168.9A 2017-12-22 2017-12-22 产品相似度判断方法、装置及服务器集群 Pending CN108038730A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711404168.9A CN108038730A (zh) 2017-12-22 2017-12-22 产品相似度判断方法、装置及服务器集群

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711404168.9A CN108038730A (zh) 2017-12-22 2017-12-22 产品相似度判断方法、装置及服务器集群

Publications (1)

Publication Number Publication Date
CN108038730A true CN108038730A (zh) 2018-05-15

Family

ID=62100552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711404168.9A Pending CN108038730A (zh) 2017-12-22 2017-12-22 产品相似度判断方法、装置及服务器集群

Country Status (1)

Country Link
CN (1) CN108038730A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087019A (zh) * 2018-08-18 2018-12-25 北京企信云信息科技有限公司 一种中小企业征信方法及装置
CN109934631A (zh) * 2019-03-13 2019-06-25 联想(北京)有限公司 问答信息处理方法、装置及计算机设备
CN110264269A (zh) * 2019-06-20 2019-09-20 卓尔智联(武汉)研究院有限公司 广告位推荐方法、装置、电子设备及存储介质
CN110852329A (zh) * 2019-10-21 2020-02-28 南京航空航天大学 一种产品外观属性的定义方法
CN111178375A (zh) * 2018-11-13 2020-05-19 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN111291019A (zh) * 2018-12-07 2020-06-16 中国移动通信集团陕西有限公司 数据模型的相似判别方法及装置
CN111369313A (zh) * 2020-02-03 2020-07-03 深圳市道旅旅游科技股份有限公司 订房失败订单的处理方法、装置、计算机设备及存储介质
CN111429183A (zh) * 2020-03-26 2020-07-17 中国联合网络通信集团有限公司 一种商品分析方法及装置
CN111476621A (zh) * 2019-01-24 2020-07-31 百度在线网络技术(北京)有限公司 用户物品推荐方法和装置
CN112036981A (zh) * 2020-09-02 2020-12-04 珠海随变科技有限公司 一种用于提供目标对比商品的方法、装置、设备及介质
CN112218160A (zh) * 2020-10-12 2021-01-12 北京达佳互联信息技术有限公司 视频转换方法及装置和视频转换设备及存储介质
CN112907148A (zh) * 2021-04-01 2021-06-04 携程商旅信息服务(上海)有限公司 基于服务商的产品信息的处理方法、系统、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102654859A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种歌曲推荐方法及系统
CN103824213A (zh) * 2014-03-13 2014-05-28 北京理工大学 一种基于用户偏好与商品属性的个性化推荐方法
CN104462385A (zh) * 2014-12-10 2015-03-25 山东科技大学 一种基于用户兴趣模型的电影个性化相似度计算方法
CN106952130A (zh) * 2017-02-27 2017-07-14 华南理工大学 基于协同过滤的通用物品推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102654859A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种歌曲推荐方法及系统
CN103824213A (zh) * 2014-03-13 2014-05-28 北京理工大学 一种基于用户偏好与商品属性的个性化推荐方法
CN104462385A (zh) * 2014-12-10 2015-03-25 山东科技大学 一种基于用户兴趣模型的电影个性化相似度计算方法
CN106952130A (zh) * 2017-02-27 2017-07-14 华南理工大学 基于协同过滤的通用物品推荐方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087019A (zh) * 2018-08-18 2018-12-25 北京企信云信息科技有限公司 一种中小企业征信方法及装置
CN111178375A (zh) * 2018-11-13 2020-05-19 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN111178375B (zh) * 2018-11-13 2024-04-09 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN111291019A (zh) * 2018-12-07 2020-06-16 中国移动通信集团陕西有限公司 数据模型的相似判别方法及装置
CN111291019B (zh) * 2018-12-07 2023-09-29 中国移动通信集团陕西有限公司 数据模型的相似判别方法及装置
CN111476621B (zh) * 2019-01-24 2023-09-22 百度在线网络技术(北京)有限公司 用户物品推荐方法和装置
CN111476621A (zh) * 2019-01-24 2020-07-31 百度在线网络技术(北京)有限公司 用户物品推荐方法和装置
CN109934631A (zh) * 2019-03-13 2019-06-25 联想(北京)有限公司 问答信息处理方法、装置及计算机设备
CN110264269A (zh) * 2019-06-20 2019-09-20 卓尔智联(武汉)研究院有限公司 广告位推荐方法、装置、电子设备及存储介质
CN110852329A (zh) * 2019-10-21 2020-02-28 南京航空航天大学 一种产品外观属性的定义方法
CN111369313A (zh) * 2020-02-03 2020-07-03 深圳市道旅旅游科技股份有限公司 订房失败订单的处理方法、装置、计算机设备及存储介质
CN111429183A (zh) * 2020-03-26 2020-07-17 中国联合网络通信集团有限公司 一种商品分析方法及装置
CN112036981A (zh) * 2020-09-02 2020-12-04 珠海随变科技有限公司 一种用于提供目标对比商品的方法、装置、设备及介质
CN112218160A (zh) * 2020-10-12 2021-01-12 北京达佳互联信息技术有限公司 视频转换方法及装置和视频转换设备及存储介质
CN112907148A (zh) * 2021-04-01 2021-06-04 携程商旅信息服务(上海)有限公司 基于服务商的产品信息的处理方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN108038730A (zh) 产品相似度判断方法、装置及服务器集群
US11983748B2 (en) Using artificial intelligence to determine a size fit prediction
Kaul et al. Research for product positioning and design decisions: An integrative review
CA2655196C (en) System and method for generating a display of tags
CN110163647A (zh) 一种数据处理方法及装置
US10672015B2 (en) Streaming events modeling for information ranking to address new information scenarios
KR102340463B1 (ko) 샘플 가중치 설정방법 및 장치, 전자 기기
CN110363213A (zh) 服装图像的认知分析和分类
US20200234218A1 (en) Systems and methods for entity performance and risk scoring
WO2012016039A1 (en) Determining a likelihood of suitability based on historical data
CN107808314B (zh) 用户推荐方法及装置
WO2004001652A2 (en) Method system and computer program product for dynamic construction of packages and optimal assignement
CN112966189B (zh) 一种基金产品推荐系统
US20140195312A1 (en) System and method for management of processing workers
CN113407854A (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
JP4386973B2 (ja) 階層的予測モデル構築装置及びその方法
US20150142482A1 (en) Search engine for identifying business travel proposals
US11861698B2 (en) Vehicle selection platform
US20220245699A1 (en) Systems and methods for determining price bands and user price affinity predictions using machine learning architectures and techniques
CN113095680A (zh) 电力大数据模型的评价指标体系与构建方法
KR101081947B1 (ko) 대용량 데이터를 위한 하이브리드 추천 방법 및 시스템
WO2020150597A1 (en) Systems and methods for entity performance and risk scoring
WO2019200296A1 (en) Computing systems and methods for improving content quality for internet webpages
CN107077475A (zh) 根据产品/用户标签和共安装图推荐产品捆绑包的系统和方法
CN108345941B (zh) 一种参数调整方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180515

RJ01 Rejection of invention patent application after publication