CN102456203B - 确定候选产品链表的方法及相关装置 - Google Patents

确定候选产品链表的方法及相关装置 Download PDF

Info

Publication number
CN102456203B
CN102456203B CN201010527002.8A CN201010527002A CN102456203B CN 102456203 B CN102456203 B CN 102456203B CN 201010527002 A CN201010527002 A CN 201010527002A CN 102456203 B CN102456203 B CN 102456203B
Authority
CN
China
Prior art keywords
product
value
nominal
generic attribute
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010527002.8A
Other languages
English (en)
Other versions
CN102456203A (zh
Inventor
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201010527002.8A priority Critical patent/CN102456203B/zh
Priority to TW100104748A priority patent/TWI517065B/zh
Priority to JP2013535007A priority patent/JP5897019B2/ja
Priority to PCT/US2011/056720 priority patent/WO2012054488A1/en
Priority to US13/381,822 priority patent/US20130198022A1/en
Priority to EP11834994.3A priority patent/EP2630625A4/en
Publication of CN102456203A publication Critical patent/CN102456203A/zh
Priority to HK12107086.6A priority patent/HK1166412A1/zh
Application granted granted Critical
Publication of CN102456203B publication Critical patent/CN102456203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Abstract

本申请公开了一种确定候选产品链表的方法及相关装置,用以解决现有技术无法准确地确定产品之间的相似度值,导致无法准确提供候选产品链表的问题。该方法包括:提供包括第一产品和多个第二产品的同类产品集合,针对集合中每个第二产品:计算第一产品和第二产品在每个标称类属性上值的相似度值时,当第一产品属性的值和第二产品属性的值不同时,根据购买记录集合中购买该第一产品属性值的产品的用户购买第二产品属性值的产品的倾向性,确定相似度值;根据第一产品和第二产品非标称类属性的值的相似度值和标称类属性的值的相似度值,计算第一产品和第二产品的产品相似度值;将与第一产品相似度值排名靠前的第二产品作为第一产品的候选产品链表。

Description

确定候选产品链表的方法及相关装置
技术领域
本申请涉及计算机网络技术领域,尤其涉及一种确定候选产品链表的方法、一种确定两个产品之间标称类属性上值的相似度值的方法、一种确定候选产品链表的装置及一种提供候选产品链表的系统。
背景技术
网上购物作为一种新兴的购物方式,与传统的实体购物方式相比具有种类齐全、方便快捷、省时省力以及价格低廉的优势,已经成为一种普遍的购物方式。
网店经营者预先在电子商务网站上上传自身销售的每种产品的信息,产品信息包括产品标识、图片以及该产品各属性的属性值。根据属性值的取值特点,产品属性可以被分为以下两大类:标称类属性和非标称类属性。其中非标称类属性包括数值型属性、序数型属性以及集合类属性等。
标称类属性的特点是其属性值为无值序字符串,例如产品品牌属于标称类属性,其属性值的取值为无值序字符串,以化妆品为例,产品品牌属性的取值范围为雅芳、玉兰油、雅诗兰黛、碧欧泉、兰蔻、......等。而非标称类属性的属性值为自然数或者可以对应为自然数的有值序字符串。例如,产品价格属性属于数值型属性,其属性值的取值范围为大于零的实数,以产品为某一款式的鞋子为例,该鞋子的价格为59.99元。又如产品销量属性属于序数型属性,其属性值的取值范围为自然数,或者可以被映射为自然数的其他形式,例如“高”、“中”、“低”等有值序字符串,仍以某一款式的鞋子为例,鞋子的销量为100双。产品颜色属于集合类属性,其属性值的取值范围为预定枚举集合中的一个或多个元素形成的集合,如鞋子的颜色值为{紫色,红色,黄色}。
用户在进行网上购物时,常见的一种流程为:通过浏览器客户端登录电子商务网站,通过电子商务网站提供的搜索功能、推荐产品列表或者该用户此前收藏的网店经营者的销售产品列表等途径,获得各种产品的信息,基于获得的信息选择一个产品,在确认购买之后,发出产品订单。
在上述过程中,用户根据各种产品信息,选择产品及确认购买是一个关键步骤。为了向用户提供更多相关产品的信息,便于用户货比三家,电子商务网站在用户选择一个产品之后,通常都会向用户提供与选择出的产品相近或相似的一些其他候选产品的信息。
现有技术中,向用户提供与指定产品相近或相似的候选产品链表的基本原理如附图1所示,假定用户选定的产品为产品t,具体步骤如下:
步骤101,从产品属性信息数据库中获取每个产品各属性的属性值,包括产品t和其他产品的各属性的属性值;
步骤102,根据获取到的产品的属性值,逐个计算产品t与每个其他产品的相似度值;
以产品c为例,根据获取到的产品c的各属性的值与产品t的各对应属性的值,计算产品c与产品t的相似度值Similarity(t,c),
Similarity ( t , c ) = Σ i = 1 . . . n w i * sim i ( t i , c i ) Σ i - 1 . . . n w i
其中,i为属性的标识,假定每个产品均有n个属性,那么i的取值为1至n;ti为产品t第i个属性的值、ci为产品c第i个属性的值;wi为第i个属性的权重值;Simi为产品t和产品c在第i个属性上值的相似度值。
步骤103,基于步骤102计算出的每个产品与用户选择的产品t的相似度值Similarity(t,c),选择相似度值超过预定阈值ds的产品组成产品t的相似产品集合CA
步骤104,将相似产品集合CA中各产品按照与产品t的相似度值由高到底的顺序排列,选取其中排名靠前的预定N个产品的链表作为产品t的相似产品链表;
步骤105,将步骤104确定出的相似产品链表中每个产品的相关信息,例如产品标识、图片、简介、评价等信息提供给用户。
另外,还可以在用户选择产品之前,预先存储每个产品的标识以及该产品对应的相似产品链表,以备在用户选择产品后,根据选择出产品的标识查询该产品的相似产品链表提供给用户。
在上述步骤102中,对于产品的不同类型的属性,现有技术采用以下方案来计算属性的相似度值Simi
1、如果属性i为数值型属性,产品t和产品c在属性i上值的相似度值为:
Sim i ( t i , t c ) = 1 - D ( t i , c i ) - min D max D - min D
其中,D(,)为距离测度,D(ti,ci)=|ti-ci|;min D是所有产品在属性i上两两之间距离测度值中的最小值;
2、如果属性i为序数型属性,产品t和产品c在属性i上值的相似度值为:
Sim i ( t i , c i ) = 1 - | t i - c i | ( n - 1 ) , 其中n为序数的取值上限;
3、如果属性i为集合型属性,产品t和产品c在属性i上值的相似度值为:
Sim i ( t i , c i ) = | t i ∩ c i | | t i ∪ c i | ;
4、如果属性i为标称型属性,产品t和产品c在属性i上值的相似度值为:
其中:N为产品总数;
其中f(ti)与f(ci)分别表示ti与ci在同类产品集合的产品该属性的属性值中出现的次数。
s(·)与属性值ti和属性值ci分别在所有产品该标称属性的值中出现的次数有关,如果二者出现的次数接近,例如二者的出现次数都较多,或者二者出现的次数都较少,则二者的相似度值较高;否则,二者的相似度值较低。
上述log(N/f(·))函数用于度量一个属性值的特殊性,或者说与众不同特点,当属性值ti在各产品该标称类属性的属性值中出现的频率较低时,该函数值较大;反之出现的频率较高时,该函数值较小。
ti和ci之间的相似度值Simi(ti,ci)与s(·)的含义相似,只是为了便于计算两个产品之间的相似度值将s(·)的取值范围进行了归一化处理,即使取值范围调整为[0,1]。
目前,产品的标称类属性在产品的所有属性中所占的比例较大,例如产品品牌属性、产品名称属性等等,并且许多标称类属性、例如产品品牌属性是用户选择产品时重要的考虑因素,因此在计算两个产品之间的相似度值Similarity(t,c)时,标称类属性的权重值,即标称类属性的重要性往往非常高,而现有技术在计算两个产品之间标称类属性的值的相似度值时,实质上是基于字符串匹配技术来实现的,即当两个产品该标称类属性的属性值字符串相同时,则相似度值为1;否则按照字符串的统计分布来计算相似度值;现有技术的处理方案无法深入发现属性值内在的语义含义,不能很好地计算出标称类属性这一重要属性的相似度值,导致无法准确地为用户提供用户选定的产品的候选产品。
发明内容
本申请实施例提供一种确定候选产品链表的方法,用以解决现有技术无法准确地确定产品之间的相似度值,导致无法准确地提供候选产品链表的问题。
对应地,本申请实施例还提供了一种提供候选产品链表的系统和一种确定产品标称类属性上的相似度值的装置。
本申请实施例提供的技术方案如下:
一种确定候选产品链表的方法,包括:提供包括第一产品和多个第二产品的同类产品集合,针对同类产品集合中的每个第二产品执行:计算所述第一产品和所述第二产品在每个非标称类属性上值的相似度值;计算所述第一产品和所述第二产品在每个标称类属性上值的相似度值时,执行:当第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值;根据第一产品和第二产品的非标称类属性的值的相似度值和标称类属性的值的相似度值,计算第一产品和第二产品的产品相似度值;将与第一产品相似度值排名靠前的至少一个第二产品作为所述第一产品的候选产品链表。
一种确定两个产品之间标称类属性上值的相似度值的方法,包括:计算第一产品和第二产品在标称类属性上值的相似度值时,执行:在第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品的该标称类属性的值和第二产品该标称类属性的值的相似度值。
一种确定候选产品链表的装置,包括:提供单元,用于提供包括第一产品和多个第二产品的同类产品集合;第一相似度确定单元,用于针对同类产品集合中的每个第二产品,计算所述第一产品和所述第二产品在每个非标称类属性上值的相似度值;第二相似度确定单元,用于针对同类产品集合中的每个第二产品,计算所述第一产品和所述第二产品在每个标称类属性上值的相似度值时,执行:当第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值;产品相似度确定单元,用于根据第一相似度确定单元确定出的第一产品和第二产品的非标称类属性的值的相似度值和第二相似度确定单元确定出的第一产品和第二产品标称类属性的值的相似度值,计算第一产品和第二产品的产品相似度值;链表确定单元,用于根据第三相似度确定单元确定出的第一产品和每个第二产品的产品相似度值,将与第一产品相似度值排名靠前的至少一个第二产品作为所述第一产品的候选产品链表。
一种提供候选产品链表的系统,包括:网页服务器,用于向确定候选产品链表的装置发送候选产品查询请求,该请求中包含指定产品的标识;交易记录数据库,用于存储用户购买记录集合;产品属性数据库,用于存储每个产品各属性的值;确定候选产品链表的装置,用于根据交易记录数据库中存储的用户购买记录集合和产品属性数据库中存储的每个产品各属性的值,确定每个产品对应的候选产品链表,并存储每个产品的标识以及该产品的候选产品链表的对应关系;接收到网页服务器发来的候选产品查询请求后,从存储的产品的标识以及候选产品链表的对应关系中选择出所述产品查询请求中包含的所述指定产品的标识对应的候选产品链表,并将选择出的候选产品链表提供给网页服务器。
本申请实施例通过对确定两个产品相似度值过程中确定该两个产品在标称类属性上值的相似度值的步骤进行改进,根据每个产品该标称类属性的值和整体用户购买产品的记录,确定整体用户群在购买该标称类属性值与第一产品的属性值一致的产品和该标称类属性值与第二产品的属性值一致的产品上表现出的倾向性特征是否相似,若相似,则确定第一产品该标称类属性的属性值与第二产品该标称类属性的属性值的相似度值较高;否则,相似度值较低,从而能够根据属性值内在的语义含义来确定相似度值,提高了计算标称类属性值相似度值的准确性。
附图说明
图1为现有技术中提供与指定产品相关的候选产品链表的流程图;
图2为本申请实施例的主要实现原理流程图;
图3a为本申请实施例中提供候选产品链表的系统的原理结构图;
图3b为本申请实施例一中向用户提供候选产品链表的过程流程图;
图4为本申请实施例一中确定候选产品链表的装置的结构示意图;
图5为本申请实施例一中计算产品A和产品B标称类属性I的属性值的相关度值的流程图;
图6a为本申请实施例一中用户属性值矩阵的示意图;
图6b为本申请实施例一中用户属性值矩阵中产品A标称类属性I的属性值对应的列向量和产品B标称类属性I的属性值对应的列向量的示意图;
图7为为本申请实施例一中提出的采用条件概率方式确定标称类属性值的相似度值的流程图;
图8为本申请实施例二中确定候选产品链表的装置的结构示意图。
具体实施方式
申请人发现现有技术无法将与用户选择出的产品较为相关的候选产品优先地提供给用户的原因在于:计算两个产品之间同一标称类属性的值的相似度值时,是基于硬计算范式的,即是基于这两个产品该标称类属性的值分别在所有产品该标称类属性值中出现频率来确定相似度值的;而无法深入发现属性值内在的语义含义。例如对于化妆品类别的产品来说,每个产品具有的品牌属性为标称类属性,该属性值的取值为无值序字符串,例如假设存在品牌“品牌一、品牌二、品牌三、品牌四、品牌五、品牌六”,并假设“品牌一、品牌二、品牌三”这三个品牌属于高档品牌,而“品牌四、品牌五、品牌六”属于低档品牌。此时,不能因为“品牌二”和“品牌五”在所有产品的品牌名称这一标称类属性的属性值中出现频率接近,就认为这两个品牌的相似度高。在计算品牌属性的相似度时,同为高档品牌的产品之间应具有较高的相似度值,而高档品牌的产品和低档品牌的产品之间应具有较低的相似度值。
本申请的基本思想是:在计算两个产品A(第一产品)和B(第二产品)之间的相似度值的过程中,对计算标称类属性值的相似度值的步骤进行改进,具体为:
对于每个标称类属性来说,根据该标称类属性的值与产品A该标称类属性的值一致的产品、该标称类属性的值与产品B该标称类属性的值一致的产品分别被各用户购买的记录,来确定整体用户群购买的产品分别在产品A该标称类属性值上体现出的倾向性特点(即哪些用户倾向于购买该标称类属性的值与产品A该标称类属性的值一致的产品,例如哪些用户倾向于购买“品牌二”品牌的产品)、以及在产品B该标称类属性值上体现出的倾向性特点(即哪些用户倾向于购买该标称类属性的值与产品B该标称类属性的值一致的产品,例如哪些用户倾向于购买“品牌五”品牌的产品),如果整体用户群购买的产品在产品A该标称类属性的值上体现出的倾向性特点与在产品B该标称类属性的值上体现出的倾向性特点相同,即购买“品牌二”品牌的产品的用户通常也购买“品牌五”品牌的产品,那么认为在产品品牌标称类属性上,“品牌二”和“品牌五”相似度高,否则认为“品牌二”和“品牌五”相似度低。
在此基础上,结合其他类别属性上属性值的相关度值计算方法,确定用户当前选定的产品与其他产品的相似度值;再根据计算出的相似度值确定优先提供给用户的候选产品链表。
如图2所示,本申请实施例的主要实现原理流程如下:
步骤10,提供包括第一产品和多个第二产品的同类产品集合,针对所述同类产品集合中的每个第二产品执行步骤20~步骤50:
步骤20,计算所述第一产品和所述第二产品在每个非标称类属性上值的相似度值;
步骤30,计算所述第一产品和所述第二产品在每个标称类属性上值的相似度值时,执行:当第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值;
步骤40,根据步骤20计算出的第一产品和第二产品的非标称类属性的值的相似度值和步骤30计算出的标称类属性的值的相似度值,计算第一产品和第二产品的产品相似度值;
步骤50,将与第一产品相似度值排名靠前的至少一个第二产品作为所述第一产品的候选产品链表。
在步骤30计算中两个产品的标称类属性的值的相似度值过程中,确定这两个产品在每个标称类属性上的相似度值时,在第一产品和第二产品该标称类属性的值相同时,可将第一产品和第二产品该标称类属性的值的相似度设定的最高值,例如1。
下面将依据本申请上述发明原理,详细介绍两个实施例来对本申请方法的主要实现原理进行详细的阐述和说明。
实施例一
请参照附图3a,为本申请实施例中提供候选产品链表的系统的原理结构图。该系统包括浏览器客户端、网页Web服务器、交易记录数据库、产品属性数据库和确定候选产品链表的装置。
其中,用户通过浏览器客户端登录网页服务器查看各种产品信息,选择感兴趣的产品、以及确认购买产品等;
网页服务器,用于向确定候选产品链表的装置发送候选产品查询请求,该请求中包含指定产品的标识;
交易记录数据库,用于存储用户购买产品的订单记录数据,每条订单记录包括订单生成时间、用户标识、用户所购买的产品的标识、购买产品的数量等;
产品属性数据库,用于存储每个产品各属性的属性值;
确定候选产品链表的装置,用于针对同类产品集合中的每个产品,根据该产品和所述同类产品集合中每个其他产品各属性值的相似度值和设定的各属性权重值,确定该产品与所述其他产品的相似度值,根据交易记录数据库中存储的用户购买记录集合和产品属性数据库中存储的每个产品各属性的值,确定每个产品对应的候选产品链表,并存储每个产品的标识以及该产品的候选产品链表的对应关系;接收到网页服务器发来的候选产品查询请求后,从存储的产品的标识以及候选产品链表的对应关系中选择出所述产品查询请求中包含的所述指定产品的标识对应的候选产品链表,并将选择出的候选产品链表提供给网页服务器;
其中,在确定同类产品集合中第一产品和第二产品的相似度值时,针对同类产品集合中的每个第二产品执行:计算所述第一产品和所述第二产品在每个非标称类属性上值的相似度值;计算所述第一产品和所述第二产品在每个标称类属性上值的相似度值时,执行:当第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值;根据第一产品和第二产品的非标称类属性的值的相似度值和标称类属性的值的相似度值,计算第一产品和第二产品的产品相似度值;将与第一产品相似度值排名靠前的至少一个第二产品作为所述第一产品的候选产品链表。
本申请实施例中为用户提供候选产品链表的过程流程图如附图3b所示。
步骤301,用户通过浏览器客户端与网页服务器进行交互,发送浏览产品请求,浏览产品请求可以为多种消息,例如查看推荐产品列表的请求,或者根据关键词查询产品信息的请求,或者在通过用户名和密码登录后发送查看收藏网店的销售产品列表的请求;
步骤302,网页服务器接收到浏览产品请求后,对应向用户提供产品列表,产品列表中不仅可以包含产品标识,还可以附加提供产品的缩略图、简要介绍等等;
步骤303,用户基于网页服务器提供的产品列表,选中其中的一个产品A,例如将鼠标停留在该产品的缩略图上、或者点击该产品的标识等等;
步骤304,网页服务器向确定候选产品链表的装置发送候选产品查询请求,该请求中包含用户选中的产品A的标识;
步骤305,确定候选产品链表的装置接收到候选产品查询请求后,从预先存储的各产品的标识与候选产品链表的对应关系(如表1所示)中,查找候选产品查询请求中包含的产品A的标识对应的候选产品链表为ListA:H-I-J,表1中的H、I、J、K、L、M、R、S、T、U分别为其他产品的标识;表1给出了存储的产品标识与候选产品链表的对应关系的示例。
表1
  产品标识   对应的候选产品链表
  A   ListA:H-I-J
  B   ListB:K-L-M
  C   ListC:R-S-T-U
表1中的候选产品链表是确定候选产品链表的装置预先根据交易记录数据库和产品属性数据库中存储的数据,计算产品A与其他产品的相似度值,将与产品A的相似度值超过预定阈值的产品加入候选产品集合CA中,并将CA中的产品按照相似度值由高到低的顺序排序,并从中选取排名靠前的预定数目的产品而生成的候选产品链表,在本实施例中产品A的候选产品链表为ListA:H-I-J;
为了提高计算两个产品相似度值时的效率,可以预先对产品类别进行分类,仅计算产品A所属的同类产品集合中的其他产品与产品A的相似度值,例如假定用户选中的产品A为“品牌五”润肤霜,那么这时只需要计算化妆品产品集合中的其他产品与产品A“品牌五”润肤霜之间的相似度值即可。
步骤306,确定候选产品链表的装置将查找到的候选产品链表ListA:H-I-J发送给网页服务器;
步骤307,网页服务器将确定候选产品链表的装置发来的候选产品链表通过浏览器客户端显示给用户;
步骤308,用户根据显示的候选产品链表,确定想要购买的产品,确认购买后,向网页服务器发送确认购买通知,该确认购买通知中包含确认购买的产品的标识;
步骤309,网页服务器接收到确认购买通知后生成订单,并在交易记录数据库中存储用户购买记录。
上述步骤306中,也可以直接发送至浏览器客户端显示给用户;即不通过网页服务器中转,省略步骤307。
在上述步骤305中,确定候选产品链表的装置的结构示意图如附图4所示,在确定候选产品链表时,该装置首先逐一计算同类产品集合中的每个产品(以产品A为例)与同类产品集合中的每个其他产品(以产品B为例)每个属性的属性值之间的相似度值,并根据产品A与产品B各属性值的相关度值,计算产品A与产品B的相似度值,由于本申请主要是通过附图5中的各步骤详细地说明计算两个产品的标称类属性值的相关度值时的改进,计算非标称类属性的属性值的相关度值时,例如数值型属性、序数型属性和集合类属性的值的相关度值的方法与现有技术类似,此处不再赘述。
这里以计算产品A和产品B的标识为Attribute_I的标称类属性上值的相关度值为例进行说明。
步骤501,根据产品属性数据库中存储的各产品的标称类属性Attribute_I的值,确定标称类属性Attribute_I的值集合ITEM;
产品属性数据库中的数据表Table_P中存储有每个产品各属性的值,数据表Table_P的存储结构如表2所示,每行包含同一个产品各属性的值,每列包含各产品同一属性的值,也可以理解为一个产品的不同属性的值分别存储于同一行的不同字段中。
表2
通过数据库查询SQL语句“Select distinct Attribute_I from Table_P”可以从表Table_P中获取属性Attribute_I对应的字段中不同的属性值,从而获得属性Attribute_I的包含有N个元素的属性值集合ValueSet_Attribute_I={ITEMi},i=0,...N,在本实施例中属性值集合ValueSet_Attribute_I具体包括3个不同的值:ITEM1、ITEM2和ITEM3
步骤502,从交易记录数据库中获取购买过产品的用户集合Set_U;
假定在交易记录数据库中订单数据表Table_T的存储结构如表2所示,每行的不同字段分别存储一个订单记录的各种相关数据,包括订单生成时间、用户标识、用户所购买的产品的标识、购买产品的数量等。以表3其中第3行为例,序列号为55的订单记录表明标识为u100的用户,在2007年1月4日18点00时00分购买了1件产品标识为A的产品。
表3
上述表Table_T中存储用户标识的字段为user,通过数据库查询SQL语句“Select distinct user from Table_T”可以从表Table_T中获取字段user中不同的用户标识u100、u101,从而获得用户标识集合Set_U={u100,u101};
较佳地,考虑到用户的购买行为具有连续性,即习惯进行网上购物的用户往往每周、或每个月都要进行网上购物,这种用户的行为具有一定的习惯性或倾向性特点;而有的用户只是2、3年中偶尔进行了一次网上购物,这类用户的行为具有很大的偶然性,很难从中发现倾向性,因此相比较而言,前一类用户的订单记录更有用,出于减少数据量,提高处理效率方面的考虑,可以从用户标识集合Set_U中进一步筛选出预定时间段内进行网上交易的用户,例如一个月、一个季度、半年、一年内等进行网上交易的用户。
步骤503,根据步骤501获得的属性Attribute_I的属性值集合ValueSet_Attribute_I,以及步骤502获得的用户标识集合Set_U,确定每个用户标识ui与属性Attribute_I的属性值之间的三元组<ui,itemj,1/0>,如果用户标识为ui的用户购买过属性Attribute_I的属性值为itemj的产品,则第三个向量值为1(或其他第一预定值),即<ui,itemj,1>;否则,特征三元组中第三个向量值为0(或其他第二预定值),即<ui,itemj,0>;
依次取出用户标识集合Set_U中的每个用户标识,构建该用户标识与属性Attribute_I的属性值之间的三元组,下面给出了两种三元组的构建方法,执行以下步骤:
方案一:从订单数据表Table_T中取出用户标识为ui的所有记录,根据取出的记录中的产品标识字段,即可获得用户标识为ui的用户已购买的产品标识的集合从产品属性数据库中获取集合中各产品属性Attribute_I的值,将第一向量为ui、第二向量为中各产品属性Attribute_I的值的三元组的第三个向量值设置为1;将第一向量为ui、第二向量为属性值集合Set_Attribute_I中除用户标识为ui的用户已购买的产品属性Attribute_I的值之外的属性值的三元组中第三个向量值设置为0;以此获取每个用户标识ui与属性值集合Set_Attribute_I中包含的属性值数量对应的N个三元组。
方案二:依次获取属性值集合Set_Attribute_I中的各属性值itemk,k的取值范围为0至N(属性值集合Set_Attribute_I中包含的元素数目),执行以下SQL语句:
Select*
From Table_T and Table_P
Where T.user=”ui”and T.product=P.product and P.Attribute_I=”itemk
若执行上述语句后的返回值不为空,则说明用户ui购买过标称类属性Attribute_I的值为itemk的产品,将第一向量为ui、且第二向量为itemk的三元组中第三个向量设置为1,即<ui,itemk,1>;否则将第一向量为ui、且第二向量为itemk的三元组中的第三个向量设置为0,即<ui,itemk,0>。
步骤504,根据步骤503确定出的各用户对应的标称类属性Attribute_I的N个三元组,确定标称类属性Attribute_I的用户属性值矩阵,用户属性值矩阵中的每行包含同一用户购买的产品是否具有属性值集合ValueSet_Attribute_I中的各属性值的信息,该矩阵中的每列包含各用户购买的产品是否具有属性值集合ValueSet_Attribute_I中同一属性值的信息;
如附图6a所示,按照设定的属性值集合Set_Attribute_I中各属性值的排列顺序,依次将同一用户对应的N个三元组中的第三个向量填入特征矩阵的同一行的不同位置中。
步骤505,从步骤504获得的属性值矩阵中提取产品A标称类属性Attribute_I的属性值itemi对应的列向量以及产品B标称类属性Attribute_I的属性值itemj对应的列向量如附图6b中的黑色粗线框所示,在本实施例中
其中列向量表明整体用户群购买的产品标称类属性Attribute_I的属性值为itemi的倾向性特征,即哪些用户倾向于购买标称类属性Attribute_I的属性值为itemi的产品;列向量表明整体用户群购买的产品标称类属性Attribute_I的属性值为itemj的倾向性特征,即哪些用户倾向于购买标称类属性Attribute_I的属性值为itemj的产品。
步骤506,计算步骤505提取出的的互相关度值,将计算出的互相关度值作为产品A和产品B的标称类属性Attribute_I的值的相似度值simi(itemi,itemj);
sim i ( item i , item j ) = cos ( R &RightArrow; * , i , R &RightArrow; * , j ) = R &RightArrow; * , j * R &RightArrow; * , i | | R &RightArrow; * , i | | 2 | | R &RightArrow; * , j | | 2 .
需要说明的是,也可以采用条件概率的方式替代步骤506中计算互相关度的方式确定产品A和产品B的标称类属性Attribute_I的属性值的相似度值simi(itemi,itemj),具体过程请参照附图7所示:
步骤701,根据该标称类属性的值与第一产品该标称类属性的值一致的产品和该标称类属性的值与第二产品该标称类属性的值一致的产品被各用户购买的记录,确定购买该标称类属性的值与第一产品该标称类属性的值一致的产品的第一用户集合、购买该标称类属性的值与第二产品该标称类属性的值一致的产品的第二用户集合、同时购买该标称类属性的值与第一产品该标称类属性的值一致的产品和该标称类属性的值与第二产品该标称类属性的值一致的产品的第三用户集合;
在本实施例中根据附图6b中的第i列和第j列,可以获得购买标称类属性Attribute_I的属性值为itemi的产品的用户集合UA(即中元素值为1的元素对应的用户组成的集合)、购买标称类属性Attribute_I的属性值为itemj的产品的用户集合UB(即中元素值为1的元素对应的用户组成的集合)、以及同时购买属性值为itemi的产品和属性值为itemj的产品的用户集合UAB
步骤702,根据第一用户集合、第二用户集合和第三用户集合,确定用户在购买属性值与第一产品该标称类属性属性值一致的产品的情况下购买属性值与第二产品该标称类属性属性值一致的产品的第一条件概率、以及用户在购买属性值与第二产品该标称类属性属性值一致的产品的情况下购买属性值与第一产品该标称类属性属性值一致的产品的第二条件概率;
根据用户集合UA、用户集合UAB确定用户在购买属性值为itemi的产品的情况下购买属性值为itemj的产品的条件概率为:
P(B|A)=|UAB|/|UA|,其中|U|为集合U中包含的元素数量;
同理可以获得购买属性值itemj为的产品的情况下购买属性值为itemi的产品的条件概率为:
P(A|B)=|UAB|/|UB|;
步骤703,将第一条件概率和第二条件概率的算术平均值作为确定第一产品和第二产品该标称类属性值的相似度值。
确定产品A的标称类属性Attribute_I的属性值itemi和产品B的标称类属性Attribute_I的属性值itemj的相似度值simi(itemi,itemj)为:
simi(itemi,itemj)=(P(B|A)+P(A|B))/2
即,如果购买标称类属性Attribute_I的属性值为itemi的产品的用户群中的而用户同时也有较大可能倾向于购买标称类属性Attribute_I的属性值为itemj的产品,则说明在属性值itemi和属性值itemj具有较高的相似性。
当然,附图7只是给出了一种准确性更高的计算两个产品标称类属性上值的相似度值的方案,直接将第一条件概率和第二条件概率作为相似度值也可以解决无法发现属性值内在的语义含义的问题。
如附图4所示,确定候选产品链表的装置具体包括提供单元401、第一相似度确定单元402、第二相似度确定单元403、产品相似度确定单元404、链表确定单元405;较佳地还可以包括存储单元406、接收单元407、选择单元408和发送单元409,其中:
提供单元401,用于提供包括第一产品和多个第二产品的同类产品集合;
第一相似度确定单元402,用于针对同类产品集合中的每个第二产品,计算所述第一产品和所述第二产品在每个非标称类属性上值的相似度值;
第二相似度确定单元403,用于针对同类产品集合中的每个第二产品,计算所述第一产品和所述第二产品在每个标称类属性上值的相似度值时,执行:当第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值;
产品相似度确定单元404,用于根据第一相似度确定单元402确定出的第一产品和第二产品的非标称类属性的值的相似度值和第二相似度确定单元403确定出的第一产品和第二产品标称类属性的值的相似度值,计算第一产品和第二产品的产品相似度值;
链表确定单元405,用于根据产品相似度确定单元404确定出的第一产品和每个第二产品的产品相似度值,将与第一产品相似度值排名靠前的至少一个第二产品作为所述第一产品的候选产品链表;
存储单元406,用于存储第一产品的标识以及链表确定单元405确定出的候选产品链表的对应关系;
接收单元407,用于接收候选产品查询请求;
选择单元408,用于在接收单元407接收到候选产品查询请求后,从存储单元406存储的产品的标识以及候选产品链表的对应关系中,选择出候选产品查询请求中包含的产品的标识对应的候选产品链表;
发送单元409,用于将选择单元408获得的候选产品链表发送给网页服务器。
第二相似度确定单元403计算产品A与其他产品B标称类属性值的相似度值的具体过程请参照附图5至附图7所示,在这里不再赘述。
本申请实施例在确定产品A和产品B某个标称类属性的属性值的相关度值时,根据每个产品该标称类属性的属性值和每个用户购买产品的记录,确定整体用户群所购买的产品的该标称类属性值在产品A的属性值和产品B的属性值上的倾向性特征是否相似,若相似,则说明产品A与产品B该标称类属性的属性值的相似度较高,否则确定产品A与产品B该标称类属性的属性值的相似度较低,从而能够发现产品A该标称类属性的属性值与产品B该标称类属性的属性值的相似度内在语义上的相似性,克服了现有技术存在的问题,提高计算标称类属性值相似度值的准确性,从而进一步提高了计算候选产品链表的准确性。
实施例二
实施例一提供了一种采用离线方式提供选中的产品A的后续产品链表的方案:计算产品A与其他产品的相似度值,并基于计算出的选中产品A与其他产品的相似度值提供候选产品链表,存储每个产品的标识与该产品的候选产品链表之间的对应关系,在接收到候选产品查询请求时,根据候选产品查询请求中包含的产品标识,从存储的产品标识与该产品的候选产品链表的对应关系中选择出所述候选产品查询请求中包含的产品标识对应的候选产品链表,将选择出候选产品链表发送给网页服务器。由于这种方案预先存储的产品标识与该产品的候选产品链表的对应关系会占用一定存储资源,而其中有可能有部分产品标识与该产品的候选产品链表的对应关系被检索到的概率较低。因此,本申请还提供了一种在线确定备选产品链表的方式,即在步骤305中确定候选产品链表的装置不是从存储的每个产品的标识与该产品的候选产品链表之间的对应关系中选择候选产品查询请求中包含的产品标识对应的候选产品链表,而是根据交易记录数据库、产品属性数据库中的数据实时地计算出候选产品查询请求中包含的产品标识对应的候选产品链表。
较佳地,考虑这种实时计算候选产品链表的方案在同类产品集合中的其他产品数量较多时,计算相似度值会耗费较多时间,如果步骤305中确定候选产品链表的装置在较短时间内接收到网页服务器发来数量较多的候选产品查询请求的话,处理压力将会增大,因此可以预先根据除标称类属性之外的其他属性值进行筛选,如果候选产品查询请求中的产品标识对应的指定产品A和其他产品B之间除标称类属性之外的其他类型属性(例如数值型等)的属性值的相似度值低于设定的阈值,则无需再计算产品A和产品B标称类属性上属性值的相似度值,直接将产品B排除在候选产品集合CA之外。
请参照附图8,为本申请实施例提供的确定候选产品链表的装置的原理结构图。确定候选产品链表的装置具体包括:接收单元801、产品相似度值确定单元802、链表确定单元803和发送单元804,其中:
接收单元801,用于接收网页服务器发来的候选产品查询请求;
产品相似度值确定单元802,用于针对查询请求中包含的产品标识对应的指定产品,根据该指定产品和所属同类产品集合中每个其他产品各属性值的相似度值和设定的各属性权重值,确定该指定产品与所述其他产品的相似度值,其中在确定该指定产品和每个其他产品每个标称类属性上属性值的相似度值时,执行:在该指定产品和每个其他产品该标称类属性的属性值不同时,根据购买记录集合中购买该指定产品该标称类属性的值对应的产品的用户购买该其他产品该标称类属性的值对应的产品的倾向性,确定该指定产品该标称类属性的值和该其他产品该标称类属性的值的相似度值;
链表确定单元803,用于将与指定产品相似度值排名靠前的至少一个其他产品作为所述指定产品的候选产品链表;
发送单元804,用于将链表确定单元803获得的候选产品链表发送给网页服务器。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.一种确定候选产品链表的方法,其特征在于,包括:
提供包括第一产品和多个第二产品的同类产品集合,针对同类产品集合中的每个第二产品执行:
计算所述第一产品和所述第二产品在每个非标称类属性上值的相似度值;
计算所述第一产品和所述第二产品在每个标称类属性上值的相似度值时,执行:当第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值;
根据第一产品和第二产品的非标称类属性的值的相似度值和标称类属性的值的相似度值,计算第一产品和第二产品的产品相似度值;
将与第一产品相似度值排名靠前的至少一个第二产品作为所述第一产品的候选产品;
所述根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值,具体包括:
根据购买记录集合,确定第一用户集合、第二用户集合、第三用户集合;
其中,第一用户集合为所述购买记录集合中购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的集合;
第二用户集合为所述购买记录集合中购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的集合;
第三用户集合为所述购买记录集合中购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品并且购买该标称类属性值与所述第二产品该标称类属性的值一致的产品的集合;
根据第一用户集合、第二用户集合和第三用户集合,确定用户在购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的情况下购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的第一条件概率,并确定用户在购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的情况下购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的第二条件概率;
将所述第一条件概率和第二条件概率的算术平均值作为第一产品和第二产品在该标称类属性上值的相似度值;或者
所述根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值,具体包括:
根据购买记录集合,确定该标称类属性的用户属性值关系矩阵,该用户关系矩阵中的每列表明具有该标称类属性的同一个值的产品是否被各用户购买的记录;
从所述用户属性值关系矩阵中选择出第一产品该标称类属性的值对应的列作为该标称类属性的值与第一产品该标称类属性的值一致的产品被各用户购买的记录,将第二产品该标称类属性的值对应的列作为该标称类属性的值与第二产品该标称类属性的值一致的产品被各用户购买的记录;
所述第一产品和所述第二产品该标称类属性值的相似度值sim(i,j)为
s i m ( i , j ) = c o s ( R &RightArrow; * , i , R &RightArrow; * , j ) = R &RightArrow; * , i &CenterDot; R &RightArrow; * , j | | R &RightArrow; * , i | | 2 | | R &RightArrow; * , j | | 2 .
2.如权利要求1所述的方法,其特征在于,根据购买记录集合,确定该标称类属性的用户属性值关系矩阵,具体包括:
针对用户购买记录集合中的每个用户购买记录,执行:
根据该用户购买记录以及每个产品该标称类属性的值,确定该用户购买的产品的该标称类属性的值;并,
根据确定出的该用户购买的产品的该标称类属性的值,确定该用户的该标称类属性向量其中m为该用户的标识,对于该中的每个元素Rm,i,其中i为值集合中的值的标识,若用户购买过标识为i的值的产品,则将元素Rm,i的值设置为第一值;否则元素Rm,i的值设置为第二值;
将每个用户的该标称类属性向量作为矩阵中的行,确定该标称类属性的用户属性值关系矩阵。
3.如权利要求1所述的方法,其特征在于,计算所述第一产品和所述第二产品在每个标称类属性上值的相似度值时,还包括:
当第一产品该标称类属性的值和第二产品该标称类属性的值相同时,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值为设定的最高值。
4.如权利要求1至3中任一权利要求所述的方法,其特征在于,选取排名靠前的至少一个第二产品作为该第一产品的候选产品链表之后,还包括:
存储第一产品的标识以及确定出的候选产品链表的对应关系;
在接收到候选产品查询请求后,从存储的产品的标识以及候选产品链表的对应关系中,选择出候选产品查询请求中包含的产品的标识对应的候选产品链表。
5.一种确定两个产品之间标称类属性上值的相似度值的方法,其特征在于,包括:
计算第一产品和第二产品在标称类属性上值的相似度值时,执行:
在第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品的该标称类属性的值和第二产品该标称类属性的值的相似度值;
其中,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品的该标称类属性的值和第二产品该标称类属性的值的相似度值,具体包括:
根据购买记录集合,确定该标称类属性的用户属性值关系矩阵,该用户关系矩阵中的每列表明具有该标称类属性的同一个值的产品是否被各用户购买的记录;
从所述用户属性值关系矩阵中选择出第一产品该标称类属性的值对应的列作为该标称类属性的值与第一产品该标称类属性的值一致的产品被各用户购买的记录,将第二产品该标称类属性的值对应的列作为该标称类属性的值与第二产品该标称类属性的值一致的产品被各用户购买的记录;
所述第一产品和所述第二产品该标称类属性值的相似度值sim(i,j)为
s i m ( i , j ) = c o s ( R &RightArrow; * , i , R &RightArrow; * , j ) = R &RightArrow; * , i &CenterDot; R &RightArrow; * , j | | R &RightArrow; * , i | | 2 | | R &RightArrow; * , j | | 2 ; 或者
根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品的该标称类属性的值和第二产品该标称类属性的值的相似度值,具体包括:
根据购买记录集合,确定第一用户集合、第二用户集合、第三用户集合;
其中,第一用户集合为所述购买记录集合中购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的集合;
第二用户集合为所述购买记录集合中购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的集合;
第三用户集合为所述购买记录集合中购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品并且购买该标称类属性值与所述第二产品该标称类属性的值一致的产品的集合;
根据第一用户集合、第二用户集合和第三用户集合,确定用户在购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的情况下购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的第一条件概率,并确定用户在购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的情况下购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的第二条件概率;
将所述第一条件概率和第二条件概率的算术平均值作为第一产品和第二产品在该标称类属性上值的相似度值。
6.一种确定候选产品链表的装置,其特征在于,包括:
提供单元,用于提供包括第一产品和多个第二产品的同类产品集合;
第一相似度确定单元,用于针对同类产品集合中的每个第二产品,计算所述第一产品和所述第二产品在每个非标称类属性上值的相似度值;
第二相似度确定单元,用于针对同类产品集合中的每个第二产品,计算所述第一产品和所述第二产品在每个标称类属性上值的相似度值时,执行:当第一产品该标称类属性的值和第二产品该标称类属性的值不同时,根据购买记录集合中购买该第一产品该标称类属性的值对应的产品的用户购买该第二产品该标称类属性的值对应的产品的倾向性,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值;
产品相似度确定单元,用于根据第一相似度确定单元确定出的第一产品和第二产品的非标称类属性的值的相似度值和第二相似度确定单元确定出的第一产品和第二产品标称类属性的值的相似度值,计算第一产品和第二产品的产品相似度值;
链表确定单元,用于根据第三相似度确定单元确定出的第一产品和每个第二产品的产品相似度值,将与第一产品相似度值排名靠前的至少一个第二产品作为所述第一产品的候选产品链表;
其中,所述第二相似度确定单元,具体用于:
根据购买记录集合,确定该标称类属性的用户属性值关系矩阵,该用户关系矩阵中的每列表明具有该标称类属性的同一个值的产品是否被各用户购买的记录;
从所述用户属性值关系矩阵中选择出第一产品该标称类属性的值对应的列作为该标称类属性的值与第一产品该标称类属性的值一致的产品被各用户购买的记录,将第二产品该标称类属性的值对应的列作为该标称类属性的值与第二产品该标称类属性的值一致的产品被各用户购买的记录;
所述第一产品和所述第二产品该标称类属性值的相似度值sim(i,j)为
s i m ( i , j ) = c o s ( R &RightArrow; * , i , R &RightArrow; * , j ) = R &RightArrow; * , i &CenterDot; R &RightArrow; * , j | | R &RightArrow; * , i | | 2 | | R &RightArrow; * , j | | 2 ; 或者
所述第二相似度确定单元,具体用于:
根据购买记录集合,确定第一用户集合、第二用户集合、第三用户集合;
其中,第一用户集合为所述购买记录集合中购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的集合;
第二用户集合为所述购买记录集合中购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的集合;
第三用户集合为所述购买记录集合中购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品并且购买该标称类属性值与所述第二产品该标称类属性的值一致的产品的集合;
根据第一用户集合、第二用户集合和第三用户集合,确定用户在购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的情况下购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的第一条件概率,并确定用户在购买该标称类属性的值与所述第二产品该标称类属性的值一致的产品的情况下购买该标称类属性的值与所述第一产品该标称类属性的值一致的产品的第二条件概率;
将所述第一条件概率和第二条件概率的算术平均值作为第一产品和第二产品在该标称类属性上值的相似度值。
7.如权利要求6所述的装置,其特征在于,还包括:
存储单元,用于存储第一产品的标识以及链表确定单元确定出的候选产品链表的对应关系;
接收单元,用于接收候选产品查询请求;
选择单元,用于在接收单元接收到候选产品查询请求后,从存储单元存储的产品的标识以及候选产品链表的对应关系中,选择出候选产品查询请求中包含的产品的标识对应的候选产品链表。
8.如权利要求6所述的装置,其特征在于,所述第二相似度确定单元还用于当第一产品该标称类属性的值和第二产品该标称类属性的值相同时,确定该第一产品该标称类属性的值和第二产品该标称类属性的值的相似度值为设定的最高值。
CN201010527002.8A 2010-10-22 2010-10-22 确定候选产品链表的方法及相关装置 Active CN102456203B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201010527002.8A CN102456203B (zh) 2010-10-22 2010-10-22 确定候选产品链表的方法及相关装置
TW100104748A TWI517065B (zh) 2010-10-22 2011-02-14 Method and related device for determining the list of candidate products
PCT/US2011/056720 WO2012054488A1 (en) 2010-10-22 2011-10-18 Method and apparatus of determining a linked list of candidate products
US13/381,822 US20130198022A1 (en) 2010-10-22 2011-10-18 Method and Apparatus of Determining A Linked List of Candidate Products
JP2013535007A JP5897019B2 (ja) 2010-10-22 2011-10-18 候補製品のリンクリストを判定する方法および装置
EP11834994.3A EP2630625A4 (en) 2010-10-22 2011-10-18 METHOD AND DEVICE FOR DETERMINING A CHAINED LIST OF CANDIDATE PRODUCTS
HK12107086.6A HK1166412A1 (zh) 2010-10-22 2012-07-19 確定候選產品鏈表的方法及相關裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010527002.8A CN102456203B (zh) 2010-10-22 2010-10-22 确定候选产品链表的方法及相关装置

Publications (2)

Publication Number Publication Date
CN102456203A CN102456203A (zh) 2012-05-16
CN102456203B true CN102456203B (zh) 2015-10-14

Family

ID=45975589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010527002.8A Active CN102456203B (zh) 2010-10-22 2010-10-22 确定候选产品链表的方法及相关装置

Country Status (7)

Country Link
US (1) US20130198022A1 (zh)
EP (1) EP2630625A4 (zh)
JP (1) JP5897019B2 (zh)
CN (1) CN102456203B (zh)
HK (1) HK1166412A1 (zh)
TW (1) TWI517065B (zh)
WO (1) WO2012054488A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679489A (zh) * 2012-09-10 2014-03-26 腾讯科技(深圳)有限公司 一种物品关联推荐的方法及系统
CN103106600A (zh) * 2012-11-15 2013-05-15 深圳中兴网信科技有限公司 商品信息推送系统和商品信息推送方法
US9117239B2 (en) 2013-03-13 2015-08-25 Reno Acquisitions, Llc Method and system for generating a data grid interface to monitor and recommend relevant products
US20140279189A1 (en) * 2013-03-13 2014-09-18 Dynamite Data, Llc Method and system for monitoring and recommending relevant products
US20140358730A1 (en) * 2013-05-30 2014-12-04 Wal-Mart Stores, Inc. Systems And Methods For Optimally Ordering Recommendations
JP6060833B2 (ja) * 2013-06-28 2017-01-18 株式会社Jvcケンウッド 情報処理装置、情報処理方法、及び情報処理プログラム
KR102215436B1 (ko) * 2014-02-26 2021-02-16 십일번가 주식회사 쇼핑몰의 동일 상품 판별 장치 및 방법
JP6112077B2 (ja) * 2014-07-03 2017-04-12 トヨタ自動車株式会社 半導体装置
CN105808611B (zh) * 2014-12-31 2019-12-06 华为技术有限公司 数据挖掘方法和装置
PH12017501388A1 (en) 2015-02-02 2018-01-08 Beijing Didi Infinity Technology & Dev Co Ltd Methods and systems for order processing
CN104715285B (zh) * 2015-03-31 2018-06-22 北京嘀嘀无限科技发展有限公司 处理订单的方法和设备
EP3278536B1 (en) 2015-03-31 2023-11-15 British Telecommunications public limited company Network control with central analysis of network-data
EP3109771A1 (en) * 2015-06-22 2016-12-28 Deutsche Telekom AG Method, distributed system and device for efficiently quantifying a similarity of large data sets
GB2541034A (en) 2015-07-31 2017-02-08 British Telecomm Network operation
CN105205107A (zh) * 2015-08-27 2015-12-30 湖南人文科技学院 一种物联网数据相似度处理方法
US10832304B2 (en) 2016-01-15 2020-11-10 Target Brands, Inc. Resorting product suggestions for a user interface
CN107016473B (zh) * 2016-01-27 2022-11-22 创新先进技术有限公司 一种风险控制方法和设备
CN107515880B (zh) * 2016-06-17 2020-12-22 宏碁股份有限公司 数据分散处理系统与方法
CN108121737B (zh) * 2016-11-29 2022-04-26 阿里巴巴集团控股有限公司 一种业务对象属性标识的生成方法、装置和系统
CN107391531B (zh) * 2017-04-11 2020-09-22 阿里巴巴集团控股有限公司 一种菜品推荐方法和装置
US11416877B2 (en) 2017-09-26 2022-08-16 International Business Machines Corporation Extracting product drag effect from transaction records
JP6508316B2 (ja) * 2017-12-22 2019-05-08 カシオ計算機株式会社 情報表示装置及びプログラム
CN110348921B (zh) * 2018-04-02 2023-06-02 北京京东尚科信息技术有限公司 门店物品选取的方法和装置
EP3598373A1 (en) * 2018-07-18 2020-01-22 Seulo Palvelut Oy Determining product relevancy
CN110033351B (zh) * 2019-04-15 2021-09-10 秒针信息技术有限公司 一种相似度的确定方法及装置
CN112632145A (zh) * 2019-09-24 2021-04-09 北京国双科技有限公司 新油气藏的评估方法、装置、存储介质及设备
CN111198988B (zh) * 2019-12-25 2023-05-02 中国平安财产保险股份有限公司 业务推荐方法、训练方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7366721B1 (en) * 2000-08-29 2008-04-29 Intel Corporation Method and apparatus for displaying a plurality of related products to a user based upon the selection of a main product by the user
CN101206674A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 以商品为媒介的增强型相关搜索系统及其方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US6266649B1 (en) * 1998-09-18 2001-07-24 Amazon.Com, Inc. Collaborative recommendations using item-to-item similarity mappings
US6356879B2 (en) * 1998-10-09 2002-03-12 International Business Machines Corporation Content based method for product-peer filtering
US6728706B2 (en) * 2001-03-23 2004-04-27 International Business Machines Corporation Searching products catalogs
JP2002312397A (ja) * 2001-04-09 2002-10-25 Nippon Telegr & Teleph Corp <Ntt> 相関アイテム検出方法および装置、お薦めアイテム紹介方法および装置、相関アイテム検出プログラム、お薦めアイテム紹介プログラム、同プログラムを記録した記録媒体
US7707221B1 (en) * 2002-04-03 2010-04-27 Yahoo! Inc. Associating and linking compact disc metadata
US8019656B2 (en) * 2003-05-07 2011-09-13 Cbs Interactive Inc. System and method for generating an alternative product recommendation
US20060036510A1 (en) * 2003-06-02 2006-02-16 W.W. Grainger, Inc. System and method for directing a customer to additional purchasing opportunities
WO2005052639A1 (en) * 2003-10-28 2005-06-09 Western Geco, Llc A method for estimating porosity and saturation in a subsurface reservoir
JP4543930B2 (ja) * 2005-01-07 2010-09-15 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4770445B2 (ja) * 2005-12-20 2011-09-14 大日本印刷株式会社 情報推薦装置
US20080120167A1 (en) * 2006-11-17 2008-05-22 Ac Technologies S.A. Personal Inventory and Marketing Electronic System and Method
WO2008121737A1 (en) * 2007-03-30 2008-10-09 Amazon Technologies, Inc. Service for providing item recommendations
US8073854B2 (en) * 2007-04-10 2011-12-06 The Echo Nest Corporation Determining the similarity of music using cultural and acoustic information
US7974933B2 (en) * 2007-09-11 2011-07-05 Bae Systems Plc Estimating the efficacy of a mathematical model of system behaviour
US20090070325A1 (en) * 2007-09-12 2009-03-12 Raefer Christopher Gabriel Identifying Information Related to a Particular Entity from Electronic Sources
US20090077081A1 (en) * 2007-09-19 2009-03-19 Joydeep Sen Sarma Attribute-Based Item Similarity Using Collaborative Filtering Techniques
US8001003B1 (en) * 2007-09-28 2011-08-16 Amazon Technologies, Inc. Methods and systems for searching for and identifying data repository deficits
US7921071B2 (en) * 2007-11-16 2011-04-05 Amazon Technologies, Inc. Processes for improving the utility of personalized recommendations generated by a recommendation engine
JP5079578B2 (ja) * 2008-04-10 2012-11-21 日本電信電話株式会社 履歴処理装置、履歴処理方法および履歴処理プログラム
EP2325768A4 (en) * 2008-08-08 2016-08-17 Nikon Corp RESEARCH ASSISTANCE SYSTEM, RESEARCH ASSISTANCE METHOD, AND RESEARCH ASSISTANCE PROGRAM
US8615516B2 (en) * 2008-12-22 2013-12-24 International Business Machines Corporation Grouping similar values for a specific attribute type of an entity to determine relevance and best values
US8694514B2 (en) * 2009-10-12 2014-04-08 Oracle International Corporation Collaborative filtering engine
WO2012016052A1 (en) * 2010-07-28 2012-02-02 True Fit Corporation Fit recommendation via collaborative inference

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7366721B1 (en) * 2000-08-29 2008-04-29 Intel Corporation Method and apparatus for displaying a plurality of related products to a user based upon the selection of a main product by the user
CN101206674A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 以商品为媒介的增强型相关搜索系统及其方法

Also Published As

Publication number Publication date
HK1166412A1 (zh) 2012-10-26
JP2013544000A (ja) 2013-12-09
CN102456203A (zh) 2012-05-16
TWI517065B (zh) 2016-01-11
JP5897019B2 (ja) 2016-03-30
TW201218105A (en) 2012-05-01
EP2630625A1 (en) 2013-08-28
WO2012054488A1 (en) 2012-04-26
EP2630625A4 (en) 2016-05-04
US20130198022A1 (en) 2013-08-01

Similar Documents

Publication Publication Date Title
CN102456203B (zh) 确定候选产品链表的方法及相关装置
JP6356744B2 (ja) ウェブサイト横断情報を表示する方法およびシステム
US11354584B2 (en) Systems and methods for trend aware self-correcting entity relationship extraction
CN103544632B (zh) 一种网络商品个性化推荐方法及系统
US10042883B2 (en) System and method for asynchronous consumer item searching requests with synchronous parallel searching
US20130006713A1 (en) Method for aggregating pricing information and assigning a fair market value to goods sold in a peer-to-peer e-commerce transaction
CN106021337A (zh) 一种基于大数据分析的智能推荐方法及系统
CN108108380A (zh) 搜索排序方法、搜索排序装置、搜索方法和搜索装置
US8117060B2 (en) Geographic demand distribution and forecast
CN102254028A (zh) 一种集成属性和结构相似性的个性化商品推荐方法和系统
US20100070342A1 (en) Regional demand and supply comparison
CN104077693A (zh) 商品对比方法、服务器、客户端及电子商务系统
Ahmed et al. E-banking customer satisfaction and loyalty: evidence from serial mediation through modified ES-QUAL model and second-order PLS-SEM
CN105138690A (zh) 确定关键词的方法和装置
Prasetyo Searching cheapest product on three different e-commerce using k-means algorithm
CN105303447A (zh) 利用网络信息进行信用评级的方法和系统
KR20100046421A (ko) 상품 선호도를 평가하는 방법 및 쇼핑몰 서버
Hutahaean et al. E-Commerce during pandemic in Indonesia: bibliometric analysis
CN112784064A (zh) 一种面向社交网络的层次化超维知识图谱构建方法
Ahlers et al. Are local retailers conquering the long tail? A web usage and association rule mining approach on local shopping platforms
Dai et al. A network-based recommendation algorithm
Thakur et al. Bayesian Belief Networks–Based Product Prediction for E-Commerce Recommendation
Kim Study on the difference in the Social Commerce use of Korea and China Consumer: Consider factor, shopping value, purchase satisfaction and intention to revisit.
Zhu Research on multi‐source mobile commerce service recommendation model of data fusion based on tree network
JP2004127261A (ja) 金融商品提示システム、その方法及び金融商品検索サーバ

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1166412

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1166412

Country of ref document: HK