CN108510297A - 一种商品评价得分的处理方法及系统 - Google Patents

一种商品评价得分的处理方法及系统 Download PDF

Info

Publication number
CN108510297A
CN108510297A CN201710110476.4A CN201710110476A CN108510297A CN 108510297 A CN108510297 A CN 108510297A CN 201710110476 A CN201710110476 A CN 201710110476A CN 108510297 A CN108510297 A CN 108510297A
Authority
CN
China
Prior art keywords
commodity
prior distribution
score
evaluation
evaluation score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710110476.4A
Other languages
English (en)
Other versions
CN108510297B (zh
Inventor
刘亚男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710110476.4A priority Critical patent/CN108510297B/zh
Publication of CN108510297A publication Critical patent/CN108510297A/zh
Application granted granted Critical
Publication of CN108510297B publication Critical patent/CN108510297B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种商品评价得分的处理方法,包括:获取多个用户对同一商品的多个初始评价得分,并计算所述多个初始评价得分的得分均值;根据所述多个初始评价得分和先验知识,计算先验分布,所述先验分布是对得分均值的发生概率的调整结果,所述先验知识是指所述多个初始评价得分中各个初始评价得分出现概率的估计;根据所述先验分布,计算后验分布,所述后验分布是对所述先验分布的修正结果。本发明还公开了一种商品评价得分的处理系统。

Description

一种商品评价得分的处理方法及系统
技术领域
本发明涉及电子商务的评价得分领域,更具体地说是一种商品评价得分的处理方法及系统。
背景技术
用户在电子商务网站购买商品时,商品评价是重要的参考因素之一,计算商品评价得分可以衡量商品受欢迎程度,从而对于商品的广告展示、搜索排序、个性化推荐等方面起到重要作用,但现有的商品评价得分是对商品所有评价进行平均数计算,只利用到了商品样本集合的信息,如果商品的样本集合较小,则可能出现计算的均值与实际总体偏差较大的情况。
发明内容
本发明一方面提出了一种商品评价得分的处理方法,包括:获取多个用户对同一商品的多个初始评价得分,并计算所述多个初始评价得分的得分均值;根据所述多个初始评价得分和先验知识,计算先验分布,所述先验分布是对得分均值发生概率的调整结果,所述先验知识是指所述多个初始评价得分中各个初始评价得分出现概率的估计;根据所述先验分布,计算后验分布,所述后验分布是对所述先验分布修正的结果。
本发明另一方面提出了一种商品评价得分的处理系统,包括:均值计算模块,获取多个用户对同一商品的多个初始评价得分,并计算所述多个初始评价得分的得分均值;调整模块,根据所述多个初始评价得分和先验知识,计算先验分布,所述先验分布是对得分均值发生概率的调整结果,所述先验知识是指所述多个初始评价得分中各个初始评价得分出现概率的估计;修正模块,根据所述先验分布,计算后验分布,所述后验分布是对所述先验分布的修正结果。
本发明另一方面提出了一种商品评价得分的处理系统,包括:一个或多个处理器;以及一个或多个存储器,存储有可执行指令,所述指令在被处理器执行时,使得处理器执行上述方法。
本发明另一方面提出了一种可读存储介质,其上存储有用于执行上述方法的指令。
附图说明
图1示意性示出了本发明实施例的商品评价得分的处理方法的流程图。
图2示意性示出了本发明实施例的二项式分布的先验分布呈现图。
图3示意性示出了本发明实施例的多项式分布的先验分布呈现图。
图4示意性示出了本发明实施例的商品评价得分的处理系统的模块图。
图5示意性示出了本发明实施例的商品评价得分的处理系统的系统框图。
具体实施方式
根据结合附图对本发明示例性实施例的以下详细描述,本发明的其它方面、优势和突出特征对于本领域技术人员将变得显而易见。
在本发明中,术语“包括”和“含有”及其派生词意为包括而非限制;术语“或”是包含性的,意为和/或。
在本说明书中,下述用于描述本发明原理的各种实施例只是说明,不应该以任何方式解释为限制发明的范围。参照附图的下述描述用于帮助全面理解由权利要求及其等同物限定的本发明的示例性实施例。下述描述包括多种具体细节来帮助理解,但这些细节应认为仅仅是示例性的。因此,本领域普通技术人员应认识到,在不背离本发明的范围和精神的情况下,可以对本文中描述的实施例进行多种改变和修改。此外,为了清楚和简洁起见,省略了公知功能和结构的描述。此外,贯穿附图,相同附图标记用于相似功能和操作。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
目前,随着电子商务网站的兴起,大多数用户在购买商品时都会参考商品的评价得分,因此商品的评价得分是决定用户购买意向的重要因数。本发明是通过计算商品的评价得分确定该商品对用户的欢迎程度是多少,以便在电子商务网站对该商品做出相应的调整。
图1示意性示出了本发明实施例的商品评价得分的处理方法的流程图,该处理方法应用于处理在电子商务网站上用户对商品的评价得分。下面把获取同一商品的多个初始评价得分作为一个样本来进行描述,没有任何的限定意义,只是一个示例性的表达。
如图1所示,是根据本发明实施例的商品评价得分的处理方法。
该方法开始于步骤S10。
在步骤S11,获取多个用户对同一商品的多个初始评价得分,并计算多个初始评价得分的得分均值。
根据本发明的实施例,获取的样本包括多个用户对同一商品的多个初始评价得分。例如,获取10个用户在美团上对一部电影的评价得分,分别是3、5、2、6、1、7、3、9、5、6分。在本步骤中可以采用简单平均数的方法计算商品的得分均值,根据10个用户在美团上对一部电影的评价得分计算得分均值为4.7分。
在步骤S12,根据多个初始评价得分和先验知识,计算先验分布,所述先验分布是对得分均值的发生概率的调整结果,所述先验知识是指所述多个初始评价得分中各个初始评价得分出现概率的估计。例如,10个用户在美团上对一部电影进行评分,得到10个初始评价得分,假设评分只有好评和差评两个评价种类,则根据电影的实际观看效果,估计好评的概率为0.9,差评为0.1;假设评分有一星、二星、三星、四星和五星供五个评价种类,则根据电影的实际观看效果,估计一星概率为0,二星概率为0.1,三星概率为0.1,四星概率为0.2,五星的概率为0.6。
根据本发明的实施例,根据获取样本的商品的评价种类分为两大类进行计算。具体地,将商品评价只有两种的称为二项式分布,将商品评价有多种的称为多项式分布。其中二项式分布和多项式分布都属于共轭分布,其好处是计算得的先验分布和下面计算得的后验分布都在同一类分布族,便于计算实现。具体应用哪一种方式来计算先验分布是根据步骤S11来选择的,例如,获取10个用户在美团上对一部电影的评价得分,分别是3、5、2、6、1、7、3、9、5、6分,计算得分均值为4.7分。如果规定5分以上为好评(包括5分),5分以下为差评,那么得分均值4.7分为差评。在这种情况下采用二项式分布的公式来计算先验分布。如果规定的是1~2分为一星,3~4分为二星,5~6分为三星,7~8分为四星,9~10分为五星,那么得分均值4.7分为三星。在这种情况下采用多项式分布的公式来计算先验分布。具体地,如下所示:
二项式分布,若商品的评价只有两种,即好评与差评,则利用如下公式计算先验分布Beta(μ│a,b):
其中μ表示多个初始评价得分中各个初始评价得分出现概率的估计,a表示好评在多个初始评价得分中出现的次数,b表示差评在多个初始评价得分中出现的次数。例如,获取10个用户在美团上对一部电影的评价得分,分别是3、5、2、6、1、7、3、9、5、6分,规定5分以上为好评(包括5分),5分以下为差评,那么a=6,b=4。
根据本发明的实施例,利用参数为不同的a和b取值,可以计算出多个先验分布。并把计算出的多个先验分布通过其概率密度函数来呈现,具体地,如图2所示,针对不同a、b的取值,可以观测到在二项式分布中的先验分布呈现不同的变化曲线。
如图2所示,示出了a=0.1,b=0.1、a=1,b=1、a=2,b=3和a=8,b=4四组取值的先验分布发生的变化,其中a=0.1,b=0.1这组参数是极端的情况,例如,一款新的产品还没有投入市场,所以没有用户对它进行过评价,这种情况下的a和b应该都为0,但是这样会导致公式(1)没有实际的意义,因此让a=0.1,b=0.1。在观测先验分布变化的过程中,可以随时将二项式分布中的其他参数带入公式(1)计算出新的先验分布,以此方式不间断的加入新的参数可以实时观测到先验分布的分布情况。
多项式分布,若商品的评价有多种,则利用如下公式计算先验分布Dir(μ│α):
其中μ表示多个初始评价得分中各个初始评价得分出现概率的估计,α1…αk表示多种评价在样本中出现的次数,α0表示α12…αk,k表示商品评价的种类,商品评价的种类数量为1~K,μk表示k种设定的商品的评价概率。例如,获取10个用户在美团上对一部电影的评价得分,分别是3、5、2、6、1、7、3、9、5、6分,如果规定的是1~2分为一星,3~4分为二星,5~6分为三星,7~8分为四星,9~10分为五星,那么α1=2,α2=2,α3=4,α4=1,α5=1。
根据本发明的实施例,利用参数为不同的α取值,可以计算出多个先验分布。并把计算出的多个先验分布通过其概率密度函数来呈现。具体地,如图3所示,针对不同α的取值,可以观测到在多项式分布中的先验分布呈现不同的空间图形。
如图3所示,根据本发明的实施例,α=(α123),其中α123分别表示三种商品评价在整个获取样本中所出现的次数。以图3中间的三角形为例,所述的三角形是一个平放的几何图形,其中三角形三个顶点分别为α1=(1,0,0)、α2=(0,1,0)、α3=(0,0,1),三个坐标具体表示三种商品评价出现的次数相同,此种情况较为极端,只会发生在当获取的样本数量极少时。如果获取的样本数量是千万级,那么观测到的多种先验分布情况表现的较为全面。因此,如果获取样本为多种初始评价得分,要求样本的数量是千万级的。一般在观测多项式分布的先验分布变化的过程中,可以随时将多项式分布中的其他α带入公式(2)计算出新的先验分布,以此方式不间断的加入新的参数可以实时的观测到先验分布的具体分布情况。
在步骤S13,根据先验分布,计算后验分布,所述后验分布是对所述先验分布的修正结果。
根据本发明的实施例,在步骤S13中要结合下线业务提供的数据知识来计算后验分布。所述数据知识包括来自下线业务对商品评价的预期值,是通过对下线店铺的调查得到的一个预期概率,是没有经过任何数据验证的。例如,一位卖手机的店主希望店内某一款手机的好评率为98%,98%就是预期值。针对该手机的初始评价得分来执行本实施例,得到后验概率为96%,其与预期值98%之差为2%。假定阈值为3%,则通过先验分布和外界的数据知识计算得到的后验概率能够满足店主期望。如果假设在步骤S11中的得分均值为4.7分,即此商品的好评率不高。如果后验概率与预期值之差大于所述阈值,则可能证明商品的质量有问题,需要店主对商品进行改进。
根据本发明的实施例,在步骤S13中避免了简单平均数由于样本量较少带来的评价得分不准确、不稳定问题。因为不是直接利用获取样本的数据量,而是结合获取样本的先验分布和增加的外界数据知识来实现的。
根据本发明的实施例,步骤S13是根据贝叶斯后验估计方法,对步骤S12中的先验分布进行修正,具体是将步骤S13分成两种情况来进行修正,如下所述:
第一种,若商品的评价只有两种,则利用贝叶斯后验概率公式计算后验分布P(O│X):
其中O表示获取样本的先验分布,Oi表示在获取样本中有i个先验分布,i的取值为1~n,X表示来自下线业务对商品评价的预期值。
根据本发明的实施例,O是指在步骤S12中的先验分布,O1~Oi和在步骤S12中每一组a和b计算所得的先验分布是一一对应的,X是通过对下线店铺的调查得到的一个预期概率。
第二种,若商品的评价有多种,,则利用贝叶斯后验概率公式计算后验分布P(O│p1,p2,p3,p4,p5):
其中O表示获取样本的先验分布,p1,p2,p3,p4,p5表示来自下线业务对商品评价的预期值,K1、K2、K3、K4、K5表示p1,p2,p3,p4,p5在先验分布中出现的次数。
根据本发明的实施例,O是指在步骤S12中的先验分布,K1、K2、K3、K4、K5表示p1,p2,p3,p4,p5在步骤S12中的先验分布中出现的次数,p1,p2,p3,p4,p5是通过对下线店铺的调查得到的商品多种评价的预期概率。
根据本发明的实施例,如果步骤S12中的先验分布与预期概率相同,那么这种情况是可以不进行步骤S13的修正,可以直接进行下一步存储与显示。
通过上述三个步骤对获取样本进行了计算,并得到修正后的得分均值发生的概率。下面步骤是对修正结果的存储和显示。
在步骤S14,根据初始评价得分的数据量,将修正结果以不同的形式存储。
根据本发明的实施例,选择存储方式是由获取的样本数据量决定的。所述的第一阈值可以取1000万。具体存储可以分为两种情况,如下所示:
第一种,如果多个初始评价得分的数据量小于等于第一阈值,则将修正结果以平面文件形式存储。例如,获取样本为600万用户对同一商品进行初始评价的得分,在这种情况下是以平面文件形式存储修正结果。以平面文件形式存储的数据可以快速开发,敏捷相应。
第二种,如果多个初始评价得分的数据量大于第一阈值,则将修正结果以key-value形式存储。例如,获取样本为一亿用户对同一商品进行初始评价的得分,在这种情况下是以key-value形式存储修正结果。以key-value形式存储的数据查询和响应为常数级,随着数据量扩大,查询效率不会显著降低,保证后续应用稳定性和及时性。
在步骤S15,利用以不同的形式存储的修正结果,对商品的评价进行显示。
根据本发明的实施例,显示结果可以观测到两种或多种商品评价的具体分布情况,便于从汇总粒度理解数据分布,发现数据问题,比如得分服从幂律、正态、均匀等分布或者存在不同峰值、偏度、厚尾等情况,可以指引使用者深入进行业务解读,及时发现问题所在。
该方法在步骤S16结束。
根据本发明的实施例,上述的商品评价得分的处理方法避免了简单平均数由于样本量较少带来的评价得分不准确、不稳定问题。因为不是直接利用获取样本的数据量,而是结合获取样本的先验分布和增加的外界数据知识来实现的,极大利用总体及先验信息,更能准确反映实际情况;还避免了加权平均数和截尾平均数带来的主观影响,在操作上更加简单便利、客观;对商品不同分类采取可调节的先验分布参数,扩展性和适应性更强,整个技术方案采用计算机一站式实现,很大程度上减少人工操作,提高人效。
图4示意性示出了本发明实施例的处理400系统的模块图。如上所述,该处理系统应用于处理在电子商务网站上用户对商品的评价得分。下面把获取同一商品的多个初始评价得分作为一个样本来进行描述,没有任何的限定意义,只是一个示例性的表达。
该系统400包括均值计算模块410、调整模块420、修正模块430、存储模块440和显示模块450。
均值计算模块410,获取多个用户对同一商品的多个初始评价得分,并计算多个初始评价得分的得分均值。
根据本发明的实施例,获取的样本包括多个用户对同一商品的多个初始评价得分。例如,获取10个用户在美团上对一部电影的评价得分,分别是3、5、2、6、1、7、3、9、5、6分。在本步骤中可以采用简单平均数的方法计算商品的得分均值,根据10个用户在美团上对一部电影的评价得分计算得分均值为4.7分。
调整模块420,根据多个初始评价得分,计算先验分布,所述先验分布是对得分均值的发生概率的调整结果,所述先验知识是指所述多个初始评价得分中各个初始评价得分出现概率的估计。例如,10个用户在美团上对一部电影进行评分,得到10个初始评价得分,假设评分只有好评和差评两个评价种类,则根据电影的实际观看效果,估计好评的概率为0.9,差评为0.1;假设评分有一星、二星、三星、四星和五星供五个评价种类,则根据电影的实际观看效果,估计一星概率为0,二星概率为0.1,三星概率为0.1,四星概率为0.2,五星的概率为0.6。。
根据本发明的实施例,根据获取样本的商品的评价种类分为两大类进行计算。具体地,将商品评价只有两种的称为二项式分布,将商品评价有多种的称为多项式分布。其中二项式分布和多项式分布都属于共轭分布,其好处是计算得的先验分布和下面修正后的后验分布都在同一类分布族,便于计算实现。具体应用哪一种方式来计算先验分布是根据均值计算模块410来选择的,例如,获取10个用户在美团上对一部电影的评价得分,分别是3、5、2、6、1、7、3、9、5、6分,计算得分均值为4.7分。如果规定5分以上为好评(包括5分),5分以下为差评,那么得分均值4.7分为差评。在这种情况下采用二项式分布的公式来计算先验分布。如果规定的是1~2分为一星,3~4分为二星,5~6分为三星,7~8分为四星,9~10分为五星,那么得分均值4.7分为三星。在这种情况下采用多项式分布的公式来计算先验分布。具体地,如下所示:
模块1,若商品的评价只有两种,即好评与差评,则利用如下公式(1)计算先验分布Beta(μ│a,b),其中公式(1)中μ表示多个初始评价得分中各个初始评价得分出现概率的估计,a表示好评在多个初始评价得分中出现的次数,b表示差评在多个初始评价得分中出现的次数。例如,获取10个用户在美团上对一部电影的评价得分,分别是3、5、2、6、1、7、3、9、5、6分,如果规定5分以上为好评(包括5分),5分以下为差评,那么a=6,b=4。
根据本发明的实施例,利用参数为不同的a和b取值,可以计算出多个先验分布。并把计算出的多个先验分布通过其概率密度函数来呈现,具体地,如图2所示,针对不同a、b的取值,可以观测到在二项式分布中的先验分布呈现不同的变化曲线。
如图2所示,示出了a=0.1,b=0.1、a=1,b=1、a=2,b=3和a=8,b=4四组取值的先验分布发生的变化,其中a=0.1,b=0.1这组参数是极端的情况,例如,一款新的产品还没有投入市场,所以没有用户对它进行过评价,这种情况下的a和b应该都为0,但是这样会导致公式(1)没有实际的意义,因此让a=0.1,b=0.1。在观测先验分布变化的过程中,可以随时将二项式分布中的其他参数带入公式(1)计算出新的先验分布,以此方式不间断的加入新的参数可以实时观测到先验分布的分布情况。
模块2,若商品的评价有多种,则利用如下公式(2)计算先验分布Dir(μ│α),其中公式(2)中μ表示多个初始评价得分中各个初始评价得分出现概率的估计,α1…αk表示多种评价在样本中出现的次数,α0表示α12…αk,k表示商品评价的种类,商品评价的种类数量为1~K,μk表示k种设定的商品的评价概率。例如,获取10个用户在美团上对一部电影的评价得分,分别是3、5、2、6、1、7、3、9、5、6分,如果规定的是1~2分为一星,3~4分为二星,5~6分为三星,7~8分为四星,9~10分为五星,那么α1=2,α2=2,α3=4,α4=1,α5=1。
根据本发明的实施例,利用参数为不同的α取值,可以计算出多个先验分布。并把计算出的多个先验分布通过其概率密度函数来呈现。具体地,如图3所示,针对不同α的取值,可以观测到在多项式分布中的先验分布呈现不同的空间图形。
如图3所示,根据本发明的实施例,α=(α123),其中α123分别表示三种商品评价在整个获取样本中所出现的次数。以图3中间的三角形为例,所述的三角形是一个平放的几何图形,其中三角形三个顶点分别为α1=(1,0,0)、α2=(0,1,0)、α3=(0,0,1),三个坐标具体表示三种商品评价出现的次数相同,此种情况较为极端,只会发生在当获取的样本数量极少时。如果获取的样本数量是千万级,那么观测到的多种先验分布情况表现的较为全面。因此,如果获取样本为多种初始评价得分,要求样本的数量是千万级的。一般在观测多项式分布的先验分布变化的过程中,可以随时将多项式分布中的其他α带入公式(2)计算出新的先验分布,以此方式不间断的加入新的参数可以实时的观测到先验分布的具体分布情况。
修正模块430,根据先验分布,计算后验分布,所述后验分布是对所述先验分布的修正结果。
根据本发明的实施例,在修正模块430中要结合下线业务提供的数据知识来计算后验分布。所述数据知识包括来自下线业务对商品评价的预期值,是通过对下线店铺的调查得到的一个预期概率,是没有经过任何数据验证的。例如,一位卖手机的店主希望店内某一款手机的好评率为98%,98%就是预期值。针对该手机的初始评价得分来执行本实施例,得到后验概率为96%,其与预期值98%之差为2%。假定阈值为3%,则通过先验分布和外界的数据知识计算得到的后验概率能够满足店主期望。如果假设在步骤S11中的得分均值为4.7分,即此商品的好评率不高。如果后验概率与预期值之差大于所述阈值,则可能证明商品的质量有问题,需要店主对商品进行改进。
根据本发明的实施例,在修正模块430中避免了简单平均数由于样本量较少带来的评价得分不准确、不稳定问题。因为不是直接利用获取样本的数据量,而是结合获取样本的先验分布和增加的外界数据知识来实现的。
根据本发明的实施例,修正模块430是根据贝叶斯后验估计方法,对调整模块420中的先验分布进行修正,具体是将修正模块430分成两种情况来进行修正,如下所述:
模块I,若商品的评价只有两种,则利用贝叶斯后验概率公式(3)计算后验分布P(O│X),其中公式(3)中O表示获取样本的先验分布,Oi表示在先验分布中有i个先验分布,i的取值为1~n,X表示数据知识包括来自下线业务对商品评价的预期值。
根据本发明的实施例,O是指在调整模块420中的先验分布,O1~Oi和在调整模块420中每一组a和b计算所得的先验分布是一一对应的,X是通过对下线店铺的调查得到的一个预期概率。
模块II,若商品的评价有多种,,则利用贝叶斯后验概率公式(4)计算后验分布P(O│p1,p2,p3,p4,p5),其中公式(4)中O表示获取样本的先验分布,p1,p2,p3,p4,p5表示来自下线业务对商品评价的预期值,K1、K2、K3、K4、K5表示p1,p2,p3,p4,p5在先验分布中出现的次数。
根据本发明的实施例,O是指在调整模块420中的先验分布,K1、K2、K3、K4、K5表示p1,p2,p3,p4,p5在调整模块420中的先验分布中出现的次数,p1,p2,p3,p4,p5是通过对下线店铺的调查得到的商品多种初始得分的预期概率。
根据本发明的实施例,如果调整模块420中的先验分布与预期概率相同,那么这种情况是可以不进行修正模块430,可以直接进行下一个模块存储与呈现
通过上述三个模块对获取样本进行了计算,并得到修正结果。下面模块是对修正结果的存储和显示。
存储模块440,根据初始评价得分的数据量,将修正结果以不同的形式存储。
根据本发明的实施例,选择存储方式是由获取的样本数据量决定的。所述第一阈值可以取1000万。具体存储可以分为两种情况,如下所示:
小数据存储模块441,如果多个初始评价得分的数据量小于等于第一阈值,则将修正结果以平面文件形式存储。例如,获取样本为600万用户对同一商品进行初始评价的得分,在这种情况下是以平面文件形式存储修正结果。以平面文件形式存储的数据可以快速开发,敏捷相应。
大数据存储模块442,如果多个初始评价得分的数据量大于第一阈值,则将修正结果以key-value形式存储。例如,获取样本为一亿用户对同一商品进行初始评价的得分,在这种情况下是以key-value形式存储修正结果。以key-value形式存储的数据查询和响应为常数级,随着数据量扩大,查询效率不会显著降低,保证后续应用稳定性和及时性。
显示模块450,利用以不同的形式存储的修正结果,对商品的评价进行显示。
根据本发明的实施例,显示结果可以观测到两种或多种商品评价的具体分布情况,便于从汇总粒度理解数据分布,发现数据问题,比如得分服从幂律、正态、均匀等分布或者存在不同峰值、偏度、厚尾等情况,可以指引使用者深入进行业务解读,及时发现问题所在。
可以理解的是,均值计算模块410、调整模块420、模块1、模块2、修正模块430、模块I、模块II、存储模块440、小数据存储模块441、大数据存储模块442以及显示模块450中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,均值计算模块410、调整模块420、模块1、模块2、修正模块430、模块I、模块II、存储模块440、小数据存储模块441、大数据存储模块442以及显示模块450中的至少一项可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以以用于对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,均值计算模块410、调整模块420、模块1、模块2、修正模块430、模块I、模块II、存储模块440、小数据存储模块441、大数据存储模块442以及显示模块450中的至少一项可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
图5示意性示出了本发明实施例的处理系统的系统框图。如图所示,处理系统400包括处理器410,例如通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器410还可以包括用于缓存用途的板载存储器。处理器410可以是用于执行参考图1描述的根据本发明实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
处理系统400还可以包括具有非易失性或易失性存储器形式的至少一个可读存储介质420,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
可读存储介质420包括计算机程序421,该计算机程序421包括代码/计算机可读指令,其在由处理器410执行时使得处理器410可以执行例如上面结合图1所描述的方法流程及其任何变形。
计算机程序421可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序421中的代码可以包括一个或多个程序模块,例如包括421A、模块421B、……模块421F。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器410执行时,使得处理器410可以执行例如上面结合图1所描述的方法流程及其任何变形。
根据本发明的实施例,处理系统400还可以包括用于从其他实体接收信号的输入单元430、以及用于向其他实体提供信号的输出单元440。输入单元430和输出单元440可以被布置为单一实体或者是分离的实体。输入单元430可以接收例如修正后的得分均值的发生概率,输出单元440可以将商品的评价显示出来。这样,就可以根据获取样本对总体进行大致的估计。
结合图4和图5所示,根据本发明的实施例,均值计算模块410、调整模块420、模块1、模块2、修正模块430、模块I、模块II、存储模块440、小数据存储模块441、大数据存储模块442以及显示模块450可以实现为参考图5描述的计算机程序模块,其在被处理器410执行时,可以实现上面描述的相应操作。
尽管已经参照本发明的特定示例性实施例示出并描述了本发明,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本发明的精神和范围的情况下,可以对本发明进行形式和细节上的多种改变。因此,本发明的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (12)

1.一种商品评价得分的处理方法,包括:
获取多个用户对同一商品的多个初始评价得分,并计算所述多个初始评价得分的得分均值;
根据所述多个初始评价得分和先验知识,计算先验分布,所述先验分布是对得分均值的发生概率的调整结果,所述先验知识是指所述多个初始评价得分中各个初始评价得分出现概率的估计;
根据所述先验分布,计算后验分布,所述后验分布是对所述先验分布的修正结果。
2.根据权利要求1所述的商品评价得分的处理方法,其中,所述计算先验分布包括:
若所述商品的评价只有两种,则利用如下公式计算先验分布Beta(μ│a,b):
其中μ表示先验知识,a表示一种商品评价在所述多个初始评价得分中出现的次数,b表示另一种商品评价在所述多个初始评价得分中出现的次数;
若所述商品的评价有多种,则利用如下公式计算先验分布Dir(μ│α):
其中μ表示先验知识,α1…αk表示多种评价在所述样本中出现的次数,α0表示α12…αk,k表示商品评价的种类,所述商品评价的种类数量为1~K,μk表示k种设定的商品的评价概率。
3.根据权利要求1所述的商品评价得分的处理方法,其中,所述计算后验分布是指,采用贝叶斯后验估计方法对所述先验分布进行修正,包括:
若所述商品的评价只有两种,则利用如下公式计算后验分布P(O│X):
其中O表示先验分布Beta(μ│a,b),Oi表示在先验分布中有i个先验分布,i的取值为1~n,X表示商品评价的预期概率;
若所述商品的评价有多种,则利用如下公式计算后验分布P(O│p1,p2,p3,p4,p5):
其中O表示先验分布Dir(μ│α),p1,p2,p3,p4,p5表示商品评价的预期概率,K1、K2、K3、K4、K5表示p1,p2,p3,p4,p5在先验分布中出现的次数。
4.根据权利要求1所述的商品评价得分的处理方法,其中,所述方法还包括:
根据初始评价得分的数据量,将所述修正结果以不同的形式存储;
利用以不同的形式存储的修正结果,对所述商品的评价进行显示。
5.根据权利要求4所述的商品评价得分的处理方法,其中,根据初始评价得分的数据量,将所述修正结果以不同的形式存储包括:
如果多个初始评价得分的数据量小于等于第一阈值,则将所述修正结果以平面文件形式存储;
如果多个初始评价得分的数据量大于所述第一阈值,则将所述修正结果以key-value形式存储。
6.一种商品评价得分的处理系统,包括:
均值计算模块,获取多个用户对同一商品的多个初始评价得分,并计算所述多个初始评价得分的得分均值;
调整模块,根据所述多个初始评价得分和先验知识,计算先验分布,所述先验分布是对得分均值的发生概率的调整结果,所述先验知识是指所述多个初始评价得分中各个初始评价得分出现概率的估计;
修正模块,根据所述先验分布,计算后验分布,所述后验分布是对所述先验分布的修正结果。
7.根据权利要求6所述的商品评价得分的处理系统,其中,所述调整模块包括:
模块1,若所述商品的评价只有两种,则利用如下公式计算先验分布Beta(μ│a,b):
其中μ表示指先验知识,a表示一种商品评价在所述多个初始评价得分中出现的次数,b表示另一种商品评价在所述多个初始评价得分中出现的次数;
模块2,若所述商品的评价有多种,则利用如下公式计算先验分布Dir(μ│α):
其中μ表示先验知识,α1…αk表示多种评价在所述样本中出现的次数,α0表示α12…αk,k表示商品评价的种类,所述商品评价的种类数量为1~K,μk表示k种设定的商品的评价概率。
8.根据权利要求6所述的商品评价得分的处理系统,其中,修正模块包括:
模块I,若所述商品的评价只有两种,则利用如下公式计算后验分布P(O│X):
其中O表示先验分布Beta(μ│a,b),Oi表示在先验分布中有i个先验分布,i的取值为1~n,X表示商品评价的预期概率;
模块II,若所述商品的评价有多种,则利用如下公式计算后验分布P(O│p1,p2,p3,p4,p5):
其中O表示先验分布Dir(μ│α),p1,p2,p3,p4,p5表示商品评价的预期概率,K1、K2、K3、K4、K5表示p1,p2,p3,p4,p5在先验分布中出现的次数。
9.根据权利要求6所述的商品评价得分的处理系统,还包括:
存储模块,根据初始评价得分的数据量,将所述修正结果以不同的形式存储;
显示模块,利用以不同的形式存储的修正结果,对所述商品的评价进行显示。
10.根据权利要求9所述的商品评价得分的处理系统,其中,存储模块包括:
小数据存储模块,如果多个初始评价得分的数据量小于等于第一阈值,则将所述修正结果以平面文件形式存储;
大数据存储模块,如果多个初始评价得分的数据量大于所述第一阈值,则将所述修正结果以key-value形式存储。
11.一种商品评价得分的处理系统,包括:
一个或多个处理器;以及
一个或多个存储器,存储有可执行指令,所述指令在被处理器执行时,使得处理器执行根据权利要求1~5任一项所述的方法。
12.一种可读存储介质,其上存储有用于执行根据权利要求1~5中任意一项所述的方法的指令。
CN201710110476.4A 2017-02-28 2017-02-28 一种商品评价得分的处理方法及系统 Active CN108510297B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710110476.4A CN108510297B (zh) 2017-02-28 2017-02-28 一种商品评价得分的处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710110476.4A CN108510297B (zh) 2017-02-28 2017-02-28 一种商品评价得分的处理方法及系统

Publications (2)

Publication Number Publication Date
CN108510297A true CN108510297A (zh) 2018-09-07
CN108510297B CN108510297B (zh) 2021-12-31

Family

ID=63373952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710110476.4A Active CN108510297B (zh) 2017-02-28 2017-02-28 一种商品评价得分的处理方法及系统

Country Status (1)

Country Link
CN (1) CN108510297B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292000A (zh) * 2020-02-21 2020-06-16 国网北京市电力公司 供应商绩效分数的确定方法和装置、存储介质及处理器
CN117743813A (zh) * 2024-02-05 2024-03-22 蓝色火焰科技成都有限公司 广告分类评估方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1684228A1 (en) * 2005-01-24 2006-07-26 Microsoft Corporation Scoring with Baysian algorithm
CN102799567A (zh) * 2011-05-24 2012-11-28 索尼公司 信息处理装置、信息处理方法和程序
US8732025B2 (en) * 2005-05-09 2014-05-20 Google Inc. System and method for enabling image recognition and searching of remote content on display
CN105654339A (zh) * 2015-12-28 2016-06-08 无锡城市云计算中心有限公司 一种对评论有用性进行评估和排序的方法和装置
CN105809474A (zh) * 2016-02-29 2016-07-27 深圳市未来媒体技术研究院 一种层次化商品信息过滤推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1684228A1 (en) * 2005-01-24 2006-07-26 Microsoft Corporation Scoring with Baysian algorithm
US8732025B2 (en) * 2005-05-09 2014-05-20 Google Inc. System and method for enabling image recognition and searching of remote content on display
CN102799567A (zh) * 2011-05-24 2012-11-28 索尼公司 信息处理装置、信息处理方法和程序
CN105654339A (zh) * 2015-12-28 2016-06-08 无锡城市云计算中心有限公司 一种对评论有用性进行评估和排序的方法和装置
CN105809474A (zh) * 2016-02-29 2016-07-27 深圳市未来媒体技术研究院 一种层次化商品信息过滤推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
管涛: "《数据分析基础及模型》", 31 July 2015 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292000A (zh) * 2020-02-21 2020-06-16 国网北京市电力公司 供应商绩效分数的确定方法和装置、存储介质及处理器
CN117743813A (zh) * 2024-02-05 2024-03-22 蓝色火焰科技成都有限公司 广告分类评估方法、装置及存储介质
CN117743813B (zh) * 2024-02-05 2024-04-23 蓝色火焰科技成都有限公司 广告分类评估方法、装置及存储介质

Also Published As

Publication number Publication date
CN108510297B (zh) 2021-12-31

Similar Documents

Publication Publication Date Title
US11373233B2 (en) Item recommendations using convolutions on weighted graphs
Fritz et al. A comparison of algorithms for the multivariate L 1-median
US20150278341A1 (en) Data search processing
JP2023541245A (ja) マルチホップアテンショングラフニューラルネットワークに基づく関係学習方法およびシステム
WO2016058485A2 (zh) 用于计算排序分及建立模型的方法、装置及商品推荐系统
US20150007064A1 (en) Automatic generation of a webpage layout with high empirical performance
US20120233183A1 (en) Information processing apparatus, terminal apparatus, information presentation system, calculation method of evaluation scores, and program
CN104809637B (zh) 计算机实现的商品推荐方法及系统
US20180225581A1 (en) Prediction system, method, and program
CN105809558A (zh) 基于社交网络的推荐方法和装置
WO2020233432A1 (zh) 一种信息推荐方法及装置
US11455544B2 (en) Prediction model generation device, prediction model generation method, and recording medium
CN107526810B (zh) 建立点击率预估模型的方法及装置、展示方法及装置
CN104751353A (zh) 基于聚类和Slope One预测的协同过滤方法
US20210256548A1 (en) Computation of user-specific item-related values on an electronic processing platform
US20160132916A1 (en) System and method of demand modeling and price calculation based on competitive pressure
WO2022081267A1 (en) Product evaluation system and method of use
CN110880061A (zh) 商品到手价格的风险监管方法及系统
Cai et al. Pricing strategies in a supply chain with multi-manufacturer and a common retailer under online reviews
US11301763B2 (en) Prediction model generation system, method, and program
CN105574599A (zh) 估算订单退货率的方法及装置
CN108510297A (zh) 一种商品评价得分的处理方法及系统
CN112243509A (zh) 从异构源生成数据集用于机器学习的系统和方法
US20120096009A1 (en) Collaborative filtering with hashing
WO2014026541A2 (zh) 同类非同质商品对性价比进行比较与排序的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant