CN110880119A - 一种数据处理方法和装置 - Google Patents
一种数据处理方法和装置 Download PDFInfo
- Publication number
- CN110880119A CN110880119A CN201811032322.9A CN201811032322A CN110880119A CN 110880119 A CN110880119 A CN 110880119A CN 201811032322 A CN201811032322 A CN 201811032322A CN 110880119 A CN110880119 A CN 110880119A
- Authority
- CN
- China
- Prior art keywords
- attribute
- commodity
- commodities
- difference information
- attribute difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 230000007704 transition Effects 0.000 claims abstract description 114
- 239000013598 vector Substances 0.000 claims abstract description 110
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012546 transfer Methods 0.000 claims abstract description 12
- 230000006399 behavior Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 9
- 230000001419 dependent effect Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 abstract description 14
- 238000010586 diagram Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 235000013361 beverage Nutrition 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 241000227653 Lycopersicon Species 0.000 description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013210 evaluation model Methods 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 235000019634 flavors Nutrition 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000013486 operation strategy Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据各商品的交易数据、所述各商品对应的用户数据确定商品间的第一转移概率;根据所述各商品的商品主数据,生成商品间的第一属性差异信息;根据所述第一转移概率和所述第一属性差异信息生成预测值向量,以及根据所述第一属性差异信息生成各商品的每个属性对应的属性差异向量;根据所述预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。该实施方式能够量化不同属性的重要度,省时省力,能很好地定位参考商品范围,既考虑相似商品的销售情况又考虑消费者需求,提高评估结果可靠性,能精确指导业务人员的商品运营。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法和装置。
背景技术
随着电子商务的发展,线上交易的商品也越来越多,人们主要的购物方式也发生了变化。对于新研发、新上市的商品,如何评估其未来市场,对于电商企业和品牌商都是非常重要的。
现有的量化某一商品价值的方案主要有两种:一是通过问卷调查的方式,调研是否有购买该商品的意愿,这一方案费时费力,而且样本较少,不能得出一个可靠的结论;二是通过观察与该商品相关的竞争商品或者相似商品的历史销量和销售额数据,依靠业务知识进行判断,这一方案不能很好地定位参考商品的范围,不同品牌不同属性之间的商品差别很大,而且没有考虑市场以及用户的需求,而不能精确地指导业务人员的进行商品运营。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有方案无法量化不同属性的重要度,费时费力、可靠性差,此外,不能很好地定位参考商品的范围,并且没有考虑市场以及用户的需求,不能精确地指导业务人员的进行商品运营。
发明内容
有鉴于此,本发明实施例提供一种数据处理方法和装置,能够量化不同属性的重要度,并可利用不同属性的重要度来评估新上市商品的价值,省时省力,并能很好地定位参考商品的范围,且不仅考虑相似商品的销售情况,还考虑到消费者的需求,提高评估结果的可靠性,能精确地指导业务人员的进行商品运营。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据处理方法。
一种数据处理方法,包括根据各商品的交易数据、所述各商品对应的用户数据确定商品间的第一转移概率;根据所述各商品的商品主数据,生成商品间的第一属性差异信息;根据所述第一转移概率和所述第一属性差异信息生成预测值向量,以及根据所述第一属性差异信息生成各商品的每个属性对应的属性差异向量;根据所述预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。
可选地,所述用户数据包括用户消费行为轨迹数据,所述各商品的交易数据包括每个商品对应订单的金额以及在各订单中的商品金额,根据各商品的交易数据、所述各商品对应的用户数据确定商品间的第一转移概率的步骤,包括:根据同一用户连续订单的两个商品中每个商品对应的订单的金额,以及所述两个商品在各自的订单中的商品金额,确定在所述连续订单中商品间的转移概率消费额,所述连续订单包括第一订单和第二订单,所述两个商品分别属于所述第一订单和所述第二订单;根据所述用户消费行为轨迹数据,对各用户连续订单中商品间的转移概率消费额进行汇总,并对汇总后的转移概率消费额归一化,得到所述商品间的第一转移概率。
可选地,所述商品主数据包括商品的属性信息,根据所述各商品的商品主数据,生成商品间的第一属性差异信息的步骤,包括:以相同类别的两个商品作为一个商品组合,且各商品组合具有相同属性,其中,对于每一商品组合,如果所述商品组合中两个商品的属性值为非数值型变量,则比对该两个商品的属性值是否相同,根据所述比对的结果生成所述商品间的第一属性差异信息;如果所述商品组合中两个商品的属性值为数值型变量,则计算该两个商品的属性值之间的距离,根据所述两个商品的属性值之间的距离,生成所述商品间的第一属性差异信息。
可选地,通过如下方法计算两个商品的属性值之间的距离:
根据所述两个商品的属性值之间的距离,通过如下方法生成所述商品间的第一属性差异信息:
其中,Dij表示第i个商品组合中两个商品的第j个属性值之间的距离,表示第i个商品组合的两个商品中第一个商品的第j个属性值,表示第i个商品组合的两个商品中第二个商品的第j个属性值,Xij表示第i个商品组合中两个商品的第j个属性值之间的差异信息,MAX(Dj)表示所述各商品组合中两个商品的第j个属性值之间的距离的最大值,所述商品间的第一属性差异信息为同类别所述各商品组合中两个商品的属性值之间的差异信息的集合。
可选地,根据所述第一转移概率和所述第一属性差异信息生成预测值向量的步骤,包括:以所述第一属性差异信息为自变量,以所述第一转移概率为因变量,利用预设的预测模型,预测与所述第一转移概率对应的第二转移概率;根据所述第一转移概率和与所述第一转移概率对应的第二转移概率,生成预测值向量。
可选地,根据所述第一属性差异信息生成各商品的每个属性对应的属性差异向量的步骤,包括:根据预设的变换规则,将所述第一属性差异信息变换为与所述第一属性差异信息对应的第二属性差异信息;根据所述第一属性差异信息和与所述第一属性差异信息对应的第二属性差异信息,生成各商品的每个属性对应的属性差异向量。
可选地,所述第一属性差异信息为二进制数值或0到1之间的小数,按照如下的所述预设的变换规则,将所述第一属性差异信息变换为与所述第一属性差异信息对应的第二属性差异信息:如果所述第一属性差异信息为二进制数值,则通过将所述第一属性差异信息取反,得到与所述第一属性差异信息对应的第二属性差异信息;如果所述第一属性差异信息为0到1之间的小数,则根据1与所述第一属性差异信息的差值得到与所述第一属性差异信息对应的第二属性差异信息。
可选地,通过如下方法确定商品的某个属性的重要度:根据所述预测值向量与所述商品的该属性对应的属性差异向量进行内积运算,得到第一内积运算结果;根据所述预测值向量与该预测值向量自身的内积运算,得到第二内积运算结果;根据所述第一内积运算结果和所述第二内积运算结果的比值,确定所述商品的该属性的重要度。
可选地,根据所述预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度的步骤之后,包括:根据待评估商品的各属性的重要度、所述待评估商品各属性值对应的销售额、所述待评估商品所属类别的商品销售总额,评估所述待评估商品的价值。
根据本发明实施例的另一方面,提供了一种数据处理装置。
一种数据处理装置,包括:转移概率确定模块,用于根据各商品的交易数据、所述各商品对应的用户数据确定商品间的第一转移概率;属性差异信息生成模块,用于根据所述各商品的商品主数据,生成商品间的第一属性差异信息;向量生成模块,用于根据所述第一转移概率和所述第一属性差异信息生成预测值向量,以及根据所述第一属性差异信息生成各商品的每个属性对应的属性差异向量;属性重要度确定模块,用于根据所述预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。
可选地,所述用户数据包括用户消费行为轨迹数据,所述各商品的交易数据包括每个商品对应订单的金额以及在各订单中的商品金额,所述转移概率确定模块还用于:根据同一用户连续订单的两个商品中每个商品对应的订单的金额,以及所述两个商品在各自的订单中的商品金额,确定在所述连续订单中商品间的转移概率消费额,所述连续订单包括第一订单和第二订单,所述两个商品分别属于所述第一订单和所述第二订单;根据所述用户消费行为轨迹数据,对各用户连续订单中商品间的转移概率消费额进行汇总,并对汇总后的转移概率消费额归一化,得到所述商品间的第一转移概率。
可选地,所述商品主数据包括商品的属性信息,所述属性差异信息生成模块还用于:以相同类别的两个商品作为一个商品组合,且各商品组合具有相同属性,其中,对于每一商品组合,如果所述商品组合中两个商品的属性值为非数值型变量,则比对该两个商品的属性值是否相同,根据所述比对的结果生成所述商品间的第一属性差异信息;如果所述商品组合中两个商品的属性值为数值型变量,则计算该两个商品的属性值之间的距离,根据所述两个商品的属性值之间的距离,生成所述商品间的第一属性差异信息。
可选地,所述属性差异信息生成模块通过如下方法计算两个商品的属性值之间的距离:
所述属性差异信息生成模块根据所述两个商品的属性值之间的距离,通过如下方法生成所述商品间的第一属性差异信息:
其中,Dij表示第i个商品组合中两个商品的第j个属性值之间的距离,表示第i个商品组合的两个商品中第一个商品的第j个属性值,表示第i个商品组合的两个商品中第二个商品的第j个属性值,Xij表示第i个商品组合中两个商品的第j个属性值之间的差异信息,MAX(Dj)表示所述各商品组合中两个商品的第j个属性值之间的距离的最大值,所述商品间的第一属性差异信息为同类别所述各商品组合中两个商品的属性值之间的差异信息的集合。
可选地,所述向量生成模块包括预测值向量生成子模块,用于:以所述第一属性差异信息为自变量,以所述第一转移概率为因变量,利用预设的预测模型,预测与所述第一转移概率对应的第二转移概率;根据所述第一转移概率和与所述第一转移概率对应的第二转移概率,生成预测值向量。
可选地,所述向量生成模块包括属性差异向量生成子模块,用于:根据预设的变换规则,将所述第一属性差异信息变换为与所述第一属性差异信息对应的第二属性差异信息;根据所述第一属性差异信息和与所述第一属性差异信息对应的第二属性差异信息,生成各商品的每个属性对应的属性差异向量。
可选地,所述第一属性差异信息为二进制数值或0到1之间的小数,所述属性差异向量生成子模块按照如下的所述预设的变换规则,将所述第一属性差异信息变换为与所述第一属性差异信息对应的第二属性差异信息:如果所述第一属性差异信息为二进制数值,则通过将所述第一属性差异信息取反,得到与所述第一属性差异信息对应的第二属性差异信息;如果所述第一属性差异信息为0到1之间的小数,则根据1与所述第一属性差异信息的差值得到与所述第一属性差异信息对应的第二属性差异信息。
可选地,所述属性重要度确定模块通过如下方法确定商品的某个属性的重要度:根据所述预测值向量与所述商品的该属性对应的属性差异向量进行内积运算,得到第一内积运算结果;根据所述预测值向量与该预测值向量自身的内积运算,得到第二内积运算结果;根据所述第一内积运算结果和所述第二内积运算结果的比值,确定所述商品的该属性的重要度。
可选地,还包括价值评估模块,用于:根据待评估商品的各属性的重要度、所述待评估商品各属性值对应的销售额、所述待评估商品所属类别的商品销售总额,评估所述待评估商品的价值。
根据本发明实施例的又一方面,提供了一种电子设备。
一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明提供的数据处理方法。
根据本发明实施例的又一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明提供的数据处理方法。
上述发明中的一个实施例具有如下优点或有益效果:根据各商品的交易数据、各商品对应的用户数据确定商品间的第一转移概率;根据各商品的商品主数据,生成商品间的第一属性差异信息;根据第一转移概率和第一属性差异信息生成预测值向量,以及根据第一属性差异信息生成各商品的每个属性对应的属性差异向量;根据预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。能够量化不同属性的重要度,并利用不同属性的重要度来评估新上市商品的价值,省时省力,并能很好地定位参考商品的范围,且不仅考虑相似商品的销售情况,还考虑到消费者的需求,提高评估结果的可靠性,能精确地指导业务人员的进行商品运营。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明一个实施例的数据处理方法的主要步骤示意图;
图2是根据本发明一个实施例的属性重要度排序示意图;
图3是根据本发明实施例的商品价值评估系统构成示意图;
图4是根据本发明实施例的数据处理装置的主要模块示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
对于电商业务人员而言,某一商品未来的销售市场如何?应该备货多少才不会滞销?对于品牌商而言,要生产新的产品,以完成产品的更新换代,具有哪些属性特征的商品消费者需求更大,都需要精准可靠地评估商品的价值。所以在评估新品价值时,不仅需要考虑现在相似品的销售情况,还需要考虑到消费者的需求。本发明实施例提供一种基于属性重要度的的商品价值评估系统,能够量化不同属性的重要度,并可利用不同属性的重要度来评估某一商品的价值。用户通过系统可以了解到各个商品之间的转移概率、不同属性的重要度,以及待评估商品未来可能达到的销售额,在进行待评估销售运营以及库存管理的时候,可以以此来调整相关策略。本发明实施例的待评估商品可以是新上市的商品(即新品),然而,本发明实施例的数据处理方法不仅限于评估新品的价值,还可以用于评估非新品的价值。
图1是根据本发明一个实施例的数据处理方法的主要步骤示意图。
如图1所示,本发明一个实施例的数据处理方法主要包括如下的步骤S101至步骤S105。
步骤S101:根据各商品的交易数据、各商品对应的用户数据确定商品间的第一转移概率。
某一商品的交易数据主要包括该商品的订单数据,具体可以包括该商品对应订单的金额,以及在对应的订单中的该商品的金额,例如用户在订单1中购买了商品A,则该商品的交易数据具体可以包括订单1的金额和订单1中商品A的金额。
上述用户数据是指用户在购买过程中的消费行为轨迹数据以及用户信息,消费行为轨迹数据体现了用户在购买某一商品之后,下次购买哪些商品的消费行为轨迹。
步骤S101具体包括:根据同一用户连续订单的两个商品中每个商品对应的订单的金额,以及两个商品在各自的订单中的商品金额,确定在连续订单中商品间的转移概率消费额,其中,连续订单包括第一订单和第二订单,该两个商品分别属于第一订单和第二订单;根据用户消费行为轨迹数据,对各用户连续订单中商品间的转移概率消费额进行汇总,并对汇总后的转移概率消费额归一化,得到商品间的第一转移概率。
连续订单是同一用户的相邻两次购物的订单,例如同一用户的连续订单为订单1和订单2,订单1中包括商品A,订单2中包括商品B,可通过如下公式确定连续订单中商品间的转移概率消费额Ri(A,B):
其中,Sale1表示订单1的总金额,Sale2表示订单2的总金额,Sale1A表示订单1中商品A的金额,Sale2B表示订单2中商品B的金额。连续订单中商品间的转移概率消费额Ri(A,B)体现了用户在购买了商品A之后,下一次下单时购买商品B的消费转移。
统计所有用户消费行为轨迹数据,将所有用户的连续订单中商品间的转移概率消费额进行汇总,并对汇总后的转移概率消费额归一化,得到商品间的第一转移概率。商品间的第一转移概率量化了用户在购买某一商品以后,会再次购买哪些商品的概率,通过商品间的第一转移概率,可以使业务人员了解用户在不同商品之间的消费流向,以及用户可以再次购买同一商品或者转移到不同商品的概率。
步骤S102:根据各商品的商品主数据,生成商品间的第一属性差异信息。
商品主数据是指商品的主要信息,具体包括商品的属性信息。
步骤S102具体包括:以相同类别的两个商品作为一个商品组合,且各商品组合具有相同属性,其中,对于每一商品组合,如果该商品组合中两个商品的属性值为非数值型变量,则比对该两个商品的属性值是否相同,根据比对的结果生成商品间的第一属性差异信息;如果该商品组合中两个商品的属性值为数值型变量,则计算该两个商品的属性值之间的距离,根据该两个商品的属性值之间的距离,生成商品间的第一属性差异信息。
商品的类别具体可以为该商品所属的品类。商品间的第一属性差异信息体现了相同品类的两个商品的属性值之间的差异性。对于非数值型变量的属性值,例如品牌、颜色等,通过比对其属性值相同或者不同来表示差异性,对于数值型变量的属性值,例如价格、容量等,通过计算属性值之间的距离来表示其差异性。
具体地,对于商品组合Ci(i∈[1,n]),首先确认其中的商品是否具有相同属性,在属性相同的情况下,制作属性相似表。其中:
对于非数值型变量的属性值,依次比较两个商品的属性V的属性值是否相同,如果相同,则记作1,不相同则记作0。以Xij表示第i个商品组合中两个商品的第j个属性值之间的差异信息,即:
对于数值型变量的属性值,
通过如下方法计算两个商品的属性值之间的距离:
根据两个商品的属性值之间的距离,通过如下方法生成商品组合中两个商品的第j个属性值之间的差异信息:
其中,Dij表示第i个商品组合中两个商品的第j个属性值之间的距离,表示第i个商品组合的两个商品中第一个商品的第j个属性值,表示第i个商品组合的两个商品中第二个商品的第j个属性值,Xij表示第i个商品组合中两个商品的第j个属性值之间的差异信息,MAX(Dj)表示各商品组合中两个商品的第j个属性值之间的距离的最大值。
商品间的第一属性差异信息为同品类的各商品组合中两个商品的属性值之间的差异信息的集合。通过上述各算式(或表达式)可知,对于非数值型变量的属性值,商品间的第一属性差异信息由二进制数值0或1组成;对于数值型变量的属性值,商品间的第一属性差异信息由0到1之间的小数组成。
对于非数值型变量的属性值,根据第一属性差异信息制作的属性相似表可以如表1所示。表1中为7个商品组合Ci(i∈[1,7])的3个属性(品牌、颜色、大小)的差异信息。
表1
品牌 | 颜色 | 大小 | |
C<sub>1</sub> | 0 | 1 | 0 |
C<sub>2</sub> | 1 | 0 | 0 |
C<sub>3</sub> | 0 | 1 | 1 |
C<sub>4</sub> | 1 | 1 | 1 |
C<sub>5</sub> | 0 | 1 | 0 |
C<sub>6</sub> | 0 | 0 | 1 |
C<sub>7</sub> | 0 | 1 | 1 |
需要说明的是,上述的步骤S101和步骤S102的执行顺序可以互换,即先执行步骤S102,后执行步骤S101。
步骤S103:根据商品间的第一转移概率和商品间的第一属性差异信息生成预测值向量,以及根据该第一属性差异信息生成各商品的每个属性对应的属性差异向量。
其中,根据第一转移概率和第一属性差异信息生成预测值向量的步骤,具体可以包括:以商品间的第一属性差异信息为自变量,以所述商品间的第一转移概率为因变量,利用预设的预测模型,预测与该第一转移概率对应的第二转移概率;根据第一转移概率和与第一转移概率对应的第二转移概率,生成预测值向量。
预设的预测模型可以是随机森林的算法拟合模型。以表1中的数据为例,生成预测值向量的过程为:Ci(i∈[1,7])中每个商品组合中的两个商品间都有一个第一转移概率,将这些第一转移概率作为因变量,将表1的各属性对应的一列数据作为自变量,输入到随机森林的算法拟合模型,来预测各第二转移概率,将各第一转移概率构成的向量与预测得到的各第二转移概率构成的向量拼接,即得到预测值向量。
根据第一属性差异信息生成各商品的每个属性对应的属性差异向量的步骤,具体包括:根据预设的变换规则,将第一属性差异信息变换为与第一属性差异信息对应的第二属性差异信息;根据第一属性差异信息和与第一属性差异信息对应的第二属性差异信息,生成各商品的每个属性对应的属性差异向量。
其中,可以按照如下的预设的变换规则,将第一属性差异信息变换为与第一属性差异信息对应的第二属性差异信息:如果第一属性差异信息为二进制数值,则通过将第一属性差异信息取反,得到与第一属性差异信息对应的第二属性差异信息;如果第一属性差异信息为0到1之间的小数,则根据1与第一属性差异信息的差值得到与第一属性差异信息对应的第二属性差异信息。
以表1的数据为例,对应品牌的一列第一属性差异信息为(0,1,0,1,0,0,0),根据上述变换规则,进行取反,即得到的第二属性差异信息为(1,0,1,0,1,1,1)。将该第一属性差异信息的向量和该第二属性差异信息的向量拼接,即生成各商品的品牌这一属性对应的属性差异向量,即:(0,1,0,1,0,0,0,1,0,1,0,1,1,1)。
步骤S104:根据预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。
利用决策树确定商品的属性的重要度。其中,可以通过如下方法确定商品的某个属性的重要度:根据预测值向量与商品的该属性对应的属性差异向量进行内积运算,得到第一内积运算结果;根据预测值向量与该预测值向量自身的内积运算,得到第二内积运算结果;根据第一内积运算结果和第二内积运算结果的比值,确定商品的该属性的重要度。对应的公式为:
其中,Ej为第j个属性的重要度,Xj为第j个属性对应的属性差异向量,R为预测值向量。Ej越大,说明属性j对于用户在购买决策中起的作用越大,重要程度越高。
根据计算出的属性重要度,可以对同一品类的商品属性进行排名。如图2所示。基于属性重要度,能更好地帮助品牌商定位用户的需求,发崛细分市场的空缺点,了解哪些属性的细分市场用户需求大,增长快,并指导新品的研发。
步骤S105:根据待评估商品的各属性的重要度、待评估商品各属性值对应的销售额、待评估商品所属类别的商品销售总额,评估待评估商品的价值。
步骤S105具体可以包括:将待评估商品的每一属性的重要度分别与待评估商品的该属性值对应的销售额相乘,并将各相乘结果进行加和;将该加和的结果与待评估商品所属类别的商品销售总额的比值,得到待评估商品的价值对应的数值。
其中,待评估商品的某一属性值对应的销售额,是指在该待评估商品所属的类别(如品类)中,具有该属性值的商品对应该属性值的销售额。
由于每个商品都是由不同的属性值来组成的,所以新品的价值可以根据新品本身的属性值,结合用户需求来计算,例如,对于某一待评估商品,一款新上市的番茄味X类型饮料(假设X类型饮料为常见的一种饮料),虽然该番茄味X类型饮料为新品,但其仍然具有一些已知属性的属性值,例如品牌(某品牌)、包装容积(250mL)、包装类型(瓶装)等等,根据这些属性值可以得到待评估商品的这些属性值对应的销售额,即该品类下对应某品牌的商品的销售额、包装容积为250mL的商品的销售额、包装类型为瓶装的商品的销售额等。
评估某一待评估商品价值M的具体计算公式如下:
其中,PM表示新品M的价值,Ej表示新品M的第j个属性的重要度,SaleMj表示新品M对应第j个属性值的销售额,SaleM_total表示新品M所属品类的商品销售总额。SaleMj和SaleM_total可以选取新品M上市最近一个固定时间段的数据,例如最近一个月的数据。
本发明实施例得到的待评估商品的价值对应的数值还可以用于预测该待评估商品的销售额,例如对于一款市场上没有的新品或新上市的商品,没有历史数据可以依据,在得到该新品的价值之后,可以参考已有商品的价值与销售额的对应关系,根据与该新品价值相同或相近的已有商品的价值对应的销售额,得到该新品的销售额的预测值,例如,某已有商品的价值与某新品的价值相同(数值相同)或相近(数值同属于一个预设区间内),则可以根据该已有商品的销售额预测该新品的销售额。
图3是根据本发明实施例的商品价值评估系统构成示意图。
如图3所示,本发明实施例的商品价值评估系统主要包括三个部分:数据部分、算法部分、用户界面部分。
数据部分包括商品主数据、交易数据和用户数据。
算法部分包括商品转移概率模型、属性重要度模型和商品价值评估模型。商品转移概率模型利用用户在不同商品之间的购买行为来衡量商品之间的转移概率(即第一转移概率)。属性重要度模型利用属性之间的相似度以及用户转移概率(包括第一转移概率和第二转移概率)来量化不同属性的重要度。商品价值评估模型是基于属性重要度模型来评估商品的价值。
为用户提供合适的商品首先需要了解用户的购买行为,以及用户最重要的需求。通过本发明实施例的属性重要度模型,可以量化用户在购买时对他最重要的属性。对于消费者而言,属性越重要,购买这个商品的可能性就越大。每个商品可以分解成若干商品属性,这些属性最终驱动着顾客的购买决策。例如Y品牌手机,可以分解为品牌、屏幕尺寸、颜色等属性,对于每个商品,列出每个商品的各个属性,就可以得到一个属性矩阵V。基于商品间的转移概率(第一转移概率和第一转移概率对应的第二转移概率),来计算不同属性造成商品之间差异的影响,差异最大的属性,驱使最多的用户决策,也就是重要度最高。例如,购买手机,白色Y品牌手机XI型号和白色Y品牌手机XII型号,在其他属性都相同的情况下,用户最后购买了屏幕尺寸更大的XII型号,那说明屏幕尺寸对用户的决策影响很大,重要度高。
通过本发明实施例的商品价值评估模型,可以对商品未来的销售市场进行预测,从而指导业务人员更好的进行商品销售运营和备货策略。例如对于一款市场上没有的商品或者新上市的商品,没有历史的数据可以依据,我们可以根据此模型对新品的销售额进行预测。而对于引进的新品而言,也可以根据新品的价值排名,优先引进价值高的商品。
用户界面部分允许用户查看各个商品之间的转移概率(即第一转移概率)、属性重要度排名、商品价值等,来指导业务人员进行不同的运营策略。
通过本发明实施例的商品价值评估系统,可以了解消费者在购物过程中是如何决策的、哪些属性对于消费者而言更重要或需求更大,从而量化商品(例如新品)的价值,了解商品的市场潜力,为商品的销售运营和库存备货提供策略支持。
图4是根据本发明实施例的数据处理装置的主要模块示意图。
如图4所示,本发明实施例的数据处理装置400主要包括:转移概率确定模块401、属性差异信息生成模块402、向量生成模块403、属性重要度确定模块404、价值评估模块405。
转移概率确定模块401用于根据各商品的交易数据、各商品对应的用户数据确定商品间的第一转移概率。
各商品的交易数据包括每个商品对应订单的金额以及在各订单中的商品金额,该用户数据包括用户消费行为轨迹数据。
转移概率确定模块401具体可以用于:根据同一用户连续订单的两个商品中每个商品对应的订单的金额,以及两个商品在各自的订单中的商品金额,确定在连续订单中商品间的转移概率消费额,连续订单包括第一订单和第二订单,两个商品分别属于第一订单和第二订单;根据用户消费行为轨迹数据,对各用户连续订单中商品间的转移概率消费额进行汇总,并对汇总后的转移概率消费额归一化,得到商品间的第一转移概率。
属性差异信息生成模块402,用于根据各商品的商品主数据,生成商品间的第一属性差异信息。
商品主数据包括商品的属性信息。
属性差异信息生成模块402具体可以用于:以相同类别的两个商品作为一个商品组合,且各商品组合具有相同属性,其中,对于每一商品组合,如果商品组合中两个商品的属性值为非数值型变量,则比对该两个商品的属性值是否相同,根据比对的结果生成商品间的第一属性差异信息;如果商品组合中两个商品的属性值为数值型变量,则计算该两个商品的属性值之间的距离,根据两个商品的属性值之间的距离,生成商品间的第一属性差异信息。
属性差异信息生成模块402具体可以通过如下方法计算两个商品的属性值之间的距离:
并且,属性差异信息生成模块402根据两个商品的属性值之间的距离,具体可以通过如下方法生成商品间的第一属性差异信息:
其中,Dij表示第i个商品组合中两个商品的第j个属性值之间的距离,表示第i个商品组合的两个商品中第一个商品的第j个属性值,表示第i个商品组合的两个商品中第二个商品的第j个属性值,Xij表示第i个商品组合中两个商品的第j个属性值之间的差异信息,MAX(Dj)表示各商品组合中两个商品的第j个属性值之间的距离的最大值,商品间的第一属性差异信息为同类别各商品组合中两个商品的属性值之间的差异信息的集合。
向量生成模块403,用于根据商品间的第一转移概率和商品间的第一属性差异信息生成预测值向量,以及根据第一属性差异信息生成各商品的每个属性对应的属性差异向量。
向量生成模块403可以包括预测值向量生成子模块,用于:以商品间的第一属性差异信息为自变量,以商品间的第一转移概率为因变量,利用预设的预测模型,预测与第一转移概率对应的第二转移概率;根据第一转移概率和与第一转移概率对应的第二转移概率,生成预测值向量。
向量生成模块403还可以包括属性差异向量生成子模块,用于:根据预设的变换规则,将第一属性差异信息变换为与第一属性差异信息对应的第二属性差异信息;根据第一属性差异信息和与第一属性差异信息对应的第二属性差异信息,生成各商品的每个属性对应的属性差异向量。
第一属性差异信息可以为二进制数值或0到1之间的小数。
属性差异向量生成子模块可以按照如下的预设的变换规则,将第一属性差异信息变换为与第一属性差异信息对应的第二属性差异信息:如果第一属性差异信息为二进制数值,则通过将第一属性差异信息取反,得到与第一属性差异信息对应的第二属性差异信息;如果第一属性差异信息为0到1之间的小数,则根据1与第一属性差异信息的差值得到与第一属性差异信息对应的第二属性差异信息。
属性重要度确定模块404用于根据预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。
属性重要度确定模块404可以通过如下方法确定商品的某个属性的重要度:根据预测值向量与商品的该属性对应的属性差异向量进行内积运算,得到第一内积运算结果;根据预测值向量与该预测值向量自身的内积运算,得到第二内积运算结果;根据第一内积运算结果和第二内积运算结果的比值,确定商品的该属性的重要度。
价值评估模块405用于根据待评估商品的各属性的重要度、待评估商品各属性值对应的销售额、待评估商品所属类别的商品销售总额,评估待评估商品的价值。
待评估商品的某一属性值对应的销售额是指在该待评估商品所属的类别(例如品类)中,具有该属性值的商品对应该属性值的销售额。
价值评估模块405具体用于:将待评估商品的每一属性的重要度分别与待评估商品的该属性值对应的销售额相乘,并将各相乘结果进行加和;将加和的结果与待评估商品所属类别的商品销售总额的比值,得到待评估商品的价值对应的数值。
本发明实施例的数据处理装置能够量化不同属性的重要度,并利用不同属性的重要度来评估新上市商品的价值,克服了现有技术通过问卷调查的方式,调研是否有购买该商品的意愿的缺陷,省时省力,提高评估结果的可靠性。并且,选取具有同品类的具有相同属性的两个商品作为商品组合,得到商品属性的差异信息,能很好地定位参考商品的范围,且不仅考虑相似商品(例如品类相同、属性相同)的销售情况,还考虑到消费者的需求,在确定商品间的第一转移概率时,利用了用户消费行为轨迹数据,从而通过商品间的转移概率可以体现不同商品之间的消费流向,最后利用商品间的转移概率和属性差异信息量化商品属性的重要度,进而评估商品的价值,能精确地指导业务人员的进行商品运营。
在本发明实施例中数据处理装置的具体实施内容,在上面所述数据处理方法中已经详细说明了,故在此重复内容不再说明。
图5示出了可以应用本发明实施例的数据处理方法或数据处理装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如评估结果)反馈给终端设备。
需要说明的是,本发明实施例所提供的数据处理方法一般由服务器505执行,相应地,数据处理装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。图6示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考主要步骤示意图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤示意图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的主要步骤示意图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,主要步骤示意图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或主要步骤示意图中的每个方框、以及框图或主要步骤示意图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括转移概率确定模块401、属性差异信息生成模块402、向量生成模块403、属性重要度确定模块404。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,转移概率确定模块401还可以被描述为“用于根据各商品的交易数据、各商品对应的用户数据确定商品间的第一转移概率的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:根据各商品的交易数据、所述各商品对应的用户数据确定商品间的第一转移概率;根据所述各商品的商品主数据,生成商品间的第一属性差异信息;根据所述第一转移概率和所述第一属性差异信息生成预测值向量,以及根据所述第一属性差异信息生成各商品的每个属性对应的属性差异向量;根据所述预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。
根据本发明实施例的技术方案,基于商品的交易数据、用户数据、商品主数据,量化商品间的转移概率和属性差异,并进而量化商品属性的重要度,然后根据待评估商品的各属性的重要度、待评估商品各属性值对应的销售额、待评估商品所属类别的商品销售总额,评估待评估商品的价值。能够量化不同属性的重要度,并可利用不同属性的重要度来评估新上市商品的价值,省时省力,并能很好地定位参考商品的范围,且不仅考虑相似商品的销售情况,还考虑到消费者的需求,提高评估结果的可靠性,能精确地指导业务人员的进行商品运营。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (20)
1.一种数据处理方法,其特征在于,包括:
根据各商品的交易数据、所述各商品对应的用户数据确定商品间的第一转移概率;
根据所述各商品的商品主数据,生成商品间的第一属性差异信息;
根据所述第一转移概率和所述第一属性差异信息生成预测值向量,以及根据所述第一属性差异信息生成各商品的每个属性对应的属性差异向量;
根据所述预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。
2.根据权利要求1所述的方法,其特征在于,所述用户数据包括用户消费行为轨迹数据,所述各商品的交易数据包括每个商品对应订单的金额以及在各订单中的商品金额,
根据各商品的交易数据、所述各商品对应的用户数据确定商品间的第一转移概率的步骤,包括:
根据同一用户连续订单的两个商品中每个商品对应的订单的金额,以及所述两个商品在各自的订单中的商品金额,确定在所述连续订单中商品间的转移概率消费额,所述连续订单包括第一订单和第二订单,所述两个商品分别属于所述第一订单和所述第二订单;
根据所述用户消费行为轨迹数据,对各用户连续订单中商品间的转移概率消费额进行汇总,并对汇总后的转移概率消费额归一化,得到所述商品间的第一转移概率。
3.根据权利要求1所述的方法,其特征在于,所述商品主数据包括商品的属性信息,
根据所述各商品的商品主数据,生成商品间的第一属性差异信息的步骤,包括:
以相同类别的两个商品作为一个商品组合,且各商品组合具有相同属性,其中,对于每一商品组合,
如果所述商品组合中两个商品的属性值为非数值型变量,则比对该两个商品的属性值是否相同,根据所述比对的结果生成所述商品间的第一属性差异信息;
如果所述商品组合中两个商品的属性值为数值型变量,则计算该两个商品的属性值之间的距离,根据所述两个商品的属性值之间的距离,生成所述商品间的第一属性差异信息。
5.根据权利要求1所述的方法,其特征在于,根据所述第一转移概率和所述第一属性差异信息生成预测值向量的步骤,包括:
以所述第一属性差异信息为自变量,以所述第一转移概率为因变量,利用预设的预测模型,预测与所述第一转移概率对应的第二转移概率;
根据所述第一转移概率和与所述第一转移概率对应的第二转移概率,生成预测值向量。
6.根据权利要求1所述的方法,其特征在于,根据所述第一属性差异信息生成各商品的每个属性对应的属性差异向量的步骤,包括:
根据预设的变换规则,将所述第一属性差异信息变换为与所述第一属性差异信息对应的第二属性差异信息;
根据所述第一属性差异信息和与所述第一属性差异信息对应的第二属性差异信息,生成各商品的每个属性对应的属性差异向量。
7.根据权利要求6所述的方法,其特征在于,所述第一属性差异信息为二进制数值或0到1之间的小数,
按照如下的所述预设的变换规则,将所述第一属性差异信息变换为与所述第一属性差异信息对应的第二属性差异信息:
如果所述第一属性差异信息为二进制数值,则通过将所述第一属性差异信息取反,得到与所述第一属性差异信息对应的第二属性差异信息;
如果所述第一属性差异信息为0到1之间的小数,则根据1与所述第一属性差异信息的差值得到与所述第一属性差异信息对应的第二属性差异信息。
8.根据权利要求1所述的方法,其特征在于,通过如下方法确定商品的某个属性的重要度:
根据所述预测值向量与所述商品的该属性对应的属性差异向量进行内积运算,得到第一内积运算结果;
根据所述预测值向量与该预测值向量自身的内积运算,得到第二内积运算结果;
根据所述第一内积运算结果和所述第二内积运算结果的比值,确定所述商品的该属性的重要度。
9.根据权利要求1所述的方法,其特征在于,根据所述预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度的步骤之后,包括:
根据待评估商品的各属性的重要度、所述待评估商品各属性值对应的销售额、所述待评估商品所属类别的商品销售总额,评估所述待评估商品的价值。
10.一种数据处理装置,其特征在于,包括:
转移概率确定模块,用于根据各商品的交易数据、所述各商品对应的用户数据确定商品间的第一转移概率;
属性差异信息生成模块,用于根据所述各商品的商品主数据,生成商品间的第一属性差异信息;
向量生成模块,用于根据所述第一转移概率和所述第一属性差异信息生成预测值向量,以及根据所述第一属性差异信息生成各商品的每个属性对应的属性差异向量;
属性重要度确定模块,用于根据所述预测值向量、各商品的每个属性对应的属性差异向量,确定所有商品的属性的重要度。
11.根据权利要求10所述的装置,其特征在于,所述用户数据包括用户消费行为轨迹数据,所述各商品的交易数据包括每个商品对应订单的金额以及在各订单中的商品金额,
所述转移概率确定模块还用于:
根据同一用户连续订单的两个商品中每个商品对应的订单的金额,以及所述两个商品在各自的订单中的商品金额,确定在所述连续订单中商品间的转移概率消费额,所述连续订单包括第一订单和第二订单,所述两个商品分别属于所述第一订单和所述第二订单;
根据所述用户消费行为轨迹数据,对各用户连续订单中商品间的转移概率消费额进行汇总,并对汇总后的转移概率消费额归一化,得到所述商品间的第一转移概率。
12.根据权利要求10所述的装置,其特征在于,所述商品主数据包括商品的属性信息,
所述属性差异信息生成模块还用于:
以相同类别的两个商品作为一个商品组合,且各商品组合具有相同属性,其中,对于每一商品组合,
如果所述商品组合中两个商品的属性值为非数值型变量,则比对该两个商品的属性值是否相同,根据所述比对的结果生成所述商品间的第一属性差异信息;
如果所述商品组合中两个商品的属性值为数值型变量,则计算该两个商品的属性值之间的距离,根据所述两个商品的属性值之间的距离,生成所述商品间的第一属性差异信息。
13.根据权利要求12所述的装置,其特征在于,所述属性差异信息生成模块通过如下方法计算两个商品的属性值之间的距离:
所述属性差异信息生成模块根据所述两个商品的属性值之间的距离,通过如下方法生成所述商品间的第一属性差异信息:
14.根据权利要求10所述的装置,其特征在于,所述向量生成模块包括预测值向量生成子模块,用于:
以所述第一属性差异信息为自变量,以所述第一转移概率为因变量,利用预设的预测模型,预测与所述第一转移概率对应的第二转移概率;
根据所述第一转移概率和与所述第一转移概率对应的第二转移概率,生成预测值向量。
15.根据权利要求10所述的装置,其特征在于,所述向量生成模块包括属性差异向量生成子模块,用于:
根据预设的变换规则,将所述第一属性差异信息变换为与所述第一属性差异信息对应的第二属性差异信息;
根据所述第一属性差异信息和与所述第一属性差异信息对应的第二属性差异信息,生成各商品的每个属性对应的属性差异向量。
16.根据权利要求15所述的装置,其特征在于,所述第一属性差异信息为二进制数值或0到1之间的小数,
所述属性差异向量生成子模块按照如下的所述预设的变换规则,将所述第一属性差异信息变换为与所述第一属性差异信息对应的第二属性差异信息:
如果所述第一属性差异信息为二进制数值,则通过将所述第一属性差异信息取反,得到与所述第一属性差异信息对应的第二属性差异信息;
如果所述第一属性差异信息为0到1之间的小数,则根据1与所述第一属性差异信息的差值得到与所述第一属性差异信息对应的第二属性差异信息。
17.根据权利要求10所述的装置,其特征在于,所述属性重要度确定模块通过如下方法确定商品的某个属性的重要度:
根据所述预测值向量与所述商品的该属性对应的属性差异向量进行内积运算,得到第一内积运算结果;
根据所述预测值向量与该预测值向量自身的内积运算,得到第二内积运算结果;
根据所述第一内积运算结果和所述第二内积运算结果的比值,确定所述商品的该属性的重要度。
18.根据权利要求10所述的装置,其特征在于,还包括价值评估模块,用于:
根据待评估商品的各属性的重要度、所述待评估商品各属性值对应的销售额、所述待评估商品所属类别的商品销售总额,评估所述待评估商品的价值。
19.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
20.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811032322.9A CN110880119A (zh) | 2018-09-05 | 2018-09-05 | 一种数据处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811032322.9A CN110880119A (zh) | 2018-09-05 | 2018-09-05 | 一种数据处理方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110880119A true CN110880119A (zh) | 2020-03-13 |
Family
ID=69727565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811032322.9A Pending CN110880119A (zh) | 2018-09-05 | 2018-09-05 | 一种数据处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110880119A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113762996A (zh) * | 2020-06-18 | 2021-12-07 | 北京京东振世信息技术有限公司 | 一种信息生成的方法、装置和存储介质 |
CN117522534A (zh) * | 2024-01-08 | 2024-02-06 | 深圳市卖点科技股份有限公司 | 一种基于物联网的商品智能展示方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427118A (zh) * | 2015-07-23 | 2016-03-23 | 浙江大学 | 一种应用于电子商务的商品销量预测算法 |
CN107169806A (zh) * | 2017-06-29 | 2017-09-15 | 北京京东尚科信息技术有限公司 | 用于确定商品属性对于购买决策的影响度的方法及装置 |
CN107358472A (zh) * | 2017-07-19 | 2017-11-17 | 北京京东尚科信息技术有限公司 | 数据处理方法及装置 |
CN107507039A (zh) * | 2017-09-04 | 2017-12-22 | 北京京东尚科信息技术有限公司 | 数据处理方法及装置 |
-
2018
- 2018-09-05 CN CN201811032322.9A patent/CN110880119A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427118A (zh) * | 2015-07-23 | 2016-03-23 | 浙江大学 | 一种应用于电子商务的商品销量预测算法 |
CN107169806A (zh) * | 2017-06-29 | 2017-09-15 | 北京京东尚科信息技术有限公司 | 用于确定商品属性对于购买决策的影响度的方法及装置 |
CN107358472A (zh) * | 2017-07-19 | 2017-11-17 | 北京京东尚科信息技术有限公司 | 数据处理方法及装置 |
CN107507039A (zh) * | 2017-09-04 | 2017-12-22 | 北京京东尚科信息技术有限公司 | 数据处理方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113762996A (zh) * | 2020-06-18 | 2021-12-07 | 北京京东振世信息技术有限公司 | 一种信息生成的方法、装置和存储介质 |
CN113762996B (zh) * | 2020-06-18 | 2024-04-16 | 北京京东振世信息技术有限公司 | 一种信息生成的方法、装置和存储介质 |
CN117522534A (zh) * | 2024-01-08 | 2024-02-06 | 深圳市卖点科技股份有限公司 | 一种基于物联网的商品智能展示方法及系统 |
CN117522534B (zh) * | 2024-01-08 | 2024-03-29 | 深圳市卖点科技股份有限公司 | 一种基于物联网的商品智能展示方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200250732A1 (en) | Method and apparatus for use in determining tags of interest to user | |
US10181138B2 (en) | System and method for determining retail-business-rule coefficients from current prices | |
US9846885B1 (en) | Method and system for comparing commercial entities based on purchase patterns | |
CN109840730B (zh) | 用于数据预测的方法及装置 | |
CN110348921B (zh) | 门店物品选取的方法和装置 | |
CN112016796B (zh) | 综合风险评分请求处理方法、装置及电子设备 | |
CN113095893A (zh) | 确定物品销量的方法和装置 | |
US20190220909A1 (en) | Collaborative Filtering to Generate Recommendations | |
CN112446764A (zh) | 游戏商品推荐方法、装置及电子设备 | |
CN107679916A (zh) | 用于获取用户兴趣度的方法及装置 | |
CN111626804A (zh) | 商品推荐方法、装置、电子设备及计算机可读介质 | |
CN110866625A (zh) | 促销指标信息生成方法和装置 | |
WO2022156589A1 (zh) | 一种直播点击率的确定方法和装置 | |
CN111612385B (zh) | 一种对待配送物品进行聚类的方法和装置 | |
CN110880119A (zh) | 一种数据处理方法和装置 | |
CN109978306B (zh) | 数据处理方法及装置 | |
CN113781106A (zh) | 商品运营数据分析方法、装置、设备及计算机可读介质 | |
CN110490682B (zh) | 分析商品属性的方法和装置 | |
CN112348590A (zh) | 一种物品价值确定方法、装置、电子设备和存储介质 | |
CN113360816A (zh) | 点击率预测的方法和装置 | |
US20120265588A1 (en) | System and method for recommending new connections in an advertising exchange | |
CN115293291A (zh) | 排序模型的训练方法、排序方法、装置、电子设备及介质 | |
CN110544140A (zh) | 一种处理浏览数据的方法和装置 | |
CN109961307A (zh) | 面向对象的评估方法和装置 | |
CN110738538B (zh) | 识别相似物品的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |