CN110968670A - 一种流行商品的属性获取方法、装置、设备及存储介质 - Google Patents

一种流行商品的属性获取方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110968670A
CN110968670A CN201911214057.0A CN201911214057A CN110968670A CN 110968670 A CN110968670 A CN 110968670A CN 201911214057 A CN201911214057 A CN 201911214057A CN 110968670 A CN110968670 A CN 110968670A
Authority
CN
China
Prior art keywords
popular
information
commodity
commodities
popularity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911214057.0A
Other languages
English (en)
Other versions
CN110968670B (zh
Inventor
李兆钧
雷小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chuangyou Digital Technology Guangdong Co Ltd
Original Assignee
Miniso Hengqin Enterprise Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miniso Hengqin Enterprise Management Co ltd filed Critical Miniso Hengqin Enterprise Management Co ltd
Priority to CN201911214057.0A priority Critical patent/CN110968670B/zh
Publication of CN110968670A publication Critical patent/CN110968670A/zh
Application granted granted Critical
Publication of CN110968670B publication Critical patent/CN110968670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种流行商品的属性获取方法、装置、设备及存储介质,其中方法包括:基于待分析商品的热销榜单,获取所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,所述评论信息包括:评论内容和评论数据;根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品;根据所述流行商品所述评论内容和所述商品信息,确定所述流行商品的流行特征;根据所有所述流行商品的流行特征,确定所述流行商品的流行属性,从而解决了现有的方法没有对流行商品的流行属性进行分析,无法借助于流行商品对商品开发进行指导的技术问题。

Description

一种流行商品的属性获取方法、装置、设备及存储介质
技术领域
本申请涉及电子商务技术领域,尤其涉及一种流行商品的属性获取方法、装置、设备及存储介质。
背景技术
随着电子商务的不断兴起,根据大众喜爱度进行商品的设计,在一定程度上可以提高商品的销售量。
现有大众喜爱度的分析一般是在流行商品上进行分析,得到流行商品后,向用户推荐流行商品。但这种分析方法仅仅只向用户推荐了流行商品,并没有对流行商品的属性进行分析,然而实际上对流行商品的流行属性进行分析可以对商品开发起到重要的指导意义。
发明内容
本申请提供了一种流行商品的属性获取方法、装置、设备及存储介质,解决了现有的方法没有对流行商品的流行属性进行分析,无法借助于流行商品对商品开发进行指导的技术问题。
有鉴于此,本申请第一方面提供了一种流行商品的属性获取方法,包括:
基于待分析商品的热销榜单,获取所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,所述评论信息包括:评论内容和评论数据;
根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品;
根据所述流行商品的所述评论内容和所述商品信息,确定所述流行商品的流行特征;
根据所有所述流行商品的流行特征,确定所述流行商品的流行属性。
可选地,所述基于待分析商品的热销榜单,获取所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息具体包括:
在预置时间段内,当待分析商品的热销榜单发生变化后,获取变化后的所述热销榜单;
获取每一所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息。
可选地,根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品具体包括:
根据各所述热销榜单中的名次信息、所述评分信息和所述评论数量,得到各热销榜单中各商品的综合评分;
将所有所述热销榜单中各商品的综合评分求取平均值,得到各商品对应的实际综合评分;
选取预置数量个所述实际综合评分最高的商品作为所述流行商品。
可选地,所述根据所述流行商品的所述评论内容和所述商品信息,确定所述流行商品的流行特征具体包括:
对各所述流行商品的评论内容进行文本挖掘,确定对应的流行特征标题;
根据各所述流行商品的商品信息对流行特征标题进行赋值后,得到对应的流行特征。
可选地,所述根据所有所述流行商品的流行特征,确定所述流行商品的流行属性具体包括:
根据各流行商品的实际综合评分对所述流行特征进行赋值后,得到各流行特征的得分信息;
根据所述得分信息,确定各流行特征对应的流行概率,并将所述流行概率作为所述流行属性。
可选地,所述根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品具体包括:
根据所述名次信息、所述评分信息和所述评论数量,得到所述热销榜单中各商品的综合评分;
在所述热销榜单中,选取预置数量个所述综合评分最高的商品作为所述待分析商品的流行商品。
可选地,所述根据所述名次信息、所述评分信息和所述评论数量,得到所述热销榜单中各商品的综合评分具体包括:
基于幂律分布算法,将所述热销榜单中各商品的名次信息转换为对应的榜单得分;
将各所述商品对应的榜单得分和评分信息相乘,得到对应的得分信息;
基于第一预置公式,根据所述得分信息和所述评论数量,得到各商品对应的综合评分,其中,所述第一预置公式为:
score=k/xk×r×log n,
式中,score为综合评分,k为常数,x为名次信息,r是评分,n为评论数量。
本申请第二方面提供了一种流行商品的属性获取装置,包括:
获取单元,用于基于待分析商品的热销榜单,获取所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,所述评论信息包括:评论内容和评论数据;
流行商品确定单元,用于根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品;
流行特征确定单元,用于根据所述流行商品的所述评论内容和所述商品信息,确定所述流行商品的流行特征;
流行属性确定单元,用于根据所有所述流行商品的流行特征,确定所述流行商品的流行属性。
本申请第三方面提供了一种流行商品的属性获取设备,包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所述的流行商品的属性获取方法。
本申请第四方面提供了一种存储介质,所述存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的流行商品的属性获取方法。
从以上技术方案可以看出,本申请具有以下优点:
本申请中,提供了一种流行商品的属性获取方法,包括:基于待分析商品的热销榜单,获取所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,所述评论信息包括:评论内容和评论数据;根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品;根据所述流行商品的所述评论内容和所述商品信息,确定所述流行商品的流行特征;根据所有所述流行商品的流行特征,确定所述流行商品的流行属性。
本申请中,从待分析商品的热销榜单中获取各商品的名次信息、评分信息、评论信息和商品信息,根据这三个信息进行流行商品的确定,然后再根据评论内容和商品信息确定流行商品的流行特征,最后根据流行特征确定流行商品的流行属性,相较于现有的流行商品分析方法,本申请中不仅获取了流行商品,还确定了流行商品的流行属性,后续开发人员可以根据该流行属性进行商品开发,从而解决了现有的方法没有对流行商品的流行属性进行分析,无法借助于流行商品对商品开发进行指导的技术问题。
附图说明
图1为本申请第一个实施例提供的一种流行商品的属性获取方法的流程示意图;
图2为本申请第二个实施例提供的一种流行商品的属性获取方法的流程示意图;
图3为本申请第三个实施例提供的一种流行商品的属性获取方法的流程示意图;
图4为本申请实施例中商品结构化页面示意图;
图5为本申请实施例提供的一种流行商品的属性获取装置的结构示意图。
具体实施方式
本申请实施例提供了一种流行商品的属性获取方法、装置、设备及存储介质,解决了现有的方法没有对流行商品的流行属性进行分析,无法借助于流行商品对商品开发进行指导的技术问题。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为此,可以参见图1,图1为本申请第一个实施例提供的流行商品的属性获取方法的流程示意图,该方法包括:
步骤101、基于待分析商品的热销榜单,获取热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,评论信息包括:评论内容和评论数据。
待分析榜单的获取,可以是现有的电子商务网站上获取的,例如可以在某宝或某马逊上获取毛巾的热销榜单,然后基于该榜单,获取热销榜单中各商品的名次信息、评分信息、评论信息和商品信息。
步骤102、根据名次信息、评分信息、评论数量,确定待分析商品的流行商品。
在获取到名次信息、评分信息和评论信息后,可以确定该待分析商品的流行商品。
步骤103、根据流行商品的评论内容和商品信息,确定流行商品的流行特征。
在确定流行商品后,根据流行商品的评论内容和商品信息,确定流行商品的流行特征。
步骤104、根据所有流行商品的流行特征,确定流行商品的流行属性。
本实施例中,从待分析商品的热销榜单中获取各商品的名次信息、评分信息、评论信息和商品信息,根据这三个信息进行流行商品的确定,然后再根据评论内容和商品信息确定流行商品的流行特征,最后根据流行特征确定流行商品的流行属性,相较于现有的流行商品分析方法,本申请中不仅获取了流行商品,还确定了流行商品的流行属性,后续开发人员可以根据该流行属性进行商品开发,从而解决了现有的方法没有对流行商品的流行属性进行分析,无法借助于流行商品对商品开发进行指导的技术问题。
以上为本申请第一个实施例提供的流行商品的属性获取方法。下面请参见图2,图2为本申请第二个实施例提供的流行商品的属性获取方法的流程示意图,该方法包括:
步骤201、基于待分析商品的热销榜单,获取热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,评论信息包括:评论内容和评论数据。
步骤202、根据名次信息、评分信息和评论数量,得到热销榜单中各商品的综合评分。
根据名次信息、评分信息和评论数量,得到热销榜单中各商品的综合评分具体包括:
基于幂律分布算法,将热销榜单中各商品的名次信息转换为对应的榜单得分;
将各商品对应的榜单得分和评分信息相乘,得到对应的得分信息;
基于第一预置公式,根据得分信息和评论数量,得到各商品对应的综合评分,其中,第一预置公式为:
score=k/xk×r×log n,
式中,score为综合评分,k为常数,x为名次信息,r是评分,n为评论数量。
需要说明的是,由于名次信息是无法直接相加的,需要将热销榜单上的名次信息转化为榜单得分,本实施例选用幂律分布,是考虑到现实销售所存在的“二八定律”,即“20%的商品贡献了80%的销售额”。因此,非线性的幂律分布函数更适合表达销售的现实情况,排名越靠前的榜单得分的越高。为了使得热销榜单的前20名商品的总得分约占热销榜单前100名商品总得分的80%,幂律分布函数y=k/xk里的k可以选取1.2。
在得到榜单得分时,是基于同榜单内的商品进行比较得到的,在同一个大类下的各个榜单之间,其排名及分数是无法直接比较的,因为各个榜单排位相同的几个商品其热销程度必不会完全一致。为了在各个榜单之间具有可比较性,考虑到各个商品的评分,将得到的榜单得分和评分信息相乘,得到得分信息。
考虑到不同榜单上两个相同排位的商品,它们的评分是一样的,但其中一个商品的评论数量为10,另外一个商品的评论数量为100,可以认为,后者的“置信度”更高,不过得分信息计算中没有考虑评论数量的影响。为了考虑评论数量的影响,可以将评论数量简单乘以得分信息。不过会存在问题:评论数量相差10倍,分数也将相差10倍,而步骤2.2用到的评分,其差别很少会相差两倍以上,因此造成评论数量这个因素占优的问题。为了解决此问题,对评分进行对数运算,将数量级上的差距转化为倍数的差距,从而与评价分数的变化范围对齐。
步骤203、在热销榜单中,选取预置数量个综合评分最高的商品作为待分析商品的流行商品。
需要说明的是,预置数量可以根据需要进行设置,在此不再赘述。
步骤204、根据流行商品评论内容和商品信息,确定流行商品的流行特征。
步骤205、根据所有流行商品的流行特征,确定流行商品的流行属性。
本实施例中,从待分析商品的热销榜单中获取各商品的名次信息、评分信息、评论信息和商品信息,根据这三个信息进行流行商品的确定,然后再根据评论内容和商品信息确定流行商品的流行特征,最后根据流行特征确定流行商品的流行属性,相较于现有的流行商品分析方法,本申请中不仅获取了流行商品,还确定了流行商品的流行属性,后续开发人员可以根据该流行属性进行商品开发,从而解决了现有的方法没有对流行商品的流行属性进行分析,无法借助于流行商品对商品开发进行指导的技术问题。
以上为本申请第二个实施例提供的流行商品的属性获取方法。下面请参见图3,图3为本申请第二个实施例提供的流行商品的属性获取方法的流程示意图,该方法包括:
步骤301、在预置时间段内,当待分析商品的热销榜单发生变化后,获取变化后的热销榜单。
如果只考虑这一次的榜单数据,就会丢失很多有用的信息。为了解决此问题,可以在一个时间段内多次采集榜单数据,此时间段就是预置时间段,一般可以选取7天、14天等,而采集时刻可以选取热销榜单的变更时间等。
步骤302、获取每一热销榜单中各商品的名次信息、评分信息、评论信息和商品信息。
步骤303、根据各热销榜单中的名次信息、评分信息和评论数量,得到各热销榜单中各商品的综合评分。
对于综合评分的计算可以参见上述实施例二的描述,在此不再赘述。
步骤304、将所有热销榜单中各商品的综合评分求取平均值,得到各商品对应的实际综合评分。
步骤305、选取预置数量个实际综合评分最高的商品作为流行商品。
步骤306、对各流行商品的评论内容进行文本挖掘,确定对应的流行特征标题。
考虑到商品的评论内容是消费者最直接的观点表达,因此可以认为评论内容中涉及的商品特征是消费者最为关心的特征,在步骤305中得到的流行商品,利用文本挖掘技术,可以得到商品的流行特征标题。
文本挖掘的方法可以是如下步骤:
步骤一、对评论文本数据进行文本过滤(确定具有评论内容的评论)、清除噪声及广告文本、分词等操作,得到评论分词。
步骤二、将步骤一得到的分词,利用词向量算法转换为词向量。
步骤三、对步骤三得到的词向量进行聚类分析,对各个聚类簇观察对应的词条,将词条进行归类。如将词条“颜色”、“色彩”、“色泽”这几个词成为一个聚类簇,那么这个聚类簇可以认为是“颜色”这种商品特征的流行特征标题。
步骤四、对聚类簇进行归纳,得到商品的候选流行特征标题集合。例如,对于毛巾商品,得到的流行特征标题集合为{颜色,花纹,价格,材质,尺寸}。
步骤307、根据各流行商品的商品信息对流行特征标题进行赋值后,得到对应的流行特征。
需要说明的是,对于可以直接在商品结构化信息页面上取值的类别变量特征(如图4),例如一般电商网站的商品详情页面上,会有“颜色”、“尺寸”、“材质”等的信息,这种信息可以通过网页解析技术获取。
对于可以直接在商品结构化信息页面上取值的数值变量特征(如图4),例如一般电商网站的商品详情页面上,会有“价格”等的信息,这种信息可以通过网页解析技术获取。不过对于数值变量,需要经过分箱处理,否则各种离散的数值对后续步骤的分析带来影响。例如对于价格,按照业务经验对价格进行分箱,例如划分为“0-10元”、“10-20元”、“20-50元”、“50元以上”这几个分箱,然后对每个商品的具体价格数值分别取对应的分箱。
对于可以不能直接在商品结构化信息页面上取值的特征,例如毛巾的“花纹”等的信息,一般在电商网站上的结构化信息是没有的,这种信息可以通过模板信息抽取技术对用户评论进行文本挖掘来获取。
步骤308、根据各流行商品的实际综合评分对流行特征进行赋值后,得到各流行特征的得分信息。
步骤309、根据得分信息,确定各流行特征对应的流行概率,并将流行概率作为流行属性。
本实施例中,从待分析商品的热销榜单中获取各商品的名次信息、评分信息、评论信息和商品信息,根据这三个信息进行流行商品的确定,然后再根据评论内容和商品信息确定流行商品的流行特征,最后根据流行特征确定流行商品的流行属性,相较于现有的流行商品分析方法,本申请中不仅获取了流行商品,还确定了流行商品的流行属性,后续开发人员可以根据该流行属性进行商品开发,从而解决了现有的方法没有对流行商品的流行属性进行分析,无法借助于流行商品对商品开发进行指导的技术问题。
以上为本申请第三个实施例提供的流行商品的属性获取方法。下面请参见图4,图4为本申请实施例提供的流行商品的属性获取方法的应用例示意图,该方法包括:
1、从某马逊电商平台上采集毛巾的热销榜单,并将该热销榜单上商品的商品信息、名次信息、评分信息和评论信息同时采集。
2、利用步骤1采集数据,计算热销榜单上各商品的综合评分,详细步骤如下:
2.1.将热销榜单上的名次信息转化为榜单得分,以幂律分布函数y=k/xk作为转换函数,其中,x为商品的榜单中的名次信息,y为榜单得分。
2.2.在步骤2.1中得到的榜单得分乘以该商品的评分:y×r,其中y是榜单得分,r是评分。
2.3.对评分进行对数运算,然后乘以步骤2.2的分数:y×r×log n,其中n是评论数量,得到的综合评分为score=k/xk×r×log n。
3、在预置时间段内,当待分析商品的热销榜单发生变化后,获取变化后的热销榜单,获取每一热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,利用步骤2计算出综合评价分数,并进行求平均处理得到实际综合评分。
4、利用步骤3中得到的评分,对商品进行排序,选取评分最高的前100名商品,作为流行商品。
5、对步骤4中得到的流行商品的评论内容进行文本挖掘,可以得到商品的流行特征标题,例如,对于毛巾商品,得到的流行特征标题集合为{颜色,花纹,价格,功能,尺寸}。
6、本应用例中还对步骤5得到的流行特征集合进行筛选,最终确定真实的流行特征标题集合。
例如,步骤5得到的流行特征标题集合为{颜色,花纹,价格,功能,尺寸},经步骤6确定的最终的流行特征集合为{颜色,花纹,价格,尺寸,材质}。
7、对每个商品,按照步骤6确定的流行特征标题集合中的每个流行特征标题进行赋值后,得到流行特征。
8、利用步骤7的方法对步骤4得到的所有流行商品进行处理后,得到流行特征,并对每个流行特征,将商品的实际综合评分赋值给该流行特征。
例如,以“颜色”举例,赋值后的流行特征为:
商品名称 评分 颜色
商品1 9.36 红色
商品2 8.59 红色
商品3 8.52 黄色
商品4 4.91 蓝色
商品5 4.25 黄色
商品6 3.63 蓝色
商品7 3.26 红色
商品8 2.51 蓝色
商品9 1.48 蓝色
商品10 1.15 黄色
然后将同一流行特征取值进行汇总,将评分进行累加后再进行归一化变换,得到该流行特征下各个取值的评分。对“颜色”特征标题进行评分汇总,得到:红色=21.21,黄色=13.92,蓝色=12.53。
然后对各流行特征评分进行归一化变换,变换的目的是为了使其之和为1,因此具有概率的意义,方便后续应用作为概率进行计算。归一化变换的公式为:
Figure BDA0002298981410000111
式中,n是颜色流行特征的数量,si、sk是归一化变换前的评分,Si是归一化变换后的评分。
按照上面的例子,计算出的归一化评分为:
Figure BDA0002298981410000112
9、利用步骤8的方法对各个特征的取值进行评分,作为商品流行属性,可以根据此流行属性计算商品各种属性组合的流行概率。
例如,对毛巾商品的流行特征集合为{颜色,花纹},对其进行流行属性计算,得到:
颜色特征,有红色=0.445,黄色=0.292,蓝色=0.263。
花纹特征,有条纹=0.521,方格=0.325,纯色=0.154。
以下为流行属性的计算结果:
红色 黄色 蓝色
条纹 0.232 0.145 0.069
方格 0.152 0.095 0.045
纯色 0.137 0.085 0.041
如果根据流行属性的结果选择三种组合来推出新商品,可以根据组合的流行概率选择最高的前三个组合:(红色,条纹)、(红色,方格)、(黄色,条纹)。这里以两种特征作为举例,更多数量的特征也是同样的计算方式。
以上是本申请实施例提供的流行商品的属性获取方法的应用例。下面请参见图5,图5为本申请第三个实施例提供的流行商品的属性获取装置的结构示意图,该装置包括:
获取单元501,用于基于待分析商品的热销榜单,获取热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,评论信息包括:评论内容和评论数据;
流行商品确定单元502,用于根据名次信息、评分信息、评论数量,确定待分析商品的流行商品;
流行特征确定单元503,用于根据流行商品的评论内容和商品信息,确定流行商品的流行特征;
流行属性确定单元504,用于根据所有流行商品的流行特征,确定流行商品的流行属性。
本实施例中,从待分析商品的热销榜单中获取各商品的名次信息、评分信息、评论信息和商品信息,根据这三个信息进行流行商品的确定,然后再根据评论内容和商品信息确定流行商品的流行特征,最后根据流行特征确定流行商品的流行属性,相较于现有的流行商品分析方法,本申请中不仅获取了流行商品,还确定了流行商品的流行属性,后续开发人员可以根据该流行属性进行商品开发,从而解决了现有的方法没有对流行商品的流行属性进行分析,无法借助于流行商品对商品开发进行指导的技术问题。
本申请实施还提供了一种综流行商品的属性获取设备,包括处理器以及存储器;存储器用于存储程序代码,并将程序代码传输给处理器;处理器用于根据程序代码中的指令执行第一实施例或第二实施例或第三实施例的流行商品的属性获取方法。
本申请实施例还提供了一种存储介质,存储介质用于存储程序代码,程序代码用于执行执行第一实施例或第二实施例或第三实施例的流行商品的属性获取方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种流行商品的属性获取方法,其特征在于,包括:
基于待分析商品的热销榜单,获取所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,所述评论信息包括:评论内容和评论数据;
根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品;
根据所述流行商品的所述评论内容和所述商品信息,确定所述流行商品的流行特征;
根据所有所述流行商品的流行特征,确定所述流行商品的流行属性。
2.根据权利要求1所述的流行商品的属性获取方法,其特征在于,所述基于待分析商品的热销榜单,获取所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息具体包括:
在预置时间段内,当待分析商品的热销榜单发生变化后,获取变化后的所述热销榜单;
获取每一所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息。
3.根据权利要求2所述的流行商品的属性获取方法,其特征在于,根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品具体包括:
根据各所述热销榜单中的名次信息、所述评分信息和所述评论数量,得到各热销榜单中各商品的综合评分;
将所有所述热销榜单中各商品的综合评分求取平均值,得到各商品对应的实际综合评分;
选取预置数量个所述实际综合评分最高的商品作为所述流行商品。
4.根据权利要求3所述的流行商品的属性获取方法,其特征在于,所述根据所述流行商品的所述评论内容和所述商品信息,确定所述流行商品的流行特征具体包括:
对各所述流行商品的评论内容进行文本挖掘,确定对应的流行特征标题;
根据各所述流行商品的商品信息对流行特征标题进行赋值后,得到对应的流行特征。
5.根据权利要求4所述的流行商品的属性获取方法,其特征在于,所述根据所有所述流行商品的流行特征,确定所述流行商品的流行属性具体包括:
根据各流行商品的实际综合评分对所述流行特征进行赋值后,得到各流行特征的得分信息;
根据所述得分信息,确定各流行特征对应的流行概率,并将所述流行概率作为所述流行属性。
6.根据权利要求1所述的流行商品的属性获取方法,其特征在于,所述根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品具体包括:
根据所述名次信息、所述评分信息和所述评论数量,得到所述热销榜单中各商品的综合评分;
在所述热销榜单中,选取预置数量个所述综合评分最高的商品作为所述待分析商品的流行商品。
7.根据权利要求6所述的流行商品的属性获取方法,其特征在于,所述根据所述名次信息、所述评分信息和所述评论数量,得到所述热销榜单中各商品的综合评分具体包括:
基于幂律分布算法,将所述热销榜单中各商品的名次信息转换为对应的榜单得分;
将各所述商品对应的榜单得分和评分信息相乘,得到对应的得分信息;
基于第一预置公式,根据所述得分信息和所述评论数量,得到各商品对应的综合评分,其中,所述第一预置公式为:
score=k/xk×r×log n,
式中,score为综合评分,k为常数,x为名次信息,r是评分,n为评论数量。
8.一种流行商品的属性获取装置,其特征在于,包括:
获取单元,用于基于待分析商品的热销榜单,获取所述热销榜单中各商品的名次信息、评分信息、评论信息和商品信息,所述评论信息包括:评论内容和评论数据;
流行商品确定单元,用于根据所述名次信息、所述评分信息、所述评论数量,确定所述待分析商品的流行商品;
流行特征确定单元,用于根据所述流行商品的所述评论内容和所述商品信息,确定所述流行商品的流行特征;
流行属性确定单元,用于根据所有所述流行商品的流行特征,确定所述流行商品的流行属性。
9.一种流行商品的属性获取设备,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1至7中任一项所述的流行商品的属性获取方法。
10.一种存储介质,其特征在于,所述存储介质用于存储程序代码,所述程序代码用于执行权利要求1至7中任一项所述的流行商品的属性获取方法。
CN201911214057.0A 2019-12-02 2019-12-02 一种流行商品的属性获取方法、装置、设备及存储介质 Active CN110968670B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911214057.0A CN110968670B (zh) 2019-12-02 2019-12-02 一种流行商品的属性获取方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911214057.0A CN110968670B (zh) 2019-12-02 2019-12-02 一种流行商品的属性获取方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110968670A true CN110968670A (zh) 2020-04-07
CN110968670B CN110968670B (zh) 2022-09-27

Family

ID=70032543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911214057.0A Active CN110968670B (zh) 2019-12-02 2019-12-02 一种流行商品的属性获取方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110968670B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666251A (zh) * 2020-05-26 2020-09-15 上海连尚网络科技有限公司 一种用于提供阅读模式的方法与设备
CN113706246A (zh) * 2021-08-27 2021-11-26 和元达信息科技有限公司 一种网购平台店铺巡查方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130339434A1 (en) * 2012-06-19 2013-12-19 Microsoft Corporation Automatically Generating Music Marketplace Editorial Content
CN104281890A (zh) * 2014-10-08 2015-01-14 电子科技大学 电子商务系统中预测流行商品的方法和系统
CN104408648A (zh) * 2014-12-09 2015-03-11 北京博雅立方科技有限公司 一种挑选商品的方法及装置
CN107609960A (zh) * 2017-10-18 2018-01-19 口碑(上海)信息技术有限公司 推荐理由生成方法及装置
CN108230085A (zh) * 2017-11-27 2018-06-29 重庆邮电大学 一种基于用户评论的商品评价系统及方法
CN108491377A (zh) * 2018-03-06 2018-09-04 中国计量大学 一种基于多维度信息融合的电商产品综合评分方法
CN109255676A (zh) * 2018-08-14 2019-01-22 平安科技(深圳)有限公司 商品推荐方法、装置、计算机设备及存储介质
CN109272390A (zh) * 2018-10-08 2019-01-25 中山大学 融合评分和标签信息的个性化推荐方法
US10394804B1 (en) * 2015-10-08 2019-08-27 Intuit Inc. Method and system for increasing internet traffic to a question and answer customer support system
US20210248624A1 (en) * 2013-04-11 2021-08-12 Brandshield Ltd. System, Device, and Method of Protecting Brand Names

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130339434A1 (en) * 2012-06-19 2013-12-19 Microsoft Corporation Automatically Generating Music Marketplace Editorial Content
US20210248624A1 (en) * 2013-04-11 2021-08-12 Brandshield Ltd. System, Device, and Method of Protecting Brand Names
CN104281890A (zh) * 2014-10-08 2015-01-14 电子科技大学 电子商务系统中预测流行商品的方法和系统
CN104408648A (zh) * 2014-12-09 2015-03-11 北京博雅立方科技有限公司 一种挑选商品的方法及装置
US10394804B1 (en) * 2015-10-08 2019-08-27 Intuit Inc. Method and system for increasing internet traffic to a question and answer customer support system
CN107609960A (zh) * 2017-10-18 2018-01-19 口碑(上海)信息技术有限公司 推荐理由生成方法及装置
CN108230085A (zh) * 2017-11-27 2018-06-29 重庆邮电大学 一种基于用户评论的商品评价系统及方法
CN108491377A (zh) * 2018-03-06 2018-09-04 中国计量大学 一种基于多维度信息融合的电商产品综合评分方法
CN109255676A (zh) * 2018-08-14 2019-01-22 平安科技(深圳)有限公司 商品推荐方法、装置、计算机设备及存储介质
CN109272390A (zh) * 2018-10-08 2019-01-25 中山大学 融合评分和标签信息的个性化推荐方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666251A (zh) * 2020-05-26 2020-09-15 上海连尚网络科技有限公司 一种用于提供阅读模式的方法与设备
CN111666251B (zh) * 2020-05-26 2023-09-15 上海连尚网络科技有限公司 一种用于提供阅读模式的方法与设备
CN113706246A (zh) * 2021-08-27 2021-11-26 和元达信息科技有限公司 一种网购平台店铺巡查方法

Also Published As

Publication number Publication date
CN110968670B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
CN103718212B (zh) 颜色确定装置、颜色确定系统和颜色确定方法
CN103778214B (zh) 一种基于用户评论的商品属性聚类方法
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
CN107894998B (zh) 视频推荐方法及装置
CN108694647B (zh) 一种商户推荐理由的挖掘方法及装置,电子设备
CN106611344A (zh) 挖掘潜在客户的方法及装置
CN106959966A (zh) 一种信息推荐方法及系统
CN107004203A (zh) 信息处理系统以及方法
CN105468649B (zh) 一种待展示对象匹配的判断方法及其装置
CN107256513A (zh) 一种对象的搭配推荐方法及装置
CN110197404A (zh) 可降低流行度偏差的个性化长尾商品推荐方法和系统
CN108268880A (zh) 一种行业类别的识别方法及装置
CN108229826A (zh) 一种基于改进贝叶斯算法的网购风险等级评估方法
CN110968670B (zh) 一种流行商品的属性获取方法、装置、设备及存储介质
CN111626767A (zh) 资源数据的发放方法、装置及设备
CN106997350A (zh) 一种数据处理的方法及装置
CN111177581A (zh) 一种基于多平台的社交电商网站商品推荐方法及装置
CN104572623B (zh) 一种在线lda模型的高效数据总结分析方法
CN110020918B (zh) 一种推荐信息生成方法和系统
CN106919609B (zh) 产品信息推送方法和装置
CN111611469A (zh) 标识信息确定方法及装置、电子设备和存储介质
Wu et al. [Retracted] Using the Mathematical Model on Precision Marketing with Online Transaction Data Computing
CN111639989B (zh) 商品推荐方法和可读存储介质
CN112632275B (zh) 基于个人文本信息的人群聚类数据处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201123

Address after: Room 011, first floor, no.2429, Xingang East Road, Haizhu District, Guangzhou City, Guangdong Province (office only)

Applicant after: CHUANGYOU digital technology (Guangdong) Co.,Ltd.

Address before: Room 205, 2f office, No.156, nanshanzui Road, Hengqin, Zhuhai City, Guangdong Province

Applicant before: MINISO (HENGQIN) ENTERPRISE MANAGEMENT Co.,Ltd.

GR01 Patent grant
GR01 Patent grant