CN110619547A - 确定网红商户的方法、装置、电子设备及存储介质 - Google Patents

确定网红商户的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110619547A
CN110619547A CN201910883069.6A CN201910883069A CN110619547A CN 110619547 A CN110619547 A CN 110619547A CN 201910883069 A CN201910883069 A CN 201910883069A CN 110619547 A CN110619547 A CN 110619547A
Authority
CN
China
Prior art keywords
merchant
red
determining
merchants
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910883069.6A
Other languages
English (en)
Inventor
张国良
陈冬冬
梁思
唐倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Publication of CN110619547A publication Critical patent/CN110619547A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种确定网红商户的方法、装置、电子设备及存储介质,该方法包括:获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子;根据所述关键计算因子设置识别网红商户的计算模型;根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果;根据所述计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户。本申请实现了自动识别网红商户,不再依赖于人工识别,提高了识别效率,而且依据各个商户的得分排序来确定是否为网红商户,不再依赖于人工的主观判断,提高了网红商户确定的准确性。

Description

确定网红商户的方法、装置、电子设备及存储介质
本申请要求在2019年5月30日提交中国专利局、申请号为201910465426.7、发明名称为“确定网红商户的方法、装置、电子设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及计算机技术领域,特别是涉及一种确定网红商户的方法、装置、电子设备及存储介质。
背景技术
随着目前餐饮娱乐市场的细化和发展,越来越多年轻人对于餐饮娱乐的选择偏向“网红元素”,网红商户近年来受到越来越多人关注,但是目前还没有特别有权威性的对于网红商户的识别方法和推荐渠道。
现有技术中,关于网红商户的识别或推荐,主要依赖于人工识别。依赖人工的方式进行识别,效率较低。
发明内容
本申请提供一种确定网红商户的方法、装置、电子设备及存储介质,有助于提高识别效率及准确性。
为了解决上述问题,第一方面,本申请实施例提供了一种确定网红商户的方法,包括:
获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子;
根据所述关键计算因子设置识别网红商户的计算模型;
根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果;
根据所述计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户。
第二方面,本申请实施例提供了一种确定网红商户的装置,包括:
数据获取模块,用于获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子;
计算模型设置模块,用于根据所述关键计算因子设置识别网红商户的计算模型;
计算结果获得模块,用于根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果;
网红商户确定模块,用于根据所述计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户。
第三方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的确定网红商户的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的确定网红商户的方法的步骤。
本申请实施例公开的确定网红商户的方法、装置、电子设备及存储介质,通过获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子,根据关键计算因子设置识别网红商户的计算模型,根据所述计算模型获得计算结果,根据计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户,实现了自动识别网红商户,不再依赖于人工识别,提高了识别效率,而且依据各个商户的得分排序来确定是否为网红商户,不再依赖于人工的主观判断,提高了网红商户确定的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一提供的确定网红商户的方法的流程图;
图2是本申请实施例二提供的确定网红商户的方法的流程图;
图3是本申请实施例三提供的确定网红商户的方法的流程图;
图4是本申请实施例四提供的确定网红商户的方法的流程图;
图5是本申请实施例五提供的确定网红商户的方法的流程图;
图6是本申请实施例六提供的确定网红商户的装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本实施例公开的一种确定网红商户的方法,如图1所示,该方法包括:步骤110至步骤140。
步骤110,获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子。
其中,统计周期是从当前时间往前推算的时间周期,例如,统计周期可以是例如过去6个月或者过去6周等。所述商户是创建有POI(Point of Interest,兴趣点)的商户,在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒或一个公交站等,在本申请实施例中,POI是一种标记商户和地理位置的名称统称。用户访问数据可以是某个商户的独立访客(UV)量。用户评论数据是指用户的评论内容数据,是用户原创内容(User GeneratedContent,UGC)。
获取所有具有POI的商户在统计周期内每一天的用户访问数据和用户评论数据。根据用户访问数据和用户评论数据获得关键计算因子的值。
其中,所述关键计算因子包括:网红关键词提及率、预设周期访客量增幅、预设周期访客量增幅的平均值、访客量极差和/或预设周期访客量均值,其中,所述统计周期包括至少两个预设周期。预设周期例如可以是一周。网红关键词提及率是指某一商户的用户评论数据中提及网络关键词的评论数量占该商户的所有评论数量的比例。预设周期访客量增幅是指每个预设周期相对于该预设周期的前一个预设周期的访客量的增幅。预设周期访客量增幅的平均值是在统计周期内,预设周期访客量增幅的平均值。访客量极差是指统计周期内预设周期访客量的最大值与预设周期访客量的最小值之差。预设周期访客量均值是指统计周期内的每个预设周期的访客量在统计周期内的均值。
在本申请的一些实施例中,所述根据所述用户访问数据和用户评论数据,确定所述商户的关键计算因子的步骤,包括:
根据所述商户的所述用户评论数据,确定包括网红关键词的评论的数量,并确定用户评论的总数量,并根据所述包括网红关键词的评论的数量和所述用户评论的总数量,按照如下公式确定所述商户的所述网红关键词提及率:
f=m/M
其中,f为所述商户的所述网红关键词提及率,m为包括网红关键词的评论的数量,M为所述用户评论的总数量;
根据所述商户的所述用户访问数据中预设周期访客量与所述预设周期的前一预设周期访客量,按照如下公式确定所述商户的所述预设周期的访客量增幅:
UV′=(UV1-UV2)/(UV1+1)
其中,UV′为所述预设周期访客量增幅,UV1为所述预设周期访客量,UV2为所述预设周期的前一预设周期访客量;
根据所述统计周期内所述商户的所述预设周期访客量增幅,按照如下公式确定所述商户的所述预设周期访客量增幅的平均值:
其中,为所述预设周期访客量增幅的平均值,UV′i为第i个访客量增幅,n为访客量增幅的总数量;
根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户在所述统计周期内的访客量极差;和/或,
根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户的所述预设周期访客量均值。
其中,网红关键词包括但不限于:网红、网红店、网红打卡、网红地、打卡圣地、拔草网红、打卡、适合拍照、文艺气息、拔草、文艺、拍照好看、打个卡、抖音、小红书、朋友圈、公众号、微博和种草等中的一个词或多个词。
在本申请的一些实施例中,所述根据统计周期内所述商户的所述预设周期访客量增幅,确定所述商户的所述预设周期访客量增幅的平均值的步骤,包括:确定所述统计周期内所述商户第一个出现增长增幅的访客量增幅;以及,根据所述第一个出现增长增幅的访客量增幅及该访客量增幅之后的访客量增幅,确定所述商户的所述预设周期访客量增幅的平均值。为了确定在当前时间内统计得到的商户是否为网红商户,所以,确定访客量正增长的增幅,即首先确定统计周期内访客量增幅中第一个出现增长增幅的访客量增幅,并统计该第一个出现增长增幅的访客量增幅与之后的访客量增幅的数量,将第一个出现增长增幅的访客量增幅与之后的访客量增幅的累加和除以所述数量,得到预设周期访客量增幅的平均值,即通过如下公式计算预设周期访客量增幅的平均值:
其中,为所述预设周期访客量增幅的平均值,UV′i为第一个出现增长增幅的访客量增幅及该访客量增幅之后的任一个访客量增幅,n为第一个出现增长增幅的访客量增幅及该访客量增幅之后的访客量增幅的总数量。
在本申请的一些实施例中,所述根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户在所述统计周期内的所述访客量极差的步骤,包括:根据所述商户的所述用户访问数据中每个预设周期访客量,确定所述商户在所述统计周期内所述预设周期访客量的最大值和最小值;其中,所述最大值的出现时间在所述最小值的出现时间之后,且所述最大值与所述预设周期访客量均值的倍数小于或等于第一预设倍数,所述最小值已剔除未开业时数据;以及,根据所述最大值和所述最小值,确定所述商户在所述统计周期内的访客量极差:
R=UVmax-UVmin
其中,R为所述商户在所述统计周期内的访客量极差,UVmax为所述预设周期访客量的最大值,UVmin为所述预设周期访客量的最小值。
为了确定在当前时间内统计得到的商户是否为网红商户,所以,确定访客量正增长的极差,即最大值的出现时间在最小值的出现时间之后。第一预设倍数例如是5。若最大值与预设周期访客量均值的倍数大于5,则取下一个最大值,直至不超过5倍。经过剔除不正常的数据,提高了访客量极差的正确性。
在本申请的一些实施例中,所述根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户的所述预设周期访客量均值的步骤,包括:根据所述商户在所述统计周期内每个预设周期访客量的时间先后顺序,确定每个预设周期访客量的权重;以及,根据所述每个预设周期访客量和对应的权重,按照如下公式确定所述商户的所述预设周期访客量均值:
其中,为所述商户的所述预设周期访客量均值,UVi为第i个预设周期访客量,αi为第i个预设周期访客量的权重,n为统计周期内预设周期的总数量。
在计算统计周期内的预设周期访客量均值时,根据时间进行衰减,距离当前时间越近的预设周期访客量权重越高,从而根据各个预设周期访客量及对应的权重,得到统计周期内的预设周期访客量均值。这样分配权重可以提高当前时间确定的网红商户的准确性。
在本申请的另一些实施例中,所述关键计算因子包括:网红关键词提及率、流量正向极差、流量负向极差、流量增长趋势、预设周期访客量均值和/或质量权重,其中,所述统计周期包括至少两个预设周期。预设周期例如可以是一周。网红关键词提及率是指某一商户的用户评论数据中提及网红关键词且不包含网红负向词的评论数量占该商户的所有评论数量的比例。流量正向极差是指统计周期内预设周期访客量的最大值和该最大值之前出现的最小值之差。流量负向极差是指预设周期访客量的最大值和该最大值之后出现的最小值之差。流量增长趋势是所述流量正向极差和所述流量负向极差之差。预设周期访客量均值是指统计周期内的每个预设周期访客量在统计周期内的均值。质量权重是由商户的星级对应的质量综合分和商户的评论数量决定的。
在本申请的一些实施例中,所述根据所述用户访问数据和用户评论数据,确定所述商户的关键计算因子的步骤,包括:
根据所述商户的所述用户评论数据,确定包括网红关键词且不包括网红负向词的评论的数量,并确定用户评论的总数量,并根据所述包括网红关键词且不包括网红负向词的评论的数量和所述用户评论的总数量,按照如下公式确定所述商户的所述网红关键词提及率:
f′=m′/M
其中,f′为所述商户的所述网红关键词提及率,m′为包括网红关键词且不包括网红负向词的评论的数量,M为所述用户评论的总数量;
根据所述商户的用户访问数据,确定所述统计周期内预设周期访客量的最大值,确定所述最大值之前出现的预设周期访客量的最小值,作为第一最小值,并确定所述最大值之后出现的预设周期访客量的最小值,作为第二最小值;
根据所述最大值和所述第一最小值,确定所述商户的流量正向极差,并将所述最大值和所述第二最小值之差作为所述商户的流量负向极差;
将所述流量正向极差和所述流量负向极差之差,作为所述商户的所述流量增长趋势;
根据所述商户的所述用户访问数据中的预设周期访客量,确定所述商户的所述预设周期访客量均值;和/或
根据所述商户的质量综合分和评论数量,确定所述商户的质量权重。
其中,网红关键词包括但不限于:网红、网红店、网红打卡、网红地、打卡圣地、拔草网红、打卡、适合拍照、文艺气息、拔草、文艺、拍照好看、打个卡、抖音、小红书、朋友圈、公众号、微博和种草等中的一个词或多个词。网红负向词是一些做活动的关键词,包括但不限于:打折、打x折、促销、活动、霸王餐、折扣和优惠等中的一个词或多个词。包括网红关键词且不包括网红负向词的评论是指一条评论包括网红关键词而且不能包含网红负向词,如果一条评论既包含网红关键词又包含网红负向词,则该条评论不计算在内。
在确定所述最大值之后出现的预设周期访客量的最小值之前,要首先排除被诚信惩罚的预设周期访客量。在对统计周期内的预设周期访客量进行统计时,要去除商户未开业时的访客量数据。在计算上述关键计算因子之前,还可以对用户访问数据进行过滤处理,过滤掉预设周期访客量异常值,可以通过确定统计周期内预设周期访客量的中位数,若一个预设周期访客量大于或等于所述中位数的第二预设倍数,则将该预设周期访客量过滤掉,这是因为该预设周期访客量异常大,有可能是因为做活动吸引的用户,这种数据需要剔除掉,从而可以进一步提高网红商户确定的准确性。其中,所述第二预设倍数例如是5。
其中,确定商户的预设周期访客量均值的具体方式与上述实施例中相同,这里不再赘述。
在本申请的一些实施例中,所述根据所述最大值和所述第一最小值,确定所述商户的流量正向极差的步骤,包括:将所述最大值和所述第一最小值之差,作为所述商户的流量初始正向极差;统计所述商户的用户评论数据中包含网红负向词的评论数量,并确定所述商户在所述统计周期中的评论总数量;将所述包含网红负向词的评论数量和所述评论总数量之比,作为所述商户对应的网红负向词占比;统计所有商户对应的网红负向词占比的均值;以及,根据所述商户对应的网红负向词占比和所述均值,对所述流量初始正向极差进行降权处理,得到所述商户的流量正向极差。通过所有商户网红负向词占比的均值对流量初始正向极差进行降权处理,可以消除商户做活动的误差,提高后续网红商户识别的准确率。
其中,所述根据所述商户对应的网红负向词占比和所述均值,对所述流量初始正向极差进行降权处理,得到所述商户的流量正向极差的步骤,包括:
计算所述网红负向词占比与所述均值之差,作为降权权重;若所述降权权重小于或等于0,则将所述流量初始正向极差作为所述商户的流量正向极差;若所述降权权重大于0,则根据如下公式对所述流量初始正向极差进行降权处理,得到所述商户的流量正向极差:
R1=(1-a)R1
其中,R1是所述商户的流量正向极差,R1′是所述流量初始正向极差,a是所述降权权重。
在本申请的一些实施例中,所述根据所述商户的质量综合分和评论数量,确定所述商户的质量权重的步骤,包括:若所述评论数量大于或等于预设评论阈值,则将所述商户的质量综合分作为所述商户的质量权重;若所述评论数量小于所述预设评论阈值,则将所述商户的质量综合分与预设系数之积作为所述商户的质量权重,其中,所述预设系数小于1。根据商户的星级和评论数量确定商户的质量权重,综合考虑了商户的质量综合分和用户的欢迎程度,可以提高后续确定网红商户的准确性。
步骤120,根据所述关键计算因子设置识别网红商户的计算模型。
识别网红商户的计算模型和识别新晋网红商户的计算模型可以是不同的模型,因为网红商户一般是大众认知度高的知名网红商户,统计周期较长,而新晋网红商户更加偏向于新的商户,因此,新晋网红商户主要表现为最近一段时间的访客量增幅是增长的状态,而且统计周期较短。
在本申请的一些实施例中,根据所述关键计算因子设置识别网红商户的计算模型的步骤,包括:
根据所述关键计算因子,设置所述预设周期访客量均值、所述访客量极差和所述网红关键词提及率的乘积为识别网红商户的第一计算模型;和/或
根据所述关键计算因子,设置所述预设周期访客量增幅的平均值、所述访客量极差和所述网红关键词提及率的乘积为识别新晋网红商户的第二计算模型。
网红商户的访客量数据一般是比较稳定的,因此,将预设周期访客量均值、访客量极差和网红关键词提及率设置作为识别网红商户的第一计算模型。新晋网红商户表现为最近一段时间的访客量一直在增长,因此,将预设周期访客量增幅的平均值、访客量极差和网红关键词提及率的乘积作为识别新晋网红商户的第二计算模型。由于网红商户和新晋网红商户的特性不同,所以通过不同的计算模型来获得计算结果,从而可以提高网红商户和新晋网红商户的识别准确率。
在本申请的另一些实施例中,根据所述关键计算因子设置识别网红商户的计算模型的步骤,包括:
根据所述关键计算因子,设置所述预设周期访客量均值、所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积为识别网红商户的第一计算模型;和/或
根据所述关键计算因子,设置所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积为识别新晋网红商户的第二计算模型。
网红商户的访客量数据一般是比较稳定的,因此,将预设周期访客量均值、流量增长趋势、网红关键词提及率和所述质量权重的乘积作为识别网红商户的第一计算模型。新晋网红商户表现为最近一段时间的访客量一直在增长,因此,将流量增长趋势、网红关键词提及率和所述质量权重的乘积作为识别新晋网红商户的第二计算模型。由于网红商户和新晋网红商户的特性不同,所以通过不同的计算模型来获得计算结果,从而可以提高网红商户和新晋网红商户的识别准确率。
步骤130,根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果。
根据每个商户的用户访问数据和用户评论数据计算各个关键计算因子的值,并将各个关键计算因子的值代入所述计算模型,获得各个商户的计算结果。计算结果是各个商户为网红商户的得分的列表。
在本申请的一些实施例中,所述根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果的步骤,包括:
针对每个所述商户,根据所述第一计算模型,计算所述预设周期访客量均值、所述访客量极差和所述网红关键词提及率的乘积,得到每个商户作为网红商户的计算结果,即按照如下公式计算:
其中,S1为商户作为网红商户的计算结果,为所述预设周期访客量均值,R为所述访客量极差,f为所述网红关键词提及率;和/或
针对每个所述商户,根据所述第二计算模型,计算所述预设周期访客量增幅的平均值、所述访客量极差和所述网红关键词提及率的乘积,得到每个商户作为新晋网红商户的计算结果,即按照如下公式计算:
其中,S2为商户作为新晋网红商户的计算结果,为所述预设周期访客量增幅的平均值,R为所述访客量极差,f为所述网红关键词提及率。
在确定当前的需求为识别网红商户时,针对每个商户,根据第一计算模型,分别计算每个商户作为网红商户的计算结果。在确定当前的需求为识别新晋网红商户时,针对每个商户,根据第二计算模型,分别计算每个商户作为新晋网红商户的计算结果。
在本申请的另一些实施例中,所述根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果的步骤,包括:
针对每个所述商户,根据所述第一计算模型,计算所述预设周期访客量均值、所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积,得到每个商户作为网红商户的计算结果,即按照如下公式计算:
其中,S1为商户作为网红商户的计算结果,为所述预设周期访客量均值,R′为所述流量增长趋势,f为所述网红关键词提及率,ω为所述质量权重;和/或
针对每个所述商户,根据所述第二计算模型,计算所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积,得到每个商户作为新晋网红商户的计算结果,即按照如下公式计算:
S2=R′*f*ω
其中,S2为商户作为新晋网红商户的计算结果,R′为所述流量增长趋势,f为所述网红关键词提及率,ω为所述质量权重。
步骤140,根据所述计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户。
其中,所述网红商户的统计周期大于所述新晋网红商户的统计周期,从而可以更好的识别网红商户和新晋网红商户。例如,网红商户的统计周期是过去6个月,而新晋网红商户的统计周期是过去6周。
根据计算结果的得分排序以及预先设定的数量,确定所述商户为网红商户和/或新晋网红商户。例如,预先设定的数量为50时,则将网红商户的得分排序中排序前50的商户作为网红商户,将新晋网红商户的得分排序中排序前50的商户作为新晋网红商户。
在本申请的一些实施例中,所述根据所述计算结果的得分排序确定所述商户为网红商户的步骤,包括:
根据所述商户的地理位置,确定所述地理位置在统计区域内的商户;
按照地理位置在所述统计区域内的商户为网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序;以及
确定排序靠前且符合预设条件的商户为网红商户,并将所述网红商户生成所述统计区域内的网红榜。
其中,统计区域可以是一个城市,或者是一个城市内的一个行政区域,还可以是预设的区域(例如一个商圈所在区域)。预设条件可以是预设数量或者是预设比例,还可以是预设数量和预设比例中的最小值。
在需要生成一个统计区域内的网红榜时,需要确定地理位置在该统计区域内的商户,并获取该统计区域内的商户的计算结果,将计算结果中商户为网红商户的得分按照从高到低的顺序进行排序确定排序靠前且符合预设条件的商户为网红商户。例如,对于美食类的商户可以取排序靠前的100个商户为网红商户,或者排序靠前的5%的商户为网红商户,或者,取100和统计区域内的商户数量的5%中的最小值,确定排序靠前的所述最小值内的商户为网红商户。对于非美食类的商户可以取排序靠前的50个商户为网红商户,或者靠徐靠前的5%的商户为网红商户,或者,取50和统计区域内的商户数量的5%中的最小值,确定排序靠前的所述最小值内的商户为网红商户。
在本申请的一些实施例中,所述根据所述计算结果的得分排序确定所述商户为新晋网红商户的步骤,包括:
根据所述商户的地理位置,确定所述地理位置在统计区域内的商户;
按照地理位置在所述统计区域内的商户为新晋网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序;
针对所述排序中的商户,剔除不符合新晋网红条件的商户;以及
针对处理后的排序中的商户,确定排序靠前且符合预设条件的商户为新晋网红商户,并将所述新晋网红商户生成所述统计区域内的新晋网红榜。
其中,统计区域可以是一个城市,或者是一个城市内的一个行政区域,还可以是预设的区域(例如一个商圈所在区域)。预设条件可以是预设数量或者是预设比例,还可以是预设数量和预设比例中的最小值。
其中,所述不符合新晋网红条件的商户包括品牌连锁店、预设周期访客量均值大于预设值的商户以及进入网红榜的商户中的一种或多种。因为品牌连锁店具有品牌特征,具有多家连锁分店,知名度较高,因此不能成为新晋网红商户。预设值一般设置的较高,例如3000,若预设周期访客量均值大于3000则确定该商户已经获得了大众认可,不能成为新晋网红商户。为了避免网红榜和新晋网红榜中的商户重复,则已经进入网红榜的商户不能再进入新晋网红榜。不符合新晋网红条件的商户还包括旅游类商户中开业时间较早的景点类商户,例如周边游类目下POI创建时间超过90天的景点类商户。
在需要生成一个统计区域内的新晋网红榜时,需要确定地理位置在该统计区域内的商户,并获取该统计区域内的商户的计算结果,将计算结果中商户为新晋网红商户的得分按照从高到低的顺序进行排序,针对排序中的商户,剔除不符合新晋网红条件的商户,针对处理后的排序中的商户,确定排序靠前且符合预设条件的商户为网红商户。例如,对于美食类的商户可以取排序靠前的100个商户为新晋网红商户,或者排序靠前的5%的商户为新晋网红商户,或者,取100和统计区域内的商户数量的5%中的最小值,确定排序靠前的所述最小值内的商户为新晋网红商户。对于非美食类的商户可以取排序靠前的50个商户为新晋网红商户,或者靠徐靠前的5%的商户为新晋网红商户,或者,取50和统计区域内的商户数量的5%中的最小值,确定排序靠前的所述最小值内的商户为新晋网红商户。
本申请实施例公开的确定网红商户的方法,通过获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子,根据关键计算因子设置识别网红商户的计算模型,根据所述计算模型获得计算结果,根据计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户,实现了自动识别网红商户,不再依赖于人工识别,提高了识别效率,而且依据各个商户的得分排序来确定是否为网红商户,不再依赖于人工的主观判断,提高了网红商户确定的准确性,而且可以识别新晋网红商户,相对于人工判断,降低了网红商户识别的滞后性。
在上述技术方案的基础上,在所述根据所述用户访问数据和所述用户评论数据获得关键计算因子的步骤之前,还包括:根据所述用户访问数据和用户评论数据,确定满足初筛条件的商户,其中,所述初筛条件包括:所述用户评论数据中包括网红关键词的评论的数量大于或等于数量阈值,以及所述用户访问数据中的预设周期访客量均值大于或等于访客量阈值。
在确定各个商户的关键计算因子之前,先根据每个商户的用户访问数据和用户评论数据,对商户进行初筛,以缩小数据范围,提高后续数据处理速度。其中,数量阈值例如可以是10,访客量阈值例如可以是100。
在上述技术方案的基础上,在所述根据所述用户访问数据和用户评论数据,确定满足初筛条件的商户之前,还包括:过滤掉所述用户访问数据中诚信判定作弊的访问数据;将过滤后的用户访问数据中包含访问预设页面的访问数据,作为有效的用户访问数据。首先将用户访问数据中诚信判定作弊的访问数据过滤掉,避免将作弊的访问数据作为网红商户确定的基础造成准确性低的问题。对于用户访问数据中对某一商户的访问数据没有访问预设页面,则该访问数据作为无效的用户访问数据,将访问了预设页面的访问数据作为有效的用户访问数据,后续计算关键计算因子的值时均以有效的用户访问数据作为计算的基础,可以提高网红商户确定的准确性。其中,预设页面可以是商户详情页,即用户访问了一个商户的商户详情页,才是有效的用户访问数据。
实施例二
本实施例公开的一种确定网红商户的方法,本实施例在上述实施例的基础上,主要是确定商户为网红商户,如图2所示,该方法包括:步骤210至步骤260。
步骤210,获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子。
在当前的需求为确定商户是否为网红商户时,获取网红商户的统计周期,并根据该统计周期获取每个商户的用户访问数据和用户评论数据。其中,网红商户的统计周期大于新晋网红商户的统计周期。
确定商户是否为网红商户时,所述关键计算因子包括:预设周期访客量均值、访客量极差和网红关键词提及率。其中,所述统计周期包括至少两个所述预设周期。例如,对于确定商户是否为网红商户时,统计周期可以是6个月,而预设周期一般是一周。
步骤220,根据所述关键计算因子,设置所述预设周期访客量均值、所述访客量极差和所述网红关键词提及率的乘积为识别网红商户的第一计算模型。
由于网红商户是大众一致认可的商户,而且开业时间较早,访客量也比较稳定,所以在确定是否为网红商户时,可以根据预设周期访客量均值而不是预设周期访客量增幅来设置第一计算模型。
步骤230,针对每个所述商户,根据所述第一计算模型,计算所述预设周期访客量均值、所述访客量极差和所述网红关键词提及率的乘积,得到每个商户作为网红商户的计算结果。
针对每个商户,分别根据第一计算模型计算每个商户作为网红商户的得分,每个商户均计算完成后,得到各个商户作为网红商户的计算结果。
步骤240,根据所述商户的地理位置,确定所述地理位置在统计区域内的商户。
其中,统计区域可以是一个城市,或者是一个城市内的一个行政区域,还可以是预设的区域(例如一个商圈所在区域)。预设条件可以是预设数量或者是预设比例,还可以是预设数量和预设比例中的最小值。
根据商户的地理位置,确定地理位置在统计区域内的商户,后续基于这些商户的数据确定这些商户是否为网红商户。
步骤250,按照地理位置在所述统计区域内的商户为网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序。
从所述每个商户作为网红商户的计算结果中提取出地理位置在统计区域内的商户的计算结果,并按照该计算结果中每个商户为网红商户的得分从高到低的顺序进行排序。
步骤260,确定排序靠前且符合预设条件的商户为网红商户,并将所述网红商户生成所述统计区域内的网红榜。
本实施例公开的确定网红商户的方法,通过获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子,根据所述关键计算因子,设置预设周期访客量均值、访客量极差和网红关键词提及率的乘积为识别网红商户的第一计算模型,针对每个所述商户,根据所述第一计算模型,计算预设周期访客量均值、访客量极差和网红关键词提及率的乘积,得到每个商户作为网红商户的计算结果,根据所述商户的地理位置,确定所述地理位置在统计区域内的商户,按照地理位置在统计区域内的商户为网红商户的得分从高到低的顺序对所述地理位置在统计区域内的商户进行排序,确定排序靠前且符合预设条件的商户为网红商户,并将所述网红商户生成所述统计区域内的网红榜,实现了自动识别网红商户,不再依赖于人工识别,提高了识别效率,而且依据各个商户的得分排序来确定是否为网红商户,不再依赖于人工的主观判断,提高了网红商户确定的准确性。
实施例三
本实施例公开的一种确定网红商户的方法,本实施例在上述实施例的基础上,主要是确定商户为新晋网红商户,如图3所示,该方法包括:步骤310至步骤370。
步骤310,获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子。
在当前的需求为确定商户是否为新晋网红商户时,获取新晋网红商户的统计周期,并根据该统计周期获取每个商户的用户访问数据和用户评论数据。其中,新晋网红商户的统计周期小于网红商户的统计周期。
确定商户是否为新晋网红商户时,所述关键计算因子包括:预设周期访客量增幅、预设周期访客量增幅的平均值、访客量极差和网红关键词提及率。其中,所述统计周期包括至少两个所述预设周期。例如,对于确定商户是否为新晋网红商户时,统计周期可以是6周,而预设周期一般是一周。
步骤320,根据所述关键计算因子,设置所述预设周期访客量增幅的平均值、所述访客量极差和所述网红关键词提及率的乘积为识别新晋网红商户的第二计算模型。
新晋网红商户一般更倾向于是新的商户,而且访客量呈现增长的态势,所以在确定商户是否为新晋网红商户时,根据预设周期访客量增幅的平均值来设置第二计算模型。
步骤330,针对每个所述商户,根据所述第二计算模型,计算所述预设周期访客量增幅的平均值、所述访客量极差和所述网红关键词提及率的乘积,得到每个商户作为新晋网红商户的计算结果。
针对每个商户,分别根据第二计算模型计算每个商户作为新晋网红商户的得分,每个商户均计算完成后,得到各个商户作为新晋网红商户的计算结果。
步骤340,根据所述商户的地理位置,确定所述地理位置在统计区域内的商户。
根据商户的地理位置,确定地理位置在统计区域内的商户,后续基于这些商户的数据确定这些商户是否为新晋网红商户。
步骤350,按照地理位置在所述统计区域内的商户为新晋网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序。
从所述每个商户作为新晋网红商户的计算结果中提取出地理位置在统计区域内的商户的计算结果,并按照该计算结果中每个商户为新晋网红商户的得分从高到低的顺序进行排序。
步骤360,针对所述排序中的商户,剔除不符合新晋网红条件的商户。
其中,所述不符合新晋网红条件的商户包括品牌连锁店、预设周期访客量均值大于预设值的商户以及进入网红榜的商户中的一种或多种。
主要是剔除一些认知度已经较高的商户,这些商户一般不认为是新晋网红商户。
步骤370,针对处理后的排序中的商户,确定排序靠前且符合预设条件的商户为新晋网红商户,并将所述新晋网红商户生成所述统计区域内的新晋网红榜。
本实施例公开的确定网红商户的方法,通过获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子,根据所述关键计算因子,设置预设周期访客量增幅的平均值、访客量极差和网红关键词提及率的乘积为识别新晋网红商户的第二计算模型,针对每个所述商户,根据所述第二计算模型,计算预设周期访客量增幅的平均值、访客量极差和网红关键词提及率的乘积,得到每个商户作为新晋网红商户的计算结果,根据所述商户的地理位置,确定所述地理位置在统计区域内的商户,按照地理位置在统计区域内的商户为新晋网红商户的得分从高到低的顺序对所述地理位置在统计区域内的商户进行排序,针对所述排序中的商户,剔除不符合新晋网红条件的商户,针对处理后的排序中的商户,确定排序靠前且符合预设条件的商户为新晋网红商户,并将所述新晋网红商户生成所述统计区域内的新晋网红榜,可以识别新晋网红商户,实现了对网红商户的预测,相对于人工判断,降低了网红商户识别的滞后性,提高了识别效率。
实施例四
本实施例公开的一种确定网红商户的方法,本实施例在上述实施例的基础上,主要是确定商户为网红商户,如图4所示,该方法包括:步骤410至步骤460。
步骤410,获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子。
在当前的需求为确定商户是否为网红商户时,获取网红商户的统计周期,并根据该统计周期获取每个商户的用户访问数据和用户评论数据。其中,网红商户的统计周期大于新晋网红商户的统计周期。
确定商户是否为网红商户时,所述关键计算因子包括:网红关键词提及率、流量正向极差、流量负向极差、流量增长趋势、预设周期访客量均值和质量权重。其中,所述统计周期包括至少两个所述预设周期。例如,对于确定商户是否为网红商户时,统计周期可以是6个月,而预设周期一般是一周。
步骤420,根据所述关键计算因子,设置所述预设周期访客量均值、所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积为识别网红商户的第一计算模型。
由于网红商户是大众一致认可的商户,而且开业时间较早,访客量也比较稳定,所以在确定是否为网红商户时,将预设周期访客量均值作为识别网红商户的一个关键计算因子,并设置第一计算模型。
步骤430,针对每个所述商户,根据所述第一计算模型,计算所述预设周期访客量均值、所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积,得到每个商户作为网红商户的计算结果。
针对每个商户,分别根据第一计算模型计算每个商户作为网红商户的得分,每个商户均计算完成后,得到各个商户作为网红商户的计算结果。
步骤440,根据所述商户的地理位置,确定所述地理位置在统计区域内的商户。
其中,统计区域可以是一个城市,或者是一个城市内的一个行政区域,还可以是预设的区域(例如一个商圈所在区域)。
根据商户的地理位置,确定地理位置在统计区域内的商户,后续基于这些商户的数据确定这些商户是否为网红商户。
步骤450,按照地理位置在所述统计区域内的商户为网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序。
从所述每个商户作为网红商户的计算结果中提取出地理位置在统计区域内的商户的计算结果,并按照该计算结果中每个商户为网红商户的得分从高到低的顺序进行排序。
步骤460,确定排序靠前且符合预设条件的商户为网红商户,并将所述网红商户生成所述统计区域内的网红榜。
其中,预设条件可以是预设数量或者是预设比例,还可以是预设数量和预设比例中的最小值。
本实施例公开的确定网红商户的方法,通过获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子,根据所述关键计算因子,设置预设周期访客量均值、流量增长趋势、网红关键词提及率和质量权重的乘积为识别网红商户的第一计算模型,针对每个所述商户,根据所述第一计算模型,计算预设周期访客量均值、流量增长趋势、网红关键词提及率和质量权重的乘积,得到每个商户作为网红商户的计算结果,根据所述商户的地理位置,确定所述地理位置在统计区域内的商户,按照地理位置在统计区域内的商户为网红商户的得分从高到低的顺序对所述地理位置在统计区域内的商户进行排序,确定排序靠前且符合预设条件的商户为网红商户,并将所述网红商户生成所述统计区域内的网红榜,实现了自动识别网红商户,不再依赖于人工识别,提高了识别效率,而且依据各个商户的得分排序来确定是否为网红商户,不再依赖于人工的主观判断,提高了网红商户确定的准确性。
实施例五
本实施例公开的一种确定网红商户的方法,本实施例在上述实施例的基础上,主要是确定商户为新晋网红商户,如图5所示,该方法包括:步骤510至步骤570。
步骤510,获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子。
在当前的需求为确定商户是否为新晋网红商户时,获取新晋网红商户的统计周期,并根据该统计周期获取每个商户的用户访问数据和用户评论数据。其中,新晋网红商户的统计周期小于网红商户的统计周期。
确定商户是否为新晋网红商户时,所述关键计算因子包括:网红关键词提及率、流量正向极差、流量负向极差、流量增长趋势和质量权重。其中,在计算每个关键计算因子时,以预设周期为单位,根据预设周期访客量进行计算,所述统计周期包括至少两个所述预设周期。例如,对于确定商户是否为新晋网红商户时,统计周期可以是6周,而预设周期一般是一周。
步骤520,根据所述关键计算因子,设置所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积为识别新晋网红商户的第二计算模型。
新晋网红商户一般更倾向于是新的商户,而且访客量呈现增长的态势,所以在确定商户是否为新晋网红商户时,不需要考虑预设周期访客量均值,主要依据流量增长趋势来设置第二计算模型。
步骤530,针对每个所述商户,根据所述第二计算模型,计算所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积,得到每个商户作为新晋网红商户的计算结果。
针对每个商户,分别根据第二计算模型计算每个商户作为新晋网红商户的得分,每个商户均计算完成后,得到各个商户作为新晋网红商户的计算结果。
步骤540,根据所述商户的地理位置,确定所述地理位置在统计区域内的商户。
根据商户的地理位置,确定地理位置在统计区域内的商户,后续基于这些商户的数据确定这些商户是否为新晋网红商户。
步骤550,按照地理位置在所述统计区域内的商户为新晋网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序。
从所述每个商户作为新晋网红商户的计算结果中提取出地理位置在统计区域内的商户的计算结果,并按照该计算结果中每个商户为新晋网红商户的得分从高到低的顺序进行排序。
步骤560,针对所述排序中的商户,剔除不符合新晋网红条件的商户。
其中,所述不符合新晋网红条件的商户包括品牌连锁店、预设周期访客量均值大于预设值的商户以及进入网红榜的商户中的一种或多种。
主要是剔除一些认知度已经较高的商户,这些商户一般不认为是新晋网红商户。
步骤570,针对处理后的排序中的商户,确定排序靠前且符合预设条件的商户为新晋网红商户,并将所述新晋网红商户生成所述统计区域内的新晋网红榜。
其中,预设条件可以是预设数量或者是预设比例,还可以是预设数量和预设比例中的最小值。
本实施例公开的确定网红商户的方法,通过获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子,根据所述关键计算因子,设置流量增长趋势、网红关键词提及率和质量权重的乘积为识别新晋网红商户的第二计算模型,针对每个所述商户,根据所述第二计算模型,计算流量增长趋势、网红关键词提及率和质量权重的乘积,得到每个商户作为新晋网红商户的计算结果,根据所述商户的地理位置,确定所述地理位置在统计区域内的商户,按照地理位置在统计区域内的商户为新晋网红商户的得分从高到低的顺序对所述地理位置在统计区域内的商户进行排序,针对所述排序中的商户,剔除不符合新晋网红条件的商户,针对处理后的排序中的商户,确定排序靠前且符合预设条件的商户为新晋网红商户,并将所述新晋网红商户生成所述统计区域内的新晋网红榜,可以识别新晋网红商户,实现了对网红商户的预测,相对于人工判断,降低了网红商户识别的滞后性,提高了识别效率。
实施例六
本实施例公开的一种确定网红商户的装置,如图6所示,所述装置600包括:
数据获取模块610,用于获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子;
计算模型设置模块620,用于根据所述关键计算因子设置识别网红商户的计算模型;
计算结果获得模块630,用于根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果;
网红商户确定模块640,用于根据所述计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户。
可选的,所述装置还包括:
商户初筛模块,用于根据所述用户访问数据和用户评论数据,确定满足初筛条件的商户,其中,所述初筛条件包括:所述用户评论数据中包括网红关键词的评论的数量大于或等于数量阈值,以及所述用户访问数据中的预设周期访客量均值大于或等于访客量阈值。
可选的,所述装置还包括:
访问数据过滤模块,用于过滤掉所述用户访问数据中诚信判定作弊的访问数据;
有效数据确定模块,用于将过滤后的用户访问数据中包含访问预设页面的访问数据,作为有效的用户访问数据。
可选的,所述关键计算因子包括:网红关键词提及率、预设周期访客量增幅、预设周期访客量增幅的平均值、访客量极差和/或预设周期访客量均值,其中,所述统计周期包括至少两个预设周期。
可选的,所述数据获取模块包括:
网红关键词提及率确定单元,用于根据所述商户的所述用户评论数据,确定包括网红关键词的评论的数量,并确定用户评论的总数量,并根据所述包括网红关键词的评论的数量和所述用户评论的总数量,确定所述商户的所述网红关键词提及率;
访客量增幅确定单元,用于根据所述商户的所述用户访问数据中预设周期访客量与所述预设周期的前一预设周期访客量,确定所述商户的所述预设周期访客量增幅;
增幅平均值确定单元,用于根据所述统计周期内所述商户的所述预设周期访客量增幅,确定所述商户的所述预设周期访客量增幅的平均值;
访客量极差确定单元,用于根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户在所述统计周期内的所述访客量极差;和/或
访客量均值确定单元,用于根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户的所述预设周期访客量均值。
可选的,所述增幅平均值确定单元具体用于:
确定所述统计周期内所述商户第一个出现增长增幅的访客量增幅;以及
根据所述第一个出现增长增幅的访客量增幅及该访客量增幅之后的访客量增幅,确定所述商户的所述预设周期访客量增幅的平均值。
可选的,所述访客量极差确定单元具体用于:
根据所述商户的所述用户访问数据中每个预设周期访客量,确定所述商户在所述统计周期内所述预设周期访客量的最大值和最小值;其中,所述最大值的出现时间在所述最小值的出现时间之后,且所述最大值与所述预设周期访客量均值的倍数小于预设倍数,所述最小值已剔除未开业时数据;以及
根据所述最大值和所述最小值,确定所述商户在所述统计周期内的访客量极差。
可选的,所述访客量均值确定单元具体用于:
根据所述商户在所述统计周期内每个预设周期访客量的时间先后顺序,确定每个预设周期访客量的权重;以及
根据每个所述预设周期访客量和对应的权重,确定所述商户的所述预设周期访客量均值。
可选的,所述计算模型设置模块包括:
第一计算模型设置单元,用于根据所述关键计算因子,设置所述预设周期访客量均值、所述访客量极差和所述网红关键词提及率的乘积为识别网红商户的第一计算模型;和/或
第二计算模型设置单元,用于根据所述关键计算因子,设置所述预设周期访客量增幅的平均值、所述访客量极差和所述网红关键词提及率的乘积为识别新晋网红商户的第二计算模型。
可选的,所述计算结果获得模块包括:
第一网红结果获得单元,用于针对每个所述商户,根据所述第一计算模型,计算所述预设周期访客量均值、所述访客量极差和所述网红关键词提及率的乘积,得到每个商户作为网红商户的计算结果;和/或
第一新晋网红结果获得单元,用于针对每个所述商户,根据所述第二计算模型,计算所述预设周期访客量增幅的平均值、所述访客量极差和所述网红关键词提及率的乘积,得到每个商户作为新晋网红商户的计算结果。
可选的,所述关键计算因子包括:网红关键词提及率、流量正向极差、流量负向极差、流量增长趋势、预设周期访客量均值和/或质量权重,其中,所述统计周期包括至少两个预设周期。
可选的,所述数据获取模块包括:
网红关键词提及率确定单元,用于根据所述商户的所述用户评论数据,确定包括网红关键词且不包括网红负向词的评论的数量,并确定用户评论的总数量,并根据所述包括网红关键词且不包括网红负向词的评论的数量和所述用户评论的总数量,确定所述商户的所述网红关键词提及率;
极值确定单元,用于根据所述商户的用户访问数据,确定所述统计周期内预设周期访客量的最大值,确定所述最大值之前出现的预设周期访客量的最小值,作为第一最小值,并确定所述最大值之后出现的预设周期访客量的最小值,作为第二最小值;
极差确定单元,用于根据所述最大值和所述第一最小值,确定所述商户的流量正向极差,并将所述最大值和所述第二最小值之差作为所述商户的流量负向极差;
流量增长确定单元,用于将所述流量正向极差和所述流量负向极差之差,作为所述商户的所述流量增长趋势;
访客量均值确定单元,用于根据所述商户的所述用户访问数据中的预设周期访客量,确定所述商户的所述预设周期访客量均值;和/或
质量权重确定单元,用于根据所述商户的质量综合分和评论数量,确定所述商户的质量权重。
可选的,所述极差确定单元包括:
初始正向极差确定子单元,用于将所述最大值和所述第一最小值之差,作为所述商户的流量初始正向极差;
评论统计子单元,用于统计所述商户的用户评论数据中包含网红负向词的评论数量,并确定所述商户在所述统计周期中的评论总数量;
负向词占比确定子单元,用于将所述包含网红负向词的评论数量和所述评论总数量之比,作为所述商户对应的网红负向词占比;
占比均值确定子单元,用于统计所有商户对应的网红负向词占比的均值;以及
正向极差确定子单元,用于根据所述商户对应的网红负向词占比和所述均值,对所述流量初始正向极差进行降权处理,得到所述商户的流量正向极差。
可选的,所述质量权重确定单元具体用于:
若所述评论数量大于或等于预设评论阈值,则将所述商户的质量综合分作为所述商户的质量权重;
若所述评论数量小于所述预设评论阈值,则将所述商户的质量综合分与预设系数之积作为所述商户的质量权重,其中,所述预设系数小于1。
可选的,所述计算模型设置模块包括:
第一模型设置单元,用于根据所述关键计算因子,设置所述预设周期访客量均值、所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积为识别网红商户的第一计算模型;和/或
第二模型设置单元,用于所述关键计算因子,设置所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积为识别新晋网红商户的第二计算模型。
可选的,所述计算结果获得模块包括:
第二网红结果获得单元,用于针对每个所述商户,根据所述第一计算模型,计算所述预设周期访客量均值、所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积,得到每个商户作为网红商户的计算结果;和/或
第二新晋网红结果获得单元,用于针对每个所述商户,根据所述第二计算模型,计算所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积,得到每个商户作为新晋网红商户的计算结果。
可选的,所述网红商户确定模块包括:
第一商户确定单元,用于根据所述商户的地理位置,确定所述地理位置在统计区域内的商户;
第一排序模块,用于按照地理位置在所述统计区域内的商户为网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序;以及
网红榜生成模块,用于确定排序靠前且符合预设条件的商户为网红商户,并将所述网红商户生成所述统计区域内的网红榜。
可选的,所述网红商户确定模块包括:
第二商户确定模块,用于根据所述商户的地理位置,确定所述地理位置在统计区域内的商户;
第二排序模块,用于按照地理位置在所述统计区域内的商户为新晋网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序;
剔除模块,用于针对所述排序中的商户,剔除不符合新晋网红条件的商户;以及
新晋网红榜生成模块,用于针对处理后的排序中的商户,确定排序靠前且符合预设条件的商户为新晋网红商户,并将所述新晋网红商户生成所述统计区域内的新晋网红榜。
可选的,所述不符合新晋网红条件的商户包括品牌连锁店、预设周期访客量均值大于预设值的商户以及进入网红榜的商户中的一种或多种。
可选的,所述网红商户的统计周期大于所述新晋网红商户的统计周期。
本申请实施例提供的确定网红商户的装置,用于实现本申请实施例一中所述的确定网红商户的方法的各步骤,装置的各模块的具体实施方式参见相应步骤,此处不再赘述。
本申请实施例公开的确定网红商户的装置,通过数据获取模块获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子,计算模型设置模块根据关键计算因子设置识别网红商户的计算模型,计算结果获得模块根据所述计算模型获得计算结果,网红商户确定模块根据计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户,实现了自动识别网红商户,不再依赖于人工识别,提高了识别效率,而且依据各个商户的得分排序来确定是否为网红商户,不再依赖于人工的主观判断,提高了网红商户确定的准确性,而且可以识别新晋网红商户,相对于人工判断,降低了网红商户识别的滞后性。
相应的,本申请还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例一所述的确定网红商户的方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。
本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例一所述的确定网红商户的方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请提供的一种确定网红商户的方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims (25)

1.一种确定网红商户的方法,其特征在于,包括:
获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子;
根据所述关键计算因子设置识别网红商户的计算模型;
根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果;以及
根据所述计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述用户访问数据和所述用户评论数据获得关键计算因子的步骤之前,还包括:
根据所述用户访问数据和用户评论数据,确定满足初筛条件的商户,其中,所述初筛条件包括:所述用户评论数据中包括网红关键词的评论的数量大于或等于数量阈值,以及所述用户访问数据中的预设周期访客量均值大于或等于访客量阈值。
3.根据权利要求2所述的方法,其特征在于,在所述根据所述用户访问数据和用户评论数据,确定满足初筛条件的商户之前,还包括:
过滤掉所述用户访问数据中诚信判定作弊的访问数据;
将过滤后的用户访问数据中包含访问预设页面的访问数据,作为有效的用户访问数据。
4.根据权利要求1所述的方法,其特征在于,所述关键计算因子包括:网红关键词提及率、预设周期访客量增幅、预设周期访客量增幅的平均值、访客量极差和/或预设周期访客量均值,其中,所述统计周期包括至少两个预设周期。
5.根据权利要求4所述的方法,其特征在于,所述根据所述用户访问数据和所述用户评论数据获得关键计算因子的步骤,包括:
根据所述商户的所述用户评论数据,确定包括网红关键词的评论的数量,并确定用户评论的总数量,并根据所述包括网红关键词的评论的数量和所述用户评论的总数量,确定所述商户的所述网红关键词提及率;
根据所述商户的所述用户访问数据中预设周期访客量与所述预设周期的前一预设周期访客量,确定所述商户的所述预设周期访客量增幅;
根据所述统计周期内所述商户的所述预设周期访客量增幅,确定所述商户的所述预设周期访客量增幅的平均值;
根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户在所述统计周期内的所述访客量极差;和/或
根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户的所述预设周期访客量均值。
6.根据权利要求5所述的方法,其特征在于,所述根据统计周期内所述商户的所述预设周期访客量增幅,确定所述商户的所述预设周期访客量增幅的平均值的步骤,包括:
确定所述统计周期内所述商户第一个出现增长增幅的访客量增幅;以及
根据所述第一个出现增长增幅的访客量增幅及该访客量增幅之后的访客量增幅,确定所述商户的所述预设周期访客量增幅的平均值。
7.根据权利要求5所述的方法,其特征在于,所述根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户在所述统计周期内的所述访客量极差的步骤,包括:
根据所述商户的所述用户访问数据中每个预设周期访客量,确定所述商户在所述统计周期内所述预设周期访客量的最大值和最小值;其中,所述最大值的出现时间在所述最小值的出现时间之后,且所述最大值与所述预设周期访客量均值的倍数小于或等于第一预设倍数,所述最小值已剔除未开业时数据;以及
根据所述最大值和所述最小值,确定所述商户在所述统计周期内的访客量极差。
8.根据权利要求5所述的方法,其特征在于,所述根据所述商户的所述用户访问数据中的所述预设周期访客量,确定所述商户的所述预设周期访客量均值的步骤,包括:
根据所述商户在所述统计周期内每个预设周期访客量的时间先后顺序,确定每个预设周期访客量的权重;以及
根据所述每个预设周期访客量和对应的权重,确定所述商户的所述预设周期访客量均值。
9.根据权利要求5所述的方法,其特征在于,根据所述关键计算因子设置识别网红商户的计算模型的步骤,包括:
根据所述关键计算因子,设置所述预设周期访客量均值、所述访客量极差和所述网红关键词提及率的乘积为识别网红商户的第一计算模型;和/或
根据所述关键计算因子,设置所述预设周期访客量增幅的平均值、所述访客量极差和所述网红关键词提及率的乘积为识别新晋网红商户的第二计算模型。
10.根据权利要求9所述的方法,其特征在于,所述根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果的步骤,包括:
针对每个所述商户,根据所述第一计算模型,计算所述预设周期访客量均值、所述访客量极差和所述网红关键词提及率的乘积,得到每个商户作为网红商户的计算结果;和/或
针对每个所述商户,根据所述第二计算模型,计算所述预设周期访客量增幅的平均值、所述访客量极差和所述网红关键词提及率的乘积,得到每个商户作为新晋网红商户的计算结果。
11.根据权利要求1所述的方法,其特征在于,所述关键计算因子包括:网红关键词提及率、流量正向极差、流量负向极差、流量增长趋势、预设周期访客量均值和/或质量权重,其中,所述统计周期包括至少两个预设周期。
12.根据权利要求11所述的方法,其特征在于,所述根据所述用户访问数据和所述用户评论数据获得关键计算因子的步骤,包括:
根据所述商户的所述用户评论数据,确定包括网红关键词且不包括网红负向词的评论的数量,并确定用户评论的总数量,并根据所述包括网红关键词且不包括网红负向词的评论的数量和所述用户评论的总数量,确定所述商户的所述网红关键词提及率;
根据所述商户的用户访问数据,确定所述统计周期内预设周期访客量的最大值,确定所述最大值之前出现的预设周期访客量的最小值,作为第一最小值,并确定所述最大值之后出现的预设周期访客量的最小值,作为第二最小值;
根据所述最大值和所述第一最小值,确定所述商户的流量正向极差,并将所述最大值和所述第二最小值之差作为所述商户的流量负向极差;
将所述流量正向极差和所述流量负向极差之差,作为所述商户的所述流量增长趋势;
根据所述商户的所述用户访问数据中的预设周期访客量,确定所述商户的所述预设周期访客量均值;和/或
根据所述商户的质量综合分和评论数量,确定所述商户的质量权重。
13.根据权利要求12所述的方法,其特征在于,所述根据所述最大值和所述第一最小值,确定所述商户的流量正向极差的步骤,包括:
将所述最大值和所述第一最小值之差,作为所述商户的流量初始正向极差;
统计所述商户的用户评论数据中包含网红负向词的评论数量,并确定所述商户在所述统计周期中的评论总数量;
将所述包含网红负向词的评论数量和所述评论总数量之比,作为所述商户对应的网红负向词占比;
统计所有商户对应的网红负向词占比的均值;以及
根据所述商户对应的网红负向词占比和所述均值,对所述流量初始正向极差进行降权处理,得到所述商户的流量正向极差。
14.根据权利要求12所述的方法,其特征在于,所述根据所述商户的质量综合分和评论数量,确定所述商户的质量权重的步骤,包括:
若所述评论数量大于或等于预设评论阈值,则将所述商户的质量综合分作为所述商户的质量权重;
若所述评论数量小于所述预设评论阈值,则将所述商户的质量综合分与预设系数之积作为所述商户的质量权重,其中,所述预设系数小于1。
15.根据权利要求12所述的方法,其特征在于,根据所述关键计算因子设置识别网红商户的计算模型的步骤,包括:
根据所述关键计算因子,设置所述预设周期访客量均值、所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积为识别网红商户的第一计算模型;和/或
根据所述关键计算因子,设置所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积为识别新晋网红商户的第二计算模型。
16.根据权利要求15所述的方法,其特征在于,所述根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果的步骤,包括:
针对每个所述商户,根据所述第一计算模型,计算所述预设周期访客量均值、所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积,得到每个商户作为网红商户的计算结果;和/或
针对每个所述商户,根据所述第二计算模型,计算所述流量增长趋势、所述网红关键词提及率和所述质量权重的乘积,得到每个商户作为新晋网红商户的计算结果。
17.根据权利要求1所述的方法,其特征在于,所述根据所述计算结果的得分排序确定所述商户为网红商户的步骤,包括:
根据所述商户的地理位置,确定所述地理位置在统计区域内的商户;
按照地理位置在所述统计区域内的商户为网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序;以及
确定排序靠前且符合预设条件的商户为网红商户,并将所述网红商户生成所述统计区域内的网红榜。
18.根据权利要求1所述的方法,其特征在于,所述根据所述计算结果的得分排序确定所述商户为新晋网红商户的步骤,包括:
根据所述商户的地理位置,确定所述地理位置在统计区域内的商户;
按照地理位置在所述统计区域内的商户为新晋网红商户的得分从高到低的顺序对所述地理位置在所述统计区域内的商户进行排序;
针对所述排序中的商户,剔除不符合新晋网红条件的商户;以及
针对处理后的排序中的商户,确定排序靠前且符合预设条件的商户为新晋网红商户,并将所述新晋网红商户生成所述统计区域内的新晋网红榜。
19.根据权利要求18所述的方法,其特征在于,所述不符合新晋网红条件的商户包括品牌连锁店、预设周期访客量均值大于预设值的商户以及进入网红榜的商户中的一种或多种。
20.根据权利要求1所述的方法,其特征在于,所述网红商户的统计周期大于所述新晋网红商户的统计周期。
21.一种确定网红商户的装置,其特征在于,包括:
数据获取模块,用于获取统计周期内商户的用户访问数据和用户评论数据,并根据所述用户访问数据和所述用户评论数据获得关键计算因子;
计算模型设置模块,用于根据所述关键计算因子设置识别网红商户的计算模型;
计算结果获得模块,用于根据所述计算模型、所述用户访问数据和所述用户评论数据获得计算结果;以及
网红商户确定模块,用于根据所述计算结果的得分排序确定所述商户为网红商户和/或新晋网红商户。
22.根据权利要求21所述的装置,其特征在于,所述装置还包括:
商户初筛模块,用于根据所述用户访问数据和用户评论数据,确定满足初筛条件的商户,其中,所述初筛条件包括:所述用户评论数据中包括网红关键词的评论的数量大于或等于数量阈值,以及所述用户访问数据中的预设周期访客量均值大于或等于访客量阈值。
23.根据权利要求21所述的装置,其特征在于,所述关键计算因子包括:网红关键词提及率、预设周期访客量增幅、预设周期访客量增幅的平均值、访客量极差和/或预设周期访客量均值,其中,所述统计周期包括至少两个预设周期。
24.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至20任意一项所述的确定网红商户的方法。
25.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至20任意一项所述的确定网红商户的方法的步骤。
CN201910883069.6A 2019-05-30 2019-09-18 确定网红商户的方法、装置、电子设备及存储介质 Pending CN110619547A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019104654267 2019-05-30
CN201910465426.7A CN110310146A (zh) 2019-05-30 2019-05-30 确定网红商户的方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN110619547A true CN110619547A (zh) 2019-12-27

Family

ID=68075674

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910465426.7A Pending CN110310146A (zh) 2019-05-30 2019-05-30 确定网红商户的方法、装置、电子设备及存储介质
CN201910883069.6A Pending CN110619547A (zh) 2019-05-30 2019-09-18 确定网红商户的方法、装置、电子设备及存储介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910465426.7A Pending CN110310146A (zh) 2019-05-30 2019-05-30 确定网红商户的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (2) CN110310146A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113595860B (zh) * 2020-04-30 2023-06-13 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN110310146A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN104317959B (zh) 基于社交平台的数据挖掘方法及装置
CN108073659B (zh) 一种婚恋对象推荐方法及装置
CN106372249B (zh) 一种点击率预估方法、装置及电子设备
JP6937776B2 (ja) 地理的位置の属性情報を特定するための方法及びデバイス
US20130179511A1 (en) Method and system for determining user impact on their content pools within an online social network
CN108429776B (zh) 网络对象的推送方法、装置、客户端、交互设备以及系统
CN103353920A (zh) 基于社交网络推荐游戏的方法和装置
CN113535991B (zh) 一种多媒体资源推荐方法、装置、电子设备及存储介质
CN103778545B (zh) 一种商品信息处理方法和系统
CN110942344A (zh) 美食推荐榜单的生成方法、装置、设备及存储介质
WO2015124024A1 (zh) 一种提升信息的曝光率的方法和装置、确定搜索词的价值的方法和装置
CN110119980A (zh) 一种用于信贷的反欺诈方法、装置、系统和记录介质
US20050144633A1 (en) World-wide non-time based poll method for determining best image of a child
CN111489190A (zh) 一种基于用户关系的反作弊方法及系统
CN110619547A (zh) 确定网红商户的方法、装置、电子设备及存储介质
CN109033443A (zh) 推荐对象确定方法、装置、存储介质及计算机设备
CN106469163A (zh) 一种公众号推荐方法及系统
CN110210884B (zh) 确定用户特征数据的方法、装置、计算机设备及存储介质
WO2019242453A1 (zh) 信息处理方法及装置、存储介质、电子装置
CN106708939A (zh) 一种对目标人物进行评分及推送的方法、装置、系统
CN115099868A (zh) 一种基于游客行为数据的采集方法及装置
KR20190113145A (ko) 해시태그 기반 이미지 콘테스트를 통한 마케팅 방법
CN114266592A (zh) 一种广告素材的分配方法、分配装置、设备和介质
CN113626681B (zh) 一种账户信息的处理方法、装置、电子设备及存储介质
CN107818483B (zh) 网络卡券推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination