CN109214583A - 店铺人气值的预测方法及装置 - Google Patents

店铺人气值的预测方法及装置 Download PDF

Info

Publication number
CN109214583A
CN109214583A CN201811101764.4A CN201811101764A CN109214583A CN 109214583 A CN109214583 A CN 109214583A CN 201811101764 A CN201811101764 A CN 201811101764A CN 109214583 A CN109214583 A CN 109214583A
Authority
CN
China
Prior art keywords
shop
data
sample
predicted
popularity value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811101764.4A
Other languages
English (en)
Inventor
谢瓅
黄瑞
沈丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Word Of Mouth (beijing) Network Technology Co Ltd
Original Assignee
Word Of Mouth (beijing) Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Word Of Mouth (beijing) Network Technology Co Ltd filed Critical Word Of Mouth (beijing) Network Technology Co Ltd
Priority to CN201811101764.4A priority Critical patent/CN109214583A/zh
Publication of CN109214583A publication Critical patent/CN109214583A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种店铺人气值的预测方法及装置,方法包括:抽取待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据;将待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到待预测目标店铺的人气值。利用本发明可以在没有获取到待预测目标店铺交易信息的情况下,得到待预测目标店铺的人气值,解决了人气值计算必须依赖于交易信息的问题。进一步,对于在交易平台上没有发生过交易的店铺,也可以利用本发明预测其人气值,避免受到仅根据交易信息计算人气值的限制,导致无交易信息店铺的人气值为0的状况。

Description

店铺人气值的预测方法及装置
技术领域
本发明涉及软件领域,具体涉及一种店铺人气值的预测方法及装置。
背景技术
根据用户到店消费的交易情况,可以计算每个店铺的人气值。如专利申请号为201611096672.2的中国专利说明书中记载的,可以根据店铺的支付实时数据,以及保存的历史记录,确定店铺的人气值。根据店铺的人气值,可以对店铺进行推荐。用户可以方便的得到热门的店铺。店铺的人气值反映了店铺的火爆程度,人气值越高,说明店铺的交易多、到店消费的用户多、店铺的人流量多。
上述计算人气值的前提需要得到店铺的交易数据,如店铺利用支付宝、口碑等交易平台进行收款交易时,在店铺授权的情况下,这些交易平台可以获取到店铺的交易信息,进而计算店铺的人气值。这样使得人气值的计算必须依赖与店铺的交易信息,当店铺没有使用如上述交易平台进行收款交易而采用其他收款方式时,无法获取到店铺的交易信息,在计算店铺的人气值时会得到人气值为0。此时得到的人气值不能正确的反应店铺实际的人气值。因此,需要一种不依赖于店铺交易信息计算店铺人气值的方法。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的店铺人气值的预测方法及装置。
根据本发明的一个方面,提供了一种店铺人气值的预测方法,其包括:
抽取待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据;待预测目标店铺的第一特征数据包括店铺基本信息;待预测目标店铺的关联店铺的第二特征数据包括交易数据、人气值、与待预测目标店铺的距离信息以及关联店铺的店铺基本信息;
将待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到待预测目标店铺的人气值。
可选地,人气值训练模型的训练过程包括:
采集样本数据、样本标注数据和样本关联数据;
将样本数据和样本关联数据输入至待训练模型中进行训练,得到待训练模型的输出结果;
根据输出结果与样本标注数据之间的损失,调整待训练模型的权重参数,直至满足预设条件,得到人气值训练模型。
可选地,样本数据包括:第一指定历史时间内的样本店铺的第一特征数据;样本标注数据包括:样本店铺的人气值标注结果;样本店铺的第一特征数据包括样本店铺基本信息;
样本关联数据包括:第一指定历史时间内的样本店铺的关联样本店铺的第二特征数据;样本店铺的关联样本店铺的第二特征数据包括交易数据、人气值、与样本店铺的距离信息以及关联样本店铺基本信息。
可选地,待训练模型包括:深度神经网络学习模型、贝叶斯模型或支持向量机模型。
可选地,方法还包括:
采集测试样本数据、测试样本标注数据和测试样本关联数据;
利用测试样本数据、测试样本标注数据和测试样本关联数据,对人气值训练模型进行验证。
可选地,测试样本数据包括:第二指定历史时间内的测试样本店铺的第一特征数据;测试样本标注数据包括:测试样本店铺的人气值标注结果;测试样本店铺的第一特征数据包括测试样本店铺基本信息;
测试样本关联数据包括:第二指定历史时间内的测试样本店铺的关联测试样本店铺的第二特征数据;测试样本店铺的关联测试样本店铺的第二特征数据包括交易数据、人气值、与测试样本店铺的距离信息以及关联测试样本店铺基本信息。
可选地,人气值包括人气数值和/或人气等级。
可选地,待预测目标店铺为无交易信息店铺。
可选地,待预测目标店铺的第一特征数据还包括店铺查询信息和/或店铺优惠获取信息;待预测目标店铺的关联店铺的第二特征数据还包括店铺查询信息和/或店铺优惠获取信息。
可选地,样本店铺的第一特征数据还包括样本店铺查询信息和/或店铺优惠获取信息;样本店铺的关联样本店铺的第二特征数据还包括关联样本店铺查询信息和/或店铺优惠获取信息。
可选地,测试样本店铺的第一特征数据还包括测试样本店铺查询信息和/或店铺优惠获取信息;测试样本店铺的关联测试样本店铺的第二特征数据还包括关联测试样本店铺查询信息和/或店铺优惠获取信息。
根据本发明的另一方面,提供了一种店铺人气值的预测装置,其包括:
抽取模块,适于抽取待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据;待预测目标店铺的第一特征数据包括店铺基本信息;待预测目标店铺的关联店铺的第二特征数据包括交易数据、人气值、与待预测目标店铺的距离信息以及关联店铺的店铺基本信息;
预测模块,适于将待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到待预测目标店铺的人气值。
可选地,装置还包括:人气值训练模型训练模块;
人气值训练模型训练模块包括:
采集单元,适于采集样本数据、样本标注数据和样本关联数据;
输入单元,适于将样本数据和样本关联数据输入至待训练模型中进行训练,得到待训练模型的输出结果;
调整单元,适于根据输出结果与样本标注数据之间的损失,调整待训练模型的权重参数,直至满足预设条件,得到人气值训练模型。
可选地,样本数据包括:第一指定历史时间内的样本店铺的第一特征数据;样本标注数据包括:样本店铺的人气值标注结果;样本店铺的第一特征数据包括样本店铺基本信息;
样本关联数据包括:第一指定历史时间内的样本店铺的关联样本店铺的第二特征数据;样本店铺的关联样本店铺的第二特征数据包括交易数据、人气值、与样本店铺的距离信息以及关联样本店铺基本信息。
可选地,待训练模型包括:深度神经网络学习模型、贝叶斯模型或支持向量机模型。
可选地,装置还包括:
测试模块,适于采集测试样本数据、测试样本标注数据和测试样本关联数据;利用测试样本数据、测试样本标注数据和测试样本关联数据,对人气值训练模型进行验证。
可选地,测试样本数据包括:第二指定历史时间内的测试样本店铺的第一特征数据;测试样本标注数据包括:测试样本店铺的人气值标注结果;测试样本店铺的第一特征数据包括测试样本店铺基本信息;
测试样本关联数据包括:第二指定历史时间内的测试样本店铺的关联测试样本店铺的第二特征数据;测试样本店铺的关联测试样本店铺的第二特征数据包括交易数据、人气值、与测试样本店铺的距离信息以及关联测试样本店铺基本信息。
可选地,人气值包括人气数值和/或人气等级。
可选地,待预测目标店铺为无交易信息店铺。
可选地,待预测目标店铺的第一特征数据还包括店铺查询信息和/或店铺优惠获取信息;待预测目标店铺的关联店铺的第二特征数据还包括店铺查询信息和/或店铺优惠获取信息。
可选地,样本店铺的第一特征数据还包括样本店铺查询信息和/或店铺优惠获取信息;样本店铺的关联样本店铺的第二特征数据还包括关联样本店铺查询信息和/或店铺优惠获取信息。
可选地,测试样本店铺的第一特征数据还包括测试样本店铺查询信息和/或店铺优惠获取信息;测试样本店铺的关联测试样本店铺的第二特征数据还包括关联测试样本店铺查询信息和/或店铺优惠获取信息。
根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述店铺人气值的预测方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述店铺人气值的预测方法对应的操作。
根据本发明提供的店铺人气值的预测方法及装置,抽取待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据;待预测目标店铺的第一特征数据包括店铺基本信息;待预测目标店铺的关联店铺的第二特征数据包括交易数据、人气值、与待预测目标店铺的距离信息以及关联店铺的店铺基本信息;将待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到待预测目标店铺的人气值。利用本发明可以在没有获取到待预测目标店铺交易信息的情况下,得到待预测目标店铺的人气值,解决了人气值计算必须依赖于交易信息的问题。进一步,对于在交易平台上没有发生过交易的店铺,也可以利用本发明预测其人气值,避免受到仅根据交易信息计算人气值的限制,导致无交易信息店铺的人气值为0的状况。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的店铺人气值的预测方法的流程图;
图2示出了根据本发明一个实施例的人气值训练模型训练方法的流程图;
图3示出了根据本发明一个实施例的店铺人气值的预测装置的功能框图;
图4示出了根据本发明一个实施例的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的店铺人气值的预测方法的流程图。如图1所示,店铺人气值的预测方法具体包括如下步骤:
步骤S101,抽取待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据。
本实施例中待预测目标店铺以无交易信息店铺为例进行说明,受无交易信息的限制,现有人气值计算方法不适用于无交易信息店铺。本实施例可以在无店铺交易信息的情况下,对店铺的人气值进行预测。但本实施例不仅限于无交易信息店铺,对于具有交易信息的店铺也可以使用本实施例预测人气值。
对于待预测目标店铺,需要抽取待预测目标店铺的第一特征数据,其第一特征数据包括店铺基本信息,如店铺ID、店铺名称、店铺地理位置信息、店铺的类目信息、品牌信息、商家ID等;店铺的类目信息可以根据实际划分情况,设置为一级类目信息或多级类目信息,如一级类目信息为美食,当划分类目较多级时,还可以包括如二级类目信息为美食分类中的火锅等;品牌信息根据店铺所属的品牌,如外婆家,可以获取外婆家品牌相关的信息,如品牌知名度、热点等,以及店铺所属商家ID等。以上店铺基本信息为举例说明,具体基本信息根据实施需要抽取,其中未包括店铺实际发生的交易信息。
进一步,待预测目标店铺的第一特征数据还包括了店铺查询信息、店铺优惠获取信息等。店铺查询信息包括当前实时的查询数据,还包括历史查询数据,如根据店铺名称、地址等信息查询、查找店铺发布的优惠券信息次数、查找店铺发布的商品信息次数、在优惠券或商品等购买详情页面点击购买停留时间等数据信息;店铺优惠获取信息包括如购买或领取店铺优惠券未使用金额、次数等信息、购买店铺商品未使用金额、次数等信息等等。根据店铺查询信息、店铺优惠获取信息等第一特征数据可以分析得到用户对待预测目标店铺的关注度,便于预测待预测目标店铺的人气值。
对于待预测目标店铺的关联店铺,需要抽取待预测目标店铺的关联店铺的第二特征数据。其第二特征数据包括交易数据、人气值、与待预测目标店铺的距离信息以及关联店铺的店铺基本信息。其中交易数据包括待预测目标店铺的关联店铺交易金额、交易笔数、交易优惠金额、交易优惠笔数等;人气值为待预测目标店铺的关联店铺当前根据其本身的交易信息所计算得到的人气值;与待预测目标店铺的距离信息可以通过待预测目标店铺的地理位置信息和待预测目标店铺的关联店铺的地理位置信息计算得到。如使用geocash(公共领域地理编码系统)数据。geocash将地理位置编码成一串字母和数字,提供了任意精度的属性,以及逐渐从代码的末尾删除字符以减小其大小(并逐渐失去精度)的可能性。由于精度逐渐下降的结果,使得相邻近地理位置区域的字母和数字可能呈现类似的前缀。当类似前缀越长时,说明两个地理位置越接近。利用geocash数据,可以确定待预测目标店铺的关联店铺与待预测目标店铺间的距离信息。考虑到人气值受人流量大小的影响,当关联店铺人气值较高,即关联店铺所在地理位置的人流量较大,当关联店铺与待预测目标店铺的距离较近时,人流会分流,也影响待预测目标店铺的人气值;关联店铺的店铺基本信息包括待预测目标店铺的关联店铺的店铺ID、店铺名称、店铺地理位置信息、店铺的类目信息、品牌信息、商家ID等;品牌信息、商家ID等与预测目标店铺相同时,考虑品牌效应,如品牌为外婆家,各个外婆家连锁店铺的人气值会相互影响;店铺的类目信息与预测目标店铺的类目信息相同时,如一级类目信息均为美食,二级类目信息均为火锅,火锅在美食类目中较受用户青睐,根据关联店铺的人气值及两个店铺的类目信息,可以影响待预测目标店铺的人气值。
进一步,待预测目标店铺的关联店铺的第二特征数据还包括了关联店铺的店铺查询信息、关联店铺的店铺优惠获取信息等。关联店铺的店铺查询信息包括当前实时的查询数据,还包括历史查询数据,如根据店铺名称、地址等信息查询、查找店铺发布的优惠券信息次数、查找店铺发布的商品信息次数、在优惠券或商品等购买详情页面点击购买停留时间等数据信息;关联店铺的店铺优惠获取信息包括如购买或领取店铺优惠券未使用金额、次数等信息、购买店铺商品未使用金额、次数等信息等等。根据以上各第二特征数据,结合第一特征数据,考虑两者对应的数据间关系对待预测目标店铺人气值的影响。
步骤S102,将待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到待预测目标店铺的人气值。
将抽取得到的待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据都输入到预先训练得到的人气值训练模型中,人气值训练模型可以根据输入的各个数据,得到待预测目标店铺的人气值。得到的人气值根据人气值训练模型输出结果的不同,可以包括人气数值或者人气等级等。人气数值为具体的数字,如当店铺没有人气时,人气值为0,店铺人气值最高值为100,得到的人气数值为根据输入的数据获取的0-100之间的数字。人气等级即将人气值按照不同数字划分的不同等级,如可以20分为一等级,得到5个人气等级,人气值训练模型可以直接输出待预测目标店铺的人气等级,如4等。具体输出的人气值可以根据实施情况设置,此处不做限定。
进一步,本实施例中人气值训练模型可以根据当前实时抽取的待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据,预测当前实时的待预测目标店铺的人气值。
根据本发明提供的店铺人气值的预测方法,抽取待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据;待预测目标店铺的第一特征数据包括店铺基本信息;待预测目标店铺的关联店铺的第二特征数据包括交易数据、人气值、与待预测目标店铺的距离信息以及关联店铺的店铺基本信息;将待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到待预测目标店铺的人气值。利用本发明可以在没有获取到待预测目标店铺交易信息的情况下,得到待预测目标店铺的人气值,解决了人气值计算必须依赖于交易信息的问题。进一步,对于在交易平台上没有发生过交易的店铺,也可以利用本发明预测其人气值,避免受到仅根据交易信息计算人气值的限制,导致无交易信息店铺的人气值为0的状况。
图2示出了根据本发明一个实施例的人气值训练模型训练方法的流程图。如图2所示,人气值训练模型训练方法具体包括如下步骤:
步骤S201,采集样本数据、样本标注数据和样本关联数据。
在人气值训练模型进行训练前,需要采集训练所需的足够多的样本数据、样本标注数据和样本关联数据。其中,样本数据包括了第一指定历史时间内的样本店铺的第一特征数据。由于需要足够多的样本数据进行训练,此处第一指定历史时间内的样本店铺的第一特征数据可以包括如采集过去三个月内的样本店铺的第一特征数据。样本店铺的第一特征数据包括样本店铺基本信息,如店铺ID、店铺名称、店铺地理位置信息、店铺的类目信息、品牌信息、商家ID等,以上各店铺基本信息的描述可以参照图1实施例中对店铺基本信息的描述,在此不再赘述。在训练时所使用的样本数据中的样本店铺一般采用具有交易信息的店铺,这些店铺的人气值可以根据交易信息方便的得到。在采集样本店铺的第一特征数据的同时,采集样本店铺的人气值标注结果作为样本标注数据。样本关联数据包括了第一指定历史时间内的样本店铺的关联样本店铺的第二特征数据。此处,样本关联数据的第一指定历史时间与样本数据中的第一指定历史时间为相同的时间。如样本数据为采集过去三个月内的样本店铺的第一特征数据,则样本关联数据为采集过去三个月内的样本店铺的关联样本店铺的第二特征数据。样本店铺的关联样本店铺的第二特征数据包括交易数据、人气值、与样本店铺的距离信息以及关联样本店铺基本信息。以上第二特征数据中包含的各信息可以参照图1实施例中对交易数据、人气值、距离信息以及店铺基本信息的描述,在此不再赘述。
进一步,样本店铺的第一特征数据还包括样本店铺查询信息、店铺优惠获取信息等;样本店铺的关联样本店铺的第二特征数据还包括关联样本店铺查询信息、店铺优惠获取信息等。以上各店铺查询信息、店铺优惠获取信息的描述参照图1实施例中店铺查询信息、店铺优惠获取信息的描述,在此不再赘述。
步骤S202,将样本数据和样本关联数据输入至待训练模型中进行训练,得到待训练模型的输出结果。
上述采集的样本数据和样本关联数据作为输入数据输入至待训练模型中进行训练,得到待训练模型的输出结果,即预测的样本店铺的人气值。
待训练模型可以采用如深度神经网络学习模型(DNN,Deep Neural Network)、贝叶斯模型、支持向量机模型(SVM,Support Vector Machine)等分类模型,根据实施情况设置,此处不作限定。
步骤S203,根据输出结果与样本标注数据之间的损失,调整待训练模型的权重参数,直至满足预设条件,得到人气值训练模型。
预设条件如计算输出结果与样本标注数据的准确率,当准确率满足某阈值如99%;或者预设条件为输出结果与样本标注数据的偏差小于某阈值如两者偏差小于1等。以待训练模型为深度神经网络学习模型为例,待训练模型包括输入层、3层隐藏层(隐藏层的层数根据训练所使用的样本数据、样本关联数据的大小进行调整)、输出层,输出层所输出的输出结果与样本标注数据之间会存在损失,根据输出结果与样本标注数据之间的损失,可以相应的调整待训练模型中的各项权重参数。该步骤可以反复执行,不断根据输出结果与样本标注数据之间的损失,调整待训练模型的权重参数,直至满足预设条件,从而得到人气值训练模型。
可选地,本实施例还可以包括步骤S204和步骤S205。
步骤S204,采集测试样本数据、测试样本标注数据和测试样本关联数据。
在训练得到人气值训练模型后,还可以进一步采集测试样本数据、测试样本标注数据和测试样本关联数据,以便利用以上数据对人气值训练模型进行评估、验证等。
测试样本数据包括了第二指定历史时间内的测试样本店铺的第一特征数据。此处,第二指定历史时间需与第一指定历史时间不同,如第一指定历史时间为过去第89天至昨天,第二指定历史时间为过去第90天,以保障可以使用与样本数据不同的测试样本数据完成对人气值训练模型的评估,使得评估更准确。测试样本店铺的第一特征数据包括测试样本店铺基本信息,如店铺ID、店铺名称、店铺地理位置信息、店铺的类目信息、品牌信息、商家ID等,以上各店铺基本信息的描述可以参照图1实施例中对店铺基本信息的描述,在此不再赘述。在采集测试样本店铺的第一特征数据的同时,采集测试样本店铺的人气值标注结果作为测试样本标注数据包括。测试样本关联数据包括第二指定历史时间内的测试样本店铺的关联测试样本店铺的第二特征数据。此处,测试样本关联数据的第二指定历史时间与测试样本数据中的第二指定历史时间为相同的时间。测试样本店铺的关联测试样本店铺的第二特征数据包括交易数据、人气值、与测试样本店铺的距离信息以及关联测试样本店铺基本信息。以上第二特征数据中包含的各信息可以参照图1实施例中对交易数据、人气值、距离信息以及店铺基本信息的描述,在此不再赘述。
进一步,测试样本店铺的第一特征数据还包括测试样本店铺查询信息、店铺优惠获取信息等;测试样本店铺的关联测试样本店铺的第二特征数据还包括测试关联样本店铺查询信息、店铺优惠获取信息等。以上各店铺查询信息、店铺优惠获取信息的描述参照图1实施例中店铺查询信息、店铺优惠获取信息的描述,在此不再赘述。
步骤S205,利用测试样本数据、测试样本标注数据和测试样本关联数据,对人气值训练模型进行验证。
将上述测试样本数据和测试样本关联数据输入至训练得到的人气值训练模型中,得到输出结果,将输出结果与测试样本标注数据进行比对,还可以根据比对结果进一步对人气值训练模型进行评估、验证、测试等,消除可能的预测均方误差,以确保最终得到的人气值训练模型为最合适的人气值训练模型。
根据本发明提供的人气值训练模型训练方法,利用采集的样本数据和样本关联数据,输入至待训练模型中进行训练,根据输出结果与样本标注数据之间的损失,调整待训练模型的权重参数,直至满足预设条件,得到人气值训练模型,从而可以利用人气值训练模型预测待预测目标店铺的人气值。样本数据除包括样本店铺基本信息外,还可以包括样本店铺查询信息、店铺优惠获取信息等,样本关联数据除包括交易数据、人气值、与样本店铺的距离信息以及关联样本店铺基本信息外,还可以包括关联样本店铺查询信息、店铺优惠获取信息等,实现人气值训练模型从多维度、多方面进行训练,提高人气值训练模型的预测准确性。进一步,本发明中还采集了测试样本数据、测试样本标注数据和测试样本关联数据,对人气值训练模型进行评估、验证,保障了人气值训练模型的准确。
图3示出了根据本发明一个实施例的店铺人气值的预测装置的功能框图。如图3所示,店铺人气值的预测装置包括如下模块:
抽取模块310适于:抽取待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据;待预测目标店铺的第一特征数据包括店铺基本信息;待预测目标店铺的关联店铺的第二特征数据包括交易数据、人气值、与待预测目标店铺的距离信息以及关联店铺的店铺基本信息。
预测模块320适于:将待预测目标店铺的第一特征数据和待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到待预测目标店铺的人气值。
可选地,装置还包括:人气值训练模型训练模块330。
人气值训练模型训练模块330包括:采集单元331、输入单元332和调整单元333。
采集单元331适于:采集样本数据、样本标注数据和样本关联数据。
输入单元332适于:将样本数据和样本关联数据输入至待训练模型中进行训练,得到待训练模型的输出结果。
调整单元333适于:根据输出结果与样本标注数据之间的损失,调整待训练模型的权重参数,直至满足预设条件,得到人气值训练模型。
可选地,装置还包括:测试模块340。
测试模块340适于:采集测试样本数据、测试样本标注数据和测试样本关联数据;利用测试样本数据、测试样本标注数据和测试样本关联数据,对人气值训练模型进行验证。
以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。
本申请还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的店铺人气值的预测方法。
图4示出了根据本发明一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:
处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述店铺人气值的预测方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行上述任意方法实施例中的店铺人气值的预测方法。程序410中各步骤的具体实现可以参见上述店铺人气值的预测实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的店铺人气值的预测装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种店铺人气值的预测方法,其包括:
抽取待预测目标店铺的第一特征数据和所述待预测目标店铺的关联店铺的第二特征数据;所述待预测目标店铺的第一特征数据包括店铺基本信息;所述待预测目标店铺的关联店铺的第二特征数据包括交易数据、人气值、与所述待预测目标店铺的距离信息以及所述关联店铺的店铺基本信息;
将所述待预测目标店铺的第一特征数据和所述待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到所述待预测目标店铺的人气值。
2.根据权利要求1所述的方法,其中,所述人气值训练模型的训练过程包括:
采集样本数据、样本标注数据和样本关联数据;
将所述样本数据和样本关联数据输入至待训练模型中进行训练,得到所述待训练模型的输出结果;
根据所述输出结果与所述样本标注数据之间的损失,调整所述待训练模型的权重参数,直至满足预设条件,得到所述人气值训练模型。
3.根据权利要求2所述的方法,其中,所述样本数据包括:第一指定历史时间内的样本店铺的第一特征数据;所述样本标注数据包括:样本店铺的人气值标注结果;所述样本店铺的第一特征数据包括样本店铺基本信息;
所述样本关联数据包括:第一指定历史时间内的所述样本店铺的关联样本店铺的第二特征数据;所述样本店铺的关联样本店铺的第二特征数据包括交易数据、人气值、与所述样本店铺的距离信息以及关联样本店铺基本信息。
4.根据权利要求2或3所述的方法,其中,所述待训练模型包括:深度神经网络学习模型、贝叶斯模型或支持向量机模型。
5.根据权利要求2-4中任一项所述的方法,其中,所述方法还包括:
采集测试样本数据、测试样本标注数据和测试样本关联数据;
利用所述测试样本数据、测试样本标注数据和测试样本关联数据,对所述人气值训练模型进行验证。
6.根据权利要求5所述的方法,其中,所述测试样本数据包括:第二指定历史时间内的测试样本店铺的第一特征数据;所述测试样本标注数据包括:测试样本店铺的人气值标注结果;所述测试样本店铺的第一特征数据包括测试样本店铺基本信息;
所述测试样本关联数据包括:第二指定历史时间内的测试样本店铺的关联测试样本店铺的第二特征数据;所述测试样本店铺的关联测试样本店铺的第二特征数据包括交易数据、人气值、与所述测试样本店铺的距离信息以及关联测试样本店铺基本信息。
7.根据权利要求1-6中任一项所述的方法,其中,所述人气值包括人气数值和/或人气等级。
8.一种店铺人气值的预测装置,其包括:
抽取模块,适于抽取待预测目标店铺的第一特征数据和所述待预测目标店铺的关联店铺的第二特征数据;所述待预测目标店铺的第一特征数据包括店铺基本信息;所述待预测目标店铺的关联店铺的第二特征数据包括交易数据、人气值、与所述待预测目标店铺的距离信息以及所述关联店铺的店铺基本信息;
预测模块,适于将所述待预测目标店铺的第一特征数据和所述待预测目标店铺的关联店铺的第二特征数据输入预先训练得到的人气值训练模型,得到所述待预测目标店铺的人气值。
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的店铺人气值的预测方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的店铺人气值的预测方法对应的操作。
CN201811101764.4A 2018-09-20 2018-09-20 店铺人气值的预测方法及装置 Pending CN109214583A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811101764.4A CN109214583A (zh) 2018-09-20 2018-09-20 店铺人气值的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811101764.4A CN109214583A (zh) 2018-09-20 2018-09-20 店铺人气值的预测方法及装置

Publications (1)

Publication Number Publication Date
CN109214583A true CN109214583A (zh) 2019-01-15

Family

ID=64984274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811101764.4A Pending CN109214583A (zh) 2018-09-20 2018-09-20 店铺人气值的预测方法及装置

Country Status (1)

Country Link
CN (1) CN109214583A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458609A (zh) * 2019-07-23 2019-11-15 安徽迪科数金科技有限公司 一种新店经营管理预测分析系统
CN111275479A (zh) * 2020-01-07 2020-06-12 北京爱笔科技有限公司 一种人流量预测方法、装置及系统
CN113657652A (zh) * 2021-07-31 2021-11-16 腾讯科技(深圳)有限公司 流动量的预测方法、装置、设备及可读存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458609A (zh) * 2019-07-23 2019-11-15 安徽迪科数金科技有限公司 一种新店经营管理预测分析系统
CN111275479A (zh) * 2020-01-07 2020-06-12 北京爱笔科技有限公司 一种人流量预测方法、装置及系统
CN111275479B (zh) * 2020-01-07 2023-11-10 北京爱笔科技有限公司 一种人流量预测方法、装置及系统
CN113657652A (zh) * 2021-07-31 2021-11-16 腾讯科技(深圳)有限公司 流动量的预测方法、装置、设备及可读存储介质
CN113657652B (zh) * 2021-07-31 2023-06-20 腾讯科技(深圳)有限公司 流动量的预测方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN105447186B (zh) 一种基于大数据平台的用户行为分析系统
CN102314654B (zh) 一种信息推送方法及信息推送服务器
CN106355432A (zh) 一种付费广告效果监测调控的方法
CN106407210B (zh) 一种业务对象的展示方法和装置
CN109214583A (zh) 店铺人气值的预测方法及装置
US20120246000A1 (en) Techniques to capture context and location information and utilize heuristics to turn location tracked over time and context information into semantic location information
CN107038237A (zh) 基于大数据的用户画像系统及画像方法
CN105354719A (zh) 应用于电子商务平台的信用评估系统及方法
CN105302810A (zh) 一种信息搜索方法和装置
CN106445954B (zh) 一种业务对象的展示方法和装置
CN104517224A (zh) 一种网络热销商品的预测方法及系统
CN110348930A (zh) 业务对象数据处理方法、业务对象信息的推荐方法和装置
JP2008257723A (ja) キーワード広告を提供する方法およびこの方法を実行するシステム
CN109145200A (zh) 推广展现的方法、装置、设备和计算机存储介质
US20110246300A1 (en) Techniques to determe when an internet user is in-market for a specific product and determining general shopping preferences and habits of internet users
US10726449B2 (en) System and method for extracting and publishing information captured by point of sale, point of service, and other order management and sales transactions recording systems for positively influencing internet search engine results
CN107507037B (zh) 服务器、赠品栏的赠品推送方法及存储介质
WO2014009962A2 (en) Generating a ranked list of offers in a shopping query
CN108415970B (zh) 检索结果排序方法、装置、电子设备及存储介质
CN110222285A (zh) 阅读页面的展示方法、计算设备及计算机存储介质
CN106484698A (zh) 一种搜索关键词的推送方法和装置
CN103425680A (zh) 页面展示广告的选取方法和系统
CN108932625A (zh) 用户行为数据的分析方法、装置、介质和电子设备
CN108230003A (zh) 关键词的投放效果分析方法及装置
US20110251873A1 (en) Method, system, and computer readable recording medium for generating keyword pairs for search advertisements based on advertisement purchase history

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190115

RJ01 Rejection of invention patent application after publication