CN108647827B - 商户排队时长的预测方法、装置、电子设备及存储介质 - Google Patents

商户排队时长的预测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN108647827B
CN108647827B CN201810463891.2A CN201810463891A CN108647827B CN 108647827 B CN108647827 B CN 108647827B CN 201810463891 A CN201810463891 A CN 201810463891A CN 108647827 B CN108647827 B CN 108647827B
Authority
CN
China
Prior art keywords
time
queuing
merchant
user
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810463891.2A
Other languages
English (en)
Other versions
CN108647827A (zh
Inventor
朱静雅
朱青祥
李思颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201810463891.2A priority Critical patent/CN108647827B/zh
Publication of CN108647827A publication Critical patent/CN108647827A/zh
Application granted granted Critical
Publication of CN108647827B publication Critical patent/CN108647827B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及商户排队时长的预测方法、装置、电子设备及存储介质。所述预测方法包括以下步骤:根据用户对商户的评论数据,确定用户在所述商户的历史排队时长;获取用户在所述商户的历史到店时间;根据所述历史排队时长、历史到店时间预测所述商户的排队时长。本发明便于顾客合理安排时间,提高了时间利用率;有效的利用了o2o公司的用户行为数据,获取的排队信息相较于“推动商户接入排队装置”,节省了大量的人力及开发成本;相较于传统方式可覆盖更多商户;时间衰减的引入,可实时获取用户排队信息的变更,使数据更加实时和准确。

Description

商户排队时长的预测方法、装置、电子设备及存储介质
技术领域
本发明涉及计算机网络技术领域,具体涉及商户排队时长的预测方法、装置、电子设备及存储介质。
背景技术
随着生活节奏的加快,在日常工作和生活中,人们更注重节省时间的消费方式,出去吃饭、看电影、各种娱乐和商业活动,都不希望等待时间太长。
目前,顾客到店时常通过取号的方式排队,但是无法根据已经取到的号码预估等待的时间,造成用户体验较差。
发明内容
为了改进现有方法的缺点,本发明拟提供商户排队时长的预测方法、装置、电子设备及存储介质,采用挖掘评论数据,进行模型训练和数据融合的方法,从而预测商户排队时长。
本发明提供一种商户排队时长的预测方法,包括以下步骤:
根据用户对商户的评论数据,确定用户在所述商户的历史排队时长;
获取用户在所述商户的历史到店时间;
根据所述历史排队时长、历史到店时间预测所述商户的排队时长。
进一步的,所述根据用户对商户的评论数据,确定用户在所述商户的历史排队时长的步骤包括:
获取用户对所述商户的评论数据;
根据与排队信息相关的预定义词语获得扩展词库;
根据所述扩展词库得到与排队信息相关的模式串;
逐一匹配所述模式串与所述评论数据,以获取所述评论数据对应的排队时长;
对所述排队时长按时间区间进行分类。
进一步地,所述对排队时长按时间区间进行分类,包括不排队、短时间排队、较长时间排队、长时间排队。
进一步地,所述用户在所述商户的历史到店时间通过以下任一方式获取:用户买单信息、所述商户关联券的使用信息、用户在所述商户的签到信息、用户对所述商户信息的浏览信息、用户上传图片的拍摄信息。
进一步地,所述根据所述历史排队时长、历史到店时间预测所述商户的排队时长的步骤包括:
根据时间衰减函数,得到所述评论数据的时间衰减权重;
根据所述历史排队时长、所述历史到店时间对所述排队时长预测模型进行训练,获得各类排队时长的权重;
根据所述各类排队时长权重及所述时间衰减权重,对所述评论数据进行处理,获得所述商户的排队时长。
进一步地,所述利用所述各类排队时长权重及所述时间衰减权重,对所述评论数据进行处理,获得所述商户排队的时长的步骤包括:
利用所述各类排队时长权重及所述时间衰减权重,对所述评论数据进行逐一处理,获得每条评论数据的分数;
将同一排队时长分类下的所述每条评论数据的分数进行求和计算,获得每个排队时长分类下的总分;
将所述每个排队时长分类中总分最高的所述排队时长,作为该商户的排队时长。
进一步地,根据所述用户对商户的评论数据进行分时段预测。
本发明还提供一种商户排队时长的预测装置,其特征在于,所述装置包括数据采集单元、到店时间获取单元、预测单元,其中:
所述数据采集单元用于根据用户对商户的评论数据,确定用户在所述商户的历史排队时长;
所述到店时间获取单元用于获取用户在所述商户的历史到店时间;
所述预测单元根据所述历史排队时长、历史到店时间预测所述商户的排队时长。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的商户排队时长的预测方法。
本发明还提供一种计算机可读存储介质,其上存储有处理器程序, 该处理器程序用于执行所述的商户排队时长的预测方法。
本发明有效的利用了o2o公司的用户行为数据,便于顾客合理安排时间,提高了时间利用率。
附图说明
图1是本发明排队时长预测方法流程示意图。
图2是本发明排队时长预测装置示意图。
图3是本发明获得历史排队时长的方法流程示意图。
图4是本发明实施例时间衰减函数曲线示意图。
具体实施方式
以下是通过附图和具体实施例来说明本发明的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不悖离本发明的构思下进行各种修改与变更。
另外,本发明的附图仅为简单示意说明,并非依实际尺寸的描绘,事先声明。以下的实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。
一种商户排队时长的预测装置,如图2所示,图2是本发明排队时长预测装置示意图。
所述装置包括数据采集单元1、到店时间获取单元2、预测单元3,其中:所述数据采集单元1用于根据用户对商户的评论数据,确定用户在所述商户的历史排队时长;所述到店时间获取单元2用于获取用户在所述商户的历史到店时间;所述预测单元3用于根据所述历史排队时长、历史到店时间预测所述商户的排队时长。
所述数据采集单元1包括评论挖掘单元11、训练单元12、词库13、匹配单元14、排队时长分类单元15,其中:所述评论挖掘单元11用于从各网站的用户评论区,挖掘用户对于在商户消费时排队情况的评论数据送到所述训练单元12;所述训练单元12用于预定义排队词语,对所述评论数据进行深度学习,训练得到word2vec模型;所述词库13用于根据所述模型和预定义的词语,获取排队相关词语形成词库13,得到排队相关描述的模式串送到所述匹配单元14;所述匹配单元14用于匹配所述模式串与所述评论数据,以获取评论描述的排队时长;所述排队时长分类单元15用于对所述排队时长进行规范化并分类。
所述到店时间获取单元2包括WiFi获取单元21、买单获取单元22、签到获取单元23、浏览获取单元24、图片获取单元25,其中:所述 WiFi获取单元21通过WiFi的名字及其mac地址获取的经纬度,与商户的名字与经纬度进行关联,获取WiFi与商户的关联库,进一步通过当天用户连接WiFi或WiFi列表扫描情况来获取用户历史到店时间;所述买单获取单元22通过用户买单、商户“优惠买点“的消费,“优惠券”“消费等服务,获取用户的消费时间,进而获取用户历史到店时间;所述签到获取单元23通过用户在商户的签到时间来获取用户历史到店时间;所述浏览获取单元24通过用户对商户APP的浏览记录及其停留时长,获取用户历史到店时间;所述图片获取单元25通过用户的评论图片的拍摄时间,获取用户的历史到店时间。
所述预测单元3包括建模单元31、模型训练单元32、时间衰减计算单元33、数据处理单元34,其中:所述建模单元31用于设置排队时长预测模型;所述模型训练单元32利用所述历史排队时长、历史到店时间对所述排队时长预测模型进行训练,获得各类排队时长的权重送到所述数据处理单元34;所述时间衰减计算单元33根据时间衰减函数,计算得到用户评论的时间衰减权重送到所述数据处理单元34;所述数据处理单元34利用所述各类排队时长权重和时间衰减权重,对全量评论数据进行处理,获得每一类排队时长的分数预测所述商户的排队时长。
一种商户排队时长的预测方法,如图1所示,图1是本发明排队时长预测方法流程示意图。包括以下步骤。
根据用户对商户的评论数据,确定用户在所述商户的历史排队时长。
获取用户在所述商户的历史到店时间;
根据所述历史排队时长、历史到店时间预测所述商户的排队时长。
上述获取商户排队时长和历史到店时间的步骤,没有先后,可以互换。
图3是获得历史排队时长的方法流程示意图。如图3所示,所述根据用户对商户的评论数据,确定用户在所述商户的历史排队时长包括以下步骤。
获取用户对所述商户的评论数据;
根据与排队信息相关的预定义词语获得扩展词库;
根据所述扩展词库得到与排队信息相关的模式串;
逐一匹配所述模式串与所述评论数据,以获取所述评论数据对应的排队时长;
对所述排队时长按时间区间进行分类。
在大众点评网、美团网等的商户页面,会有用户的评论区,其中会涉及用户在商户消费过程中有关排队情况的描述。从各网站的用户评论区,挖掘用户对于在商户消费时排队情况的评论数据。也可以通过电话访问,直接询问商户,或者由用户提交排队相关信息,来获得更多的评论数据。有效的利用了o2o公司的用户行为数据,获取的排队信息相较于“推动商户接入排队装置”,节省了大量的人力及开发成本;相较于传统方式可覆盖更多商户。
通过预定义排队相关的词语,并对所有的评论数据进行深度学习,训练得到word2vec模型,根据训练好的模型和预定义的词语,获取排队相关词语,形成词库。
根据所述词库得到与排队信息相关的模式串。模式串包括排队、等待、一会儿等等所述词库的词,与相应的排队时长相对应。
逐一匹配所述模式串与所述评论数据,过滤掉不相关的词,判断所述评论数据符合的模式串,以获取所述评论数据对应的排队时长。
所述模式串部分,本案进行了具体实施例描述,参考实施例1。
对所述排队时长按时间区间进行分类,包括不排队、短时间排队、较长时间排队、长时间排队。
需要特别指出的是,根据实际情况需要,所述排队时长的分类种类和分类方式可以灵活变化,可以分为3类、5类甚至其他数量,分类方式也可以根据需要选取不同的时长。
在一个实施例中,所述排队时长分为3类,包括不排队、排队0-0.5h、排队0.5-1h。
在一个实施例中,用户要求越来越高的情况下,排队时长可以根据需求分为6类,包括不排队、排队0-0.25h、排队0.25-0.5h、排队0.5-0.75h、排队0.75-1h、排队〉1h。
分类情况可以各种变化,不以此为限制。
所述用户在所述商户的历史到店时间通过以下任一方式获取:用户买单信息、所述商户关联券的使用信息、用户在所述商户的签到信息、用户对所述商户信息的浏览信息、用户上传图片的拍摄信息。获取方式包括但不仅限于以上方式。
已经通过上一步获取了用户评论描述中设计到的商户的排队时长,但由于用户评论时间一般发生在到店消费后,有一定的时间延迟,故不能将评论时间作为用户到店时间使用。本发明,也利用了O2O公司特有的用户行为数据,节省了大量的人力及开发成本。此步主要结合用户的其他行为信息获取其到店的具体日期及时间段。O2O即Online To Offline(在线离线/线上到线下),是指将线下的商务机会与互联网结合,让互联网成为线下交易的平台。像美团、大众点评、百度糯米充当的就是这样一个角色,链接线上和线下,使商户和消费者链接在一起,方便了大家。
通过用户买单时,WiFi的名字及其mac地址获取的经纬度,与商户的名字与经纬度进行关联,获取WiFi与商户的关联库,进一步通过当天用户连接WiFi或WiFi列表扫描情况来获取用户历史到店时间。
通过用户在商户“优惠买点”的消费,“优惠券”消费等服务,获取用户的消费时间,进而获取用户历史到店时间。
通过用户在商户的签到时间来获取用户历史到店时间。
通过用户对商户APP的浏览记录及其停留时长,获取用户历史到店时间。
用户的评论中多数会带有图片,其图片中包含拍摄时间,通过用户的评论图片的拍摄时间,获取用户的历史到店时间。
获得所述历史到店时间后,对所述历史到店时间分类为午市和晚市,并格式化为日期+【午市/晚市】。例如,午市一般为时间11:00-13:00 到店;晚市一般为时间16:00-19:00到店。
特别需要指出的是,根据实际情况需要,所述到店时间的分类也是可以以其它形式划分。
在一个实施例中,由于商户营业性质的不同,还可以增加夜市,夜市时间一般为20:00-23:00到店。分类情况可以各种变化,不以此为限制。
所述根据所述历史排队时长、历史到店时间预测所述商户的排队时长的步骤包括:
根据时间衰减函数,得到所述评论数据的时间衰减权重;
根据所述历史排队时长、所述历史到店时间对所述排队时长预测模型进行训练,获得各类排队时长的权重;
根据所述各类排队时长权重及所述时间衰减权重,对所述评论数据进行处理,获得所述商户的排队时长。
根据时间衰减函数,得到用户评论的时间衰减权重W时间因子
所述W时间因子=0.1+0.9*exp(-days^2/threshold^2)。
其中,days为用户的历史到店时间距今的天数,threshold为考虑的评论数据的天数,所述threshold的值等于150。根据评论时间,及计算出的时间衰减权重W时间因子做出衰减权重曲线,如图4,图4为计算后的时间衰减函数曲线图。横坐标为days,纵坐标为W时间因子。根据图4 可以看出商户300天内经营情况的变化,更准确的说,可以看出商户 300天内排队时长的变化。所述时间衰减权重的计算参见实施例2。
根据所述历史排队时长、所述历史到店时间对所述排队时长预测模型进行训练,获得各类排队时长的权重。
设置排队时长预测模型。
商户商户在午市或晚市的排队时长为:
Figure BDA0001661592580000081
其中,h为商户的排队时长,n为排队时长类型总数,Wi为此排队时长类型的权重,W时间因子为时间衰减因子,hi为此类型的排队时长,b为偏置值,此偏置项为如果评论都没有提到排队的时候,真实的排队时间。
利用所述历史排队时长、历史到店时间对所述排队时长预测模型进行训练,获得各类排队时长的权重Wi。
所述Wi的计算公式是,通过设置损失函数为:
Loss=(h-htrue)^2。
所述h为商户在午市或晚市的排队时长,htrue为htrue是此商户真实的排队时长,将
Figure BDA0001661592580000091
代入该损失函数,来预估 Wi,通过损失函数来评价损失问题,通过最小化loss,利用梯度下降法求取Wi及b。
梯度下降是迭代法的一种,在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采用的方法之一,另一种常用的方法是最小二乘法。在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值。所述排队时长权重Wi的计算参见实施例3。
所述利用所述各类排队时长权重及所述时间衰减权重,对所述评论数据进行处理,获得所述商户排队的时长的步骤包括:
利用所述各类排队时长权重及所述时间衰减权重,对所述评论数据进行逐一处理,获得每条评论数据的分数;
根据所述用户对商户的评论数据进行分时段预测,将同一排队时长分类下的所述每条评论数据的分数进行求和计算,获得每个排队时长分类下的总分;
将所述每个排队时长分类中总分最高的所述排队时长,作为该商户的排队时长。
商户的排队时长分为多种类型,比如分为四种类型,不排队、排队 0-0.5h、排队0.5-1h、排队〉1h。
分时段预测,例如分为午市和晚市分别计算。特别需要指出的是,根据实际情况需要,所述分时段的分类也可以以其它形式划分。
在一个实施例中,由于商户营业性质的不同,还可以增加夜市,夜市时间一般为20:00-23:00到店。分类情况可以各种变化,不以此为限制。
记每条评论的初始分为1分,每条评论的最终得分为初始分*时间因子。其中每一种类型的最后得分的计算公式为:
Figure BDA0001661592580000101
根据最后得分,预测商户排队时长的方式为,哪一类排队时长的分数Score最高,就认为该商户排队时长为哪一类。
在一个实施例中,午市,不排队类型的分数为200、排队0-0.5h类型的分数为500、排队0.5-1h类型的分数为300、排队〉1h类型的分数为100。最高分数为500,那么,就认为该商户午市排队时长为排队0-0.5h 这个类型。每一类最后得分的计算参见实施例4。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的商户排队时长的预测方法。
一种计算机可读存储介质,其上存储有处理器程序,该处理器程序用于执行上述所述的商户排队时长的预测方法。其中,计算机可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、光盘只读存储器(CD-ROM)、磁带、软盘和光数据存储设备等。
实施例1
实施例1中提供步骤S13中所述的模式串举例。
例一,(不用|不需要|没|无人)(排队|等座|等位|等候)。
表示不需要排队,其能命中的句子包含,不用排队/不用等座/不用等候/不需要排队/不需要等座/不需要等位/不需要等候/没排队/没等座/ 没等位/没等候等等。
例二,(等位|排队|排了|等座)[\u4e00-\u9fa5]{0,5}?(不多|不是很多| 不久|一会|不是很久|一会儿|一阵|一下)。
表示等位0-0.5小时之间,其中[\u4e00-\u9fa5]{0,5}?表示可匹配(等位|排队|排了|等座)与(不多|不是很多|不久|一会|不是很久|一会儿|一阵| 一下)之间的0-5个任意汉字,以过滤掉用户评论的无效信息。
例三,(排)[\u4e00-\u9fa5]{0,5}?(大队|长龙|队伍)表示排队0.5-1h
表示排队在0.5-1小时。
例四,(等位|排队|排了|等座)[\u4e00-\u9fa5]{0,5}?(几|一个半|一|二| 三|四|五|六|七|八|九|十|[0-9]+)[\u4e00-\u9fa5]{0,5}?(小时|太久|太长) 表示排队约在〉1小时。
模式串中的数字或字母等,是应用了算法对评论中无用的数据进行了过滤,这种过滤后显示的数字或字母等,不属于模式串的有意义的部分。
本实施例没有涉及到的部分,同具体实施方式描述相同,在此不再赘述。
实施例2
实施例2提供时间衰减权重的计算实施例。步骤33中,在所述时间衰减计算单元33中计算时间衰减权重。
实际实施过程中,认为距离现在越近的数据具有越高的使用价值,根据时间衰减函数来计算时间衰减权重W时间因子。函数公式为:
W时间因子=0.1+0.9*exp(-days^2/threshold^2)
其中,days为用户的历史到店并评论的时间距今的天数,值为0-300 天,所述threshold的值等于150天,即考虑距今300天内的评论数据,认为评论价值在150天左右开始剧烈衰减。
如图4所示,图4为时间衰减函数曲线图。横坐标为days,纵坐标为W时间因子
当days越小时,例如今天刚到店并评论,则days为该时间距今的天数,days=0,通过计算可知W时间因子=1,即距离现在越近,评论数据具有越高的使用价值。
当days越大时,例如距今300天时到店并评论,则days为该时间距今的天数,days=300,通过计算可知W时间因子接近于0.1,即距离现在越远,评论数据具有越低的使用价值。
从图4可以看出,开始和结束的地方衰减较慢,在中间衰减速度快,可知,随着时间过去,商户的经营状况会发生越来越大的变化,常规认知商户的排队信息可能在2-3个月会有较大的变动,此时间的衰减曲线符合我们的认知,时间衰减的引入,可实时获取用户排队信息的变更,使数据更加实时和准确。
本实施例没有涉及到的部分,同具体实施方式描述相同,在此不再赘述。
实施例3
实施例3提供排队时长权重Wi的计算实施例。
某商户的排队时长分为多种类型,比如分为四种类型,不排队、排队0-0.5h、排队0.5-1h、排队〉1h。记每条评论的初始分为1分,每条评论的最终得分为:初始分×时间因子。则针对午市和晚市分别计算,此时间段(午市或晚市)此商户的排队时长为:
Figure BDA0001661592580000121
其中:n为步骤1中的分出的时间类型总数,Wi为此类型的权重, W时间因子为时间衰减因子,hi为此类型的排队时长,b为偏置,此偏置项为如果评论都没有提到排队的时候,真实的排队时间。
设置损失函数为:Loss=(h-htrue)^2,其中htrue是此时间段(午市或晚市)商户真实的排队时长。
其中,排队时长h代入损失函数来预估Wi,通过损失函数来评价损失问题。
将上述h的计算式代入损失函数,通过最小化损失函数loss,来获取Wi以及b。在此,最小化损失函数loss的方法可以是梯度下降法,或者别的算法。
本实施例没有涉及到的部分,同具体实施方式描述相同,在此不再赘述。
实施例4
实施例4提供每一种类型的最后得分的计算实施例。
某商户的排队时长分为多种类型,比如分为四种类型,不排队、排队0-0.5h、排队0.5-1h、排队〉1h,记每条评论的初始分为1分,每条评论的最终得分为初始分*时间因子。针对午市和晚市分别计算,【每个商户】在【午市/晚市】的【每个时间段】的得分如下:
Figure BDA0001661592580000131
其中,Score_i为各个排队时长类型的得分,k为提到此排队时长类型的评论的个数,Wi为此排队时长类型的权重,W时间因子为时间衰减因子,hi为此类型的排队时长,b为偏置,此偏置项为如果评论都没有提到排队的时候,真实的排队时间。最后选取分数最高的排队时长类型。
例如午市时,不排队类型的分数为200、排队0-0.5h类型的分数为 300、排队0.5-1h类型的分数为500、排队〉1h类型的分数为150。
晚市时,不排队类型的分数为200、排队0-0.5h类型的分数为600、排队0.5-1h类型的分数为300、排队〉1h类型的分数为100。
那么通过下面的预测单元4的预测,认为该商户午市最高分的时间段0.5-1h为该商户午市的预测排队时间。认为该商户晚市最高分的时间段0-0.5h为该商户晚市的预测排队时间。
本发明便于顾客根据排队信息对其等待时间进行修正,避免顾客错过服务机会;合理安排时间,提高了时间利用率,降低了空号率。
本实施例没有涉及到的部分,同具体实施方式描述相同,在此不再赘述。
需要说明的是,以上参照附图所描述的各个实施例仅用以说明本发明而非限制本发明的范围,本领域的普通技术人员应当理解,在不脱离本发明的精神和范围的前提下对本发明进行的修改或者等同替换,均应涵盖在本发明的范围之内。此外,除上下文另有所指外,以单数形式出现的词包括复数形式,反之亦然。另外,除非特别说明,那么任何实施例的全部或一部分可结合任何其它实施例的全部或一部分来使用。

Claims (8)

1.一种商户排队时长的预测方法,包括以下步骤:
根据用户对商户的评论数据,确定用户在所述商户的历史排队时长,包括:从用户评论区,挖掘用户对于在商户消费时排队情况的评论数据;预定义排队词语,对所有的评论数据进行深度学习,训练得到word2vec模型,根据与排队信息相关的预定义词语和训练的所述模型获得排队相关词语形成扩展词库;根据所述扩展词库得到与排队信息相关的模式串;逐一匹配所述模式串与所述评论数据,以获取所述评论数据对应的历史排队时长;
获取用户在所述商户的历史到店时间;
根据所述历史排队时长、历史到店时间预测所述商户的排队时长,包括:根据时间衰减函数,计算得到所述评论数据的时间衰减权重;根据所述历史排队时长、所述历史到店时间对所述排队时长预测模型进行训练,获得各个排队时长类型的权重;根据所述各个排队时长类型的权重及所述时间衰减权重,对所述评论数据进行处理,预测所述商户的排队时长。
2.根据权利要求1所述的商户排队时长的预测方法,其特征在于,在所述确定用户在所述商户的历史排队时长后,所述方法还包括:对排队时长按时间区间进行分类,具体包括不排队、短时间排队、较长时间排队、长时间排队。
3.根据权利要求1所述的商户排队时长的预测方法,其特征在于,
所述用户在所述商户的历史到店时间还通过以下任一方式获取:用户买单信息、所述商户关联券的使用信息、用户在所述商户的签到信息、用户对所述商户信息的浏览信息、用户上传图片的拍摄信息。
4.根据权利要求1所述的商户排队时长的预测方法,其特征在于,所述根据所述各个排队时长类型的权重及所述时间衰减权重,对所述评论数据进行处理,预测所述商户的排队时长的步骤包括:
利用所述各个排队时长类型的权重及所述时间衰减权重,对所述评论数据进行逐一处理,获得每条评论数据的分数;
将同一排队时长分类下的所述每条评论数据的分数进行求和计算,获得每个排队时长分类下的总分;
将所述每个排队时长分类中总分最高的所述排队时长,作为该商户的排队时长。
5.根据权利要求1-4任一项所述的商户排队时长的预测方法,其特征在于,根据所述用户对商户的评论数据进行分时段预测。
6.一种商户排队时长的预测装置,其特征在于,所述装置包括数据采集单元、到店时间获取单元、预测单元,其中:
所述数据采集单元用于根据用户对商户的评论数据,确定用户在所述商户的历史排队时长,具体包括:从用户评论区,挖掘用户对于在商户消费时排队情况的评论数据;预定义排队词语,对所有的评论数据进行深度学习,训练得到word2vec模型,根据与排队信息相关的预定义词语和训练的所述模型获得排队相关词语形成扩展词库;根据所述扩展词库得到与排队信息相关的模式串;逐一匹配所述模式串与所述评论数据,以获取所述评论数据对应的历史排队时长;
所述到店时间获取单元用于获取用户在所述商户的历史到店时间;
所述预测单元根据所述历史排队时长、历史到店时间预测所述商户的排队时长,包括:根据时间衰减函数,计算得到所述评论数据的时间衰减权重;根据所述历史排队时长、所述历史到店时间对所述排队时长预测模型进行训练,获得各个排队时长类型的权重;根据所述各个排队时类型的长权重及所述时间衰减权重,对所述评论数据进行处理,预测所述商户的排队时长。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的商户排队时长的预测方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序用于执行如上述权利要求1至5任一项所述的商户排队时长的预测方法。
CN201810463891.2A 2018-05-15 2018-05-15 商户排队时长的预测方法、装置、电子设备及存储介质 Active CN108647827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810463891.2A CN108647827B (zh) 2018-05-15 2018-05-15 商户排队时长的预测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810463891.2A CN108647827B (zh) 2018-05-15 2018-05-15 商户排队时长的预测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN108647827A CN108647827A (zh) 2018-10-12
CN108647827B true CN108647827B (zh) 2020-03-17

Family

ID=63756006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810463891.2A Active CN108647827B (zh) 2018-05-15 2018-05-15 商户排队时长的预测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN108647827B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741076A (zh) * 2018-12-28 2019-05-10 拉扎斯网络科技(上海)有限公司 商户合同生效时长确定方法及装置、电子设备及存储介质
CN109978198B (zh) * 2019-03-29 2021-11-26 时时同云科技(成都)有限责任公司 一种基于大数据及ai技术的候餐时长实时预估系统
CN111860903A (zh) * 2019-09-18 2020-10-30 北京嘀嘀无限科技发展有限公司 一种确定预估到达时间的方法和系统
CN111612594A (zh) * 2020-06-03 2020-09-01 天天向上(北京)网络科技有限公司 本地化电商零售系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985186A (zh) * 2014-05-28 2014-08-13 南京亿栋信息科技有限公司 一种用于排队机的等待时间预测方法
CN106203717A (zh) * 2016-07-15 2016-12-07 浪潮软件集团有限公司 基于数据分析的办税大厅智能导航方法
CN107895283A (zh) * 2017-11-07 2018-04-10 重庆邮电大学 一种基于时间序列分解的商家客流量大数据预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8732097B2 (en) * 2012-02-22 2014-05-20 Palo Alto Research Center Incorporated Automatically triggering predictions in recommendation systems based on an activity-probability threshold
US9183497B2 (en) * 2012-02-23 2015-11-10 Palo Alto Research Center Incorporated Performance-efficient system for predicting user activities based on time-related features

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985186A (zh) * 2014-05-28 2014-08-13 南京亿栋信息科技有限公司 一种用于排队机的等待时间预测方法
CN106203717A (zh) * 2016-07-15 2016-12-07 浪潮软件集团有限公司 基于数据分析的办税大厅智能导航方法
CN107895283A (zh) * 2017-11-07 2018-04-10 重庆邮电大学 一种基于时间序列分解的商家客流量大数据预测方法

Also Published As

Publication number Publication date
CN108647827A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN108647827B (zh) 商户排队时长的预测方法、装置、电子设备及存储介质
US20220005125A1 (en) Systems and methods for collecting and processing alternative data sources for risk analysis and insurance
CN109285075B (zh) 一种理赔风险评估方法、装置及服务器
US20190325514A1 (en) Credit risk prediction method and device based on lstm model
CN104915879B (zh) 基于金融数据的社会关系挖掘的方法及装置
US9183497B2 (en) Performance-efficient system for predicting user activities based on time-related features
JP6911603B2 (ja) ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置
WO2017190610A1 (zh) 目标用户定向方法、装置和计算机存储介质
WO2019105226A1 (zh) 一种用于营销活动效果预测的方法、装置及电子设备
CN107146089A (zh) 一种刷单识别方法及装置,电子设备
CN108737859A (zh) 基于弹幕的视频推荐方法和装置
CN110310163A (zh) 一种精准制定营销策略的方法、设备及可读介质
CN111126495B (zh) 模型训练方法、信息预测方法、装置、存储介质及设备
US11082509B1 (en) Determining session intent
JP2008547129A (ja) 自動広告掲載
Tsui et al. International arrivals forecasting for Australian airports and the impact of tourism marketing expenditure
CN110689402A (zh) 推荐商家的方法、装置、电子设备及可读存储介质
Zhang et al. Forecasting hotel room demand amid COVID-19
CN109949089A (zh) 一种确定展示率的方法、装置及终端
CN106909560B (zh) 兴趣点排序方法
CN103617146B (zh) 一种基于硬件资源消耗的机器学习方法及装置
US11244257B2 (en) Systems and methods for determining a likelihood of a lead conversion event
CA3032711A1 (en) Automated business reviews based on patron sentiment
US10762423B2 (en) Using a neural network to optimize processing of user requests
WO2019144035A1 (en) Systems and methods for collecting and processing alternative data sources for risk analysis and insurance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant