CN111782973A - 兴趣点状态预测方法、装置、电子设备及存储介质 - Google Patents
兴趣点状态预测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111782973A CN111782973A CN202010501586.5A CN202010501586A CN111782973A CN 111782973 A CN111782973 A CN 111782973A CN 202010501586 A CN202010501586 A CN 202010501586A CN 111782973 A CN111782973 A CN 111782973A
- Authority
- CN
- China
- Prior art keywords
- poi
- wifi
- state
- state prediction
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000012549 training Methods 0.000 claims description 19
- 238000005070 sampling Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种兴趣点状态预测方法、装置、电子设备及存储介质。兴趣点状态预测方法包括:获取待预测兴趣点POI多天的历史特征数据,所述历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征;将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值;依据所述状态预测值,确定所述待预测POI的状态。本发明能够提高POI状态预测的效率和准确性。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种兴趣点状态预测方法、装置、电子设备及存储介质。
背景技术
POI(Point of Interest,兴趣点)是地理信息系统发展到一定阶段后,随着用户的个性化服务需求而出现的。全面的POI讯息是丰富导航地图的条件,及时的POI能提醒用户路况的分支及周边建筑的详尽信息,也能方便导航中查到你所需要的各个地方,选择最为便捷和通畅的道路来进行路径规划。
在实际场景中,POI的状态可能会发生变化。比如,某个商铺由营业变为停业,或者由停业变为营业,等等。为了保证POI信息的准确性的,需及时获取POI状态的变化情况,并及时更新到地图数据中。
目前,检测POI状态的通常采用以下两种方式:一种是通过地图数据采集车来检测POI的状态。但是,该种方式受限于资源问题和时间成本,不能很快的发现状态发生变化的商铺,时效性较差。另一种是依靠人工打电话或者去现场核实POI的状态。但是,该种方式人工成本较高,并且时效性同样较差。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种兴趣点状态预测方法、装置、电子设备及存储介质。
第一方面,本发明实施例公开了一种兴趣点状态预测方法,包括:
获取待预测兴趣点POI多天的历史特征数据,所述历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征;
将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值;
依据所述状态预测值,确定所述待预测POI的状态。
可选地,在所述历史特征数据包括WiFi扫描特征时,获取待预测POI任意一天的WiFi扫描特征,包括:从预先生成的POI与WiFi的对应关系中,查找所述待预测POI对应的目标WiFi;获取在所述任意一天扫描所述目标WiFi的用户总数量,将所述用户总数量作为所述待预测POI在所述任意一天的WiFi扫描特征。
可选地,所述POI与WiFi的对应关系通过如下方式生成:获取历史用户现场订单信息,所述历史用户现场订单信息包括POI标识和用户连接的WiFi标识;确定所述用户连接的WiFi标识为所述POI标识对应的WiFi标识。
可选地,所述POI与WiFi的对应关系通过如下方式生成:获取历史用户定位信息,所述历史用户定位信息包括用户定位位置和用户扫描的WiFi标识;依据所述用户定位位置和所述用户扫描的WiFi标识,确定各POI对应的WiFi标识。
可选地,所述依据所述用户定位位置和所述用户扫描的WiFi标识,确定各POI对应的WiFi标识,包括:针对一个待关联POI,计算各用户定位位置与所述待关联POI的位置之间的距离,选取距离小于预设阈值的用户定位位置;将选取的用户定位位置对应的用户扫描的WiFi标识,与所述待关联POI的标识进行匹配,将匹配成功的WiFi标识作为所述待关联POI对应的WiFi标识。
可选地,所述依据所述状态预测值,确定所述待预测POI的状态,包括:在所述状态预测值小于预设的失效阈值时,确定所述待预测POI的状态为失效状态;在所述状态预测值大于预设的有效阈值时,确定所述待预测POI的状态为有效状态;所述失效阈值小于所述有效阈值。
可选地,所述状态预测模型通过如下方式训练:获取样本POI的样本标注状态和多天的样本历史特征数据;所述样本历史特征数据包括以下至少一种:样本WiFi连接特征、样本搜索点击特征、样本订单特征;将所述多天的样本历史特征数据输入待训练的状态预测模型,得到所述待训练的状态预测模型输出的,所述样本POI的样本状态预测值;依据所述样本POI的样本状态预测值及所述样本POI的样本标注状态,确定是否训练完成,并将训练完成的模型作为所述状态预测模型。
第二方面,本发明实施例公开了一种兴趣点状态预测装置,包括:
数据获取模块,用于获取待预测兴趣点POI多天的历史特征数据,所述历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征;
状态预测模块,用于将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值;
状态确定模块,用于依据所述状态预测值,确定所述待预测POI的状态。
可选地,所述数据获取模块包括:目标查找单元,用于从预先生成的POI与WiFi的对应关系中,查找所述待预测POI对应的目标WiFi;数量获取单元,用于获取在任意一天扫描所述目标WiFi的用户总数量,将所述用户总数量作为所述待预测POI在所述任意一天的WiFi扫描特征。
可选地,所述POI与WiFi的对应关系通过如下模块生成:第一关联模块,用于获取历史用户定位信息,所述历史用户定位信息包括用户定位位置和用户扫描的WiFi标识;依据所述用户定位位置和所述用户扫描的WiFi标识,确定各POI对应的WiFi标识。
可选地,所述POI与WiFi的对应关系通过如下模块生成:第二关联模块,用于获取历史用户现场订单信息,所述历史用户现场订单信息包括POI标识和用户连接的WiFi标识;确定所述用户连接的WiFi标识为所述POI标识对应的WiFi标识。
可选地,所述第一关联模块包括:选取单元,用于针对一个待关联POI,计算各用户定位位置与所述待关联POI的位置之间的距离,选取距离小于预设阈值的用户定位位置;匹配单元,用于将选取的用户定位位置对应的用户扫描的WiFi标识,与所述待关联POI的标识进行匹配,将匹配成功的WiFi标识作为所述待关联POI对应的WiFi标识。
可选地,所述状态确定模块,具体用于在所述状态预测值小于预设的失效阈值时,确定所述待预测POI的状态为失效状态;在所述状态预测值大于预设的有效阈值时,确定所述待预测POI的状态为有效状态;所述失效阈值小于所述有效阈值。
可选地,所述状态预测模型通过如下模块训练:样本获取模块,用于获取样本POI的样本标注状态和多天的样本历史特征数据;所述样本历史特征数据包括以下至少一种:样本WiFi连接特征、样本搜索点击特征、样本订单特征;样本预测模块,用于将所述多天的样本历史特征数据输入待训练的状态预测模型,得到所述待训练的状态预测模型输出的,所述样本POI的样本状态预测值;模型确定模块,用于依据所述样本POI的样本状态预测值及所述样本POI的样本标注状态,确定是否训练完成,并将训练完成的模型作为所述状态预测模型。
第三方面,本发明实施例公开了一种电子设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质;当所述指令由所述一个或多个处理器执行时,使得所述处理器执行如上任一项所述兴趣点状态预测方法。
第四方面,本发明实施例公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任一项所述的兴趣点状态预测方法。
本发明实施例中,在对POI进行状态预测时,获取待预测POI多天的历史特征数据,历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征;将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值;依据所述状态预测值,确定所述待预测POI的状态。由此可知,本发明实施例中,POI的状态与该POI对应的WiFi扫描特征、搜索点击特征、订单特征,通过状态预测模型基于POI多天的历史特征数据对POI的状态进行预测,能够提高预测的效率,更加及时地发现状态发生变化的POI,时效性更高;并且状态预测模型基于大量的样本数据训练得到,预测的准确性较高。
附图说明
图1是本发明实施例的一种兴趣点状态预测方法的步骤流程图。
图2是本发明实施例的一种状态预测模型训练方法的步骤流程图。
图3是本发明实施例的一种POI与WiFi进行关联过程的示意图。
图4是本发明实施例的另一种兴趣点状态预测方法的步骤流程图。
图5是本发明实施例的一种兴趣点状态预测过程的示意图。
图6是本发明实施例的一种兴趣点状态预测装置的结构框图。
图7是本发明实施例的另一种兴趣点状态预测装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明实施例的一种兴趣点状态预测方法的步骤流程图。
如图1所示,兴趣点状态预测方法可以包括以下步骤:
步骤101,获取待预测POI多天的历史特征数据。
一个POI可以是一个商铺、一个商场、一个公交站、一个公司,等等。
POI的状态可以包括有效状态和无效状态。POI的状态与该POI对应的WiFi(Wireless-Fidelity,无线保真)扫描特征、搜索点击特征、订单特征等特征相关。比如,对于一个商铺来说,如果有用户的客户端扫描到了该商铺的WiFi,则可以认为该商铺为有效状态(有效状态表示商铺营业,无效状态表示商铺停业);如果有用户在客户端中搜索到该商铺,或者点击了该商铺,则可以认为该商铺为有效状态;如果有用户在客户端中针对该商铺下了订单,则可以认为该商铺为有效状态。
针对一个待预测POI,获取该待预测POI多天的历史特征数据。所述历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征。
步骤102,将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值。
本发明实施例中,预先训练用于预测POI状态的状态预测模型。在训练过程中,采用大量样本POI对应的WiFi扫描特征、搜索点击特征、订单特征中的至少一种进行训练,训练得到的状态预测模型能够更加快速、更加准确地预测POI的状态。对于模型训练的具体过程,将在下面的实施例中详细介绍。
步骤103,依据所述状态预测值,确定所述待预测POI的状态。
将步骤101中获取的待预测POI多天的历史特征数据输入状态预测模型,该状态预测模型输出待预测POI的状态预测值。依据所述状态预测值,即可确定所述待预测POI的状态。
本发明实施例中,POI的状态与该POI对应的WiFi扫描特征、搜索点击特征、订单特征,通过状态预测模型基于POI多天的历史特征数据对POI的状态进行预测,能够提高预测的效率,更加及时地发现状态发生变化的POI,时效性更高;并且状态预测模型基于大量的样本数据训练得到,预测的准确性较高。
图2是本发明实施例的一种状态预测模型训练方法的步骤流程图。
如图2所示,状态预测模型训练方法包括以下步骤:
步骤201,获取样本POI的样本标注状态和多天的样本历史特征数据。
客户端在运行过程中,可以实时采集客户端自动生成的信息或者用户行为信息等上传至服务器中,服务器对这些信息进行维护。其中,客户端可以为各种生活消费类应用程序等。客户端自动生成的信息可以包括客户端自动扫描的WiFi信息等。用户行为信息可以包括用户的搜索信息、点击信息、订单信息等。
根据服务器中维护的信息,可以获取大量样本。比如,将处于有效状态的样本作为正样本,将处于无效状态的样本作为负样本。针对每个样本POI,标注该样本POI的状态,得到该样本POI的样本标注状态,样本标注状态可以包括有效状态和无效状态。针对每个样本POI,还获取该样本POI多天的样本历史特征数据。
多天可以为连续多天。对于其中多天的具体天数,本领域技术人员根据实际经验选用任意适用的数值均可。可选地,考虑到统计周期越长,不确定因素的影响越小,比如,对于各种假期(如国庆节、春节),POI在该假期内可能处于暂时停业状态,但假期前后处于营业状态,因此,为了规避这些因素的影响,可以将多天设置为连续至少8天,比如连续10天、连续15天,等等。
样本历史特征数据可以包括以下至少一种:样本WiFi连接特征、样本搜索点击特征、样本订单特征。
针对样本WiFi连接特征,获取样本POI任意一天的样本WiFi连接特征可以包括以下步骤A1~A2:
步骤A1,从预先生成的POI与WiFi的对应关系中,查找所述样本POI对应的目标WiFi。
步骤A2,获取在所述任意一天扫描所述目标WiFi的用户总数量,将所述用户总数量作为所述样本POI在所述任意一天的WiFi扫描特征。
如果要获取POI的WiFi连接特征,则需知道POI与WiFi的对应关系。本发明实施例中,为了避免每次获取WiFi连接特征时,都要确定POI与WiFi的对应关系,可以预先生成POI与WiFi的对应关系,并不断更新该对应关系,以便在获取WiFi连接特征时可以直接查询该对应关系,从而简化处理过程。
本发明实施例中,POI与WiFi的对应关系通过如下方式生成:
方式1,获取历史用户定位信息,所述历史用户定位信息包括用户定位位置和用户扫描的WiFi标识;依据所述用户定位位置和所述用户扫描的WiFi标识,确定各POI对应的WiFi标识。
用户在使用客户端的过程中,可以使用定位功能。在定位过程中,客户端将用户扫描的WiFi信息上传至服务器,服务器依据WiFi信息进行定位,得到用户定位位置,将用户扫描的WiFi信息和用户定位位置作为用户定位信息进行存储。用户扫描的WiFi信息可以包括WiFi的标识、WiFi的MAC(Media Access Control,媒体访问控制)地址等,Wi-Fi的标识可以包括但不限于:Wi-Fi名称、Wi-Fi的SSID(Service Set Identifier,服务集标识)。用户定位位置可以为用户的经纬度坐标。用户定位位置与待关联POI的位置之间具有一定的关联性,用户扫描的WiFi标识与待关联POI的位置之间具有一定的关联性,因此依据用户定位位置和用户扫描的WiFi标识,能够较为准确地挖掘出待关联POI对应的POI标识。
依据所述用户定位位置和所述用户扫描的WiFi标识,确定各POI对应的WiFi标识的过程,可以包括以下步骤A11~A12:
步骤A11,针对一个待关联POI,计算各用户定位位置与所述待关联POI的位置之间的距离,选取距离小于预设阈值的用户定位位置。
对于每个待关联POI,该待关联POI的位置是已知的。待关联POI的位置可以为该待关联POI的经纬度坐标。针对每个历史用户定位信息中的用户定位位置,分别计算该用户定位位置与待关联POI的位置之间的距离,选取距离小于预设阈值的用户定位位置。
对于预设阈值,本领域技术人员根据实际经验设置任意适用的数值均可。比如,可以根据通常情况下,用户在扫描到某个POI对应的WiFi时,用户与该POI之间的最大距离,设置该阈值,等等。
步骤A12,将选取的用户定位位置对应的用户扫描的WiFi标识,与所述待关联POI的标识进行匹配,将匹配成功的WiFi标识作为所述待关联POI对应的WiFi标识。
本发明实施例中,可以先将用户扫描的WiFi标识与待关联POI的标识进行字符的匹配(字符可以包括文字、拼音字母、符号等)。如果用户扫描的WiFi标识与待关联POI的标识中存在相同字符,则可以确定字符匹配成功,否则确定字符匹配失败。如果字符匹配成功,则确定用户扫描的WiFi标识与待关联POI的标识匹配成功。如果字符匹配失败,则可以再将用户扫描的WiFi标识与待关联POI的标识进行语义的匹配。比如,可以利用预设的语义模型对用户扫描的WiFi标识与待关联POI的标识进行匹配。如果语义匹配成功,则确定用户扫描的WiFi标识与待关联POI的标识匹配成功。如果语义匹配失败,则确定用户扫描的WiFi标识与待关联POI的标识匹配失败。其中,语义模型可以为DSSM(Deep StructuredSemantic Models,深度结构语义模型)CNN(Convolutional Neural Network,卷积神经网络)-DSSM,等等。
通过对用户定位位置与待关联POI的位置之间的距离进行判断,可以过滤掉距离较远的用户定位位置,该种用户定位位置无需再进一步进行标识匹配。通过对距离较近的用户定位位置对应的用户扫描的WiFi标识,与待关联POI的标识进行匹配,是基于通常情况下POI对应的WiFi标识通常与该POI的标识相关的情况考虑。距离计算和标识匹配的处理过程更加简便,处理结果更加准确。
方式2,获取历史用户现场订单信息,所述历史用户现场订单信息包括POI标识和用户连接的WiFi标识;确定所述用户连接的WiFi标识为所述POI标识对应的WiFi标识。
用户在使用客户端的过程中,如果针对某个POI,用户完成了现场订单,并在完成现场订单时客户端连接了WiFi(比如通过连接的WiFi在客户端上完成了现场订单),则服务器可以将POI标识和用户连接的WiFi标识作为用户现场订单信息进行存储。POI标识可以为POI的名称等。由于用户在完成现场订单时连接的WiFi通常即为POI对应的WiFi,因此针对一个历史用户现场订单信息,可以将该历史用户现场订单信息中包括的用户连接的WiFi标识,作为该历史用户现场订单信息中包括的POI标识对应的WiFi标识,从而能够较为准确地挖掘出待关联POI对应的POI标识。
其中,上述方式1和方式2之间为“和/或”的关系,“和/或”是指两者中的至少一个。也即,在生成POI与WiFi的对应关系时,既可以采用方式1,也可以采用方式2,也可以采用方式1和方式2。
图3是本发明实施例的一种POI与WiFi进行关联过程的示意图。如图3所示,WiFi挂接体系通过对历史用户定位信息(可以包括用户扫描的WiFi表示和用户定位位置)、历史用户现场订单信息(可以包括客户端消费、POS(Point Of Sale,销售终端)消费等)中的信息进行规则匹配(如字符匹配)和语义匹配,将WiFi标识挂接POI。
针对样本搜索点击特征,获取样本POI任意一天的样本搜索点击特征可以包括:获取在所述任意一天所述样本POI的搜索曝光量,将所述搜索曝光量作为所述样本POI在所述任意一天的样本搜索点击特征;或者,获取在所述任意一天所述样本POI的点击量,将所述点击量作为所述样本POI在所述任意一天的样本搜索点击特征。
针对样本订单特征,获取样本POI任意一天的样本订单特征可以包括:获取在所述任意一天所述样本POI的订单量,将所述订单量作为所述样本POI在所述任意一天的样本订单特征。其中,订单包括以下至少一种:网络订单、现场订单。
步骤202,将所述多天的样本历史特征数据输入待训练的状态预测模型,得到所述待训练的状态预测模型输出的,所述样本POI的样本状态预测值。
步骤203,依据所述样本POI的样本状态预测值及所述样本POI的样本标注状态,确定是否训练完成,并将训练完成的模型作为所述状态预测模型。
本发明实施例中,可以使用机器学习方法,例如随机森林,XGB(eXtreme GradientBoosting,极端梯度提升)等进行模型训练。
在一次训练过程中,得到所述待训练的状态预测模型输出的,所述样本POI的样本状态预测值后,如果所述样本状态预测值小于预设的失效阈值,则确定所述样本POI的预测状态为失效状态;如果所述样本状态预测值大于预设的有效阈值,则确定所述样本POI的预测状态为有效状态。如果样本POI的预测状态与标注状态相同,则可以确定训练完成,否则调整模型参数,继续训练。
其中,失效阈值小于有效阈值。对于失效阈值和有效阈值的具体数值,本领域技术人员根据实际经验设置任意适用的数值均可,本发明实施例对此不作限制。比如,可以设置失效阈值为0.3,有效阈值为0.8,等等。
本发明实施例中,状态预测模型基于大量样本POI的样本标注状态和多天的样本历史特征数据训练得到,准确性较高。
图4是本发明实施例的另一种兴趣点状态预测方法的步骤流程图。
如图4所示,兴趣点状态预测方法可以包括以下步骤:
步骤401,获取待预测POI多天的历史特征数据。
历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征。
针对WiFi连接特征,获取待预测POI任意一天的WiFi连接特征可以包括以下步骤B1~B2:
步骤B1,从预先生成的POI与WiFi的对应关系中,查找所述待预测POI对应的目标WiFi。
对于生成POI与WiFi的对应关系的过程,可以参照上述图2对应实施例中的相关描述,本发明实施例在此不再详细论述。
步骤B2,获取在所述任意一天扫描所述目标WiFi的用户总数量,将所述用户总数量作为所述待预测POI在所述任意一天的WiFi扫描特征。
针对搜索点击特征,获取待预测POI任意一天的搜索点击特征可以包括:获取在所述任意一天所述待预测POI的搜索曝光量,将所述搜索曝光量作为所述待预测POI在所述任意一天的搜索点击特征;或者,获取在所述任意一天所述待预测POI的点击量,将所述点击量作为所述待预测POI在所述任意一天的搜索点击特征。
针对订单特征,获取待预测POI任意一天的订单特征可以包括:获取在所述任意一天所述待预测POI的订单量,将所述订单量作为所述待预测POI在所述任意一天的订单特征。其中,订单包括以下至少一种:网络订单、现场订单。
步骤402,将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值。
步骤403,在所述状态预测值小于预设的失效阈值时,确定所述待预测POI的状态为失效状态。
步骤404,在所述状态预测值大于预设的有效阈值时,确定所述待预测POI的状态为有效状态。
在得到所述状态预测模型输出的,所述待预测POI的状态预测值后,将待预测POI的状态预测值于预设的失效阈值和预设的有效阈值进行比较。如果所述状态预测值小于预设的失效阈值,则确定所述待预测POI的状态为失效状态;如果所述状态预测值大于预设的有效阈值,则确定所述待预测POI的状态为有效状态;所述失效阈值小于所述有效阈值。
图5是本发明实施例的一种兴趣点状态预测过程的示意图。
图5中,以POI为商铺为例进行说明。如图5所示,获取商铺的WiFi扫描特征、商铺的搜索点击特征、商铺的订单特征,将其输入至状态预测模型,通过状态预测模型的输出确定商铺的有效/无效(营业/停业)状态。在实现中,可以将WiFi扫描特征、搜索点击特征、订单特征拼接成一个特征向量后,输入状态预测模型。
比如,下面表一是A店和B店这两家商铺在15天之内的WiFi扫描特征、搜索点击特征、订单特征,将这些特征数据输入到状态预测模型中,可以看到状态预测模型对于A店得出的是0.94的一个状态预测得分,说明A店大概率是正常营业(有效)的状态;而对于B店,得出的是0.12的一个状态预测得分,说明B店很有可能是暂停营业(无效)的状态。
表一
本发明实施例中,通过模型预测POI的状态,能够节省各种成本,不需要大量的人力、物力,并且准确率高,可以不断地优化迭代,改进效果。
参照图6,示出了本发明实施例的一种兴趣点状态预测装置的结构框图。
如图6所示,兴趣点状态预测装置可以包括以下模块:
数据获取模块601,用于获取待预测兴趣点POI多天的历史特征数据,所述历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征;
状态预测模块602,用于将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值;
状态确定模块603,用于依据所述状态预测值,确定所述待预测POI的状态。
参照图7,示出了本发明实施例的另一种兴趣点状态预测装置的结构框图。
如图7所示,兴趣点状态预测装置可以包括以下模块:
数据获取模块701,用于获取待预测兴趣点POI多天的历史特征数据,所述历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征;
状态预测模块702,用于将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值;
状态确定模块703,用于依据所述状态预测值,确定所述待预测POI的状态。
可选地,所述数据获取模块701包括:目标查找单元7011,用于从预先生成的POI与WiFi的对应关系中,查找所述待预测POI对应的目标WiFi;数量获取单元7012,用于获取在任意一天扫描所述目标WiFi的用户总数量,将所述用户总数量作为所述待预测POI在所述任意一天的WiFi扫描特征。
可选地,所述POI与WiFi的对应关系通过如下模块生成:第一关联模块704,用于获取历史用户定位信息,所述历史用户定位信息包括用户定位位置和用户扫描的WiFi标识;依据所述用户定位位置和所述用户扫描的WiFi标识,确定各POI对应的WiFi标识。
可选地,所述POI与WiFi的对应关系通过如下模块生成:第二关联模块705,用于获取历史用户现场订单信息,所述历史用户现场订单信息包括POI标识和用户连接的WiFi标识;确定所述用户连接的WiFi标识为所述POI标识对应的WiFi标识。
可选地,所述第一关联模块704包括:选取单元7041,用于针对一个待关联POI,计算各用户定位位置与所述待关联POI的位置之间的距离,选取距离小于预设阈值的用户定位位置;匹配单元7042,用于将选取的用户定位位置对应的用户扫描的WiFi标识,与所述待关联POI的标识进行匹配,将匹配成功的WiFi标识作为所述待关联POI对应的WiFi标识。
可选地,所述状态确定模块703,具体用于在所述状态预测值小于预设的失效阈值时,确定所述待预测POI的状态为失效状态;在所述状态预测值大于预设的有效阈值时,确定所述待预测POI的状态为有效状态;所述失效阈值小于所述有效阈值。
可选地,所述状态预测模型通过如下模块训练:样本获取模块,用于获取样本POI的样本标注状态和多天的样本历史特征数据;所述样本历史特征数据包括以下至少一种:样本WiFi连接特征、样本搜索点击特征、样本订单特征;样本预测模块,用于将所述多天的样本历史特征数据输入待训练的状态预测模型,得到所述待训练的状态预测模型输出的,所述样本POI的样本状态预测值;模型确定模块,用于依据所述样本POI的样本状态预测值及所述样本POI的样本标注状态,确定是否训练完成,并将训练完成的模型作为所述状态预测模型。
本发明实施例中,POI的状态与该POI对应的WiFi扫描特征、搜索点击特征、订单特征,通过状态预测模型基于POI多天的历史特征数据对POI的状态进行预测,能够提高预测的效率,更加及时地发现状态发生变化的POI,时效性更高;并且状态预测模型基于大量的样本数据训练得到,预测的准确性较高。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在本发明的实施例中,还提供了一种电子设备。该电子设备可以包括一个或多个处理器,以及其上存储有指令的一个或多个机器可读介质,指令例如应用程序。当所述指令由所述一个或多个处理器执行时,使得所述处理器执行上述的方法。
在本发明的实施例中,还提供了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序可由电子设备的处理器执行,以完成上述的方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种兴趣点状态预测方法、装置、电子设备及存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种兴趣点状态预测方法,其特征在于,包括:
获取待预测兴趣点POI多天的历史特征数据,所述历史特征数据包括以下至少一种:无线保真WiFi扫描特征、搜索点击特征、订单特征;
将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值;
依据所述状态预测值,确定所述待预测POI的状态。
2.根据权利要求1所述的方法,其特征在于,在所述历史特征数据包括WiFi扫描特征时,获取待预测POI任意一天的WiFi扫描特征,包括:
从预先生成的POI与WiFi的对应关系中,查找所述待预测POI对应的目标WiFi;
获取在所述任意一天扫描所述目标WiFi的用户总数量,将所述用户总数量作为所述待预测POI在所述任意一天的WiFi扫描特征。
3.根据权利要求2所述的方法,其特征在于,所述POI与WiFi的对应关系通过如下方式生成:
获取历史用户现场订单信息,所述历史用户现场订单信息包括POI标识和用户连接的WiFi标识;
确定所述用户连接的WiFi标识为所述POI标识对应的WiFi标识。
4.根据权利要求2所述的方法,其特征在于,所述POI与WiFi的对应关系通过如下方式生成:
获取历史用户定位信息,所述历史用户定位信息包括用户定位位置和用户扫描的WiFi标识;
依据所述用户定位位置和所述用户扫描的WiFi标识,确定各POI对应的WiFi标识。
5.根据权利要求4所述的方法,其特征在于,所述依据所述用户定位位置和所述用户扫描的WiFi标识,确定各POI对应的WiFi标识,包括:
针对一个待关联POI,计算各用户定位位置与所述待关联POI的位置之间的距离,选取距离小于预设阈值的用户定位位置;
将选取的用户定位位置对应的用户扫描的WiFi标识,与所述待关联POI的标识进行匹配,将匹配成功的WiFi标识作为所述待关联POI对应的WiFi标识。
6.根据权利要求1所述的方法,其特征在于,所述依据所述状态预测值,确定所述待预测POI的状态,包括:
在所述状态预测值小于预设的失效阈值时,确定所述待预测POI的状态为失效状态;
在所述状态预测值大于预设的有效阈值时,确定所述待预测POI的状态为有效状态;所述失效阈值小于所述有效阈值。
7.根据权利要求1所述的方法,其特征在于,所述状态预测模型通过如下方式训练:
获取样本POI的样本标注状态和多天的样本历史特征数据;所述样本历史特征数据包括以下至少一种:样本WiFi连接特征、样本搜索点击特征、样本订单特征;
将所述多天的样本历史特征数据输入待训练的状态预测模型,得到所述待训练的状态预测模型输出的,所述样本POI的样本状态预测值;
依据所述样本POI的样本状态预测值及所述样本POI的样本标注状态,确定是否训练完成,并将训练完成的模型作为所述状态预测模型。
8.一种兴趣点状态预测装置,其特征在于,包括:
数据获取模块,用于获取待预测兴趣点POI多天的历史特征数据,所述历史特征数据包括以下至少一种:WiFi扫描特征、搜索点击特征、订单特征;
状态预测模块,用于将所述多天的历史特征数据输入预先训练的状态预测模型,得到所述状态预测模型输出的,所述待预测POI的状态预测值;
状态确定模块,用于依据所述状态预测值,确定所述待预测POI的状态。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质;
当所述指令由所述一个或多个处理器执行时,使得所述处理器执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010501586.5A CN111782973A (zh) | 2020-06-04 | 2020-06-04 | 兴趣点状态预测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010501586.5A CN111782973A (zh) | 2020-06-04 | 2020-06-04 | 兴趣点状态预测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111782973A true CN111782973A (zh) | 2020-10-16 |
Family
ID=72754067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010501586.5A Pending CN111782973A (zh) | 2020-06-04 | 2020-06-04 | 兴趣点状态预测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782973A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417192A (zh) * | 2022-03-28 | 2022-04-29 | 北京百度网讯科技有限公司 | 更新兴趣点poi状态的方法、装置、设备、介质及产品 |
CN115309999A (zh) * | 2022-10-11 | 2022-11-08 | 北京高德云信科技有限公司 | 兴趣点状态预测方法、装置、电子设备及计算机存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102933938A (zh) * | 2010-02-08 | 2013-02-13 | 通腾波兰股份有限公司 | 用于评估兴趣点的属性的方法及设备 |
US20160026722A1 (en) * | 2014-07-22 | 2016-01-28 | Korea Institute Of Science And Technology | Content management device and content management method |
CN106302664A (zh) * | 2016-08-03 | 2017-01-04 | 百度在线网络技术(北京)有限公司 | 一种兴趣点失效校验的方法和装置 |
US20180041867A1 (en) * | 2016-08-05 | 2018-02-08 | Baidu Online Network Technology (Beijing) Co., Ltd | Method and apparatus for matching wireless hotspot with poi |
US20180160261A1 (en) * | 2016-12-02 | 2018-06-07 | Samsung Electronics Co., Ltd. | Method for providing point of interest information and electronic device supporting the same |
CN109858683A (zh) * | 2019-01-07 | 2019-06-07 | 北京三快在线科技有限公司 | 确定店铺的营业状态的方法、装置、电子设备及存储介质 |
CN110019616A (zh) * | 2017-12-04 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 一种poi现势状态获取方法及其设备、存储介质、服务器 |
CN110347775A (zh) * | 2019-07-17 | 2019-10-18 | 北京百度网讯科技有限公司 | 兴趣点状态校正方法、装置、设备及计算机可读存储介质 |
US20190370251A1 (en) * | 2017-02-06 | 2019-12-05 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for data updating |
CN110674232A (zh) * | 2018-06-14 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 地图兴趣点的处理方法、装置、服务器及存储介质 |
-
2020
- 2020-06-04 CN CN202010501586.5A patent/CN111782973A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102933938A (zh) * | 2010-02-08 | 2013-02-13 | 通腾波兰股份有限公司 | 用于评估兴趣点的属性的方法及设备 |
US20160026722A1 (en) * | 2014-07-22 | 2016-01-28 | Korea Institute Of Science And Technology | Content management device and content management method |
CN106302664A (zh) * | 2016-08-03 | 2017-01-04 | 百度在线网络技术(北京)有限公司 | 一种兴趣点失效校验的方法和装置 |
US20180041867A1 (en) * | 2016-08-05 | 2018-02-08 | Baidu Online Network Technology (Beijing) Co., Ltd | Method and apparatus for matching wireless hotspot with poi |
US20180160261A1 (en) * | 2016-12-02 | 2018-06-07 | Samsung Electronics Co., Ltd. | Method for providing point of interest information and electronic device supporting the same |
US20190370251A1 (en) * | 2017-02-06 | 2019-12-05 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for data updating |
CN110019616A (zh) * | 2017-12-04 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 一种poi现势状态获取方法及其设备、存储介质、服务器 |
CN110674232A (zh) * | 2018-06-14 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 地图兴趣点的处理方法、装置、服务器及存储介质 |
CN109858683A (zh) * | 2019-01-07 | 2019-06-07 | 北京三快在线科技有限公司 | 确定店铺的营业状态的方法、装置、电子设备及存储介质 |
CN110347775A (zh) * | 2019-07-17 | 2019-10-18 | 北京百度网讯科技有限公司 | 兴趣点状态校正方法、装置、设备及计算机可读存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417192A (zh) * | 2022-03-28 | 2022-04-29 | 北京百度网讯科技有限公司 | 更新兴趣点poi状态的方法、装置、设备、介质及产品 |
WO2023184777A1 (zh) * | 2022-03-28 | 2023-10-05 | 北京百度网讯科技有限公司 | 更新兴趣点poi状态的方法、装置、设备、介质及产品 |
CN115309999A (zh) * | 2022-10-11 | 2022-11-08 | 北京高德云信科技有限公司 | 兴趣点状态预测方法、装置、电子设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101721339B1 (ko) | 새로운 공급처의 주소를 확정하는 방법 및 장치 | |
CN107851243B (zh) | 推断物理会议位置 | |
CN110929162A (zh) | 基于兴趣点的推荐方法、装置、计算机设备和存储介质 | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
US11216499B2 (en) | Information retrieval apparatus, information retrieval system, and information retrieval method | |
CN106767835B (zh) | 定位方法和装置 | |
CN104731917A (zh) | 一种推荐方法及装置 | |
CN109858683B (zh) | 确定店铺的营业状态的方法、装置、电子设备及存储介质 | |
CN110020144B (zh) | 一种推荐模型建立方法及其设备、存储介质、服务器 | |
CN110674423A (zh) | 一种地址定位的方法、装置、可读存储介质和电子设备 | |
CN105517679A (zh) | 用户地理位置的确定 | |
CN111132027B (zh) | 一种场景识别网络图的绘制方法、场景识别方法及装置 | |
CN111814069A (zh) | 信息处理方法、装置、存储介质以及电子设备 | |
CN111782741A (zh) | 兴趣点挖掘方法、装置、电子设备及存储介质 | |
CN111782973A (zh) | 兴趣点状态预测方法、装置、电子设备及存储介质 | |
CN111931077B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN107133689B (zh) | 一种位置标记方法 | |
CN110263250B (zh) | 一种推荐模型的生成方法及装置 | |
CN110647602B (zh) | 一种基于定位点经纬度确定对应兴趣点的方法和系统 | |
CN110674208B (zh) | 用于确定用户的职住地信息的方法和装置 | |
Mahmud et al. | State of mobile crowdsourcing applications: A review | |
CN110096609A (zh) | 房源搜索方法、装置、设备及计算机可读存储介质 | |
CN111624640B (zh) | 定位方法、装置、电子设备及存储介质 | |
CN111782955A (zh) | 兴趣点表示和推送方法、装置、电子设备及存储介质 | |
CN110825960A (zh) | 一种学习内容推荐方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |