CN113190640B - 兴趣点数据处理方法及装置 - Google Patents

兴趣点数据处理方法及装置 Download PDF

Info

Publication number
CN113190640B
CN113190640B CN202110552172.XA CN202110552172A CN113190640B CN 113190640 B CN113190640 B CN 113190640B CN 202110552172 A CN202110552172 A CN 202110552172A CN 113190640 B CN113190640 B CN 113190640B
Authority
CN
China
Prior art keywords
interest
interest point
address
point
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110552172.XA
Other languages
English (en)
Other versions
CN113190640A (zh
Inventor
刘小杰
王丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rajax Network Technology Co Ltd
Original Assignee
Rajax Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rajax Network Technology Co Ltd filed Critical Rajax Network Technology Co Ltd
Priority to CN202110552172.XA priority Critical patent/CN113190640B/zh
Publication of CN113190640A publication Critical patent/CN113190640A/zh
Application granted granted Critical
Publication of CN113190640B publication Critical patent/CN113190640B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing

Abstract

本发明实施例公开了一种兴趣点数据处理方法及装置。其中,方法包括:获取订单数据生产端产生的订单数据,从订单数据中提取出候选兴趣点;将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从候选兴趣点中筛选出目标兴趣点;将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库。本方案能够实现兴趣点的自动提取及存储,减少人工成本;而且依据兴趣点类型对候选兴趣点进行类型过滤,有效避免了兴趣点数据库中存储较多的冗余兴趣点数据,并避免了冗余兴趣点数据对业务服务的干扰。

Description

兴趣点数据处理方法及装置
技术领域
本发明实施例涉及数据处理技术领域,具体涉及一种兴趣点数据处理方法、装置、计算设备及计算机存储介质。
背景技术
兴趣点(POI,Point of Interest)是地理信息系统中可以抽象为点的地理对象。例如,兴趣点可以为商铺、学校、银行、以及楼栋等。准确的兴趣点数据能够为基于地理信息的服务(如订单配送服务及导航服务等)提供有效辅助。
现有技术在挖掘兴趣点之后便直接将所有挖掘出的兴趣点的兴趣点数据存储于兴趣点数据库中,继而利用兴趣点数据库中的兴趣点进行业务服务。采用该种方式,会导致兴趣点数据库中存在大量的冗余兴趣点,增加了存储成本。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的兴趣点数据处理方法、装置、计算设备及计算机存储介质。
根据本发明实施例的一个方面,提供了一种兴趣点数据处理方法,包括:
获取订单数据生产端产生的订单数据,从所述订单数据中提取出候选兴趣点;
将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从所述候选兴趣点中筛选出目标兴趣点;其中,所述目标兴趣点的兴趣点类型与所述黑名单兴趣点类型不匹配;
将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库。
在一种可选的实施方式中,在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,所述方法还包括:
根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出订单热度小于第一预设阈值的低热度兴趣点;
根据低热度兴趣点的兴趣点类型,确定与预设业务场景对应的第一类黑名单兴趣点类型。
在一种可选的实施方式中,在所述根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出低热度兴趣点之前,所述方法还包括:
针对兴趣点数据库中任一已存储的兴趣点,统计在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量;其中,所述预设类型订单为所述预设业务场景中的订单;
根据在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量,计算该兴趣点的订单热度。
在一种可选的实施方式中,在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,所述方法还包括:
针对于任一兴趣点类型,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数;
将对应的用户体验评价参数小于第二预设阈值的兴趣点类型作为与预设业务场景对应的第二类黑名单兴趣点类型。
在一种可选的实施方式中,所述计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数进一步包括:
根据在所述预设业务场景中该兴趣点类型所对应的配送时效评价参数、兴趣点稳定性评价参数、和/或订单消费舒适度评价参数,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数。
在一种可选的实施方式中,在所述将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库之前,所述方法还包括:
判断目标兴趣点的兴趣点地址是否完整;若否,则对目标兴趣点的兴趣点地址进行地址补全处理;
则所述将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库进一步包括:若目标兴趣点的兴趣点地址不完整,则将地址补全处理后的目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库。
在一种可选的实施方式中,所述对目标兴趣点的兴趣点地址进行地址补全处理进一步包括:
对目标兴趣点的兴趣点地址名称进行实体识别,以从兴趣点地址名称中提取出地址实体;
从所述地址实体中筛选出地址关键字;
查找与所述地址关键字及所述兴趣点地址坐标匹配的标准地址;
将标准地址的地址名称与兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
在一种可选的实施方式中,所述对目标兴趣点的兴趣点地址进行地址补全处理进一步包括:
对兴趣点地址名称进行实体识别,以从所述兴趣点地址名称中提取出地址关键字;
在预先构建的地址知识图谱中查找与地址关键字关联的图谱节点;
将图谱节点的节点名称以及兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
在一种可选的实施方式中,在所述获取订单数据生产端产生的订单数据之后,所述方法还包括:
判断所述预设业务场景对应的兴趣点数据库中是否存储有与所述订单数据关联的兴趣点;
则所述从所述订单数据中提取出候选兴趣点进一步包括:若所述预设业务场景对应的兴趣点数据库中未存储有与所述订单数据关联的兴趣点,则从所述订单数据中提取出候选兴趣点。
在一种可选的实施方式中,在所述获取订单数据生产端产生的订单数据之后,所述方法还包括:判断所述订单数据中的订单地址是否包含楼栋信息;
则所述从所述订单数据中提取出候选兴趣点进一步包括:若所述订单数据中的订单地址包含楼栋信息,则从所述订单数据中提取出候选兴趣点。
根据本发明实施例的又一方面,提供了一种兴趣点数据处理装置,包括:
获取模块,用于获取订单数据生产端产生的订单数据;
提取模块,用于从所述订单数据中提取出候选兴趣点;
筛选模块,用于将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从所述候选兴趣点中筛选出目标兴趣点;其中,所述目标兴趣点的兴趣点类型与所述黑名单兴趣点类型不匹配;
存储模块,用于将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库。
在一种可选的实施方式中,所述装置还包括:
黑名单生成模块,用于在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出订单热度小于第一预设阈值的低热度兴趣点;
根据低热度兴趣点的兴趣点类型,确定与预设业务场景对应的第一类黑名单兴趣点类型。
在一种可选的实施方式中,所述黑名单生成模块进一步用于:在所述根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出低热度兴趣点之前,针对兴趣点数据库中任一已存储的兴趣点,统计在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量;其中,所述预设类型订单为所述预设业务场景中的订单;
根据在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量,计算该兴趣点的订单热度。
在一种可选的实施方式中,所述装置还包括:
黑名单生成模块,用于在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,针对于任一兴趣点类型,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数;
将对应的用户体验评价参数小于第二预设阈值的兴趣点类型作为与预设业务场景对应的第二类黑名单兴趣点类型。
在一种可选的实施方式中,所述黑名单生成模块进一步用于:根据在所述预设业务场景中该兴趣点类型所对应的配送时效评价参数、兴趣点稳定性评价参数、和/或订单消费舒适度评价参数,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数。
在一种可选的实施方式中,所述装置还包括:
地址补全模块,用于在所述将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库之前,判断目标兴趣点的兴趣点地址是否完整;若否,则对目标兴趣点的兴趣点地址进行地址补全处理;
则所述存储模块进一步用于:若目标兴趣点的兴趣点地址不完整,则将地址补全处理后的目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库。
在一种可选的实施方式中,所述地址补全模块进一步用于:
对目标兴趣点的兴趣点地址名称进行实体识别,以从兴趣点地址名称中提取出地址实体;
从所述地址实体中筛选出地址关键字;
查找与所述地址关键字及所述兴趣点地址坐标匹配的标准地址;
将标准地址的地址名称与兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
在一种可选的实施方式中,所述地址补全模块进一步用于:
对兴趣点地址名称进行实体识别,以从所述兴趣点地址名称中提取出地址关键字;
在预先构建的地址知识图谱中查找与地址关键字关联的图谱节点;
将图谱节点的节点名称以及兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
在一种可选的实施方式中,所述提取模块进一步用于:
在所述获取订单数据生产端产生的订单数据之后,判断所述预设业务场景对应的兴趣点数据库中是否存储有与所述订单数据关联的兴趣点;
若所述预设业务场景对应的兴趣点数据库中未存储有与所述订单数据关联的兴趣点,则从所述订单数据中提取出候选兴趣点。
在一种可选的实施方式中,所述提取模块进一步用于:
在所述获取订单数据生产端产生的订单数据之后,判断所述订单数据中的订单地址是否包含楼栋信息;
若所述订单数据中的订单地址包含楼栋信息,则从所述订单数据中提取出候选兴趣点。
根据本发明实施例的再一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述兴趣点数据处理方法对应的操作。
根据本发明实施例的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述兴趣点数据处理方法对应的操作。
根据本发明实施例的提供的兴趣点数据处理方法及装置,先获取订单数据生产端产生的订单数据,从订单数据中提取出候选兴趣点;进一步将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从候选兴趣点中筛选出目标兴趣点;最终将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库。本方案能够实现兴趣点的自动提取及存储,减少人工成本;而且依据兴趣点类型对候选兴趣点进行类型过滤,有效避免了兴趣点数据库中存储较多的冗余兴趣点数据,并避免了冗余兴趣点数据对业务服务的干扰。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例提供的一种兴趣点数据处理方法的流程图;
图2示出了根据本发明另一个实施例提供的一种兴趣点数据处理方法的流程图;
图3示出了根据本发明又一个实施例提供的一种兴趣点数据处理方法的流程图;
图4示出了根据本发明一个实施例提供的一种兴趣点数据处理装置的结构图;
图5示出了根据本发明一个实施例提供的一种计算设备的结构图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例提供的一种兴趣点数据处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S110,获取订单数据生产端产生的订单数据,从订单数据中提取出候选兴趣点。
订单数据生产端可以是为用户提供订单服务的业务服务器,订单数据生产端中记录有大量的历史订单数据,并随着时间的推移不断产生新的订单数据。在一种可选的实施方式中,在获得用户授权的情况下,本发明实施例定期或实时地获取订单数据生产端新产生的订单数据,并通过后续步骤基于该新产生的订单数据挖掘出目标兴趣点,从而及时更新兴趣点数据库中的兴趣点数据。
基于订单数据生产端产生的订单数据可以初步挖掘出候选兴趣点。本发明实施例对候选兴趣点的挖掘方式不作限定。
步骤S120,将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从候选兴趣点中筛选出目标兴趣点。
由于业务场景不同,业务服务所依据的兴趣点的兴趣点类型也存在差异。现有技术中,所有的业务场景均采用同一套兴趣点数据,从而各个业务场景所对应的兴趣点数据库均需要存储所有挖掘出的兴趣点数据,一方面造成了存储资源的浪费,另一方面兴趣点数据库中与业务场景无关的兴趣点数据还会造成对业务服务的干扰,从而降低业务服务质量。
基于此,与现有技术不同的是,本发明实施例从订单数据中挖掘出兴趣点之后,并未直接将该兴趣点存储至兴趣点数据库中,而是先将初步挖掘出的兴趣点作为候选兴趣点,并进一步依据候选兴趣点的类型进行过滤,以从候选兴趣点中筛选出预设业务场景所需的目标兴趣点。
具体地,本发明实施例为了准确且快速地筛选出目标兴趣点,预先生成了预设业务场景对应的兴趣点类型黑名单。兴趣点类型黑名单中存储有该预设业务场景不需要的兴趣点类型,该预设业务场景不需要的兴趣点类型为黑名单兴趣点类型。由此从候选兴趣点中筛选出兴趣点类型与黑名单兴趣点类型不匹配的目标兴趣点。例如,若预设业务场景为餐饮外卖业务场景,则餐饮外卖业务场景的兴趣点类型黑名单中包含黑名单兴趣点类型“公共厕所”。则最终筛选出的目标兴趣点的兴趣点类型不包括黑名单兴趣点类型“公共厕所”。
步骤S130,将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库。
其中,存储的目标兴趣点的兴趣点数据可以包括兴趣点地址等等。
由此可见,本发明实施例能够自动地根据订单数据来挖掘出目标兴趣点,并将目标兴趣点存储至对应的兴趣点数据库中,从而实现兴趣点的自动挖掘及存储,减少人工成本;而且本发明实施例再从订单数据中提取出候选兴趣点之后,依据兴趣点类型对候选兴趣点进行类型过滤,以筛选出与预设业务场景匹配的目标兴趣点,并仅将目标兴趣点的兴趣点数据存储至预设业务场景对应的兴趣点数据库中,从而避免兴趣点数据库中存储较多的冗余兴趣点数据,并避免冗余兴趣点数据对业务服务的干扰。
图2示出了根据本发明另一个实施例提供的一种兴趣点数据处理方法的流程图,如图2所示,该方法包括如下步骤:
步骤S210,预先生成预设业务场景对应的兴趣点类型黑名单;其中,兴趣点类型黑名单中包含有至少一个与预设业务场景对应的黑名单兴趣点类型。
在一种可选的实施方式中,虽然预设业务场景对应的兴趣点数据库中已存储的兴趣点是经过类型过滤后的兴趣点,然而由于业务变化等因素影响,兴趣点数据库中某些兴趣点与预设业务场景的关联性变弱,从而不再适宜存储在与预设业务场景对应的兴趣点数据库中。本发明实施例除了将该类兴趣点从兴趣点数据库中剔除以外,还进一步基于该类兴趣点,生成与预设业务场景对应的第一类黑名单兴趣点类型。
具体地,首先针对兴趣点数据库中任一已存储的兴趣点,统计在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量;其中,预设类型订单为预设业务场景中的订单。例如,预设业务场景为餐饮外卖业务场景,则预设类型订单应当为餐饮外卖订单。预设历史时间窗口可以为最近一个月等距离当前较近的时间段。
根据在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量,计算该兴趣点的订单热度。其中,与该兴趣点关联的预设类型订单的订单数量越多,则该兴趣点的订单热度越高。通过已存储的兴趣点的订单热度,能够反映近期已存储的兴趣点与预设业务场景的关联强度,其中订单热度越高则表明已存储的兴趣点与预设业务场景的关联强度越强;反之,订单热度越低则表明已存储的兴趣点与预设业务场景的关联强度越弱。
进一步根据兴趣点数据库中已存储的兴趣点的订单热度,从已存储的兴趣点中筛选出订单热度小于第一预设阈值的低热度兴趣点。该低热度兴趣点是当前不再适宜存储至兴趣点数据库中的兴趣点。继而根据低热度兴趣点的兴趣点类型,确定与预设业务场景对应的第一类黑名单兴趣点类型,并将第一类黑名单兴趣点类型记录于与预设业务场景对应的兴趣点类型黑名单中。
在又一种可选的实施方式中,根据在预设业务场景中兴趣点类型所对应的用户体验来确定第二类黑名单兴趣点类型。具体地,针对于任一兴趣点类型,根据在预设业务场景中该兴趣点类型所对应的配送时效评价参数、兴趣点稳定性评价参数、和/或订单消费舒适度评价参数,计算在预设业务场景中该兴趣点类型所对应的用户体验评价参数。例如,预设业务场景为餐饮外卖业务场景为例,若兴趣点类型为“公共厕所”,则兴趣点类型“公共厕所”所对应的订单消费舒适度评价参数较低;又或者,兴趣点类型为“A湖中心”,则确定出兴趣点类型“A湖中心”在餐饮外卖场景中的配送难度高,配送时效性差,兴趣点类型“A湖中心”所对应的配送时效评价参数较低;再者,兴趣点类型为“限时促销活动展”,则确定出兴趣点类型“限时促销活动展”所对应的兴趣点稳定性评价参数较低。
进一步将对应的用户体验评价参数小于第二预设阈值的兴趣点类型作为与预设业务场景对应的第二类黑名单兴趣点类型,从而可筛选出在预设业务场景中用户体验差的兴趣点类型。
本步骤根据已存储的兴趣点的订单热度确定出当前与预设业务场景关联性弱的第一类黑名单兴趣点类型,以及根据在预设业务场景中兴趣点类型对应的用户体验评价参数确定出用户体验差的第二类黑名单兴趣点类型,从而能够全面地获得不适于存储至预设业务场景对应的兴趣点数据库的兴趣点类型。
步骤S220,获取订单数据生产端产生的订单数据,从订单数据中提取出候选兴趣点。
在一种可选的实施方式中,针对于任意一条订单数据,先判断预设业务场景对应的兴趣点数据库中是否存储有与该订单数据关联的兴趣点,若否,从该订单数据中提取出候选兴趣点;若是,则舍弃该条订单数据。采用该种方式,能够及时地挖掘出新的候选兴趣点。
在又一种可选的实施方式中,针对于任意一条订单数据,判断该订单数据中的订单地址是否包含楼栋信息;若是,则从该订单数据中提取出候选兴趣点;若否,则舍弃该订单数据。采用该种方式,能够提取出细粒度的候选兴趣点。其中,实际的订单数据中的订单地址通常包含两部分,其一为用户选择的系统推荐地址,该地址粒度较粗,通常仅包含省市区及小区名称等,其二为用户自行填写的地址,该地址粒度较细,通常包含了楼栋及门牌号信息等等。则本步骤可将该两部分地址进行合并,以便于后续依据该合并后的订单地址进行候选兴趣点的提取。
进一步可选的,可采用机器学习算法构建的二分类模型来判断订单数据的订单地址中是否包含楼栋信息等等。在判断订单数据的订单地址中是否包含楼栋信息时,还可以针对订单地址的地址名称进行分词处理,并分别确定分词对应的地址标识,进一步通过判断地址名称对应的地址标识中是否包含楼栋标识,即可快速准确地判断订单数据的订单地址中是否包含楼栋信息。例如,订单地址的地址名称为“X小区Y号楼”,进行分词处理后获得“X小区”及“Y号楼”,分词“X小区”对应于地址标识“I”,分词“Y号楼”对应于地址标识“B”,从而确定识别地址名称“X小区Y号楼”对应的地址标识中包含“B”,则表明地址名称包含楼栋信息。
此外,在基于订单数据提取候选兴趣点时,具体是依据订单数据中的订单地址名称生成候选兴趣点的兴趣点地址名称,依据订单数据中的订单地址坐标生成候选兴趣点的兴趣点地址坐标。其中,订单地址坐标具体为配送端送达物品的地址坐标。
步骤S230,将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从候选兴趣点中筛选出目标兴趣点。
若候选兴趣点的兴趣点类型与预设业务场景对应的兴趣点类型黑名单中的某个黑名单兴趣点类型一致,则舍弃该候选兴趣点;若候选兴趣点的兴趣点类型与预设业务场景对应的兴趣点类型黑名单中的某个黑名单兴趣点类型不一致,则将该候选兴趣点确定为目标兴趣点。
步骤S240,将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库。
其中,步骤S220-步骤S240可参照其他方法实施例中相应步骤的描述,在此不作赘述。
由此可见,本发明实施例根据兴趣点数据库中已经存储的兴趣点的订单热度来获得与预设业务场景对应的第一类黑名单兴趣点类型,以及根据兴趣点类型在预设业务场景中的配送时效、兴趣点稳定性、和/或订单消费舒适度等等,获得与预设业务场景对应的第二类黑名单兴趣点类型,从而可以准确且全面地确定出与预设业务场景匹配的黑名单兴趣点类型,继而避免预设业务场景对应的兴趣点数据库中存储过多的冗余兴趣点数据。
而且,本发明实施例在提取候选兴趣点过程中,先判断预设业务场景对应的兴趣点数据库中是否存储有与该订单数据关联的兴趣点,若否,从该订单数据中提取出候选兴趣点;若是,则舍弃该条订单数据。采用该种方式,能够及时地挖掘出新的候选兴趣点,保障存储的兴趣点数据的全面性。
此外,本发明实施例依据包含楼栋信息的订单数据能够提取出细粒度的候选兴趣点,以便于细化后续兴趣点数据库中存储的兴趣点数据的数据粒度,有利于基于存储的兴趣点数据的业务服务精度。
图3示出了根据本发明又一个实施例提供的一种兴趣点数据处理方法的流程图,如图3所示,该方法包括如下步骤:
步骤S310,获取订单数据生产端产生的订单数据,从订单数据中提取出候选兴趣点。
步骤S320,将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从候选兴趣点中筛选出目标兴趣点。
步骤S330,判断目标兴趣点的兴趣点地址是否完整;若否,则执行步骤S340;若是,则执行步骤S350。
在实际的实施过程中,由于订单数据中订单地址会存在部分缺失,如缺失省或市信息等,从而会造成部分目标兴趣点的兴趣点地址不完整。为了提升存储的目标兴趣点的兴趣点数据的准确性及完整性,保障基于目标兴趣点服务的准确性,本发明实施例在存储目标兴趣点的兴趣点数据之前前,判断目标兴趣点的兴趣点地址是否完整;若完整,则不对兴趣点地址进行地址补全;若不完整,则通过后续步骤S340对目标兴趣点的兴趣点地址进行地址补全处理。
步骤S340,对目标兴趣点的兴趣点地址进行地址补全处理。
兴趣点地址通常包含兴趣点地址名称以及兴趣点地址坐标,在实际的实施场景中,兴趣点地址名称会存在不完整的情况,从而对目标兴趣点的兴趣点地址的地址补全处理主要为对兴趣点地址名称的补全处理。
在一种可选的实施方式中,可依据目标兴趣点的兴趣点地址名称及兴趣点地址坐标来对目标兴趣点的兴趣点地址进行地址补全处理。具体地,对目标兴趣点的兴趣点地址名称进行实体识别,以从兴趣点地址名称中提取出地址实体,继而从地址实体中筛选出地址关键字;进一步查找与该地址关键字及兴趣点地址坐标匹配的标准地址。最终将标准地址的地址名称与兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。进一步可选的,与该地址关键字及兴趣点地址坐标匹配的标准地址包含多个,则可采用相应的确定方式从该标准地址中选择出一个作为目标标准地址,最终将目标标准地址的地址名称与兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。其中,本发明实施例对具体的目标标准地址的确定方式不作限定,例如可计算标准地址与兴趣点地址的相似度,将相似度最大的标准地址作为目标标准地址等等;还可以采用投票机制获取目标标准地址等等。
在又一种可选的实施方式中,可仅依据目标兴趣点的兴趣点地址名称来对目标兴趣点的兴趣点地址进行地址补全处理。具体地,对兴趣点地址名称进行实体识别,以从兴趣点地址名称中提取出地址关键字;进一步在预先构建的地址知识图谱中查找与地址关键词关联的图谱节点;将图谱节点的节点名称以及兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
步骤S350,将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库。
若目标兴趣点的兴趣点地址完整,则将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库;若目标兴趣点的兴趣点地址不完整,将地址补全处理后的目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库。
此外,在一种可选的实施方式中,在将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库之前,进一步校验目标兴趣点的兴趣点数据的合规性。例如,校验目标兴趣点的兴趣点数据的各个字段是否符合相应字段的字段规则,又或者,校验目标兴趣点的兴趣点数据是否缺少核心字段等等。在目标兴趣点的兴趣点数据合规的情况下才将兴趣点数据存储至与预设业务场景对应的兴趣点数据库。
在另一种可选的实施方式中,在将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库之前,进一步校验目标兴趣点的兴趣点数据的规范性,以将目标兴趣点的兴趣点数据进行规范化处理后存储至与预设业务场景对应的兴趣点数据库。其中,规范化处理包括以下处理方式中的至少一种:字体转换、大小写转换、重复字段剔除、以及连续空格合并等等。
在又一种可选的实施方式中,在将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库之前,进一步判断兴趣点数据库中是否已存储有该目标兴趣点,若否,则在将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库,从而避免存储重复的兴趣点数据,节约存储资源。
在再一种可选的实施方式中,在将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库过程中,若目标兴趣点的兴趣点地址坐标与已存储的某兴趣点的兴趣点地址坐标相近或相同,则将该目标兴趣点的兴趣点数据与已存储的该兴趣点的兴趣点数据进行融合。
此外,为了便于确定目标兴趣点所对应的业务类型,在将目标兴趣点的兴趣点数据存储至与预设业务场景对应的兴趣点数据库后,为该目标兴趣点分配预设业务场景的标签。
由此可见,本发明实施例在将目标兴趣点的兴趣点数据存储至兴趣点数据库之前,还进一步地对目标兴趣点的兴趣点地址进行完整性校验,并针对于不完整的兴趣点地址进行补全处理,从而保障存储至兴趣点数据库中兴趣点数据的完整性及准确性,提升基于目标兴趣点的服务的质量及精度。
图4示出了根据本发明一个实施例提供的一种兴趣点数据处理装置的结构图。如图4所示,该装置包括:获取模块410、提取模块420、筛选模块430、以及存储模块440。
获取模块410,用于获取订单数据生产端产生的订单数据;
提取模块420,用于从所述订单数据中提取出候选兴趣点;
筛选模块430,用于将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从所述候选兴趣点中筛选出目标兴趣点;其中,所述目标兴趣点的兴趣点类型与所述黑名单兴趣点类型不匹配;
存储模块440,用于将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库。
在一种可选的实施方式中,该装置还包括:黑名单生成模块,用于在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出订单热度小于第一预设阈值的低热度兴趣点;
根据低热度兴趣点的兴趣点类型,确定与预设业务场景对应的第一类黑名单兴趣点类型。
在一种可选的实施方式中,黑名单生成模块进一步用于:在所述根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出低热度兴趣点之前,针对兴趣点数据库中任一已存储的兴趣点,统计在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量;其中,所述预设类型订单为所述预设业务场景中的订单;
根据在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量,计算该兴趣点的订单热度。
在一种可选的实施方式中,该装置还包括:黑名单生成模块,用于在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,针对于任一兴趣点类型,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数;
将对应的用户体验评价参数小于第二预设阈值的兴趣点类型作为与预设业务场景对应的第二类黑名单兴趣点类型。
在一种可选的实施方式中,该黑名单生成模块进一步用于:根据在所述预设业务场景中该兴趣点类型所对应的配送时效评价参数、兴趣点稳定性评价参数、和/或订单消费舒适度评价参数,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数。
在一种可选的实施方式中,该装置还包括:地址补全模块,用于在所述将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库之前,判断目标兴趣点的兴趣点地址是否完整;若否,则对目标兴趣点的兴趣点地址进行地址补全处理;
则存储模块440进一步用于:若目标兴趣点的兴趣点地址不完整,则将地址补全处理后的目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库。
在一种可选的实施方式中,地址补全模块进一步用于:对目标兴趣点的兴趣点地址名称进行实体识别,以从兴趣点地址名称中提取出地址实体;
从所述地址实体中筛选出地址关键字;
查找与所述地址关键字及所述兴趣点地址坐标匹配的标准地址;
将标准地址的地址名称与兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
在一种可选的实施方式中,地址补全模块进一步用于:
对兴趣点地址名称进行实体识别,以从所述兴趣点地址名称中提取出地址关键字;
在预先构建的地址知识图谱中查找与地址关键字关联的图谱节点;
将图谱节点的节点名称以及兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
在一种可选的实施方式中,提取模块420进一步用于:
在所述获取订单数据生产端产生的订单数据之后,判断所述预设业务场景对应的兴趣点数据库中是否存储有与所述订单数据关联的兴趣点;
若所述预设业务场景对应的兴趣点数据库中未存储有与所述订单数据关联的兴趣点,则从所述订单数据中提取出候选兴趣点。
在一种可选的实施方式中,提取模块420进一步用于:
在所述获取订单数据生产端产生的订单数据之后,判断所述订单数据中的订单地址是否包含楼栋信息;
若所述订单数据中的订单地址包含楼栋信息,则从所述订单数据中提取出候选兴趣点。
其中,本装置各模块的具体实施过程可参照相应方法实施例中的描述,本实施例在此不作赘述。
由此可见,本发明实施例能够自动地获取订单数据来挖掘出目标兴趣点,并将目标兴趣点存储至对应的兴趣点数据库中,从而实现兴趣点的自动挖掘及存储,减少人工成本;而且本发明实施例再从订单数据中提取出候选兴趣点之后,依据兴趣点类型对候选兴趣点进行类型过滤,以筛选出与预设业务场景匹配的目标兴趣点,并仅将目标兴趣点的兴趣点数据存储至预设业务场景对应的兴趣点数据库中,从而避免兴趣点数据库中存储较多的冗余兴趣点数据,并避免冗余兴趣点数据对业务服务的干扰。
本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的兴趣点数据处理方法。
图5示出了根据本发明实施例提供的一种计算设备的结构示意图,本发明实施例的具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:
处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述兴趣点数据处理方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行上述任意方法实施例中的兴趣点数据处理方法。
程序510中各步骤的具体实现可以参见上述兴趣点数据处理方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明实施例的内容,并且上面对特定语言所做的描述是为了披露本发明实施例的较佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明实施例并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明实施例进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (21)

1.一种兴趣点数据处理方法,包括:
获取订单数据生产端产生的订单数据,从所述订单数据中提取出候选兴趣点;
将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从所述候选兴趣点中筛选出目标兴趣点;其中,所述目标兴趣点的兴趣点类型与所述黑名单兴趣点类型不匹配;
将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库;
其中,所述预设业务场景为餐饮外卖业务场景,在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,所述方法还包括:
根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出订单热度小于第一预设阈值的低热度兴趣点;
根据低热度兴趣点的兴趣点类型,确定与预设业务场景对应的第一类黑名单兴趣点类型。
2.根据权利要求1所述的方法,其中,在所述根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出低热度兴趣点之前,所述方法还包括:
针对兴趣点数据库中任一已存储的兴趣点,统计在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量;其中,所述预设类型订单为所述预设业务场景中的订单;
根据在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量,计算该兴趣点的订单热度。
3.根据权利要求1所述的方法,其中,在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,所述方法还包括:
针对于任一兴趣点类型,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数;
将对应的用户体验评价参数小于第二预设阈值的兴趣点类型作为与预设业务场景对应的第二类黑名单兴趣点类型。
4.根据权利要求3所述的方法,其中,所述计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数进一步包括:
根据在所述预设业务场景中该兴趣点类型所对应的配送时效评价参数、兴趣点稳定性评价参数、和/或订单消费舒适度评价参数,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数。
5.根据权利要求1-4中任一项所述的方法,其中,在所述将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库之前,所述方法还包括:
判断目标兴趣点的兴趣点地址是否完整;若否,则对目标兴趣点的兴趣点地址进行地址补全处理;
则所述将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库进一步包括:若目标兴趣点的兴趣点地址不完整,则将地址补全处理后的目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库。
6.根据权利要求5所述的方法,其中,所述对目标兴趣点的兴趣点地址进行地址补全处理进一步包括:
对目标兴趣点的兴趣点地址名称进行实体识别,以从兴趣点地址名称中提取出地址实体;
从所述地址实体中筛选出地址关键字;
查找与所述地址关键字及兴趣点地址坐标匹配的标准地址;
将标准地址的地址名称与兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
7.根据权利要求5所述的方法,其中,所述对目标兴趣点的兴趣点地址进行地址补全处理进一步包括:
对兴趣点地址名称进行实体识别,以从所述兴趣点地址名称中提取出地址关键字;
在预先构建的地址知识图谱中查找与地址关键字关联的图谱节点;
将图谱节点的节点名称以及兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
8.根据权利要求1-4中任一项所述的方法,其中,在所述获取订单数据生产端产生的订单数据之后,所述方法还包括:
判断所述预设业务场景对应的兴趣点数据库中是否存储有与所述订单数据关联的兴趣点;
则所述从所述订单数据中提取出候选兴趣点进一步包括:若所述预设业务场景对应的兴趣点数据库中未存储有与所述订单数据关联的兴趣点,则从所述订单数据中提取出候选兴趣点。
9.根据权利要求1-4中任一项所述的方法,其中,在所述获取订单数据生产端产生的订单数据之后,所述方法还包括:判断所述订单数据中的订单地址是否包含楼栋信息;
则所述从所述订单数据中提取出候选兴趣点进一步包括:若所述订单数据中的订单地址包含楼栋信息,则从所述订单数据中提取出候选兴趣点。
10.一种兴趣点数据处理装置,包括:
获取模块,用于获取订单数据生产端产生的订单数据;
提取模块,用于从所述订单数据中提取出候选兴趣点;
筛选模块,用于将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配,根据匹配结果从所述候选兴趣点中筛选出目标兴趣点;其中,所述目标兴趣点的兴趣点类型与所述黑名单兴趣点类型不匹配;
存储模块,用于将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库;
其中,所述预设业务场景为餐饮外卖业务场景,所述装置还包括:
黑名单生成模块,用于在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出订单热度小于第一预设阈值的低热度兴趣点;根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出订单热度小于第一预设阈值的低热度兴趣点;
根据低热度兴趣点的兴趣点类型,确定与预设业务场景对应的第一类黑名单兴趣点类型。
11.根据权利要求10所述的装置,其中,所述装置还包括:
黑名单生成模块,用于在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出订单热度小于第一预设阈值的低热度兴趣点;
根据低热度兴趣点的兴趣点类型,确定与预设业务场景对应的第一类黑名单兴趣点类型。
12.根据权利要求11所述的装置,其中,所述黑名单生成模块进一步用于:在所述根据兴趣点数据库中已存储的兴趣点的订单热度,从所述已存储的兴趣点中筛选出低热度兴趣点之前,针对兴趣点数据库中任一已存储的兴趣点,统计在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量;其中,所述预设类型订单为所述预设业务场景中的订单;
根据在预设历史时间窗口内与该兴趣点关联的预设类型订单的订单数量,计算该兴趣点的订单热度。
13.根据权利要求10所述的装置,其中,所述装置还包括:
黑名单生成模块,用于在所述将候选兴趣点的类型与预设业务场景对应的黑名单兴趣点类型进行匹配之前,针对于任一兴趣点类型,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数;
将对应的用户体验评价参数小于第二预设阈值的兴趣点类型作为与预设业务场景对应的第二类黑名单兴趣点类型。
14.根据权利要求13所述的装置,其中,所述黑名单生成模块进一步用于:根据在所述预设业务场景中该兴趣点类型所对应的配送时效评价参数、兴趣点稳定性评价参数、和/或订单消费舒适度评价参数,计算在所述预设业务场景中该兴趣点类型所对应的用户体验评价参数。
15.根据权利要求10-14中任一项所述的装置,其中,所述装置还包括:
地址补全模块,用于在所述将所述目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库之前,判断目标兴趣点的兴趣点地址是否完整;若否,则对目标兴趣点的兴趣点地址进行地址补全处理;
则所述存储模块进一步用于:若目标兴趣点的兴趣点地址不完整,则将地址补全处理后的目标兴趣点的兴趣点数据存储至与所述预设业务场景对应的兴趣点数据库。
16.根据权利要求15所述的装置,其中,所述地址补全模块进一步用于:
对目标兴趣点的兴趣点地址名称进行实体识别,以从兴趣点地址名称中提取出地址实体;
从所述地址实体中筛选出地址关键字;
查找与所述地址关键字及所述兴趣点地址坐标匹配的标准地址;
将标准地址的地址名称与兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
17.根据权利要求15所述的装置,其中,所述地址补全模块进一步用于:
对兴趣点地址名称进行实体识别,以从所述兴趣点地址名称中提取出地址关键字;
在预先构建的地址知识图谱中查找与地址关键字关联的图谱节点;
将图谱节点的节点名称以及兴趣点地址名称进行融合,以生成补全处理后的兴趣点地址名称。
18.根据权利要求10-14中任一项所述的装置,其中,所述提取模块进一步用于:
在所述获取订单数据生产端产生的订单数据之后,判断所述预设业务场景对应的兴趣点数据库中是否存储有与所述订单数据关联的兴趣点;
若所述预设业务场景对应的兴趣点数据库中未存储有与所述订单数据关联的兴趣点,则从所述订单数据中提取出候选兴趣点。
19.根据权利要求10-14中任一项所述的装置,其中,所述提取模块进一步用于:
在所述获取订单数据生产端产生的订单数据之后,判断所述订单数据中的订单地址是否包含楼栋信息;
若所述订单数据中的订单地址包含楼栋信息,则从所述订单数据中提取出候选兴趣点。
20.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-9中任一项所述的兴趣点数据处理方法对应的操作。
21.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-9中任一项所述的兴趣点数据处理方法对应的操作。
CN202110552172.XA 2021-05-20 2021-05-20 兴趣点数据处理方法及装置 Active CN113190640B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110552172.XA CN113190640B (zh) 2021-05-20 2021-05-20 兴趣点数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110552172.XA CN113190640B (zh) 2021-05-20 2021-05-20 兴趣点数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN113190640A CN113190640A (zh) 2021-07-30
CN113190640B true CN113190640B (zh) 2023-02-07

Family

ID=76982814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110552172.XA Active CN113190640B (zh) 2021-05-20 2021-05-20 兴趣点数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN113190640B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN104899243A (zh) * 2015-03-31 2015-09-09 北京奇虎科技有限公司 检测兴趣点poi数据准确性的方法及装置
CN106919567A (zh) * 2015-12-24 2017-07-04 北京四维图新科技股份有限公司 一种兴趣点poi地址的处理方法及装置
CN107656913A (zh) * 2017-09-30 2018-02-02 百度在线网络技术(北京)有限公司 地图兴趣点地址提取方法、装置、服务器和存储介质
CN109074396A (zh) * 2016-05-10 2018-12-21 北京嘀嘀无限科技发展有限公司 推荐个性化内容的系统和方法
CN109783723A (zh) * 2018-12-12 2019-05-21 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN110909170A (zh) * 2019-10-12 2020-03-24 百度在线网络技术(北京)有限公司 兴趣点知识图谱构建方法、装置、电子设备及存储介质
CN111782741A (zh) * 2020-06-04 2020-10-16 汉海信息技术(上海)有限公司 兴趣点挖掘方法、装置、电子设备及存储介质
CN112100522A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 用于检索兴趣点的方法、装置、设备及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN104899243A (zh) * 2015-03-31 2015-09-09 北京奇虎科技有限公司 检测兴趣点poi数据准确性的方法及装置
CN106919567A (zh) * 2015-12-24 2017-07-04 北京四维图新科技股份有限公司 一种兴趣点poi地址的处理方法及装置
CN109074396A (zh) * 2016-05-10 2018-12-21 北京嘀嘀无限科技发展有限公司 推荐个性化内容的系统和方法
CN107656913A (zh) * 2017-09-30 2018-02-02 百度在线网络技术(北京)有限公司 地图兴趣点地址提取方法、装置、服务器和存储介质
CN109783723A (zh) * 2018-12-12 2019-05-21 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN110909170A (zh) * 2019-10-12 2020-03-24 百度在线网络技术(北京)有限公司 兴趣点知识图谱构建方法、装置、电子设备及存储介质
CN111782741A (zh) * 2020-06-04 2020-10-16 汉海信息技术(上海)有限公司 兴趣点挖掘方法、装置、电子设备及存储介质
CN112100522A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 用于检索兴趣点的方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113190640A (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN103678708B (zh) 一种识别预设地址的方法及装置
CN108230040B (zh) 到店预测方法及装置
CN110263840B (zh) 一种线路分析方法、装置及程序产品、存储介质
CN110727857A (zh) 针对业务对象识别潜在用户的关键特征的方法及装置
CN111896016A (zh) 位置信息的处理方法及装置、存储介质、终端
CN107798450B (zh) 业务分配方法和装置
CN113190640B (zh) 兴趣点数据处理方法及装置
CN112988933A (zh) 地址信息管理的方法和装置
CN110007998B (zh) 页面生成方法及装置
CN109274725B (zh) 互联网交易定位方法、装置及服务器
CN114820960B (zh) 构建图谱的方法、装置、设备和介质
CN114356951B (zh) 引导点的关联信息的更新方法和装置
CN113032514B (zh) 兴趣点数据处理方法及装置
US20200320090A1 (en) Method and device for data fusion, non-transitory storage medium and server
CN114661920A (zh) 地址编码关联方法、业务数据分析方法及相应装置
CN107329730B (zh) 语音提示信息生成方法及装置
CN112784061A (zh) 知识图谱的构建方法、装置、计算设备及存储介质
CN110674843A (zh) 一种停车场实体的生成方法及系统
CN104750822A (zh) 提供搜索建议的方法和装置
CN111737374A (zh) 位置坐标确定方法、装置、电子设备及存储介质
CN116543758B (zh) 语音唤醒模型的更新方法、系统和介质
CN115641430B (zh) 一种兴趣面确定方法、装置、介质及计算机设备
CN110443493B (zh) 路线相似度确定方法、装置、设备和介质
CN112232845B (zh) 一种基于用户位置预测用户行为偏好的方法及装置
CN111552759B (zh) 一种行动轨迹相关数据的获取方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant