CN116719896A - Poi数据的挖掘方法及其装置、计算机设备及存储介质 - Google Patents

Poi数据的挖掘方法及其装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN116719896A
CN116719896A CN202310660121.8A CN202310660121A CN116719896A CN 116719896 A CN116719896 A CN 116719896A CN 202310660121 A CN202310660121 A CN 202310660121A CN 116719896 A CN116719896 A CN 116719896A
Authority
CN
China
Prior art keywords
data
poi
acquiring
type
judged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310660121.8A
Other languages
English (en)
Other versions
CN116719896B (zh
Inventor
李宏宽
刘军毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yishi Huolala Technology Co Ltd
Original Assignee
Shenzhen Yishi Huolala Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yishi Huolala Technology Co Ltd filed Critical Shenzhen Yishi Huolala Technology Co Ltd
Publication of CN116719896A publication Critical patent/CN116719896A/zh
Application granted granted Critical
Publication of CN116719896B publication Critical patent/CN116719896B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Remote Sensing (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请的POI数据挖掘方法包括:获取第一待判别POI数据;获取与第一待判别POI数据相关的第一关联AOI数据,基于第一待判别POI数据及第一关联AOI数据获取第二待判别POI数据;获取与第二待判别POI数据相关的关联历史订单;获取关联历史订单的第一类型数据,对第一类型数据中的至少一种数据进行预处理得到预处理数据;对预处理数据及部分第一类型数据进行校正处理得到校正数据;基于第二待判别POI数据及校正数据获取第一挖掘结果;获取关联历史订单的第二类型数据,并基于第二类型数据获取第三待判别POI数据;获取与第三待判别POI数据相关的第二关联AOI数据,并基于第三待判别POI数据及第二关联AOI数据获取第二挖掘结果;基于第一及第二挖掘结果获得目标挖掘结果。

Description

POI数据的挖掘方法及其装置、计算机设备及存储介质
技术领域
本申请涉及大数据处理技术领域,特别涉及一种POI数据的挖掘方法及其装置、计算机设备及存储介质。
背景技术
POI(一般作为Point of Interest的缩写,也有Point of Information的说法),通常称作兴趣点,泛指互联网电子地图中的点类数据,主要包括名称、地址、坐标、类别四类基本属性信息,同时包含其他附属属性信息。POI数据源于基础测绘成果DLG(Digital LineGraphic,数字线划地图)产品中点类地图要素矢量数据集;在GIS(GeographicInformation System,地理信息系统)中指可以抽象成点进行管理、分析和计算的对象。POI等点类数据是互联网导航电子地图的重要组成部分,而POI数据的准确性和现势性也是众多互联网地图服务商的重点关注的方面,因此及时挖掘已有数据中的错误数据显得极为重要和紧迫。
在具体的业务场景应用中,比如在货运POI数据错误数据挖掘校正的场景中,出现POI数据中坐标错误、地址错误、类型错误等等各种错误场景,会导致下游应用环节发生其他意想不到错误问题,从而引起终端用户非常差的体验。然而坐标错误又是各种错误中比较严重的,因为坐标错误对用户的造成的伤害也是比较严重,特别是在针对在大型商场、商圈货运装卸货点信息复杂较隐蔽等场景,现有POI对应推荐的装卸货点位置总是和实际情况偏差比较大,影响司机的碰面效率,所以挖掘并校正POI的坐标错误问题显得尤为重要。
发明内容
为解决上述背景技术中的至少一个技术问题,本申请实施方式提供了一种POI数据的挖掘方法、POI数据的挖掘装置、计算机设备及非易失性计算机可读存储介质。
本申请实施方式提供一种POI数据的挖掘方法,其中,所述POI数据为货运数据。所述POI数据的挖掘方法包括:
获取第一待判别POI数据,所述第一待判别POI数据包括商场POI数据、商圈POI数据、物流园区POI数据中的至少一种;
获取与所述第一待判别POI数据相关的第一关联AOI数据,并基于所述第一待判别POI数据及所述第一关联AOI数据获取第二待判别POI数据;
获取与所述第二待判别POI数据相关的关联历史订单;
获取所述关联历史订单中的第一类型数据,并对所述第一类型数据中的至少一种数据进行预处理得到预处理数据,所述第一类型数据包括位置数据、轨迹数据、地址备注数据中的至少一种;
对所述预处理数据及部分所述第一类型数据进行校正处理得到校正数据;
基于所述第二待判别POI数据及所述校正数据获取第一挖掘结果;
获取所述关联历史订单中的第二类型数据,并基于所述第二类型数据获取第三待判别POI数据,所述第二类型数据包括碰面时长、语音数据中的至少一种;
获取与所述第三待判别POI数据相关的第二关联AOI数据,并基于所述第三待判别POI数据及所述第二关联AOI数据获取第二挖掘结果;
基于所述第一挖掘结果及所述第二挖掘结果获得目标挖掘结果。
在某些实施方式中,所述获取第一待判别POI数据,包括:
获取所有POI数据的类别参数;
从所有所述POI数据选取所述类别参数符合预设类别参数的POI数据作为所述第一待判别POI数据,所述预设类别参数包括所述商场、所述商圈、所述物流园区中的至少一种。
在某些实施方式中,所述第一类型数据包括所述位置数据和所述轨迹数据,所述对所述第一类型数据中的至少一种数据进行预处理得到预处理数据,包括:
基于所述位置数据对应的所述关联历史订单的时间,对所有所述位置数据进行排序,以得到预处理位置数据;
从所述轨迹数据中选取出轨迹完整度大于预设值的数据以作为预处理轨迹数据。
在某些实施方式中,所述第一类型数据还包括所述地址备注数据,所述对所述预处理数据及部分所述第一类型数据进行校正处理得到校正数据,包括:
对所述预处理位置数据进行第一聚合处理以得到校正位置数据;
对所述地址备注数据进行第二聚合处理以得到校正地址备注数据;
将所述轨迹数据中的轨迹坐标与基础路网数据进行挂接匹配,以得到校正轨迹数据;
在某些实施方式中,所述基于所述第二待判别POI数据及所述校正数据获取第一挖掘结果,包括:
对所述第二待判别POI数据与所述校正数据进行空间距离分析以得到所述第一挖掘结果。
在某些实施方式中,所述第二类型数据包括所述碰面时长和所述语音数据,所述基于所述第二类型数据获取第三待判别POI数据,包括:
选取所述关联历史订单中的所述碰面时长超过预设时长且所述语音数据中包含设定词汇的选定历史订单;
获取所述选定历史订单的位置数据以作为所述第三待判别POI数据。
在某些实施方式中,所述基于所述第三待判别POI数据及所述第二关联AOI数据获取第二挖掘结果,包括:
对所述第三待判别POI数据及所述第二关联AOI数据进行空间分析以得到所述第二挖掘结果。
本申请实施方式提供一种POI数据的挖掘装置,其中,所述POI数据为货运数据,所述挖掘装置包括:
第一获取模块,用于获取第一待判别POI数据,所述第一待判别POI数据包括商场POI数据、商圈POI数据、物流园区POI数据中的至少一种;
第二获取模块,用于获取与所述第一待判别POI数据相关的第一关联AOI数据,并基于所述第一待判别POI数据及所述第一关联AOI数据获取第二待判别POI数据;
第三获取模块,用于获取与所述第二待判别POI数据相关的关联历史订单;
第一处理模块,用于获取所述关联历史订单中的第一类型数据,并对所述第一类型数据中的至少一种数据进行预处理得到预处理数据,所述第一类型数据包括位置数据、轨迹数据、地址备注数据中的至少一种;
第二处理模块,用于对所述预处理数据及部分所述第一类型数据进行校正处理得到校正数据;
第四获取模块,用于基于所述第二待判别POI数据及所述校正数据获取第一挖掘结果;
第五获取模块,用于获取所述关联历史订单中的第二类型数据,并基于所述第二类型数据获取第三待判别POI数据,所述第二类型数据包括碰面时长、语音数据中的至少一种;
第六获取模块,用于获取与所述第三待判别POI数据相关的第二关联AOI数据,并基于所述第三待判别POI数据及所述第二关联AOI数据获取第二挖掘结果;
第七获取模块,用于基于所述第一挖掘结果及所述第二挖掘结果获得目标挖掘结果。
本申请实施方式提供一种计算机设备。计算机设备包括:一个或多个处理器;存储器;及一个或多个计算机程序,其中,所述一个或多个计算机程序被存储在所述存储器中,并被配置为由所述一个或多个处理器执行,所述一个或多个计算程序配置用于:执行本申请任一实施方式所述的POI数据的挖掘方法。
本申请实施方式提供一种非易失性计算机可读存储介质。非易失性计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,使得所述处理器执行本申请任一实施方式所述的POI数据的挖掘方法。
本申请实施方式的POI数据的挖掘方法、POI数据的挖掘装置、计算机设备及非易失性计算机可读存储介质,通过利用与待判别POI数据关联的历史订单中的位置数据、轨迹数据、碰面时长和语音数据等业务数据,并结合基础路网数据和AOI数据等综合判断,挖掘出疑似错误或缺失的POI数据,提升POI数据的坐标位置精度和覆盖率,为后续的其他业务场景提供坚实基础。
本申请实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点可以从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1为本申请第一实施方式的POI数据的挖掘方法的流程示意图;
图2为本申请第二实施方式的POI数据的挖掘方法的流程示意图;
图3为本申请第三实施方式的POI数据的挖掘方法的流程示意图;
图4为本申请第四实施方式的POI数据的挖掘方法的流程示意图;
图5为本申请第一实施方式的POI数据的挖掘方法的场景示意图;
图6为本申请第二实施方式的POI数据的挖掘方法的场景示意图;
图7为本申请第三实施方式的POI数据的挖掘方法的场景示意图;
图8为本申请第五实施方式的POI数据的挖掘方法的流程示意图;
图9为本申请第五实施方式的POI数据的挖掘方法的流程示意图;
图10为本申请一个实施方式的POI数据的挖掘装置的模块示意图;
图11为本申请一个实施方式的计算机可读存储介质与处理器通信的示意图;
图12为本申请一个实施方式的计算机设备的示意图。
具体实施方式
下面详细描述本申请的实施方式,所述实施方式的示例在附图中示出,其中,相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本申请的实施方式,而不能理解为对本申请的实施方式的限制。
请参阅图1,本申请实施方式提供一种POI数据的挖掘方法。其中,POI数据为货运POI数据。POI数据的挖掘方法包括:
011:获取第一待判别POI数据,第一待判别POI数据包括商场POI数据、商圈POI数据、物流园区POI数据中的至少一种;
012:获取与第一待判别POI数据相关的第一关联AOI数据,并基于第一待判别POI数据及第一关联AOI数据获取第二待判别POI数据;
013:获取与第二待判别POI数据相关的关联历史订单;
014:获取关联历史订单中的第一类型数据,并对第一类型数据中的至少一种数据进行预处理得到预处理数据,第一类型数据包括位置数据、轨迹数据、地址备注数据中的至少一种;
015:对预处理数据及部分第一类型数据进行校正处理得到校正数据;
016:基于第二待判别POI数据及校正数据获取第一挖掘结果;
017:获取关联历史订单中的第二类型数据,并基于第二类型数据获取第三待判别POI数据,第二类型数据包括碰面时长、语音数据中的至少一种;
018:获取与第三待判别POI数据相关的第二关联AOI数据,并基于第三待判别POI数据及第二关联AOI数据获取第二挖掘结果;
019:基于第一挖掘结果及第二挖掘结果获得目标挖掘结果。
其中,POI数据为货运平台的服务器中已存储的所有货运装载点(也即起点)、货运卸货点的数据(也即终点)。每个POI数据均包括相应地点的名称、地址、坐标、类别信息。
对于步骤011,在一个示例中,请结合图2,可以通过以下方式获取第一待判别POI数据:
0111:获取所有POI数据的类别参数;
0112:从所有POI数据中选取类别参数符合预设类别参数的POI数据作为第一待判别POI数据,预设类别参数包括商场、商圈、物流园区中的至少一种。
可以理解,每个POI数据都有相应的类别信息(也即kind标识)。本申请的一个实施例中,需要对商场、商圈、物流园区三种类别的POI数据进行挖掘,即预设类别参数包括商场、商圈、物流园区三种。其中,商场可以理解为具体的商业大厦,商圈可以理解为多个商业市场、商业大厦组成的商业群,物流园区可以理解为物流作业集中的物流功能区域。那么,可以获取所有POI数据的类别参数,并从平台服务器存储的所有POI数据中将类别参数符合商场、商圈或物流园区的POI数据筛选出来,从而得到第一待判别POI数据。可以理解的是,商场、商圈、物流园区的货运需求量大,对这些类型的POI数据进行错误或缺失数据的挖掘和校正,有利于货运业务的顺利开展,能够提升用户的使用体验。
对于步骤012,示例地,在筛选出第一待判别POI数据后,可以基于该第一待判别POI数据确定与该第一待判别POI数据相关的第一关联AOI数据。其中,第一待判别POI数据为点数据,第一关联AOI(Area ofInterest)为面数据,且作为与之相关的第一待判别POI数据的边界数据,边界数据通常包括多个,以用于界定相应区域的边界。本申请实施例将第一待判别POI数据和与之相关的第一关联AOI数据合并起来作为第二待判别POI数据,可以筛选出更为完整的与商场、商圈、物流园区关联的POI数据,便于更全面地做数据挖掘,避免漏掉待挖掘数据的问题。
对于步骤013,可以理解的是,POI数据具有名称、地址、坐标信息,而货运订单通常都具备位置数据(包括地址、坐标的信息),也即起点位置数据、终点位置数据。因此,可以基于第二待判别POI的地址、坐标等信息从服务器中存储的多个历史订单中筛选出与之相关的关联历史订单。其中,关联历史订单的位置数据与POI的位置数据一致,或者二者的空间距离较小,例如小于某个预定距离。
对于步骤014,第一类型数据可以包括位置数据、轨迹数据、地址备注数据中的任意一种,也可以包括位置数据、轨迹数据、地址备注数据中的任意两种,也可以同时包括位置数据、轨迹数据和地址备注数据三种,本申请不作限制。在本申请的一个示例中,第一类型数据包括位置数据、轨迹数据、地址备注数据三种,采用的数据越多,对于第二待判别POI数据的判别会更准确。作为一个示例,请结合图3,对第一类型数据进行预处理可以包括:
0141:基于位置数据对应的关联历史订单的时间,对所有位置数据进行排序,以得到预处理位置数据;
0142:从轨迹数据中选取出轨迹完整度大于预设值的数据以作为预处理轨迹数据。
对于步骤0141,可以理解,由于每个位置信息对应的关联历史订单均具有其执行时间,因此,可以采用位置信息对应的关联历史订单的执行时间,对所有位置信息进行排序,以得到预处理位置数据。
对于步骤0142,由于网络因素或设备因素的影响,可能存在订单执行过程中记录的轨迹数据不全的情况,因此,可以对轨迹数据进行筛选,将轨迹完整度较高的数据筛选出来,以作为预处理轨迹数据。进一步地,轨迹数据可以选择在第二待判别POI数据所处位置附近一定范围内的轨迹数据,例如距离第二待判别POI数据所处位置50米、100米、200米、300米范围内的轨迹数据等,不同类型的待判别POI数据对应的范围可以不同。随后,再从该轨迹数据中筛选出轨迹完整度较高的数据以作为预处理轨迹数据。可以理解,与第二待判别POI数据所处位置距离较近的轨迹数据的可参考性更高,更有利于后续的数据挖掘。
对于步骤015,示例地,请结合图4,可以通过以下方式对预处理数据及部分第一类型数据进行校正处理得到校正数据:
0151:对预处理位置数据进行第一聚合处理以得到校正位置数据;
0152:对地址备注数据进行第二聚合处理以得到校正地址备注数据;
0153:将轨迹数据中的轨迹坐标与基础路网数据进行挂接匹配,以得到校正轨迹数据;
对于步骤0151,在一个例子中,可以对预处理后的位置数据(包括起点和终点),也即按时间排序后的位置数据进行空间坐标聚合。具体地,可以先对预处理位置数据进行噪声数据的删除,随后将噪声去除后的预处理位置数据根据点数据分布情况拆分为不同的子集,随后再使用空间聚合算法进行聚合处理,空间聚合算法例如为K-Means算法、DBSCAN算法等,本申请对此不作限制。其中,K-Means算法是一种基于距离测量的聚类算法,根据指定的聚类数目K,迭代计算每个点距离最近的聚类中心,并将其归入该类别中。DBSCAN算法算法是一种密度聚类算法,通过设置半径和密度参数,将数据集中高密度的点归为一类,同时排除低密度的噪声点。
请结合图5和图6,示例地,对所有位置数据进行排序。由于每个位置数据对应的关联历史订单均具有其执行时间,因此,可以采用位置数据对应的关联历史订单的执行时间,对所有位置数据进行排序。随后,需要对排序后的所有位置数据信息进行去噪和聚合处理。去噪即去除分散在较外围的离散点,这些离散点对整体聚合的价值不大,使用这些点的数据反而会影响聚合结果的准确性。以图5为例,位置数据15a和位置数据16a即为离散点,在聚合时需要进行去除。去噪后,再针对剩下的位置数据进行聚合。示例地,请结合图6,对剩下的位置数据进行聚合以获得A、B、C三个聚合簇,随后,再取A、B、C三个聚合簇的中心作为聚类中心,则A、B、C三个聚合簇及其聚类中心即为校正位置数据。
对于步骤0152,可以对地址备注数据进行聚合处理,生成有价值的地址数据或名称数据,作为校正后的地址备注数据。示例地,请结合图7,图中示出了多个地址备注数据,在聚合时,虚线所圈出来的地址备注数据应去除噪声后再聚合成一个点,点划线所圈出来的地址备注数据独立为一个点,双点划线所圈出来的地址备注数据聚合成一个点。
对于步骤0153,可以从预处理估计数据中提取轨迹坐标,再将提取的轨迹坐标和基础路网数据进行挂接匹配,以校正轨迹数据,从而得到校正轨迹数据。示例地,可以先对提取出来的轨迹坐标进行数据清洗、采样和去噪。随后,可以调用基础匹配服务以将轨迹坐标与基础路网数据进行匹配,基础匹配服务可以是HMM、粒子滤波算法、基于图匹配算法、基于时间窗口的匹配算法等。其中,Hidden Markov Model(HMM)将道路网看做一个隐含的Markov过程,将路段划分成多个小区间,将GPS点与小区间进行匹配,并通过动态规划算法求解最优匹配路径。粒子滤波算法(Particle Filter)利用贝叶斯滤波思想,将概率密度函数表示为粒子群,通过递归地重要性采样、预测和更新等步骤,根据GPS点和道路网约束,筛选出最符合实际的轨迹。基于图匹配(Graph Matching)算法将GPS点的权重表示为节点,将道路的权重表示为边,构建一个带权无向图,利用最大流最小割算法或者二分图匹配算法对图进行处理,找到最优的匹配路径。基于时间窗口的匹配算法(Time-Window Matching)将GPS数据在时间上进行排序,并且设定一个时间窗口,对于窗口内的GPS点,进行道路匹配,从而保证定位精度和匹配精度。随后,将匹配后的结果进行移动平均滤波或岭回归处理,即可得到校正轨迹数据。
对于步骤016,请结合图8,可以通过以下方式来基于第二待判别POI数据及校正数据获取第一挖掘结果:
0161:对第二待判别POI数据与校正数据进行空间距离分析以得到第一挖掘结果。
具体地,可以计算每个第二待判别POI数据与相应的校正数据(包括校正位置数据、校正地址备注数据、校正轨迹数据)的空间距离,以获得第一挖掘结果。其中,第一挖掘结果包括第二待判别POI数据的准确度以及准确度的相应标识。可以理解的是,对于空间距离越大的第二待判别POI数据而言,其坐标错误的可能性越大,可以据此对第二待判别POI数据进行准确度界定及标记。
进一步地,可以分析第二待判别POI数据的轨迹密集程度,具体可以利用单位面积内轨迹点的数量来判断轨迹密集程度随着时间变化情况,若某个位置原来的轨迹密度高,相关订单多,但近期轨迹密度降低,相关订单也减少,说明该位置可能出现改变,相应的第二待判别POI数据的准确度较低。此外,还可以分析第二待判别POI数据随时间变化的位置迁移变化,比如,同一个下单位置点从O点迁移到了P点,说明该位置可能发生了迁移,相应的第二待判别POI数据的准确度也较低。另外,还可以分析第二待判别POI数据的关联历史订单中是否持续存在地址备注数据,若是,则说明该第二待判别POI数据的准确度较低。可以综合空间距离分析结果、轨迹密集程度分析结果、数据随时间变化的位置迁移变化分析结果、地址备注数据分析结果来共同界定第二待判别POI数据的准确度,以得到第一挖掘结果。
对于步骤017,第二类型数据可以是碰面时长或语音数据中的任意一种,也可以是包含碰面时长和语音数据两种。碰面时长可以理解为司机到达订单的起点或终点附近到司机到达用户指定目标地点的时间,语音数据可以理解为司机与用户沟通确定目标地点过程中的语音通话记录。可以理解的是,部分关联历史订单中可能具有碰面时长及语音数据。作为一个示例,请结合图9,可以通过以下方式来获取第三待判别POI数据:
0171:选取关联历史订单中的碰面时长超过预设时长且语音数据中包含设定词汇的选定历史订单;
0172:获取选定历史订单的位置数据以作为第三待判别POI数据。
具体地,可以将与第一待判别POI数据相关的关联历史订单中的碰面时长较长,且语音数据包含设定词汇的订单筛选出来,以作为选定历史订单,再将选定历史订单中的位置数据作为第三待判别POI数据。其中,设定词汇可以是“位置在哪里”、“定位不对”、“往前”、“导航错误”、“按照备注地址”等词的信息。可以理解,碰面时长较长以及语音数据包含上述设定词汇表示订单的起点或终点的数据可能有误,可以将其筛选出来,进行后续判断。
对于步骤018,可以先获取与第三待判别POI数据相关的第二关联AOI数据。随后,再进行第二挖掘结果计算。作为一个示例,可以通过以下方式来获取第二挖掘结果:对第三待判别POI数据及第二关联AOI数据进行空间分析以得到第二挖掘结果。
具体地,可以根据POI数据类型来确定与第三待判别POI数据进行空间分析的第二关联AOI数据。示例地,若第三待判别POI数据是商圈类数据,则使用商圈类AOI面数据与该第三待判别POI数据进行topo空间分析;若第三待判别POI数据是商场类数据,则使用相应的商场类AOI面数据(即该商场相应建筑面数据)与第三待判别POI数据进行topo空间分析;若第三待判别数据是物流园区类数据,则使用相应的物流园区类AOI面数据(即相应园区面数据)与第三待判别POI数据进行空间topo分析。随后,可以基于空间topo分析的结果来获得第二挖掘结果。第二挖掘结果可以包括第三待判别POI数据的准确度及准确度的相应标识。
对于步骤019,在获得第一挖掘结果和第二挖掘结果之后,可以建立相应的数学模型,将第一挖掘结果和第二挖掘结果输入到数学模型中,以输出待判别POI数据在商场、商圈、物流园区场景中是否有坐标错误或缺失,以及错误程度的信息,从而获得目标挖掘结果,目标挖掘结果指示待判别POI数据的准确度信息,从而告知平台开发人员哪些POI数据需要进行校正。
本申请实施方式的POI数据的挖掘方法,首先引入针对货运POI中首先针对商场、商圈、物流园区类数据的筛选,并且利用与待判别POI数据关联的历史订单中的位置数据(点数据)、轨迹数据、碰面时长和语音数据等业务数据,并结合基础路网数据(线数据)和AOI数据(面数据)等综合判断,挖掘出疑似错误或缺失的POI数据,提升POI数据的坐标位置精度和覆盖率,为后续的其他业务场景提供坚实基础。
在某些实施方式中,在获得目标挖掘结果后,还可利用人工作业进行坐标校正,修复错误或增补缺失数据,提升POI数据的坐标位置精度和覆盖率,为后续的其他业务场景提供坚实基础。
请参阅图10,本申请实施方式还提供一种POI数据的挖掘装置10。其中,POI数据为货运POI数据。挖掘装置10包括:
第一获取模块11,用于获取第一待判别POI数据,第一待判别POI数据包括商场POI数据、商圈POI数据、物流园区POI数据中的至少一种;
第二获取模块12,用于获取与第一待判别POI数据相关的第一关联AOI数据,并基于第一待判别POI数据及第一关联AOI数据获取第二待判别POI数据;
第三获取模块13,用于获取与第二待判别POI数据相关的关联历史订单;
第一处理模块14,用于获取关联历史订单中的第一类型数据,并对第一类型数据中的至少一种数据进行预处理得到预处理数据,第一类型数据包括位置数据、轨迹数据、地址备注数据中的至少一种;
第二处理模块15,用于对预处理数据及部分第一类型数据进行校正处理得到校正数据;
第四获取模块16,用于基于第二待判别POI数据及校正数据获取第一挖掘结果;
第五获取模块17,用于获取关联历史订单中的第二类型数据,并基于第二类型数据获取第三待判别POI数据,第二类型数据包括碰面时长、语音数据中的至少一种;
第六获取模块18,用于获取与第三待判别POI数据相关的第二关联AOI数据,并基于第三待判别POI数据及第二关联AOI数据获取第二挖掘结果;
第七获取模块19,用于基于第一挖掘结果及第二挖掘结果获得目标挖掘结果。
在某些实施方式中,第一获取模块11还用于:获取所有POI数据的类别参数;从所有POI数据中选取类别参数符合预设类别参数的POI数据作为第一待判别POI数据,预设类别参数包括商场、商圈、物流园区中的至少一种。
在某些实施方式中,第一类型数据包括位置数据和轨迹数据,第一处理模块14还用于:基于位置数据对应的关联历史订单的时间,对所有位置数据进行排序,以得到预处理位置数据;从轨迹数据中选取出轨迹完整度大于预设值的数据以作为预处理轨迹数据。
在某些实施方式中,第一类型数据还包括地址备注数据,第二处理模块15还用于:对预处理位置数据进行第一聚合处理以得到校正位置数据;对地址备注数据进行第二聚合处理以得到校正地址备注数据;将轨迹数据中的轨迹坐标与基础路网数据进行挂接匹配,以得到校正轨迹数据。
在某些实施方式中,第四获取模块16还用于:对第二待判别POI数据与校正数据进行空间距离分析以得到第一挖掘结果。
在某些实施方式中,第二类型数据包括碰面时长和语音数据,第五获取模块17还用于:选取关联历史订单中的碰面时长超过预设时长且语音数据中包含设定词汇的选定历史订单;获取选定历史订单的位置数据以作为第三待判别POI数据。
在某些实施方式中,第六获取模块18还用于:对第三待判别POI数据及第二关联AOI数据进行空间分析以得到第二挖掘结果。
需要说明的是,本申请的POI数据的挖掘装置10实施本申请任一实施方式的POI数据的挖掘方法时的实施细节及所达到的效果,可以参考上述对POI数据的挖掘方法的描述,在此不再赘述。
此外,请参阅图11,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现以上任一实施方式所述的POI数据的挖掘方法。其中,所述计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(RandomAccess Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储设备包括由设备(例如,计算机、手机)以能够读的形式存储或传输信息的任何介质,可以是只读存储器,磁盘或光盘等。
本申请方法实施例的内容均适用于本存储介质实施例,本存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同,具体请参见方法实施例中的说明,在此不再赘述。
此外,请参阅图12,本申请实施例还提供了一种计算机设备,本实施例所述的计算机设备可以是服务器、个人计算机以及网络设备等设备。所述计算机设备包括一个或多个处理器、存储器、以及一个或多个计算机程序。其中一个或多个计算机程序被存储在存储器中并被配置为由一个或多个处理器执行。一个或多个计算机程序配置用于执行以上任一实施方式所述的POI数据的挖掘方法。
在本说明书的描述中,参考术语“一个实施方式”、“一些实施方式”、“示意性实施方式”、“示例”、“具体示例”或“一些示例”等的描述意指结合所述实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
尽管上面已经示出和描述了本申请的实施方式,可以理解的是,上述实施方式是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施方式进行变化、修改、替换和变型。

Claims (10)

1.一种POI数据的挖掘方法,其特征在于,所述POI数据为货运POI数据,所述POI数据的挖掘方法包括:
获取第一待判别POI数据,所述第一待判别POI数据包括商场POI数据、商圈POI数据、物流园区POI数据中的至少一种;
获取与所述第一待判别POI数据相关的第一关联AOI数据,并基于所述第一待判别POI数据及所述第一关联AOI数据获取第二待判别POI数据;
获取与所述第二待判别POI数据相关的关联历史订单;
获取所述关联历史订单中的第一类型数据,并对所述第一类型数据中的至少一种数据进行预处理得到预处理数据,所述第一类型数据包括位置数据、轨迹数据、地址备注数据中的至少一种;
对所述预处理数据及部分所述第一类型数据进行校正处理得到校正数据;
基于所述第二待判别POI数据及所述校正数据获取第一挖掘结果;
获取所述关联历史订单中的第二类型数据,并基于所述第二类型数据获取第三待判别POI数据,所述第二类型数据包括碰面时长、语音数据中的至少一种;
获取与所述第三待判别POI数据相关的第二关联AOI数据,并基于所述第三待判别POI数据及所述第二关联AOI数据获取第二挖掘结果;
基于所述第一挖掘结果及所述第二挖掘结果获得目标挖掘结果。
2.根据权利要求1所述的挖掘方法,其特征在于,所述获取第一待判别POI数据,包括:
获取所有POI数据的类别参数;
从所有所述POI数据中选取所述类别参数符合预设类别参数的POI数据作为所述第一待判别POI数据,所述预设类别参数包括所述商场、所述商圈、所述物流园区中的至少一种。
3.根据权利要求1所述的挖掘方法,其特征在于,所述第一类型数据包括所述位置数据和所述轨迹数据,所述对所述第一类型数据中的至少一种数据进行预处理得到预处理数据,包括:
基于所述位置数据对应的所述关联历史订单的时间,对所有所述位置数据进行排序,以得到预处理位置数据;
从所述轨迹数据中选取出轨迹完整度大于预设值的数据以作为预处理轨迹数据。
4.根据权利要求3所述的挖掘方法,其特征在于,所述第一类型数据还包括所述地址备注数据,所述对所述预处理数据及部分所述第一类型数据进行校正处理得到校正数据,包括:
对所述预处理位置数据进行第一聚合处理以得到校正位置数据;
对所述地址备注数据进行第二聚合处理以得到校正地址备注数据;
将所述轨迹数据中的轨迹坐标与基础路网数据进行挂接匹配,以得到校正轨迹数据。
5.根据权利要求4所述的挖掘方法,其特征在于,所述基于所述第二待判别POI数据及所述校正数据获取第一挖掘结果,包括:
对所述第二待判别POI数据与所述校正数据进行空间距离分析以得到所述第一挖掘结果。
6.根据权利要求1所述的挖掘方法,其特征在于,所述第二类型数据包括所述碰面时长和所述语音数据,所述基于所述第二类型数据获取第三待判别POI数据,包括:
选取所述关联历史订单中的所述碰面时长超过预设时长且所述语音数据中包含设定词汇的选定历史订单;
获取所述选定历史订单的位置数据以作为所述第三待判别POI数据。
7.根据权利要求6所述的挖掘方法,其特征在于,所述基于所述第三待判别POI数据及所述第二关联AOI数据获取第二挖掘结果,包括:
对所述第三待判别POI数据及所述第二关联AOI数据进行空间分析以得到所述第二挖掘结果。
8.一种POI数据的挖掘装置,其特征在于,所述POI数据为货运POI数据,所述挖掘装置包括:
第一获取模块,用于获取第一待判别POI数据,所述第一待判别POI数据包括商场POI数据、商圈POI数据、物流园区POI数据中的至少一种;
第二获取模块,用于获取与所述第一待判别POI数据相关的第一关联AOI数据,并基于所述第一待判别POI数据及所述第一关联AOI数据获取第二待判别POI数据;
第三获取模块,用于获取与所述第二待判别POI数据相关的关联历史订单;
第一处理模块,用于获取所述关联历史订单中的第一类型数据,并对所述第一类型数据中的至少一种数据进行预处理得到预处理数据,所述第一类型数据包括位置数据、轨迹数据、地址备注数据中的至少一种;
第二处理模块,用于对所述预处理数据及部分所述第一类型数据进行校正处理得到校正数据;
第四获取模块,用于基于所述第二待判别POI数据及所述校正数据获取第一挖掘结果;
第五获取模块,用于获取所述关联历史订单中的第二类型数据,并基于所述第二类型数据获取第三待判别POI数据,所述第二类型数据包括碰面时长、语音数据中的至少一种;
第六获取模块,用于获取与所述第三待判别POI数据相关的第二关联AOI数据,并基于所述第三待判别POI数据及所述第二关联AOI数据获取第二挖掘结果;
第七获取模块,用于基于所述第一挖掘结果及所述第二挖掘结果获得目标挖掘结果。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储器;及
一个或多个计算机程序,其中,所述一个或多个计算机程序被存储在所述存储器中,并被配置为由所述一个或多个处理器执行,所述一个或多个计算程序配置用于:执行权利要求1至7任意一项所述的POI数据的挖掘方法。
10.一种存储有计算机程序的非易失性计算机可读存储介质,其特征在于,当所述计算机程序被一个或多个处理器执行时,使得所述处理器执行权利要求1至7任意一项所述的POI数据的挖掘方法。
CN202310660121.8A 2022-12-27 2023-06-05 Poi数据的挖掘方法及其装置、计算机设备及存储介质 Active CN116719896B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202211679169.5A CN115658839A (zh) 2022-12-27 2022-12-27 Poi数据的挖掘方法、装置、计算机设备及存储介质
CN2022116791695 2022-12-27

Publications (2)

Publication Number Publication Date
CN116719896A true CN116719896A (zh) 2023-09-08
CN116719896B CN116719896B (zh) 2024-02-06

Family

ID=85023558

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211679169.5A Pending CN115658839A (zh) 2022-12-27 2022-12-27 Poi数据的挖掘方法、装置、计算机设备及存储介质
CN202310660121.8A Active CN116719896B (zh) 2022-12-27 2023-06-05 Poi数据的挖掘方法及其装置、计算机设备及存储介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211679169.5A Pending CN115658839A (zh) 2022-12-27 2022-12-27 Poi数据的挖掘方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (2) CN115658839A (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060287810A1 (en) * 2005-06-16 2006-12-21 Pasha Sadri Systems and methods for determining a relevance rank for a point of interest
US20160132513A1 (en) * 2014-02-05 2016-05-12 Sk Planet Co., Ltd. Device and method for providing poi information using poi grouping
CN108984640A (zh) * 2018-06-22 2018-12-11 华北电力大学 一种基于web数据挖掘的地理信息获取方法
CN109241225A (zh) * 2018-08-27 2019-01-18 百度在线网络技术(北京)有限公司 兴趣点竞争关系挖掘方法、装置、计算机设备及存储介质
CN110149804A (zh) * 2018-05-28 2019-08-20 北京嘀嘀无限科技发展有限公司 用于确定兴趣点的父-子关系的系统和方法
CN110427444A (zh) * 2019-07-26 2019-11-08 北京百度网讯科技有限公司 导航引导点挖掘方法、装置、设备和存储介质
CN111160471A (zh) * 2019-12-30 2020-05-15 腾讯云计算(北京)有限责任公司 一种兴趣点数据处理方法、装置、电子设备和存储介质
CN111782741A (zh) * 2020-06-04 2020-10-16 汉海信息技术(上海)有限公司 兴趣点挖掘方法、装置、电子设备及存储介质
CN111813787A (zh) * 2020-04-08 2020-10-23 北京嘀嘀无限科技发展有限公司 地图数据的下发方法、更新方法、存储介质及电子设备
CN111896016A (zh) * 2020-07-28 2020-11-06 拉扎斯网络科技(上海)有限公司 位置信息的处理方法及装置、存储介质、终端
CN112101339A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 地图兴趣点的信息获取方法、装置、电子设备和存储介质
CN114428824A (zh) * 2020-10-29 2022-05-03 汉海信息技术(上海)有限公司 Poi重要度确定方法、装置、电子设备及存储介质
CN114756634A (zh) * 2021-01-08 2022-07-15 丰图科技(深圳)有限公司 兴趣点变化发现方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718470B (zh) * 2014-12-03 2019-08-20 高德软件有限公司 一种poi数据处理方法和装置
CN111220173B (zh) * 2018-11-26 2023-07-28 阿里巴巴集团控股有限公司 一种poi的识别方法及装置
CN111881225A (zh) * 2020-04-01 2020-11-03 北京嘀嘀无限科技发展有限公司 一种修正上车点名称的方法和系统
CN113886719A (zh) * 2021-09-29 2022-01-04 阿里巴巴(中国)有限公司 数据处理方法、交互方法、订单分配方法及计算设备
CN114297326A (zh) * 2021-12-13 2022-04-08 汉海信息技术(上海)有限公司 一种地址的验证方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060287810A1 (en) * 2005-06-16 2006-12-21 Pasha Sadri Systems and methods for determining a relevance rank for a point of interest
US20160132513A1 (en) * 2014-02-05 2016-05-12 Sk Planet Co., Ltd. Device and method for providing poi information using poi grouping
CN110149804A (zh) * 2018-05-28 2019-08-20 北京嘀嘀无限科技发展有限公司 用于确定兴趣点的父-子关系的系统和方法
CN108984640A (zh) * 2018-06-22 2018-12-11 华北电力大学 一种基于web数据挖掘的地理信息获取方法
CN109241225A (zh) * 2018-08-27 2019-01-18 百度在线网络技术(北京)有限公司 兴趣点竞争关系挖掘方法、装置、计算机设备及存储介质
CN110427444A (zh) * 2019-07-26 2019-11-08 北京百度网讯科技有限公司 导航引导点挖掘方法、装置、设备和存储介质
CN111160471A (zh) * 2019-12-30 2020-05-15 腾讯云计算(北京)有限责任公司 一种兴趣点数据处理方法、装置、电子设备和存储介质
CN111813787A (zh) * 2020-04-08 2020-10-23 北京嘀嘀无限科技发展有限公司 地图数据的下发方法、更新方法、存储介质及电子设备
CN111782741A (zh) * 2020-06-04 2020-10-16 汉海信息技术(上海)有限公司 兴趣点挖掘方法、装置、电子设备及存储介质
CN111896016A (zh) * 2020-07-28 2020-11-06 拉扎斯网络科技(上海)有限公司 位置信息的处理方法及装置、存储介质、终端
CN112101339A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 地图兴趣点的信息获取方法、装置、电子设备和存储介质
CN114428824A (zh) * 2020-10-29 2022-05-03 汉海信息技术(上海)有限公司 Poi重要度确定方法、装置、电子设备及存储介质
CN114756634A (zh) * 2021-01-08 2022-07-15 丰图科技(深圳)有限公司 兴趣点变化发现方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN115658839A (zh) 2023-01-31
CN116719896B (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
CN112526513B (zh) 基于聚类算法的毫米波雷达环境地图构建方法及装置
CN113593017A (zh) 露天矿地表三维模型构建方法、装置、设备及存储介质
US11676375B2 (en) System and process for integrative computational soil mapping
CN112906823B (zh) 目标对象识别模型训练方法、识别方法及识别装置
CN111341103A (zh) 车道信息提取方法、装置、设备及存储介质
CN111475746B (zh) 兴趣点位置挖掘方法、装置、计算机设备和存储介质
CN113408561A (zh) 模型生成方法、目标检测方法、装置、设备及存储介质
CN114186619A (zh) 车辆停靠点聚类的方法、装置、设备及存储介质
CN116612280A (zh) 车辆分割方法、装置、计算机设备和计算机可读存储介质
CN114157507A (zh) 采用大数据分析的云服务漏洞分析方法及人工智能系统
CN116719896B (zh) Poi数据的挖掘方法及其装置、计算机设备及存储介质
CN111582378B (zh) 定位识别模型的训练生成方法、位置检测方法、装置
CN112269848A (zh) 一种众包轨迹数据融合方法及装置
US11988522B2 (en) Method, data processing apparatus and computer program product for generating map data
CN111767357B (zh) 区域采全评估方法和设备、电子设备和存储介质
CN115731215A (zh) 一种回环检测方法、装置、电子设备及存储介质
CN115406452A (zh) 一种实时定位及建图方法、装置及终端设备
CN113761033B (zh) 基于档案数字化管理的信息整理方法及系统
CN113808142A (zh) 一种地面标识的识别方法、装置、电子设备
CN113609990A (zh) 目标建筑物的施工进度的确定方法、装置和服务器
CN112836991A (zh) 站点规划方法、装置、终端设备和可读存储介质
CN112712197B (zh) 一种数据处理方法、装置、设备和存储介质
CN114299043B (zh) 点云质量评估方法、装置、电子设备和存储介质
CN116929355A (zh) 代价地图更新方法、机器人和计算机存储介质
CN114428871A (zh) 图像聚类方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant