CN112989193A - 数据处理方法、装置、电子设备及计算机存储介质 - Google Patents

数据处理方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN112989193A
CN112989193A CN202110265258.4A CN202110265258A CN112989193A CN 112989193 A CN112989193 A CN 112989193A CN 202110265258 A CN202110265258 A CN 202110265258A CN 112989193 A CN112989193 A CN 112989193A
Authority
CN
China
Prior art keywords
grid
discrete
discrete point
target
discrete points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110265258.4A
Other languages
English (en)
Inventor
易爱华
王震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Chengkan Information Technology Co Ltd
Original Assignee
Shanghai Chengkan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Chengkan Information Technology Co Ltd filed Critical Shanghai Chengkan Information Technology Co Ltd
Priority to CN202110265258.4A priority Critical patent/CN112989193A/zh
Publication of CN112989193A publication Critical patent/CN112989193A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本发明的目的是提供一种数据处理方法、装置、电子设备及计算机存储介质,该方法包括:根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。通过本发明的实施方式能够快速有效的将离散点进行分簇。

Description

数据处理方法、装置、电子设备及计算机存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种数据处理方法、装置、电子设备及计算机存储介质。
背景技术
在飞速发展的信息化时代,经常会碰到需要展示大量信息点的场景。但是,如果同时展示如此多的信息点会导致信息密集,而造成信息内容互相覆盖而无法清晰显示。因此,需要将不同的信息点归集到一个或多个簇中,以这个簇来表征对应的信息点来展示综合信息。例如,目前GIS(地理信息系统)已融入了生活的方方面面,在互联网应用中经常会碰到需要在web地图上同时展示大量点位信息的场景,当地图可视域较大时,点位密集造成信息内容互相覆盖而无法清晰显示。此时需要将与某个点周边一定范围内的其他点归集到一个簇中,这个簇的综合信息会在地图用一个点位进行展示,从而大大减少了地图可视域张中点位的数量,以获得良好的展示效果。
现有技术中,将大量的离散点归集到簇中往往需要多次遍历计算,过程耗时长、效率低。
发明内容
本说明书实施方式的目的是提供一种数据处理方法、装置、电子设备及计算机存储介质,能够快速有效的将离散点进行分簇。
为实现上述目的,本说明书实施方式提供一种数据处理方法,所述方法包括:根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
在一个实施方式中,所述网格标记为一对数组,该数组用于表征对应的所述网格单元在所述网格群中的位置。
在一个实施方式中,在根据每个离散点的坐标,确定以聚合距离为格网间距的网格群的步骤后还包括:将所述网格单元的所述网格标记作为该网格单元中所述离散点的附带信息。
在一个实施方式中,基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合的步骤中包括:基于每个所述离散点作为中心离散点,确定所述中心离散点对应的候选集合;其中,所述候选集合中的离散点对应的网格单元与所述中心离散点的对应的网格单元相邻或相同;该相邻关系包括直接相邻、斜对角相邻;遍历计算所述候选集合中的每个离散点与所述中心离散点的距离值;将所述距离值小于或等于所述聚合距离对应的所述离散点放入该中心离散点对应的所述初始集合。
在一个实施方式中,在根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合的步骤中包括:基于所述初始集合的密度特征值,将密集程度最大的所述初始集合作为第一个所述目标集合;所述密度特征值表征对应的所述初始集合中所述离散点的密集程度;根据已确定的所述目标集合,在剩余所述初始集合中排除已确定的所述目标集合中包含的所述离散点,并重新计算剩余所述初始集合的密度特征值;根据所述重新计算得到的所述密度特征值,将其中密集程度最大的集合作为后一个所述目标集合,直至遍历所述初始集合。
在一个实施方式中,所述密度特征值至少包括以下之一:所述密度特征值为该初始集合中所述离散点的数量,所述密度特征值越大表征该初始集合中所述离散点越密集;或,所述密度特征值为该初始集合中所述离散点构成的外包多边形的面积或外包多边体的体积除以所述离散点的数量,所述密度特征值越小表征该初始集合中所述离散点越密集。
在一个实施方式中,在筛选得到目标集合的步骤后还包括:确定所述目标集合的表征中心,所述表征中心用于在展示界面对应相对位置展示该目标集合的信息。
在一个实施方式中,所述表征中心为所述目标集合中所述离散点构成的外包多边形或外包多边体的重心。
在一个实施方式中,所述方法应用于地图展示;所述离散点至少附带有待展示的目标点位信息,所述表征中心用于表征所述目标集合以用于展示该目标集合的综合信息。
本说明书实施方式还提供一种数据处理装置,所述装置包括:第一处理单元,用于根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;第二处理单元,用于基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;第三处理单元,用于根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
本说明书实施方式还提供一种电子设备,包括:数据接收设备,处理器;所述数据接收设备,用于获得离散点数据;所述处理器,用于根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
本说明书实施方式还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
由以上本说明书实施方式提供的技术方案可见,本说明书实施方式根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合。以上做法能够快速有效的将离散点进行分簇,减少大量的重复计算量。
附图说明
为了更清楚地说明本说明书实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书提供的一种数据处理方法的流程图;
图2是本说明书提供的一种二维情况下分簇示意图;
图3是本说明书提供的一种二维情况下网格单元的网格标记示意图;
图4是本说明书提供的一种电子设备示意图。
具体实施方式
下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都应当属于本申请保护的范围。
请参阅图1。本说明书提供的一种数据处理方法。所述方法可以包括以下步骤。
在本实施方式中,执行所述数据处理方法的客体可以是具有逻辑运算功能的电子设备。所述电子设备可以是服务器和客户端。所述客户端可以为台式电脑、平板电脑、笔记本电脑、智能手机、数字助理等。当然,客户端并不限于上述具有一定实体的电子设备,其还可以为运行于上述电子设备中的软体。还可以是一种通过程序开发形成的程序软件,该程序软件可以运行于上述电子设备中。
在本实施方式中,所述数据处理方法可以应用于地图系统,也可以应用于数据抽析等场景。
步骤S10:根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点。
在本实施方式中,所述离散点附带有坐标信息。具体的,例如,在二维空间中,所述离散点附带有该离散点的x、y坐标,以表征该离散点的位置;在三维空间中,所述离散点附带有该离散点的x、y、z坐标,以表征该离散点的位置。当然,所述离散点还可以附带其他表征信息,例如,所述离散点用于表征餐厅A,则对应的文字信息餐厅A为该离散点附带的其他表征信息。
在本实施方式中,所述聚合距离为预设的一个距离,用于将所述目标区域内的离散点以该距离作为基准进行聚合。所述网格群的网格间距为聚合距离,所述网格群用于将目标区域分割为相同大小的多个网格单元。具体的,所述网格群为所述网格单元不留空间的规则排列组成,每个所述网格单元的大小形状相同,所述网格单元在二维空间中可以是正方形,在三维空间中可以是正方体。所述网格群的格网间距为所述网格单元的边长。所述网格群用于将所有离散点划分到对应的所述网格单元的空间中。所述目标区域用于表征所述离散点的区域,该区域中包含所有的所述离散点。所述网格单元的空间位置属性可以包括该网格单元对应的空间坐标范围,也可以包括该网格单元与其他网格单元的空间位置关系。请参阅图2,图2为一个二维场景下的示例。途中的黑点表征所述离散点,每个所述网格单元边长为所述聚合距离。
在本实施方式中,所述网格标记可以用于区分不同的所述网格单元。当然,所述网格标记的标记符号还可以与该网格单元的空间属性对应。具体的,例如,请参阅图3,所述网格标记可以是一组数组,第一行第一列的所述网格单元的网格标记为(1,1),第i行第j列的所述网格单元的网格标记为(i,j)。在该场景示例中,用户或计算机可以直接通过所述网格标记判断该网格单元的位置。在三维空间中,同理。
在本实施方式中,确定以聚合距离为格网间距的网格群后,所述离散点与所述网格单元就有了空间位置关联特性。请参阅图2,在建立网格后,所述离散点都会落入对应的所述网格单元。在一个实施方式中,可以建立空间网格单元索引,通过空间位置分析,建立所述离散点与所述网格单元的对应关系,即通过所述网格单元可以查到包含在该网格单元内的所述离散点,通过离散点可以查到包含该离散点的所述网格单元。在一个场景示例中,可以通过所述网格标记建立所述空间网格单元索引。具体的,例如,在构建网格后,每个离散点附带其落入的所述网格单元的网格标记,以方便后期查询对应的所述网格单元或所述网格单元对应的所述离散点。
步骤S12:基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离。
在本实施方式中,基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合。具体的,针对每个所述离散点建立其对应的初始集合,每个所述离散点在各自对应的初始集合中作为中心离散点。在初始集合中的所述离散点的距离与该中心离散点的距离小于或等于所述聚合距离。
在本实施方式中,可以通过所述中心离散点的标记来区分各个不同的初始集合。例如,所述离散点的标记为{a1,a2,a3,…,an},对应的以所述离散点a1为基准建立的所述初始集合的标记可以为A1,以所述离散点ai为基准建立的所述初始集合的标记可以为Ai,在Ai 中的所有所述离散点距所述离散点ai距离小于或等于所述聚合距离。
在本实施方式中,在确定所述初始集合的步骤中可以通过所述离散点对应的所述网格单元与相邻的所述网格单元来初步筛选候选离散点,以减小计算工作量。具体的,例如,请参阅图3,目标的所述离散点为a8,该离散点位于所述网格标记为(3,3)的所述网格单元,计算该离散点a8对应的初始集合A8中包含的离散点时,将与网格单元(3,3)相邻的网格单元(3,2)、网格单元(3,4)、网格单元(2,2)、网格单元(2,3)、网格单元(2,4)、网格单元(4,2)、网格单元(4,3)、网格单元(4,4),以及该网格单元(3,3)中的离散点放入候选集合。遍历计算所述候选集合中的每个离散点与所述中心离散点的距离值,将所述距离值小于或等于所述聚合距离对应的所述离散点和所述离散点a8一起放入该对应的所述初始集合A8中。
步骤S14:根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
在本实施方式中,所述目标集合可以称为所述离散点聚合后的簇。因多个所述初始集合中存在重复点,因此,需要筛选得到所述目标集合,使所述目标集合之间无交集,且目标集合的并集能包含所有的所述离散点,以实现将所述离散点进行聚合。
在一个实施方式中,筛选得到目标集合可以是基于所述初始集合的密度特征值,将密集程度最大的所述初始集合作为第一个所述目标集合;所述密度特征值表征对应的所述初始集合中所述离散点的密集程度;根据已确定的所述目标集合,在剩余所述初始集合中排除已确定的所述目标集合中包含的所述离散点,并重新计算剩余所述初始集合的密度特征值;根据所述重新计算得到的所述密度特征值,将其中密集程度最大的集合作为后一个所述目标集合,直至遍历所述初始集合。具体的,例如,计算每个簇的所有离散点构成的外包多边形的面积,面积除以离散点数量作为此簇的密度特征值;密度特征值越小表征该簇的密集程度越大,权重也越大;根据簇的密度特征值从小到大排序,并按此顺序遍历簇,如果簇中记录的离散点已经存在于前面的簇当中,则从当前簇中删除,保证一个离散点只属于一个簇,从当前簇开始对后续的簇再次按照上述步骤执行,如此循环,直到簇中的离散点不再变化。以此完成所述离散点聚合,得到多个簇和不满足聚合条件的独立离散点。其中,计算得到的簇中只包含了1个所述离散点的情况时,该离散点就为独立离散点。
当然,本实施方式同样适用于三维空间中,此处不做具体赘述。
在本实施方式中,根据所述离散点建立所述网格群,以赋予所述离散点与所述网格单元的空间位置关联关系,可以利用空间网格索引,提高所述离散点的检索速度,筛选符合条件的所述离散点,作为所述候选离散点,极大地减少了重复无效地计算。通过先确定每个所述离散点对应的所述初始集合,将所述初始集合进行排列,并根据排列情况对所述初始集合中的所述离散点进行筛选,得到所述目标集合。基于直线距离和密度进行分簇,优选出集中度高的离散点构成簇,避免簇中出现离群点以实现对所述离散点聚合,得到多个簇和不满足聚合条件的独立离散点。
在一个实施方式中,所述网格标记为一对数组,该数组用于表征对应的所述网格单元在所述网格群中的位置。
在本实施方式中,所述网格标记不仅仅用于区分不同的所述网格单元,还可以用于标记出该网格单元在所述网格群中的位置。请参阅图3,所述网格单元的网格标记为(i,j),表征该单元格位于第i行第j列。当然,在三维空间中,所述网格单元格的网格标记可以是3 个数组成的数组以表征该网格单元在所述网格群中的位置。
在本实施方式中,所述网格标记为表征对应的所述网格单元在所述网格群中位置的一对数组,既起到了区分不同的所述网格单元的作用,也起到了将所述网格单元进行位置标记的作用,可以直接应用于空间索引,方便确定所述离散点对应的所述网格单元与相邻的所述网格单元,减小后续计算工作量。
在一个实施方式中,在根据每个离散点的坐标,确定以聚合距离为格网间距的网格群的步骤后还包括:将所述网格单元的所述网格标记作为该网格单元中所述离散点的附带信息。
在本实施方式中,在本实施方式中,所述离散点可以附带有多个信息。例如,该离散点的坐标信息为第一位置信息,对应的网格标记也可以作为该离散点的第二位置信息。在确定以聚合距离为格网间距的网格群的步骤后,可以根据所述离散点和所述网格单元的空间位置关联关系,将所述网格单元的网格标记赋予给所述离散点。具体的,例如,图3中的所述离散点a8位于所述网格单元(3,3),将所述网格标记(3,3)赋值到所述离散点a8的位置信息中,在确定所述离散点a8对应的所述初始集合时,可以通过所述离散点a8的位置信息中的所述网格标记(3,3)快速找到该网格单元和相邻的网格单元。
在一个实施方式中,基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合的步骤中包括以下步骤。
步骤S20:基于每个所述离散点作为中心离散点,确定所述中心离散点对应的候选集合;其中,所述候选集合中的离散点对应的网格单元与所述中心离散点的对应的网格单元相邻或相同;该相邻关系包括直接相邻、斜对角相邻。
步骤S22:遍历计算所述候选集合中的每个离散点与所述中心离散点的距离值。
步骤S24:将所述距离值小于或等于所述聚合距离对应的所述离散点放入该中心离散点对应的所述初始集合。
在本实施方式中,所述初始集合中任一所述离散点与其对应的所述中心离散点的距离都小于或等于所述聚合距离。如果遍历所有的所述离散点无疑计算量十分巨大,所以,首选确定候选的所述离散点的集合作为所述候选集合。在该候选集合中,遍历计算所述候选集合中任意任一所述离散点与所述中心离散点的聚合距离。在距离小于或等于所述聚合距离时,将该离散点放入该中心离散点对应的所述初始集合中。同样的,该中心离散点也可以作为其他离散点作为中心离散点的初始集合中,即两个离散点分别记录在对方的初始集合中。
在本实施方式中,针对某个中心离散点的候选集合,所述候选集合中的离散点对应的网格单元与所述中心离散点的对应的网格单元相邻或相同;该相邻关系包括直接相邻、斜对角相邻。具体的,请参阅图3,如果中心离散点位于(3,3),则对应的所述候选集合为网格单元(3,2)、网格单元(3,4)、网格单元(2,2)、网格单元(2,3)、网格单元(2,4)、网格单元(4,2)、网格单元(4,3)、网格单元(4,4),以及该网格单元(3,3)中的离散点。同理,在三维空间中,候选集合中的离散点也是与所述中心离散点的对应的网格单元相邻或相同的网格单元中的离散点;该相邻关系包括直接相邻、斜对角相邻。
在本实施方式中,通过预先缺点候选集合,以进一步筛选得到所述初始集合,可以大大减小计算量。
在一个实施方式中,在根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合的步骤中可以包括以下步骤。
步骤S30:基于所述初始集合的密度特征值,将密集程度最大的所述初始集合作为第一个所述目标集合;所述密度特征值表征对应的所述初始集合中所述离散点的密集程度;
步骤S32:根据已确定的所述目标集合,在剩余所述初始集合中排除已确定的所述目标集合中包含的所述离散点,并重新计算剩余所述初始集合的密度特征值;
步骤S34:根据所述重新计算得到的所述密度特征值,将其中密集程度最大的集合作为后一个所述目标集合,直至遍历所述初始集合。
在本实施方式中,所述密度特征值表征对应的所述初始集合中所述离散点的密集程度。具体的,例如,所述密度特征值可以是该初始集合中所述离散点的数量,所述密度特征值越大表征该初始集合中所述离散点越密集;或,所述密度特征值为该初始集合中所述离散点构成的外包多边形的面积或外包多边体的体积除以所述离散点的数量,所述密度特征值越小表征该初始集合中所述离散点越密集。
在本实施方式中,通过所述密度特征值筛选所述初始集合中的所述离散点。具体的,将最密集的所述初始集合作为第一个所述目标集合,然后将其他初始集合中与第一个目标集合中相同的所述离散点排除。排除后,重新计算剩余初始集合的密度特征值,将其中最密集的所述初始集合作为第二个所述目标集合。以此类推,在剩余的初始集合中排除已经确定的所述目标集合中的所述离散点,重新计算密度特征值,直至将所有的所述离散点放入所述目标集合。即所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。其中,若所述目标集合只包含一个所述离散点,则该离散点为离群离散点。
通过上述方法,可以优先得到集中度高的所述目标集合,还可以确定离群离散点。
在一个实施方式中,所述密度特征值至少包括以下之一:所述密度特征值为该初始集合中所述离散点的数量,所述密度特征值越大表征该初始集合中所述离散点越密集;或,所述密度特征值为该初始集合中所述离散点构成的外包多边形的面积或外包多边体的体积除以所述离散点的数量,所述密度特征值越小表征该初始集合中所述离散点越密集。
上述实施方式提供两种所述密度特征值的表示方法,可以有效的表示所述初始集合的密度。
在一个实施方式中,在筛选得到目标集合的步骤后还包括确定所述目标集合的表征中心,所述表征中心用于在展示界面对应相对位置展示该目标集合的信息。
在本实施方式中,所述表征中心可以是一个概念位置,用于表征该目标集合。在展示所述离散点时,将所述目标集合作为该目标集合中所述离散点的代表进行展示。在展示界面展示时,所述表征中心用于在展示界面对应相对位置展示该目标集合的信息。在本实施方式中,表征中心可以附带有位置信息,以实现在界面展示时,各个所述目标集合的表征中心能根据各自的相对位置信息,在界面相应位置进行展示。请参阅图2,图2中各簇汇聚的点就可以作为该簇的表征中心,在界面展示时可以在该表征中心对应的位置展示该簇的综合信息,避免信息在展示界面重叠。
通过表征中心进行展示可以起到代表作用,避免展示界面信息过多造成信息重叠。
在一个实施方式中,所述表征中心为所述目标集合中所述离散点构成的外包多边形或外包多边体的重心。
在本实施方式中,将重心的位置作为所述表征中心的位置,效果较好。
在一个实施方式中,所述方法应用于地图展示;所述离散点至少附带有待展示的目标点位信息,所述表征中心用于表征所述目标集合以用于展示该目标集合的综合信息。
在本实施方式中,将上述方法应用于地图展示的场景,优化地图系统。
本说明书实施方式中还提供了一种数据处理装置,如下面的实施方式所述。由于一种数据处理装置解决问题的原理与一种数据处理方法相似,因此一种数据处理装置的实施可以参见一种数据处理方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。该装置具体可以包括:第一处理单元、第二处理单元、第三处理单元。下面对该结构进行具体说明。
第一处理单元,用于根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点。
第二处理单元,用于基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离。
第三处理单元,用于根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
本实施方式中的相关术语可以参见前述实施方式对照解释,此处不再复述。
请参阅图4,本说明书实施方式中还提供了一种电子设备,所述电子设备可以包括:数据接收设备,处理器。
所述数据接收设备,用于获得离散点数据。
所述处理器,用于根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
所述数据接收设备是用户和计算机系统之间进行信息交换的主要装置之一。所述数据接收设备包括键盘、鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等;所述数据接收设备用于把数据的输入到计算机中。
所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。
在本实施方式中,该电子设备具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
本说明书实施方式中还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
在本实施方式中,所述存储器包括但不限于随机存取存储器(Random AccessMemory, RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(HardDiskDrive, HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
尽管本申请内容中提到一种数据处理方法、装置、电子设备及存储器介质,但是,本申请并不局限于必须是行业标准或实施例所描述的情况等,某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、处理、输出、判断方式等的实施例,仍然可以属于本申请的可选实施方案范围之内。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。
上述实施例阐明的装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络 PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请。

Claims (12)

1.一种数据处理方法,其特征在于,所述方法包括:
根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;
基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;
根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
2.如权利要求1所述的方法,其特征在于,所述网格标记为一对数组,该数组用于表征对应的所述网格单元在所述网格群中的位置。
3.如权利要求2所述的方法,其特征在于,在根据每个离散点的坐标,确定以聚合距离为格网间距的网格群的步骤后还包括:
将所述网格单元的所述网格标记作为该网格单元中所述离散点的附带信息。
4.如权利要求1所述的方法,其特征在于,基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合的步骤中包括:
基于每个所述离散点作为中心离散点,确定所述中心离散点对应的候选集合;其中,所述候选集合中的离散点对应的网格单元与所述中心离散点的对应的网格单元相邻或相同;该相邻关系包括直接相邻、斜对角相邻;
遍历计算所述候选集合中的每个离散点与所述中心离散点的距离值;
将所述距离值小于或等于所述聚合距离对应的所述离散点放入该中心离散点对应的所述初始集合。
5.如权利要求1所述的方法,其特征在于,在根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合的步骤中包括:
基于所述初始集合的密度特征值,将密集程度最大的所述初始集合作为第一个所述目标集合;所述密度特征值表征对应的所述初始集合中所述离散点的密集程度;
根据已确定的所述目标集合,在剩余所述初始集合中排除已确定的所述目标集合中包含的所述离散点,并重新计算剩余所述初始集合的密度特征值;
根据所述重新计算得到的所述密度特征值,将其中密集程度最大的集合作为后一个所述目标集合,直至遍历所述初始集合。
6.如权利要求5所述的方法,其特征在于,所述密度特征值至少包括以下之一:
所述密度特征值为该初始集合中所述离散点的数量,所述密度特征值越大表征该初始集合中所述离散点越密集;或,
所述密度特征值为该初始集合中所述离散点构成的外包多边形的面积或外包多边体的体积除以所述离散点的数量,所述密度特征值越小表征该初始集合中所述离散点越密集。
7.如权利要求1所述的方法,其特征在于,在筛选得到目标集合的步骤后还包括:
确定所述目标集合的表征中心,所述表征中心用于在展示界面对应相对位置展示该目标集合的信息。
8.如权利要求7所述的方法,其特征在于,所述表征中心为所述目标集合中所述离散点构成的外包多边形或外包多边体的重心。
9.如权利要求7所述的方法,其特征在于,所述方法应用于地图展示;所述离散点至少附带有待展示的目标点位信息,所述表征中心用于表征所述目标集合以用于展示该目标集合的综合信息。
10.一种数据处理装置,其特征在于,所述装置包括:
第一处理单元,用于根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;
第二处理单元,用于基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;
第三处理单元,用于根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
11.一种电子设备,其特征在于,包括:数据接收设备,处理器;
所述数据接收设备,用于获得离散点数据;
所述处理器,用于根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
12.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:
根据每个离散点的坐标,确定以聚合距离为格网间距的网格群;所述网格群用于将目标区域分割为相同大小的多个网格单元;其中,每个网格单元都有对应的空间位置属性和网格标记;所述目标区域包含所有所述离散点;
基于所述离散点和所述网格单元的空间位置关联关系,确定多个初始集合;其中,每个所述离散点都有对应的所述初始集合,对应的,该离散点为该初始集合的中心离散点,该初始集合中的所述离散点与该中心离散点距离值小于或等于所述聚合距离;
根据每个所述初始集合的密集程度,排除所述初始集合中重复的离散点以得到目标集合;其中,所述目标集合的并集包含每个所述离散点,所述目标集合之间无交集。
CN202110265258.4A 2021-03-11 2021-03-11 数据处理方法、装置、电子设备及计算机存储介质 Pending CN112989193A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110265258.4A CN112989193A (zh) 2021-03-11 2021-03-11 数据处理方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110265258.4A CN112989193A (zh) 2021-03-11 2021-03-11 数据处理方法、装置、电子设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN112989193A true CN112989193A (zh) 2021-06-18

Family

ID=76335018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110265258.4A Pending CN112989193A (zh) 2021-03-11 2021-03-11 数据处理方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN112989193A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114141061A (zh) * 2021-11-30 2022-03-04 中航空管系统装备有限公司 基于离散化网格的空域运行监控的方法及利用上述方法对单航迹影响空域进行监控的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114141061A (zh) * 2021-11-30 2022-03-04 中航空管系统装备有限公司 基于离散化网格的空域运行监控的方法及利用上述方法对单航迹影响空域进行监控的方法
CN114141061B (zh) * 2021-11-30 2024-04-12 中航空管系统装备有限公司 基于离散化网格的空域运行监控的方法及其应用

Similar Documents

Publication Publication Date Title
US9965821B2 (en) Fully parallel in-place construction of 3D acceleration structures in a graphics processing unit
CN104050196B (zh) 一种兴趣点数据冗余检测方法及装置
US9396512B2 (en) Fully parallel construction of k-d trees, octrees, and quadtrees in a graphics processing unit
CN104281701B (zh) 分布式多尺度空间数据查询方法及系统
Wei et al. On the spatial distribution of buildings for map generalization
Tong et al. Efficient encoding and spatial operation scheme for aperture 4 hexagonal discrete global grid system
US20130144565A1 (en) Accuracy-based significant point derivation from dense 3d point clouds for terrain modeling
CN110647607A (zh) 一种基于图片识别的poi数据的验证方法和装置
CN109063193A (zh) 一种专题地图推荐显示的方法及装置
CN110888880A (zh) 基于空间索引的邻近分析方法、装置、设备及介质
CN115795000A (zh) 基于联合相似度算法对比的围标识别方法和装置
CN114090838A (zh) 大数据可视化展示的方法、系统、电子装置和存储介质
CN114219023A (zh) 数据聚类方法、装置、电子设备及可读存储介质
CN112989193A (zh) 数据处理方法、装置、电子设备及计算机存储介质
CN113706222A (zh) 一种门店选址的方法、装置
CN110688995A (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
CN105677843A (zh) 一种自动获取宗地四至属性的方法
CN113360586A (zh) 地址聚集度查询方法、装置、设备及计算机可读存储介质
US9317125B2 (en) Searching of line pattern representations using gestures
CN113724009A (zh) 一种运力定价方法、装置、电子设备及机器可读存储介质
Yang et al. Workload-based ordering of multi-dimensional data
CN113627184B (zh) 数据处理方法和装置
CN116028679B (zh) 一种数据处理方法、装置及设备
US20160246920A1 (en) Systems and methods of improved molecule screening
CN115587140B (zh) 基于大数据的电子工程项目数据可视化管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination