CN112801189A - 经纬度异常检测方法、装置、电子设备和存储介质 - Google Patents
经纬度异常检测方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112801189A CN112801189A CN202110127719.1A CN202110127719A CN112801189A CN 112801189 A CN112801189 A CN 112801189A CN 202110127719 A CN202110127719 A CN 202110127719A CN 112801189 A CN112801189 A CN 112801189A
- Authority
- CN
- China
- Prior art keywords
- longitude
- latitude
- points
- data
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 36
- 230000002159 abnormal effect Effects 0.000 claims abstract description 72
- 238000001514 detection method Methods 0.000 claims abstract description 62
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 33
- 238000001914 filtration Methods 0.000 claims abstract description 13
- 230000005856 abnormality Effects 0.000 claims description 24
- 238000010586 diagram Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 230000002547 anomalous effect Effects 0.000 claims 1
- 230000003287 optical effect Effects 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C25/00—Manufacturing, calibrating, cleaning, or repairing instruments or devices referred to in the other groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0833—Tracking
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Manufacturing & Machinery (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及物流技术领域,提供一种经纬度异常检测方法、装置、电子设备和存储介质。所述经纬度异常检测方法包括:获得一具有多栋楼的地理区域的经纬度数据;判断所述经纬度数据对应的经纬度点的数量是否达到预设值;若是,通过异常点检测算法对所述经纬度数据对应的各经纬度点进行检测,获得异常经纬度点;若否,根据各所述经纬度点之间的平均距离,获得异常经纬度点;自所述经纬度数据中滤除所述异常经纬度点对应的经纬度,获得所述地理区域的目标经纬度数据。本发明通过对包含多栋楼的地理区域的经纬度数据进行异常检测,准确剔除其中的异常经纬度点,从而提高经纬度数据的准确性,为后续的物流准确定位提供数据基础。
Description
技术领域
本发明涉及物流技术领域,具体地说,涉及一种经纬度异常检测方法、装置、电子设备和存储介质。
背景技术
在物流领域,日益发展的电商、外卖等业务对地理位置的定位准确性提出了更高的要求。在许多场景下,地理位置的定位精度需要精确到小区、工业园区等兴趣点的楼栋级别,这就需要提前采集兴趣点的楼栋经纬度。
楼栋经纬度的采集需要由人工进行,由于采集人员操作不规范等原因,采集到的楼栋经纬度通常存在一定程度上的误差。例如,将某兴趣点附近楼栋经纬度采集到了该兴趣点的经纬度数据中,造成后续定位时产生偏差。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种经纬度异常检测方法、装置、电子设备和存储介质,能够对包含多栋楼的地理区域的经纬度数据进行异常检测,准确剔除其中的异常经纬度点,从而提高经纬度数据的准确性,为后续的物流准确定位提供数据基础。
本发明的一个方面提供一种经纬度异常检测方法,包括:获得一具有多栋楼的地理区域的经纬度数据;判断所述经纬度数据对应的经纬度点的数量是否达到预设值;若是,通过异常点检测算法对所述经纬度数据对应的各经纬度点进行检测,获得异常经纬度点;若否,根据各所述经纬度点之间的平均距离,获得异常经纬度点;自所述经纬度数据中滤除所述异常经纬度点对应的经纬度,获得所述地理区域的目标经纬度数据。
在一些实施例中,所述异常点检测算法为基于密度的聚类算法,所述获得异常经纬度点,包括:获得所述经纬度数据对应的经纬度点分布图;通过所述基于密度的聚类算法,对所述经纬度点分布图中的各经纬度点进行聚类;获得聚类后经纬度点的数量最多的目标类,将未落入所述目标类的经纬度点作为异常经纬度点。
在一些实施例中,所述基于密度的聚类算法中,根据所述地理区域的楼栋分布确定邻域距离。
在一些实施例中,所述根据各所述经纬度点之间的平均距离,获得异常经纬度点,包括:根据每个经纬度点对应的经纬度,计算每个经纬度点与其余经纬度点之间的平均距离;以计算获得的平均距离的中位数与一阈值之和为距离阈值,将平均距离超出所述距离阈值的经纬度点作为异常经纬度点。
在一些实施例中,所述自所述经纬度数据中滤除所述异常经纬度点对应的经纬度后,还包括:获得剩余经纬度点的数量,及所述地理区域的楼栋数量;判断所述剩余经纬度点的数量是否等于所述楼栋数量;若否,还根据所述剩余经纬度点和所述地理区域的楼栋分布,确定遗漏楼栋和/或冗余经纬度点;如有遗漏楼栋,获得所述遗漏楼栋的经纬度,加入所述经纬度数据;如有冗余经纬度点,自所述经纬度数据中滤除所述冗余经纬度点对应的经纬度。
在一些实施例中,所述确定遗漏楼栋和/或冗余经纬度点,包括:将所述剩余经纬度点映射至一电子地图中,获得第一分布图;获得所述地理区域的楼栋分布图,通过叠加图层的方式缩放至所述电子地图中,获得第二分布图;对所述第一分布图和所述第二分布图进行重叠匹配,获得所述第二分布图中未匹配到经纬度点的遗漏楼栋,和/或所述第一分布图中未匹配到楼栋的冗余经纬度点。
在一些实施例中,所述获得所述地理区域的目标经纬度数据后,还包括:合并各地理区域的目标经纬度数据,形成关于各所述地理区域的标准经纬度数据库。
本发明的另一个方面提供一种经纬度异常检测装置,包括:初始数据获取模块,配置为获得一具有多栋楼的地理区域的经纬度数据;判断模块,配置为判断所述经纬度数据对应的经纬度点的数量是否达到预设值;第一检测模块,配置为当所述判断模块判断为是,通过异常点检测算法对所述经纬度数据对应的各经纬度点进行检测,获得异常经纬度点;第二检测模块,配置为当所述判断模块判断为否,根据各所述经纬度点之间的平均距离,获得异常经纬度点;异常数据滤除模块,配置为自所述经纬度数据中滤除所述异常经纬度点对应的经纬度,获得所述地理区域的目标经纬度数据。
本发明的再一个方面提供一种电子设备,包括:一处理器;一存储器,存储有可执行指令;其中,所述可执行指令被所述处理器执行时,实现上述任意实施例所述的经纬度异常检测方法。
本发明的又一个方面提供一种计算机可读的存储介质,存储有计算机程序,所述计算机程序被执行时实现上述任意实施例所述的经纬度异常检测方法。
本发明与现有技术相比的有益效果至少包括:
通过对包含多栋楼的地理区域的经纬度数据进行异常检测,具体根据经纬度点的数量,判断地理区域的规模;当规模较大时采用异常点检测算法识别地理区域的经纬度数据中的异常经纬度点;当规模较小时采用基于平均距离的方法识别地理区域的经纬度数据中的异常经纬度点;
从而,结合异常点检测算法和基于平均距离的方法,能够准确剔除地理区域的经纬度数据中的异常经纬度点,提高地理区域的经纬度数据的准确性,为后续的物流准确定位提供数据基础。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明实施例中经纬度异常检测方法的步骤示意图;
图2示出本发明实施例中复检过程的步骤示意图;
图3示出本发明实施例中确定遗漏楼栋/冗余经纬度点的步骤示意图;
图4示出本发明实施例中经纬度异常检测装置的模块示意图;
图5示出本发明实施例中电子设备的结构示意图;
图6示出本发明实施例中计算机可读的存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使本发明全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
下面实施例中的步骤序号仅用于表示不同的执行内容,并不严格限定步骤之间的执行顺序。具体描述时使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。需要说明的是,在不冲突的情况下,本发明的实施例及不同实施例中的特征可以相互组合。
图1示出实施例中经纬度异常检测方法的主要步骤,参照图1所示,本实施例中经纬度异常检测方法包括:在步骤S110中,获得一具有多栋楼的地理区域的经纬度数据;在步骤S120中,判断经纬度数据对应的经纬度点的数量是否达到预设值;在步骤S130中,若判断为是,通过异常点检测算法对经纬度数据对应的各经纬度点进行检测,获得异常经纬度点;在步骤S140中,若判断否,根据各经纬度点之间的平均距离,获得异常经纬度点;在步骤S150中,自经纬度数据中滤除异常经纬度点对应的经纬度,获得地理区域的目标经纬度数据。
具有多栋楼的地理区域通常指兴趣点(POI,Point ofInterest),包括小区、校区、工业园区等包含多楼栋的特定地理范围。每个地理区域的经纬度数据包括多个经纬度地址,提前采集好并预存至系统中。在进行经纬度异常检测时,自系统中提取需要检测的地理区域的经纬度数据。
根据地理区域的经纬度数据对应的经纬度点的数量,可以判断地理区域的规模大小。此处,预设值可根据实际需要设定,例如设定为5个。当地理区域的经纬度点的数量(对应该地理区域的大致的楼栋数量)达到预设值,判定该地理区域规模较大,采用异常点检测算法对该地理区域的经纬度点进行检测,识别出其中的异常经纬度点;当地理区域的经纬度点的数量小于预设值,判定该地理区域规模较小,采用基于平均距离的方法识别出其中的异常经纬度点。
从而,结合异常点检测算法和基于平均距离的方法,准确识别出地理区域中的异常经纬度点,将其对应的经纬度从经纬度数据中滤除,以获得地理区域的准确的目标经纬度数据,为后续的物流准确定位提供数据基础。
在一个实施例中,异常点检测算法具体采用基于密度的聚类算法DBSCAN(Density-Based Spatial Clustering of Application with Noise,具有噪声的基于密度的空间聚类应用)。获得异常经纬度点的过程具体包括:获得经纬度数据对应的经纬度点分布图;通过基于密度的聚类算法,对经纬度点分布图中的各经纬度点进行聚类;获得聚类后经纬度点的数量最多的目标类,将未落入目标类的经纬度点作为异常经纬度点。
经纬度点分布图可以通过地图投影的方法,获得地理区域的经纬度数据的二维经纬度点分布图。
基于密度的聚类算法能够对经纬度点分布图中的所有经纬度点进行聚类,根据聚类结果,点数最多的目标类中的经纬度点判定为采集正确的楼栋点,其余类中的经纬度点判定为异常经纬度点。在基于密度的聚类算法中,根据地理区域的楼栋分布确定邻域距离,例如设定为100m。也即,本实施例中经纬度点之间的距离为实际地理距离,距离相隔100m以内认为是相邻的点。
在其他实施例中,可以根据需要调整基于密度的聚类算法的参数,包括邻域距离和密度阈值,具体的参数设定可采用已有的技术,因此不再展开说明。使用密度的聚类算法,可以很好地解决地理区域形状不规则导致的异常经纬度点难以判断的问题。
在一个实施例中,根据各经纬度点之间的平均距离,获得异常经纬度点的过程具体包括:根据每个经纬度点对应的经纬度,计算每个经纬度点与其余经纬度点之间的平均距离;以计算获得的平均距离的中位数与一阈值之和为距离阈值,将平均距离超出距离阈值的经纬度点作为异常经纬度点。
其中,阈值也可参照地理区域的楼栋分布确定,例如设定为200m。在一个实施例中,可以通过抽取实际数据进行测试的方式,调整基于密度的聚类算法中的参数以及基于平均距离的方法中的阈值,直至通过基于密度的聚类算法和基于平均距离的方法,能够实现分别对相应规模的地理区域的经纬度数据进行准确检测。
通过上述的经纬度异常检测方法,实现了对地理区域的经纬度数据中的异常经纬度点的准确剔除,也即准确剔除了不属于该地理区域范围的经纬度,从而提高地理区域的经纬度数据的准确性。
进一步地,在一个实施例中,还通过复检过程,对滤除异常经纬度点后的经纬度数据进行复检,判断是否有遗漏的楼栋或者冗余的经纬度,以进一步提高地理区域的经纬度数据的准确性。
具体来说,参照图2所示的复检过程的主要步骤,自经纬度数据中滤除异常经纬度点对应的经纬度后,还包括:步骤S210,获得剩余经纬度点的数量,及地理区域的楼栋数量;步骤S220,判断剩余经纬度点的数量是否等于楼栋数量;步骤S230,若否,还根据剩余经纬度点和地理区域的楼栋分布,确定遗漏楼栋和/或冗余经纬度点;步骤S240,如有遗漏楼栋,获得遗漏楼栋的经纬度,加入经纬度数据;步骤S250,如有冗余经纬度点,自经纬度数据中滤除冗余经纬度点对应的经纬度。
剩余经纬度点是指自经纬度数据中滤除异常经纬度点对应的经纬度后,剩余的经纬度数据对应的经纬度点。地理区域的楼栋数量可以获取自互联网的公开数据,或者地图数据,或者在采集地理区域的经纬度数据时一并采集。
滤除异常经纬度点后,若剩余经纬度点的数量等于地理区域的楼栋数量,可判定此时剩余经纬度数据即对应地理区域的楼栋分布,因此可生成地理区域的目标经纬度数据。而若剩余经纬度点的数量不同于地理区域的楼栋数量,则需进一步根据剩余经纬度点和地理区域的楼栋分布,确定可能存在的遗漏楼栋/冗余经纬度点。
存在遗漏楼栋的场景例如,某地理区域中真实存在10栋楼,采集经纬度数据时,采集到10组经纬度,但其中两组经纬度由于采集偏差,实际不属于该地理区域。经过异常点检测算法,滤除了该两组经纬度,导致剩余经纬度数据对应的经纬度点的数量小于地理区域的楼栋数量。此时,需根据剩余经纬度点和地理区域的楼栋分布,确定具体的遗漏楼栋,补足其经纬度。
存在冗余经纬度点的场景例如,某地理区域中真实存在10栋楼,采集经纬度数据时,错误地多采集了两组经纬度,且该两组经纬度位于该地理区域范围内,从而没有被作为异常经纬度点滤除,而在复检过程中判别出剩余经纬度数据对应的经纬度点的数量大于地理区域的楼栋数量。此时,需根据剩余经纬度点和地理区域的楼栋分布,确定具体的冗余经纬度点,滤除其经纬度。
在一些场景中,遗漏楼栋和冗余经纬度点可能同时存在。
图3示出一个实施例中确定遗漏楼栋/冗余经纬度点的具体过程,参照图3所示,确定遗漏楼栋和/或冗余经纬度点,包括:步骤S310,将剩余经纬度点映射至一电子地图中,获得第一分布图;步骤S320,获得地理区域的楼栋分布图,通过叠加图层的方式缩放至电子地图中,获得第二分布图;步骤S330,对第一分布图和第二分布图进行重叠匹配,获得第二分布图中未匹配到经纬度点的遗漏楼栋,和/或第一分布图中未匹配到楼栋的冗余经纬度点。
可采用地图映射的方式,获得剩余经纬度点的第一分布图。地理区域的楼栋分布图可获取自互联网的公开数据,将楼栋分布图缩放至与电子地图同比例,并采用叠加图层的方式,获得所有楼栋的第二分布图。从而,根据第一分布图和第二分布图的重叠匹配,能够准确且快速地定位可能存在的遗漏楼栋/冗余经纬度点。
确定出遗漏楼栋/冗余经纬度点后,针对性采集遗漏楼栋的经纬度添加至地理区域的经纬度数据中/自地理区域的经纬度数据中滤除冗余经纬度点对应的经纬度,即可获得地理区域的准确的目标经纬度数据。
当获得各个地理区域的目标经纬度数据后,合并各地理区域的目标经纬度数据,即可形成关于各地理区域的标准经纬度数据库。该标准经纬度数据库,在电商物流等多种实际业务场景下都具有应用价值。
综上,上述的经纬度异常检测方法,结合异常点检测算法和基于平均距离的方法,对包含多栋楼的地理区域的经纬度数据进行异常检测,确剔除地理区域的经纬度数据中的异常点,从而提高地理区域的经纬度数据的准确性,为后续的物流准确定位提供数据基础。
本发明实施例还提供一种经纬度异常检测装置,可用于实现上述任意实施例描述的经纬度异常检测方法。上述任意实施例描述的经纬度异常检测方法的特征和原理均可应用至下面的经纬度异常检测装置实施例。在下面的经纬度异常检测装置实施例中,对已经阐明的关于经纬度异常检测的特征和原理不再重复说明。
图4示出一个实施例中经纬度异常检测装置的主要模块,参照图4所示,本实施例中经纬度异常检测装置400包括:初始数据获取模块410,配置为获得一具有多栋楼的地理区域的经纬度数据;判断模块420,配置为判断经纬度数据对应的经纬度点的数量是否达到预设值;第一检测模块430,配置为当判断模块420判断为是,通过异常点检测算法对经纬度数据对应的各经纬度点进行检测,获得异常经纬度点;第二检测模块440,配置为当判断模块420判断为否,根据各经纬度点之间的平均距离,获得异常经纬度点;异常数据滤除模块450,配置为自经纬度数据中滤除异常经纬度点对应的经纬度,获得地理区域的目标经纬度数据。
进一步地,经纬度异常检测装置400还可包括实现上述各经纬度异常检测方法实施例的其他流程步骤的模块,各个模块的具体原理可参照上述各经纬度异常检测方法实施例的描述,此处不再重复说明。
如上所述,本发明的经纬度异常检测装置,能够结合异常点检测算法和基于平均距离的方法,对包含多栋楼的地理区域的经纬度数据进行异常检测,确剔除地理区域的经纬度数据中的异常点,从而提高地理区域的经纬度数据的准确性,为后续的物流准确定位提供数据基础。
本发明实施例还提供一种电子设备,包括处理器和存储器,存储器中存储有可执行指令,可执行指令被处理器执行时,实现上述任意实施例描述的经纬度异常检测方法。
如上所述,本发明的电子设备能够结合异常点检测算法和基于平均距离的方法,对包含多栋楼的地理区域的经纬度数据进行异常检测,确剔除地理区域的经纬度数据中的异常点,从而提高地理区域的经纬度数据的准确性,为后续的物流准确定位提供数据基础。
图5是本发明实施例中电子设备的结构示意图,应当理解的是,图5仅仅是示意性地示出各个模块,这些模块可以是虚拟的软件模块或实际的硬件模块,这些模块的合并、拆分及其余模块的增加都在本发明的保护范围之内。
如图5所示,电子设备600以通用计算设备的形式表现。电子设备600的组件包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行上述任意实施例描述的经纬度异常检测方法的步骤。例如,处理单元610可以执行如图1至图3所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一个或多个程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700通信,外部设备700可以是键盘、指向设备、蓝牙设备等设备中的一种或多种。这些外部设备700使得用户能与该电子设备600进行交互通信。电子设备600也能与一个或多个其它计算设备进行通信,所示计算机设备包括路由器、调制解调器。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读的存储介质,用于存储程序,程序被执行时实现上述任意实施例描述的经纬度异常检测方法。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行上述任意实施例描述的经纬度异常检测方法。
如上所述,本发明的计算机可读的存储介质能够结合异常点检测算法和基于平均距离的方法,对包含多栋楼的地理区域的经纬度数据进行异常检测,确剔除地理区域的经纬度数据中的异常点,从而提高地理区域的经纬度数据的准确性,为后续的物流准确定位提供数据基础。
图6是本发明的计算机可读的存储介质的结构示意图。参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子包括但不限于:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读的存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备,例如利用因特网服务提供商来通过因特网连接。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1.一种经纬度异常检测方法,其特征在于,包括:
获得一具有多栋楼的地理区域的经纬度数据;
判断所述经纬度数据对应的经纬度点的数量是否达到预设值;
若是,通过异常点检测算法对所述经纬度数据对应的各经纬度点进行检测,获得异常经纬度点;
若否,根据各所述经纬度点之间的平均距离,获得异常经纬度点;
自所述经纬度数据中滤除所述异常经纬度点对应的经纬度,获得所述地理区域的目标经纬度数据。
2.如权利要求1所述的经纬度异常检测方法,其特征在于,所述异常点检测算法为基于密度的聚类算法,所述获得异常经纬度点,包括:
获得所述经纬度数据对应的经纬度点分布图;
通过所述基于密度的聚类算法,对所述经纬度点分布图中的各经纬度点进行聚类;
获得聚类后经纬度点的数量最多的目标类,将未落入所述目标类的经纬度点作为异常经纬度点。
3.如权利要求2所述的经纬度异常检测方法,其特征在于,所述基于密度的聚类算法中,根据所述地理区域的楼栋分布确定邻域距离。
4.如权利要求1所述的经纬度异常检测方法,其特征在于,所述根据各所述经纬度点之间的平均距离,获得异常经纬度点,包括:
根据每个经纬度点对应的经纬度,计算每个经纬度点与其余经纬度点之间的平均距离;
以计算获得的平均距离的中位数与一阈值之和为距离阈值,将平均距离超出所述距离阈值的经纬度点作为异常经纬度点。
5.如权利要求1所述的经纬度异常检测方法,其特征在于,所述自所述经纬度数据中滤除所述异常经纬度点对应的经纬度后,还包括:
获得剩余经纬度点的数量,及所述地理区域的楼栋数量;
判断所述剩余经纬度点的数量是否等于所述楼栋数量;
若否,还根据所述剩余经纬度点和所述地理区域的楼栋分布,确定遗漏楼栋和/或冗余经纬度点;
如有遗漏楼栋,获得所述遗漏楼栋的经纬度,加入所述经纬度数据;
如有冗余经纬度点,自所述经纬度数据中滤除所述冗余经纬度点对应的经纬度。
6.如权利要求5所述的经纬度异常检测方法,其特征在于,所述确定遗漏楼栋和/或冗余经纬度点,包括:
将所述剩余经纬度点映射至一电子地图中,获得第一分布图;
获得所述地理区域的楼栋分布图,通过叠加图层的方式缩放至所述电子地图中,获得第二分布图;
对所述第一分布图和所述第二分布图进行重叠匹配,获得所述第二分布图中未匹配到经纬度点的遗漏楼栋,和/或所述第一分布图中未匹配到楼栋的冗余经纬度点。
7.如权利要求1所述的经纬度异常检测方法,其特征在于,所述获得所述地理区域的目标经纬度数据后,还包括:
合并各地理区域的目标经纬度数据,形成关于各所述地理区域的标准经纬度数据库。
8.一种经纬度异常检测装置,其特征在于,包括:
初始数据获取模块,配置为获得一具有多栋楼的地理区域的经纬度数据;
判断模块,配置为判断所述经纬度数据对应的经纬度点的数量是否达到预设值;
第一检测模块,配置为当所述判断模块判断为是,通过异常点检测算法对所述经纬度数据对应的各经纬度点进行检测,获得异常经纬度点;
第二检测模块,配置为当所述判断模块判断为否,根据各所述经纬度点之间的平均距离,获得异常经纬度点;
异常数据滤除模块,配置为自所述经纬度数据中滤除所述异常经纬度点对应的经纬度,获得所述地理区域的目标经纬度数据。
9.一种电子设备,其特征在于,包括:
一处理器;
一存储器,存储有可执行指令;
其中,所述可执行指令被所述处理器执行时,实现如权利要求1-7任一项所述的经纬度异常检测方法。
10.一种计算机可读的存储介质,存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1-7任一项所述的经纬度异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110127719.1A CN112801189A (zh) | 2021-01-29 | 2021-01-29 | 经纬度异常检测方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110127719.1A CN112801189A (zh) | 2021-01-29 | 2021-01-29 | 经纬度异常检测方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112801189A true CN112801189A (zh) | 2021-05-14 |
Family
ID=75812895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110127719.1A Pending CN112801189A (zh) | 2021-01-29 | 2021-01-29 | 经纬度异常检测方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112801189A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763538A (zh) * | 2018-05-31 | 2018-11-06 | 北京嘀嘀无限科技发展有限公司 | 一种确定兴趣点poi地理位置的方法及装置 |
CN109302714A (zh) * | 2018-12-07 | 2019-02-01 | 南京华苏科技有限公司 | 基于用户数据实现基站位置研判及越区覆盖识别的方法 |
CN109548139A (zh) * | 2018-08-27 | 2019-03-29 | 福建新大陆软件工程有限公司 | 一种基于knn的小区基站经纬度数据校正方法 |
CN109635063A (zh) * | 2018-12-06 | 2019-04-16 | 拉扎斯网络科技(上海)有限公司 | 地址库的信息处理方法、装置、电子设备和存储介质 |
CN109688535A (zh) * | 2018-12-13 | 2019-04-26 | 大唐软件技术股份有限公司 | 确定无线热点地理位置的方法、装置、电子设备及介质 |
CN109766956A (zh) * | 2018-07-19 | 2019-05-17 | 西北工业大学 | 基于快递大数据的异常检测方法 |
CN109769201A (zh) * | 2018-12-28 | 2019-05-17 | 科大国创软件股份有限公司 | 一种实现用户精准定位的智慧城市管理平台 |
CN109788428A (zh) * | 2018-12-28 | 2019-05-21 | 科大国创软件股份有限公司 | 一种基于运营商数据的用户分类识别方法 |
WO2019128355A1 (zh) * | 2017-12-29 | 2019-07-04 | 北京京东尚科信息技术有限公司 | 确定精确地理位置的方法和装置 |
WO2020024206A1 (zh) * | 2018-08-02 | 2020-02-06 | 深圳先进技术研究院 | 基于dcgan的停车数据修补方法、装置、设备及存储介质 |
CN110769452A (zh) * | 2019-10-30 | 2020-02-07 | 北京红山信息科技研究院有限公司 | 基站经纬度异常识别方法、系统、服务器和存储介质 |
US20200059800A1 (en) * | 2018-08-17 | 2020-02-20 | Spectrum Effect Inc. | Method and system for detecting and resolving anomalies in a wireless network |
CN111523614A (zh) * | 2020-05-09 | 2020-08-11 | 上海添玑网络服务有限公司 | 小区相似判断方法及装置 |
CN111563630A (zh) * | 2020-05-11 | 2020-08-21 | 圆通速递有限公司 | 基于地址经纬度聚类的物流服务网点布局方法和系统 |
CN112052908A (zh) * | 2020-09-17 | 2020-12-08 | 公安部交通管理科学研究所 | 一种交通事故地点聚类方法及系统 |
EP3767229A1 (en) * | 2005-10-19 | 2021-01-20 | Osmose Utilities Services, Inc. | Apparatus and method for detection of stray voltage anomalies |
-
2021
- 2021-01-29 CN CN202110127719.1A patent/CN112801189A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3767229A1 (en) * | 2005-10-19 | 2021-01-20 | Osmose Utilities Services, Inc. | Apparatus and method for detection of stray voltage anomalies |
WO2019128355A1 (zh) * | 2017-12-29 | 2019-07-04 | 北京京东尚科信息技术有限公司 | 确定精确地理位置的方法和装置 |
CN108763538A (zh) * | 2018-05-31 | 2018-11-06 | 北京嘀嘀无限科技发展有限公司 | 一种确定兴趣点poi地理位置的方法及装置 |
CN109766956A (zh) * | 2018-07-19 | 2019-05-17 | 西北工业大学 | 基于快递大数据的异常检测方法 |
WO2020024206A1 (zh) * | 2018-08-02 | 2020-02-06 | 深圳先进技术研究院 | 基于dcgan的停车数据修补方法、装置、设备及存储介质 |
US20200059800A1 (en) * | 2018-08-17 | 2020-02-20 | Spectrum Effect Inc. | Method and system for detecting and resolving anomalies in a wireless network |
CN109548139A (zh) * | 2018-08-27 | 2019-03-29 | 福建新大陆软件工程有限公司 | 一种基于knn的小区基站经纬度数据校正方法 |
CN109635063A (zh) * | 2018-12-06 | 2019-04-16 | 拉扎斯网络科技(上海)有限公司 | 地址库的信息处理方法、装置、电子设备和存储介质 |
CN109302714A (zh) * | 2018-12-07 | 2019-02-01 | 南京华苏科技有限公司 | 基于用户数据实现基站位置研判及越区覆盖识别的方法 |
CN109688535A (zh) * | 2018-12-13 | 2019-04-26 | 大唐软件技术股份有限公司 | 确定无线热点地理位置的方法、装置、电子设备及介质 |
CN109788428A (zh) * | 2018-12-28 | 2019-05-21 | 科大国创软件股份有限公司 | 一种基于运营商数据的用户分类识别方法 |
CN109769201A (zh) * | 2018-12-28 | 2019-05-17 | 科大国创软件股份有限公司 | 一种实现用户精准定位的智慧城市管理平台 |
CN110769452A (zh) * | 2019-10-30 | 2020-02-07 | 北京红山信息科技研究院有限公司 | 基站经纬度异常识别方法、系统、服务器和存储介质 |
CN111523614A (zh) * | 2020-05-09 | 2020-08-11 | 上海添玑网络服务有限公司 | 小区相似判断方法及装置 |
CN111563630A (zh) * | 2020-05-11 | 2020-08-21 | 圆通速递有限公司 | 基于地址经纬度聚类的物流服务网点布局方法和系统 |
CN112052908A (zh) * | 2020-09-17 | 2020-12-08 | 公安部交通管理科学研究所 | 一种交通事故地点聚类方法及系统 |
Non-Patent Citations (6)
Title |
---|
PRISTI SUKMASETYA 等: "Outlier Detection on Hotspots Data in Riau Province using DBSCAN Algorithm", 《IOP CONFERENCE SERIES: EARTH AND ENVIRONMENTAL SCIENCE》, vol. 31, no. 2016, 31 December 2016 (2016-12-31), pages 1 - 7 * |
RAMI IBRAHIM 等: "Detecting taxi movements using Random Swap clustering and sequential pattern mining", 《JOURNAL OF BIG DATA》, vol. 39, no. 2019, 13 May 2019 (2019-05-13), pages 1 - 26 * |
张雷: "面向GPS数据的轨迹聚类与异常检测算法研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》, no. 2020, 15 January 2020 (2020-01-15), pages 008 - 263 * |
王兴旺: "基于手机经纬度数据的重要位置识别应用研究", 《数字技术与应用》, vol. 37, no. 08, 25 August 2019 (2019-08-25), pages 53 - 54 * |
艾佳琪: "AIS航迹聚类分析及异常轨迹检测", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》, no. 2021, 15 January 2021 (2021-01-15), pages 036 - 291 * |
魏延生: "基于POI和滴滴出行数据的人们打车需求分析——以北京市核心区域为例", 《中国优秀硕士学位论文全文数据库 基础科学辑》, no. 2019, 15 January 2019 (2019-01-15), pages 008 - 57 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110608982A (zh) | 检测方法、装置、移动设备、电子设备及存储介质 | |
CN109190573B (zh) | 应用于无人驾驶车辆的地面检测方法、电子设备、车辆 | |
CN113205037B (zh) | 事件检测的方法、装置、电子设备以及可读存储介质 | |
US8818031B1 (en) | Utility pole geotagger | |
CN107295489B (zh) | 伪基站短信识别方法、装置、设备及存储介质 | |
CN114070760B (zh) | 一种网络空间资产的测绘方法及相关装置 | |
JP2017102672A (ja) | 地理位置情報特定システム及び地理位置情報特定方法 | |
CN108256020B (zh) | 异常路线的检测方法、装置、服务器及存储介质 | |
CN112818314A (zh) | 一种设备检测方法、装置、设备及存储介质 | |
CN110515758B (zh) | 一种故障定位方法、装置、计算机设备及存储介质 | |
CN114091771A (zh) | 一种确定目标路径的方法、装置、电子设备及存储介质 | |
CN111812545A (zh) | 线路缺陷检测方法、装置、设备及介质 | |
CN112801189A (zh) | 经纬度异常检测方法、装置、电子设备和存储介质 | |
CN115022201B (zh) | 一种数据处理功能测试方法、装置、设备及存储介质 | |
CN113079052B (zh) | 模型训练、物联网数据识别方法、装置、设备及存储介质 | |
CN110555352A (zh) | 一种兴趣点识别方法、装置、服务器和存储介质 | |
CN114136327A (zh) | 一种虚线段的查全率的自动化检查方法及系统 | |
CN110909668B (zh) | 目标检测方法、装置、计算机可读存储介质和电子设备 | |
CN110839201B (zh) | 管道数据处理方法、发送装置、接收装置和存储介质 | |
CN108021656B (zh) | 比对坐标的生成方法、装置、服务器及存储介质 | |
CN112881600A (zh) | 实验室危险检测方法、设备、存储介质及装置 | |
CN107872874B (zh) | 定位数据的更新方法、服务器及计算机可读介质 | |
CN112632992B (zh) | 测试方法、测试装置、计算机设备和介质 | |
CN111105590A (zh) | 一种报警方法及装置 | |
CN115327497B (zh) | 雷达检测范围确定方法、装置、电子设备及可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |