CN109740684A - 共享单车入栏检测方法及装置 - Google Patents

共享单车入栏检测方法及装置 Download PDF

Info

Publication number
CN109740684A
CN109740684A CN201910018484.5A CN201910018484A CN109740684A CN 109740684 A CN109740684 A CN 109740684A CN 201910018484 A CN201910018484 A CN 201910018484A CN 109740684 A CN109740684 A CN 109740684A
Authority
CN
China
Prior art keywords
positioning data
point
shared bicycle
data
fence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910018484.5A
Other languages
English (en)
Inventor
朱江淼
张菁
王世镖
王星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201910018484.5A priority Critical patent/CN109740684A/zh
Publication of CN109740684A publication Critical patent/CN109740684A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种共享单车入栏检测方法及装置,涉及共享单车的技术领域,所述方法包括获取围栏的边界坐标定位数据,以及获取共享单车的多个定位数据;研制数据筛选算法对数据进行预处理,以去除粗大误差及异常值;研制基于K均值的单车位置估计算法,采用K均值聚类算法对共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的一个定位信息;根据研制的入栏检测算法计算共享单车定位数据是否在围栏边界定位数据范围内,以判断共享单车是否入栏;本发明能够准确定位共享单车,从而能够准确检测出共享单车是否入栏,为规范管理共享单车停放提供依据和标准。

Description

共享单车入栏检测方法及装置
技术领域
本发明涉及共享单车技术领域,尤其是涉及一种共享单车入栏检测方法及装置。
背景技术
目前,共享单车是全球第一个无桩共享单车出行解决方案,缔造了“无桩单车共享”模式,致力于解决城市出行问题。解锁骑行,随取随用,随时随地,解决了最后一公里的难题。在肯定了共享单车便捷群众出行的同时,投放量巨大以致于违规停放是当下共享单车尤为突出的问题。推出共享单车围栏的管理,正确引导共享单车用户规范停车,是政府管理的一个重要举措。因此,能否准确检测出共享单车是否在围栏内是该举措的关键问题。虽然共享单车带有定位系统,能够反馈其位置信息,但是,在实际操作中,共享单车一次落锁时能连续提供28个以经纬度数据表示的地理位置。理论上,这28个数据是服从正态分布的随机数据,基本应是一致的。但是,由于单车配备的接收机很廉价,导致这28个数据分散性较大,定位精度不高,从而无法获知单车准确的地理位置,也就无法准确检测出共享单车是否入栏。
发明内容
有鉴于此,本发明的目的在于提供一种共享单车入栏检测方法及装置,能够准确定位共享单车,从而能够准确检测出共享单车是否入栏,为规范管理共享单车停放提供依据和标准。
第一方面,本发明实施例提供了一种共享单车入栏检测方法,包括如下步骤:
获取围栏的边界定位数据,以及获取共享单车的多个定位数据;
采用K均值聚类算法对所述共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据;
根据所述围栏的边界定位数据计算所述共享单车定位数据是否在所述围栏边界定位数据范围内,以判断所述共享单车是否入栏。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,步骤采用K均值聚类算法对所述共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据之前还包括步骤:
采用莱特准则对所述共享单车的多个定位数据进行筛选,以剔除异常数据。
结合第一方面的第一种实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,采用莱特准则对所述共享单车的多个所述定位数据进行筛选,以剔除异常数据的步骤包括:
选取多个所述定位数据中的第一点,获取距离所述第一点距离最近的第二点,计算所述第一点与所述第二点之间的距离之和S1
获取距离所述第二点距离最近的第三点,计算所述第二点与所述第三点之间的距离之和S2,并S1与S2的加权和SL;将所述第三点作为新的第一点;
重复执行以上步骤,直至完成所有点中各个点与其最近点的距离之和的计算,并计算所有点的距离之和的加权和SL
根据所述所有点的距离之和的加权和SL计算标准偏差根据所述标准偏差和莱特准则剔除异常值。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,采用K均值聚类算法对所述共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据的步骤包括:
从所述共享单车的多个定位数据中随机选取K个定位数据作为聚类中心点;计算各个所述聚类中心点与其余每个定位数据的距离值;
将所述其余每个定位数据和与其距离最小的聚类中心点进行关联;
将所有具有相同聚类中心点的多个定位数据聚为同一簇;
计算每一簇定位数据的平均值,得到平均值坐标,将所述平均值坐标作为该簇的新的聚类中心点;
重复执行以上步骤,直至所述新的聚类中心点不再变化;
对每一簇定位数据的数量进行统计,将数量最多的一簇的聚类中心点作为最接近共享单车真实停放位置的定位数据。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,获取围栏的边界定位数据,以及获取共享单车的多个定位数据的步骤包括:
利用GNSS接收机获取围栏中心点的经纬度坐标,将围栏中心点的经纬度坐标视为平面坐标的原点;
根据所述平面坐标的原点计算围栏的边界定位数据;
获取个共享单车的多个经纬度定位数据;
根据所述平面坐标的原点和墨卡托投影原理将多个所述共享单车的经纬度定位数据转换为多个直角坐标数据,将多个所述直角坐标数据作为所述共享单车的多个定位数据。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,根据所述所有点的距离之和的加权和SL计算标准偏差,根据所述标准偏差和莱特准则剔除异常值的步骤包括:
选取多个所述定位数据中的所有的第一轴向数据,计算所述第一轴向数据的算术平均值
根据下列算式计算残差μi
其中,Xi为第一轴向数据;
根据下式计算标准偏差S:
其中,n为第一轴向数据Xi的个数;
将所有第一轴向数据逐一与3倍标准偏差3S相比较,将|μi|>3S所对应的定位数据作为异常值进行剔除。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,K的值为1。
第二方面,本发明实施例还提供一种共享单车入栏检测装置,包括数据获取模块、定位模块和入栏检测模块,
所述数据获取模块用于获取围栏的边界定位数据,以及获取共享单车的多个坐定位据;
所述定位模块用于采用K均值聚类算法对所述共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据;
所述入栏检测模块用于根据所述围栏的边界定位数据计算所述共享单车定位数据是否在所述围栏边界定位数据范围内,以判断所述共享单车是否入栏。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,还包括数据筛选模块,所述数据筛选模块用于依据莱特准则,对所述共享单车的多个定位数据进行筛选,以剔除异常数据。
结合第二方面的第一种可能的实施方式,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所述数据筛选模块包括第一距离计算模块、第二距离计算模块、重复迭代模块及异常值剔除模块:
所述第一距离计算模块用于选取多个所述定位数据中的第一点,
获取距离所述第一点距离最近的第二点,计算所述第一点与所述第二点之间的距离之和S1
所述第二距离计算模块用于获取距离所述第二点距离最近的第三点,计算所述第二点与所述第三点之间的距离之和S2,并S1与S2的加权和SL;将所述第三点作为新的第一点;
所述重复迭代模块用于重复执行所述第一距离计算模块和所述第二距离计算模块,直至完成所有点中各个点与其最近点的距离之和的计算,并计算所有点的距离之和的加权和SL
所述异常值剔除模块用于根据所述所有点的距离之和的加权和SL计算标准偏差,根据所述标准偏差和莱特准则剔除异常值。
第三方面,本发明实施例提供了一种服务器,该服务器包括存储器以及处理器,该存储器用于存储支持处理器执行第一方面所述方法的程序,该处理器被配置为用于执行该存储器中存储的程序。
第四方面,本发明实施例还提供一种计算机存储介质,用于存储计算机程序指令,当计算机执行所示计算机程序指令时,执行如第一方面所述的方法。
本发明实施例带来了以下有益效果:采用K均值聚类算法对共享单车的定位数据进行聚类处理,从而能够获得共享单车准确的定位数据,从而能够准确检测出共享单车是否入栏,为规范管理共享单车停放提供依据和标准。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种共享单车入栏检测方法的流程图;
图2为本发明实施例一提供的一种共享单车入栏检测方法的步骤S200的流程图;
图3为本发明实施例一提供的一种共享单车入栏检测方法的步骤S300的流程图;
图4为本发明实施例一提供的一种共享单车入栏检测方法的GNSS接收机的原理图;
图5本发明实施例一提供的一组单车原始定位数据图;
图6本发明实施例一提供的一种共享单车入栏检测方法的组内数据筛选效果图;
图7本发明实施例一提供的多组单车原始定位数据图;
图8本发明实施例一提供的一种共享单车入栏检测方法的组间数据筛选效果图;
图9为本发明实施例二提供的一种共享单车入栏检测装置的原理图。
图标:
10-数据获取模块;20-数据筛选模块;30-定位模块;40-入栏检测模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
准确检测出共享单车是否在围栏,是政府管理共享单车用户规范停车的重要举措,而目前无法获知单车准确的地理位置,从而无法准确检测出共享单车是否入栏,基于此,本发明实施例提供的一种共享单车入栏检测方法及装置,可以准确定位共享单车,从而能够准确检测出共享单车是否入栏。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种共享单车入栏检测方法进行详细介绍。
实施例一:
参照图1,本实施例提供的共享单车入栏检测方法,包括如下步骤:
步骤S100,获取围栏的边界定位数据,以及获取共享单车的多个定位数据;
步骤S200,采用莱特准则对共享单车的多个定位数据进行筛选,以剔除异常数据。
步骤S300,采用K均值聚类算法对共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据;
步骤S400,根据围栏的边界定位数据计算共享单车定位数据是否在围栏边界定位数据范围内,以判断共享单车是否入栏。
具体地,在本实施例中,利用GNSS高精度接收机确定围栏的地理位置数据。在实际操作中,共享单车一次落锁时能连续提供28个以经纬度数据表示的地理位置。理论上,这28个数据是服从正态分布的随机数据,基本应是一致的。但是由于单车配备的接收机很廉价,导致这28个数据分散性较大,定位精度不高。正是基于此,本实施例提出了一种基于聚类原理的K均值算法的共享单车入栏检测方法。K均值聚类算法中,类指的是具有相似性的集合,聚类指的是将数据集划分为若干类,使得类内之间的数据最为相似,各类之间的数据相似度差别尽可能大,聚类分析属于无监督学习,就是以相似性为基础,对数据集进行聚类划分。而K均值(K-means)算法是一种简单的迭代型聚类算法,以距离作为相似性指标,发现给定数据集中的K个类,且每个类的中心是根据类中所有值的均值得到,每个类用聚类中心来描述。本实施例通过K均值聚类算法,最终计算出一个共享单车的地理位置定位数据,将这一定位数据与围栏的边界定位数据相比较,计算共享单车的定位数据是否在围栏的边界定位数据的范围内,从而确定共享单车是否入栏。
优选地,在将共享单车的定位数据进行处理之前,先对数据进行预处理,以剔除粗大误差及异常数据。
进一步地,参照图2,步骤S200包括:
步骤S201,选取多个定位数据中的第一点,获取距离第一点距离最近的第二点,计算第一点与第二点之间的距离之和S1
步骤S202,获取距离第二点距离最近的第三点,计算第二点与第三点之间的距离之和S2,并计算S1与S2的加权和;将第三点作为新的第一点;
步骤S203,重复步骤S201-步骤S202,直至完成所有点中各个点与其最近点的距离之和的计算,并计算所有点的距离之和的加权和SL
步骤S204,根据所有点的距离之和的加权和SL计算标准偏差,根据标准偏差和莱特准则剔除异常值。
进一步地,步骤S204包括:
选取多个定位数据中的所有的第一轴向数据,计算第一轴向数据的算术平均值其中,
根据式(1)计算残差μi
其中,Ui为残差,Xi为第一轴向数据;
根据下式计算标准偏差S:
式(2)中,n为第一轴向数据Xi的个数;将所有第一轴向数据逐一与3倍标准偏差3S相比较,将|μi|>3S所对应的定位数据作为异常值进行剔除。
具体地,由于28个定位数据是符合正态分布的,而莱特准则是一种正态分布情况下判别异常值的方法,因此共享单车原始定位数据符合莱特准则使用条件。莱特准则是指,测量值与其算术平均值的差(即残差)的绝对值,大于3倍标准偏差,那么满足这一条件的测量值为异常值,应当剔除不用。但是,对共享单车定位数据进行数据筛选时,仅利用基本的莱特准则效果并不理想,无法剔除异常值。本实施例对28个定位数据,选取初始点,寻找与之欧氏距离最近的点,将距离值作为基本误差表达数据的的离散性,提出了一种新的基于莱特准则的组内数据筛选算法来去除共享单车原始定位数据的粗大误差及异常值,取得了理想效果。
参照图5和图6,图5为筛选前的原始定位数据图,图6为筛选后的效果图,图5验证了本实施例的基于距离的莱特准则异常值筛选方法取得了理想的效果。
本实施例的基于距离的莱特准则数据筛选的原理是:对每组单车定位数据,选取第一个出现的点,找到距离这个点最近的点,计算两点之间距离,依此类推,再找到下一个距离上一个点最近的点,计算两点之间距离……最终计算出这些所有距离的和,将距离和作为一个整体的数值,即基本误差,再应用莱特准则去除粗大据。
进一步地,参照图3,步骤S300包括:
步骤S301,从共享单车的多个定位数据中随机选取K个定位数据作为聚类中心点;计算各个聚类中心点与其余每个定位数据的距离值;
步骤S302,将其余每个定位数据和与其距离最小的聚类中心点进行关联;
步骤S303,将所有具有相同聚类中心点的多个定位数据聚为同一簇;
步骤S304,计算每一簇定位数据的平均值,得到平均值坐标,将平均值坐标作为该簇的新的聚类中心点;
步骤S305,重复步骤S301-步骤S304,直至新的聚类中心点不再变化;
步骤S306,对每一簇定位数据的数量进行统计,将数量最多的一簇的聚类中心点作为接近共享单车真实停放位置的定位数据。
具体地,本实施例是利用聚类思想,基于K均值算法,对共享单车进行定位。其原理是:随机选取出来K个作为聚类中心的点,针对这组定位数据集中的各个数据点,计算出其与K个中心点的距离值,关联其与距离最为接近的一个中心点,将所有与相同中心点关联的数据点聚类分为一类,计算得到每簇的均值,把该簇已关联好的中心点移至均值的位置处。重复迭代,若中心点不再变化,则结束,否则继续迭代。对每一类所包含的数据的数量进行统计,取数量最多的一类的聚类中心,作为最接近共享单车真实停放位置的定位数据。
需要注意的是,在本实施例中,进行定位时,从聚类结果中筛选出数据数量最多的一簇的聚类中心点作为接近共享单车真实停放位置的定位数据,也就是最终的定位坐标是一个数值,而不是多个。这样,在进行入栏检测时,只将这一个最终的数值与围栏边界值进行比较。
进一步地,步骤S100包括:
步骤S101,利用GNSS接收机获取围栏中心点的经纬度坐标,将围栏中心点的经纬度坐标视为平面坐标的原点;
步骤S102,根据平面坐标的原点计算围栏的边界定位数据;
步骤S103,获取多个共享单车的经纬度定位数据;
步骤S104,根据平面坐标的原点和墨卡托投影原理将多个共享单车的经纬度定位数据转换为多个直角坐标数据,将多个直角坐标数据作为共享单车的多个定位数据。
具体地,利用GNSS高精度接收机确定围栏的地理位置。GNSS接收机的接收原理如图4所示,图中GNSS接收机接收共享单车定位模块发送的位置定位数据。GNSS接收机包括信号调理模块,中频信号处理模块、位置解算模块。其中,信号调理模块包括用于对接收信号进行滤波、变频和A/D转换,将模拟信号转换为数字信号。中频信号处理模块对信号进行捕获、跟踪、解调和解扩。而位置解算模块用于对数据进行解算,得到共享单车的定位数据。
为研究针对不同长宽的围栏的单车入栏检测准确率,在算法仿真研究时,利用GNSS高精度接收机确定围栏中心点的位置,例如用接收机测得围栏中心点的经度值为116.632317度,纬度值为39.892849度,视为平面坐标原点,即(0,0)点。那么对于长10m、宽2m的围栏,其位置也随之确定,也就是得到了栏框四个边界点的经纬度值分别为(116.632255,39.892858)、(116.632255,39.892841)、(116.632383,39.892859)、(116.632382,39.892842)(单位为度)。在实际电子围栏应用中我们常常需要用m来表示位置坐标,因此需要将上述经纬度坐标转换到直角坐标,即需要把经纬度转换为大地坐标。本实施例利用UTM投影系统来解决这个问题,将高精度接收机测得的基准点坐标视为(0,0)点,其他定位数据用相对基准点的m数距离坐标值来表示。
优选地,在对定位数据进行入栏检测时,分别计算单车的最终定位坐标与围栏四条边的距离,若该位置点同时满足大于左栏框、小于右栏框,且大于下栏框、小于上栏框的边界值的条件,则将输出值赋为1,说明该单车位于围栏内;若该位置点不同时满足上述条件,则将输出值赋为0,说明该单车不在围栏内。
本实施例对上述方法进行了仿真验证和实际数据验证。
仿真验证的原理是:
由于共享单车每次落锁是一次独立事件,而二项分布(Binomial Distribution)就是重复N次的独立事件的伯努利实验。因此为仿真得到最为随机的单车停放情况,取长10米,宽2米的围栏,以其几何中心作为坐标原点(0,0),围绕栏周围(包括栏内与栏外),首先采用二项随机分布产生1个单车定位数据点,模拟共享单车的真实停放位置。其次在这个位置处产生包含28个数据的正态分布,从而得到一组28个服从正态分布位置点的模拟单车定位数据。采用二项随机分布产生50组单车定位数据点,模拟共享单车最为随意无序的真实停放位置;其次使这50个模拟单车真实停放位置的定位数据点,分别呈每点包含28个数据的正态分布,从而得到50组且每组包含28个服从正态分布位置点的模拟单车定位数据。
上述数据筛选方法是对一组28个数据的筛选,即组内筛选。而对50组定位数据进行进行筛选处理时,不仅要对每组内的数据进行筛选,为了得到更好的单车定位修正效果,还要考查整组定位数据的一致性,即组间数据筛选。如果整组单车定位数据的一致性特别差,大部分点都是分散的,离散性很大,那就要去除这组误差大、离散分布的数据。组间筛选方法与组内筛选方法一样,组间定位筛选是以每一组距离和的加权和为基础,计算并得到50个距离和的加权和数据,依此为数据基础,根据莱特准则,筛选异常值,从而提出异常值所代表的离散性大的一组或几组数据。图7给出了多组共享单车原始定位数据,图8给出了组间数据筛选效果图,从图中可知,组间筛选同样取得了理想的效果。
对每一组数据应用本实施例的方法进行入栏检测,取得输出值为1或0,依次与之前模拟好的共享单车真实停放位置相比较,验证入栏检测结果是否准确。统计全部50组单车定位数据的验证情况,从而得到入栏检测的准确率。
分析入栏检测准确率影响因素。K均值聚类算法中,有两个参数会影响最后的结果,一个是K值,一个是迭代次数。结果如表1所示,针对K值只需迭代10次就可使聚类中心点不再变化,达到算法的最优效果。当取K=1时,即聚类中心点接近均值点的位置被确定为单车的停放位置时,入栏检测的准确率高达100%。
表1不同K值对应的入栏检测准确率
围栏的大小对入栏检测的准确率也有一定影响。在对围栏位置进行定位时,以原点为中心,再变换不同的围栏长宽可易得其边界点的对应经、纬度。本实施例分别取长度为6-10米,宽度固定为2米的围栏,用同样的50组单车定位数据应用本实施例的方法进行入栏检测,针对每一个K值迭代10次,得到不同K值对应的入栏检测准确率如表2所示。
表2不同长度的围栏对应的入栏检测准确率
取不同宽度的围栏进行入栏情况检测,对入栏检测的准确率也有一定影响。分别取宽度为2米、1.5米、1米,长度固定为10米的围栏,用同样的50组单车定位数据应用本实施例的方法进行入栏检测,针对每一个K值迭代10次,得到不同K值对应的入栏检测准确率如表3所示。
表3不同宽度的围栏对应的入栏检测准确率
由表1-3可知,当取聚类中心数K值为1,迭代次数为10时。通过这一结果可知,在对本方法进行具体实施时,可将K值设为1,迭代次数设为10,可以使得本方法的检测准确率保持在最佳水平。另外,按照政府管理规范,对于常规长6-10米且宽1.5-2米的围栏,本实施例提出的共享单车入栏检测方法,对共享单车的定位数据入栏检测的正确率达80%-100%。如若在长6-10米且宽1.5-2米之间任意变换不同长宽的组合,入栏检测的正确率依然在80%-100%范围内。
本实施例根据实际关锁时的GNSS接收的定位数据,对本实施例方法进行了实际数据验证,其原理是:
先用GNSS高精度接收机确定了围栏的中心点位置,将该位置作为基准点。实验测得基准点的经纬度值为116.632295度,纬度值为39.892793度,变换围栏的长宽,进行入栏检测算法的验证。
在等精度测量条件下,在围栏的不同位置对某一型号的单车接收机进行100次测量,从而采集到共享单车100组实际的位置信息。其中每次测量包含一次开锁、落锁操作,得到28个以经纬度数据表示的地理位置,视为1组定位数据。
通过本实施例的基于K均值的入栏检测方法,估计出单车每次大概的真实停放位置,对这100个定位进行入栏检测,验证该算法能否对这些真实的单车定位数据得到较高的入栏检测的准确率。
当取聚类中心数K值为1时,对于常规长6-10米、宽1.5-2米的围栏,本实施例的基于K均值的入栏检测的方法,对共享单车的定位数据入栏检测的正确率达80%-100%,其中,长度为7米、6米的围栏检测准确率为80%-92%;长8-10米、宽1.5-2米的围栏,入栏检测准确率高达100%。这表明本实施例方法正确可靠,对判断共享单车是否停入围栏内的分析具有较好的实用价值,在符合政府管理的条件下,提高了入栏检测的准确率。
附图中的流程图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本实施例的有益效果是:
(1)通过分析共享单车定位数据特性,采用K均值聚类算法,对判断共享单车是否停入围栏内的分析具有较好的实用价值,在符合政府管理的条件下,提高了入栏检测的准确率;
(2)采用基于莱特准则的组内数据筛选方法,能够有效去除共享单车原始定位数据的异常值;
(3)入栏检测方法可准确检测共享单车是否入栏,为共享单车围栏的管理问题提供了较为精确的依据和标准。
实施例二:
参照图9,本实施例提出的一种共享单车入栏检测装置,包括数据获取模块10、数据筛选模块20,定位模块30和入栏检测模块40;
数据获取模块10用于获取围栏的边界定位数据,以及获取共享单车的多个定位数据;
数据筛选模块20用于采用莱特准则对共享单车的多个定位数据进行筛选,以剔除异常数据;
定位模块30用于采用K均值聚类算法对共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据;
入栏检测模块40用于根据围栏的边界定位数据计算共享单车定位数据是否在围栏边界定位数据范围内,以判断共享单车是否入栏。
进一步地,数据筛选模块20包括第一距离计算模块、第二距离计算模块、重复迭代模块及异常值剔除模块:
第一距离计算模块用于选取多个定位数据中的第一点,
获取距离第一点距离最近的第二点,计算第一点与第二点之间的距离之和S1
第二距离计算模块用于获取距离第二点距离最近的第三点,计算第二点与第三点之间的距离之和S2,并计算S1与S2的加权和;将第三点作为新的第一点;
重复迭代模块用于重复执行第一距离计算模块和第二距离计算模块,直至完成所有点中各个点与其最近点的距离之和的计算,并计算所有点的距离之和的加权和SL
异常值剔除模块用于将根据所有点的距离之和SL计算标准偏差,根据标准偏差和莱特准则剔除异常值。
进一步地,定位模块30包括第一计算模块、关联模块、聚类模块、第二计算模块、重复计算模块和统计定位模块;
第一计算模块用于从共享单车的多个定位数据中随机选取K个定位数据作为聚类中心点;计算各个聚类中心点与其余每个定位数据的距离值;
关联模块用于将其余每个定位数据和与其距离最小的聚类中心点进行关联;
聚类模块用于将所有具有相同聚类中心点的多个定位数据聚为同一簇;
第二计算模块用于计算每一簇定位数据的平均值,得到平均值坐标,将平均值坐标作为该簇的新的聚类中心点;
重复计算模块用于重复执行第一计算模块、关联模块和第二计算模块,直至新的聚类中心点不再变化;
统计定位模块用于对每一簇定位数据的数量进行统计,将数据数量最多的一簇的聚类中心点作为最接近共享单车真实停放位置的定位数据。
优选地,具体实施时,K为1,迭代次数为10次。
进一步地,数据获取模块10包括围栏坐标接收模块、围栏边界坐标计算模块、共享单车坐标接收模块和共享单车坐标转换模块;
围栏坐标接收模块用于利用GNSS接收机获取围栏中心点的经纬度坐标,将围栏中心点的经纬度坐标视为平面坐标的原点;
围栏边界坐标计算模块用于根据平面坐标的原点计算围栏的边界定位数据;
共享单车坐标接收模块用于获取多个共享单车的经纬度定位数据;
共享单车坐标转换模块用于根据平面坐标的原点和墨卡托投影原理将多个共享单车的经纬度定位数据转换为多个直角坐标数据,将多个直角坐标数据作为最接近共享单车真实停放位置的多个定位数据。
进一步地,异常值剔除模块包括平均值模块、残差模块和异常值剔除模块;
平均值模块用于选取多个定位数据中的所有的第一轴向数据,计算第一轴向数据的算术平均值
残差模块用于根据式(3)计算残差μi
其中,Ui为残差,Xi为第一轴向数据;
根据下式计算标准偏差S:
式(4)中,n为第一轴向数据Xi的个数;
异常值剔除模块用于将所有第一轴向数据逐一与3倍标准偏差3S相比较,将|μi|>3S所对应的定位数据作为异常值进行剔除。
本发明实施例还提供了一种服务器,该服务器包括存储器以及处理器,上述存储器用于存储支持处理器执行上述实施例一方法的程序,上述处理器被配置为用于执行该存储器中存储的程序。
进一步,本发明实施例还提供一种计算机存储介质,用于存储计算机程序指令,当计算机执行所示计算机程序指令时,执行如上述实施例一的方法。
具体地,功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本发明实施例提供的共享单车入栏检测装置,与上述实施例提供的共享单车入栏检测方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明实施例所提供的进行共享单车入栏检测方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种共享单车入栏检测方法,其特征在于,包括如下步骤:
获取围栏的边界定位数据,以及获取共享单车的多个定位数据;
采用K均值聚类算法对所述共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据;
根据所述围栏的边界定位数据计算所述共享单车定位数据是否在所述围栏边界定位数据范围内,以判断所述共享单车是否入栏。
2.根据权利要求1所述的共享单车入栏检测方法,其特征在于,步骤采用K均值聚类算法对所述共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据之前还包括步骤:
采用莱特准则对所述共享单车的多个定位数据进行筛选,以剔除异常数据。
3.根据权利要求2所述的共享单车入栏检测方法,其特征在于,采用莱特准则对所述共享单车的多个所述定位数据进行筛选,以剔除异常数据的步骤包括:
选取多个所述定位数据中的第一点,获取距离所述第一点距离最近的第二点,计算所述第一点与所述第二点之间的距离之和S1
获取距离所述第二点距离最近的第三点,计算所述第二点与所述第三点之间的距离之和S2,并计算S1与S2的加权和;将所述第三点作为新的第一点;
重复执行以上步骤,直至完成所有点中各个点与其最近点的距离之和的计算,并计算所有点的距离之和的加权和SL
根据所述所有点的距离之和的加权和SL计算标准偏差,根据所述标准偏差和莱特准则剔除异常值。
4.根据权利要求1所述的共享单车入栏检测方法,其特征在于,采用K均值聚类算法对所述共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据的步骤包括:
从所述共享单车的多个定位数据中随机选取K个定位数据作为聚类中心点;计算各个所述聚类中心点与其余每个定位数据的距离值;
将所述其余每个定位数据和与其距离最小的聚类中心点进行关联;
将所有具有相同聚类中心点的多个定位数据聚为同一簇;
计算每一簇定位数据的平均值,得到平均值坐标,将所述平均值坐标作为该簇的新的聚类中心点;
重复执行以上步骤,直至所述新的聚类中心点不再变化;
对每一簇定位数据的数量进行统计,将数量最多的一簇的聚类中心点作为最接近共享单车真实停放位置的定位数据。
5.根据权利要求1所述的共享单车入栏检测方法,其特征在于,获取围栏的边界定位数据,以及获取共享单车的多个定位数据的步骤包括:
利用GNSS接收机获取围栏中心点的经纬度坐标,将围栏中心点的经纬度坐标视为平面坐标的原点;
根据所述平面坐标的原点计算围栏的边界定位数据;
获取共享单车的多个经纬度定位数据;
根据所述平面坐标的原点和墨卡托投影原理将多个所述共享单车的经纬度定位数据转换为多个直角坐标数据,将多个所述直角坐标数据作为所述共享单车的多个定位数据。
6.根据权利要求3所述的共享单车入栏检测方法,其特征在于,根据所述所有点的距离之和的加权和SL计算标准偏差,根据所述标准偏差和莱特准则剔除异常值的步骤包括:
选取多个所述定位数据中的所有的第一轴向数据,计算所述第一轴向数据的算术平均值
根据下列算式计算残差μi
其中,Xi为第一轴向数据;
根据下式计算标准偏差S:
其中,n为第一轴向数据Xi的个数;
将所有第一轴向数据逐一与3倍标准偏差3S相比较,将|μi|>3S所对应的定位数据作为异常值进行剔除。
7.根据权利要求2所述的共享单车入栏检测方法,其特征在于,K的值为1。
8.一种共享单车入栏检测装置,其特征在于,包括数据获取模块、定位模块和入栏检测模块,
所述数据获取模块用于获取围栏的边界定位数据,以及获取共享单车的多个定位数据;
所述定位模块用于采用K均值聚类算法对所述共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的定位数据;
所述入栏检测模块用于根据所述围栏的边界定位数据计算所述共享单车定位数据是否在所述围栏边界定位数据范围内,以判断所述共享单车是否入栏。
9.根据权利要求8所述的共享单车入栏检测装置,其特征在于,还包括数据筛选模块,所述数据筛选模块用于依据莱特准则,对所述共享单车的多个定位数据进行筛选,以剔除异常数据。
10.根据权利要求9所述的共享单车入栏检测装置,其特征在于,所述数据筛选模块包括第一距离计算模块、第二距离计算模块、重复迭代模块及异常值剔除模块:
所述第一距离计算模块用于选取多个所述定位数据中的第一点,获取距离所述第一点距离最近的第二点,计算所述第一点与所述第二点之间的距离之和S1
所述第二距离计算模块用于获取距离所述第二点距离最近的第三点,计算所述第二点与所述第三点之间的距离之和S2,并计算S1与S2的加权和;将所述第三点作为新的第一点;
所述重复迭代模块用于重复执行所述第一距离计算模块和所述第二距离计算模块,直至完成所有点中各个点与其最近点的距离之和的计算,并计算所有点的距离之和的加权和SL
所述异常值剔除模块用于根据所述所有点的距离之和的加权和SL计算标准偏差,根据所述标准偏差和莱特准则剔除异常值。
CN201910018484.5A 2019-01-08 2019-01-08 共享单车入栏检测方法及装置 Pending CN109740684A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910018484.5A CN109740684A (zh) 2019-01-08 2019-01-08 共享单车入栏检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910018484.5A CN109740684A (zh) 2019-01-08 2019-01-08 共享单车入栏检测方法及装置

Publications (1)

Publication Number Publication Date
CN109740684A true CN109740684A (zh) 2019-05-10

Family

ID=66364040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910018484.5A Pending CN109740684A (zh) 2019-01-08 2019-01-08 共享单车入栏检测方法及装置

Country Status (1)

Country Link
CN (1) CN109740684A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516558A (zh) * 2019-08-01 2019-11-29 仲恺农业工程学院 样本数据获取方法、装置、计算机设备及存储介质
CN111553383A (zh) * 2020-03-30 2020-08-18 平安医疗健康管理股份有限公司 一种数据风险检测方法、装置及设备
CN111967823A (zh) * 2020-08-14 2020-11-20 北京骑胜科技有限公司 物品的管理方法及设备
CN112632399A (zh) * 2021-03-09 2021-04-09 四川万网鑫成信息科技有限公司 一种基于空间位置的拓扑关系获取方法、装置和存储介质
CN116778701A (zh) * 2023-08-23 2023-09-19 北京阿帕科蓝科技有限公司 车辆违停判定方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150154457A1 (en) * 2012-06-28 2015-06-04 International Business Machines Corporation Object retrieval in video data using complementary detectors
CN105371857A (zh) * 2015-10-14 2016-03-02 山东大学 一种基于公交车gnss时空轨迹数据建构路网拓扑的装置及方法
CN107197437A (zh) * 2017-05-05 2017-09-22 上海共佰克智能科技有限公司 一种设置和应用停放区域的方法和系统
CN107292798A (zh) * 2017-06-29 2017-10-24 国信优易数据有限公司 一种共享单车停放点的确定方法及装置
CN107371134A (zh) * 2017-06-22 2017-11-21 深圳市鼎芯无限科技有限公司 一种共享单车的电子围栏定点停车系统
CN107390243A (zh) * 2017-06-09 2017-11-24 北斗导航位置服务(北京)有限公司 一种gnss定位数据与地理围栏临界点阈值判断方法
CN108346282A (zh) * 2018-04-20 2018-07-31 杭州骑迹科技有限公司 共享单车的停车监控方法、计算设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150154457A1 (en) * 2012-06-28 2015-06-04 International Business Machines Corporation Object retrieval in video data using complementary detectors
CN105371857A (zh) * 2015-10-14 2016-03-02 山东大学 一种基于公交车gnss时空轨迹数据建构路网拓扑的装置及方法
CN107197437A (zh) * 2017-05-05 2017-09-22 上海共佰克智能科技有限公司 一种设置和应用停放区域的方法和系统
CN107390243A (zh) * 2017-06-09 2017-11-24 北斗导航位置服务(北京)有限公司 一种gnss定位数据与地理围栏临界点阈值判断方法
CN107371134A (zh) * 2017-06-22 2017-11-21 深圳市鼎芯无限科技有限公司 一种共享单车的电子围栏定点停车系统
CN107292798A (zh) * 2017-06-29 2017-10-24 国信优易数据有限公司 一种共享单车停放点的确定方法及装置
CN108346282A (zh) * 2018-04-20 2018-07-31 杭州骑迹科技有限公司 共享单车的停车监控方法、计算设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
肖支才等: "《自动测试技术》", 31 August 2017, 《北京航空航天大学出版社》 *
陶启萌: "基于聚类分析的共享单车时空分布模型", 《中国战略新兴产业》 *
雷玉珍: "三维点云数据处理中的若干关键技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516558A (zh) * 2019-08-01 2019-11-29 仲恺农业工程学院 样本数据获取方法、装置、计算机设备及存储介质
CN110516558B (zh) * 2019-08-01 2022-04-22 仲恺农业工程学院 样本数据获取方法、装置、计算机设备及存储介质
CN111553383A (zh) * 2020-03-30 2020-08-18 平安医疗健康管理股份有限公司 一种数据风险检测方法、装置及设备
CN111967823A (zh) * 2020-08-14 2020-11-20 北京骑胜科技有限公司 物品的管理方法及设备
CN111967823B (zh) * 2020-08-14 2024-04-19 北京骑胜科技有限公司 物品的管理方法及设备
CN112632399A (zh) * 2021-03-09 2021-04-09 四川万网鑫成信息科技有限公司 一种基于空间位置的拓扑关系获取方法、装置和存储介质
CN112632399B (zh) * 2021-03-09 2021-06-08 四川万网鑫成信息科技有限公司 一种基于空间位置的拓扑关系获取方法、装置和存储介质
CN116778701A (zh) * 2023-08-23 2023-09-19 北京阿帕科蓝科技有限公司 车辆违停判定方法、装置、计算机设备和存储介质
CN116778701B (zh) * 2023-08-23 2024-01-16 北京阿帕科蓝科技有限公司 车辆违停判定方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN109740684A (zh) 共享单车入栏检测方法及装置
CN103544429A (zh) 用于安全性信息交互的异常检测装置及方法
CN110991553B (zh) Bim模型对比方法
CN106598999A (zh) 一种计算文本主题归属度的方法及装置
CN109492047A (zh) 一种基于差分隐私的精确直方图的发布方法
CN110826897A (zh) 地域安全评价方法、装置、设备及存储介质
CN115221218A (zh) 车辆数据的质量评估方法、装置、计算机设备和存储介质
CN117216454B (zh) 基于模糊非概率的可靠性评估方法、装置、终端及存储介质
CN112613983B (zh) 一种机器建模过程中的特征筛选方法、装置及电子设备
CN107067276A (zh) 确定对象影响力的方法及装置
CN116701492B (zh) 轨迹匹配程度校验方法、装置、计算机设备及存储介质
CN108197347B (zh) 连续不规则区域采样点的地理空间分布均匀度检测方法
CN107133328B (zh) 管线埋深精度检测方法及装置
CN106021511A (zh) 一种网络账号的处理方法及装置
CN111680083B (zh) 智能化多级政府财政数据采集系统及数据采集方法
CN102709207A (zh) 质量评估设备、方法和使计算机执行质量评估方法的程序
CN113190985B (zh) 一种分层异质区域内数据误差的分析方法及系统
CN113327336B (zh) 人车关系的识别方法、装置和电子设备
CN115452101A (zh) 一种仪表检定方法、装置、设备及介质
CN112651338B (zh) 一种输电线路违章施工隐患的判别方法及装置
CN111737247B (zh) 用于数据质量管控的实现方法
CN115201864A (zh) 一种检测卫星钟差跳变的方法、装置、存储介质及设备
CN112148764B (zh) 特征的筛选方法、装置、设备和存储介质
CN109347691B (zh) 一种用于Web服务的数据采样方法、装置及设备
CN114428809B (zh) 一种地图数据准确性获取方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190510