CN101727749B - 异常车速数据的识别方法和装置 - Google Patents

异常车速数据的识别方法和装置 Download PDF

Info

Publication number
CN101727749B
CN101727749B CN2009102379401A CN200910237940A CN101727749B CN 101727749 B CN101727749 B CN 101727749B CN 2009102379401 A CN2009102379401 A CN 2009102379401A CN 200910237940 A CN200910237940 A CN 200910237940A CN 101727749 B CN101727749 B CN 101727749B
Authority
CN
China
Prior art keywords
vehicle speed
speed data
data object
apart
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009102379401A
Other languages
English (en)
Other versions
CN101727749A (zh
Inventor
昝艳
付新刚
贾学力
李建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Cennavi Technologies Co Ltd
Original Assignee
Beijing Cennavi Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Cennavi Technologies Co Ltd filed Critical Beijing Cennavi Technologies Co Ltd
Priority to CN2009102379401A priority Critical patent/CN101727749B/zh
Publication of CN101727749A publication Critical patent/CN101727749A/zh
Priority to PCT/CN2010/078875 priority patent/WO2011060725A1/zh
Application granted granted Critical
Publication of CN101727749B publication Critical patent/CN101727749B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/052Detecting movement of traffic to be counted or controlled with provision for determining speed or overspeed

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开一种异常车速数据的识别方法和装置,涉及智能交通领域,解决了现有技术中还没有将基于密度聚类的方法用于识别异常车速数据的问题。该方法包括:根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离;从所有上述k-距离中选出所述目标车速数据集的半径参数;将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。本发明实施例主要应用于智能交通领域。

Description

异常车速数据的识别方法和装置
技术领域
本发明涉及智能交通领域,尤其涉及一种异常车速数据的识别方法和装置。
背景技术
智能交通系统是目前能全面有效地解决交通运输领域问题,特别是交通拥挤、交通阻塞、交通事故和交通污染等的最佳途径。其中,动态交通信息服务是智能交通系统的核心研究方向之一,它可以动态实时反映区域内的交通路况,指引最佳的行驶路线,提高道路和车辆的使用效率,是缓解交通拥堵状况的重要措施。在动态交通信息的研究中,分析道路历史车速值,找到能够反映道路周期性趋势的参数,进而提取出道路的动态交通特征是个热点问题。但是由于在车速数据的采集和处理输出过程中存在各种干扰,会使车速数据受到不同程度的噪声污染,使用被污染的数据建模和统计分析,可能会导致错误结果,故而需要对车速数据进行除噪,即识别并删除异常车速值。现有技术中用于识别异常数据的主要方法有统计方法、基于距离的方法和基于密度聚类的方法。
然而,在将统计方法和基于距离的方法用于识别异常车速数据的过程中,发明人发现现有技术中至少存在如下问题:采用统计方法识别异常车速数据时通常要求知道关于数据集参数的知识,如分布模型,分布参数等。但是在大多数情况下,分布可能是未知的。采用基于距离的方法识别异常车速数据时需要根据某个距离函数来计算数据对象之间的距离,异常数据是那些与所有其他对象相比有更高距离的数据对象。但是它需要用户直接提供最小的可接受距离,而这个是很难确定的。而基于密度聚类的方法可以从未知分布形式的数据中识别出异常数据,但是现有技术中还没有将基于密度聚类的方法用于识别异常车速数据。
发明内容
本发明的实施例提供一种异常车速数据的识别方法和装置,采用基于密度聚类的方法实现了从目标车速数据集中识别异常车速数据。
为达到上述目的,本发明的实施例采用如下技术方案:
一种异常车速数据的识别方法,包括:
根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离;
从所有上述k-距离中选出所述目标车速数据集的半径参数;
将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。
一种异常车速数据的识别装置,包括:
计算单元,用于根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离;
选择单元,用于从所有上述k-距离中选出所述目标车速数据集的半径参数;
第一标识单元,用于将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。
由上述方案描述的本发明实施例中,所述预设的参数k为基于密度聚类的方法中的密度阈值,根据所述预设的参数k可以计算出目标车速数据集中每一个车速数据对象的k-距离。所述车速数据对象的k-距离为所述车速数据对象到其k个最邻近的车速数据对象的最大距离。计算出所述目标数据集中所有车速数据对象的k-距离之后,从所有上述k-距离中选出所述目标车速数据集的半径参数。所述目标车速数据集的半径参数即为基于密度聚类的方法中的密度聚类的半径。通过依次比较所述目标数据集中的每个车速数据对象的k-距离与所述目标车速数据集的半径参数的大小,将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。从而实现了将基于密度聚类的方法用于识别异常车速数据。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为实施例1异常车速数据的识别方法的流程图;
图2为实施例1异常车速数据的识别装置的结构框图;
图3为实施例2异常车速数据的识别方法的流程图;
图4为实施例2异常车速数据的识别装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本发明实施例提供一种异常车速数据的识别方法,如图1所示,该方法包括以下步骤:
101、根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离。
由于基于密度聚类的方法通过设置密度阈值与领域半径从任意形状的簇中识别异常数据,因此在将基于密度聚类的方法用于识别异常车速数据时,也要设置密度阈值与领域半径的值。所述预设参数k即为基于密度聚类的方法中的密度阈值,可以通过技术人员的经验设定参数k。
所述车速数据对象的k-距离可以定义为:车速数据对象p与车速数据对象o∈D之间的距离dist(p,o),且满足:
①至少有k个车速数据对象对象q∈D\{p},使得dist(p,q)≤dist(p,o);
②并且至多有(k-1)个车速数据对象对象q∈D\{p},使得dist(p,q)<dist(p,o)。
102、从所有上述k-距离中选出所述目标车速数据集的半径参数。所述目标数据集中每一个车速数据对象都有对应的k-距离,从所有上述k-距离中选择一个k-距离作为所述目标车速数据集的半径参数。所述半径参数即为基于密度聚类的方法中的领域半径的值。
103、所述密度阈值与领域半径的值确定之后,根据基于密度聚类的方法,将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。从而实现了将基于密度聚类的方法应用于识别异常车速数据。
为了实现上述方法,本发明实施例还提供一种异常车速数据的识别装置,如图2所示,该装置包括:计算单元21、选择单元22和第一标识单元23。
其中,所述计算单元21用于根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离。所述计算单元21计算出每一个车速数据对象的k-距离之后,选择单元22用于从所有上述k-距离中选出所述目标车速数据集的半径参数。所述半径参数即为基于密度聚类的方法中的领域半径的值。基于密度聚类的方法中的密度阈值和领域半径都确定之后,第一标识单元23用于将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。该装置通过计算单元21和选择单元22来确定基于密度聚类的方法中的密度阈值和领域半径,第一标识单元23根据基于密度聚类的方法通过比较所述目标数据集中的每个车速数据对象的k-距离与所述目标车速数据集的半径参数的大小,从所述目标数据集中识别出异常车速数据。从而实现了将基于密度聚类的方法用于识别异常车速数据。
实施例2:
本发明实施例以指定路链上历史交通流为例来详细介绍异常车速数据的识别方法,如图3所示,该方法包括如下步骤:
301、加载目标数据集。所述目标数据集可以为指定路链上某个星期特征日中特定时间点的车速值。如:从一年的车速数据对象中取目标数据集时,由于车速值可能有丢失的现象,所述目标数据集中最多有52个车速值。所述星期特征日是指一周中交通流数据变化具有一定相似特征的某些日期的集合。如:一周的日期可以简单地分为工作日和周日两类星期特征日,也可以按交通流的周相似性细分为周一到周日共7个特征日等。
302、根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离。所述预设参数k即为基于密度聚类的方法中的密度阈值,可以通过技术人员的经验设定参数k。
303、将所有上述k-距离按照递增次序进行排序。对于上述所有车速数据对象的k-距离,以递增次序进行排序。然后按纵坐标为k-距离,横坐标为点的个数排序,如:1、2、3等,分别用以表示第一个车速数据、第二个车速数据、第三个车速数据等,绘制排序后的值。
304、选择所述k-距离增量变化最大时对应的k-距离作为所述目标车速数据集的半径参数。可以采用导数的方法来确定所述k-距离增量变化的大小。将所述k-距离作为因变量,所述点的个数作为自变量。相对于点的个数值的增量计算所述k-距离的增量的变化大小,取增量变化最大时对应的k-距离作为所述目标车速数据集的半径参数。所述半径参数即为基于密度聚类的方法中的领域半径的值。
305、所述密度阈值与领域半径的值确定之后,根据基于密度聚类的方法,将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。将异常车速数据识别出来之后,可以删除所述异常车速数据。
306、将等于所述半径参数的k-距离对应的车速数据对象标识为边界车速数据。
307、将小于所述半径参数的k-距离对应的车速数据对象标识为核心车速数据。本方法中采用基于密度聚类的方法,不仅实现了从目标数据集中识别异常车速数据,同时也识别出边界车速数据和核心车速数据,为研究历史交通流中的车速变化提供依据。
本发明实施例还提供一种异常车速数据的识别装置,如图4所示,包括:加载单元41、计算单元42、选择单元43、第一标识单元44、第二标识单元45和第三标识单元46。
其中,所述加载单元41用于将目标数据集加载到缓存中。所述目标数据集可以为指定路链上某个星期特征日中特定时间点的车速值。所述加载单元41加载目标数据集之后,所述计算单元42用于根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离。
然后,所述选择单元43用于从所有上述k-距离中选出所述目标车速数据集的半径参数。所述选择单元43包括:排序模块43A和选择模块43B。所述排序模块43A用于将所有上述k-距离按照递增次序进行排序。选择模块43B用于选择所述k-距离增量变化最大时对应的k-距离作为所述目标车速数据集的半径参数。所述半径参数即为基于密度聚类的方法中的领域半径的值。通过计算单元42和选择单元43确定了基于密度聚类的方法中的密度阈值和领域半径。
然后,根据基于密度聚类的方法通过比较所述目标数据集中的每个车速数据对象的k-距离与所述目标车速数据集的半径参数的大小,第一标识单元44用于将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。第二标识单元45用于将等于所述半径参数的k-距离对应的车速数据对象标识为边界车速数据。第三标识单元46用于将小于所述半径参数的k-距离对应的车速数据对象标识为核心车速数据。从而基于密度聚类的方法实现了从目标数据集中识别异常车速数据。
本发明实施例主要应用于智能交通领域,实现了将基于密度聚类的方法用于识别异常车速数据。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (4)

1.一种异常车速数据的识别方法,其特征在于,包括:
根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离,所述车速数据对象的k-距离为:车速数据对象p与车速数据对象o∈D之间的距离dist(p,o),且满足:①至少有k个车速数据对象q∈D\{p},使得dist(p,q)≤dist(p,o);②并且至多有(k-1)个车速数据对象q∈D\{p},使得dist(p,q)<dist(p,o);
将所有上述k-距离按照递增次序进行排序;
选择所述k-距离增量变化最大时对应的k-距离作为所述目标车速数据集的半径参数;
将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。
2.根据权利要求1所述的异常车速数据的识别方法,其特征在于,还包括:
将等于所述半径参数的k-距离对应的车速数据对象标识为边界车速数据;
将小于所述半径参数的k-距离对应的车速数据对象标识为核心车速数据。
3.一种异常车速数据的识别装置,其特征在于,包括:
计算单元,用于根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离,所述车速数据对象的k-距离为:车速数据对象p与车速数据对象o∈D之间的距离dist(p,o),且满足:①至少有k个车速数据对象对象q∈D\{p},使得dist(p,q)≤dist(p,o);②并且至多有(k-1)个车速数据对象对象q∈D\{p},使得dist(p,q)<dist(p,o);
选择单元,用于从所有上述k-距离中选出所述目标车速数据集的半径参数所述选择单元具体包括:排序模块,用于将所有上述k-距离按照递增次序进行排序;选择模块,用于选择所述k-距离增量变化最大时对应的k-距离作为所述目标车速数据集的半径参数;
第一标识单元,用于将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。
4.根据权利要求3所述的异常车速数据的识别装置,其特征在于,还包括:
第二标识单元,用于将等于所述半径参数的k-距离对应的车速数据对象标识为边界车速数据;
第三标识单元,用于将小于所述半径参数的k-距离对应的车速数据对象标识为核心车速数据。
CN2009102379401A 2009-11-19 2009-11-19 异常车速数据的识别方法和装置 Active CN101727749B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2009102379401A CN101727749B (zh) 2009-11-19 2009-11-19 异常车速数据的识别方法和装置
PCT/CN2010/078875 WO2011060725A1 (zh) 2009-11-19 2010-11-18 异常车速数据的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102379401A CN101727749B (zh) 2009-11-19 2009-11-19 异常车速数据的识别方法和装置

Publications (2)

Publication Number Publication Date
CN101727749A CN101727749A (zh) 2010-06-09
CN101727749B true CN101727749B (zh) 2012-01-04

Family

ID=42448581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102379401A Active CN101727749B (zh) 2009-11-19 2009-11-19 异常车速数据的识别方法和装置

Country Status (2)

Country Link
CN (1) CN101727749B (zh)
WO (1) WO2011060725A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727749B (zh) * 2009-11-19 2012-01-04 北京世纪高通科技有限公司 异常车速数据的识别方法和装置
CN106021852B (zh) * 2016-05-06 2018-11-06 鼎泰生物科技(海南)有限公司 基于密度聚类算法的血糖数据异常值计算方法和装置
CN108847022B (zh) * 2018-06-08 2021-04-16 浙江银江智慧交通集团有限公司 一种微波交通数据采集设备的异常值检测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100580739C (zh) * 2005-04-29 2010-01-13 宋怀淳 高速公路行车超速全程监测方法
US20080243350A1 (en) * 2007-03-30 2008-10-02 Harkness Johnnie C System and method for receiving and using data associated with driving conditions and related parameters
CN101102277B (zh) * 2007-06-20 2010-04-14 华为技术有限公司 业务数据识别控制方法、系统及识别控制装置
US9076331B2 (en) * 2007-07-16 2015-07-07 Crucs Holdings, Llc System and method to monitor vehicles on a roadway and to control driving restrictions of vehicle drivers
CN101465053B (zh) * 2007-12-21 2010-12-22 厦门雅迅网络股份有限公司 一种通过无线通信网络实时统计汽车怠速的方法
CN101727749B (zh) * 2009-11-19 2012-01-04 北京世纪高通科技有限公司 异常车速数据的识别方法和装置

Also Published As

Publication number Publication date
CN101727749A (zh) 2010-06-09
WO2011060725A1 (zh) 2011-05-26

Similar Documents

Publication Publication Date Title
CN111966729B (zh) 一种车辆轨迹数据处理方法、装置、设备及存储介质
CN101694743B (zh) 预测路况的方法和装置
CN103617429A (zh) 一种主动学习分类方法和系统
CN106840176A (zh) Gps时空数据增量路网实时更新和轨迹匹配系统
CN111680102B (zh) 基于人工智能的定位数据处理方法及相关设备
CN109657844A (zh) 电力短期负荷预测方法和装置
CN106599915B (zh) 一种车载激光点云分类方法
CN111881243B (zh) 一种出租车轨迹热点区域分析方法及系统
CN108566618A (zh) 获取用户驻留规律的方法、装置、设备及存储介质
CN111523748B (zh) 案件分配方法、装置及系统
CN109766902A (zh) 对同区域的车辆聚类的方法、装置和设备
CN103617435A (zh) 一种主动学习图像分类方法和系统
CN105099729A (zh) 一种识别用户身份标识的方法和装置
CN101727749B (zh) 异常车速数据的识别方法和装置
CN106530685B (zh) 一种交通数据短时预测方法及装置
CN106874943A (zh) 业务对象分类方法和系统
CN112885099A (zh) 用于确定车辆轨迹关键点的方法、装置及设备
CN114140780A (zh) 一种异常车辆的检测方法、装置及设备
CN116467266A (zh) 一种批量文件智能联机处理方法、装置及可存储介质
CN112182140B (zh) 结合rpa和ai的信息录入方法、装置、计算机设备和介质
CN116611678B (zh) 数据处理方法、装置、计算机设备和存储介质
CN112308339B (zh) 充电数据的处理方法和装置
CN111368616B (zh) 从车的识别方法、装置及设备
CN111260927B (zh) 一种公路路网流量预测方法
CN108287973A (zh) 交通状态的模拟方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant