CN110851450B - 一种基于增量计算的伴随车即时发现方法 - Google Patents

一种基于增量计算的伴随车即时发现方法 Download PDF

Info

Publication number
CN110851450B
CN110851450B CN201911098391.4A CN201911098391A CN110851450B CN 110851450 B CN110851450 B CN 110851450B CN 201911098391 A CN201911098391 A CN 201911098391A CN 110851450 B CN110851450 B CN 110851450B
Authority
CN
China
Prior art keywords
data
item
vehicle
time
transaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911098391.4A
Other languages
English (en)
Other versions
CN110851450A (zh
Inventor
刘宴兵
陶虹妃
肖云鹏
彭文勤
杨晨
帅杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201911098391.4A priority Critical patent/CN110851450B/zh
Publication of CN110851450A publication Critical patent/CN110851450A/zh
Application granted granted Critical
Publication of CN110851450B publication Critical patent/CN110851450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5022Mechanisms to release resources
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/017Detecting movement of traffic to be counted or controlled identifying vehicles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及智能交通技术领域,具体涉及一种基于增量计算的伴随车即时发现方法,包括:获取交通摄像头记录中的交通车辆数据,生成数据集;从数据集中提取相关属性,生成过车事务数据集;获取过车事务数据集,构建动态频繁树;根据动态频繁树,采用自底向上的方法遍历动态频繁树,进行频繁项映射存储,生成动态频繁项集;利用时间衰减模型,通过加权时间权重对动态频繁项集进行过滤,挖掘近期的伴随车组。本发明的方法增加哈希表以减少树的构建时间,同时增加数据批次散列表作为DF‑tree的减枝依据以释放过期数据占用的内存,引入时间衰减模型,实现基于大规模过车数据的伴随车即时发现。

Description

一种基于增量计算的伴随车即时发现方法
技术领域
本发明涉及智能交通技术领域,具体涉及一种基于增量计算的伴随车即时发现方法。
背景技术
随着智能交通的发展,各种交通信息采集技术广泛应用于城市交通,持续的产生海量、实时的时空数据,车辆智能监测系统(卡口系统)检测到的过车数据量迅速膨胀,计算机自动识别车牌的技术已经基本完善,挖掘大量已识别的车牌数据中的内在信息,检测伴随车辆,已经成为了交通管理者的关注热点。伴随车辆是一个交通术语,是指在规定的时间内某些车辆一起通过的卡口数量达到了某一阈值,这些车辆即为伴随车辆。现有技术中,伴随车发现方法主要分为两类:全球定位系统(Global Positioning System,GPS)数据和自动车牌识别数据(Automatic Number Plate Recognition,ANPR)数据。基于GPS数据对伴随车的研究,现有技术中已经存在多种典型的车辆伴随模式,这些伴随模式能够发现一段时间内一起移动的车辆群组。基于ANPR数据挖掘伴随车辆组的研究,主要通过处理流式数据,利用移动对象聚类得到伴随车组,还有部分研究针对大规模的轨迹数据,通过分布式处理框架Spark实现频繁序列挖掘算法的来获取伴随车组。虽然基于GPS和ANPR数据来发现伴随车组已经取得了一定的研究成果,但仍然存在一些挑战:
1.增量发现问题:车牌识别数据为流式数据,这要求算法适应流数据的动态性,以增量的方式来计算,避免部分数据的重复计算增加时间开销。
2.效率和性能问题:交通时空数据以数据流的格式生成,大量的数据在短时间内迅速到达。交通监控系统必须对数据进行聚类处理或频繁项挖掘以发现伴随车辆组,这些步骤涉及很高的计算开销。因此,伴随车组发现算法应该具有有效的数据结构来处理大规模数据。
3.时空约束问题:伴随车定义在时空约束上车辆的团体移动,这要求算法在计算伴随车组时需要同时考虑时间和空间两个方面。
发明内容
为了解决上述问题,本发明考虑到车牌自动识别数据流的特点建立增量数据结构动态频繁树DF-tree对车牌识别流数据进行动态挖掘,并加权时间影响因子实时发现伴随车组,因此,本发明提出一种基于增量计算的伴随车即时发现方法。
一种基于增量计算的伴随车即时发现方法,包括以下步骤:
S1、获取交通摄像头记录中的交通车辆数据,生成数据集;
S2、从数据集中提取相关属性,生成过车事务数据集;
S3、获取过车事务数据集,构建动态频繁树DF-tree;
S4、采用自底向上的方法遍历动态频繁树,进行频繁项映射存储,生成动态频繁项集;
S5、利用时间衰减模型,通过加权时间权重对动态频繁项集进行过滤,挖掘近期的伴随车组信息;
S6、将挖掘的伴随车组信息输入到交通管理中心的数据库中储存,并将伴随车信息输入到警用地理信息系统PGIS(Police Geographic Information System,PGIS)。
本发明的有益效果:
1.本发明提出动态频繁树DF-tree数据结构,增加哈希表以减少DF-tree的构建时间,提高伴随车挖掘效率;同时增加数据批次散列表作为DF-tree的减枝依据以释放过期数据占用的内存。
2.本发明针对伴随车发现的时效性要求,引入时间衰减模型,实现基于大规模过车数据的伴随车即时发现。
附图说明
下面结合附图和具体实施方式对本发明做进一步详细的说明。
图1为本发明实施例的总体流程图;
图2为本发明实施例的一种基于增量式的伴随车即时发现方法整体框架图;
图3为本发明实施例的事务数据样例;
图4为本发明实施例的动态频繁树构建与维护示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-2所示,一种基于增量计算的伴随车即时发现方法,包括以下步骤:
S1、获取交通摄像头记录中的交通车辆数据,生成数据集;
S2、从数据集中提取相关属性,生成过车事务数据集;
S3、获取过车事务数据集,构建动态频繁树DF-tree;
S4、采用自底向上的方法遍历动态频繁树,进行频繁项映射存储,生成动态频繁项集;
S5、利用时间衰减模型,通过加权时间权重对动态频繁项集进行过滤,挖掘近期的伴随车组信息;
S6、将挖掘的伴随车组信息输入到交通管理中心的数据库中储存,并将伴随车信息输入到警用地理信息系统(Police Geographic Information System,PGIS)。
第一步获取交通摄像头记录的过车数据,生成数据集,具体步骤包括:
S11、获取数据,提取交通摄像头采集的行驶车辆的所有原始数据,原始数据包括:自动车牌识别ANPR数据、过车时间、摄像头编号、摄像卡口、行驶车辆颜色及形态;
S12、对原始数据进行时间分片,根据“过车时间”字段对经过卡口的行驶车辆数据进行划分,统计同一卡口在设定时间阈值间隔中的过车数量,生成数据集。其中,伴随车指的是两个或多个移动对象在短时间阈值内共同经过多个卡口的车辆组。
第二步从数据集中提取相关属性,生成过车事务数据集。从获取到的数据集中提取与伴随车辆发现相关的特征:包括车牌号、过车时间及摄像头编号,将提取到的特征作为动态频繁树DF-tree的特征输入,具体步骤包括:
S21、提取相关属性。从获取到的数据集中提取与伴随车辆发现相关的特征:车牌号、过车时间、摄像头编号;
S22、设定时间阈值间隔对过车时间进行时间窗口滑动,对提取到的相关属性进行哈希值计算,形成哈希表,根据哈希表将提取到的属性根据时间维度和空间维度生成过车事务数据集,计算公式如下:
其中,ANPR(v,t,p)表示车牌识别数据流,v表示车牌号,t表示过车时间,p表示摄像头编号,hash(w(δ+t),p)表示对摄像头编号p和经过时间窗口滑动处理后的过车时间做哈希值计算,δ表示时间阈值,w(δ+t)表示滑动窗口在过车时间t的基础上左右滑动δ个时间单位,I表示生成的过车事务数据集,tid1:v1,v2,…,vn1表示一条数据事务项,z表示数据事务集中数据事务项的数量,n表示一条事务数据项中包含的数据项的数量,vn,1表示第1条事务项中的第n个数据。
进一步的,过车事务数据集的生成还包括:设定时间阈值间隔对过车时间进行时间窗口滑动处理,对交通摄像头编号和过车时间做哈希计算,生成的哈希值作为该辆行驶车辆的数据事务项,根据所有车辆的数据事务项生成过车事务数据集,并将过车事务数据集中事务数据项中的数据按字典顺序排序。
第三步获取过车事务数据集,构建动态频繁树DF-tree。
获取动态车牌数据集,通过实时流数据处理平台将ANPR数据处理为ANPR离散数据流,例如,将ANPR数据以1秒的时间片为单位进行分批,将流处理转换为时间片数据处理,最终处理为ANPR离散数据流。根据ANPR离散数据流中的移动对象的特征信息,采用滑动时间窗口机制,将每一批ANPR离散数据流处理为过车事务数据,所述特征信息包括:车牌号,过车时间和摄像头编号;如图3和图4所示,具体步骤包括:
S31、将提取的自动车牌识别ANPR数据通过实时流数据处理平台处理为ANPR离散数据流;根据ANPR离散数据流中的移动对象的特征信息,特征信息包括:车牌号,过车时间和摄像头编号,引入滑动时间窗口机制,将每一批ANPR离散数据流处理为过车事务数据;
S32、将过车事务数据集的数据按照数据流到达的时间顺序依次进入固定容量的事务队列窗口;
S33、根据当前事务队列中的过车事务数据集生成项头表和散列表,将散列表作为辅助项头查询表,通过散列表进行项头表的辅助查询,在向项头表添加项目时,按照开放地址散列函数xi(item)=(x(item)+di)MODm计算该项目哈希值,以该哈希值作为该项目在辅助项头查询表中的存储位置,然后根据该存储位置获得在项头表的项元素节点信息。
其中x(item)表示所选的散列函数,item指的是项头表中的项目名,此处表示车牌号,di表示由随机函数计算得到的偏移量,m表示当前项头表的容量大小,i表示第i个项,MOD表示求余运算;
S34、新的事务数据到来时,在新项目插入动态频繁树之前,要先判断是否需要对动态频繁树进行剪枝操作,若需要进行剪枝操作,则先对动态频繁树进行剪枝操作,再扫描事务数据集,查询辅助项头表获得项目节点信息,按事务项数据排列的顺序插入新项目;若无需剪枝操作则直接扫描事务数据集,查询辅助项头表获得项目节点信息,按事务项数据排列的顺序插入新项目,并在数据批次表中记录该批次事务数据项中最后插入动态频繁树的节点信息。
进一步的,动态频繁树节点结构包括:项目名,节点频率计数器,子父指针,指向同名节点指针,记录当前项所在节点的动态频繁树子树的根结点地址标记,记录当前节点是否为叶子节点的标记。
进一步的,对动态频繁树是否要进行剪枝操作的判断:当事务队列窗口装满时,需要对过期事务数据进行处理,即构建动态频繁树的时候利用数据批次表对动态频繁树进行剪枝操作。
进一步的,剪枝操作具体包括:从数据批次表中读取过期数据中最后添加的节点,将该结点沿着子父指针执行,判断结点的频率计数是否大于支持度阈值,若不满足则删除该节点,否则,所经过的结点的频率计数都减1,直到到达根结点。
第四步根据动态频繁树,采用自底向上的方法遍历动态频繁树,进行频繁项映射存储,生成动态频繁项集。具体包括以下步骤:
S41、根据动态频繁树DF-tree的叶子记录表,逆向遍历每一颗子树;
S42、根据公式计算子树路径上两两节点的频率计数,其中,/>表示pre和d车辆之间的伴随次数,/>表示以项目pre为前项、项目d为后项的所有节点集合,以项目名组合(pre,d)为键,/>的计算值映射存储于存储表中,利用存储后的存储表生成动态频繁项集。
第五步根据上一步生成的动态频繁项集,利用时间衰减函数对各个频繁项的加权时间计数进行统计,挖掘近期的伴随车组,具体包括以下步骤:
S51、第四步中生成的动态频繁项集是持续更新的,当新的频繁项μ到来时,记录当前时间参数tcur加1;
S52、发现新的伴随车cv时,根据公式ccv=ccv×α,引入时间衰减因子以概率为1的机会更新伴随车辆的伴随计数ccv,其中,α表示衰减因子,/>表示引入时间参数的时间衰减因子,ccv表示伴随车cv的伴随计数,Tv表示伴随车cv在摄像头下的过车时间集合,过车时间t≤tcur
S53、对于新的频繁项μ,若μ∈CV时,将其时间权重计数加1,所述时间权重计数ccv′=mincv∈CVccv;若则取出当前伴随车集合中时间权重计数最小的伴随车,其中,CV表示伴随车发现结果,ccv′表示时间权重计数最小的伴随车的伴随计数,mincv∈cVccv表示时间权重计数最小的伴随车的伴随计数;
S54、判断ccv′的值,若ccv′<1,则从伴随车集合中去掉cv′,同时将新的频繁项μ加入伴随车发现结果CV中;
S55、输出伴随车发现结果CV。
第六步将挖掘的伴随车组信息输入到交通管理中心的数据库中储存,并将伴随车信息输入到警用地理信息系统(Police Geographic Information System,PGIS),以便后续查询和显示,例如,设计实现伴随车实时查询的RESTful API,相关部门可以通过车牌号,过车时间等参数实时查询伴随车情况。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种基于增量计算的伴随车即时发现方法,其特征在于,包括以下步骤:
S1、获取交通摄像头记录中的交通车辆数据,生成数据集;
S2、从数据集中提取相关属性,生成过车事务数据集;
S3、获取过车事务数据集,构建动态频繁树DF-tree;
动态频繁树DF-tree的构建包括以下步骤:
S31、将提取的自动车牌识别ANPR数据通过实时流数据处理平台处理为ANPR离散数据流;采用滑动时间窗口机制,将每一批ANPR离散数据流中的移动对象的特征信息处理为过车事务数据,所述特征信息包括:车牌号,过车时间和摄像头编号;
S32、将过车事务数据集的数据按照数据流到达的时间顺序依次进入固定容量的事务队列窗口;
S33、根据当前事务队列中的过车事务数据集生成项头表和散列表,通过散列表进行项头表的辅助查询,在向项头表添加项目时,按照开放地址散列函数计算该项目哈希值,以该哈希值作为该项目在散列表中的存储位置,然后根据该存储位置获得在项头表的项元素节点信息,其中,/>表示所选的散列函数,item指的是项头表中的项目名,di表示由随机函数计算得到的偏移量,m表示当前项头表的容量大小,i表示第i个项;
S34、新的事务数据到来时,在新项目插入动态频繁树之前,判断是否需要对动态频繁树进行剪枝操作,若需要进行剪枝操作,则先对动态频繁树进行剪枝操作,再扫描事务数据集,查询辅助项头表获得项目节点信息,按事务项数据排列的顺序插入新项目;若无需剪枝操作则直接扫描事务数据集,查询辅助项头表获得项目节点信息,按事务项数据排列的顺序插入新项目,并在数据批次表中记录该批次事务数据项中最后插入动态频繁树的节点信息;
S4、采用自底向上的方法遍历动态频繁树,进行频繁项映射存储,生成动态频繁项集;动态频繁项集的生成过程包括:
S41、根据动态频繁树的叶子记录表,逆向遍历每一棵子树;
S42、根据公式计算子树路径上两两节点的频率计数,其中,/>表示pre、d车辆之间的伴随次数,/>表示以项目pre为前项、项目d为后项的所有节点集合,以项目名组合(pre,d)为键,/>的计算值映射存储于存储表中,利用存储后的存储表生成动态频繁项集;
S5、利用时间衰减模型,通过加权时间权重对动态频繁项集进行过滤,挖掘近期的伴随车组信息;包括:
S51、动态频繁项集是持续更新的,当新的频繁项μ到来时,当前时间参数tcur加1;
S52、发现新的伴随车cv时,根据公式ccv=ccv×α,引入时间衰减因子以概率为1的机会更新伴随车辆的伴随计数ccv,其中,α表示衰减因子,/>表示引入时间参数的时间衰减因子,ccv表示伴随车cv的伴随计数,过车时间t≤tcur
S53、对于新的频繁项μ,若μ∈CV时,将时间权重计数ccv′加1,所述时间权重计数ccv′=mincv∈CVccv;若则取出当前伴随车集合中时间权重计数最小的伴随车cv′,其中,CV表示伴随车发现结果,mincv∈CVccv表示时间权重计数最小的伴随车的伴随计数;
S54、判断时间权重计数ccv′的值,若ccv′<1,则从伴随车集合中去掉时间权重计数最小的伴随车cv′,同时将新的频繁项μ加入伴随车发现结果CV中;
S55、输出伴随车发现结果CV;
S6、将挖掘的伴随车组信息输入到交通管理中心的数据库中储存,并将伴随车信息输入到警用地理信息系统PGIS。
2.如权利要求1所述的一种基于增量计算的伴随车即时发现方法,其特征在于,数据集的生成包括以下步骤:
S11、获取数据,提取交通摄像头采集的行驶车辆的所有原始数据,原始数据包括:自动车牌识别ANPR数据、过车时间、摄像头编号、摄像卡口、行驶车辆颜色及形态;
S12、对原始数据进行时间分片,根据“过车时间”字段对经过卡口的行驶车辆数据进行划分,统计同一卡口在设定时间阈值间隔中的过车数量,生成数据集。
3.如权利要求1所述的一种基于增量计算的伴随车即时发现方法,其特征在于,过车事务数据集的生成包括以下步骤:
S21、从获取的数据集中提取行驶车辆的特征,提取的行驶车辆的特征包括:车牌号、过车时间和摄像头编号;
S22、设定时间阈值间隔对过车时间进行时间窗口滑动,对提取到的相关属性进行哈希值计算,形成哈希表,根据哈希表将提取到的属性根据时间维度和空间维度生成过车事务数据集,计算公式如下:
其中,ANPR(v,t,p)表示车牌识别数据流,v表示车牌号,t表示过车时间,p表示摄像头编号,hash(w(δ+t),p)表示对摄像头编号p和经过时间窗口滑动处理后的过车时间做哈希值计算,δ表示时间阈值,w(δ+t)表示滑动窗口在过车时间t的基础上左右滑动δ个时间单位,I表示生成的过车事务数据集,tid1:v1,v2,…,vn1表示一条数据事务项,z表示数据事务集中数据事务项的数量,n表示一条事务数据项中包含的数据项的数量,vn,1表示第1条事务项中的第n个数据。
4.如权利要求3所述的一种基于增量计算的伴随车即时发现方法,其特征在于,过车事务数据集的生成还包括:设定时间阈值间隔对过车时间进行窗口滑动处理,对交通摄像头编号和过车时间做哈希计算,生成的哈希值作为该辆行驶车辆的数据事务项,根据所有车辆的数据事务项生成过车事务数据集,并将过车事务数据集中事务数据项中的数据按字典顺序排序。
5.如权利要求1所述的一种基于增量计算的伴随车即时发现方法,其特征在于,动态频繁树节点结构包括:项目名、节点频率计数器、子父指针、指向同名节点指针、记录当前项目所在节点的动态频繁树子树的根节点地址标记、记录当前节点是否为叶子节点的标记。
6.如权利要求1所述的一种基于增量计算的伴随车即时发现方法,其特征在于,动态频繁树的剪枝操作包括:当事务队列窗口装满时,需要对过期事务数据进行处理,在构建动态频繁树时利用数据批次表进行剪枝操作,具体剪枝操作包括:从数据批次表中读取过期数据中最后添加的节点,沿着该节点的子父指针执行,判断节点的频率计数是否大于支持度阈值,若节点的频率计数小于支持度阈值,则删除该节点,若节点的频率计数大于支持度阈值,则将经过的节点的频率计数减1,直到到达根节点。
CN201911098391.4A 2019-11-12 2019-11-12 一种基于增量计算的伴随车即时发现方法 Active CN110851450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911098391.4A CN110851450B (zh) 2019-11-12 2019-11-12 一种基于增量计算的伴随车即时发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911098391.4A CN110851450B (zh) 2019-11-12 2019-11-12 一种基于增量计算的伴随车即时发现方法

Publications (2)

Publication Number Publication Date
CN110851450A CN110851450A (zh) 2020-02-28
CN110851450B true CN110851450B (zh) 2023-07-18

Family

ID=69601613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911098391.4A Active CN110851450B (zh) 2019-11-12 2019-11-12 一种基于增量计算的伴随车即时发现方法

Country Status (1)

Country Link
CN (1) CN110851450B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395277B (zh) * 2020-12-09 2024-01-09 招商华软信息有限公司 一种车辆信息筛选方法、装置、设备及存储介质
CN115017247A (zh) * 2022-06-02 2022-09-06 河南信安通信技术股份有限公司 移动对象伴随关系分析用动态时间片划分方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933136A (zh) * 2015-06-15 2015-09-23 北方工业大学 基于海量车牌自动识别数据的动态拼车方法和系统
CN106021412A (zh) * 2016-05-13 2016-10-12 上海市计算技术研究所 一种面向大规模过车数据的伴随车辆识别方法
CN108564788A (zh) * 2018-06-07 2018-09-21 重庆邮电大学 一种基于流式大数据的同行车辆发现方法
CN109165237A (zh) * 2018-08-28 2019-01-08 新华三大数据技术有限公司 伴随对象确定方法、装置以及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140302774A1 (en) * 2013-04-04 2014-10-09 General Motors Llc Methods systems and apparatus for sharing information among a group of vehicles

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933136A (zh) * 2015-06-15 2015-09-23 北方工业大学 基于海量车牌自动识别数据的动态拼车方法和系统
CN106021412A (zh) * 2016-05-13 2016-10-12 上海市计算技术研究所 一种面向大规模过车数据的伴随车辆识别方法
CN108564788A (zh) * 2018-06-07 2018-09-21 重庆邮电大学 一种基于流式大数据的同行车辆发现方法
CN109165237A (zh) * 2018-08-28 2019-01-08 新华三大数据技术有限公司 伴随对象确定方法、装置以及电子设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Kim J., Hwang B.Real-time stream data mining based on CanTree and Gtree.Information Sciences.2016,全文. *
Unil Yun.Incremental mining of weighted maximal frequent itemsets from dynamic databases.Expert Systems with Applicaions.2016,全文. *
赵秋实 ; 史燕中 ; 方志 ; 蒋遂平 ; .基于频繁集的伴随车辆检测算法研究.软件.2016,(第04期),全文. *
陈瑶 ; 桂峰 ; 卢超 ; 王华 ; .基于频繁项集挖掘算法的伴随车应用与实现.计算机应用与软件.2017,(第04期),全文. *

Also Published As

Publication number Publication date
CN110851450A (zh) 2020-02-28

Similar Documents

Publication Publication Date Title
CN107133318B (zh) 一种基于手机信令数据的人口识别方法
US7603339B2 (en) Merging synopses to determine number of distinct values in large databases
Potamias et al. Sampling trajectory streams with spatiotemporal criteria
US7636731B2 (en) Approximating a database statistic
CN109634946B (zh) 一种基于大数据挖掘的轨迹智能匹配关联分析方法
CN110334111B (zh) 一种多维轨迹分析方法及装置
CN110851450B (zh) 一种基于增量计算的伴随车即时发现方法
CN111104398B (zh) 针对智能船舶近似重复记录的检测方法、消除方法
CN113297135A (zh) 数据处理方法以及装置
CN111294742B (zh) 基于信令cdr数据识别伴随手机号码的方法与系统
CN114647684A (zh) 基于stacking算法的流量预测方法、装置及相关设备
CN106326923A (zh) 一种顾及位置重复和密度峰值点的签到位置数据聚类方法
CN1783092A (zh) 数据分析装置和数据分析方法
CN111107319A (zh) 基于区域摄像头的目标追踪方法、装置及系统
CN114398315A (zh) 一种数据存储方法、系统、存储介质及电子设备
CN114528284A (zh) 一种底层数据清洗方法、装置、移动终端和存储介质
CN112765120A (zh) 一种基于手机信令分析和提取用户移动轨迹的方法
CN116760728A (zh) 一种面向高速数据流的通用流级过滤方法
CN116013084A (zh) 交通管控场景确定方法、装置、电子设备及存储介质
CN111383032B (zh) 一种房源信息的真实性检测方法和装置
CN109408727B (zh) 基于多维感知数据的用户关注信息智能推荐方法及系统
CN113657533A (zh) 一种面向时空场景构建的多元时间序列分割聚类方法
Zhou et al. A new approach for noise data detection based on cluster and information entropy
Wu et al. Fuzzy trajectory linking
CN111242978A (zh) 基于红外相机技术的生物行为轨迹分析系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant