CN107066483A - 一种交通行业指标数据编码及存储方法 - Google Patents

一种交通行业指标数据编码及存储方法 Download PDF

Info

Publication number
CN107066483A
CN107066483A CN201611212819.XA CN201611212819A CN107066483A CN 107066483 A CN107066483 A CN 107066483A CN 201611212819 A CN201611212819 A CN 201611212819A CN 107066483 A CN107066483 A CN 107066483A
Authority
CN
China
Prior art keywords
data
index
monitoring index
generation
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611212819.XA
Other languages
English (en)
Inventor
程磊
翁剑成
张航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Thoroughfare Permanent Technology Co Ltd
Original Assignee
Beijing Thoroughfare Permanent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Thoroughfare Permanent Technology Co Ltd filed Critical Beijing Thoroughfare Permanent Technology Co Ltd
Priority to CN201611212819.XA priority Critical patent/CN107066483A/zh
Publication of CN107066483A publication Critical patent/CN107066483A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种交通行业指标数据编码及存储的方法,该方法由监测指标配置服务、监测指标数据生成服务组成。监测指标配置服务定义了指标数据的各属性及编码;监测指标数据生成服务根据监测指标配置服务定义的指标数据的属性及编码进而生成指标值,进而保存到分布式数据库中。监测指标管理清晰、易维护。hbase相对于关系数据库,通过时间戳很容易实现指标数据的多版本存储、追溯。数据以文件系统方式保存在各数据节点上,自动切分数据,使得数据存储自动具有水平扩展;通过不断增加廉价的机器,来增加计算和存储能力;满足指标数据持续增长要求。5000W条数据使用hbase导入30分钟以可以内完成,查询同一个指标所有数据2秒可以完成。

Description

一种交通行业指标数据编码及存储方法
技术领域
本发明涉及一种交通行业指标数据编码及存储方法。利用指标数据编码、自定义的数据结构,对指标数据高并发读写操作的方法。
背景技术
交通领域大数据分析和应用的场景相当多:一个是大数据本身的技术处理平台,另一个是数据分析和挖掘算法。
对于交通线路规划和设计是一个大数据潜在的应用场景,传统的交通线路规划往往需要在前期投入大量的人力进行OD调查和数据收集。特别是在交通卡普及后,对于OD流量数据完全可以从交通的卡中采集到相关的交通流量和流向数据,包括同一张卡每天的行走路线和换乘次数等详细信息。对于一个上千万人口的大城市而言,每天的流量数据都会相当大,单一分析一天的数据可能没有相关的价值,而分析一个周期的数据趋势变化则会相当有价值。结合交通流量流向数据趋势变化,可以很好的帮助公交运营线路的调整,换乘站的设计等很多内容。
从单一的交通流量流向数据动态分析仅仅是一个方面,大数据往往更加强调相关性分析。比如对于在某一个时间段内公交流量和流向数据发生明细的趋势变化的时候,这个趋势变化的究竟和哪些潜在的大事件或其它影响因素的变化存在相关性,如何去分析这些相关性并做出正确的应对。
就智能交通来说,现在的智慧交通应用往往已经能够很方面的进行整个大城市环境下的交通状况监控并发布相应的道路状况信息。在GPS导航中往往也可以实时的看到相应的拥堵路况等信息,而方便驾驶者选择新的路线。但是这仍然是一种事后分析和处理的机制,一个好的智能导航和交通流诱导系统一定是基于大量的实时数据分析为每个车辆给出最好的导航路线,而不是在事后进行处理。对于智能交通中的交通流分配和诱导等模型很复杂,而且面对大量的实时数据采集,根据模型进行实时分分析和计算,给出有价值的结果,这个在原有的信息技术下确实很难解决。随着物联网和车联网,分布式计算,基于大数据的实时流处理等各种技术的不断城市,智能的交通导航和趋势分析预测将逐步成为可能。
随着智慧城市的建设,城市里面到处都是摄像头采集数据,当锁定一个车辆后如何根据车辆的特征或车牌号等信息,实时的追踪到车辆的行走路线和位置。这里面往往需要实时的视频数据采集,采集数据的实时分析和比对,给出相应的参考信息和数据。对于视频流和图像信息的比对和分析往往更加耗费计算资源,需要更长的计算周期,要从城市成千上万个摄像头里面采集数据并进行实时分析完全满足大数据常说的海量数据,异构数据,速度和价值等四个维度的特征。
交通行业数据有流数据、数据文件、数据库文件、在线文字和图片、音频视频流等。要在这些基础数据基础上,建立指标体系,进行监测,反应交通状况。其中有结构化数据、非结构化数据和半结构化数据,要对这些数据进行分析建模。
发明内容
针对上述问题,本发明提供一种交通行业指标数据编码及存储的方法,实现交通行业指标数据存储和快速查询。
为实现上述目的,本发明采用以下技术方案:
一种交通行业指标数据编码及存储的方法,该方法由监测指标配置服务、监测指标数据生成服务组成。监测指标配置服务定义了指标数据的各属性及编码;监测指标数据生成服务根据监测指标配置服务定义的指标数据的属性及编码进而生成指标值,进而保存到分布式数据库中。具体实施的流程包括以下步骤:
步骤1:监测指标配置服务。
监测指标配置服务包括指标数据的空间维度维护、监测指标维护。指标数据的空间维度为树形结构,共8级,每一级占4位,为16进制数字,共32位,监测指标编码编码由服务后台根据规则自动生成。监测指标编码由空间维度编码+时间范围+日期特征+时间特征+指标+单位+来源组成。
步骤2:监测指标数据生成服务。
监测指标数据生成服务根据步骤1:监测指标配置服务中的监测指标编码生成指标值并存储。
接收主题库消息,根据配置生成指标值,获取和主题相关的指标集合;遍历指标并根据配置生成指标。其他依赖该指标的指标,通过调度生成。指标值存储在分布式数据库hbase中,使用“监测指标编码+时间”作为RowKey。
与现有技术相比,本发明具有以下明显的优势:
监测指标管理清晰、易维护。hbase相对于关系数据库,通过时间戳很容易实现指标数据的多版本存储、追溯。数据以文件系统方式保存在各数据节点上,自动切分数据,使得数据存储自动具有水平扩展;通过不断增加廉价的机器,来增加计算和存储能力;满足指标数据持续增长要求。
采用本发明后,项目上三年的指标值5000W左右,插入oracle需要7个小时,查询一个指标所有的数据要15秒左右。使用hbase导入30分钟以可以内完成(三个节点,设备配置和oracle一样),查询同一个指标所有数据2秒可以完成。
附图说明
图1空间维度编码结构示意图;
图2监测指标编码结构示意图;
图3为监测指标配置流程图。
图4为监测指标数据生成服务流程图。
具体实施方式
下面结合附图1-2和具体实施方式对本发明做进一步说明。
本发明所述的方法包括以下步骤:
监测指标配置,包括以下步骤:
步骤1.1调研数据和需求,整理待生成指标及计算方法,如:刷卡数据、流量数据等,以及指标计算方法。
步骤1.2根据1.1结果,整理空间维度数据,建立树形结构:如:区县、线路、站点、检查站、检测器等;将空间维度数据进行导入。
步骤1.3选择空间维度、指标、单位、时间范围、时间特征、来源、计算公式,创建监测指标。
监测指标数据生成服务,包括以下步骤:
步骤2.1监听消息队列,找到关联的指标,生成指标数据。
步骤2.2如果生成成功,查询依赖该指标的其他指标,并判断当前时间是否大于要生成时间;如果大于生成时间,发送生成指标消息。否则,放入缓存。
步骤2.3定时调度,遍历缓存,判断当前时间是否大于要生成时间;如果大于生成时间,发送生成指标消息。

Claims (3)

1.一种交通行业指标数据编码及存储的方法,其特征在于:该方法由监测指标配置服务、监测指标数据生成服务组成;监测指标配置服务定义了指标数据的各属性及编码;监测指标数据生成服务根据监测指标配置服务定义的指标数据的属性及编码进而生成指标值,进而保存到分布式数据库中;具体实施的流程包括以下步骤:
步骤1:监测指标配置服务;
监测指标配置服务包括指标数据的空间维度维护、监测指标维护;指标数据的空间维度为树形结构,共8级,每一级占4位,为16进制数字,共32位,监测指标编码编码由服务后台根据规则自动生成;监测指标编码由空间维度编码+时间范围+日期特征+时间特征+指标+单位+来源组成;
步骤2:监测指标数据生成服务;
监测指标数据生成服务根据步骤1:监测指标配置服务中的监测指标编码生成指标值并存储;
接收主题库消息,根据配置生成指标值,获取和主题相关的指标集合;遍历指标并根据配置生成指标;其他依赖该指标的指标,通过调度生成;指标值存储在分布式数据库hbase中,使用“监测指标编码+时间”作为RowKey。
2.根据权利要求1所述的一种交通行业指标数据编码及存储的方法,其特征在于:监测指标配置,包括以下步骤:
步骤1.1整理原始数据,如:刷卡数据、流量数据等,找出数据与检测指标的关系;
步骤1.2整理空间维度数据,建立树形:线路、站点、检查站、检测器;将空间维度数据进行导入;
步骤1.3选择空间维度、指标、单位、时间范围、时间特征、来源、计算公式,创建监测指标。
3.根据权利要求1所述的一种交通行业指标数据编码及存储的方法,其特征在于:监测指标数据生成服务,包括以下步骤:
步骤2.1监听消息队列,找到关联的指标,生成指标数据;
步骤2.2如果生成成功,查询依赖该指标的其他指标,检查是否到生成时间,如果到了,发送生成指标消息;没有的话,放入缓存,通过定时调度触发;
步骤2.3定时调度,遍历缓存,如果生成时间到了,发送生成指标消息。
CN201611212819.XA 2016-12-25 2016-12-25 一种交通行业指标数据编码及存储方法 Pending CN107066483A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611212819.XA CN107066483A (zh) 2016-12-25 2016-12-25 一种交通行业指标数据编码及存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611212819.XA CN107066483A (zh) 2016-12-25 2016-12-25 一种交通行业指标数据编码及存储方法

Publications (1)

Publication Number Publication Date
CN107066483A true CN107066483A (zh) 2017-08-18

Family

ID=59624636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611212819.XA Pending CN107066483A (zh) 2016-12-25 2016-12-25 一种交通行业指标数据编码及存储方法

Country Status (1)

Country Link
CN (1) CN107066483A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858539A (zh) * 2020-07-22 2020-10-30 重庆新致金服信息技术有限公司 指标关系的可追溯性的实现方法、系统以及设备
CN111858539B (zh) * 2020-07-22 2024-05-14 重庆新致金服信息技术有限公司 指标关系的可追溯性的实现方法、系统以及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719237A (zh) * 2009-12-09 2010-06-02 南京联创科技集团股份有限公司 基于全业务指标规则配置的数据质量监控方法
CN102194164A (zh) * 2011-04-18 2011-09-21 上海实时数据软件有限公司 基于指标体系模型的敏捷商业智能数据构建方法
CN104282140A (zh) * 2014-09-22 2015-01-14 同济大学 基于分布式框架的大规模实时交通指数服务方法与系统
CN104461544A (zh) * 2014-12-12 2015-03-25 用友软件股份有限公司 编码动态生成装置和方法
CN105426437A (zh) * 2015-11-05 2016-03-23 西安翔迅科技有限责任公司 一种基于HBase的智能交通领域卡口数据存储方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719237A (zh) * 2009-12-09 2010-06-02 南京联创科技集团股份有限公司 基于全业务指标规则配置的数据质量监控方法
CN102194164A (zh) * 2011-04-18 2011-09-21 上海实时数据软件有限公司 基于指标体系模型的敏捷商业智能数据构建方法
CN104282140A (zh) * 2014-09-22 2015-01-14 同济大学 基于分布式框架的大规模实时交通指数服务方法与系统
CN104461544A (zh) * 2014-12-12 2015-03-25 用友软件股份有限公司 编码动态生成装置和方法
CN105426437A (zh) * 2015-11-05 2016-03-23 西安翔迅科技有限责任公司 一种基于HBase的智能交通领域卡口数据存储方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858539A (zh) * 2020-07-22 2020-10-30 重庆新致金服信息技术有限公司 指标关系的可追溯性的实现方法、系统以及设备
CN111858539B (zh) * 2020-07-22 2024-05-14 重庆新致金服信息技术有限公司 指标关系的可追溯性的实现方法、系统以及设备

Similar Documents

Publication Publication Date Title
CN109754594B (zh) 一种路况信息获取方法及其设备、存储介质、终端
Lin et al. Impact of weather conditions and built environment on public bikesharing trips in Beijing
US9286801B2 (en) Leveraging information for use in a traffic prediction scenario
An et al. How the built environment promotes public transportation in Wuhan: A multiscale geographically weighted regression analysis
CN111190982B (zh) 一种基于大数据的共享单车管理方法及系统
CN104318327A (zh) 一种车辆轨迹预测分析方法
Xia et al. A parallel grid-search-based SVM optimization algorithm on Spark for passenger hotspot prediction
CN113255552A (zh) 公交车载视频乘客od分析系统、方法、装置及存储介质
Gong et al. Multi-information location data fusion system of railway signal based on cloud computing
Shah et al. Assessment of Ahmedabad (India) and Shanghai (China) on smart city parameters applying the Boyd Cohen smart city wheel
Stenneth et al. Monitoring and mining GPS traces in transit space
CN110021161A (zh) 一种交通流向的预测方法及系统
Lee et al. A dual attention-based recurrent neural network for short-term bike sharing usage demand prediction
CN112382122B (zh) 一种交通信息处理的方法和装置
Zheng et al. A deep learning–based approach for moving vehicle counting and short-term traffic prediction from video images
Lin et al. Insights into Travel Pattern Analysis and Demand Prediction: A Data-Driven Approach in Bike-Sharing Systems
CN112699955A (zh) 一种用户分类方法、装置、设备及存储介质
Zhang et al. Free-floating bike-sharing demand prediction with deep learning
CN107066483A (zh) 一种交通行业指标数据编码及存储方法
Serrano et al. Real-time traffic-based routing, based on open data and open-source software
CN115169466A (zh) 一种地块画像方法、装置、电子设备及计算机可读介质
Hua et al. Transfer learning for cross-modal demand prediction of bike-share and public transit
Sari Aslam et al. Trip purpose identification using pairwise constraints based semi-supervised clustering
Balamurugan et al. The future of India creeping up in building a smart city: intelligent traffic analysis platform
Wang et al. Data, methods, and applications of traffic source prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170818