发明内容
针对现有技术存在的缺陷,本发明提供了一种交通信息发布系统,能够提更具实时性和真实性的交通信息。
一种交通信息发布系统,包括:
数据捕获模块,用于采集多源交通信息数据;
数据分类器模块,用于接收所述交通信息数据,并对所述交通信息数据进行预处理,同时将经预处理后的所述交通信息数据按空间属性和交通信息属性分类并输出;及
数据融合器模块,用于接收所述数据分类器模块输出的数据,并根据所述空间属性和交通信息属性对所述数据进行融合,以形成可以识别的交通路况信息数据。
进一步地,所述数据捕获模块为插件式数据捕获模块,所述插件式数据捕获模块可根据不同数据源采集交通信息数据,所述交通信息数据包括套接字、文本、图像、语音或视频。
进一步地,所述插件式数据捕获模块包括:
数据网络套接字服务器子模块,包括套接字接收模块与字节流解析模块,所述套接字接收模块采集网络套接字字节流再由所述字节流解析模块解析后以文本或数据流的形式输出;
文件传输服务器子模块,包括文件服务器存储模块及文件服务器客户端传输模块,所述文件服务器存储模块输入网络文件再经所述文件服务器客户端传输模块输出文本文件或二进制文件;
网络爬虫服务器子模块,包含爬虫服务器采集模块及爬虫结果存储模块,所述爬虫服务器采集模块采集万维网上可以访问的交通信息网页并通过所述爬虫结果存储模块输出自定义规整格式信息;
API数据服务器子模块,包含API数据采集模块及采集结果存储模块,所述API数据采集模块采集外部服务器协议的API返回结果格式,通过所述采集结果存储模块输出文本数据的规整格式;
视频图像处理服务器子模块,包含视频图像流媒体处理服务器模块及视频图像多媒体文件存储服务器模块,所述视频图像流媒体处理服务器模块采集多媒体数据信息并转化为规整文本数据存储于所述视频图像多媒体文件存储服务 器模块中;
音频识别处理服务器子模块,包括音频处理服务器模块和音频文件存储服务器模块,所述音频处理服务器子模块,将音频信息转化为规整文本数据并存储于所述音频文件存储服务器模块中。
进一步地,所述数据分类器模块包括:
语义分析器子模块,用于接收所述交通信息数据,并将所述交通信息数据生成规整的文本数据并进行解析;
数据预规整器子模块,用于解析后的数据进行二次规整;及
数据分类器子模块,用于将二次规整后的数据按空间属性和交通信息属性分类并输出。
进一步地,所述数据融合器模块包括:
数据融合空间计算子模块,用于根据所述空间属性计算所述数据的空间关系;
数据融合分类器计算子模块,用于根据所述数据的交通信息属性进行数据分类融合。
进一步地,所述空间属性包括点、线和面之间的空间关系。
进一步地,所述交通信息属性包括连续变量和分类变量。
进一步地,所述空间关系包括:点与点之间的相邻、相离两种空间关系;点与线之间的相交、相邻、相离三种空间关系;点与面之间的包含、相邻、相离三种空间关系;线与线之间的相交、相邻、相离三种空间关系;线与面之间的包含、相交、相邻、相离四种空间关系;及面与面之间的包含、相交、相邻、相离四种空间关系。
进一步地,所述连续变量与连续变量之间的融合包括:连续变量与连续变量之间的融合、连续变量与分类变量之间的融合、分类变量与分类变量之间的 融合。
进一步地,通过统计和拟合训练方法建立线性与非线性模型实现所述连续变量与连续变量之间的融合;通过机器学习和数据挖掘方法建立分类器模型实现所述连续变量与所述分类变量之间的融合及实现所述分类变量与分类变量之间的融合。
另外,本发明还提供了一种交通信息发布方法,包括下述步骤:
采集多源交通信息数据;
接收所述交通信息数据,并对所述交通信息数据进行预处理,同时将经预处理后的所述交通信息数据按空间属性和交通信息属性分类并输出;及
接收所述数据分类器模块输出的数据,并根据所述空间属性和交通信息属性对所述数据进行融合,以形成可以识别的交通路况信息数据。
本发明提供的交通信息发布系统和方法,通过数据捕获模块采集多源交通信息数据,数据分类器模块接收所述交通信息数据,并对所述交通信息数据进行预处理,同时将经预处理后的所述交通信息数据按空间属性和交通信息属性分类并输出,数据融合器模块接收所述数据分类器模块输出的数据,并根据所述空间属性和交通信息属性对所述数据进行融合,以形成可以识别的交通路况信息数据。本发明提供的交通信息发布系统和方法,利用了与交通信息相关的各种形态的数据,并以分布式数据库和分布式处理系统作为基底,对大型数据进行实时处理,并将将处理后的数据进行融合以形成交通信息,提高了交通信息的实时性、准确性和真实性。
另外,本发明提供的交通信息发布系统和方法,采用插件式数据捕获模块作为数据采集平台,易于扩展,且能够采集流式数据、文本数据、音频数据和视频图像数据等几类典型数据,适应性好。
具体实施方式
为了使本发明的目的、技术方案及优点更加清晰,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1和图2,图1为本发明提供的交通信息发布系统100的结构示意图,图2为本发明提供的交通信息发布系统100的原理示意图,交通信息发布系统100包括:数据捕获模块110、数据分类器模块120及数据融合器模块130。
数据捕获模块110用于采集多源交通信息数据。优选地,数据捕获模块110为插件式数据捕获模块,插件式数据捕获模块可根据不同数据源采集交通信息数据,交通信息数据包括套接字、文本、图像、语音或视频。可以理解,插件式数据捕获器,可根据不同数据源设计实时、半实时、延时的套接字、文本、图像、语音和视频等交通路况信息数据。
请参阅图3,为本发明提供的插件式数据捕获模块的结构示意图,包括:
数据网络套接字服务器子模块111包括套接字接收模块1111与字节流解析模块1112,套接字接收模块1111采集网络套接字字节流再由字节流解析模块解析1112后以文本或数据流的形式输出。数据网络套接字服务器子模块111可以 适用于实时轨迹数据的传播流通。
文件传输服务器子模块112包括文件服务器存储模块1121及文件服务器客户端传输模块1122,文件服务器存储模块1121输入网络文件再经文件服务器客户端传输模块1122输出文本文件或二进制文件。文件传输服务器子模块112可适用于批量数据上传。
网络爬虫服务器子模块113包含爬虫服务器采集模块1131及爬虫结果存储模块1132,爬虫服务器采集模块1131采集万维网上可以访问的交通信息网页并通过所述爬虫结果存储模块1132输出自定义规整格式信息。网络爬虫服务器子模块113可以适用于没有提供特定API的网页内容的信息采集。
API数据服务器子模块114包含API数据采集模块1141及采集结果存储模块1142,API数据采集模块1141采集外部服务器协议的API返回结果格式,通过采集结果存储模块1142输出文本数据的规整格式。API数据服务器子模块114可以适用于新浪微博、微信等提供公共API放问问接口的信息来源。
视频图像处理服务器子模块115包含视频图像流媒体处理服务器模块1151及视频图像多媒体文件存储服务器模块1152,视频图像流媒体处理服务器模块1151采集多媒体数据信息并转化为规整文本数据存储于视频图像多媒体文件存储服务器模块1152中。
音频识别处理服务器子模块116包括音频处理服务器模块1161和音频文件存储服务器模块1162,音频处理服务器子模块1161将音频信息转化为规整文本数据并存储于音频文件存储服务器模块1162中。
可以理解,插件式数据捕获模块,可任意自定义数据捕获子模块,结合分布式存储服务器设计可以轻易地横向扩展。
数据分类器模块120用于接收交通信息数据,并对交通信息数据进行预处理,同时将经预处理后的交通信息数据按空间属性和交通信息属性分类并输出。
请参阅图4,为本发明提供的数据分类器模块120的结构示意图,包括:
语义分析器子模块121用于接收交通信息数据,并将交通信息数据生成规整的文本数据并进行解析;数据预规整器子模块122用于解析后的数据进行二次规整;数据分类器子模块123用于将二次规整后的数据按空间属性和交通信息属性分类并输出。
其中,空间属性包括点、线和面之间的空间关系。具体地,空间关系包括:点与点之间的相邻、相离两种空间关系;点与线之间的相交、相邻、相离三种空间关系;点与面之间的包含、相邻、相离三种空间关系;线与线之间的相交、相邻、相离三种空间关系;线与面之间的包含、相交、相邻、相离四种空间关系;及面与面之间的包含、相交、相邻、相离四种空间关系。请参阅表1,为空间属性分类的九交模型表。
表1为空间属性分类的九交模型表
空间属性 |
点 |
线 |
面 |
点 |
相邻、相离 |
相交、相邻、相离 |
包含、相邻、相离 |
线 |
|
相交、相邻、相离 |
包含、相交、响铃、相离 |
面 |
|
|
包含、相交、相邻、相离 |
其中,交通信息属性包括连续变量和分类变量。请参阅表2,为本发明提供的交通信息属性的三交模型表。
表2为本发明提供的交通信息属性的三交模型表
信息属性 |
连续变量 |
分类变量 |
连续变量 |
线性、非线性模型 |
贝叶斯分类器 |
分类变量 |
|
决策树、贝叶斯分类器 |
可以理解,数据分类器子模块123用于将二次规整后的数据按上述空间属 性和交通信息属性分类并输出,从而得到分类后的数据。
数据融合器模块130用于接收数据分类器模块120输出的数据,并根据空间属性和交通信息属性对所述数据进行融合,以形成可以识别的交通路况信息数据,进行可视化显示。
请参阅图5为本发明提供的数据融合器模块的结构示意图,数据融合器模块130包括数据融合空间计算子模块131用于根据空间属性计算所述数据的空间关系。可以理解,根据上述空间属性可以得到数据的空间关系,具体如下:
(1)点与点:相邻、相离两种空间关系;
(2)点与线:相交、相邻、相离三种空间关系;
(3)点与面:包含、相邻、相离三种空间关系;
(4)线与线:相交、相邻、相离三种空间关系;
(5)线与面:包含、相交、相邻、相离四种空间关系;
(6)面与面:包含、相交、相邻、相离四种空间关系。
其中,相交包含、时为空间强作用,相邻时为缓冲区域空间弱作用,相交时为叠置区域空间强作用,相离时空间作用微弱可以忽略。
数据融合器模块130还包括数据融合分类器计算子模块132用于根据所述数据的交通信息属性进行数据分类融合。可以理解,交通信息属性分为连续变量和分类变量两大类。类中和类间融合策略如下:连续变量与连续变量:通过统计和拟合训练等方法建立线性与非线性模型;连续变量与分类变量:通过机器学习和数据挖掘方法建立分类器模型,如贝叶斯分类器;分类变量与分类变量:通过机器学习和数据挖掘方法建立分类器模型,如贝叶斯分类器与决策树分类器。可以理解,通过采用上述融合方法可以将数据的交通信息属性进行数据分类融合。
可以理解,数据融合结果为将交通信息分为两大类:一般性数据和指示性数据。一般性数据为交通状况的定量描述性数据,例如浮动车带有速度的GPS 定位数据就是一般性数据,因为这种数据可以通过均值计算转化为每条道路的平均速度数值。而天气状况也属于一般性数据,因为我们可以计算一些系数,用定量的降雨量数据去推算对道路平均速度的影响(例如,降雨量3mm时,受影响范围的所有道路平均行驶速度减少至平时的50%);指示性数据主要为交通状况定性描述性数据。如交通事故报告:X路与Y路交界处发生一起交通事故。这种是点状的定性的交通事故,在底层数据上会将道路与道路间的拓扑关系切断,道路导航时这两条道路会变成不互相连接的道路从而没有导航道路。还有一个例子是交警的封路,例如上周深圳马拉松,将深南大道封闭了,这是线状的定性描述,对底层数据上的影响是,这条路暂时从实时路况中被强制置为不可通行,平均速度为0。
一般性数据典型为道路的通畅程度,指示性数据为交通事故标识。输出数据包含空间属性和交通信息属性,供前端输出,用户可以根据一般性数据和指示性数据识别交通情况。
请参阅图6,为本发明提供的一种交通信息发布方法500,包括下述步骤:
步骤S510:采集多源交通信息数据;
步骤S520:接收交通信息数据,并对交通信息数据进行预处理,同时将经预处理后的所述交通信息数据按空间属性和交通信息属性分类并输出;及
步骤S530:接收数据分类器模块输出的数据,并根据空间属性和交通信息属性对数据进行融合,以形成可以识别的交通路况信息数据。
可以理解,上述交通信息发布方法500基于交通信息发布系统的各个模块功能实现的,在这里不再赘述。
本发明提供的交通信息发布系统和方法,通过数据捕获模块110采集多源交通信息数据,数据分类器模块120接收交通信息数据,并对交通信息数据进行预处理,同时将经预处理后的所述交通信息数据按空间属性和交通信息属性分类并输出,数据融合器模块130接收数据分类器模块输出的数据,并根据所述空间属性和交通信息属性对所述数据进行融合,以形成可以识别的交通路况 信息数据。本发明提供的交通信息发布系统和方法,利用了与交通信息相关的各种形态的数据,并以分布式数据库和分布式处理系统作为基底,对大型数据进行实时处理,并将将处理后的数据进行融合以形成交通信息,提高了交通信息的实时性、准确性和真实性。
另外,本发明提供的交通信息发布系统和方法,采用插件式数据捕获模块作为数据采集平台,易于扩展,且能够采集流式数据、文本数据、音频数据和视频图像数据等几类典型数据,适应性好。
可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术构思做出其他各种相应的改变与变形,而所有这些改变与变形都应属于本发明权利要求的保护范围。