基于云计算系统的数据采集与汇总分流的系统和方法
技术领域
本发明涉及计算机网络的数据采集系统,具体为一种基于云计算系统的数据采集与汇总分流的系统和方法。
背景技术
云计算(cloud computing),分布式计算技术的一种,其最基本的概念,是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。透过这项技术,网络服务提供者可以在数秒之内,达成处理数以千万计甚至亿计的信息,达到和“超级计算机”同样强大效能的网络服务。
一个基于云计算技术的计算机集群称为“云”。云计算具有以下特点:
(1)超大规模。“云”具有相当的规模,企业私有云一般拥有数百上千台服务器。“云”能赋予用户前所未有的计算能力;
(2)虚拟化。云计算支持用户在任意位置、使用各种终端获取应用服务。所请求的资源来自“云”,而不是固定的有形的实体。应用在“云”中某处运行,但实际上用户无需了解、也不用担心应用运行的具体位置;
(3)高可靠性。“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠;
(4)通用性。云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行;
(5)高可扩展性。“云”的规模可以动态伸缩,满足应用和用户规模增长的需要;
(6)极其廉价。由于“云”的特殊容错措施可以采用极其廉价的节点来构成云。
数据采集指从一个系统或者终端获取数据,并按照一定的格式存储进入另一个系统或者终端的过程。计算机科学中的数据采集根据终端和系统的不同可以进行不同划分,其中一种就是从异构的分散的数据库中采集数据,然后进行统一的数据管理和存储。在移动搜索中,需要采集大量的用户数据和移动环境数据。移动数据具有两个主要特点,分散化和海量性。分散化指移动数据存在于运营商的各种异构数据库中,且分散于各个数据中心。海量性是指由于时间的累积和用户的增长,移动用户的消费记录和无线环境数据都会呈现海量的特点。
各个结点采集的数据,可以通过定义统一的数据格式而达到分散数据整合的目的,云计算透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户的特点,可以将分散的移动数据整合到一个统一的平台上加以利用,这是其他计算模式无法提供的优点。对于单个结点采集到的海量数据,云计算通过自己的超大规模和高容错能力,更好的发挥整个系统的处理能力而不是单个结点的处理能力。
Mesh网络即“无线网格网络”,它是一个无线多跳网络,是由adhoc网络发展而来,是解决“最后一公里”问题的关键技术之一。在像下一代网络演进的过程中,无线是一个不可或缺的技术。无线mesh可以与其它网络协同通信。是一个动态的可以不断扩展的网络架构,任意的两个设备均可以保持无线互联。
Mesh WLAN网络要比单跳网络更加稳定,这是因为在数据通信中,网络性能的发挥并不是仅依靠某个节点。在传统的单跳无线网络中,如果固定的AP发生故障,那么该网络中所有的无线设备都不能进行通信。而在Mesh网络中,如果某个节点的AP发生故障,它可以重新再选择一个AP进行通信,数据仍然可以高速地到达目的地。从物理角度而言,无线通信意味着通信距离越短,通信的效果会越好。因为随着通信距离的增长,无线信号不但会衰弱而且会相互干扰,从而降低数据通信的效率。而在Mesh网络中,是以一条条较短的无线网络连接代替以往长距离的连接,从而保证数据可以以高速率在节点之间快速传递。Mesh技术可以使WLAN的安装部署,网络扩容更加方便。许多厂家都推出了功能丰富的Mesh产品,从而使部署大规模运营级无线城域网成为可能。(具体的Mesh技术表示可以参考相关厂家的技术文档。)比如:Strix开发了DMA协议(Strix Dynamic Mesh Architecture,动态mesh架构),使无线访问点具有自动配置网络,并使网络效率最优化的特性。提供自我组织,自我修复,更新动态网络连接,确保网络安全等等功能。
无线Mesh网络(无线网状网络)也称为“多跳(multi-hop)”网络,它是一种与传统无线网络完全不同的新型无线网络技术。在传统的无线局域网(WLAN)中,每个客户端均通过一条与AP相连的无线链路来访问网络,用户如果要进行相互通信的话,必须首先访问一个固定的接入点(AP),这种网络结构被称为单跳网络。而在无线Mesh网络中,任何无线设备节点都可以同时作为AP和路由器,网络中的每个节点都可以发送和接收信号,每个节点都可以与一个或者多个对等节点进行直接通信。
这种结构的最大好处在于:如果最近的AP由于流量过大而导致拥塞的话,那么数据可以自动重新路由到一个通信流量较小的邻近节点进行传输。依此类推,数据包还可以根据网络的情况,继续路由到与之最近的下一个节点进行传输,直到到达最终目的地为止。这样的访问方式就是多跳访问。
与传统的交换式网络相比,无线Mesh网络去掉了节点之间的布线需求,但仍具有分布式网络所提供的冗余机制和重新路由功能。在无线Mesh网络里,如果要添加新的设备,只需要简单地接上电源就可以了,它可以自动进行自我配置,并确定最佳的多跳传输路径。添加或移动设备时,网络能够自动发现拓扑变化,并自动调整通信路由,以获取最有效的传输路径。
目前,云计算虽然将计算工作分布到网络中的各个计算节点,但计算结果的管理以及应用服务的提供仍然需要管理中心承担,因此整个网络中的各个节点、网关节点以及管理中心之间的数据通道尤为重要,单个节点故障也许并不影响云计算网络的整体功能,但负责与管理中心连接的网关出现故障,则会导致分布计算、处理的数据结果无法汇总至管理中心,管理中心也就无法提供相关的应用服务。
其次,在传感网络中,即使具备自愈能力,但网络中的关键节点(例如网关节点)产生故障时,仍然会使网络的数据交互出现障碍,导致整个传感网络的应用失效。
此外,为了应对因为网关故障导致的数据传输失败,有的传感网络对数据进行了预处理,这就需要为传感器或传感节点增加数据处理和存储的模块,并对其进行应用功能开发和设定,这种方式将直接增加传感器或传感节点的开发和生产成本,从而增加了整个传感网络的建设成本,受制于开发和生产成本,传感器和传感节点的数据处理能力必然受限,通常只能进行简单的数据处理,无法完成复杂的运算。
由于传感网络的应用范围日益广泛,即便采用了数据预处理的方案,单纯靠传感器或传感节点自身的计算处理能力远远不足以满足实际应用,仍然需要大型数据处理中心或管理中心的支撑,因此数据预处理的方案并不能解决传感网络因关键节点(例如网关节点)产生故障而导致的数据传输障碍。
发明内容
本发明的目的是提供一种基于云计算系统的数据采集与汇总分流的系统和方法,使用模块化设计,分布式部署,即插即用,有效减少网络数据量和管理中心计算量,大大降低网络维护难度和部署成本。
本发明的技术方案为提供一种基于云计算系统的数据采集与汇总分流的系统,所述数据采集与汇总分流的系统包括扩展通信模块、分别部署在云计算系统主节点和从节点的主节点系统和从节点系统;
所述扩展通信模块用于组网和通信并且基于Mesh网络技术;
所述主节点系统包括:
处理模块:用于选择数据的处理方式;
智能分析决策模块:主要用于调用所述处理模块,生成针对从节点的预连接任务、预处理任务、预存储任务,提交给云计算辅助管理主节点模块;接收云计算辅助管理主节点模块的预连接反馈信息,包括预连接信息、预处理信息、预存储信息,根据该反馈信息生成数据采集任务,或者用户报告,提交云计算辅助管理主节点模块;
云计算辅助管理主节点模块:是主节点系统通过扩展通信模块与从节点系统的接口界面,并用于接收用户提交的数据采集任务,提交给智能分析决策模块,然后接受智能分析决策模块的任务输出,通过给扩展通信模块提交给从节点系统的云计算辅助管理从节点模块;
所述从节点系统包括:
前台连接模块:连接前台的各种异构数据库,并反馈前台连接信息;
数据处理模块:对采集的数据进行必要的处理;
数据存储模块:存储数据,反馈存储信息;
云计算辅助管理从节点模块:是从节点系统通过扩展通信模块与主节点系统的接口界面,用于接收云计算辅助管理主节点模块的预连接任务、预处理任务、预存储任务,数据采集任务,调用所述前台连接模块、数据处理模块、数据存储模块,并将各种反馈信息通过返回给云计算辅助管理主节点模块。
优选的,上述基于云计算系统的数据采集与汇总分流的系统,所述扩展通信模块包括GSM,GPRS,3G,4G,WIFI和有线连接通信方式。
优选的,上述基于云计算系统的数据采集与汇总分流的系统,所述Mesh网络采用802.11a/b/g/n标准。
本发明的另一技术方案为提供一种基于云计算系统的数据采集与汇总分流的方法,包括以下步骤:
步骤1:通过扩展通信模块与附近网络建立连接,云计算辅助管理主节点模块接收用户提交的一个数据采集请求,提交给智能分析决策模块;所述扩展通信模块用于组网和通信并且基于Mesh网络技术;
步骤2:智能分析决策模块调用处理模块,生成预连接任务输出到云计算辅助管理主节点模块;
步骤3:云计算辅助管理主节点模块将预连接任务通过扩展通信模块提交给从节点上的云计算辅助管理从节点模块;
步骤4:云计算辅助管理从节点模块调用前台连接模块,通过JDBC接口连接前台的各种异构数据库,并向云计算辅助管理从节点模块反馈前台连接信息;
步骤5:云计算辅助管理从节点模块将前台预连接反馈信息通过扩展通信模块返回给云计算辅助管理主节点模块,并最终反馈智能分析决策模块,智能分析决策模块根据反馈的信息进行分支判断选择:
如果反馈的预连接信息表示预连接任务执行成功,则由智能分析决策模块调用处理库模块,生成预处理任务输出到云计算辅助管理主节点模块;云计算辅助管理主节点模块通过通信扩展模块提交给从节点的云计算辅助管理从节点模块;云计算辅助管理从节点模块调用数据处理模块,根据前台预连接的信息为各种异构数据库的表生成相应的数据表格处理类和函数,对采集的数据进行必要的处理,包括数据格式转化、文本处理,并反馈数据处理信息,并向云计算辅助管理从节点模块反馈预处理信息;
否则,生成预连接失败信息,反馈用户;
步骤6:云计算辅助管理从节点模块将数据预处理反馈信息返回给云计算辅助管理主节点模块,并最终反馈智能分析决策模块,智能分析决策模块根据反馈的信息进行分支判断选择:
如果反馈的预处理信息表示数据预处理任务执行成功,生成预存储任务输出到云计算辅助管理主节点模块;云计算辅助管理主节点模块提交预处理任务给云计算辅助管理从节点模块;云计算辅助管理从节点模块调用数据存储模块,实现将经过预处理的数据存储到数据存储模块,或者通过JDBC接口存储到新建数据库中,并向云计算辅助管理从节点模块反馈后台预存储信息;
否则,生成预处理失败信息,反馈用户。
优选的,上述基于云计算系统的数据采集与汇总分流的方法,所述扩展通信模块包括GSM,GPRS,3G,4G,WIFI和有线连接通信方式。
优选的,上述基于云计算系统的数据采集与汇总分流的方法,所述Mesh网络采用802.11a/b/g/n标准。
与现有技术相比,本发明的优点在于:本发明提供的云计算节点采用模块化设计,嵌入式微架构,可根据实际应用范围增加或减少扩展功能模块,功能丰富,即插即用,可以网络中任意位置部署,降低网络搭建成本,大大降低网络维护难度,有效减少网络数据传输对通信链路的资源占用,降低管理中心的计算量,间接降低了网络搭建和管理中心架设的投入成本,如果网络中关键节点(例如网关节点)故障导致数据无法正常传输至管理中心,但因为数据在云计算节点已经进行了计算处理并保存结果,因此应用仍然有效,一旦关键节点恢复正常,计算结果仍可及时传输至管理中心以供展现,避免了因网络中关键节点(例如网关节点)的故障导致的应用功能失效。云计算节点可以覆盖一定的范围,因此在网络中部署时可视具体情况增加或减少云计算节点的数量,相比于为每个节点增强计算能力,大大降低了成本投入,云计算节点可以支持MESH网络,GSM,GPRS,3G,4G,WIFI和有线连接等通信方式。可同时支持多链路的工作请求。而且在无线Mesh网络中,任何无线设备节点都可以同时作为AP和路由器,网络中的每个节点都可以发送和接收信号,每个节点都可以与一个或者多个对等节点进行直接通信。如果某个节点的AP发生故障,它可以重新再选择一个AP进行通信,数据仍然可以高速地到达目的地。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明:
图1:本发明基于云计算系统的数据采集与汇总分流的系统结构示意图。
具体实施方式
为详细说明本发明的技术内容、构造特征、所实现目的及效果,以下结合实施方式并配合附图详予说明。
请参阅图1,本发明的一个实施例为提供的一种基于云计算系统的数据采集与汇总分流的系统所述数据采集与汇总分流的系统包括扩展通信模块、分别部署在云计算系统主节点和从节点的主节点系统和从节点系统;
所述扩展通信模块用于组网和通信并且基于Mesh网络技术;所述扩展通信模块包括GSM,GPRS,3G,4G,WIFI和有线连接通信方式。所述Mesh网络采用802.11a/b/g/n标准。
所述主节点系统包括:
处理模块:用于选择数据的处理方式,定义统一的数据格式,确定数据内容的筛选策略,生成数据处理任务化参数;生成数据处理任务输出;
智能分析决策模块:主要用于调用所述处理模块,用于选择后台存储的策略,生成预存储任务化参数,生成存储任务化参数;生成后台预存储任务输出;
分别生成针对从节点的预连接任务、预处理任务、预存储任务,提交给云计算辅助管理主节点模块;接收云计算辅助管理主节点模块的预连接反馈信息,包括预连接信息、预处理信息、预存储信息,根据该反馈信息生成数据采集任务,或者用户报告,提交云计算辅助管理主节点模块;
云计算辅助管理主节点模块:是主节点系统通过扩展通信模块与从节点系统的接口界面,并用于接收用户提交的数据采集任务,提交给智能分析决策模块,然后接受智能分析决策模块的任务输出,通过给扩展通信模块提交给从节点系统的云计算辅助管理从节点模块;
所述从节点系统包括:
前台连接模块:连接前台的各种异构数据库,并反馈前台连接信息;
数据处理模块:对采集的数据进行必要的处理;根据前台预连接的信息为各种异构数据库的表生成相应的数据表格处理类和函数,对采集的数据进行必要的处理,包括数据格式转化、文本处理,并反馈数据处理信息;
数据存储模块:存储数据,反馈存储信息;实现将经过预处理的数据,存储到云计算系统的文件系统中,或者通过JBDC接口存储到新建数据库中,并反馈存储信息;
云计算辅助管理从节点模块:是从节点系统通过扩展通信模块与主节点系统的接口界面,用于接收云计算辅助管理主节点模块的预连接任务、预处理任务、预存储任务,数据采集任务,调用所述前台连接模块、数据处理模块、数据存储模块,并将各种反馈信息通过返回给云计算辅助管理主节点模块。
本发明的又一实施例为提供一种基于云计算系统的数据采集与汇总分流的方法,包括以下步骤:
步骤1:通过扩展通信模块与附近网络建立连接,云计算辅助管理主节点模块接收用户提交的一个数据采集请求,提交给智能分析决策模块;所述扩展通信模块用于组网和通信并且基于Mesh网络技术;
步骤2:智能分析决策模块调用处理模块,生成预连接任务输出到云计算辅助管理主节点模块;
步骤3:云计算辅助管理主节点模块将预连接任务通过扩展通信模块提交给从节点上的云计算辅助管理从节点模块;
步骤4:云计算辅助管理从节点模块调用前台连接模块,通过JDBC接口连接前台的各种异构数据库,并向云计算辅助管理从节点模块反馈前台连接信息;
步骤5:云计算辅助管理从节点模块将前台预连接反馈信息通过扩展通信模块返回给云计算辅助管理主节点模块,并最终反馈智能分析决策模块,智能分析决策模块根据反馈的信息进行分支判断选择:
如果反馈的预连接信息表示预连接任务执行成功,则由智能分析决策模块调用处理库模块,生成预处理任务输出到云计算辅助管理主节点模块;云计算辅助管理主节点模块通过通信扩展模块提交给从节点的云计算辅助管理从节点模块;云计算辅助管理从节点模块调用数据处理模块,根据前台预连接的信息为各种异构数据库的表生成相应的数据表格处理类和函数,对采集的数据进行必要的处理,包括数据格式转化、文本处理,并反馈数据处理信息,并向云计算辅助管理从节点模块反馈预处理信息;
否则,生成预连接失败信息,反馈用户;
步骤6:云计算辅助管理从节点模块将数据预处理反馈信息返回给云计算辅助管理主节点模块,并最终反馈智能分析决策模块,智能分析决策模块根据反馈的信息进行分支判断选择:
如果反馈的预处理信息表示数据预处理任务执行成功,生成预存储任务输出到云计算辅助管理主节点模块;云计算辅助管理主节点模块提交预处理任务给云计算辅助管理从节点模块;云计算辅助管理从节点模块调用数据存储模块,实现将经过预处理的数据存储到数据存储模块,或者通过JDBC接口存储到新建数据库中,并向云计算辅助管理从节点模块反馈后台预存储信息;
否则,生成预处理失败信息,反馈用户。
本发明的实施例中,其中节点是指现有技术的移动节点、固定节点、网关节点以及各类传感节点,各个模块包括普通计算机,服务器或计算机群组、大型数据处理中心等。
各个节点通过扩展通信模块与附近的网络建立连接,入网后,各节点根据其内嵌的模块具备的功能向网内广播功能标识并开放链路。当工作节点需要数据计算和处理时,向网内链路发起请求。云计算节点收到请求后需验证合法性以及该请求是否属于其功能范围,验证通过则开始接收工作节点的初始数据并进行计算处理,之后按工作节点的要求返回计算结果或将计算结果经网关节点传输至管理中心。支持工作节点通过他工作节点的链路发起数据计算处理的请求。如果网关节点出现故障,则云计算节点会将计算结果暂存本地,并在网关节点恢复正常后将计算结果再传输给管理中心。
本发明以一个主节点和若干个从节点组网工作的方式来说明流程,但在实际应用中,从至少一个主节点和若干个从节点组网工作,到多个主节点和若干个从节点组网工作都在本发明的应用实例范围。
本发明实施例中可由手机等数据采集终端将采集到的数据发送给路由节点,路由节点将接收到的数据通过网关发送给主节点系统,当网关发生故障,不能接收数据并将其发送给主节点系统,这时,云备用链路节点被唤醒,云备用链接节点通过与其链接的路由节点接收数据并将其暂时存储。
云计算系统的文件系统、各种参数配置,以及基于云计算的后台存储数据库都是云计算系统固有特性,本系统在实现中可以加以利用。同时,本系统由于下面的决策是以上面的决策正确为前提的,上面的决策正确获取的参数,又可以作为下面决策的参考的依据,这样不仅可以保证决策的逻辑顺序,同时可以大大提高决策的质量和正确,保证系统最后产生的决策结果是可以在系统上运行的。就大大提高系统的智能化水平和成功率,减少不必要的操作失误和系统盲区导致的低效问题。由于云计算是现有的技术并且有统一的技术规范,本发明仅就系统进行阐述,其他具体实现的技术细节,不再赘述。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。