CN202093513U - 大批量数据处理系统 - Google Patents

大批量数据处理系统 Download PDF

Info

Publication number
CN202093513U
CN202093513U CN2011200892424U CN201120089242U CN202093513U CN 202093513 U CN202093513 U CN 202093513U CN 2011200892424 U CN2011200892424 U CN 2011200892424U CN 201120089242 U CN201120089242 U CN 201120089242U CN 202093513 U CN202093513 U CN 202093513U
Authority
CN
China
Prior art keywords
data
quotation
storage
result
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN2011200892424U
Other languages
English (en)
Inventor
吕杰
徐博
马文杰
邵一飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN2011200892424U priority Critical patent/CN202093513U/zh
Application granted granted Critical
Publication of CN202093513U publication Critical patent/CN202093513U/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本实用新型公开了一种大批量数据处理系统,包括:缓存装置,其临时存储来自外部数据源的原始数据和经过数据处理装置处理的数据结果;数据处理装置,对原始数据进行处理,得到数据结果;检测装置,根据缓存装置中原始数据的数据量,动态调整数据处理装置中数据处理单元数量,并根据系统的资源使用情况选择通过存储装置存储或者通过排水装置存储;排水装置,在系统资源繁忙时暂时保存原始数据和数据结果,在系统资源空闲时再将其保存的原始数据和数据结果同步到存储装置中;存储装置,持久性存储所述原始数据和数据结果。本实用新型克服了现有数据处理系统在处理大批量信息时效率低下,稳定性差,可能会导致内存溢出、系统崩溃等缺陷。

Description

大批量数据处理系统
技术领域
本实用新型涉及数据处理技术领域,特别涉及一种大批量数据处理系统。
背景技术
银行业内现有的外汇及利率报价系统为了保证报价业务的可追溯性,需要保证原始报价数据及处理后结果数据的完整性。即需要存储从外部报价源接收的原始报价和系统处理后的报价结果。现有的外汇报价系统在处理报价信息时,通常采用如下流程:接收外部报价源的报价数据,将原始报价存储到数据库中,对某一时间段内的原始报价进行风险过滤、加工处理后报送给报价使用方,最后将报价结果存储到数据库中。
上述报价处理方法在订阅的报价信息较少,报价波动不频繁的情况下,可以运转得很好。但是在市场波动频繁,单位时间内接收到大量报价数据的情况下,由于数据库的输入输出(IO)速度远低于CPU的处理速度,报价存储速度的限制会导致报价处理时间延长,报价时效性变差,所报价格无法正常反映出市场的真实价格波动。同时也使得CPU利用率变低。在极端情况下,大量待存储的原始报价及待存储的报价结果淤积在内存中,可能会导致内存溢出,进而引起系统崩溃。
如图6所示,直观地展示了现有的一个报价系统(采用上述报价处理方法设计)在面临大量报价信息时,系统内存的使用情况。从图中可以看出,所占用内存量直线上升,系统稳定性存在隐患。
实用新型内容
为了克服现有技术的上述缺陷,本实用新型提供了一种大批量数据处理系统,通过将数据信息的存储从同步修改为异步,提升了CPU的使用率。
本实用新型的大批量数据处理系统包括:缓存装置,与系统中其它各装置连接,其临时存储来自外部数据源的原始数据和经过数据处理装置处理的数据结果;数据处理装置,与检测装置和缓存装置连接,其对原始数据进行处理,得到数据结果;检测装置,与缓存装置、数据处理装置、排水装置以及存储装置连接,其根据缓存装置中原始数据的数据量,动态调整数据处理装置中数据处理单元数量,以及根据系统的资源使用情况选择通过存储装置存储或者通过排水装置存储;排水装置,与存储装置、缓存装置和检测装置连接,其在系统资源繁忙时暂时保存原始数据和数据结果,在系统资源空闲时再将其保存的原始数据和数据结果同步到存储装置中,进而保证数据的完整性;存储装置,与缓存装置、检测装置以及排水装置连接,其持久性存储所述原始数据和数据结果。
优选地,所述原始数据是原始报价信息,所述数据结果是报价结果。
优选地,缓存装置是高速存储装置,进一步包括:原始数据缓存单元,用于临时存储来自外部报价源的原始报价,原始报价以队列的形式存储并可以被数据处理装置启动的一个或者多个数据处理单元处理;数据结果缓存单元,用于临时存储经数据处理装置加工处理的报价结果。
优选地,所述检测装置进一步包括:数据处理检测单元,用于检测缓存装置中原始数据缓存单元的原始报价的数量,根据报价数量动态分配数据处理单元;原始数据存储检测单元,用于监控原始数据缓存单元中原始报价增长与其存储处理的速度差值,如果超出了设置的阈值,则启动排水装置进行排水操作;数据结果存储检测单元,用于监控数据结果缓存单元中报价结果增长与其存储处理的速度差值,如果超出了设置的阈值,则启动排水装置进行排水操作。
优选地,排水装置进一步包括:原始数据排水单元,用于在存储装置的存储速度无法满足原始报价的存储速度要求时,对原始报价进行临时存储;数据结果排水单元,用于在存储装置的存储速度无法满足报价结果的存储要求时,对报价结果进行临时存储;排水同步单元,用于在外部数据源的报价不频繁,原始报价或报价结果存储操作不繁忙时,将排水装置中原始数据排水单元和数据结果排水单元存储的原始报价和报价结果同步到存储装置。
优选地,上述系统还包括:数据接收装置,用于从外部的一个或者多个数据源获取原始报价,并缓存到缓存装置;数据发送装置,用于从缓存装置中数据结果缓存单元获取报价结果并提供给报价使用方。
优选地,所述数据处理装置进一步包括:数据处理单元,用于对原始报价进行处理,将处理后的报价结果临时存储在缓存装置的数据结果缓存单元。
优选地,原始报价处理包括报价筛选、报价解析及报价组装,其中报价筛选采用基于方差区间的报价筛选算法,比较前后两个报价的方差值,自动将超出方差区间参数的报价筛除,报价解析是从原始报价中提出有用信息并加工成报价元素的过程,报价元素是一个由id和value组成的数据结构,报价组装是将报价元素通过计算处理得到最终报价结果的过程。
利用本实用新型的大批量数据处理系统,在面临外部数据源的大批量数据信息时,通过内置的缓存装置,使数据信息的存储从同步变为异步,最大限度地降低了数据存储对数据处理效率的影响,减少了数据处理的延迟;通过检测装置中支持的动态选择存储策略,排水装置的排水处理,保证数据的有效存储。
本实用新型克服了现有数据处理系统在处理大批量信息时效率低下,稳定性差,可能会导致内存溢出、系统崩溃等缺陷。
附图说明
图1为本实用新型大批量数据处理系统的结构框图;
图2为本实用新型缓存装置的结构框图;
图3为本实用新型数据处理装置的结构框图;
图4为本实用新型检测装置的结构框图;
图5为本实用新型排水装置的结构框图;
图6为现有技术中报价系统的内存使用情况示意图;
图7为本实用新型大批量数据处理系统在处理报价数据时的内存使用情况示意图。
具体实施方式
为使本实用新型的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本实用新型进一步详细说明。
图1为本实用新型的大批量数据处理系统的结构框图。
如图1所示,该系统包括数据接收装置1、缓存装置2、数据发送装置3、数据处理装置4、检测装置5、存储装置6和排水装置7,其中缓存装置2与其他各装置分别连接,另外,排水装置7与检测装置5和存储装置6分别连接。
在本实用新型中,被处理的数据优选为报价信息,例如外汇及利率报价信息,在下面的描述中,将以报价信息为例进行详细说明。
数据接收装置1用于从外部的一个或者多个数据源获取原始报价,并缓存到缓存装置2中。
缓存装置2可以是一种高速存储装置,例如系统内存的一块区域。缓存装置2用于临时存储从数据接收装置1获取的外部数据源的原始报价和经过数据处理装置4处理的报价结果。
图2为本实用新型缓存装置2的结构框图。
如图2所示,缓存装置2包括2个逻辑单元:原始数据缓存单元21和数据结果缓存单元22。原始数据缓存单元21用于临时存储从数据接收装置1获取的外部数据源的原始报价,原始报价可以以队列的形式存储并可以被数据处理装置4启动的一个或者多个数据处理单元处理。数据结果缓存单元22用于临时存储经数据处理装置4加工处理的报价结果。
数据发送装置3用于从缓存装置2中数据结果缓存单元22获取报价结果并提供给报价使用方。
如图3所示,数据处理装置4包括数据处理单元41,用于对原始报价进行加工处理,加工后的报价结果临时存储在缓存装置2中数据结果缓存单元22。原始报价加工处理包括报价筛选、报价解析及报价组装等步骤。报价筛选采用基于方差区间的报价筛选算法,比较前后两个报价的方差值,由系统自动将超出方差区间参数的报价筛除;报价解析是从原始报价中提出有用信息并加工成报价元素的过程,报价元素是一个由id和value组成的数据结构;报价组装是根据业内定义的报价产品如美元对人民币,将报价元素通过例如加减点差等计算加工出最终报价结果的过程。
图4为本实用新型检测装置5的结构框图。
检测装置5可以根据缓存装置中原始报价数据量,动态调整报价处理装置中报价处理单元及存储装置中存储单元的数量,并可以在报价存储时,根据系统的资源使用情况选择通过存储装置存储或者通过排水装置存储,其包括数据处理检测单元51、原始数据存储检测单元52和数据结果存储检测单元53三个逻辑单元。
数据处理检测单元51用于检测缓存装置2中原始数据缓存单元21的原始报价的数量,根据报价数量动态分配数据处理单元。原始数据存储检测单元52用于监控原始数据缓存单元21中原始报价增长与其存储处理的速度差值,如果超出了设置的阈值,则启动排水装置7中原始数据排水单元71进行排水操作。数据结果存储检测单元53用于监控数据结果缓存单元22中报价结果增长与其存储处理的速度差值,如果超出了设置的阈值,则启动排水装置7中数据结果排水单元72进行排水操作。
存储装置6是一个持久化、结构化的数据存储装置,在本实用新型中可以是一个数据库,用于保存缓存装置2中的原始数据缓存单元21的原始报价和数据结果缓存单元22的报价结果。
排水装置7包含一个或多个用于排水的高速持久存储装置,可以是一个文件系统,并提供一种快速存储的机制及算法,不仅限于本实用新型中提及的排水算法,排水装置7还包括一个排水同步单元73,用于将排水装置7中存储的原始报价和报价结果同步到存储装置6,进而保证数据的完整性。排水装置7在存储时采用高速、稳定的排水算法,排水算法的基本原理是当水库中的水快速增长时,水库的阀门需要以加速度的形式打开,保证水库中的水快速排出。原始数据缓存单元21或数据结果单元22好比一个水库,原始报价或报价结果好比水库中的水,原始数据排水单元或数据结果排水单元好比水库的阀门,当原始报价或报价结果快速增长时,排水算法以2n为一个批次分配排水单元进行排水。排水算法中基于指数的分配调度策略可以在排水速度与资源利用之间达到平衡,一方面基于指数方式分配排水单元的方式可以减少资源占用,另一方面批量排水可以提高排水效率。
图5为本实用新型排水装置7的结构框图。
排水装置7用于在系统资源繁忙时暂时保存原始报价和报价结果,在系统资源空闲时再将其保存的原始报价和报价结果同步到存储装置中,进而保证数据的完整性,其包括原始数据排水单元71、数据结果排水单元72和排水同步单元73。
原始数据排水单元71用于在存储装置6的存储速度无法满足原始报价的存储速度要求时,对原始报价进行临时存储,存储时分配的排水处理单元基于排水算法调度。数据结果排水单元72用于在存储装置6的存储速度无法满足报价结果的存储要求时,对报价结果进行临时存储。排水同步单元73用于在外部数据源的报价不频繁,原始报价或报价结果存储操作不繁忙时,将排水装置7中原始数据排水单元71和数据结果排水单元72存储的原始报价和报价结果同步到存储装置6。
本实用新型提供的一种大批量数据处理系统,使得报价系统在面临大批量报价信息时,能够稳定、高效地完成报价信息的处理、存储、发送工作。其优点总结如下:
利用本实用新型的系统,降低了报价存储对报价效率的影响,提升了CPU的使用率。本实用新型通过增加缓存装置,把报价信息的存储从同步修改为异步。这样一来,报价存储步骤就可以从整个报价主流程中剥离,报价信息的加工处理完全在高速缓存装置中运行,最大限度地降低了报价存储对报价效率的影响,提升了CPU的使用率。
另外,利用本实用新型的系统,提高了系统在压力下运行的稳定性及可靠性。系统在面临大批量报价的时候,通过检测装置的检测结果,支持动态选择存储策略;借助排水装置,可以有效缓冲短时间内对系统内存的压力,保证系统的稳定运行。
参照图7,直观地展示了采用本实用新型的报价系统在面临大批量报价信息时,系统内存的使用情况。从图中可以看出,内存使用相对平稳,没有大幅波动。
以上所述的具体实施例,对本实用新型的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本实用新型的具体实施例而已,并不用于限制本实用新型,凡在本实用新型的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。

Claims (6)

1.一种大批量数据处理系统,该系统包括:
缓存装置(2),与系统中其它各装置连接,其临时存储来自外部数据源的原始数据和经过数据处理装置处理的数据结果;
数据处理装置(4),与检测装置和缓存装置连接,其对原始数据进行处理,得到数据结果;
检测装置(5),与缓存装置、数据处理装置、排水装置以及存储装置连接,其根据缓存装置中原始数据的数据量,动态调整数据处理装置中数据处理单元数量,以及根据系统的资源使用情况选择通过存储装置存储或者通过排水装置存储;
排水装置(7),与存储装置、缓存装置和检测装置连接,其在系统资源繁忙时暂时保存原始数据和数据结果,在系统资源空闲时再将其保存的原始数据和数据结果同步到存储装置(6)中,进而保证数据的完整性;以及
存储装置(6),与缓存装置、检测装置以及排水装置连接,其持久性存储所述原始数据和数据结果。
2.根据权利要求1所述的系统,其特征在于,缓存装置(2)是高速存储装置,进一步包括:
原始数据缓存单元(21),临时存储来自外部报价源的原始报价,原始报价以队列的形式存储并可以被数据处理装置(4)启动的一个或者多个数据处理单元处理;
数据结果缓存单元(22),临时存储经数据处理装置4加工处理的报价结果。
3.根据权利要求2所述的系统,其特征在于,检测装置(5)进一步包括:
数据处理检测单元(51),检测缓存装置(2)中原始数据缓存单元(21)的原始报价的数量,根据报价数量动态分配数据处理单元; 
原始数据存储检测单元(52),监控原始数据缓存单元(21)中原始报价增长与其存储处理的速度差值,如果超出了设置的阈值,则启动排水装置(7)进行排水操作;
数据结果存储检测单元(53),监控数据结果缓存单元(22)中报价结果增长与其存储处理的速度差值,如果超出了设置的阈值,则启动排水装置(7)进行排水操作。
4.根据权利要求3所述的系统,其特征在于,排水装置(7)进一步包括:
原始数据排水单元(71),在存储装置(6)的存储速度无法满足原始报价的存储速度要求时,对原始报价进行临时存储;
数据结果排水单元(72),在存储装置(6)的存储速度无法满足报价结果的存储要求时,对报价结果进行临时存储。
排水同步单元(73),在外部数据源的报价不频繁,原始报价或报价结果存储操作不繁忙时,将排水装置(7)中原始数据排水单元(71)和数据结果排水单元(72)存储的原始报价和报价结果同步到存储装置(6)。
5.根据权利要求2~4任一项所述的系统,其特征在于,该系统还包括:
数据接收装置(1),从外部的一个或者多个数据源获取原始报价,并缓存到缓存装置(2);
数据发送装置(3),其从缓存装置(2)中数据结果缓存单元(22)获取报价结果并提供给报价使用方。
6.根据权利要求5所述的系统,其特征在于,所述数据处理装置(4)进一步包括:
数据处理单元(41),其对原始报价进行处理,将处理后的报价结果临时存储在缓存装置(2)的数据结果缓存单元(22)。 
CN2011200892424U 2011-03-30 2011-03-30 大批量数据处理系统 Expired - Lifetime CN202093513U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011200892424U CN202093513U (zh) 2011-03-30 2011-03-30 大批量数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011200892424U CN202093513U (zh) 2011-03-30 2011-03-30 大批量数据处理系统

Publications (1)

Publication Number Publication Date
CN202093513U true CN202093513U (zh) 2011-12-28

Family

ID=45368567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011200892424U Expired - Lifetime CN202093513U (zh) 2011-03-30 2011-03-30 大批量数据处理系统

Country Status (1)

Country Link
CN (1) CN202093513U (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156722A (zh) * 2011-03-30 2011-08-17 中国工商银行股份有限公司 一种大批量数据处理系统及方法
CN102693164A (zh) * 2012-05-03 2012-09-26 中国石油集团川庆钻探工程有限公司地球物理勘探公司 防止缓存溢出的设备和方法
CN109309603A (zh) * 2018-11-02 2019-02-05 华青融天(北京)软件股份有限公司 一种动态的负载均衡分配方法及装置
CN111104399A (zh) * 2019-12-19 2020-05-05 国网安徽省电力有限公司信息通信分公司 一种海量电网数据管理存储系统
CN112437152A (zh) * 2020-11-20 2021-03-02 北京百度网讯科技有限公司 崩溃处理方法、装置、电子设备和存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156722A (zh) * 2011-03-30 2011-08-17 中国工商银行股份有限公司 一种大批量数据处理系统及方法
CN102156722B (zh) * 2011-03-30 2014-04-09 中国工商银行股份有限公司 一种大批量数据处理系统及方法
CN102693164A (zh) * 2012-05-03 2012-09-26 中国石油集团川庆钻探工程有限公司地球物理勘探公司 防止缓存溢出的设备和方法
CN102693164B (zh) * 2012-05-03 2014-09-17 中国石油集团川庆钻探工程有限公司地球物理勘探公司 防止缓存溢出的设备和方法
CN109309603A (zh) * 2018-11-02 2019-02-05 华青融天(北京)软件股份有限公司 一种动态的负载均衡分配方法及装置
CN111104399A (zh) * 2019-12-19 2020-05-05 国网安徽省电力有限公司信息通信分公司 一种海量电网数据管理存储系统
CN112437152A (zh) * 2020-11-20 2021-03-02 北京百度网讯科技有限公司 崩溃处理方法、装置、电子设备和存储介质
CN112437152B (zh) * 2020-11-20 2022-05-17 北京百度网讯科技有限公司 崩溃处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN102156722B (zh) 一种大批量数据处理系统及方法
CN202093513U (zh) 大批量数据处理系统
JP5744707B2 (ja) メモリ使用量照会ガバナのためのコンピュータ実装方法、コンピュータ・プログラム、およびシステム(メモリ使用量照会ガバナ)
CN109508432B (zh) 一种基于区块链的高性能faas系统
CN103699660B (zh) 一种大规模网络流式数据缓存写入的方法
CN105378716B (zh) 一种数据存储格式的转换方法及装置
CN101695034B (zh) 一种web服务监控参数的调整装置和方法
CN104038392A (zh) 一种云计算资源服务质量评估方法
CN103345514A (zh) 大数据环境下的流式数据处理方法
CN106569733A (zh) 缓存数据的处理方法和装置
CN110661668A (zh) 一种消息发送管理方法及装置
CN111198754B (zh) 一种任务调度方法及装置
CN106776025A (zh) 一种计算机集群作业调度方法及其装置
CN105516024A (zh) 一种基于队列的任务流量监控方法及系统
CN111796770B (zh) 日志路由负载均衡实现方法及装置
CN103945005A (zh) 基于多评价指标的动态负载均衡框架
CN105554069B (zh) 一种大数据处理分布式缓存系统及其方法
CN109040156B (zh) 一种基于容器云的软负载资源处理方法及装置
WO2019183781A1 (zh) 一种数据处理方法及网络设备
US20080276045A1 (en) Apparatus and Method for Dynamic Cache Management
CN107861820A (zh) 一种虚拟机资源分配方法及系统
CN104360961A (zh) 一种基于对象存储的自适应分级处理方法及系统
CN109582460B (zh) 一种Redis内存数据的淘汰方法和装置
CN111124439A (zh) 一种云边协同的智能动态卸载算法
CN110413540A (zh) 一种fpga数据缓存的方法、系统、设备及存储介质

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20111228

CX01 Expiry of patent term