CN102737127A - 一种海量数据存储方法 - Google Patents

一种海量数据存储方法 Download PDF

Info

Publication number
CN102737127A
CN102737127A CN2012102041238A CN201210204123A CN102737127A CN 102737127 A CN102737127 A CN 102737127A CN 2012102041238 A CN2012102041238 A CN 2012102041238A CN 201210204123 A CN201210204123 A CN 201210204123A CN 102737127 A CN102737127 A CN 102737127A
Authority
CN
China
Prior art keywords
data
memory database
database server
hash
backup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102041238A
Other languages
English (en)
Other versions
CN102737127B (zh
Inventor
林蔚
林凡
黄文林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
XIAMEN JUHAIYUAN INTERNET OF THINGS NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XIAMEN JUHAIYUAN INTERNET OF THINGS NETWORK TECHNOLOGY Co Ltd filed Critical XIAMEN JUHAIYUAN INTERNET OF THINGS NETWORK TECHNOLOGY Co Ltd
Priority to CN201210204123.8A priority Critical patent/CN102737127B/zh
Publication of CN102737127A publication Critical patent/CN102737127A/zh
Application granted granted Critical
Publication of CN102737127B publication Critical patent/CN102737127B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及计算机数据存储技术领域。本发明一种海量数据存储方法,其包括以下步骤:步骤1:得到目前活动的内存数据库服务器列表;步骤2:把需要待存储的数据整理为数据库可以存储的格式,并将其映射到环形的Hash空间上,其中上述数据同时包含数据来源的主机IP地址以及目标内存数据库服务器的IP地址;步骤3:把内存数据库服务器的IP地址映射到环形的Hash空间上;步骤4:建立两个数据库与数据库的散列位置建立映射数组,也即一台数据库服务器的各虚拟服务器散列位置存储数组,得到数据、虚拟数据库与实际数据库的映射关系,并对待存储的逐条数据进行存储。本发明应用于海量数据的即时存储。

Description

一种海量数据存储方法
技术领域
本发明涉及计算机数据存储技术领域,具体涉及一种基于分布式哈希表DHT与内存数据库存储相结合的海量数据存储方法。
背景技术
近年来,“电梯惊魂事件”在各大一线城市频繁上演,北京、深圳、上海、广州等城市电梯死亡、伤人事故报道不断,成为继食品危机之后又一触及百姓神经的重大敏感事件,为了有效防范和坚决遏制电梯事故发生,电梯安全管理平台应运而生。电梯安全管理平台主要实现对电梯运行远程动态检测、故障诊断和记录,可以通过视频实时了解电梯的运行情况,在电梯出现关人、冲顶、沉底等故障时,第一时间获悉并及时采取措施,而且对于电梯的检验、维保等状况,政府部门能够实时掌握,可以及时敦促有关方面落实责任,达到技术监管的目的,同时,通过对电梯运行状况的数据处理,还能掌握不同品牌、不同地点电梯的安全运行与质量状况,起到预警、分析、处理的作用。
在市场和政府政策的推动下,以区、市为单位的大型的电梯安全管理平台的概念的提出,在理论上保障了区、市领导能够在发生事故时第一时间掌握信息、第一时间发出指令、第一时间实施救援、第一时间调查处理。但是在实际研发中,由于区、市为单位的大型的电梯安全管理平台具有海量的数据,每天具有几十万甚至上亿条的数据记录,对现有的数据库的稳定性和扩展性带来极大的挑战。
现有的数据存储策略是将数据保存到硬盘上,再进行读取,一般是处理永久、稳定的数据。例如专利申请号为CN200810216695.1的发明,提供一种海量数据存储方法,采用文件服务器来管理海量文件数据,具体存储的时候,首先读取DICOM图像文件,根据其中特定的数据元素,对所述DICOM图像文件进行存储,包括步骤:A1、建立树结构目录的根目录;A2、求取所述DICOM图像文件中的一种唯一性标识的Hash值,建立以所述Hash值命名的第一级子结点目录;A3、以所述DICOM图像文件中的SOP Instance UID命名所述DICOM图像文件,将所述DICOM图像文件存储于第一级子结点目录中。上述数据存储方法虽然在处理海量数据时具有良好的稳定性,但其同样强调维护数据的完整性、一致性,但很难顾及有关数据及其处理的定时限制,不能满足电梯报警在实际应用中的实时性的需要。
再例如,专利申请号为CN201010246288.2的发明,提供了一种支持海量存储的内存数据库方法,使用内存数据库来管理海量数据,并且改进了当物理数据库有大量的数据需加载到内存时,会存在内存不足的情况,具体方案包括:一个内存数据库将用户要访问且不在内存数据库中的记录从一个物理数据库载入,当内存数据库使用内存达到上限时,定时清除内存数据库中使用机率低于设定值的记录。
上述方案在一定程度上解决了数据存储的时限性问题,但是该方案把大量的数据全部加载到内存中,这对服务器的硬件要求非常高,普通企业很难承受。
发明内容
本发明所要解决的技术问题是提供一种海量数据存储方法,基于分布式哈希表DHT与内存数据库存储相结合的方案,解决以区、市为单位的大型的电梯安全管理平台的海量数据的存储的即时性问题。
为了解决上述技术问题,本发明所采用的思路是,为每台待监控的电梯配备数据采集主机,以区、市为单位的大型的电梯安全管理平台安装于监控中心,该数据采集主机负责将数据传输至监控中心的内存数据库服务器集群。内存数据库服务器集群是由多台内存数据库服务器组成,这多台内存数据库服务器采用无主模式(没有一个集中管理的内存数据库服务器),来实现大规模内存存储。
一种海量数据存储方法,包括以下步骤:
步骤1:得到目前活动的内存数据库服务器列表;其具体包括:
步骤11:在数据采集主机上建立活动的(目前正常工作的)内存数据库服务器的IP地址表,并通过“心跳检测”程序定期向各内存数据库服务器发送心跳检测信号;各内存数据库服务器通过“心跳响应”程序对数据采集主机发送的心跳检测信号向数据采集主机发送响应信号;
步骤12:数据采集主机判断各内存数据库服务器对心跳检测信号进行响应的时间,如果一内存数据库服务器没有在规定时间响应,则认为该内存数据库服务器已下线,则从IP地址表中删除该内存数据库服务器;数据采集主机如果重新收到已下线的内存数据库服务器的响应信号,则向IP地址表中插入该内存数据库服务器的IP地址;
通过上述方式,实时更新数据采集主机上的IP地址表,从而得到目前活动的内存数据库服务器列表。
步骤2:把待存储的数据整理为Key-Value的Hash字符串值索引格式,存储于关系数据库和Hash数据表中,并将其映射到环形的Hash空间上;所述待存储的数据包含数据来源的数据采集主机IP地址以及目标内存数据库服务器的IP地址;
步骤3:把内存数据库服务器的IP地址映射到环形的Hash空间上:
步骤4:建立内存数据库服务器上的内存数据库与Hash键值的对应映射数组PositionToDB,也即每台内存数据库服务器对应的各组Hash键值的存储映射关系,以及内存数据库服务器的各虚拟服务器的虚拟数据库的散列位置存储数组DBtoPosition,从而得到数据、虚拟数据库与实际数据库的映射关系,并进行数据存储,具体存储过程包括:
步骤41:当某条数据要存储到内存数据库的时候,首先对该数据的关键字进行Hash,得到Key;
步骤42:根据步骤41得到的Key,搜索内存数据库与Hash键值的对应映射数组PositionToDB(即Hash键值映射到数据库节点的对照表,相当于确定将hash数据存储到哪一个内存数据库服务器节点上)的索引值,当搜索到某个索引值≥该Key时,则停止搜索,并存储该索引值;否则把该数组中的第一个索引值当作所要查找的索引值;
步骤43:根据步骤42找到的索引值,依据数据、虚拟数据库与实际数据库的映射关系,得到内存数据库的服务器IP地址,并把该条数据发送给该内存数据库,对应的内存数据库接收并存储。
进一步的,本发明的海量数据存储方法还包括:
步骤5:数据备份,其具体包括:为保证数据存取的实时性,本方案中数据备份采用异步方式,数据采集主机在发送数据的时候,如果预设的备份数量超过预设值,则从环形的Hash空间中查找后继的内存数据库,也即从内存数据库与Hash键值的对应映射数组PositionToDB中查找后继的内存数据库,同时要确保查找到的内存数据库与先前备份的内存数据库实际属于不同的内存数据库,以保证备份被保存在不同的内存数据库服务器上,内存数据库服务器在收到数据后,首先存储数据,然后再按照数据采集主机提供的后继的内存数据库所在的内存数据库服务器的IP地址,直接将该数据复制到该内存数据库里。
进一步的,对于上述步骤5的数据备份,其存取策略是:由于数据备份采用异步方式进行,因此,备份数据可能存在不一致的情况,为克服数据不一致的缺陷,对于步骤5的数据备份,对备份数据的存取采用NWR规则,即:做N个备份;写入至少W份才认为备份成功;读备份数据的时候,至少读取R个备份才认为读到的数据是一致的;其中W+R>N。
进一步的,本发明的海量数据存储方法还包括异常情况处理,当数据采集主机判断出现内存数据库服务器宕机情况,进行以下处理:
第一,根据数据采集主机上存储的IP地址表,找到宕机的内存数据库服务器的IP地址,根据该IP地址的Hash值删除数组PositionToDB与DBToPosition中对应的内容,其中,PositionToDB是内存数据库与Hash键值的对应映射数组,DBToPosition是内存数据库服务器的各虚拟服务器散列位置的存储数组;
第二,由于数据备份存储在内存数据库服务器集群的不同的内存数据库服务器上,故根据数据来源的数据采集主机的IP地址与目标内存数据库服务器的IP地址,将缺失的数据从其他正常工作的内存数据库服务器上获取。
当数据采集主机判断有新的内存数据库服务器时,进行以下处理:
第一,将新增的内存数据库服务器映射到环形的Hash空间,根据Hash值往数组PositionToDB与DBToPosition中增加相应的元素,并确保PositionToDB 索引是有序的;
第二,根据数组PositionToDB查找到该数据库后继内存数据库,查找满足“后继内存数据库的移动索引值小于等于新内存数据库Hash值”条件的数据,移动到新的内存数据库上。
本发明采用上述方法,具有以下优点:
1. 本发明基于分布式哈希表DHT与内存数据库存储相结合的方案,应用于以区、市为单位的大型的电梯安全管理平台,解决了其海量数据的存储的即时性问题;
2. 本发明提供的存储方法同时具备数据备份功能,该数据备份采用异步方式进行,不影响数据存储的即时性;且采用NWR规则,防止了备份的数据与原数据可能存在不一致的情况;
3. 本发明还包括异常情况处理,在出现内存数据库服务器宕机的情况下进行自我修复。
附图说明
图1是本发明的实施例的系统架构示意图;
图2是本发明的实施例的步骤2的示意图;
图3是本发明的实施例的步骤3的示意图;
图4是本发明的实施例的步骤4的示意图。
具体实施方式
现结合附图和具体实施方式对本发明进一步说明。
现以应用于以区、市为单位的大型的电梯安全管理平台的海量数据存储为例来阐述本发明的具体实施。
如图1所示,首先为每台待监控的电梯配备数据采集主机,以区、市为单位的大型的电梯安全管理平台安装于监控中心,该数据采集主机负责将数据传输至监控中心的内存数据库服务器集群。内存数据库服务器集群是由多台内存数据库服务器组成,这多台内存数据库服务器采用无主模式运行,即没有一个集中管理的内存数据库服务器,各个内存数据库服务器之间是平行的关系,来实现大规模内存存储。
本发明的海量数据存储方法具体存储步骤如下:
步骤1:数据采集主机上安装“心跳检测”程序,并建立活动的(即目前正常工作的)内存数据库服务器的IP地址表;各内存数据库服务器装有“心跳响应”程序,数据采集主机通过“心跳检测”程序定期向各内存数据库服务器发送心跳检测信号,若规定时间内未接收到内存数据库服务器的响应信号,则表示该内存数据库服务器已下线,则从IP地址表中删除该内存数据库服务器;如果数据采集主机重新受到已下线的内存数据库服务器的响应信号,则向IP地址表中插入该内存数据库服务器的IP地址,通过这种方式,可以实时更新数据采集主机上的内存数据库服务器IP地址表,用来确定目前正常工作的内存数据库服务器。上述过程中的“心跳检测”为本领域技术人员所熟知,这里不再赘述。
步骤2:把待存储的数据整理为Key-Value的Hash字符串值索引格式,存储于关系数据库和Hash数据表中,映射到环形的Hash空间上;具体实现方法如下:首先,通过电梯的数据采集主机把采集到的数据整理成数据库可以存储的格式,同时设置字段用来记录数据来源的数据采集主机IP地址以及目标内存数据库服务器的IP地址。如图2所示,假设现在用n位地址空间,则可以把环形Hash空间进行2n 等分,分别编号为0—(2n-1)。把每条数据记录的“来源数据采集主机IP地址+记录主键”当成一个关键字,然后对此关键字进行MD5进行加密,当然也可以采用其他方式加密;然后可以适当的截取若干位(假设这里n=32,则截取前4个字节)作为Hash值Key,最后根据Hash值的大小映射到环形Hash空间上。
步骤3:把内存数据库服务器的IP地址映射到环形的Hash空间上:
根据步骤2中的Hash算法,并对各数据采集主机中的内存数据库服务器IP地址表的IP值进行Hash获得DKey值,然后散列到环形Hash空间上。为了保证数据尽可能均匀地存储至内存数据库服务器,本方案引入虚拟数据库的概念,也即根据内存数据库服务器的存储能力(存储能力越强,虚拟台数越多),把一台内存数据库服务器虚拟成M台,然后分别对各虚拟服务器进行Hash,这里取“IP#1”到“IP#M”为这M台虚拟服务器的Hash关键字与数据库ID,最后散列到环上,假设这里把第一台内存数据库服务器虚拟成两台虚拟服务器,则其示意图如图3所示。
步骤4:建立内存数据库与Hash键值的对应映射数组PositionToDB,以及内存数据库服务器的各虚拟服务器的虚拟数据库的散列位置存储数组DBtoPosition,从而得到数据、虚拟数据库与实际数据库的映射关系,并进行数据存储,其数据存储方案如下:
根据步骤3的原理,将内存数据库服务器的M台虚拟服务器的M个虚拟数据库与该内存数据库服务器的内存数据库的散列位置建立映射数组DBtoPosition,也即一台内存数据库服务器的各虚拟服务器的散列位置存储数组,也可以称为一个内存数据库的各虚拟数据库的散列位置存储数组。虚拟数据库较多的情况下可使用二叉树进行存储。
例如,将内存数据库服务器的IP地址作为实际数据库的标志,则:
DBtoPosition[IP][]={{PositionL,… ,PositonM},… ,{PositionS,… PositonZ}},
PositionToDB[Postion]={DB1#1,DB2,DB1#2,… ,DBN};
其中,
DBToPosition[DB1_IP]={Hash(DB1_IP#1),Hash(DB1_IP#2)},表示内存数据库DB1被虚拟成两个虚拟数据库以及该虚拟数据库的散列位置;
PositionToDB[Hash(DB1_IP#1)]={DB1_IP},表示散列位置Hash(DB1_IP#1)对应虚拟数据库DB1#1(也即虚拟服务器),这里保证该数组的索引值是有序的,默认从小到大排序;
根据以上描述,可以得到数据、虚拟数据库与实际数据库的映射关系图如图4所示。
具体存储步骤如下:
步骤41:当某条数据要存储到内存数据库的时候,首先根据步骤2的方法对该数据的关键字进行Hash,得到Key;
步骤42:根据步骤41得到的Key,搜索内存数据库与Hash键值的对应映射数组PositionToDB的索引值,当搜索到某个索引值≥该Key时,则停止搜索,并存储该索引值;否则把该数组中的第一个索引值当作所要查找的索引值;
步骤43:根据步骤42找到的索引值,依据数据、虚拟数据库与实际数据库的映射关系,得到内存数据库服务器的IP地址,并把该条数据发送给该内存数据库服务器上的内存数据库,对应的内存数据库接收并存储;
步骤44:返回继续执行步骤41-步骤43,直到所有数据存储完毕
步骤5:数据备份:为为保证数据存取的实时性,本方案中数据备份采用异步方式,数据采集主机在发送数据的时候,如果预设的备份数量超过预设值,则从环形的Hash空间中查找后继的内存数据库,也即从内存数据库与Hash键值的对应映射数组PositionToDB中查找后继的内存数据库,同时要确保查找到的内存数据库与先前备份的内存数据库实际属于不同的内存数据库,以保证备份被保存在不同的内存数据库服务器上,内存数据库服务器在收到数据后,首先存储数据,然后再按照数据采集主机提供的后继的内存数据库所在的内存数据库服务器的IP地址,直接将该数据复制到该内存数据库里。
上述步骤5的备份数据存取策略:由于数据备份采用异步方式进行,因此,备份数据可能存在不一致的情况,为克服数据不一致的缺陷,这里对备份数据的存取采用NWR规则:这里N代表总共需要做N个备份,W代表要写入至少W份才认为备份成功,R表示应用程序需要读备份数据的情况下,至少需要读取R个备份才认为读到的数据是一致的,这些参数都可以通过电梯的数据采集主机进行设置。配置的时候要求W+R > N,这样就保证至少能读取到一个最新的数据版本。
另外,本发明还对异常情况进行处理,例如出现内存数据库服务器出现宕机情况:
第一,根据数据采集主机上存储的IP地址表,找到宕机IP,根据IP的Hash值删除数组PositionToDB与DBToPosition中对应的内容;
第二,由于数据备份存储在不同的内存数据库服务器上,根据数据来源地址与目标数据库地址,缺失的数据可以从别的服务器上获取。
当增加新的内存数据库服务器时:
第一,根据步骤2的方法,把新增内存数据库服务器映射到环形Hash空间,根据Hash值往数组PositionToDB与DBToPosition中增加相应的元素,并确保PositionToDB 索引是有序的;
第二,根据数组PositionToDB查找到该内存数据库的后继内存数据库,找出符合“后继的内存数据库移动索引值小于等于新内存数据库Hash值”条件的数据,移动到新的内存数据库上,比如,根据图3,假设DB2是新插入的数据库,则只要把Hash 值在区间[ KEY1,DKEY2]的数据移动到DB2内存数据库服务器上即可。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。 

Claims (4)

1.一种海量数据存储方法,其特征在于:包括以下步骤:
步骤1:得到目前活动的内存数据库服务器列表;
步骤2:把待存储的数据整理为Key-Value的Hash字符串值索引格式,存储于关系数据库和Hash数据表中,并将其映射到环形的Hash空间上;所述待存储的数据包含数据来源的数据采集主机IP地址以及目标内存数据库服务器的IP地址;
步骤3:把内存数据库服务器的IP地址映射到环形的Hash空间上;
步骤4:建立内存数据库服务器上的内存数据库与Hash键值的对应映射数组PositionToDB,以及内存数据库服务器的各虚拟服务器的虚拟数据库的散列位置存储数组DBtoPosition,从而得到数据、虚拟数据库与实际数据库的映射关系,并进行数据存储,具体存储过程包括:
步骤41:当某条数据要存储到内存数据库的时候,首先对该数据的关键字进行Hash,得到Key;
步骤42:根据步骤41得到的Key,搜索内存数据库与Hash键值的对应映射数组PositionToDB的索引值,当搜索到某个索引值≥该Key时,则停止搜索,并存储该索引值;否则把该数组中的第一个索引值当作所要查找的索引值;
步骤43:根据步骤42找到的索引值,依据数据、虚拟数据库与实际数据库的映射关系,得到内存数据库服务器的IP地址,并把该条数据发送给该内存数据库服务器上的内存数据库,对应的内存数据库接收并存储;
步骤44:返回继续执行步骤41-步骤43,直到所有数据存储完毕。
2.根据权利要求1所述的一种海量数据存储方法,其特征在于:还包括:
步骤5:数据备份,其具体过程包括:为保证数据存取的实时性,本方案中数据备份采用异步方式,数据采集主机在发送数据的时候,如果预设的备份数量超过预设值,则从环形的Hash空间中查找后继的内存数据库,也即从内存数据库与Hash键值的对应映射数组PositionToDB中查找后继的内存数据库,同时要确保查找到的内存数据库与先前备份的内存数据库实际属于不同的内存数据库,以保证备份被保存在不同的内存数据库服务器上,内存数据库服务器在收到数据后,首先存储数据,然后再按照数据采集主机提供的后继的内存数据库所在的内存数据库服务器的IP地址,直接将该数据复制到该内存数据库里。
3.根据权利要求2所述的一种海量数据存储方法,其特征在于:对于步骤5的数据备份,对备份数据的存取采用NWR规则,具体是:做N个备份;写入至少W份才认为备份成功;读备份数据的时候,至少读取R个备份才认为读到的数据是一致的;其中W+R>N。
4.根据权利要求1所述的一种海量数据存储方法,其特征在于:所述步骤1得到目前活动的内存数据库服务器列表具体包括:
步骤11:在数据采集主机上建立活动的内存数据库服务器的IP地址表,并通过“心跳检测”程序定期向各内存数据库服务器发送心跳检测信号;各内存数据库服务器通过“心跳响应”程序对数据采集主机发送的心跳检测信号向数据采集主机发送响应信号;
步骤12:数据采集主机判断各内存数据库服务器对心跳检测信号进行响应的时间,如果一内存数据库服务器没有在规定时间响应,则认为该内存数据库服务器已下线,则从IP地址表中删除该内存数据库服务器;数据采集主机如果重新收到已下线的内存数据库服务器的响应信号,则向IP地址表中插入该内存数据库服务器的IP地址。
CN201210204123.8A 2012-06-20 2012-06-20 一种海量数据存储方法 Active CN102737127B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210204123.8A CN102737127B (zh) 2012-06-20 2012-06-20 一种海量数据存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210204123.8A CN102737127B (zh) 2012-06-20 2012-06-20 一种海量数据存储方法

Publications (2)

Publication Number Publication Date
CN102737127A true CN102737127A (zh) 2012-10-17
CN102737127B CN102737127B (zh) 2015-04-08

Family

ID=46992628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210204123.8A Active CN102737127B (zh) 2012-06-20 2012-06-20 一种海量数据存储方法

Country Status (1)

Country Link
CN (1) CN102737127B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955845A (zh) * 2012-10-23 2013-03-06 北京亿赞普网络技术有限公司 数据访问方法、装置与分布式数据库系统
WO2014089828A1 (zh) * 2012-12-14 2014-06-19 华为技术有限公司 访问存储设备的方法和存储设备
CN103888499A (zh) * 2012-12-21 2014-06-25 中国科学院深圳先进技术研究院 一种分布式对象处理的方法及系统
CN104050270A (zh) * 2014-06-23 2014-09-17 成都康赛信息技术有限公司 一种基于一致性哈希算法的分布式存储方法
CN104298541A (zh) * 2014-10-22 2015-01-21 浪潮(北京)电子信息产业有限公司 云存储系统的数据分布算法及其装置
CN104391863A (zh) * 2014-10-23 2015-03-04 中国建设银行股份有限公司 一种数据存储方法及装置
CN104424275A (zh) * 2013-08-29 2015-03-18 中兴通讯股份有限公司 数据库系统以及数据同步方法
CN104572711A (zh) * 2013-10-18 2015-04-29 腾讯科技(深圳)有限公司 一种分布式文档形数据存取方法及装置
CN105117171A (zh) * 2015-08-28 2015-12-02 南京国电南自美卓控制系统有限公司 一种能源scada海量数据分布式处理系统及其方法
CN105511801A (zh) * 2015-11-12 2016-04-20 长春理工大学 数据存储的方法和装置
CN105550306A (zh) * 2015-12-14 2016-05-04 北京奇虎科技有限公司 多副本数据的读写方法及系统
CN105607594A (zh) * 2015-12-25 2016-05-25 福州福群电子科技有限公司 基于智能家居的服务器内存查找设备的方法
CN105745639A (zh) * 2013-11-20 2016-07-06 惠普发展公司,有限责任合伙企业 可移动储存器数据散列
CN105930510A (zh) * 2016-05-12 2016-09-07 广西尊达电子商务有限公司 一种基于库表散列的多数据库管理系统
CN106156328A (zh) * 2016-07-06 2016-11-23 中国银行股份有限公司 一种银行运行日志数据监控方法及系统
CN106599322A (zh) * 2017-01-03 2017-04-26 北京网智天元科技股份有限公司 数据脱敏的方法及设备
CN106777166A (zh) * 2016-12-21 2017-05-31 济南浪潮高新科技投资发展有限公司 一种利用Docker容器进行虚拟内存数据库存储的实现方法
WO2017161956A1 (zh) * 2016-03-22 2017-09-28 北京京东尚科信息技术有限公司 一种数据库扩展系统、设备和用于扩展数据库的方法
CN107622062A (zh) * 2016-07-13 2018-01-23 天脉聚源(北京)科技有限公司 一种对大批量数据存储的方法和系统
CN107844388A (zh) * 2012-11-26 2018-03-27 亚马逊科技公司 从备份系统流式恢复数据库
CN107992417A (zh) * 2017-11-29 2018-05-04 平安科技(深圳)有限公司 基于存储过程的测试方法、装置及设备、可读存储介质
CN108108436A (zh) * 2017-12-20 2018-06-01 东软集团股份有限公司 数据存储方法、装置、存储介质及电子设备
CN108334551A (zh) * 2017-12-29 2018-07-27 谷米科技有限公司 数据存储方法和系统、数据查询方法和系统
CN109246102A (zh) * 2018-09-07 2019-01-18 公安部第研究所 一种支撑大规模认证数据快速存储及检索的系统及方法
CN109508261A (zh) * 2018-08-31 2019-03-22 云南电网有限责任公司信息中心 一种基于大数据的电网数据节点备份方法及备份系统
CN112327777A (zh) * 2020-11-13 2021-02-05 上海能誉科技股份有限公司 一种数据采集系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398869A (zh) * 2008-10-07 2009-04-01 深圳市蓝韵实业有限公司 一种海量数据存储方法
US20100179954A1 (en) * 2009-01-09 2010-07-15 Linkage Technology Group Co., Ltd. Quick Mass Data Manipulation Method Based on Two-Dimension Hash
CN102298633A (zh) * 2011-09-08 2011-12-28 厦门市美亚柏科信息股份有限公司 一种分布式海量数据排重方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398869A (zh) * 2008-10-07 2009-04-01 深圳市蓝韵实业有限公司 一种海量数据存储方法
US20100179954A1 (en) * 2009-01-09 2010-07-15 Linkage Technology Group Co., Ltd. Quick Mass Data Manipulation Method Based on Two-Dimension Hash
CN102298633A (zh) * 2011-09-08 2011-12-28 厦门市美亚柏科信息股份有限公司 一种分布式海量数据排重方法及系统

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955845A (zh) * 2012-10-23 2013-03-06 北京亿赞普网络技术有限公司 数据访问方法、装置与分布式数据库系统
CN102955845B (zh) * 2012-10-23 2015-11-25 北京亿赞普网络技术有限公司 数据访问方法、装置与分布式数据库系统
CN107844388A (zh) * 2012-11-26 2018-03-27 亚马逊科技公司 从备份系统流式恢复数据库
US11475038B2 (en) 2012-11-26 2022-10-18 Amazon Technologies, Inc. Automatic repair of corrupted blocks in a database
WO2014089828A1 (zh) * 2012-12-14 2014-06-19 华为技术有限公司 访问存储设备的方法和存储设备
CN104054071A (zh) * 2012-12-14 2014-09-17 华为技术有限公司 访问存储设备的方法和存储设备
CN103888499A (zh) * 2012-12-21 2014-06-25 中国科学院深圳先进技术研究院 一种分布式对象处理的方法及系统
CN103888499B (zh) * 2012-12-21 2018-08-14 中国科学院深圳先进技术研究院 一种分布式对象处理的方法及系统
CN104424275A (zh) * 2013-08-29 2015-03-18 中兴通讯股份有限公司 数据库系统以及数据同步方法
CN104572711A (zh) * 2013-10-18 2015-04-29 腾讯科技(深圳)有限公司 一种分布式文档形数据存取方法及装置
CN105745639A (zh) * 2013-11-20 2016-07-06 惠普发展公司,有限责任合伙企业 可移动储存器数据散列
CN104050270A (zh) * 2014-06-23 2014-09-17 成都康赛信息技术有限公司 一种基于一致性哈希算法的分布式存储方法
CN104298541A (zh) * 2014-10-22 2015-01-21 浪潮(北京)电子信息产业有限公司 云存储系统的数据分布算法及其装置
CN104391863A (zh) * 2014-10-23 2015-03-04 中国建设银行股份有限公司 一种数据存储方法及装置
CN105117171B (zh) * 2015-08-28 2018-11-30 南京国电南自维美德自动化有限公司 一种能源scada海量数据分布式处理系统及其方法
CN105117171A (zh) * 2015-08-28 2015-12-02 南京国电南自美卓控制系统有限公司 一种能源scada海量数据分布式处理系统及其方法
CN105511801A (zh) * 2015-11-12 2016-04-20 长春理工大学 数据存储的方法和装置
CN105511801B (zh) * 2015-11-12 2018-11-16 长春理工大学 数据存储的方法和装置
CN105550306A (zh) * 2015-12-14 2016-05-04 北京奇虎科技有限公司 多副本数据的读写方法及系统
CN105607594A (zh) * 2015-12-25 2016-05-25 福州福群电子科技有限公司 基于智能家居的服务器内存查找设备的方法
US11243921B2 (en) 2016-03-22 2022-02-08 Beijing Jingdong Shangke Information Technology Co., Ltd. Database expansion system, equipment, and method of expanding database
WO2017161956A1 (zh) * 2016-03-22 2017-09-28 北京京东尚科信息技术有限公司 一种数据库扩展系统、设备和用于扩展数据库的方法
CN105930510A (zh) * 2016-05-12 2016-09-07 广西尊达电子商务有限公司 一种基于库表散列的多数据库管理系统
CN106156328A (zh) * 2016-07-06 2016-11-23 中国银行股份有限公司 一种银行运行日志数据监控方法及系统
CN106156328B (zh) * 2016-07-06 2019-05-07 中国银行股份有限公司 一种银行运行日志数据监控方法及系统
CN107622062A (zh) * 2016-07-13 2018-01-23 天脉聚源(北京)科技有限公司 一种对大批量数据存储的方法和系统
CN106777166A (zh) * 2016-12-21 2017-05-31 济南浪潮高新科技投资发展有限公司 一种利用Docker容器进行虚拟内存数据库存储的实现方法
CN106599322A (zh) * 2017-01-03 2017-04-26 北京网智天元科技股份有限公司 数据脱敏的方法及设备
CN107992417B (zh) * 2017-11-29 2019-01-29 平安科技(深圳)有限公司 基于存储过程的测试方法、装置及设备、可读存储介质
CN107992417A (zh) * 2017-11-29 2018-05-04 平安科技(深圳)有限公司 基于存储过程的测试方法、装置及设备、可读存储介质
CN108108436A (zh) * 2017-12-20 2018-06-01 东软集团股份有限公司 数据存储方法、装置、存储介质及电子设备
CN108108436B (zh) * 2017-12-20 2020-07-31 东软集团股份有限公司 数据存储方法、装置、存储介质及电子设备
CN108334551A (zh) * 2017-12-29 2018-07-27 谷米科技有限公司 数据存储方法和系统、数据查询方法和系统
CN109508261A (zh) * 2018-08-31 2019-03-22 云南电网有限责任公司信息中心 一种基于大数据的电网数据节点备份方法及备份系统
CN109508261B (zh) * 2018-08-31 2019-12-13 云南电网有限责任公司信息中心 一种基于大数据的电网数据节点备份方法及备份系统
CN109246102A (zh) * 2018-09-07 2019-01-18 公安部第研究所 一种支撑大规模认证数据快速存储及检索的系统及方法
CN109246102B (zh) * 2018-09-07 2021-02-09 公安部第一研究所 一种支撑大规模认证数据快速存储及检索的系统及方法
CN112327777A (zh) * 2020-11-13 2021-02-05 上海能誉科技股份有限公司 一种数据采集系统及方法

Also Published As

Publication number Publication date
CN102737127B (zh) 2015-04-08

Similar Documents

Publication Publication Date Title
CN102737127B (zh) 一种海量数据存储方法
CN109241161B (zh) 一种气象数据管理方法
US10296498B2 (en) Coordinated hash table indexes to facilitate reducing database reconfiguration time
CN101334797B (zh) 一种分布式文件系统及其数据块一致性管理的方法
US10248356B2 (en) Using scratch extents to facilitate copying operations in an append-only storage system
CN107391758B (zh) 数据库切换方法、装置及设备
EP2474919B1 (en) System and method for data replication between heterogeneous databases
CN105843702B (zh) 一种用于数据备份的方法以及装置
CN108595664B (zh) 一种hadoop环境下的农业数据监控方法
US9547706B2 (en) Using colocation hints to facilitate accessing a distributed data storage system
US9223797B2 (en) Reparse point replication
US9753792B2 (en) Method and system for byzantine fault tolerant data replication
CN104657459A (zh) 一种基于文件粒度的海量数据存储方法
CN104184812B (zh) 一种基于私有云的多点数据传输方法
US11221785B2 (en) Managing replication state for deleted objects
CN109298978B (zh) 一种指定位置的数据库集群的恢复方法及系统
CN102722584B (zh) 数据存储系统及方法
US11567899B2 (en) Managing dependent delete operations among data stores
CN105630919A (zh) 存储方法及系统
CN102890678A (zh) 一种基于格雷编码的分布式数据布局方法及查询方法
WO2019171296A1 (en) Resilient, durable, scalable, and consistent distributed timeline data store
CN109902127B (zh) 历史态数据处理方法、装置、计算机设备及存储介质
US11409711B2 (en) Barriers for dependent operations among sharded data stores
CN107832159A (zh) 管理分布式锁的方法和计算机可读存储介质
CN111984696A (zh) 一种新型数据库和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: XIAMEN UNIVERSITY

Free format text: FORMER OWNER: XIAMEN JUHAIYUAN INTERNET OF THINGS TECHNOLOGY CO., LTD.

Effective date: 20140924

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140924

Address after: Xiamen City, Fujian Province, 361000 South Siming Road No. 422

Applicant after: Xiamen University

Address before: Post and No. 16 building, 361000 Fujian province Xiamen software park two 5 floor view of the road

Applicant before: Xiamen Juhaiyuan Internet of Things Network Technology Co., Ltd.

C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: Lin Fan

Inventor before: Lin Wei

Inventor before: Lin Fan

Inventor before: Huang Wenlin

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: LIN WEI LIN FAN HUANG WENLIN TO: LIN FAN

C14 Grant of patent or utility model
GR01 Patent grant