CN103841168A - 数据副本更新方法及元数据服务器 - Google Patents

数据副本更新方法及元数据服务器 Download PDF

Info

Publication number
CN103841168A
CN103841168A CN201210490832.7A CN201210490832A CN103841168A CN 103841168 A CN103841168 A CN 103841168A CN 201210490832 A CN201210490832 A CN 201210490832A CN 103841168 A CN103841168 A CN 103841168A
Authority
CN
China
Prior art keywords
data
metadata
liveness
trnascription
update
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210490832.7A
Other languages
English (en)
Other versions
CN103841168B (zh
Inventor
顾茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201210490832.7A priority Critical patent/CN103841168B/zh
Publication of CN103841168A publication Critical patent/CN103841168A/zh
Application granted granted Critical
Publication of CN103841168B publication Critical patent/CN103841168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种数据副本更新方法及元数据服务器,数据副本更新方法包括:接收客户端发送的数据更新请求,并根据数据更新请求查询待更新的数据副本对应的元数据的活跃度;将元数据的活跃度与预设的活跃度阈值进行比较,如果超过预设的活跃度阈值,则为元数据对应的数据模块设置代表较高优先级的更新标记;查看元数据对应的数据模块的更新标记,如果更新标记所代表的优先级高于当前处理优先级,则查找元数据对应的数据模块的各个数据副本;按照各个数据副本的活跃度的大小顺序更新各个数据副本。本发明将元数据和对应的数据副本的活跃度作为优先更新的依据,使得被频繁访问的数据模块可以被及时的同步更新,从而不影响访问者获得数据的及时性。

Description

数据副本更新方法及元数据服务器
技术领域
本发明涉及云计算海量存储应用领域,尤其涉及一种数据副本更新方法及元数据服务器。
背景技术
在当今的信息社会,每天都产生大量的需要保存的数据,这使得云计算海量存储系统称为当前研究和应用中的热点问题。对于云计算平台的海量数据存储系统来说,其保存了大量的数据,并提供这些数据的访问接口,用户可以通过访问这些接口来进行数据读取和数据写入。
当云计算平台的海量数据存储系统中的数据被频繁访问时,原始数据会被复制出多个数据副本以提供给访问者。访问者可以对其所获取到的数据副本执行写入的更新操作。当这些数据副本被多次读写时,如果需要对某个数据副本更新,那么其他的数据副本也需要进行同步更新,而数据副本的同步更新则会耗费很多的时间,进而影响访问者获得数据的及时性。但目前尚缺乏能够及时更新数据副本的机制。
发明内容
本发明的目的是提出一种数据副本更新方法及元数据服务器,能够在海量数据存储体系中实现数据副本的及时更新。
为实现上述目的,本发明提供了一种数据副本更新方法,包括:
接收客户端发送的数据更新请求,并根据所述数据更新请求查询待更新的数据副本对应的元数据的活跃度;
将所述元数据的活跃度与预设的活跃度阈值进行比较,如果超过所述预设的活跃度阈值,则为所述元数据对应的数据模块设置代表较高优先级的更新标记;
查看所述元数据对应的数据模块的更新标记,如果所述更新标记所代表的优先级高于当前处理优先级,则查找所述元数据对应的数据模块的各个数据副本;
按照所述各个数据副本的活跃度的大小顺序更新所述各个数据副本。
进一步的,在接收到所述客户端发出的数据访问请求时,还包括:
查找希望访问的数据的元数据,并根据所述元数据查找对应的数据副本;
根据访问的频度计算所述元数据和数据副本的活跃度。
进一步的,如果所述元数据的活跃度未超过所述预设的活跃度阈值,则为所述元数据对应的数据模块设置代表较低优先级的更新标记。
进一步的,如果所述更新标记所代表的优先级未高于当前处理优先级,则暂不处理所述元数据对应的数据模块的更新。
进一步的,所述元数据和数据副本的活跃度采用以下公式进行计算:
A = 1 - 1 f r + 1 t - t c
其中,A表示元数据或数据副本的活跃度,fr表示元数据或数据副本在单位时间被访问的次数,t为当前时间,tc是元数据或数据副本创建的时间,t和tc均以天为计算单位。
为实现上述目的,本发明提供了一种实现数据副本更新的元数据服务器,包括:
活跃度查询模块,用于接收客户端发送的数据更新请求,并根据所述数据更新请求查询待更新的数据副本对应的元数据的活跃度;
优先级标记模块,用于将所述元数据的活跃度与预设的活跃度阈值进行比较,如果超过所述预设的活跃度阈值,则为所述元数据对应的数据模块设置代表较高优先级的更新标记;
数据更新模块,用于查看所述元数据对应的数据模块的更新标记,如果所述更新标记所代表的优先级高于当前处理优先级,则查找所述元数据对应的数据模块的各个数据副本,并按照所述各个数据副本的活跃度的大小顺序更新所述各个数据副本。
进一步的,还包括:
数据查找模块,用于在接收到所述客户端发出的数据访问请求时,查找希望访问的数据的元数据,并根据所述元数据查找对应的数据副本;
活跃度计算模块,用于根据访问的频度计算所述元数据和数据副本的活跃度。
进一步的,所述优先级标记模块还用于在所述元数据的活跃度未超过所述预设的活跃度阈值时,为所述元数据对应的数据模块设置代表较低优先级的更新标记。
进一步的,所述数据更新模块还用于在所述更新标记所代表的优先级未高于当前处理优先级时,暂不处理所述元数据对应的数据模块的更新。
进一步的,所述活跃度计算模块中元数据和数据副本的活跃度采用以下公式进行计算:
A = 1 - 1 f r + 1 t - t c
其中,A表示元数据或数据副本的活跃度,fr表示元数据或数据副本在单位时间被访问的次数,t为当前时间,tc是元数据或数据副本创建的时间,t和tc均以天为计算单位。
基于上述技术方案,本发明将元数据和对应的数据副本的活跃度作为优先更新的依据,对元数据对应的数据模块设置优先级的更新标记,并在更新过程中按照标记的优先级高低来进行元数据对应的数据副本的更新,而在同一个元数据对应的多个数据副本来说,则按照数据副本的活跃度大小依次进行更新。这样就使得被频繁访问的数据副本可以被及时的同步更新,从而不影响访问者获得数据的及时性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为应用本发明元数据服务器实施例的元计算平台的海量数据存储系统的示意图。
图2为本发明数据副本更新方法的一实施例的流程示意图。
图3为本发明数据副本更新方法的另一实施例的流程示意图。
图4为本发明元数据服务器的一实施例的结构示意图。
图5为本发明元数据服务器的另一实施例的结构示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
如图1所示,为应用本发明元数据服务器实施例的元计算平台的海量数据存储系统的示意图。在元计算平台的海量数据存储系统中,客户端1可以访问元数据服务器2,元数据服务器2中保存有元数据,即数据模块的描述信息,而数据模块由多个数据的复制版本,即数据副本3构成。客户端1可以对希望获取的数据的复制版本进行读写操作,当用户通过客户端1对数据副本3进行写操作时,需要对其他的数据副本3也进行更新。
基于上述系统,图2给出了本发明数据副本更新方法的一实施例的流程示意图。在本实施例中,数据副本更新方法包括:
步骤101、接收客户端发送的数据更新请求,并根据所述数据更新请求查询待更新的数据副本对应的元数据的活跃度;
步骤102、将所述元数据的活跃度与预设的活跃度阈值进行比较,如果超过所述预设的活跃度阈值,则为所述元数据对应的数据模块设置代表较高优先级的更新标记;
步骤103、查看所述元数据对应的数据模块的更新标记,如果所述更新标记所代表的优先级高于当前处理优先级,则查找所述元数据对应的数据模块的各个数据副本;
步骤104、按照所述各个数据副本的活跃度的大小顺序更新所述各个数据副本。
在上述技术方案中,活跃度是数据更新的优先程度的依据,而活跃度是由时间与访问频率两方面因素所影响的,如果某个数据被创建的时间比较新,或者某个数据单位时间里被访问的次数较多,则认为其活跃度较高,反之,如果某个数据属于比较老且很少被访问的数据,则认为其活跃度较低。
对于活跃度较高的元数据,则对其设置较高优先级的更新标记,以便在实际更新时能够及时对其对应的数据副本进行更新,而对于活跃度较低的元数据,则对其设置较低优先级的更新标记,当优先级较高的元数据对应的数据副本更新完毕后,则可以对这些优先级较低的元数据对应的数据副本进行更新。而由于这些数据副本被访问的频率较低,因此对用户的影响也比较小。
在对于某个待更新的元数据的数据副本来说,更新顺序可以根据数据副本的活跃度的大小顺序来安排,这样就可以使访问最频繁的数据副本最先被更新,从而满足用户的访问及时性需求。
在步骤103中,如果所述更新标记所代表的优先级未高于当前处理优先级,则暂不处理所述元数据对应的数据模块的更新,等到较高优先级的元数据对应的数据模块更新完毕后,再进行这些元数据对应的数据模块的更新。
如图3所示,为本发明数据副本更新方法的另一实施例的流程示意图。与上一实施例相比,本实施例在步骤201接收到所述客户端发出的数据访问请求时,还包括以下步骤:
步骤202、查找希望访问的数据的元数据,并根据所述元数据查找对应的数据副本;
步骤203、根据访问的频度计算所述元数据和数据副本的活跃度。
元数据和数据副本的活跃度计算均可以采用以下公式进行计算:
A = 1 - 1 f r + 1 t - t c
其中,A表示元数据或数据副本的活跃度,fr表示元数据或数据副本在单位时间被访问的次数,t为当前时间,tc是元数据或数据副本创建的时间,t和tc均以天为计算单位。
上面所示的公式只是一个说明性示例,其他利用时间和访问频率,且能够体现出时间和/或访问频率对活跃度的影响的公式也同样适用于本发明,这里就不再一一举例了。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
如图4所示,为本发明元数据服务器的一实施例的结构示意图。在本实施例中,实现数据副本更新的元数据服务器包括:活跃度查询模块21、优先级标记模块22和数据更新模块23。
活跃度查询模块21负责接收客户端发送的数据更新请求,并根据所述数据更新请求查询待更新的数据副本对应的元数据的活跃度。优先级标记模块22负责将所述元数据的活跃度与预设的活跃度阈值进行比较,如果超过所述预设的活跃度阈值,则为所述元数据对应的数据模块设置代表较高优先级的更新标记。优先级标记模块22还可以在所述元数据的活跃度未超过所述预设的活跃度阈值时,为所述元数据对应的数据模块设置代表较低优先级的更新标记。
数据更新模块23负责查看所述元数据对应的数据模块的更新标记,如果所述更新标记所代表的优先级高于当前处理优先级,则查找所述元数据对应的数据模块的各个数据副本,并按照所述各个数据副本的活跃度的大小顺序更新所述各个数据副本。数据更新模块23还可以在所述更新标记所代表的优先级未高于当前处理优先级时,暂不处理所述元数据对应的数据模块的更新。
如图5所示,为本发明元数据服务器的另一实施例的结构示意图。与上一实施例相比,本实施例还包括了数据查找模块24和活跃度计算模块25。其中,数据查找模块24负责在接收到所述客户端发出的数据访问请求时,查找希望访问的数据的元数据,并根据所述元数据查找对应的数据副本。活跃度计算模块25负责根据访问的频度计算所述元数据和数据副本的活跃度。
活跃度计算模块中元数据和数据副本的活跃度可以采用以下公式进行计算:
A = 1 - 1 f r + 1 t - t c
其中,A表示元数据或数据副本的活跃度,fr表示元数据或数据副本在单位时间被访问的次数,t为当前时间,tc是元数据或数据副本创建的时间,t和tc均以天为计算单位。
通过上述数据副本更新方法及元数据服务器实施例,可以看出本发明可以实现被频繁访问的数据副本的及时同步更新,使访问者可以及时获得更新后的数据,尤其对现有云计算平台的各类行业应用例如政务舆情监测、中小企业经营等所采用的海量数据存储提供合理有效的同步更新机制。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (10)

1.一种数据副本更新方法,包括:
接收客户端发送的数据更新请求,并根据所述数据更新请求查询待更新的数据副本对应的元数据的活跃度;
将所述元数据的活跃度与预设的活跃度阈值进行比较,如果超过所述预设的活跃度阈值,则为所述元数据对应的数据模块设置代表较高优先级的更新标记;
查看所述元数据对应的数据模块的更新标记,如果所述更新标记所代表的优先级高于当前处理优先级,则查找所述元数据对应的数据模块的各个数据副本;
按照所述各个数据副本的活跃度的大小顺序更新所述各个数据副本。
2.根据权利要求1所述的数据副本更新方法,其中在接收到所述客户端发出的数据访问请求时,还包括:
查找希望访问的数据的元数据,并根据所述元数据查找对应的数据副本;
根据访问的频度计算所述元数据和数据副本的活跃度。
3.根据权利要求2所述的数据副本更新方法,其中如果所述元数据的活跃度未超过所述预设的活跃度阈值,则为所述元数据对应的数据模块设置代表较低优先级的更新标记。
4.根据权利要求2所述的数据副本更新方法,其中如果所述更新标记所代表的优先级未高于当前处理优先级,则暂不处理所述元数据对应的数据模块的更新。
5.根据权利要求2所述的数据副本更新方法,其中所述元数据和数据副本的活跃度采用以下公式进行计算:
A = 1 - 1 f r + 1 t - t c
其中,A表示元数据或数据副本的活跃度,fr表示元数据或数据副本在单位时间被访问的次数,t为当前时间,tc是元数据或数据副本创建的时间,t和tc均以天为计算单位。
6.一种实现数据副本更新的元数据服务器,包括:
活跃度查询模块,用于接收客户端发送的数据更新请求,并根据所述数据更新请求查询待更新的数据副本对应的元数据的活跃度;
优先级标记模块,用于将所述元数据的活跃度与预设的活跃度阈值进行比较,如果超过所述预设的活跃度阈值,则为所述元数据对应的数据模块设置代表较高优先级的更新标记;
数据更新模块,用于查看所述元数据对应的数据模块的更新标记,如果所述更新标记所代表的优先级高于当前处理优先级,则查找所述元数据对应的数据模块的各个数据副本,并按照所述各个数据副本的活跃度的大小顺序更新所述各个数据副本。
7.根据权利要求6所述的元数据服务器,其中还包括:
数据查找模块,用于在接收到所述客户端发出的数据访问请求时,查找希望访问的数据的元数据,并根据所述元数据查找对应的数据副本;
活跃度计算模块,用于根据访问的频度计算所述元数据和数据副本的活跃度。
8.根据权利要求7所述的元数据服务器,其中所述优先级标记模块还用于在所述元数据的活跃度未超过所述预设的活跃度阈值时,为所述元数据对应的数据模块设置代表较低优先级的更新标记。
9.根据权利要求7所述的元数据服务器,其中所述数据更新模块还用于在所述更新标记所代表的优先级未高于当前处理优先级时,暂不处理所述元数据对应的数据模块的更新。
10.根据权利要求7所述的数据副本更新方法,其中所述活跃度计算模块中元数据和数据副本的活跃度采用以下公式进行计算:
A = 1 - 1 f r + 1 t - t c
其中,A表示元数据或数据副本的活跃度,fr表示元数据或数据副本在单位时间被访问的次数,t为当前时间,tc是元数据或数据副本创建的时间,t和tc均以天为计算单位。
CN201210490832.7A 2012-11-27 2012-11-27 数据副本更新方法及元数据服务器 Active CN103841168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210490832.7A CN103841168B (zh) 2012-11-27 2012-11-27 数据副本更新方法及元数据服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210490832.7A CN103841168B (zh) 2012-11-27 2012-11-27 数据副本更新方法及元数据服务器

Publications (2)

Publication Number Publication Date
CN103841168A true CN103841168A (zh) 2014-06-04
CN103841168B CN103841168B (zh) 2017-09-29

Family

ID=50804294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210490832.7A Active CN103841168B (zh) 2012-11-27 2012-11-27 数据副本更新方法及元数据服务器

Country Status (1)

Country Link
CN (1) CN103841168B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018076830A1 (zh) * 2016-10-25 2018-05-03 广东欧珀移动通信有限公司 数据同步周期的调整方法、装置、电子设备、存储介质及系统
CN108122129A (zh) * 2017-12-01 2018-06-05 上海富利通信息系统有限公司 一种数据处理方法、装置及电子设备
CN112839067A (zh) * 2019-11-22 2021-05-25 腾讯科技(深圳)有限公司 一种数据同步方法及装置
CN113487278A (zh) * 2021-07-02 2021-10-08 钦州云之汇大数据科技有限公司 一种基于物联网的企业协同办公系统
CN113726845A (zh) * 2021-07-14 2021-11-30 深圳市有为信息技术发展有限公司 车载终端的数据传输方法、装置、车载终端和商用车辆

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761678A (en) * 1996-06-26 1998-06-02 International Business Machines Corporation Creation of clone storage area with identification of base storage area and deferred cloning of metadata
CN102035884A (zh) * 2010-12-03 2011-04-27 华中科技大学 一种云存储系统及其数据部署方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761678A (en) * 1996-06-26 1998-06-02 International Business Machines Corporation Creation of clone storage area with identification of base storage area and deferred cloning of metadata
CN102035884A (zh) * 2010-12-03 2011-04-27 华中科技大学 一种云存储系统及其数据部署方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘瑰: "面向海量信息处理领域的数据网格及其关键技术研究", 《中国博士学位论文全文数据库 信息科技辑》 *
牛德姣等: "海量存储系统中的元数据分级索引算法", 《计算机应用于研究》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018076830A1 (zh) * 2016-10-25 2018-05-03 广东欧珀移动通信有限公司 数据同步周期的调整方法、装置、电子设备、存储介质及系统
CN108122129A (zh) * 2017-12-01 2018-06-05 上海富利通信息系统有限公司 一种数据处理方法、装置及电子设备
CN112839067A (zh) * 2019-11-22 2021-05-25 腾讯科技(深圳)有限公司 一种数据同步方法及装置
CN113487278A (zh) * 2021-07-02 2021-10-08 钦州云之汇大数据科技有限公司 一种基于物联网的企业协同办公系统
CN113487278B (zh) * 2021-07-02 2023-05-09 深圳市顿泽慧科技有限公司 一种基于物联网的企业协同办公系统
CN113726845A (zh) * 2021-07-14 2021-11-30 深圳市有为信息技术发展有限公司 车载终端的数据传输方法、装置、车载终端和商用车辆

Also Published As

Publication number Publication date
CN103841168B (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN101840362B (zh) 一种改进的写时拷贝快照的实现方法和装置
CN102725755B (zh) 文件访问方法及系统
US8924353B1 (en) Systems and methods for copying database files
CN105069048A (zh) 一种小文件存储方法、查询方法和装置
CN104298760A (zh) 一种应用于数据仓库的数据处理方法和数据处理装置
CN102663062A (zh) 一种处理搜索结果中无效链接的方法及装置
CN104536904A (zh) 一种数据管理的方法、设备与系统
CN102272751B (zh) 在数据库环境通过背景同步的数据完整性
CN103631937A (zh) 构建列存储索引的方法、装置及系统
CN103841168A (zh) 数据副本更新方法及元数据服务器
US11048423B2 (en) Method and system for synchronizing requests related to key-value storage having different portions
CN104090901A (zh) 一种对数据进行处理的方法、装置及服务器
CN103530349A (zh) 一种缓存更新方法及设备
CN103425785A (zh) 数据存储系统及其用户数据存储、读取方法
EP2038780A1 (en) Configurable views of archived data storage
US11748357B2 (en) Method and system for searching a key-value storage
CN103699557A (zh) 报表处理方法及系统
WO2023277819A3 (zh) 数据处理方法、系统、设备、计算机程序产品及存储功能
US20150234606A1 (en) Storage device for performing in-storage computing operations, method of operation the same, and system including the same
CN112131214A (zh) 数据写入、数据查询的方法、系统、设备和存储介质
CN103034734A (zh) 文件存储查询代理以及信息查找方法与系统
US10635672B2 (en) Method and system for merging data
CN104408097A (zh) 一种基于字符段热更新的混合索引方法及系统
US8768988B2 (en) Accessing snapshots of a time based file system
CN104903871A (zh) 虚拟磁带库系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant