CN117009292A - 文件数据迁移系统、方法、计算机设备和可读存储介质 - Google Patents

文件数据迁移系统、方法、计算机设备和可读存储介质 Download PDF

Info

Publication number
CN117009292A
CN117009292A CN202310992064.3A CN202310992064A CN117009292A CN 117009292 A CN117009292 A CN 117009292A CN 202310992064 A CN202310992064 A CN 202310992064A CN 117009292 A CN117009292 A CN 117009292A
Authority
CN
China
Prior art keywords
storage system
file data
read
target object
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310992064.3A
Other languages
English (en)
Inventor
冯江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haier Consumer Finance Co ltd
Original Assignee
Haier Consumer Finance Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haier Consumer Finance Co ltd filed Critical Haier Consumer Finance Co ltd
Priority to CN202310992064.3A priority Critical patent/CN117009292A/zh
Publication of CN117009292A publication Critical patent/CN117009292A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/119Details of migration of file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/1827Management specifically adapted to NAS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种文件数据迁移系统、方法、计算机设备和可读存储介质,其中,该系统包括:源端NAS存储系统、目标端对象存储系统;统一文件访问接口,业务应用系统通过所述统一文件访问接口连接源端NAS存储系统及目标端对象存储系统进行文件访问,统一文件访问接口内部封装配置有文件访问控制模块;检测服务模块,用于检测统一文件访问接口存取的文件在源端NAS存储系统、目标端对象存储系统之间是否一致,否则通过消息系统发送同步消息至同步服务模块;同步服务模块,用于通过消息系统接收同步消息,解析同步消息获取需要同步的文件数据进行文件同步。通过本发明实现平滑的不停机数据迁移,增强业务应用系统的稳定性。

Description

文件数据迁移系统、方法、计算机设备和可读存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及文件数据迁移系统、方法、计算机设备和计算机可读存储介质。
背景技术
在大数据时代,海量的数据给ICT行业(信息与通信技术产业)带来了全新的挑战,如何存储、管理和利用这些数据,如何借助规划有效的降低TCO(Total Cost ofOwnership),如何缩短开发周期从而保证业务系统快速上线等问题,传统的SAN(StorageArea Network)和NAS(Network Attached Storage)架构已经不能有效的应对这些行业的难题。
往往在企业信息化管理之处是采用NAS架构存储非结构化数据,不同部门员工每时每刻都在访问文件系统,当有大量文件同时上传下载,易造成网络阻塞,NAS系统的流畅性将受到影响。随着数据大集中、数据挖掘、商业智能、协同作业等技术的成熟,数据价值呈指数上升。各种规模的企业均为数据量的高速增长带来的管理和成本问题而困扰,同时NAS存储也面临着无法支撑大数据智能的业务需求。面对海量的非结构化数据,对象存储应运而生。
对象存储面向海量非结构化数据存储的应用场景,可提供安全、可靠和高性能的对象存储服务,采用扁平化的文件组织结构,有效解决了传统树形文件目录处理海量文件的难题,提供一套REST API接口供开发使用,无需关注底层原理,能够帮助用户完成业务系统的快速开发和上线。
但是,由于客户使用的存储种类繁多,运维管理不便,增加了运维的复杂度和运维成本;企业用户从使用传统的文件存储到升级优化至使用对象存储的应用的过程中,主要有以下几个步骤:业务系统代码改造、数据迁移、数据校验、业务系统停机升级、增量数据迁移与校验、正式上线。上述过程中,工作量最大的往往不是业务系统的代码改造,而在于数据的迁移与校验。
在数据迁移的过程中,涉及到海量非结构化数据的传输、文件数量及内容的校验,每一项工作都会消耗大量的时间与人力,为业务的割接上线带来了许多阻力,甚至导致任务无法进行,影响企业业务开展。
发明内容
本发明实施例提供了一种文件数据迁移系统、方法、计算机设备和计算机可读存储介质,以至少实现平滑的不停机数据迁移,增强业务应用系统的稳定性。
第一方面,本发明实施例提供了一种文件数据迁移系统,包括:
源端NAS存储系统,连接业务应用系统,以进行文件数据的增加、读取、更新、删除操作;
目标端对象存储系统,搭建于目标新机房;
统一文件访问接口,所述业务应用系统通过所述统一文件访问接口连接所述源端NAS存储系统及目标端对象存储系统进行文件访问,所述统一文件访问接口内部封装配置有文件访问控制模块;
检测服务模块,部署于源端NAS存储系统所属的老机房,用于检测所述统一文件访问接口存取的文件在源端NAS存储系统、目标端对象存储系统之间是否一致,若不一致,则通过消息系统发送同步消息至同步服务模块,通过同步服务模块进行数据处理,使其一致;
同步服务模块,部署于源端NAS存储系统所属的老机房,用于通过消息系统接收所述同步消息,解析所述同步消息获取需要同步的文件数据在源端NAS存储系统、目标端对象存储系统之间进行文件同步,从而消费检测服务模块产生的不一致的消息,使源端NAS存储系统的文件数据和目标端对象存储系统的文件数据保持一致;
在其中一些实施例中,所述文件访问控制模块包括:
第一读写控制模块,用于将所述业务应用系统的文件数据写入所述源端NAS存储系统,同步写入所述目标端对象存储系统,并在所述业务应用系统读取所述源端NAS存储系统、目标端对象存储系统中一者的文件数据时,将文件数据同步写入至另一者;
第二读写控制模块,用于在所述业务应用系统利用所述统一文件访问接口读取文件数据时,依次读取所述目标端对象存储系统、所述源端NAS存储系统,利用所述检测服务模块检测待读取的所述文件数据是否不存在于所述目标端对象存储系统且存在于所述源端NAS存储系统,若是,则将所述文件数据写入所述目标端对象存储系统;
第三读写控制模块,用于所述业务应用系统直接利用所述统一文件访问接口访问所述目标端对象存储系统进行文件的读取、写入。
在其中一些实施例中,所述第一读写控制模块进一步包括:
对象存储系统检测模块,用于读取源端NAS存储系统中文件数据时,利用所述检测服务模块检测待读取的所述文件数据是否存在于所述目标端对象存储系统,若否,则利用所述同步服务模块将待读取的所述文件数据写入所述目标端对象存储系统;
NAS存储系统检测模块,用于读取所述目标端对象存储系统中文件数据时,利用所述检测服务模块检测待读取的所述文件数据是否存在于所述源端NAS存储系统,若否,则利用所述同步服务模块将待读取的所述文件数据写入所述源端NAS存储系统。
在其中一些实施例中,所述统一文件访问接口以软件开发工具包SDK的形式进行封装,以便于内嵌到应用程序中使用。
第二方面,本发明实施例提供了一种文件数据迁移方法,利用如上第一方面所述的文件数据迁移系统,包括:
迁移系统部署步骤,在迁移源端部署所述检测服务模块及同步服务模块,在迁移目标端搭建所述消息系统;迁移源端用于表示文件数据原有的存储位置,迁移目标端为文件数据新的存储位置,该存储位置可以是机房,也可以是云端存储介质。
数据迁移步骤,在所述业务应用系统利用所述统一文件访问接口进行文件访问过程中,通过调用检测服务模块、同步服务模块实现文件数据从源端NAS存储系统到目标端对象存储系统的平滑迁移。
在其中一些实施例中,所述数据迁移步骤包括:
第一读写控制步骤,用于所述业务应用系统的文件数据写入所述源端NAS存储系统,同步写入所述目标端对象存储系统,并在所述业务应用系统读取所述源端NAS存储系统、目标端对象存储系统中一者的文件数据时,将文件数据同步写入至另一者;
第二读写控制步骤,在所述业务应用系统利用所述统一文件访问接口读取文件数据时,依次读取所述目标端对象存储系统、所述源端NAS存储系统,利用所述检测服务模块检测待读取的所述文件数据是否不存在于所述目标端对象存储系统且存在于所述源端NAS存储系统,若是,则将所述文件数据写入所述目标端对象存储系统;
第三读写控制步骤,所述业务应用系统直接利用所述统一文件访问接口访问所述目标端对象存储系统进行文件的读取、写入。
在其中一些实施例中,所述第一读写控制步骤进一步包括:
对象存储系统同步步骤,用于读取源端NAS存储系统中文件数据时,利用所述检测服务模块检测待读取的所述文件数据是否存在于所述目标端对象存储系统,若否,则利用所述同步服务模块将待读取的所述文件数据写入所述目标端对象存储系统;
NAS存储系统同步步骤,用于读取所述目标端对象存储系统中文件数据时,利用所述检测服务模块检测待读取的所述文件数据是否存在于所述源端NAS存储系统,若否,则利用所述同步服务模块将待读取的所述文件数据写入所述源端NAS存储系统。
在其中一些实施例中,所述第一读写控制步骤中,所述业务应用系统对所述目标端对象存储系统和源端NAS存储系统的计算处理操作包括:文件数据新增、文件数据删除、文件数据更新、文件数据查询。
在其中一些实施例中,所述文件数据新增操作配置为先保存文件数据至目标端对象存储系统,然后调用检测服务模块、同步服务模块回写入源端NAS存储系统;文件数据删除操作配置为先在目标端对象存储系统中删除,同时调用检测服务模块、同步服务模块在源端NAS存储系统中删除,文件数据更新配置为先进行文件数据删除操作,再进行文件数据新增操作;文件数据查询操作配置为直接查询目标端对象存储系统,若目标端对象存储。
第三方面,本发明实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第二方面所述的文件数据迁移。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第二方面所述的文件数据迁移。
相比于相关技术,本发明实施例提供的文件数据迁移系统、方法、计算机设备和计算机可读存储介质,实现了企业用户从传统NAS存储系统到对象存储服务的平滑迁移,利用统一文件访问接口的兼容性实现业务应用系统使用过程中的数据迁移,迁移过程无需进行复杂的代码改造、适配、数据迁移、数据校验、无需业务系统停机,不影响业务正常开展,迁移成本低。
本发明的一个或多个实施例的细节在以下附图和描述中提出,以使本发明的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的文件数据迁移系统的结构框图;
图2是根据本发明实施例的文件数据迁移方法的流程图;
图3是根据本发明实施例的文件数据迁移方法的分步骤流程图;
图4是根据本发明实施例的文件数据迁移方法的另一分步骤流程图;
图5是根据本发明优选实施例的文件数据迁移方法的应用原理示意图;
图6是根据本发明优选实施例的迁移服务的部署架构示意图;
图7是根据本发明优选实施例的应用改造的原理示意图;
图8是根据本发明优选实施例的应用迁移的原理示意图;
图9是根据本发明优选实施例的迁移监控的原理示意图;
图10是根据本发明优选实施例的迁移完成的原理示意图。
图中:
1、源端NAS存储系统;2、目标端对象存储系统;3、业务应用系统;
4、检测服务模块;5、同步服务模块;31、统一文件访问接口。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。基于本发明提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
显而易见地,下面描述中的附图仅仅是本发明的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本发明应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本发明公开的内容相关的本领域的普通技术人员而言,在本发明揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本发明公开的内容不充分。
在本发明中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本发明所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本发明所涉及的技术术语或者科学术语应当为本发明所属技术领域内具有一般技能的人士所理解的通常意义。本发明所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本发明所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本发明所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本发明所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本发明所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
NAS系统(Network Attached Storage,NAS),也称为网络附属存储,按字面简单说就是连接在网络上,具备资料存储功能的装置,因此也称为“网络存储器”。它是一种专用数据存储服务器。
对象存储系统(Object-based Storage,OBS),也称为“面向对象存储”,是综合了NAS和SAN的优点,同时具有SAN的高速直接访问和NAS的数据共享等优势,提供了高可靠性、跨平台性以及安全的数据共享的存储体系结构。其主要特点有可通过网络访问、可实现在线更新、可满足海量数据检索需求、不受硬件限制等。
CRUD是指在做计算处理时的增加(Create)、读取(Read)、更新(Update)和删除(Delete)几个操作功能单词的首字母简写。CRUD主要被用在描述软件系统中数据库或者持久层的基本操作功能。
本实施例提供了一种文件数据迁移系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图1是根据本发明实施例的文件数据迁移系统的结构框图,如图1所示,该系统包括:
源端NAS存储系统1、目标端对象存储系统2,业务应用系统3通过统一文件访问接口31连接源端NAS存储系统1及目标端对象存储系统2,并利用检测服务模块4和同步服务模块5进行文件数据同步。具体的:
源端NAS存储系统1连接业务应用系统3以进行文件数据的增加、读取、更新、删除操作;目标端对象存储系统2,搭建于目标新机房;业务应用系统3通过统一文件访问接口31连接源端NAS存储系统1及目标端对象存储系统2进行文件访问,统一文件访问接口31内部封装配置有文件访问控制模块;可选的,统一文件访问接口31以软件开发工具包SDK的形式进行封装,以便于内嵌到应用程序中使用。其中,文件访问控制模块包括:第一读写控制模块、第二读写控制模块、第三读写控制模块,分别应用于应用改造过程、应用迁移过程、迁移监控过程。
检测服务模块4部署于源端NAS存储系统1所属的老机房,检测服务模块4用于检测统一文件访问接口31存取的文件在源端NAS存储系统1、目标端对象存储系统2之间是否一致,若不一致,则通过消息系统发送同步消息至同步服务模块5,通过同步服务模块5进行数据处理,使其一致;
同步服务模块5部署于源端NAS存储系统1所属的老机房,同步服务模块5用于通过消息系统接收同步消息,解析同步消息获取需要同步的文件数据在源端NAS存储系统1、目标端对象存储系统2之间进行文件同步,从而消费检测服务模块4产生的不一致的消息,使源端NAS存储系统1的文件数据和目标端对象存储系统2的文件数据保持一致;可选的,消息系统可基于RabbitMQ、RocketMQ或Kafka搭建。具体的,同步消息至少包括文件名称、文件位置等信息。
在上述实施例中,第一读写控制模块,用于将业务应用系统3的文件数据写入源端NAS存储系统1,同步写入目标端对象存储系统2,并在业务应用系统3读取源端NAS存储系统1、目标端对象存储系统2中一者的文件数据时,将文件数据同步写入至另一者,从而保证任意文件的读写在源端NAS存储系统1和目标端对象存储系统2的一致性,避免个别业务应用系统3未接入统一文件访问接口31进行文件访问可能存在的数据缺失的问题;第一读写控制模块进一步包括:对象存储系统检测模块、NAS存储系统检测模块,二者分别用于实现从源端NAS存储系统到目标端对象存储系统、从目标端对象存储系统到源端NAS存储系统的文件数据同步。
其中,对象存储系统检测模块用于读取源端NAS存储系统1中文件数据时,利用检测服务模块4检测待读取的文件数据是否存在于目标端对象存储系统2,若否,则利用同步服务模块5将待读取的文件数据写入目标端对象存储系统2;
NAS存储系统检测模块用于读取目标端对象存储系统2中文件数据时,利用检测服务模块4检测待读取的文件数据是否存在于源端NAS存储系统1,若否,则利用同步服务模块5将待读取的文件数据写入源端NAS存储系统1。
在上述实施例中,第二读写控制模块用于在所有业务应用系统3都已接入统一文件访问接口31后,在业务应用系统3利用统一文件访问接口31读取文件数据时,依次读取目标端对象存储系统2、源端NAS存储系统1,利用检测服务模块4检测待读取的文件数据是否不存在于目标端对象存储系统2且存在于源端NAS存储系统1,若是,则将文件数据写入目标端对象存储系统2,若待读取的文件数据存在于目标端对象存储系统2,则调用读取结果返回即可。基于此,实现将业务应用系统3对源端NAS存储系统1的的访问转移至对目标端对象存储系统2的访问。基于第一读写控制模块已经对数据进行同步,同时第二读写控制模块在读写过程中优先访问目标端对象存储系统2,因此无需对源端NAS存储系统1进行数据同步,业务应用系统3对源端NAS存储系统1不再有依赖关系,因此可以直接访问目标端对象存储系统2。
在源端NAS存储系统1的有效数据均已同步至对象存储系统后,也就是说,检测服务模块4不再生成同步消息,利用第三读写控制模块进行数据操作。在实际应用中,可以是通过设置检测服务模块4的持续检测阈值周期,若超过持续检测阈值周期仍没有生成同步消息,则认为已经不在有从源端NAS存储系统1同步至目标端对象存储系统2的文件。
在其中一些实施例中,第三读写控制模块用于业务应用系统3直接利用统一文件访问接口31访问目标端对象存储系统2进行文件的读取、写入。
基于如上模块,实现读取源端NAS存储系统1、目标端对象存储系统2中任一者的文件数据时,保证该文件数据在另一存储系统中同步存在,从而实现源端NAS存储系统1与目标端对象存储系统2的双向同步,保证文件数据的一致性。
基于如上实施例的文件数据迁移系统,利用统一文件访问接口31的兼容性实现业务应用系统3使用过程中的数据迁移,实现了企业用户从传统NAS存储系统到对象存储服务的平滑迁移,迁移过程无需进行复杂的代码改造、适配、数据迁移、数据校验、无需业务系统停机,不影响业务正常开展,迁移成本低。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本实施例还提供了一种文件数据迁移方法,基于如上述实施例的文件数据迁移系统。图2-图4是根据本发明实施例的文件数据迁移方法的流程图,如图2-图4所示,该流程包括如下步骤:
迁移系统部署步骤S1,在迁移源端部署检测服务模块及同步服务模块,在迁移目标端搭建消息系统;迁移源端用于表示文件数据原有的存储位置,迁移目标端为文件数据新的存储位置,该存储位置可以是机房,也可以是云端存储介质。
数据迁移步骤S2,在业务应用系统利用统一文件访问接口进行文件访问过程中,通过调用检测服务模块、同步服务模块实现文件数据从源端NAS存储系统到目标端对象存储系统的平滑迁移。其中,数据迁移步骤S2包括:
第一读写控制步骤S21,用于业务应用系统的文件数据写入源端NAS存储系统,同步写入目标端对象存储系统,并在业务应用系统读取源端NAS存储系统、目标端对象存储系统中一者的文件数据时,将文件数据同步写入至另一者,从而保证任意文件的读写在源端NAS存储系统和目标端对象存储系统的一致性,避免个别业务应用系统未接入统一文件访问接口进行文件访问可能存在的数据缺失的问题;
多个应用系统的前提下,当每一业务应用系统均分别利用统一文件访问接口进行文件访问时,执行第二读写控制步骤。
第二读写控制步骤S22,在所有业务应用系统都已接入统一文件访问接口后,在业务应用系统利用统一文件访问接口读取文件数据时,依次读取目标端对象存储系统、源端NAS存储系统,利用检测服务模块检测待读取的文件数据是否不存在于目标端对象存储系统且存在于源端NAS存储系统,若是,则将文件数据写入目标端对象存储系统,若待读取的文件数据存在于目标端对象存储系统,则调用读取结果返回即可;基于此,实现将业务应用系统对源端NAS存储系统的的访问转移至对目标端对象存储系统的访问。基于第一读写控制模块已经对数据进行同步,同时第二读写控制模块在读写过程中优先访问目标端对象存储系统,因此无需对源端NAS存储系统进行数据同步,业务应用系统对源端NAS存储系统不再有依赖关系,因此可以直接访问目标端对象存储系统,实现了应用的迁移。
在源端NAS存储系统的有效数据均已同步至对象存储系统后,也就是说,检测服务模块不再生成同步消息,利用第三读写控制模块进行数据操作。在实际应用中,可以是通过设置检测服务模块的持续检测阈值周期,若超过持续检测阈值周期仍没有生成同步消息,则认为已经不在有从源端NAS存储系统同步至目标端对象存储系统的文件。
第三读写控制步骤S23,业务应用系统直接利用统一文件访问接口访问目标端对象存储系统进行文件的读取、写入。
在其中一些实施例中,第一读写控制步骤S21进一步包括:
对象存储系统同步步骤S211,用于读取源端NAS存储系统中文件数据时,利用检测服务模块检测待读取的文件数据是否存在于目标端对象存储系统,若否,则利用同步服务模块将待读取的文件数据写入目标端对象存储系统;
NAS存储系统同步步骤S212,用于读取目标端对象存储系统中文件数据时,利用检测服务模块检测待读取的文件数据是否存在于源端NAS存储系统,若否,则利用同步服务模块将待读取的文件数据写入源端NAS存储系统。
在其中一些实施例中,第一读写控制步骤S21中,业务应用系统对目标端对象存储系统和源端NAS存储系统的计算处理操作包括:文件数据新增、文件数据删除、文件数据更新、文件数据查询。其中,文件数据新增操作配置为业务应用系统先保存文件数据至目标端对象存储系统,然后调用检测服务模块、同步服务模块回写入源端NAS存储系统;文件数据删除操作配置为先在目标端对象存储系统中删除,同时调用检测服务模块、同步服务模块在源端NAS存储系统中删除,文件数据更新配置为先进行文件数据删除操作,再进行文件数据新增操作;文件数据查询操作配置为直接查询目标端对象存储系统,若目标端对象存储。
基于如上步骤,实现读取源端NAS存储系统、目标端对象存储系统中任一者的文件数据时,保证该文件数据在另一存储系统中同步存在,从而实现源端NAS存储系统与目标端对象存储系统的双向同步,保证文件数据的一致性。
下面通过优选实施例对本发明实施例进行描述和说明。
图5-图10是根据本发明优选实施例的文件数据迁移方法的原理示意图,如图5所示,该文件数据迁移方法所基于的业务应用系统其初始状态下为直接连接一NAS系统(即共享存储)进行文件数据的存取,NAS系统部署于老机房,在新机房搭建有对象存储系统,对象存储系统可以是分布式存储服务,或者直接使用公有云对象存储服务,本优选实施例采用分布式存储服务。
该文件数据迁移方法包括如下步骤:
迁移服务开发步骤,在新的机房搭建消息系统(MQ服务),用于收发同步文件请求的消息,消息系统可以使用RabbitMQ,RocketMQ,Kafka等。将开发好的检测服务、同步服务部署在老机房,检测服务、同步服务的作用前文已作描述。经过迁移服务开发步骤搭建得到的文件数据迁移架构原理如图6所示。
应用改造步骤,将业务应用系统统一接入统一文件访问接口Sorter进行应用改造,改造后的业务应用系统执行第一读写控制步骤S21,利用检测服务判断并产生同步消息,同步服务根据同步消息在分布式存储和NAS系统之间读取文件和/或保存文件,进行双向数据同步,如图7所示。业务应用系统对分布式存储服务和NAS系统的计算处理操作包括:文件数据新增、文件数据删除、文件数据更新、文件数据查询。具体逻辑为:
新增:先保存至分布式存储,然后调用检测服务回写至NAS系统即可;
删除:在分布式存储中删除,同时调用检测服务接口在NAS系统中删除;
更新:先执行删除操作、再执行新增操作;
查询:直接查询分布式存储,如果存在目标文件,则返回,如果不存在则去调用检测服务,查看在NAS系统上是否存在,如果不存在则返回。如果检测服务返回存在目标文件,则轮询去查询分布式存储。
应用迁移步骤,执行第二读写控制步骤S22,到了这个阶段,应用系统对NAS系统的依赖已经去掉,可以进行迁移,即直接访问对象存储即可,如图8所示。
迁移监控步骤,如图9所示,通过监控消息系统是否检测产生新的同步消息即可,当一段时间后不产生新消息,表明迁移基本完成。如图10所示,当迁移监控表明已经迁移完成时,所有应用均已通过统一文件访问接口Sorter直接访问分布式存储服务,这时可以将检测服务和同步服务下线,迁移结束。
本优选实施例通过用户对文件的存储使用来逐步完成应用改造和数据迁移,借助统一文件访问接口、消息系统、检测服务、同步服务的协同配合,实现了在较短实施周期的平滑迁移,若机房同时存在多个应用系统,可以独立进行应用改造及数据迁移。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
另外,结合图2-图4描述的本发明实施例文件数据迁移方法可以由计算机设备来实现。计算机设备可以包括处理器以及存储有计算机程序指令的存储器。
具体地,上述处理器可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecific Integrated Circuit,简称为ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
其中,存储器可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器可在数据处理装置的内部或外部。在特定实施例中,存储器是非易失性(Non-Volatile)存储器。在特定实施例中,存储器包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(Random AccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器所执行的可能的计算机程序指令。
处理器通过读取并执行存储器中存储的计算机程序指令,以实现上述实施例中的任意一种文件数据迁移方法。
另外,结合上述实施例中的文件数据迁移方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种文件数据迁移方法。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种文件数据迁移系统,其特征在于,包括:
源端NAS存储系统,连接业务应用系统;
目标端对象存储系统;
统一文件访问接口,所述业务应用系统通过所述统一文件访问接口连接所述源端NAS存储系统及目标端对象存储系统进行文件访问,所述统一文件访问接口内部封装配置有文件访问控制模块;
检测服务模块,用于检测所述统一文件访问接口存取的文件在源端NAS存储系统、目标端对象存储系统之间是否一致,若不一致,则通过消息系统发送同步消息至同步服务模块,通过同步服务模块进行数据处理,使其一致;
同步服务模块,用于通过消息系统接收所述同步消息,解析所述同步消息获取需要同步的文件数据在源端NAS存储系统、目标端对象存储系统之间进行文件同步。
2.根据权利要求1所述的文件数据迁移系统,其特征在于,所述文件访问控制模块包括:
第一读写控制模块,用于将所述业务应用系统的文件数据写入所述源端NAS存储系统,同步写入所述目标端对象存储系统,并在所述业务应用系统读取所述源端NAS存储系统、目标端对象存储系统中一者的文件数据时,将文件数据同步写入至另一者;
第二读写控制模块,用于在所述业务应用系统利用所述统一文件访问接口读取文件数据时,依次读取所述目标端对象存储系统、所述源端NAS存储系统,利用所述检测服务模块检测待读取的所述文件数据是否不存在于所述目标端对象存储系统且存在于所述源端NAS存储系统,若是,则将所述文件数据写入所述目标端对象存储系统;
第三读写控制模块,用于所述业务应用系统直接利用所述统一文件访问接口访问所述目标端对象存储系统进行文件的读取、写入。
3.根据权利要求2所述的文件数据迁移系统,其特征在于,所述第一读写控制模块进一步包括:
对象存储系统检测模块,用于读取源端NAS存储系统中文件数据时,利用所述检测服务模块检测待读取的所述文件数据是否存在于所述目标端对象存储系统,若否,则利用所述同步服务模块将待读取的所述文件数据写入所述目标端对象存储系统;
NAS存储系统检测模块,用于读取所述目标端对象存储系统中文件数据时,利用所述检测服务模块检测待读取的所述文件数据是否存在于所述源端NAS存储系统,若否,则利用所述同步服务模块将待读取的所述文件数据写入所述源端NAS存储系统。
4.根据权利要求1-3中任一项所述的文件数据迁移系统,其特征在于,所述统一文件访问接口以软件开发工具包SDK的形式进行封装。
5.一种文件数据迁移方法,利用如权利要求1至4中任一项所述的文件数据迁移系统,其特征在于,包括:
迁移系统部署步骤,在迁移源端部署所述检测服务模块及同步服务模块,在迁移目标端搭建所述消息系统;
数据迁移步骤,在所述业务应用系统利用所述统一文件访问接口进行文件访问过程中,通过调用检测服务模块、同步服务模块实现文件数据从源端NAS存储系统到目标端对象存储系统的平滑迁移。
6.根据权利要求5所述的文件数据迁移方法,其特征在于,所述数据迁移步骤包括:
第一读写控制步骤,用于所述业务应用系统的文件数据写入所述源端NAS存储系统,同步写入所述目标端对象存储系统,并在所述业务应用系统读取所述源端NAS存储系统、目标端对象存储系统中一者的文件数据时,将文件数据同步写入至另一者;
第二读写控制步骤,在所述业务应用系统利用所述统一文件访问接口读取文件数据时,依次读取所述目标端对象存储系统、所述源端NAS存储系统,利用所述检测服务模块检测待读取的所述文件数据是否不存在于所述目标端对象存储系统且存在于所述源端NAS存储系统,若是,则将所述文件数据写入所述目标端对象存储系统;
第三读写控制步骤,所述业务应用系统直接利用所述统一文件访问接口访问所述目标端对象存储系统进行文件的读取、写入。
7.根据权利要求6所述的文件数据迁移方法,其特征在于,所述第一读写控制步骤进一步包括:
对象存储系统同步步骤,用于读取源端NAS存储系统中文件数据时,利用所述检测服务模块检测待读取的所述文件数据是否存在于所述目标端对象存储系统,若否,则利用所述同步服务模块将待读取的所述文件数据写入所述目标端对象存储系统;
NAS存储系统同步步骤,用于读取所述目标端对象存储系统中文件数据时,利用所述检测服务模块检测待读取的所述文件数据是否存在于所述源端NAS存储系统,若否,则利用所述同步服务模块将待读取的所述文件数据写入所述源端NAS存储系统。
8.根据权利要求6所述的文件数据迁移方法,其特征在于,所述第一读写控制步骤中,所述业务应用系统对所述目标端对象存储系统和源端NAS存储系统的计算处理操作包括:文件数据新增、文件数据删除、文件数据更新、文件数据查询。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求5至8中任一项所述的文件数据迁移方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求5至8中任一项所述的文件数据迁移方法。
CN202310992064.3A 2023-08-08 2023-08-08 文件数据迁移系统、方法、计算机设备和可读存储介质 Pending CN117009292A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310992064.3A CN117009292A (zh) 2023-08-08 2023-08-08 文件数据迁移系统、方法、计算机设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310992064.3A CN117009292A (zh) 2023-08-08 2023-08-08 文件数据迁移系统、方法、计算机设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN117009292A true CN117009292A (zh) 2023-11-07

Family

ID=88565195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310992064.3A Pending CN117009292A (zh) 2023-08-08 2023-08-08 文件数据迁移系统、方法、计算机设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN117009292A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7765272B1 (en) * 2003-09-30 2010-07-27 Cisco Technology, Inc. Method and system for migrating content on a network
CN110209344A (zh) * 2018-07-26 2019-09-06 腾讯科技(深圳)有限公司 迁移对象存储的方法、装置和计算机可读存储介质
CN110989937A (zh) * 2019-12-06 2020-04-10 浪潮电子信息产业股份有限公司 一种数据存储方法、装置、设备及计算机可读存储介质
CN111581175A (zh) * 2020-04-29 2020-08-25 上海爱数信息技术股份有限公司 一种文件存储网关系统及其数据迁移方法
CN113268449A (zh) * 2021-03-03 2021-08-17 浪潮云信息技术股份公司 一种基于对象存储的分布式文件迁移方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7765272B1 (en) * 2003-09-30 2010-07-27 Cisco Technology, Inc. Method and system for migrating content on a network
CN110209344A (zh) * 2018-07-26 2019-09-06 腾讯科技(深圳)有限公司 迁移对象存储的方法、装置和计算机可读存储介质
CN110989937A (zh) * 2019-12-06 2020-04-10 浪潮电子信息产业股份有限公司 一种数据存储方法、装置、设备及计算机可读存储介质
CN111581175A (zh) * 2020-04-29 2020-08-25 上海爱数信息技术股份有限公司 一种文件存储网关系统及其数据迁移方法
CN113268449A (zh) * 2021-03-03 2021-08-17 浪潮云信息技术股份公司 一种基于对象存储的分布式文件迁移方法及系统

Similar Documents

Publication Publication Date Title
JP5387757B2 (ja) 並列データ処理システム、並列データ処理方法及びプログラム
EP2727014B1 (en) Automatic synchronization of most recently used document lists
US11836116B2 (en) Managing operations between heterogeneous file systems
EP3876106A1 (en) File storage method and deletion method, server, and storage medium
CN103649926A (zh) 提供在异构计算环境下访问主机数据对象
KR102119258B1 (ko) 데이터베이스 관리 시스템에서의 변경 데이터 캡쳐 구현 기법
CN110347651A (zh) 基于云存储的数据同步方法、装置、设备及存储介质
US8983899B1 (en) Systems and methods for archiving files in distributed replication environments
CN109710185A (zh) 数据处理方法及装置
CN108628885B (zh) 一种数据同步方法、装置及存储设备
CN113448938A (zh) 数据处理方法、装置、电子设备及存储介质
US11151093B2 (en) Distributed system control for on-demand data access in complex, heterogenous data storage
US20220067065A1 (en) Providing instant and distributed access to a source blob via copy-on-read blobs and link blobs
US10387384B1 (en) Method and system for semantic metadata compression in a two-tier storage system using copy-on-write
CN116501700B (zh) 一种app格式化文件离线存储方法、装置、设备及存储介质
US11341159B2 (en) In-stream data load in a replication environment
CN114328007B (zh) 一种容器备份还原方法、装置及其介质
CN117009292A (zh) 文件数据迁移系统、方法、计算机设备和可读存储介质
US8281096B1 (en) Systems and methods for creating snapshots
US20230006814A1 (en) Method and apparatus for implementing changes to a file system that is emulated with an object storage system
US10834193B2 (en) Scheduled retrieval of shared content
CN109960460B (zh) 一种分布式存储系统
US11372816B2 (en) Accessing network based content items by a mobile device while offline
CN111913926A (zh) 一种基于Hadoop的云平台存储方法
US11263032B1 (en) Systems and methods for emulating local storage

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination