CN113821167B - 一种数据迁移方法和装置 - Google Patents

一种数据迁移方法和装置 Download PDF

Info

Publication number
CN113821167B
CN113821167B CN202110998411.4A CN202110998411A CN113821167B CN 113821167 B CN113821167 B CN 113821167B CN 202110998411 A CN202110998411 A CN 202110998411A CN 113821167 B CN113821167 B CN 113821167B
Authority
CN
China
Prior art keywords
file
storage pool
metadata
written
large file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110998411.4A
Other languages
English (en)
Other versions
CN113821167A (zh
Inventor
孙业宽
孟祥瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202110998411.4A priority Critical patent/CN113821167B/zh
Publication of CN113821167A publication Critical patent/CN113821167A/zh
Application granted granted Critical
Publication of CN113821167B publication Critical patent/CN113821167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0643Management of files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据迁移方法和装置,方法包括:响应于接收到数据写入请求而将数据写入请求所请求写入的文件写入高级存储池;响应于所请求写入的文件已经被写入高级存储池而在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件;响应于所请求写入的是大文件而将大文件的元数据写入大文件表,响应于所请求写入的是小文件而将小文件的元数据写入索引表;响应于判定满足执行数据迁移的条件而由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池。本发明能够提升数据文件迁移效率,避免高级存储介质写穿,提升用户体验和用户满意度,提高产品的竞争力。

Description

一种数据迁移方法和装置
技术领域
本发明涉及元数据加载领域,更具体地,特别是指一种数据迁移方法和装置。
背景技术
在现有技术中,文件优选地存储在高级池以提升读写性能。由于高级池由SSD(固态硬盘)等高成本存储介质组成,而且一个文件往往写入后短时间内访问频繁,随着时间的增加访问频率会越来越低。如果能让文件短时存储在高级池中,访问频率降低后迁移到普通池,就可以利用较低成本的高速介质实现存储更高性能提升,即文件分层。实际使用时通过配置文件分层特性,文件写入高级池,并在索引表中记录,MDS(元数据服务器)加载索引表,逐个文件迁移至普通池,来实现文件在高级池中短时存储。
由于文件在创建时文件大小未知,大小文件都会写入高级池。大文件写入高级池会导致高级池水位快速上升,使高成本的存储介质被大文件占用,而其他文件因高级池空间变小而无法写入,只能写入普通池,写入普通池则无法获得性能提升。迁移时MDS负责加载文件迁移表,逐个文件进行迁移。如果优先迁移大文件,能让高级池水位下降更快,进而能存储更多文件,如果优先迁移小文件,高级池水位下降很慢,但实际上文件在索引表中无序存储,缺乏规律性,进而影响文件迁移效率。
针对现有技术中数据文件迁移效率低的问题,目前尚无有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种数据迁移方法和装置,能够提升数据文件迁移效率,避免高级存储介质写穿,提升用户体验和用户满意度,提高产品的竞争力。
基于上述目的,本发明实施例的第一方面提供了一种数据迁移方法,包括执行以下步骤:
响应于接收到数据写入请求而将数据写入请求所请求写入的文件写入高级存储池;
响应于所请求写入的文件已经被写入高级存储池而在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件;
响应于所请求写入的是大文件而将大文件的元数据写入大文件表,响应于所请求写入的是小文件而将小文件的元数据写入索引表;
响应于判定满足执行数据迁移的条件而由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池。
在一些实施方式中,在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件包括:由元数据服务器基于预先设定的存储阈值与数据写入请求所请求写入的文件的大小相比较,响应于数据写入请求所请求写入的文件的大小大于存储阈值而确定数据写入请求所请求写入的文件是大文件,响应于数据写入请求所请求写入的文件的大小小于存储阈值而确定数据写入请求所请求写入的文件是小文件。
在一些实施方式中,元数据包括文件尺寸;将大文件的元数据写入大文件表包括将大文件的大小写入大文件表;由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:由元数据服务器将大文件表中的大文件依照尺寸从大到小排序,并按顺序将大文件从高级存储池迁移到普通存储池。
在一些实施方式中,响应于判定满足终止数据迁移的条件而停止迁移大文件。
在一些实施方式中,响应于大文件表中的大文件已经全部迁移并且执行数据迁移的条件仍然满足,而由元数据服务器进一步地将索引表中的小文件从高级存储池迁移到普通存储池。
在一些实施方式中,判定满足执行数据迁移的条件包括:确定高级存储池的存储量超过安全阈值、或接收到指示执行数据迁移的外部指令。
在一些实施方式中,响应于确定特定大文件被从高级存储池迁移到普通存储池而在大文件表中删除与该大文件相关的元数据。
在一些实施方式中,普通存储池为多个;将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:将大文件迁移到基于执行数据迁移的条件和被迁移的大文件而确定的普通存储池。
在一些实施方式中,普通存储池为多个;将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:将大文件迁移到当前存储量最低或空间最大的普通存储池。
本发明实施例的第二方面提供了一种数据迁移装置,包括:
处理器;
控制器,存储有处理器可运行的程序代码,处理器在运行程序代码时执行以下步骤:
响应于接收到数据写入请求而将数据写入请求所请求写入的文件写入高级存储池;
响应于所请求写入的文件已经被写入高级存储池而在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件;
响应于所请求写入的是大文件而将大文件的元数据写入大文件表,响应于请求写入的是小文件而将小文件的元数据写入索引表;
响应于判定满足执行数据迁移的条件而由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池。
在一些实施方式中,在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件包括:由元数据服务器基于预先设定的存储阈值与数据写入请求所请求写入的文件的大小相比较,响应于数据写入请求所请求写入的文件的大小大于存储阈值而确定数据写入请求所请求写入的文件是大文件,响应于数据写入请求所请求写入的文件的大小小于存储阈值而确定数据写入请求所请求写入的文件是小文件。
在一些实施方式中,元数据包括文件尺寸;将大文件的元数据写入大文件表包括将大文件的大小写入大文件表;由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:由元数据服务器将大文件表中的大文件依照尺寸从大到小排序,并按顺序将大文件从高级存储池迁移到普通存储池。
在一些实施方式中,响应于判定满足终止数据迁移的条件而停止迁移大文件。
在一些实施方式中,响应于大文件表中的大文件已经全部迁移并且执行数据迁移的条件仍然满足,而由元数据服务器进一步地将索引表中的小文件从高级存储池迁移到普通存储池。
在一些实施方式中,判定满足执行数据迁移的条件包括:确定高级存储池的存储量超过安全阈值、或接收到指示执行数据迁移的外部指令。
在一些实施方式中,响应于确定特定大文件被从高级存储池迁移到普通存储池而在大文件表中删除与该大文件相关的元数据。
在一些实施方式中,普通存储池为多个;将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:将大文件迁移到基于执行数据迁移的条件和被迁移的大文件而确定的普通存储池。
在一些实施方式中,普通存储池为多个;将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:将大文件迁移到当前存储量最低或空间最大的普通存储池。
本发明具有以下有益技术效果:本发明实施例提供的数据迁移方法和装置,通过响应于接收到数据写入请求而将数据写入请求所请求写入的文件写入高级存储池;响应于所请求写入的文件已经被写入高级存储池而在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件;响应于所请求写入的是大文件而将大文件的元数据写入大文件表,响应于所请求写入的是小文件而将小文件的元数据写入索引表;响应于判定满足执行数据迁移的条件而由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池的技术方案,能够提升数据文件迁移效率,避免高级存储介质写穿,提升用户体验和用户满意度,提高产品的竞争力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的数据迁移方法的流程示意图;
图2为本发明提供的数据迁移方法的整体流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种提升数据文件迁移效率,避免高级存储介质写穿,提升用户体验和用户满意度,提高产品的竞争力的数据迁移方法的一个实施例。图1示出的是本发明提供的数据迁移方法的流程示意图。
所述的数据迁移方法,如图1所示,包括执行以下步骤:
步骤S101,响应于接收到数据写入请求而将数据写入请求所请求写入的文件写入高级存储池;
步骤S103,响应于所请求写入的文件已经被写入高级存储池而在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件;
步骤S105,响应于所请求写入的是大文件而将大文件的元数据写入大文件表,响应于所请求写入的是小文件而将小文件的元数据写入索引表;
步骤S107,响应于判定满足执行数据迁移的条件而由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池。
本发明提出一种文件分层的大文件优先迁移方法,通过配置文件分层大小策略,在MDS端识别到大文件,并单独存储,文件分层待迁移文件存储位置有两个,一个是大文件表,一个是索引表,MDS加载待迁移文件时,优先加载大文件表,即优先迁移大文件,让高级池水位快速下降,迁移完大文件表后,再迁移索引表中的文件,同时为了优先迁移大文件,在加载大文件表后,会对大文件表按文件大小进行由大到小排序,即先区分出大小文件,然后对大文件再次按大小排序,最终实现优先迁移更大文件的功能,进而将高成本存储介质价值最大化,提升存储系统读写性能。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
在一些实施方式中,在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件包括:由元数据服务器基于预先设定的存储阈值与数据写入请求所请求写入的文件的大小相比较,响应于数据写入请求所请求写入的文件的大小大于存储阈值而确定数据写入请求所请求写入的文件是大文件,响应于数据写入请求所请求写入的文件的大小小于存储阈值而确定数据写入请求所请求写入的文件是小文件。
在一些实施方式中,元数据包括文件尺寸;将大文件的元数据写入大文件表包括将大文件的大小写入大文件表;由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:由元数据服务器将大文件表中的大文件依照尺寸从大到小排序,并按顺序将大文件从高级存储池迁移到普通存储池。
在一些实施方式中,响应于判定满足终止数据迁移的条件而停止迁移大文件。
在一些实施方式中,响应于大文件表中的大文件已经全部迁移并且执行数据迁移的条件仍然满足,而由元数据服务器进一步地将索引表中的小文件从高级存储池迁移到普通存储池。
在一些实施方式中,判定满足执行数据迁移的条件包括:确定高级存储池的存储量超过安全阈值、或接收到指示执行数据迁移的外部指令。
在一些实施方式中,响应于确定特定大文件被从高级存储池迁移到普通存储池而在大文件表中删除与该大文件相关的元数据。
在一些实施方式中,普通存储池为多个;将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:将大文件迁移到基于执行数据迁移的条件和被迁移的大文件而确定的普通存储池。
在一些实施方式中,普通存储池为多个;将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:将大文件迁移到当前存储量最低或空间最大的普通存储池。
结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现所述的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里所述功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。
下面根据具体实施例来进一步阐述本发明的具体实施方式。MDS通过文件分层的大小策略,比如“>1G写入普通池1”,来识别出大文件,将大文件存储在大文件表中,MDS迁移时先加载大文件表,迁移完大文件表后,再加载索引表迁移索引表中的文件,其中加载大文件表时将文件按大小由大到小排序,实现优先迁移大文件高级池水位快速下降目的。
具体实施过程参见图2。首先MDS识别大文件,客户端会将文件大小更新到MDS,MDS根据配置的大小策略识别大文件。如果是大文件则将其存储在大文件表中,否则存储在索引表中。MDS迁移加载时,先加载大文件表,加载后对文件按大小由大到小排序。然后逐个迁移大文件,大文件迁移完成后,从大文件表中删除。处理完大文件表后,继续处理索引表,对索引表中的文件逐个迁移,迁移完成后从索引表中删除。
此外,根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
从上述实施例可以看出,本发明实施例提供的数据迁移方法,通过响应于接收到数据写入请求而将数据写入请求所请求写入的文件写入高级存储池;响应于所请求写入的文件已经被写入高级存储池而在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件;响应于所请求写入的是大文件而将大文件的元数据写入大文件表,响应于所请求写入的是小文件而将小文件的元数据写入索引表;响应于判定满足执行数据迁移的条件而由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池的技术方案,能够提升数据文件迁移效率,避免高级存储介质写穿,提升用户体验和用户满意度,提高产品的竞争力。
需要特别指出的是,上述数据迁移方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于数据迁移方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种提升数据文件迁移效率,避免高级存储介质写穿,提升用户体验和用户满意度,提高产品的竞争力的数据迁移装置的一个实施例。装置包括:
处理器;
控制器,存储有处理器可运行的程序代码,处理器在运行程序代码时执行以下步骤:
响应于接收到数据写入请求而将数据写入请求所请求写入的文件写入高级存储池;
响应于所请求写入的文件已经被写入高级存储池而在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件;
响应于所请求写入的是大文件而将大文件的元数据写入大文件表,响应于所请求写入的是小文件而将小文件的元数据写入索引表;
响应于判定满足执行数据迁移的条件而由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池。
在一些实施方式中,在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件包括:由元数据服务器基于预先设定的存储阈值与数据写入请求所请求写入的文件的大小相比较,响应于数据写入请求所请求写入的文件的大小大于存储阈值而确定数据写入请求所请求写入的文件是大文件,响应于数据写入请求所请求写入的文件的大小小于存储阈值而确定数据写入请求所请求写入的文件是小文件。
在一些实施方式中,元数据包括文件尺寸;将大文件的元数据写入大文件表包括将大文件的大小写入大文件表;由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:由元数据服务器将大文件表中的大文件依照尺寸从大到小排序,并按顺序将大文件从高级存储池迁移到普通存储池。
在一些实施方式中,响应于判定满足终止数据迁移的条件而停止迁移大文件。
在一些实施方式中,响应于大文件表中的大文件已经全部迁移并且执行数据迁移的条件仍然满足,而由元数据服务器进一步地将索引表中的小文件从高级存储池迁移到普通存储池。
在一些实施方式中,判定满足执行数据迁移的条件包括:确定高级存储池的存储量超过安全阈值、或接收到指示执行数据迁移的外部指令。
在一些实施方式中,响应于确定特定大文件被从高级存储池迁移到普通存储池而在大文件表中删除与该大文件相关的元数据。
在一些实施方式中,普通存储池为多个;将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:将大文件迁移到基于执行数据迁移的条件和被迁移的大文件而确定的普通存储池。
在一些实施方式中,普通存储池为多个;将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池包括:将大文件迁移到当前存储量最低或空间最大的普通存储池。
本发明例公开的装置、设备等可为各种电子终端设备,例如手机、个人数字助理(PDA)、平板电脑(PAD)、智能电视等,也可以是大型终端设备,如装置等,因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。
从上述实施例可以看出,本发明实施例提供的数据迁移装置,通过响应于接收到数据写入请求而将数据写入请求所请求写入的文件写入高级存储池;响应于所请求写入的文件已经被写入高级存储池而在元数据服务器确定数据写入请求所请求写入的文件是大文件还是小文件;响应于所请求写入的是大文件而将大文件的元数据写入大文件表,响应于所请求写入的是小文件而将小文件的元数据写入索引表;响应于判定满足执行数据迁移的条件而由元数据服务器将大文件表中的大文件依照其元数据顺序从高级存储池迁移到普通存储池的技术方案,能够提升数据文件迁移效率,避免高级存储介质写穿,提升用户体验和用户满意度,提高产品的竞争力。
需要特别指出的是,上述装置的实施例采用了所述数据迁移方法的实施例来具体说明各模块的工作过程,本领域技术人员能够很容易想到,将这些模块应用到所述数据迁移方法的其他实施例中。当然,由于所述数据迁移方法实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于所述装置也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
本发明实施例还可以包括相应的计算机设备。计算机设备包括存储器、至少一个处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时执行上述任意一种方法。
其中,存储器作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的所述数据迁移方法对应的程序指令/模块。处理器通过运行存储在存储器中的非易失性软件程序、指令以及模块,从而执行装置的各种功能应用以及数据处理,即实现上述方法实施例的数据迁移方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据装置的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。所述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (8)

1.一种数据迁移方法,其特征在于,包括执行以下步骤:
响应于接收到数据写入请求而将所述数据写入请求所请求写入的文件写入高级存储池;
响应于所请求写入的文件已经被写入所述高级存储池而在元数据服务器确定所述数据写入请求所请求写入的文件是大文件还是小文件;
响应于所请求写入的是大文件而将所述大文件的元数据写入大文件表,响应于所请求写入的是小文件而将所述小文件的元数据写入索引表;
响应于判定满足执行数据迁移的条件而由所述元数据服务器将所述大文件表中的所述大文件依照其元数据顺序从所述高级存储池迁移到普通存储池;
响应于所述大文件表中的所述大文件已经全部迁移并且执行数据迁移的条件仍然满足,而由所述元数据服务器进一步地将所述索引表中的所述小文件从所述高级存储池迁移到所述普通存储池;
其中,所述元数据包括文件尺寸;将所述大文件的元数据写入大文件表包括将所述大文件的大小写入大文件表;由所述元数据服务器将所述大文件表中的所述大文件依照其元数据顺序从所述高级存储池迁移到普通存储池包括:由所述元数据服务器将所述大文件表中的所述大文件依照尺寸从大到小排序,并按顺序将所述大文件从所述高级存储池迁移到普通存储池。
2.根据权利要求1所述的方法,其特征在于,在元数据服务器确定所述数据写入请求所请求写入的文件是大文件还是小文件包括:由所述元数据服务器基于预先设定的存储阈值与所述数据写入请求所请求写入的文件的大小相比较,响应于所述数据写入请求所请求写入的文件的大小大于所述存储阈值而确定所述数据写入请求所请求写入的文件是所述大文件,响应于所述数据写入请求所请求写入的文件的大小小于所述存储阈值而确定所述数据写入请求所请求写入的文件是所述小文件。
3.根据权利要求1所述的方法,其特征在于,响应于判定满足终止数据迁移的条件而停止迁移所述大文件。
4.根据权利要求1所述的方法,其特征在于,判定满足执行数据迁移的条件包括:确定所述高级存储池的存储量超过安全阈值、或接收到指示执行数据迁移的外部指令。
5.根据权利要求1所述的方法,其特征在于,响应于确定特定大文件被从所述高级存储池迁移到所述普通存储池而在所述大文件表中删除与该大文件相关的元数据。
6.根据权利要求1所述的方法,其特征在于,所述普通存储池为多个;将所述大文件表中的所述大文件依照其元数据顺序从所述高级存储池迁移到普通存储池包括:将所述大文件迁移到基于执行数据迁移的条件和被迁移的所述大文件而确定的所述普通存储池。
7.根据权利要求1所述的方法,其特征在于,所述普通存储池为多个;将所述大文件表中的所述大文件依照其元数据顺序从所述高级存储池迁移到普通存储池包括:将所述大文件迁移到当前存储量最低或空间最大的所述普通存储池。
8.一种数据迁移装置,其特征在于,包括:
处理器;
控制器,存储有所述处理器可运行的程序代码,所述处理器在运行所述程序代码时执行以下步骤:
响应于接收到数据写入请求而将所述数据写入请求所请求写入的文件写入高级存储池;
响应于所请求写入的文件已经被写入所述高级存储池而在元数据服务器确定所述数据写入请求所请求写入的文件是大文件还是小文件;
响应于所请求写入的是大文件而将所述大文件的元数据写入大文件表,响应于所请求写入的是小文件而将所述小文件的元数据写入索引表;
响应于判定满足执行数据迁移的条件而由所述元数据服务器将所述大文件表中的所述大文件依照其元数据顺序从所述高级存储池迁移到普通存储池;
响应于所述大文件表中的所述大文件已经全部迁移并且执行数据迁移的条件仍然满足,而由所述元数据服务器进一步地将所述索引表中的所述小文件从所述高级存储池迁移到所述普通存储池;
其中,所述元数据包括文件尺寸;将所述大文件的元数据写入大文件表包括将所述大文件的大小写入大文件表;由所述元数据服务器将所述大文件表中的所述大文件依照其元数据顺序从所述高级存储池迁移到普通存储池包括:由所述元数据服务器将所述大文件表中的所述大文件依照尺寸从大到小排序,并按顺序将所述大文件从所述高级存储池迁移到普通存储池。
CN202110998411.4A 2021-08-27 2021-08-27 一种数据迁移方法和装置 Active CN113821167B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110998411.4A CN113821167B (zh) 2021-08-27 2021-08-27 一种数据迁移方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110998411.4A CN113821167B (zh) 2021-08-27 2021-08-27 一种数据迁移方法和装置

Publications (2)

Publication Number Publication Date
CN113821167A CN113821167A (zh) 2021-12-21
CN113821167B true CN113821167B (zh) 2024-02-13

Family

ID=78913741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110998411.4A Active CN113821167B (zh) 2021-08-27 2021-08-27 一种数据迁移方法和装置

Country Status (1)

Country Link
CN (1) CN113821167B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9421675D0 (en) * 1993-10-27 1994-12-14 Pitney Bowes Inc Apparatus and method for forming collations of two different size documents
CN104572670A (zh) * 2013-10-15 2015-04-29 方正国际软件(北京)有限公司 一种小文件的存储、查询及删除方法和系统
CN106776688A (zh) * 2016-11-10 2017-05-31 国云科技股份有限公司 一种Oracle数据库跨平台物理迁移系统实现方法
US10007673B1 (en) * 2013-12-23 2018-06-26 EMC IP Holding Company LLC Cluster file system comprising data mover module arranged between front-end and back-end file systems
CN111045604A (zh) * 2019-12-11 2020-04-21 苏州浪潮智能科技有限公司 一种基于nvram的小文件读写加速方法和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10275177B2 (en) * 2016-10-31 2019-04-30 Oracle International Corporation Data layout schemas for seamless data migration

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9421675D0 (en) * 1993-10-27 1994-12-14 Pitney Bowes Inc Apparatus and method for forming collations of two different size documents
CN104572670A (zh) * 2013-10-15 2015-04-29 方正国际软件(北京)有限公司 一种小文件的存储、查询及删除方法和系统
US10007673B1 (en) * 2013-12-23 2018-06-26 EMC IP Holding Company LLC Cluster file system comprising data mover module arranged between front-end and back-end file systems
CN106776688A (zh) * 2016-11-10 2017-05-31 国云科技股份有限公司 一种Oracle数据库跨平台物理迁移系统实现方法
CN111045604A (zh) * 2019-12-11 2020-04-21 苏州浪潮智能科技有限公司 一种基于nvram的小文件读写加速方法和设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SMDFS分布式海量小文件系统的大空间聚合存储技术;严巍巍;何连跃;李三霞;成颖佼;;计算机研究与发展(S2);全文 *
面向城轨线网的海量小文件存储方法;刘靖;廖家赵;刘琼;;计算机应用与软件(08);全文 *

Also Published As

Publication number Publication date
CN113821167A (zh) 2021-12-21

Similar Documents

Publication Publication Date Title
CN102623042B (zh) 存储器系统及其操作方法
KR101907059B1 (ko) 비휘발성 메모리 장치의 블록 관리 방법 및 블록 관리 시스템
US8230192B2 (en) System and method for QoS-based storage tiering and migration technique
US20150378888A1 (en) Controller, flash memory apparatus, and method for writing data into flash memory apparatus
US10296264B2 (en) Automatic I/O stream selection for storage devices
CN110727685B (zh) 一种基于Cassandra数据库的数据压缩方法、设备以及存储介质
US20130138867A1 (en) Storing Multi-Stream Non-Linear Access Patterns in a Flash Based File-System
US8984027B1 (en) Systems and methods for migrating files to tiered storage systems
US8667245B2 (en) Spatial extent migration for tiered storage architecture
CN108897492B (zh) 一种数据写入方法和装置
CA2896369C (en) Method for writing data into flash memory apparatus, flash memory apparatus, and storage system
TWI608350B (zh) 儲存裝置及其控制單元、可用於儲存裝置的資料搬移方 法
CN104536813A (zh) 计算设备的加速方法和装置
CN105988875B (zh) 一种运行进程的方法及装置
CN111198856A (zh) 文件管理方法、装置、计算机设备和存储介质
US10025706B2 (en) Control device, storage device, and storage control method
CN113821167B (zh) 一种数据迁移方法和装置
CN106294832A (zh) 浏览器页面缓存处理方法及装置
CN111597129B (zh) 缓存管理方法、装置、存储介质和固态非易失存储设备
CN107341203A (zh) 一种分布式搜索引擎的访问控制和索引优化方法与装置
CN109977074B (zh) 一种基于hdfs的lob数据处理方法及装置
CN113821460B (zh) 一种文件预读缓存分配方法和装置
CN114020208A (zh) 数据垃圾回收方法、装置、计算机设备以及存储介质
CN107273188B (zh) 一种虚拟机中央处理单元cpu绑定方法及装置
US10324660B2 (en) Determining whether to compress data prior to storage thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant