CN111046006A - 数据备份系统以及数据备份方法 - Google Patents
数据备份系统以及数据备份方法 Download PDFInfo
- Publication number
- CN111046006A CN111046006A CN201811295208.5A CN201811295208A CN111046006A CN 111046006 A CN111046006 A CN 111046006A CN 201811295208 A CN201811295208 A CN 201811295208A CN 111046006 A CN111046006 A CN 111046006A
- Authority
- CN
- China
- Prior art keywords
- data
- compression
- electronic device
- server
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000007906 compression Methods 0.000 claims abstract description 120
- 230000006835 compression Effects 0.000 claims abstract description 119
- 230000005540 biological transmission Effects 0.000 claims description 19
- 238000005070 sampling Methods 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 10
- 238000013144 data compression Methods 0.000 description 31
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000012417 linear regression Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1451—Management of the data involved in backup or backup restore by selection of backup contents
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6064—Selection of Compressor
- H03M7/6076—Selection between compressors of the same type
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
- H03M7/3062—Compressive sampling or sensing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3068—Precoding preceding compression, e.g. Burrows-Wheeler transformation
- H03M7/3071—Prediction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种数据备份系统以及数据备份方法,数据备份系统包含电子装置以及服务器。电子装置的储存媒体用以储存原始数据。服务器预估原始数据各自透过多个压缩演算法的压缩,而产生一预测压缩数据的数据量以及对应预测压缩数据的一第一预测压缩时间。服务器撷取电子装置的运算资源数据,并根据运算资源数据与第一预测压缩时间,分别预测电子装置压缩原始数据所需的多个第二预测压缩时间。服务器计算多个参考值,并根据多个参考值中最小者所对应的多个压缩演算法中的预设压缩演算法,以产生推荐指令,以供电子装置进行数据备份,与传统数据备份系统相比,本揭示文件使用当下最适合的数据压缩演算法进行备份,可免于备份程序被迫中断或失败的问题。
Description
技术领域
本揭示文件是有关于一种数据系统及方法,且特别是有关于一种数据备份系统及方法。
背景技术
随着物联网技术的发展,在网络中的终端装置数量急遽上升,造成传输数据量变得十分庞大。为节省网络成本,在终端装置传送数据之前,往往需要使用数据压缩技术来降低传送的数据量,以节省网络传输频宽。
然而,数据压缩运算通常在远程装置执行,终端设备需要压缩的数据量越大,远程装置的负担越高。因此,如何降低远程装置的服务负担是亟需解决的问题。
鉴于此,本揭示文件提供一种压缩方式推荐系统,根据远程装置的系统状态及文件类型,不需分析文件本身及文件分类,采用实际压缩取样数据,获得压缩时间与数据大小等相关信息后,产出预测压缩备份时间,推荐其最适合的压缩方式。
发明内容
根据本揭示文件的一实施例,揭示一种数据备份系统。数据备份系统包含电子装置以及服务器。电子装置包含储存媒体。储存媒体用以储存原始数据。服务器通讯连接电子装置。服务器预估各自透过多个压缩演算法的其中一者的对原始数据压缩时的预测压缩数据的数据量以及对应该预测压缩数据的第一预测压缩时间。服务器撷取电子装置的运算资源数据,并根据运算资源数据与所述第一预测压缩时间,分别预测电子装置压缩原始数据所需的多个第二预测压缩时间。服务器预测在各第二预测压缩时间中产生的第一新增数据,以及分别加总各预测压缩数据的数据量与第一新增数据的数据量,以获得多个参考值。服务器根据所述多个参考值中最小者所对应的所述多个压缩演算法中的预设压缩演算法,以产生推荐指令,以供电子装置根据推荐指令而以该预设压缩演算法进行数据备份。
根据本揭示文件的一实施例,数据备份系统中,该电子装置于判定该原始数据的该数据量大于一门槛值时,于该原始数据中产生一取样数据,以及该服务器分别根据所述多个压缩演算法,压缩该取样数据以获得多个取样压缩数据与对应所述多个取样压缩数据的多个取样压缩时间。
根据本揭示文件的一实施例,数据备份系统中,该服务器使用所述多个压缩演算法所对应的一数据成长曲线以及所述多个取样压缩数据的该数据量,预估该服务器压缩该原始数据后的所述预测压缩数据;以及该服务器使用所述多个压缩演算法所对应的一时间成长曲线以及所述多个取样压缩时间,预估该服务器压缩该原始数据所需的所述第一预测压缩时间。
根据本揭示文件的一实施例,数据备份系统中,该服务器还用以根据该预测压缩数据的该数据量与该电子装置的一数据传输速率,以计算一数据传输时间;以及该服务器分别加总该原始数据的该数据量、该预测压缩数据的该数据量、该第一新增数据的该数据量以及在该数据传输时间中的一第二新增数据的数据量,以获得所述多个参考值,该服务器根据所述多个参考值中最小者以产生该推荐指令。
根据本揭示文件的一实施例,数据备份系统中,该电子装置接收该推荐指令,并根据该推荐指令所指示的所述多个压缩演算法之一,对该原始数据进行压缩以产生一压缩数据,以及储存该压缩数据于该储存媒体;以及该电子装置传送该压缩数据至该服务器,并删除该储存媒体中的该原始数据。
根据另一实施例,揭示一种数据备份方法。数据备份方法包含以下步骤:通过服务器预估各自透过多个压缩演算法其中一者压缩原始数据时的预测压缩数据的数据量以及对应预测压缩数据的第一预测压缩时间。原始数据储存于与服务器通讯连接的电子装置。通过服务器来根据电子装置的运算资源数据与所述第一预测压缩时间,分别预测电子装置压缩原始数据所需的多个第二预测压缩时间。预测在各第二预测压缩时间中产生的第一新增数据。分别加总各该预测压缩数据的数据量与第一新增数据的数据量,以获得多个参考值。决定所述多个参考值中最小者所对应的所述多个压缩演算法中的预设压缩演算法,以产生推荐指令。以及,通过电子装置根据推荐指令而以该预设压缩演算法进行数据备份。
根据本揭示文件的一实施例,数据备份方法中,通过该电子装置判定该原始数据的该数据量大于一门槛值时,于该原始数据中产生一取样数据;以及通过该服务器分别根据所述多个压缩演算法,压缩该取样数据以获得多个取样压缩数据与对应所述多个取样压缩数据的多个取样压缩时间。
根据本揭示文件的一实施例,数据备份方法中,使用所述多个压缩演算法所对应的一数据成长曲线以及所述多个取样压缩数据的该数据量,预估该服务器压缩该原始数据后的所述预测压缩数据;以及使用所述多个压缩演算法所对应的一时间成长曲线以及所述多个取样压缩时间,预估该服务器压缩该原始数据所需的所述第一预测压缩时间。
根据本揭示文件的一实施例,数据备份方法中,根据该预测压缩数据的该数据量与该电子装置的一数据传输速率,计算一数据传输时间;分别加总该原始数据的该数据量、该预测压缩数据的该数据量、该第一新增数据的该数据量以及在该数据传输时间中的一第二新增数据的该数据量,以获得所述多个参考值;以及根据所述多个参考值中最小者以产生该推荐指令。
根据本揭示文件的一实施例,数据备份方法中,通过该电子装置接收该推荐指令,并根据该推荐指令所指示的所述多个压缩演算法之一,对该原始数据进行压缩以产生一压缩数据;储存该压缩数据于该电子装置的一储存媒体;以及通过该电子装置传送该压缩数据至该服务器,并删除该储存媒体中的该原始数据。
附图说明
以下详细描述结合随附附图阅读时,将有利于理解本揭示文件的态样。应注意,根据说明上实务的需求,附图中各特征并不一定按比例绘制。实际上,出于论述清晰的目的,可能任意增加或减小各特征的尺寸。
图1绘示根据本揭示文件一实施例中的数据备份系统的功能方块示意图;
图2绘示根据本揭示文件一实施例中的数据备份方法的步骤流程图;
图3绘示根据本揭示文件一实施例中的数据成长曲线的示意图;
图4绘示根据本揭示文件一实施例中的时间成长曲线的示意图;
图5绘示根据本揭示文件一实施例中的运算效能的曲线示意图。
具体实施方式
以下揭示内容提供许多不同实施例或实例,以便实施本发明的不同特征。下文描述元件及排列的特定实例以简化本发明。当然,所述多个实例仅为示例性且并不欲为限制性。举例而言,以下描述中在第二特征上方或第二特征上形成第一特征可包括以直接接触形成第一特征及第二特征的实施例,且亦可包括可在第一特征与第二特征之间形成额外特征使得第一特征及特征可不处于直接接触的实施例。另外,本发明可在各实例中重复元件符号及/或字母。此重复系出于简明性及清晰的目的,且本身并不指示所论述的各实施例及/或配置之间的关系。
请参照图1,其绘示根据本揭示文件一实施例中的数据备份系统的功能方块示意图。数据备份系统包含服务器110以及电子装置120。在一实施例中,数据备份系统可包含至少一个电子装置120。数据备份系统中,服务器110可与至少一个电子装置120进行通讯。
服务器110包含处理器111、通讯接口113以及储存媒体115。处理器111耦接于通讯接口113以及储存媒体115。电子装置120包含处理器121、通讯接口113以及储存媒体115。处理器121耦接于通讯接口123以及储存媒体125。
当电子装置120中的数据需要备份时,电子装置120将数据传送至服务器110。服务器110储存数据后,回传已完成备份程序的讯息至电子装置120。在一实施例中,在电子装置120执行备份程序之前,服务器110会根据电子装置120目前的状态,来提供适合的压缩演算法至电子装置120。电子装置120可以为移动装置、物联网(Internet of Things,IoT)设备、雾运算(Fog Computing)设备等。
请参照图2,其绘示根据本揭示文件一实施例中的数据备份方法的步骤流程图。请一并参阅图1及图2,在数据备份系统中,电子装置120的处理器121会控制储存媒体125所储存的数据量。一般而言,电子装置120的元件所产生的数据(例如感测器(未绘示)的数据等),或者是电子装置120接收自其他终端设备的数据(例如音频数据、视频数据等),这些数据以各自原始的数据格式被储存在电子装置120的储存媒体。为了控管电子装置120的储存空间,电子装置120会判断原始数据的数据量是否大于门槛值(例如储存媒体125的70%储存空间)。若原始数据的数据量大于门槛值,则处理器121会于原始数据中撷取一段取样数据,取样数据的数据量为小于原始数据的数据量。举例来说,原始数据的数据量为5GB(Gigabytes),取样数据的数据量为2MB(Megabytes)。取样数据透过通讯接口123被传送至服务器110。在一实施例中,取样数据会先被转换为位串流(Bit Stream),再进行后续数据传输。
服务器110的处理器111可以使用不同的压缩演算法来压缩数据。压缩演算法可以为无失真数据压缩(Lempel–Ziv–Storer–Szymanski,LZSS)、ZIP数据压缩、TGZ数据压缩、蓝波-立夫-卫曲编码数据压缩(Lempel-Ziv-Welch,LZW)等。服务器110于接收到原始数据后,在步骤S220中,处理器111根据多个压缩演算法分别压缩取样数据,以获得多个取样压缩数据与多个取样压缩时间。以LZSS压缩演算法为例,处理器111对数据量为2MB的取样数据进行压缩,花费了2秒时间来产生300KB的取样压缩数据。处理器111记录300KB的数据量与2秒的取样压缩时间。以此类推,处理器111使用ZIP压缩演算法来压缩数据量为2MB的取样数据,花费了2.2秒的时间来产生320KB的压缩数据。因此,服务器110可以获得多个对应至各压缩演算法的取样压缩数据的数据量与取样压缩时间。
服务器110取得取样数据的相关压缩信息后,可以估算对原始数据进行压缩所需的压缩时间以及压缩后的文件大小。在步骤S230中,服务器110的处理器111预估当分别根据多个压缩演算法来压缩原始数据时,所产生的多个预测压缩数据的数据量与多个第一压缩时间。服务器110是根据预先建立的数据压缩预估模型来求得预测压缩数据的数据量与第一压缩时间。举例来说,建立数据压缩预估模型的方法包含搜集多个不同的数据,取这些数据中的不同数据大小的片段,使用各种数据压缩演算法对各片段压缩。压缩完成后,分别记录各片段压缩后数据大小以及所需的压缩时间。接着,根据片段的数据量与对应的压缩后数据大小,计算线性回归而获得数据成长曲线。
请参照图3,其绘示根据本揭示文件一实施例中的数据成长曲线的示意图。如图3所示,座标水平轴为数据量,座标垂直轴为压缩后的数据大小。数据成长曲线C(x)为前述线性回归计算后所获得的曲线。各种数据压缩演算法会有对应的数据成长曲线C(x),图3系以LZSS演算法作为说明。下表一为本方法中执行各数据压缩演算法后,使用线性回归计算前述压缩数据大小所得到的值。本方法可运用其他的数据压缩演算法来获得值,下表一仅以LZSS演算法与ZIP演算法作例示性说明。
表一:压缩数据大小成长趋势
压缩方法 | 100KB | 1MB | 10MB | 5GB | … |
LZSS | 20KB | 220KB | 2MB | 1.1GB | … |
ZIP | 30KB | 314KB | 2.8MB | 1.6GB | … |
服务器110使用数据成长曲线C(x)来预估原始数据被压缩之后的压缩数据的大小。在一实施例中,数据成长曲线C(x)上的c1’点座标为(2MB,100KB),c2’点座标为(5GB,250MB)。服务器110对2MB的取样数据进行压缩后,获得的压缩后数据大小为200KB,即图3的c1点,其座标为(2MB,200KB)。由于在相同压缩率下,压缩的数据量越大,产生的压缩数据的大小也会随着增加。因此,数据成长曲线C(x)的曲线斜率会接近于实际上取样点的曲线斜率。服务器110在取得c1点后,可以依据数据成长曲线C(x)的斜率以及c1点座标,来计算c2点的y值。计算公式如下:
如此,计算出的y值即为原始数据经过压缩之后的预估数据大小。
相似地,根据前述片段的数据量与对应的所需压缩时间,计算线性回归而获得时间成长曲线。请参照图4,绘示根据本揭示文件一实施例中的时间成长曲线T(x)的示意图。同样地,时间成长曲线T(x)的曲线斜率会接近于实际上取样点的曲线斜率。服务器110在取得t1点后,可以依据时间成长曲线T(x)的斜率以及t1点座标,来计算出t2点的y值,而获得对原始数据进行压缩所需要的预估压缩时间。下表二为本方法中执行各压缩演算法所需的压缩时间,将这些压缩时间进行线性回归计算后所得到的值。本方法可运用其他的数据压缩演算法来获得值,下表二仅以LZSS演算法与ZIP演算法作例示性说明。
表二:压缩时间成长趋势
压缩方法 | 100KB | 1MB | 10MB | 5GB | … |
LZSS | 1秒 | 8秒 | 49秒 | … | … |
ZIP | 0.9秒 | 7秒 | 41秒 | … | … |
值得一提的是,前述原始数据的预估压缩时间,为服务器110对原始数据进行数据压缩所作的预估时间。由于电子装置120的运算能力不一定与服务器110的运算能力相同(通常电子装置120的运算能力略差),电子装置120的运算能力也无法保持在可使用百分的百的状态,因此需要再对此预估压缩时间进行调整。
请复参照图2,在步骤S240中,服务器110根据电子装置120的运算资源数据与所述多个第一预测压缩时间,分别预估电子装置120压缩原始数据所需的多个第二预测压缩时间。请一并参照图5,其绘示根据本揭示文件一实施例中的运算效能曲线CU(x)的示意图。服务器110定期接收电子装置120的客户端状态(client state)数据,并根据客户端状态数据(例如处理器效能数据)来训练运算资源模型。在一实施例中,运算效能曲线CU(x)为经过训练运算后所获得的曲线,指示未来某个时间点,电子装置120的运算效能百分比。由于运算效能曲线CU(x)以下的面积为预测电子装置120忙碌于其他任务所使用的效能。因此,本方法计算运算效能曲线CU(x)至100%运算效能之间的面积,作为电子装置120可用于数据压缩的可用运算资源,如图5所示的灰色面积。在一实施例中,训练运算资源模型的方法可以为使用支援向量回归(Support Vector Regression,SVR)演算法来建立的模型。
在一实施例中,若服务器110的处理器111以100%的运算资源来压缩原始数据,并预估所需的压缩时间为3分钟,代表压缩原始数据总共需要的资源为100×3。接着,本方法根据此总运算资源来换算电子装置120所需要的压缩时间,计算公式举例如下:
100×3≤[(100-80)×1]+[(100-70)×1]+[(100-50)×1]+[(100-50)×1]+[(100-40)×1]+[(100-30)×1]+[(100-30)×1]=350
由上述公式中,第1分钟可用20运算资源、第2分钟可用30运算资源且累计总共可用50运算资源,以此类推,计算至第7分钟时,累计总共可用运算资源为350。由于需要大于前述的运算资源300,因此换算结果可得到电子装置120需要7分钟才能完成原始数据的压缩。值得一提的是,服务器110会根据所有压缩演算法,将服务器110压缩所需的第一预测压缩时间换算为电子装置120的第二预测压缩时间。上述公式是以LSZZ压缩演算法为例。服务器110以不同的数据压缩演算法可以获得不同的第一预测压缩时间,因此在换算为电子装置120所需的第二预测压缩时间时,其时间长度也会因演算法而异。
接着,在步骤S250中,服务器110预测在各第二压缩时间中将产生的第一新增数据。举例来说,由于电子装置120在执行数据压缩时需要耗费时间,因此在压缩的过程中可能还会收到新的数据,例如电子装置120的感测器持续产生数据。由于电子装置120的储存媒体125已经高于门槛值,因此亦需要评估在电子装置120压缩数据的过程中,其整体的储存数据量是否高于储存媒体125的储存空间。
在步骤S260中,服务器110分别根据各个数据压缩演算法,加总这些预测压缩数据的数据量与第一新增数据的数据量,以获得多个参考值。举例来说,在7分钟内,电子装置120的储存媒体125除了储存有经压缩的原始数据,还储存有7分钟内新增加的数据。接着,在步骤S270中,通过决定最小的参考值,以产生推荐指令。由于本方法可以计算出整体而言最适合电子装置120使用的数据压缩演算法。推荐指令为用以指示电子装置120应使用的数据压缩演算法。另一方面,若最后算出的参考值(即总数据量)超过储存媒体125的储存空间,代表电子装置120若使用该数据压缩演算法将导致空间不足,则可先行过滤该数据压缩演算法。
在步骤S280,服务器110传送推荐指令至电子装置120。在步骤S290,电子装置120根据推荐指令进行数据备份。举例来说,电子装置120以推荐指令指示的数据压缩演算法开始对原始数据进行压缩,以产生压缩数据,并将压缩数据储存于储存媒体125。接着,压缩数据透过通讯接口123被传送至服务器110的储存媒体115。在确认完成数据传送之后,在电子装置120的储存媒体125所储存的原始数据将被删除。如此,完成数据备份程序。
在另一些实施例中,本方法考虑到在电子装置120进行数据备份程序中,即压缩数据被传送到服务器110的过程中,电子装置120可能会收到或产生第二新增数据。因此,本方法还包含根据电子装置120的数据传输速率来预估数据传输时间。举例来说,以第二新增数据除以数据传输速率,可以得到预估的数据传输时间。
在此实施例中,服务器110根据各个数据压缩演算法,分别加总原始数据的数据量、经压缩的原始数据的数据量、第一新增数据的数据量、以及第二新增数据的数据量,以获得多个参考值。通过决定最小的参考值来产生推荐指令,以提供电子装置120进行数据备份程序。另一方面,若最后算出的参考值(即总数据量)超过储存媒体125的储存空间,代表电子装置120若使用该数据压缩演算法将导致空间不足,则可先行过滤该数据压缩演算法。
在一实施例中,电子装置120会检查是否能执行推荐指令所指示的数据压缩演算法。若电子装置120判断无法执行该数据压缩演算法,则向服务器110请求提供数据压缩演算法的执行程序。
综上所述,本揭示文件的数据备份系统以及数据备份方法,可以在不需分析文件类型的情况下,提供最适合电子装置120当下进行的数据压缩演算法。另一方面,由于电子装置120的储存空间有限,无法花费太多的资源在储存经压缩数据上。因此,本揭示文件的数据备份系统以及数据备份方法可以让电子装置120使用当下最适合的数据压缩演算法进行备份,避免备份过程中造成储存空间不足,而使得备份程序被迫中断或失败的问题。
上文概述若干实施例的特征,使得熟悉此项技术者可更好地理解本发明的态样。熟悉此项技术者应了解,可轻易使用本发明作为设计或修改其他制程及结构的基础,以便实施本文所介绍的实施例的相同目的及/或实现相同优势。熟悉此项技术者亦应认识到,此类等效结构并未脱离本发明的精神及范畴,且可在不脱离本发明的精神及范畴的情况下产生本文的各种变化、替代及更改。
Claims (10)
1.一种数据备份系统,其特征在于,包含:
一电子装置,包含一储存媒体,用以储存一原始数据;以及
一服务器,通讯连接该电子装置,并预估该原始数据各自透过多个压缩演算法其中一者的压缩,而产生一预测压缩数据的一数据量以及对应该预测压缩数据的一第一预测压缩时间,其中该服务器撷取该电子装置的一运算资源数据,并根据该运算资源数据与所述第一预测压缩时间,而分别预测该电子装置压缩该原始数据所需的多个第二预测压缩时间;
其中该服务器预测在各该第二预测压缩时间中产生的一第一新增数据,并分别加总各该预测压缩数据的该数据量与该第一新增数据的该数据量,以获得多个参考值,其中该服务器根据所述多个参考值中最小者所对应的所述多个压缩演算法中的一预设压缩演算法以产生一推荐指令,以供该电子装置根据该推荐指令而以该预设压缩演算法进行数据备份。
2.根据权利要求1所述的数据备份系统,其特征在于,该电子装置于判定该原始数据的该数据量大于一门槛值时,于该原始数据中产生一取样数据,以及该服务器分别根据所述多个压缩演算法,压缩该取样数据以获得多个取样压缩数据与对应所述多个取样压缩数据的多个取样压缩时间。
3.根据权利要求2所述的数据备份系统,其特征在于,该服务器使用所述多个压缩演算法所对应的一数据成长曲线以及所述多个取样压缩数据的该数据量,预估该服务器压缩该原始数据后的所述预测压缩数据;以及
该服务器使用所述多个压缩演算法所对应的一时间成长曲线以及所述多个取样压缩时间,预估该服务器压缩该原始数据所需的所述第一预测压缩时间。
4.根据权利要求3所述的数据备份系统,其特征在于,该服务器还用以根据该预测压缩数据的该数据量与该电子装置的一数据传输速率,以计算一数据传输时间;以及
该服务器分别加总该原始数据的该数据量、该预测压缩数据的该数据量、该第一新增数据的该数据量以及在该数据传输时间中的一第二新增数据的数据量,以获得所述多个参考值,该服务器根据所述多个参考值中最小者以产生该推荐指令。
5.根据权利要求4所述的数据备份系统,其特征在于,该电子装置接收该推荐指令,并根据该推荐指令所指示的所述多个压缩演算法之一,对该原始数据进行压缩以产生一压缩数据,以及储存该压缩数据于该储存媒体;以及
该电子装置传送该压缩数据至该服务器,并删除该储存媒体中的该原始数据。
6.一种数据备份方法,其特征在于,包含:
通过一服务器预估该原始数据各自透过多个压缩演算法其中一者的压缩,而产生的一预测压缩数据的一数据量以及对应该预测压缩数据的一第一预测压缩时间,其中该原始数据储存于与该服务器通讯连接的一电子装置;
通过该服务器根据电子装置的一运算资源数据与所述第一预测压缩时间,而分别预测该电子装置压缩该原始数据所需的多个第二预测压缩时间;
预测在各该第二预测压缩时间中产生的一第一新增数据;
分别加总各该预测压缩数据的该数据量与该第一新增数据的该数据量,以获得多个参考值;
决定所述多个参考值中最小者所对应的所述多个压缩演算法中的一预设压缩演算法,以产生一推荐指令;以及
通过该电子装置根据该推荐指令而以该预设压缩演算法进行数据备份。
7.根据权利要求6所述的数据备份方法,其特征在于,还包含:
通过该电子装置判定该原始数据的该数据量大于一门槛值时,于该原始数据中产生一取样数据;以及
通过该服务器分别根据所述多个压缩演算法,压缩该取样数据以获得多个取样压缩数据与对应所述多个取样压缩数据的多个取样压缩时间。
8.根据权利要求7所述的数据备份方法,其特征在于,还包含:
使用所述多个压缩演算法所对应的一数据成长曲线以及所述多个取样压缩数据的该数据量,预估该服务器压缩该原始数据后的所述预测压缩数据;以及
使用所述多个压缩演算法所对应的一时间成长曲线以及所述多个取样压缩时间,预估该服务器压缩该原始数据所需的所述第一预测压缩时间。
9.根据权利要求8所述的数据备份方法,其特征在于,还包含:
根据该预测压缩数据的该数据量与该电子装置的一数据传输速率,计算一数据传输时间;
分别加总该原始数据的该数据量、该预测压缩数据的该数据量、该第一新增数据的该数据量以及在该数据传输时间中的一第二新增数据的该数据量,以获得所述多个参考值;以及
根据所述多个参考值中最小者以产生该推荐指令。
10.根据权利要求9所述的数据备份方法,其特征在于,还包含:
通过该电子装置接收该推荐指令,并根据该推荐指令所指示的所述多个压缩演算法之一,对该原始数据进行压缩以产生一压缩数据;
储存该压缩数据于该电子装置的一储存媒体;以及
通过该电子装置传送该压缩数据至该服务器,并删除该储存媒体中的该原始数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107136082A TWI694332B (zh) | 2018-10-12 | 2018-10-12 | 資料備份系統以及資料備份方法 |
TW107136082 | 2018-10-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111046006A true CN111046006A (zh) | 2020-04-21 |
Family
ID=70159073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811295208.5A Pending CN111046006A (zh) | 2018-10-12 | 2018-11-01 | 数据备份系统以及数据备份方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200117544A1 (zh) |
CN (1) | CN111046006A (zh) |
TW (1) | TWI694332B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11533063B2 (en) * | 2019-08-01 | 2022-12-20 | EMC IP Holding Company LLC | Techniques for determining compression tiers and using collected compression hints |
TWI783729B (zh) * | 2021-10-14 | 2022-11-11 | 財團法人資訊工業策進會 | 分散式資料傳輸容錯系統及其動態資源調整方法 |
TWI788084B (zh) * | 2021-11-03 | 2022-12-21 | 財團法人資訊工業策進會 | 運算裝置以及資料備份方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1570885A (zh) * | 2003-07-21 | 2005-01-26 | 万国电脑股份有限公司 | 具备最佳化压缩管理机制的储存装置 |
US20100095108A1 (en) * | 2008-10-12 | 2010-04-15 | Fujitsu Limited | Data transfer device and data transfer method |
US20110251986A1 (en) * | 2010-04-13 | 2011-10-13 | Empire Technology Development Llc | Combined-model data compression |
US8806062B1 (en) * | 2009-03-27 | 2014-08-12 | Symantec Corporation | Adaptive compression using a sampling based heuristic |
US8832044B1 (en) * | 2009-03-04 | 2014-09-09 | Symantec Corporation | Techniques for managing data compression in a data protection system |
TWM495558U (zh) * | 2014-11-14 | 2015-02-11 | Wearebricks Co Ltd | 資料備份還原系統 |
US20150088945A1 (en) * | 2013-09-25 | 2015-03-26 | Nec Laboratories America, Inc. | Adaptive compression supporting output size thresholds |
CN105339924A (zh) * | 2013-05-22 | 2016-02-17 | 亚马逊科技公司 | 作为服务的有效数据压缩和分析 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW266357B (en) * | 1994-09-27 | 1995-12-21 | Ewb & Associates Inc | Data compression system |
TW201617871A (zh) * | 2014-11-14 | 2016-05-16 | 積躍股份有限公司 | 資料備份還原系統及其方法 |
TWI554893B (zh) * | 2014-12-03 | 2016-10-21 | 仁寶電腦工業股份有限公司 | 資料傳輸方法及系統 |
-
2018
- 2018-10-12 TW TW107136082A patent/TWI694332B/zh active
- 2018-11-01 CN CN201811295208.5A patent/CN111046006A/zh active Pending
- 2018-11-19 US US16/194,398 patent/US20200117544A1/en not_active Abandoned
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1570885A (zh) * | 2003-07-21 | 2005-01-26 | 万国电脑股份有限公司 | 具备最佳化压缩管理机制的储存装置 |
US20100095108A1 (en) * | 2008-10-12 | 2010-04-15 | Fujitsu Limited | Data transfer device and data transfer method |
US8832044B1 (en) * | 2009-03-04 | 2014-09-09 | Symantec Corporation | Techniques for managing data compression in a data protection system |
US8806062B1 (en) * | 2009-03-27 | 2014-08-12 | Symantec Corporation | Adaptive compression using a sampling based heuristic |
US20110251986A1 (en) * | 2010-04-13 | 2011-10-13 | Empire Technology Development Llc | Combined-model data compression |
CN105339924A (zh) * | 2013-05-22 | 2016-02-17 | 亚马逊科技公司 | 作为服务的有效数据压缩和分析 |
US20150088945A1 (en) * | 2013-09-25 | 2015-03-26 | Nec Laboratories America, Inc. | Adaptive compression supporting output size thresholds |
TWM495558U (zh) * | 2014-11-14 | 2015-02-11 | Wearebricks Co Ltd | 資料備份還原系統 |
Also Published As
Publication number | Publication date |
---|---|
TWI694332B (zh) | 2020-05-21 |
US20200117544A1 (en) | 2020-04-16 |
TW202014900A (zh) | 2020-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111046006A (zh) | 数据备份系统以及数据备份方法 | |
US7843823B2 (en) | Techniques for balancing throughput and compression in a network communication system | |
CN110535869B (zh) | 一种基于压缩算法的数据传输方法、终端设备及存储介质 | |
JP5164866B2 (ja) | ビデオ画像シーケンスの時間的頻度を適合させる方法および装置 | |
CN110248189B (zh) | 一种视频质量预测方法、装置、介质和电子设备 | |
CN105718538A (zh) | 一种分布式文件系统的自适应压缩方法及系统 | |
CN110187838B (zh) | 数据io信息处理方法、分析方法、装置和相关设备 | |
CN108512817B (zh) | 多视频转码调度方法及装置 | |
JP2012198598A (ja) | データ保存装置、データ保存方法 | |
WO2021036103A1 (zh) | 图像数据的压缩传输方法、系统和计算机可读存储介质 | |
CN114466194A (zh) | 视频编码的调整方法和装置、存储介质及电子设备 | |
JP2014164568A (ja) | 端末装置、分散処理方法、分散処理プログラムおよび分散処理システム | |
CN104426942A (zh) | 文件上传方法及系统 | |
CN113923723B (zh) | 流量重构方法、装置、设备及存储介质 | |
WO2024131593A1 (zh) | 压缩模型更新方法、装置、系统和存储介质 | |
WO2021147319A1 (zh) | 一种数据处理方法、装置、设备及介质 | |
CN105530658A (zh) | 一种无线通讯模块的远程诊断方法、装置和系统 | |
CN109560978A (zh) | 网络流量检测方法、装置及系统和计算机可读存储介质 | |
CN109218435B (zh) | 一种数据上传方法及系统 | |
CN104038307A (zh) | 数据流传输系统及方法 | |
CN111510715B (zh) | 视频处理方法、系统、计算机设备及存储介质 | |
CN111935237A (zh) | 日志处理方法及系统、电子设备及存储介质 | |
CN113850390A (zh) | 联邦学习系统中共享数据的方法、装置、设备及介质 | |
CN108347451B (zh) | 图片处理系统、方法和装置 | |
EP2813033B1 (en) | Technique for projecting network load in a communication network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200421 |