CN107040740A - 基于信息散度的视频大数据冗余删除方法 - Google Patents

基于信息散度的视频大数据冗余删除方法 Download PDF

Info

Publication number
CN107040740A
CN107040740A CN201710281352.2A CN201710281352A CN107040740A CN 107040740 A CN107040740 A CN 107040740A CN 201710281352 A CN201710281352 A CN 201710281352A CN 107040740 A CN107040740 A CN 107040740A
Authority
CN
China
Prior art keywords
video
contribution
big data
image
information content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710281352.2A
Other languages
English (en)
Other versions
CN107040740B (zh
Inventor
甘新标
刘杰
杨灿群
徐涵
胡庆丰
龚春叶
李胜国
邹丹
晏益慧
黄嘉昆
熊成伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201710281352.2A priority Critical patent/CN107040740B/zh
Publication of CN107040740A publication Critical patent/CN107040740A/zh
Application granted granted Critical
Publication of CN107040740B publication Critical patent/CN107040740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于信息散度的视频大数据冗余删除方法,目的是提出一种冗余视频数据删除方法,节省存储容量,减少视频大数据计算分析时间,提高视频大数据维护管理的效率。技术方案是先将视频大数据用视频大数据集V来表示,对V进行归一化,然后定义面向视频图像帧矢量的K‑L散度和信息量分布矩阵M_L,确认各视频图像帧矢量对V的信息量贡献,删除V中的信息量贡献最小的冗余视频图像帧。采用本发明能缓解视频数据的存储压力,提高视频数据存储效率,加快视频大数据计算分析速率,提升整个大数据视频应用系统的运营效率。

Description

基于信息散度的视频大数据冗余删除方法
技术领域
本发明涉及冗余删除方法,尤其涉及信息领域视频大数据冗余的删除方法。
背景技术
随着社会信息化不断推进,信息存储应用领域越来越广泛,在过去的5年内全球数字化信息量增长迅速,已从之前的TB级上升到PB级,甚至EB级。随着大数据时代的来临,数据增长将是大型企业部署lT设施的最大挑战,随着数据规模和数据体积的持续增大,一方面需要投入巨额资金购置存储容量,另一方面数据的计算分析运营成本也将显著增加。
研究表明,在备份和归档存储等应用系统所保存的数据中,高达80%~90%的数据是冗余的,而随着时间推移,冗余数据的比例也将继续上升。因此,存储系统中数据高冗余问题受到越来越多研究人员的关注,如何缩减存储系统数据存储容量已成为一个热门的研究课题,而重复数据冗余删除技术是其中一种容量优化技术,它通过消除存储系统中冗余的数据,缩减系统中实际存储的数据或通过网络传输的数据,在备份、长期归档和数据灾难恢复等方面已得到了广泛的应用。在工业界,DataDomain DDFs,IBM Diligent,EMC的Avarma,Veritas的PureDisk以及CommVault的Shpana是比较知名的冗余数据删除产品,这些产品通常可以达到20:1的冗余数据删除率;同时,学术界也进行了深入研究,包括美国的MIT、OSU、UC和Stanford等大学,德国Paderbom大学,英国剑桥大学,以及中国的CUHK、清华大学、国防科技大学以及华中科技大学等高校。
冗余数据删除是基于数据自身的冗余度来检测数据流中的相同数据对象,只传输和存储唯一的数据对象副本,并使用指向唯一数据对象副本的引用或关联来替换其他冗余。相比于传统的数据压缩技术,冗余数据删除技术不仅可以消除文件内的数据重复,还能消除共享数据集内文件之间的数据重复。根据实施冗余数据删除操作位置的不同,分为源和目标端冗余数据删除;根据实施冗余数据删除操作时机的不同,分为离线、近线和在线删除;根据实施冗余数据删除操作粒度的不同,分为文件级和块级删除;根据冗余数据删除所服务数据实体的存储与访问方式的不同,分为主存储和从存储删除。
无论是源和目标端冗余数据删除、离线、近线和在线删除、文件级和块级删除,还是主存储和从存储删除,冗余数据删除的对象几乎都是重复数据删除,对于非简单重复而有关联关系的冗余数据即一个数据对象可以由其它数据对象来表示的冗余数据,上述各种数据删除技术就无能为力了。
大数据时代,视频数据量庞大,种类繁多,结构复杂,很多统计问题中将信息量作为统计的基本度量,如非线性统计问题,数据挖掘问题,投影寻踪问题等,在这些涉及到随机分布之间差异的问题中提出了大量的度量准则,一般称之为信息散度,即使用基于概率分布Q的编码来编码来自概率分布P的样本所需要的额外的比特数,是一种描述两个概率分布差异的一种方法。最早的信息散度是Kullback和Leibler提出的相对熵,也称K-L距离或K-L散度,是一种用来描述两信息量差异的方法。随着大数据时代的兴起,具有关联关系的视频数据冗余现象将越来越突出,面向视频大数据的冗余数据删除变得更加紧迫和重要。
如何基于K-L散度,解决面向视频大数据的冗余数据删除难题是本领域技术人员关注的重要技术问题。
发明内容
本发明要解决的技术问题在于:针对非简单重复而有关联关系的冗余视频数据,提出一种基于信息散度的视频大数据冗余删除方法,节省存储容量,减少视频大数据计算分析时间,提高视频大数据维护管理的效率。
为了解决上述技术问题,本发明的具体技术方案为:
第一步、将视频大数据进行归一化。具体方法如下:
1.1将视频大数据用视频大数据集V来表示,
V∈RL×N,视频大数据以数字化形式呈现,R表示实数,RL×N表示规模为L×N的实数矩阵,每个视频均由多个视频图像帧组成,N为V中的视频个数,L是V中的N个视频中视频图像帧的个数的最大值(对于视频图像帧数小于L的视频,其对应的视频图像帧可以补0填充,因此V中的每个视频中视频图像帧的个数可以均为L),L和N均为正整数,Vi表示V中N个视频的第i个视
频图像帧组成的矢量集合,简称视频图像帧矢量,1≤i≤L,Vi=[vi1,vi2,…vij,…viN],vij表示Vi中第j个视频的第i个视频图像帧,vij是实数,1≤j≤N;
1.2将V中的V1,V2,…,Vi,…VL进行归一化,得到归一化后的视频图像帧矢量具体步骤如下:
1.2.1定义变量i=1;
1.2.2定义变量j=1;
1.2.3定义变量sum=0;
1.2.4执行sum=sum+vij
1.2.5j=j+1;
1.2.6若j≤N,转1.2.4,否则,转1.2.7;
1.2.7将Vi中的vi1,vi2,…vij,…viN分别除以sum,得到归一化后的视频图像帧
1.2.8i=i+1;
1.2.9若i≤L,转1.2.2,否则,转1.3;
1.3将归一化后的视频图像帧对应依次赋值给vi1,vi2,…vij,…viN
1.4将归一化后的视频图像帧矢量对应依次赋值给V1,V2,…,Vi,…VL
第二步、定义面向视频图像帧矢量的K-L散度,第i组视频图像帧矢量Vi相对于第i'组视频图像帧矢量Vi'的K-L散度M_L(Vi||Vi')定义为:
式(1)表示的意义是使用Vi'的信息表示Vi的信息所需要的额外比特数。所以,相对于视频图像帧Vi'来说,如果从V中去掉视频图像帧Vi,V便损失了大小为M_L(Vi||Vi')的信息量,另一方面,相对于视频图像帧Vi来说,如果去掉视频图像帧Vi',V便损失了大小为M_L(Vi'||Vi)的信息量。
第三步、为了分析V中视频图像帧之间的相关性,定义V的信息量分布矩阵M_L如公式(2)所示:
即:
M_Li,i'=M_L(Vi||Vi') (3)
M_Li,i'表示M_L中第i行第i'列处的元素,1≤i≤L,1≤i'≤L。M_L中的第i行用M_Li表示,M_Li中M_Li,i=0,假设除了M_Li,i,最小的元素为M_Li,i',将视频图像帧矢量Vi从V中移除,则视频图像帧Vi的大小为M_Li,i'的信息量随之丢失,视频图像帧Vi的信息量将由最接近它的视频图像帧矢量Vi'表示。因此,将视频图像帧Vi从V中移除造成的信息量损失为M_Li,i',即视频图像帧Vi对V的信息贡献量是M_Li,i',由于Vi对V的信息贡献量遵循短板原理,所以视频图像帧Vi对V的信息贡献量是M_Li中最小的元素。
第四步、确认V1,V2,…,Vi,…VL对V的信息量贡献,Vi对V的信息量贡献contribution(i)为M_Li中最小的元素值。
即:contribution(i)=min{M_Li,1,M_Li,2,…,M_Li,i',…M_Li,L} (4)
第五步、删除V中的信息量贡献最小的冗余视频图像帧。具体步骤如下:
5.1设定需要从V中保留的视频图像帧数K,1≤K≤L;
5.2计算V的信息量分布矩阵M_L。具体步骤如下:
5.2.1定义变量i=1;
5.2.2定义变量i'=1;
5.2.3根据公式(1)计算M_L(Vi||Vi');
5.2.4根据公式(3)令M_Li,i'=M_L(Vi||Vi');
5.2.5i'=i'+1;
5.2.6若i'≤L,转5.2.3,否则转5.2.7;
5.2.7i=i+1;
5.2.8若i≤L,转5.2.2,否则转5.3;
5.3定义删除的视频图像帧矢量集合
5.4确定最小贡献量,具体步骤如下:
5.4.1定义变量i=1;
5.4.2定义变量L'=L;
5.4.3根据式(4)计算contribution(i);
5.4.4i=i+1;
5.4.5若i≤L,转5.4.3,否则,转5.4.6;
5.4.6遴选视频大数据集合V中的最小信息贡献量的视频图像帧,方法是:
contribution=min{contribution(1),contribution(2),…contribution(ii),…,contribution(L')},contribution表示V1,V2,…,Vii,…VL'对V的最小信息贡献量,1≤ii≤L',令g为contribution对应的视频图像帧矢量的编号;
5.5更新V=V-{Vg},L'=L'-1,即,在V中删除编号g对应的视频图像帧矢量Vg,且V中视频图像帧矢量个数减少1个;
5.6更新S=S+{Vg},即将最小贡献量视频图像帧矢量Vg加入集合S;
5.7令num(S)为S中的视频图像帧矢量的数目;
5.8若num(S)<L-K,转5.4.6;否则,转第六步。
第六步、结束。
采用本发明可以达到以下技术效果:
1.第四步和第五步将视频大数据集合中贡献最小的视频数据帧矢量删除,缓解了视频数据的存储压力,提高了视频数据存储效率;
2.由于存储的视频冗余数据减少,加快了视频大数据计算分析速率,提升了整个大数据视频应用系统的运营效率。
附图说明
图1为本发明基于信息散度的视频大数据冗余删除方法总体流程图。
具体实施方式
图1为本发明的总体流程图,其具体实施步骤如下:
第一步、将视频大数据进行归一化。具体方法如下:
1.1将视频大数据用视频大数据集V来表示,
V∈RL×N,视频大数据以数字化形式呈现,R表示实数,RL×N表示规模为L×N的实数矩阵,每个视频均由多个视频图像帧组成,N为V中的视频个数,L是V中的N个视频中视频图像帧的个数的最大值,L和N均为正整数,Vi表示V中N个视频的第i个视频图像帧组成的矢量集合,简称视频图像帧矢量,1≤i≤L,Vi=[vi1,vi2,…vij,…viN],vij表示Vi中第j个视频的第i个视频图像帧,vij是实数,1≤j≤N;
1.2将V中的V1,V2,…,Vi,…VL进行归一化,得到归一化后的视频图像帧矢量具体步骤如下:
1.2.1定义变量i=1;
1.2.2定义变量j=1;
1.2.3定义变量sum=0;
1.2.4执行sum=sum+vij
1.2.5j=j+1;
1.2.6若j≤N,转1.2.4,否则,转1.2.7;
1.2.7将Vi中的vi1,vi2,…vij,…viN分别除以sum,得到归一化后的视频图像帧
1.2.8i=i+1;
1.2.9若i≤L,转1.2.2,否则,转1.3;
1.3将归一化后的视频图像帧对应依次赋值给vi1,vi2,…vij,…viN
1.4将归一化后的视频图像帧矢量对应依次赋值给V1,V2,…,Vi,VL
第二步、定义面向视频图像帧矢量的K-L散度,第i组视频图像帧矢量Vi相对于第i'组视频图像帧矢量Vi'的K-L散度M_L(Vi||Vi')定义为:
第三步、定义V的信息量分布矩阵M_L如公式(2)所示:
即:
M_Li,i'=M_L(Vi||Vi') (3)
M_Li,i'表示M_L中第i行第i'列处的元素,1≤i≤L,1≤i'≤L。M_L中的第i行用M_Li表示,M_Li中M_Li,i=0,假设除了M_Li,i,最小的元素为M_Li,i',将视频图像帧矢量Vi从V中移除,则视频图像帧Vi的大小为M_Li,i'的信息量随之丢失,视频图像帧Vi的信息量将由最接近它的视频图像帧矢量Vi'表示。因此,将视频图像帧Vi从V中移除造成的信息量损失为M_Li,i',即视频图像帧Vi对V的信息贡献量是M_Li,i'
第四步、确认V1,V2,…,Vi,VL对V的信息量贡献,Vi对V的信息量贡献contribution(i)为M_Li中最小的元素值。
即:contribution(i)=min{M_Li,1,M_Li,2,…,M_Li,i',…M_Li,L} (4)
第五步、删除V中的信息量贡献最小的冗余视频图像帧。具体步骤如下:
5.1设定需要从V中保留的视频图像帧数K,1≤K≤L;
5.2计算V的信息量分布矩阵M_L。具体步骤如下:
5.2.1定义变量i=1;
5.2.2定义变量i'=1;
5.2.3根据公式(1)计算M_L(Vi||Vi');
5.2.4根据公式(3)令M_Li,i'=M_L(Vi||Vi');
5.2.5i'=i'+1;
5.2.6若i'≤L,转5.2.3,否则转5.2.7;
5.2.7i=i+1;
5.2.8若i≤L,转5.2.2,否则转5.3;
5.3定义删除的视频图像帧矢量集合
5.4确定最小贡献量,具体步骤如下:
5.4.1定义变量i=1;
5.4.2定义变量L'=L;
5.4.3根据式(4)计算contribution(i);
5.4.4i=i+1;
5.4.5若i≤L,转5.4.3,否则,转5.4.6;
5.4.6遴选视频大数据集合V中的最小信息贡献量的视频图像帧,方法是:令contribution=min{contribution(1),contribution(2),…contribution(ii),…,contribution(L')},contribution表示V1,V2,…,Vii,…VL'对V的最小信息贡献量,1≤ii≤L',令g为contribution对应的视频图像帧矢量的编号;
5.5更新V=V-{Vg},L'=L'-1,即,在V中删除编号g对应的视频图像帧矢量Vg
5.6更新S=S+{Vg},即将最小贡献量视频图像帧矢量Vg加入集合S;
5.7令num(S)为S中的视频图像帧矢量的数目;
5.8若num(S)<L-K,转5.4.6;否则,转第六步。
第六步、结束。

Claims (3)

1.一种基于信息散度的视频大数据冗余删除方法,其特征在于包括以下步骤
第一步、将视频大数据进行归一化,具体方法如下:
1.1将视频大数据用视频大数据集V来表示,
V∈RL×N,视频大数据以数字化形式呈现,R表示实数,RL×N表示规模为L×N的实数矩阵,每个视频均由多个视频图像帧组成,N为V中的视频个数,L是V中的N个视频中视频图像帧的个数的最大值,L和N均为正整数,Vi表示V中N个视频的第i个视频图像帧组成的矢量集合,简称视频图像帧矢量,1≤i≤L,Vi=[vi1,vi2,…vij,…viN],vij表示Vi中第j个视频的第i个视频图像帧,vij是实数,1≤j≤N;
1.2将V中的V1,V2,…,Vi,…VL进行归一化,得到归一化后的视频图像帧和归一化后的视频图像帧矢量
1.3将归一化后的视频图像帧对应依次赋值给vi1,vi2,…vij,…viN
1.4将归一化后的视频图像帧矢量对应依次赋值给V1,V2,…,Vi,…VL
第二步、定义面向视频图像帧矢量的K-L散度,第i组视频图像帧矢量Vi相对于第i'组视频图像帧矢量Vi'的K-L散度M_L(Vi||Vi')定义为:
式(1)表示的意义是使用Vi'的信息表示Vi的信息所需要的额外比特数,相对于视频图像帧Vi'来说,如果从V中去掉视频图像帧Vi,V便损失了大小为M_L(Vi||Vi')的信息量,相对于视频图像帧Vi来说,如果去掉视频图像帧Vi',V便损失了大小为M_L(Vi'||Vi)的信息量;
第三步、定义V的信息量分布矩阵M_L如公式(2)所示:
即:
M_Li,i'=M_L(Vi||Vi') (3)
M_Li,i'表示M_L中第i行第i'列处的元素,1≤i≤L,1≤i'≤L;M_L中的第i行用M_Li表示,M_Li中M_Li,i=0,假设除了M_Li,i,最小的元素为M_Li,i',将视频图像帧矢量Vi从V中移除,则视频图像帧Vi的大小为M_Li,i'的信息量随之丢失,视频图像帧Vi的信息量将由最接近它的视频图像帧矢量Vi'表示;
第四步、确认V1,V2,…,Vi,…VL对V的信息量贡献,Vi对V的信息量贡献contribution(i)为M_Li中最小的元素值。
即:contribution(i)=min{M_Li,1,M_Li,2,…,M_Li,i',…M_Li,L} (4)
第五步、删除V中的信息量贡献最小的冗余视频图像帧,具体步骤如下:
5.1设定需要从V中保留的视频图像帧数K,1≤K≤L;
5.2计算V的信息量分布矩阵M_L;
5.3定义删除的视频图像帧矢量集合
5.4确定最小贡献量,具体步骤如下:
5.4.1定义变量i=1;
5.4.2定义变量L'=L;
5.4.3根据式(4)计算contribution(i);
5.4.4i=i+1;
5.4.5若i≤L,转5.4.3,否则,转5.4.6;
5.4.6遴选视频大数据集合V中的最小信息贡献量的视频图像帧,方法是:
contribution=min{contribution(1),contribution(2),…contribution(ii),…,contribution(L')},
contribution表示V1,V2,…,Vii,…VL'对V的最小信息贡献量,1≤ii≤L',
令g为contribution对应的视频图像帧矢量的编号;
5.5更新V=V-{Vg},L'=L'-1;
5.6更新S=S+{Vg};
5.7令num(S)为S中的视频图像帧矢量的数目;
5.8若num(S)<L-K,转5.4.6;否则,转第六步;
第六步、结束。
2.如权利要求1所述的一种基于信息散度的视频大数据冗余删除方法,其特征在于1.2步所述将V中的V1,V2,…,Vi,…VL进行归一化的具体步骤如下:
1.2.1定义变量i=1;
1.2.2定义变量j=1;
1.2.3定义变量sum=0;
1.2.4执行sum=sum+vij
1.2.5j=j+1;
1.2.6若j≤N,转1.2.4,否则,转1.2.7;
1.2.7将Vi中的vi1,vi2,…vij,…viN分别除以sum,得到归一化后的视频图像帧也即得到归一化后的
1.2.8i=i+1;
1.2.9若i≤L,转1.2.2,否则,归一化结束。
3.如权利要求1所述的一种基于信息散度的视频大数据冗余删除方法,其特征在于5.2步所述计算V的信息量分布矩阵M_L的具体步骤如下:
5.2.1定义变量i=1;
5.2.2定义变量i'=1;
5.2.3根据公式(1)计算M_L(Vi||Vi');
5.2.4根据公式(3)令M_Li,i'=M_L(Vi||Vi');
5.2.5i'=i'+1;
5.2.6若i'≤L,转5.2.3,否则转5.2.7;
5.2.7i=i+1;
5.2.8若i≤L,转5.2.2,否则计算结束,得到M_L。
CN201710281352.2A 2017-04-26 2017-04-26 基于信息散度的视频大数据冗余删除方法 Active CN107040740B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710281352.2A CN107040740B (zh) 2017-04-26 2017-04-26 基于信息散度的视频大数据冗余删除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710281352.2A CN107040740B (zh) 2017-04-26 2017-04-26 基于信息散度的视频大数据冗余删除方法

Publications (2)

Publication Number Publication Date
CN107040740A true CN107040740A (zh) 2017-08-11
CN107040740B CN107040740B (zh) 2019-05-14

Family

ID=59535851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710281352.2A Active CN107040740B (zh) 2017-04-26 2017-04-26 基于信息散度的视频大数据冗余删除方法

Country Status (1)

Country Link
CN (1) CN107040740B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100265346A1 (en) * 2007-12-13 2010-10-21 Keigo Iizuka Camera system and method for amalgamating images to create an omni-focused image
WO2012138032A1 (ko) * 2011-04-07 2012-10-11 엘지전자 주식회사 영상 정보 부호화 방법 및 복호화 방법
CN104182772A (zh) * 2014-08-19 2014-12-03 大连理工大学 一种基于深度学习的手势识别方法
CN104639944A (zh) * 2013-11-13 2015-05-20 安纳帕斯股份有限公司 运动估计的方法和使用该方法的图像处理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100265346A1 (en) * 2007-12-13 2010-10-21 Keigo Iizuka Camera system and method for amalgamating images to create an omni-focused image
WO2012138032A1 (ko) * 2011-04-07 2012-10-11 엘지전자 주식회사 영상 정보 부호화 방법 및 복호화 방법
CN104639944A (zh) * 2013-11-13 2015-05-20 安纳帕斯股份有限公司 运动估计的方法和使用该方法的图像处理装置
CN104182772A (zh) * 2014-08-19 2014-12-03 大连理工大学 一种基于深度学习的手势识别方法

Also Published As

Publication number Publication date
CN107040740B (zh) 2019-05-14

Similar Documents

Publication Publication Date Title
CN103177111B (zh) 重复数据删除系统及其删除方法
US9823975B2 (en) Efficient computation of sketches
CN103944981A (zh) 一种基于纠删码技术改进的云存储系统及实现方法
CN103118133A (zh) 基于文件访问频次的混合云存储方法
CN101467148A (zh) 利用了数据段的相似度的高效数据存储
US20140222770A1 (en) De-duplication data bank
EP3316150A1 (en) Method and apparatus for file compaction in key-value storage system
CN103761195A (zh) 一种利用分布式数据编码的存储方法
US11620065B2 (en) Variable length deduplication of stored data
CN103593264A (zh) 远距离广域网络容灾备份系统及方法
WO2021012162A1 (zh) 存储系统数据压缩的方法、装置、设备及可读存储介质
WO2024001974A1 (zh) 数据局部恢复方法、设备及存储介质
CN111208952B (zh) 一种存储系统扩容方法、可读存储介质及计算设备
CN108073472B (zh) 一种基于热度感知的内存纠删码分布方法
CN106991118A (zh) 基于ceph纠删除容错的读取文件方法及装置
CN110083487B (zh) 一种基于数据局部性的引用数据块碎片消除方法及系统
CN107040740B (zh) 基于信息散度的视频大数据冗余删除方法
US11397706B2 (en) System and method for reducing read amplification of archival storage using proactive consolidation
CN106201781B (zh) 一种基于右边正则纠删码的云数据存储方法
CN112698990A (zh) 一种备份数据时在线删除重复数据的方法
CN103885859B (zh) 一种基于全局统计的去碎片方法及系统
CN106484782A (zh) 一种基于多核哈希学习的大规模医学图像检索方法
CN111831480B (zh) 一种基于去重系统的分层编码方法、装置及去重系统
JP2014099848A (ja) イメージ分割システム及びその方法
CN107391560B (zh) 一种方差优化直方图的构建方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant