CN103023796A - 网络数据压缩方法和系统 - Google Patents

网络数据压缩方法和系统 Download PDF

Info

Publication number
CN103023796A
CN103023796A CN2012105727386A CN201210572738A CN103023796A CN 103023796 A CN103023796 A CN 103023796A CN 2012105727386 A CN2012105727386 A CN 2012105727386A CN 201210572738 A CN201210572738 A CN 201210572738A CN 103023796 A CN103023796 A CN 103023796A
Authority
CN
China
Prior art keywords
data
network
network data
finger print
print information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105727386A
Other languages
English (en)
Other versions
CN103023796B (zh
Inventor
刘进
须成忠
邱健聪
陈凯
闫茜
彭贤斌
向洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201210572738.6A priority Critical patent/CN103023796B/zh
Publication of CN103023796A publication Critical patent/CN103023796A/zh
Application granted granted Critical
Publication of CN103023796B publication Critical patent/CN103023796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

采用本发明提供了一种网络数据压缩方法和系统。所述方法包括:通过数据发送端判断网络数据对应的类型是否属于预设的网络流量类型,若是,则采用网络代理缓存实现网络数据的压缩得到所述网络数据对应的标识信息,并传输所述标识信息,若否,则采用网络冗余删除处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息;通过数据接收端接收所述指纹信息和标识信息,并根据所述标识信息提取曾缓存于所述数据接收端的网络数据,根据所述指纹信息恢复网络冗余处理前的网络数据;汇聚所述标识信息对应的网络数据和指纹信息对应的网络数据。采用本发明能降低计算开销同时不减少网络数据去冗率。

Description

网络数据压缩方法和系统
技术领域
本发明涉及计算机网络技术,特别是涉及一种网络数据压缩方法和系统。
背景技术
随着网络基础设施的发展,越来越多的高带宽网络为用户提供高速网络服务,然而,由于网络用户的激增和占用高带宽的应用越来越多,例如,多媒体应用等,使得网络带宽资源越来越紧缺,为增加网络带宽而产生的成本也越来越高。
为了避免网络带宽需求而产生的成本无限制地增加,各种减少网络流量的技术被应用于网络服务中,其中,最为有效的减少网络流量的新技术为网络冗余删除技术,网络冗余删除技术的原理是对传输的数据按一定的规则进行分块,并计算数据分块的指纹,双方网络设备保存首次经过的数据块和指纹到双方的字典中,待发现重复的数据块就使用字典中的指纹来来代替重复数据块的传输,当数据到达接收端后,接收端根据指纹信息从接收端的字典中恢复出相应的数据块即可,指纹信息的长度远小于数据块的长度,从而减少传输的数据量,达到减少网络带宽消耗目的。但是,网络冗余删除技术识别重复数据块计算量非常大,需要耗费较大的计算开销,同时对内存、存储空间、IO访问等方面有较大的处理开销需求。
发明内容
基于此,有必要提供一种能降低计算开销同时不减少网络数据去冗率的网络数据压缩方法。
此外,还用必要提供一种能降低计算开销同时不减少网络数据去冗率的网络数据压缩系统。
一种网络数据压缩方法,包括如下步骤:
通过数据发送端判断网络数据对应的类型是否属于预设的网络流量类型,若是,则采用网络代理缓存实现网络数据的压缩得到所述网络数据对应的标识信息,并传输所述标识信息,
若否,则采用网络冗余删除处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息;
通过数据接收端接收所述指纹信息和标识信息,并根据所述标识信息提取曾缓存于所述数据接收端的网络数据,根据所述指纹信息恢复网络冗余处理前的网络数据;
汇聚所述标识信息对应的网络数据和指纹信息对应的网络数据。
在其中一个实施例中,所述采用网络冗余处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息的步骤为:
对所述网络数据进行分块得到所述网络数据包含的数据块;
计算所述数据块的指纹信息;
判断所述数据块的指纹信息是否存在于数据发送端的字典中,若是,则将所述数据块对应的指纹信息代替数据块传输。在其中一个实施例中,所述采用网络冗余处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息的步骤还包括:
若判断到数据块的指纹信息不存在于数据发送端的字典中,则将所述数据块和指纹信息关联存入数据发送端的字典中,并传输所述数据块。
在其中一个实施例中,所述采用网络代理缓存实现网络数据的压缩得到所述网络数据对应的标识信息,并传输所述标识信息的步骤包括:
判断所述网络数据所对应的标识信息是否存在于缓存的网络数据中,若是,则
提取所述标识信息,并向所述数据接收端传输所述标识信息。
在其中一个实施例中,所述根据所述标识信息提取曾缓存于所述数据接收端网络数据,根据所述指纹信息恢复网络冗余处理前的网络数据的步骤包括:
从数据接收端缓存的网络数据中提取与所述接收到的标识信息对应的网络信息;
从数据接收端的字典中根据接收到的指纹信息提取相应的数据块,将所述提取得到的数据块汇聚恢复成冗余删除处理前的网络数据。
一种网络数据压缩系统,包括数据发送端和数据接收端,所述数据发送端包括:
类型判断模块,用于判断网络数据对应的类型是否属于预设的网络流量类型,若是,则通知网络代理缓存模块,若否,则通知冗余删除处理模块;
所述网络代理缓存模块用于采用网络代理缓存实现网络数据的压缩得到所述网络数据对应的标识信息,并传输所述标识信息;
所述冗余删除处理模块用于采用网络冗余处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息;
所述数据接收端包括:
数据恢复模块,用于通过数据接收端接收所述指纹信息和标识信息,并根据所述标识信息提取曾缓存于所述数据接收端网络数据,根据所述指纹信息恢复网络冗余处理前的网络数据;
汇聚模块,用于汇聚所述标识信息对应的网络数据和指纹信息对应的网络数据。
在其中一个实施例中,所述冗余删除处理模块包括:
分块单元,用于对所述网络数据进行分块得到所述网络数据包含的数据块;
指纹计算单元,用于计算所述数据块的指纹信息;
数据块处理单元,用于判断所述数据块的指纹信息是否存在于数据发送端的字典中,若是,则将所述数据块对应的指纹信息代替数据块传输。
在其中一个实施例中,所述数据块处理单元还用于若判断到数据块的指纹信息不存在于数据发送端的字典中,则将所述数据块和指纹信息关联存入数据发送端的字典中,并传输所述数据块。
在其中一个实施例中,所述网络代理缓存模块还用于判断所述网络数据所对应的标识信息是否存在于缓存的网络数据中,若是,则提取所述标识信息,并向所述数据接收端传输所述标识信息。
在其中一个实施例中,所述数据恢复模块包括:
缓存提取单元,用于从数据接收端中缓存的网络数据中提取与所述接收到的标识信息对应的网络数据;
冗余恢复单元,用于从数据接收端的字典中根据接收到的指纹信息提取相应的数据块,将所述提取得到的数据块形成冗余删除处理前的网络数据。
上述网络数据压缩方法和系统,在对网络数据进行传输的过程中,首先对与预设的网络流量类型相符的网络数据进行代理缓存处理后传输,而与预设的网络流量类型并不相符的网络数据,则通过网络冗余删除处理进行网络数据的压缩,而在数据接收端只需要根据接收的缓存处理后标识信息和冗余删除处理后的指纹信息进行数据恢复即可,由于对部分网络数据只需要进行标识信息的传输,而不需要进行冗余删除处理,因此减少了需要进行冗余删除处理的数据量,从而降低网络流量的基础上降低计算开销同时不减少网络数据去冗率。
附图说明
图1为一个实施例中网络数据压缩方法的流程图;
图2为一个实施例中采用网络冗余删除处理来实现网络数据的压缩得到网络数据对应的指纹信息,并传输指纹信息的方法流程图;
图3为一个实施例中根据标识信息提取曾缓存于数据接收端的网络数据,并根据指纹信息恢复网络冗余处理前的网络数据的方法流程图;
图4为一个实施例中网络数据压缩方法的应用示意图;
图5为一个实施例中网络数据压缩系统的结构示意图;
图6为图5中冗余删除处理模块的结构示意图。
具体实施方式
如图1所示,在一个实施例中,一种网络数据压缩方法,包括如下步骤:
步骤S110,通过数据发送端判断网络数据对应的类型是否属于预设的网络流量类型,若是,则进入步骤S130,若否,则进入步骤S150。
本实施例中,在进行网络数据的传输之前,将首先进行该网络数据所属的网络流量类型的判断,以方便根据不同的网络流量类型选取适当的网络数据压缩方法,以提高网络数据的压缩效率,进而大大地降低花费的网络带宽。
在一个实施例中,网络数据可包括静态网页所对应的网络数据、动态网页所对应的网络数据以及视频数据等,而预设的网络流量类型将包括了静态网页所对应的网络数据等,若数据发送端判断到网络数据所对应的类型是为静态网页所对应的网络数据,则进入步骤S130中对该网络数据进行网络代理缓存处理,若判断到网络数据所对应的类型为并不是预设的网络流量类型,则进入步骤S150对该网络数据通过网络冗余删除处理的方式进行压缩,以降低花费的网络流量。
步骤S130,采用网络代理缓存实现网络数据的压缩得到网络数据对应的标识信息,并传输标识信息。
本实施例中,若判断到数据发送端所发送的网络数据对应的类型属于预设的网络流量类型,则应用网络代理缓存对网络数据进行压缩。
网络代理缓存用于减少网络流量,是将用户访问过的网络数据进行缓存,存放于一个副本中,当该网络数据再次被访问时,直接从缓存的网络数据中获取所访问的网络数据。
若网络数据属于预设的网络流量类型,为静态网页所对应的网络数据,数据发送端和数据接收端均会对首次经过的网络数据进行缓存,在优选的实施例中,以标识信息为索引对首次经过的网络数据进行缓存。该标识信息可以是网络数据所对应的网络地址或者指纹信息,但并不仅限于此。
对静态网页所对应的网络数据进行缓存,以待再次传输该网络数据时,只需要在数据发送端中判断该网络数据是否已被缓存,若是,则说明该网络数据也被缓存于数据接收端中,因此,只需要提取该网络数据对应的标识信息,并传输即可,而不需要再进行该网络数据的传输,进而减少了网络流量的耗费。
进一步的,在进行传输之前,还将对传输的标识信息通过标准压缩方法进行压缩,以进一步降低耗费的网络流量。
在一个实施例中,上述步骤S130的具体过程为:
判断网络数据所对应的标识信息是否存在于缓存的网络数据中,若是,则提取标识信息,并向数据接收端传输标识信息,若否,则将缓存所述标识信息。
本实施例中,判断网络数据中记录的标识信息是否在于到数据发送端缓存的网络数据中,若是,则说明数据发送端也缓存了这一网络数据,因此不需要对这一网络数据进行传输,只需要传输相应的标识信息即可。
若判断到网络数据中记录的标识信息并未存储于数据发送端缓存的网络数据中,则说明该网络数据是首次进行传输,因此,需要对标识信息进行缓存。
在优选的实施例中,对于首次传输的网络数据,可在数据发送端进行标识信息的缓存,在数据接收端进行标识信息和网络数据的缓存,以节省存储空间,降低存储所耗费的成本。
步骤S150,采用网络冗余删除处理来实现网络数据的压缩得到网络数据对应的指纹信息,并传输指纹信息。
本实施例中,应用网络冗余删除技术对未与预设的网络流量类型相符的网络数据进行压缩,并将完成了网络冗余删除处理的网络数据所对应的指纹信息由数据发送端传输至数据接收端。
进一步的,在进行传输之前,网络冗余删除处理后的网络数据还将通过标准压缩方法进行压缩,进而将经过标准压缩方法所得到的网络数据通过互联网络传输至数据接收端。
其中,标准压缩方法即为无损数据压缩方法,主要包括游程编码、Huffman编码、算术编码和LZ系列压缩等,可根据实际的运营情况灵活地进行选取。
如图2所示,在一个实施例中,上述步骤S150的具体过程为:
步骤S151,对网络数据进行分块得到网络数据包含的数据块。
本实施例中,对待传输的网络数据进行分块,以得到网络数据中包含的若干个数据块。
步骤S152,计算数据块的指纹信息。
本实施例中,指纹信息用于指定数据块中的内容信息,即对数据块进行唯一标识,进而可通过计算得到的指纹信息区分每一数据块。
步骤S153,判断数据块的指纹信息是否存在于数据发送端的字典中,若是,则进入步骤S154,若否,则进入步骤S155。
本实施例中,数据发送端和数据接收端均会保存首次经过的数据块和该数据块所对应的指纹信息。在优选的实施例中,数据块和指纹信息在数据发送端和数据接收端将被存储于字典中,以通过字典实现快速地查找。
对字典中存储的指纹信息进行查找,判断是否存在与该数据块的指纹信息相一致的指纹信息,若是,则说明该数块曾经进行传输,并且已经被存储于数据接收端的字典中,此时,只需要将该数据块替换为相应的指纹信息,并传输替换的指纹信息即可,不再需要对该数据块进行传输。
由于指纹信息的长度远小于数据块的长度,因此,将数据块替换成指纹信息进行传输将大大降低了网络流量,进而降低带宽成本。
步骤S154,将数据块对应的指纹信息代理数据块代替数据块传输。
步骤S155,将数据块和指纹信息关联存入字典中,并传输数据块。
本实施例中,若判断到数据块的指纹信息并未存储于字典中,则该数据块是首次经由数据发送端进行传输,因此,应当将该数据块和对应的指纹信息关联存入字典中,以方便再次传输该数据块时进行查找。
步骤S170,通过数据接收端接收指纹信息和标识信息,并根据标识信息提取曾缓存于数据接收端的网络数据,并根据指纹信息恢复网络冗余处理前的网络数据。
本实施例中,在数据接收端接收到网络冗余删除处理后的数据和标识信息之后,将提取缓存的网络数据,并对网络冗余删除处理前的网络数据根据指纹信息进行恢复。
进一步的,在数据接收端根据接收到的指纹信息和标识信息根据标准解压缩方法进行解压。
如图3所示,在一个实施例中,上述根据标识信息提取曾缓存于数据接收端的网络数据,并根据指纹信息恢复网络冗余处理前的网络数据的具体过程为:
步骤S171,从数据接收端缓存的网络数据中提取与接收到的标识信息对应的网络信息。
步骤S173,从数据接收端的字典中根据接收到的指纹信息提取相应的数据块,将提取得到的数据块形成冗余删除处理前的网络数据。
本实施例中,在数据接收端的字典中根据接收到的指纹信息进行查找以得到与该指纹信息对应的数据块,而若干个数据块组合在一起将组成了传输的网络数据。
步骤S190,汇聚恢复的网络数据和提取的网络数据。
本实施例中,对恢复后的网络数据和经由代理缓存压缩之后进行传输的网络数据进行汇聚,以得到传输的所有网络数据。
下面结合一个具体的实施例来详细阐述上述网络数据压缩方法。该实施例中,如图4所示,通过数据发送端所发送的数据为原始数据,原始数据通过调度器进行类型判断,以获知该原始数据是否属于预设的网络流量类型,若该原始数据属于预设的网络流量类型,则对其时行网络代理缓存的方式进行传输,处理,即将原始数据的标识信息在进行标准压缩之后通过互联网络传输到数据接收端。
数据接收端在接收到标识信息之后解压缩,并根据解压缩得到的标识信息提取对应的网络数据,该提取得到的网络数据即为原始数据。
若该原始数据不属于预设的网络流量类型,则进行网络冗余删除处理得到相应的指纹信息;并将得到的指纹信息经过标准压缩之后通过互联网络传输到数据接收端。
在数据接收端接收到指纹信息并解压缩之后,将根据指纹信息在数据接收端所存储的字典中进行查找,以判断是否查找得到与接收到的指纹信息对应的数据块,若是,则提取数据块,进而恢复出原始数据。
上述网络数据压缩方法根据网络数据所属的不同网络流量类型选用不同的方式减少网络流量,由于代理缓存的方式无法对动态网页所对应的网络数据或视频数据产生较好的压缩效果,因此,在判断该网络数据为动态网页所对应的网络数据或视频数据时,将进行冗余删除处理,以保证很好的压缩效果。
如图5所示,在一个实施例中,一种网络数据压缩系统,包括数据发送端10和数据接收端30。
数据发送端10包括类型判断模块110、网络代理缓存模块130和冗余删除处理模块130。
类型判断模块110,用于判断网络数据对应的类型是否属于预设的网络流量类型,若是,则通知网络代理缓存模块130,若否,则通知冗余删除处理模块150。
本实施例中,在进行网络数据的传输之前,类型判断模块110将首先进行该网络数据所属的网络流量类型的判断,以方便根据不同的网络流量类型选取适当的网络数据压缩方法,以提高网络数据的压缩效率,进而大大地降低花费的网络流量。
在一个实施例中,网络数据可包括静态网页所对应的网络数据、动态网页所对应的网络数据以及视频数据等,而预设的网络流量类型将包括了静态网页所对应的网络数据等,若类型判断模块110判断到网络数据所对应的类型是为静态网页所对应的网络数据,则通知网络代理缓存模块130对该网络数据进行网络代理缓存处理,若判断到网络数据所对应的类型并不是预设的网络流量类型,则通知冗余删除处理模块150对该网络数据通过网络冗余删除处理的方式进行压缩,以降低花费的网络流量。
网络代理缓存模块130,用于采用网络代理缓存实现网络数据的压缩得到网络数据对应的标识信息,并传输标识信息。
本实施例中,若类型判断模块110判断到数据发送端所发送的网络数据对应的类型属于预设的网络流量类型,则网络代理缓存模块130应用网络代理缓存对网络数据进行压缩。
网络代理缓存用于减少网络流量,网络代理缓存模块130将用户访问过的网络数据进行缓存,存放于一个副本中,当该网络数据再次被访问时,直接从缓存的网络数据中获取所访问的网络数据。
若网络数据属于预设的网络流量类型,为静态网页所对应的网络数据,数据发送端和数据接收端均会对首次经过的网络数据进行缓存,在优选的实施例中,以标识信息为索引对首次经过的网络数据进行缓存。该标识信息可以是网络数据所对应的网络地址或者指纹信息,但并不仅限于此。
对静态网页所对应的网络数据进行缓存,以待再次传输该网络数据时,只需要网络代理缓存模块130在数据发送端中判断该网络数据是否已被缓存,若是,则说明该网络数据也被缓存于数据接收端中,因此,只需要提取该网络数据对应的标识信息,并传输即可,而不需要再进行该网络数据的传输,进而减少了网络流量的耗费。
进一步的,在进行传输之前,还将对传输的标识信息通过标准压缩方法进行压缩,以进一步降低耗费的网络流量。
在一个实施例中,网络代理缓存模块130还用于判断网络数据所对应的标识信息是否存在于缓存的网络数据中,若是,则提取标识信息,并向数据接收端传输标识信息,若否,则将缓存所述标识信息。
本实施例中,网络代理缓存模块130判断网络数据中记录的标识信息是否在于到数据发送端缓存的网络数据中,若是,则说明数据发送端也缓存了这一网络数据,因此不需要对这一网络数据进行传输,只需要传输相应的标识信息即可。
若网络代理缓存模块130判断到网络数据中记录的标识信息并未存储于数据发送端缓存的网络数据中,则说明该网络数据是首次进行传输,因此,需要对标识信息进行缓存。
在优选的实施例中,对于首次传输的网络数据,网络代理缓存模块130可在数据发送端进行标识信息的缓存,在数据接收端进行标识信息和网络数据的缓存,以节省存储空间,降低存储所耗费的成本。
冗余删除处理模块150,用于采用网络冗余处理来实现网络数据的压缩得到网络数据对应的指纹信息。
本实施例中,冗余删除处理模块150应用网络冗余删除技术对与预设的网络流量类型相符的网络数据进行压缩,并将完成了网络冗余删除处理的网络数据所对应的指纹信息由数据发送端传输至数据接收端。
进一步的,在进行传输之前,网络冗余删除处理后的网络数据还将通过标准压缩方法进行压缩,进而将经过标准压缩方法所得到的网络数据通过互联网络传输至数据接收端。
其中,标准压缩方法即为无损数据压缩方法,主要包括游程编码、Huffman编码、算术编码和LZ系列压缩等,可根据实际的运营情况灵活地进行选取。
如图6所示,上述冗余删除处理模块150包括分块单元151、指纹计算单元153和数据块处理单元155。
分块单元151,用于对网络数据进行分块得到网络数据包含的数据块。
本实施例中,分块单元151对待传输的网络数据进行分块,以得到网络数据中包含的若干个数据块。
指纹计算单元153,用于计算数据块的指纹信息。
数据块处理单元155,用于判断数据块的指纹信息是否存在于数据发送端的字典中,若是,则将数据块对应的指纹信息代替数据块传输,若否,则将数据块和指纹信息关联存入字典中,并传输数据块。
本实施例中,数据发送端和数据接收端均会保存首次经过的数据块和该数据块所对应的指纹信息。在优选的实施例中,数据块和指纹信息在数据发送端和数据接收端将被存储于字典中,以通过字典实现快速地查找。
数据块处理单元155对字典中存储的指纹信息进行查找,判断是否存在与该数据块的指纹信息相一致的指纹信息,若是,则说明该数块曾经进行传输,并且已经被存储于数据接收端的字典中,此时,只需要将该数据块替换为相应的指纹信息,并传输替换的指纹信息即可,不再需要对该数据块进行传输。
由于指纹信息的长度远小于数据块的长度,因此,将数据块替换成指纹信息进行传输将大大降低了网络流量,进而降低带宽成本。
若数据块处理单元155判断到数据块的指纹信息并未存储于字典中,则该数据块是首次经由数据发送端进行传输,因此,应当将该数据块和对应的指纹信息关联存入字典中,以方便再次传输该数据块时进行查找。
数据接收端30包括数据恢复模块310和汇聚模块330。
数据恢复模块310,用于通过数据接收端接收指纹信息和标识信息,并根据标识信息提取曾缓存于数据接收端网络数据,根据指纹信息恢复网络冗余处理前的网络数据。
本实施例中,在数据接收端接收到网络冗余删除处理后的数据和标识信息之后,数据恢复模块310将提取缓存的网络数据,并对网络冗余删除处理前的网络数据根据指纹信息进行恢复。
进一步的,在数据接收端根据接收到的指纹信息和标识信息根据标准解压缩方法进行解压。
在一个实施例中,上述数据恢复模块310包括缓存提取单元和冗余恢复单元。
缓存提取单元,用于从数据接收端中缓存的网络数据中提取与接收到的标识信息对应的网络信息。
冗余恢复单元,用于从数据接收端的字典中根据接收到的指纹信息提取相应的数据块,将提取得到的数据块形成冗余删除处理前的网络数据。
本实施例中,冗余恢复单元在数据接收端的字典中根据接收到的指纹信息进行查找以得到与该指纹信息对应的数据块,而若干个数据块组合在一起将组成了传输的网络数据
汇聚模块330,用于汇聚标识信息对应的网络数据和指纹信息对应的网络数据。
本实施例中,汇聚模块330对恢复后的网络数据和经由代理缓存压缩之后进行传输的网络数据进行汇聚,以得到传输的所有网络数据。
上述网络数据压缩方法和和系统,在对网络数据进行传输的过程中,首先对与预设的网络流量类型相符的网络数据进行代理缓存处理后传输,而与预设的网络流量类型并不相符的网络数据,则通过网络冗余删除处理进行网络数据的压缩,而在数据接收端只需要根据接收代理缓存处理后的标识信息和网络冗余删除处理后的指纹信息进行数据恢复即可,由于对部分网络数据只需要进行标识信息的传输,而不需要进行冗余删除处理,因此减少了需要进行冗余删除处理的数据量,从而降低网络流量的基础上降低了计算开销。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种网络数据压缩方法,包括如下步骤:
通过数据发送端判断网络数据对应的类型是否属于预设的网络流量类型,若是,则采用网络代理缓存实现网络数据的压缩得到所述网络数据对应的标识信息,并传输所述标识信息,
若否,则采用网络冗余删除处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息;
通过数据接收端接收所述指纹信息和标识信息,并根据所述标识信息提取曾缓存于所述数据接收端的网络数据,根据所述指纹信息恢复网络冗余处理前的网络数据;
汇聚所述标识信息对应的网络数据和指纹信息对应的网络数据。
2.根据权利要求1所述的网络数据压缩方法,其特征在于,所述采用网络冗余处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息的步骤为:
对所述网络数据进行分块得到所述网络数据包含的数据块;
计算所述数据块的指纹信息;
判断所述数据块的指纹信息是否存在于数据发送端的字典中,若是,则将所述数据块对应的指纹信息代替数据块传输。
3.根据权利要求2所述的网络数据压缩方法,其特征在于,所述采用网络冗余处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息的步骤还包括:
若判断到数据块的指纹信息不存在于数据发送端的字典中,则将所述数据块和指纹信息关联存入数据发送端的字典中,并传输所述数据块。
4.根据权利要求1所述的网络数据压缩方法,其特征在于,所述采用网络代理缓存实现网络数据的压缩得到所述网络数据对应的标识信息,并传输所述标识信息的步骤包括:
判断所述网络数据所对应的标识信息是否存在于缓存的网络数据中,若是,则
提取所述标识信息,并向所述数据接收端传输所述标识信息。
5.根据权利要求2所述的网络数据压缩方法,其特征在于,所述根据所述标识信息提取曾缓存于所述数据接收端网络数据,根据所述指纹信息恢复网络冗余处理前的网络数据的步骤包括:
从数据接收端缓存的网络数据中提取与所述接收到的标识信息对应的网络信息;
从数据接收端的字典中根据接收到的指纹信息提取相应的数据块,将所述提取得到的数据块形成冗余删除处理前的网络数据。
6.一种网络数据压缩系统,其特征在于,包括数据发送端和数据接收端,所述数据发送端包括:
类型判断模块,用于判断网络数据对应的类型是否属于预设的网络流量类型,若是,则通知网络代理缓存模块,若否,则通知冗余删除处理模块;
所述网络代理缓存模块用于采用网络代理缓存实现网络数据的压缩得到所述网络数据对应的标识信息,并传输所述标识信息;
所述冗余删除处理模块用于采用网络冗余处理来实现网络数据的压缩得到所述网络数据对应的指纹信息,并传输所述指纹信息;
所述数据接收端包括:
数据恢复模块,用于通过数据接收端接收所述指纹信息和标识信息,并根据所述标识信息提取曾缓存于所述数据接收端网络数据,根据所述指纹信息恢复网络冗余处理前的网络数据;
汇聚模块,用于汇聚所述标识信息对应的网络数据和指纹信息对应的网络数据。
7.根据权利要求6所述的网络数据压缩系统,其特征在于,所述冗余删除处理模块包括:
分块单元,用于对所述网络数据进行分块得到所述网络数据包含的数据块;
指纹计算单元,用于计算所述数据块的指纹信息;
数据块处理单元,用于判断所述数据块的指纹信息是否存在于数据发送端的字典中,若是,则将所述数据块对应的指纹信息代替数据块传输。
8.根据权利要求7所述的网络数据压缩系统,其特征在于,所述数据块处理单元还用于若判断到数据块的指纹信息不存在于数据发送端的字典中,则将所述数据块和指纹信息关联存入数据发送端的字典中,并传输所述数据块。
9.根据权利要求6所述的网络数据压缩系统,其特征在于,所述网络代理缓存模块还用于判断所述网络数据所对应的标识信息是否存在于缓存的网络数据中,若是,则提取所述标识信息,并向所述数据接收端传输所述标识信息。
10.根据权利要求7所述的网络数据压缩系统,其特征在于,所述数据恢复模块包括:
缓存提取单元,用于从数据接收端中缓存的网络数据中提取与所述接收到的标识信息对应的网络数据;
冗余恢复单元,用于从数据接收端的字典中根据接收到的指纹信息提取相应的数据块,将所述提取得到的数据块形成冗余删除处理前的网络数据。
CN201210572738.6A 2012-12-25 2012-12-25 网络数据压缩方法和系统 Active CN103023796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210572738.6A CN103023796B (zh) 2012-12-25 2012-12-25 网络数据压缩方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210572738.6A CN103023796B (zh) 2012-12-25 2012-12-25 网络数据压缩方法和系统

Publications (2)

Publication Number Publication Date
CN103023796A true CN103023796A (zh) 2013-04-03
CN103023796B CN103023796B (zh) 2015-08-19

Family

ID=47971940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210572738.6A Active CN103023796B (zh) 2012-12-25 2012-12-25 网络数据压缩方法和系统

Country Status (1)

Country Link
CN (1) CN103023796B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103634203A (zh) * 2013-11-29 2014-03-12 北京奇虎科技有限公司 消息异步传输方法、装置和系统
CN104184545A (zh) * 2013-05-27 2014-12-03 华为技术有限公司 一种传输数据的方法及解码端、编码端
CN104426838A (zh) * 2013-08-20 2015-03-18 中国移动通信集团北京有限公司 一种互联网缓存调度方法及系统
CN104468028A (zh) * 2013-09-25 2015-03-25 华为技术有限公司 一种数据编解码方法及设备
CN105608205A (zh) * 2015-12-25 2016-05-25 北京奇虎科技有限公司 结构化数据的指纹校验方法及装置
CN105812094A (zh) * 2016-03-07 2016-07-27 电信科学技术研究院 一种数据处理的方法、装置、终端及接入设备
CN108347468A (zh) * 2017-01-25 2018-07-31 电信科学技术研究院 一种进行数据同步的方法及设备
CN109743361A (zh) * 2018-12-14 2019-05-10 西安电子科技大学 一种内容增量交换网的数据处理方法、通信网络平台
CN112311686A (zh) * 2020-09-27 2021-02-02 长沙市到家悠享网络科技有限公司 一种数据处理方法、装置、电子设备及存储介质
CN112995268A (zh) * 2019-12-16 2021-06-18 现代自动车株式会社 管理车辆多媒体系统存储器的方法、记录介质和播放设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102082791A (zh) * 2010-12-31 2011-06-01 成都市华为赛门铁克科技有限公司 数据备份实现方法、客户端和服务器及系统
US20120173558A1 (en) * 2010-12-29 2012-07-05 Sorenson Iii James Christopher Receiver-Side Data Deduplication In Data Systems
CN102810075A (zh) * 2011-06-01 2012-12-05 英业达股份有限公司 事务型系统处理方法
CN102833298A (zh) * 2011-06-17 2012-12-19 英业达集团(天津)电子技术有限公司 分布式的重复数据删除系统及其处理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120173558A1 (en) * 2010-12-29 2012-07-05 Sorenson Iii James Christopher Receiver-Side Data Deduplication In Data Systems
CN102082791A (zh) * 2010-12-31 2011-06-01 成都市华为赛门铁克科技有限公司 数据备份实现方法、客户端和服务器及系统
CN102810075A (zh) * 2011-06-01 2012-12-05 英业达股份有限公司 事务型系统处理方法
CN102833298A (zh) * 2011-06-17 2012-12-19 英业达集团(天津)电子技术有限公司 分布式的重复数据删除系统及其处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANAND A, ET AL;: "An architecture for coordinated network-wide redundancy elimination", 《PROCEEDINGS OF THE ACM SIGCOMM CONFERENCE ON DATA COMMUNICATION》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104184545A (zh) * 2013-05-27 2014-12-03 华为技术有限公司 一种传输数据的方法及解码端、编码端
CN104184545B (zh) * 2013-05-27 2018-01-02 华为技术有限公司 一种传输数据的方法及解码端、编码端
CN104426838A (zh) * 2013-08-20 2015-03-18 中国移动通信集团北京有限公司 一种互联网缓存调度方法及系统
CN104426838B (zh) * 2013-08-20 2017-11-21 中国移动通信集团北京有限公司 一种互联网缓存调度方法及系统
CN104468028B (zh) * 2013-09-25 2018-11-16 华为技术有限公司 一种数据编解码方法及设备
CN104468028A (zh) * 2013-09-25 2015-03-25 华为技术有限公司 一种数据编解码方法及设备
CN103634203A (zh) * 2013-11-29 2014-03-12 北京奇虎科技有限公司 消息异步传输方法、装置和系统
CN105608205A (zh) * 2015-12-25 2016-05-25 北京奇虎科技有限公司 结构化数据的指纹校验方法及装置
CN105608205B (zh) * 2015-12-25 2019-05-14 北京奇虎科技有限公司 结构化数据的指纹校验方法及装置
CN105812094B (zh) * 2016-03-07 2019-08-02 电信科学技术研究院 一种数据处理的方法、装置、终端及接入设备
CN105812094A (zh) * 2016-03-07 2016-07-27 电信科学技术研究院 一种数据处理的方法、装置、终端及接入设备
CN108347468A (zh) * 2017-01-25 2018-07-31 电信科学技术研究院 一种进行数据同步的方法及设备
CN108347468B (zh) * 2017-01-25 2021-07-13 大唐移动通信设备有限公司 一种进行数据同步的方法及设备
CN109743361A (zh) * 2018-12-14 2019-05-10 西安电子科技大学 一种内容增量交换网的数据处理方法、通信网络平台
CN109743361B (zh) * 2018-12-14 2021-07-02 西安电子科技大学 一种内容增量交换网的数据处理方法、通信网络平台
CN112995268A (zh) * 2019-12-16 2021-06-18 现代自动车株式会社 管理车辆多媒体系统存储器的方法、记录介质和播放设备
CN112995268B (zh) * 2019-12-16 2024-05-28 现代自动车株式会社 管理车辆多媒体系统存储器的方法、记录介质和播放设备
CN112311686A (zh) * 2020-09-27 2021-02-02 长沙市到家悠享网络科技有限公司 一种数据处理方法、装置、电子设备及存储介质
CN112311686B (zh) * 2020-09-27 2022-09-30 长沙市到家悠享网络科技有限公司 一种数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN103023796B (zh) 2015-08-19

Similar Documents

Publication Publication Date Title
CN103023796B (zh) 网络数据压缩方法和系统
US10652265B2 (en) Method and apparatus for network forensics compression and storage
CN105204781B (zh) 压缩方法、装置和设备
WO2017193821A1 (zh) 云桌面图像处理方法、服务器、客户端及计算机存储介质
CN107832406B (zh) 海量日志数据的去重入库方法、装置、设备及存储介质
CN104424229B (zh) 一种多维度拆分的计算方法及系统
CN107046812A (zh) 一种数据保存方法和装置
CN108427539A (zh) 缓存设备数据的离线去重压缩方法、装置及可读存储介质
CN105511812B (zh) 一种存储系统大数据优化方法及装置
CN103118104B (zh) 一种基于版本矢量的数据还原方法及服务器
CN107404654B (zh) 一种jpeg图像解压缩方法、装置及平台
CN104768079B (zh) 多媒体资源分发方法、装置及系统
CN104252466A (zh) 流计算处理方法、设备和系统
CN108134775A (zh) 一种数据处理方法和设备
CN106790334A (zh) 一种页面数据传输方法及系统
CN111464635B (zh) 一种字典索引传输方法及装置
CN102694730B (zh) 一种并行处理的方法及装置
CN105335408B (zh) 一种搜索词白名单的扩展方法及相关系统
CN114422807B (zh) 一种基于Spice协议的传输优化方法
CN110083487A (zh) 一种基于数据局部性的引用数据块碎片消除方法及系统
CN111796969A (zh) 一种数据差量压缩检测方法、计算机设备和存储介质
CN105631000B (zh) 基于移动终端位置特征信息的终端缓存的数据压缩方法
WO2019127926A1 (zh) 一种稀疏神经网络的计算方法及计算装置、电子装置、计算机可读存储介质以及计算机程序产品
CN114610792A (zh) 数据处理方法、装置及系统、工业设备
CN104933063B (zh) 数据处理方法、搜索方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant