CN103795420B - 一种基于分段的sbr多属性数据压缩方法 - Google Patents

一种基于分段的sbr多属性数据压缩方法 Download PDF

Info

Publication number
CN103795420B
CN103795420B CN201410046933.4A CN201410046933A CN103795420B CN 103795420 B CN103795420 B CN 103795420B CN 201410046933 A CN201410046933 A CN 201410046933A CN 103795420 B CN103795420 B CN 103795420B
Authority
CN
China
Prior art keywords
base signal
data
error
attribute
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410046933.4A
Other languages
English (en)
Other versions
CN103795420A (zh
Inventor
张登银
李秀云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu chuangxiang horizon Internet of things Technology Co., Ltd
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201410046933.4A priority Critical patent/CN103795420B/zh
Publication of CN103795420A publication Critical patent/CN103795420A/zh
Application granted granted Critical
Publication of CN103795420B publication Critical patent/CN103795420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种基于分段的SBR多属性数据压缩算法。其主要包括:对于采集来的多种属性的性能数据,通过相关系数矩阵将属性分为基信号和非基信号;用基信号回归表示非基信号并得出回归参数,若由回归参数表示的预测值与实际值的误差大于阈值,则将属性进行分段,再进行回归表示,直到误差小于阈值;最后只需传送基信号和回归参数。本发明提出的方法在满足一定误差要求的前提下,能够压缩待传输的性能数据,节省了带宽,提高了性能数据的传输效率。

Description

一种基于分段的SBR多属性数据压缩方法
技术领域
本发明涉及一种基于分段的SBR多属性数据压缩方法。本发明属于异构网络领域,涉及异构网络性能管理中对性能数据进行压缩处理的方法。
背景技术
随着无线网络技术(蜂窝网络、卫星网络、移动自组网、传感器网络等)的发展,计算机网络已经不再局限于有线、单一同构网络了,而是呈现高度异构化的趋势即向异构网络方向发展。异构网络不是一个新兴的网络,而是将原有的网络(例如高速有线网络、低速移动无线网络和卫星通信网络等)中不同的网络设备,不同通信技术和不同网络协议相互连接而形成的网络形态。
异构网络不是一个新兴的网络,它是将现有的多种网络协同组合成一个整体的混合网络。由于包含的网络设备数量庞大、种类繁多、功能迥异、结构多样,而且随着网络规模不断扩大,网络的复杂程度不断的增加,当多个异构网连在一起时,经常出现无法预知的交互作用,这种复杂性经常会导致性能下降,迫切需要对异构网络进行管理和监控。
异构网络包含多个网络的不同设备,为了保证不同设备的正常运行,网络管理系统需要实时监测异构网络中的网络参数和设备参数,设备种类的繁多造成海量性能数据,其在传输的过程中不仅占据大量带宽,而且影响性能数据的传输的效率。由于性能数据间具有相关性,如何在保证性能数据传输不失真的情况下,减少大量的性能数据,是目前急需解决的问题。
发明内容
技术问题:本发明针对异构网络中海量性能数据占据大量带宽,影响传输效率问题,提供一种基于分段的SBR多属性数据压缩方法,用来去除属性间的冗余性,减少待传输的性能数据量,节省带宽资源,提高数据传输效率。
技术方案:本发明的基于分段的SBR多属性数据压缩方法,包括如下步骤:
1)对于采集来的性能数据,根据属性间的相关性,计算相关系数矩阵,规范化误差和收益界;
2)建立基集合BaseSet和候选集合CandSet,把所有属性初始化为候选集合;
3)计算相关系数矩阵中每行相关系数的绝对值之和,并把值最大的那个属性划归到基集合中,作为第一个基信号;
4)计算剩余属性的期望收益;
5)若期望收益大于收益界,则把相关系数矩阵中每行数据的绝对值之和最大相对应的属性划归到基集合BaseSet中作为基信号,并返回步骤4);则将所有剩余的属性保留在候选集合CandSet中作为非基信号,进入步骤6);
6)用基信号线性表示非基信号,并得出回归参数;
7)利用基于分段的SBR算法计算预测值与实际值之间的误差平方和,若误差平方和大于阈值,则对属性数据进行分段,并执行6);若误差平方和小于阈值,则线性表示结束,传输基信号,对于非基信号,只需传输相对应的回归参数即可。
收益界的选取决定了基信号的个数,收益界越大,基信号越少,误差越大,数据压缩效率越高。因此误差平方和进行判决的阈值采用收益界值。
附图说明
图1是本发明的异构网络性能管理架构图。
图2基于本发明的异构网络性能数据处理流程。
图3是本发明的基于分段的SBR算法流程图。
具体实施方式
下面结合附表和附图与具体实施方式对本发明作进一步详细描述。
图1是本发明的异构网络性能管理架构图,性能数据在异构网络中的处理流程为:
(1)数据采集器以周期轮训的方式采集异构网络中的用户设备和网络设备的性能数据,如流量、负载、丢包、设备温度、CPU利用率、网络延迟,性能数据通过传输设备(路由器或交换机)进行传输,然后存储在局部数据库中;
(2)网管软件从局部数据库提取实时性能数据和当前历史性能数据,通过对性能数据分析、统计、整理,生成性能报告、发出相应的性能配置指令,并把有关的性能数据存储在全局数据库中。
考虑到异构网络是一个混合的网络,包含多个网络的不同设备,设备种类的繁多造成海量性能数据,其在传输的过程中不仅占据大量带宽,而且影响性能数据的传输的效率。由于性能数据具有相关性,因此本发明提供一种基于分段的SBR算法,以收益界做为判决门限,并采用分段近似回归的方法处理处理属性间的相关性。该方法作用在传输设备中(如路由器或交换机),用于去除性能数据间的冗余性,减少性能数据的传输量,达到节省带宽,提高性能数据传输效率的目的。图2为基于本发明的异构网络性能数据处理流程。
下面给出本发明的具体实施案例:
(1)设路由器或交换机中存储了N个时刻采集的某一设备M种属性的性能数据,用矩阵表示为:
其中,Xi表示设备的第i种属性,xi,j表示第i种属性的第j个采样值。
根据相关系数公式,计算属性间的相关系数矩阵为规范化误差为enorm=|norm(Z)-norm(Y)|,其中Ymax和Ymin分别为一段时间内采样数据的最大值和最小值,norm(Y)∈[0,1];收益界为
(2)建立基集合BaseSet和候选集合CandSet,把所有属性初始化为候选集合。初始化时,候选集合包含M个序列,基集合为空。若将候选集合中的非基属性Xj添加到基集合,采用期望收益作为判决依据。期望收益表示为 bestfitj=max(|rij|),i∈BaseSet。
基集合BaseSet的结构如下:
候选集合CandSet的结构如下:
(3)根据公式计算相关系数矩阵中每行数据的绝对值和,将和最大对应的属性数据加入基集合作为第1个基信号。继续寻找其他基信号,每次选择候选集合中期望收益大于收益界且值最大的Xj加入基集合。
(4)对于非基信号Y,从基集合列表中选出合适的基信号Xpos来近似表示Y,其线性函数表示为:a和b为回归参数。
(5)计算由回归参数表示的预测值与实际值之间的误差平方和,若误差平方和大于收益界,则对基信号和非基信号进行分段,然后再进行线性表示;若误差平方和小于阈值,则线性表示结束,传输基信号,对于非基信号,只需传输相对应的回归参数即可,本发明的伪代码如下所示:
Require:X,Y,start_x,start_y,length,cnterr;//start表示数据开始位置,
//length表示参加计算的数据个数,cnterr表示误差大于误差限的次数
int cnterr=1;int start=0;int length=N;
for i=start to start+length-1{
sum_x=∑start≤i≤lengthX[i+start_x]//求和
sum_y=∑start≤i≤lengthY[i+start_y]
sum_xy=∑start≤i≤lengthX[i+start_x]Y[i+start_y]
sum_x2=∑start≤i≤lengthX[i+start_x]2
{在[start_y,start_y+length]范围内,计算原始数据Y和近似回归数据的误差平方和}
If fabs(a_cnterr×X[i]+b_cnterr-Y[i]>eps)
{cnterr++;
start+=N/cnterr;
length=N/cnterr;}
Else return(a_cnterr,b_cnterr,err);}
本发明不同于原有的数据压缩算法之处在于:本发明提出的改进算法应用于异构网络环境中,去除性能数据间的冗余性,不同于原有的数据压缩算法应用于无线传感器单个节点或多个节点中;且本发明的改进算法采用基于分段的自回归预测算法,在满足误差需求的基础上,具有较高的压缩率,能够大大减少异构网络中性能数据的传输量,节省带宽资源,提高数据传输效率。
数据压缩广泛应用于无线传感器网络,用来去除数据间的冗余性,本发明借鉴这一思想,提出一种改进的SBR算法,即在SBR算法基础上采用收益界值作为误差平方和的阈值,并采用分段近似回归的方法处理误差较大问题,实验结果表明,改进的算法不仅能满足压缩效率和误差的需求,而且算法复杂度低,适合于复杂的异构网络。

Claims (3)

1.一种基于分段的SBR多属性数据压缩方法,其特征在于包含以下步骤:
1)根据属性间的相关性,计算相关系数矩阵,规范化误差和收益界;
2)建立基集合BaseSet和候选集合CandSet,把所有属性初始化为候选集合;
3)计算相关系数矩阵中每行相关系数的绝对值之和,并把值最大的那个属性划归到基集合中,作为第一个基信号;
4)计算剩余属性的期望收益;
5)若期望收益大于收益界,则把相关系数矩阵中每行数据的绝对值之和最大相对应的属性划归到基集合BaseSet中作为基信号,并返回步骤4);若期望收益小于收益界,则将所有剩余的属性保留在候选集合CandSet中作为非基信号,进入步骤6);
6)用基信号线性表示非基信号,并得出回归参数;
7)利用基于分段的SBR算法计算预测值与实际值之间的误差平方和,若误差平方和大于阈值,则对属性数据进行分段,并执行6);若误差平方和小于阈值,则线性表示结束,传输基信号,对于非基信号,只需传输相对应的回归参数即可。
2.根据权利要求1所述的一种基于分段的SBR多属性数据压缩方法,其特征在于步骤1)中,按照下式计算收益界值:
e p s = | | e | | 2 = 1 N Σ i = 0 N - 1 e i 2
其中:N为采集性能数据的个数;i表示:大于等于0、小于等于N-1的整数;ei表示:第i个规范化误差;e表示误差。
3.根据权利要求1所述的一种基于分段的SBR多属性数据压缩方法,其特征在于步骤7)中,按照下式计算预测值与实际值之间的误差平方和:
e r r = Σ i = 0 l e n g t h - 1 ( Y [ i + s t a r t _ y ] - ( a _ c n t e r r X [ i + s t a r t _ x ] + b _ c n t e r r ) ) 2
其中:X为基信号,Y为非基信号;
start表示数据开始位置,start_x为基信号数据开始位置,start_y为非基信号数据开始位置;length表示参加计算的数据个数,cnterr表示误差大于阈值的次数,即信号分段的段数,a_cnterr和b_cnterr为线性回归函数Y=aX+b中第cnterr个分段的回归参数。
CN201410046933.4A 2014-02-10 2014-02-10 一种基于分段的sbr多属性数据压缩方法 Active CN103795420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410046933.4A CN103795420B (zh) 2014-02-10 2014-02-10 一种基于分段的sbr多属性数据压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410046933.4A CN103795420B (zh) 2014-02-10 2014-02-10 一种基于分段的sbr多属性数据压缩方法

Publications (2)

Publication Number Publication Date
CN103795420A CN103795420A (zh) 2014-05-14
CN103795420B true CN103795420B (zh) 2017-04-05

Family

ID=50670783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410046933.4A Active CN103795420B (zh) 2014-02-10 2014-02-10 一种基于分段的sbr多属性数据压缩方法

Country Status (1)

Country Link
CN (1) CN103795420B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107222551B (zh) * 2017-06-23 2020-03-17 东软集团股份有限公司 一种数据传输及处理方法、设备、信息处理中心

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1272259A (zh) * 1997-06-10 2000-11-01 拉斯·古斯塔夫·里杰利德 采用频带复现增强源编码
CN101078931A (zh) * 2007-06-01 2007-11-28 华南理工大学 一种分布式双层实时压缩方法及系统
US7636724B2 (en) * 2001-08-31 2009-12-22 Peerify Technologies LLC Data storage system and method by shredding and deshredding
CN101925091A (zh) * 2010-07-29 2010-12-22 中国地质大学(武汉) 一种基于非阈值的无线传感器网络节点数据压缩方法
CN103414476A (zh) * 2013-08-09 2013-11-27 北华大学 一种生产能耗实时数据压缩方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1272259A (zh) * 1997-06-10 2000-11-01 拉斯·古斯塔夫·里杰利德 采用频带复现增强源编码
US7636724B2 (en) * 2001-08-31 2009-12-22 Peerify Technologies LLC Data storage system and method by shredding and deshredding
CN101078931A (zh) * 2007-06-01 2007-11-28 华南理工大学 一种分布式双层实时压缩方法及系统
CN101925091A (zh) * 2010-07-29 2010-12-22 中国地质大学(武汉) 一种基于非阈值的无线传感器网络节点数据压缩方法
CN103414476A (zh) * 2013-08-09 2013-11-27 北华大学 一种生产能耗实时数据压缩方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Dissemination of Compressed Historical;Antonios Deligiannakis;《The VLDB Journal》;20060728;第439-461页 *
传感网络中误差有界的分段逼近数据压缩算法;张建明 等;《软件学报》;20110930;第2149-2165页 *

Also Published As

Publication number Publication date
CN103795420A (zh) 2014-05-14

Similar Documents

Publication Publication Date Title
CN112181971B (zh) 一种基于边缘的联邦学习模型清洗和设备聚类方法、系统
CN111741054B (zh) 一种移动用户深度神经网络计算卸载时延最小化方法
Stepanov et al. Resource allocation and sharing for transmission of batched NB IoT traffic over 3GPP LTE
CN103841647B (zh) 基于基站资源池的多粒度可伸缩封装装置和方法
CN110460454B (zh) 基于深度学习的网络设备端口故障智能预测方法
CN105049512A (zh) 物联网数据传输方法及系统
EP4307634A1 (en) Feature engineering programming method and apparatus
CN114511112A (zh) 一种基于物联网的智慧运维方法、系统和可读存储介质
CN109743356A (zh) 工业互联网数据采集方法及装置、可读存储介质和终端
CN112637806A (zh) 基于深度强化学习的变电站监测系统及其资源调度方法
CN103795420B (zh) 一种基于分段的sbr多属性数据压缩方法
CN113541986B (zh) 5g切片的故障预测方法、装置及计算设备
CN104822175A (zh) 一种适用于蜂窝网络的代码迁移方法及系统
CN104796673A (zh) 一种面向能耗优化的云视频监控系统任务接入方法
CN109561129B (zh) 一种基于光纤-无线网络的协同计算卸载方法
CN105634850A (zh) Ptn网络的业务流量建模方法及装置
CN110163249B (zh) 基于用户参数特征的基站分类识别方法及系统
CN109446020B (zh) 云存储系统的动态评估方法以及装置
Zhu et al. Smart prediction of the complaint hotspot problem in mobile network
Meng et al. Bayesian network prediction of mobile user throughput in 5g wireless networks
Strelkovskaya et al. Comparative analysis of the methods of wavelet-and spline-extrapolation in problems of predicting self-similar traffic
CN104955059A (zh) 基于贝叶斯网络的蜂窝网基站状态时变模型建立方法
CN102271348A (zh) 信息物理系统链路质量估计系统和方法
CN104507107A (zh) 一种信令数据的预处理方法
CN110351751A (zh) 一种基于抽样的动态分布式系统的共识方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20140514

Assignee: Nanjing national Mdt InfoTech Ltd

Assignor: Nanjing Post & Telecommunication Univ.

Contract record no.: 2018320000013

Denomination of invention: SBR multiple-attribute data compressing method based on segmentation

Granted publication date: 20170405

License type: Common License

Record date: 20180111

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200925

Address after: Room 781, Heying building, No. 99, Tuanjie Road, yanchuang Park, Nanjing area, China (Jiangsu) pilot Free Trade Zone, Nanjing, Jiangsu Province

Patentee after: Jiangsu chuangxiang horizon Internet of things Technology Co., Ltd

Address before: Yuen Road Ya Dong Qixia District of Nanjing City, Jiangsu province 210029 New District No. 9

Patentee before: NANJING University OF POSTS AND TELECOMMUNICATIONS