CN109978073A - 一种空间信息网络任务智能识别方法 - Google Patents

一种空间信息网络任务智能识别方法 Download PDF

Info

Publication number
CN109978073A
CN109978073A CN201910266874.4A CN201910266874A CN109978073A CN 109978073 A CN109978073 A CN 109978073A CN 201910266874 A CN201910266874 A CN 201910266874A CN 109978073 A CN109978073 A CN 109978073A
Authority
CN
China
Prior art keywords
task
item
unique characteristics
characteristic
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910266874.4A
Other languages
English (en)
Other versions
CN109978073B (zh
Inventor
杨力
石怀峰
潘成胜
李欣宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University
Original Assignee
Dalian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University filed Critical Dalian University
Priority to CN201910266874.4A priority Critical patent/CN109978073B/zh
Publication of CN109978073A publication Critical patent/CN109978073A/zh
Application granted granted Critical
Publication of CN109978073B publication Critical patent/CN109978073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Complex Calculations (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种空间信息网络任务智能识别方法,属于空间信息网络领域。包括以下步骤:S1:提取任务包含的多个业务对应的流自身特征项;S2:对流自身特征项进行降维处理以获得降维后的流自身特征项;S3:将降维后的流自身特征项进行映射处理以获得映射后的特征项;S4:将映射后的特征项代入业务类型判断函数以确定该业务的业务种类及数量;S5:提取任务的环境特征项,将每种业务的数量和环境特征项分别进行均值归一化,得到对应的任务特征项;S6:将任务特征项与多个任务类型对应的判别参数循环相乘,该任务的类型判定为相乘值最大且大于零的结果对应的任务类型。本发明结合流自身特征项及环境特征项相结合进行任务类型识别,识别更加准确。

Description

一种空间信息网络任务智能识别方法
技术领域
本发明涉及空间信息网络领域,尤其涉及一种空间信息网络任务智能识别方法。
背景技术
随着卫星技术的发展和日益增长的用户需求,空间信息网络系统不仅承载低速的数据及语音而且需要支持图像、声音、视频相结合的全新、高速率、交互式的宽带多媒体业务,因此空间信息网络任务种类变得繁多,需求差异性大;如何智能识别任务类型,以便为业务配置特定的传输优先级、链路带宽和链路路径等链路资源,保证空间信息传输任务的时效性、安全性和可靠性是一个急需解决的问题。
由于空间信息网络星上资源受限,星上载荷有限,网络资源有限存在局限性,链路传输距离远、时延长,当空间信息网络执行一次空间信息传输任务时,任务包含多个不同种类业务,并且任务自身还有多种类型,如何为这些不同类型任务进行快速准确的智能识别,以满足不同类型任务的服务质量需求是空间信息网络发展的一个瓶颈;所以需要通过任务识别进行任务分类,根据不同的任务类型配置不同的传输资源,以满足差异化的服务质量需求。
对业务进行识别是任务识别的重要前提,目前,对业务进行识别的方法有基于端口号的业务分类法、基于有效负载的业务分类法以及基于机器学习的业务分类法;其中基于端口的业务分类法依赖于对TCP或者UDP数据包中端口号的分析,将熟知的端口号进行映射来达到分类的目的,但由于动态端口的广泛应用,识别准确率很低;为了避免对端口号的过分依赖,学者提出了基于有效分类方法,该方法通过分析包的有效负载是否包含已知业务的特殊签名进行业务分类,虽然具有较高的准确性但代价过高。
发明内容
为解决现有识别方法存在空间信息网络链路资源利用不均衡,无法满足差异化业务的服务质量需求的问题,本发明提供了一种空间信息网络任务智能识别方法。
为实现上述目的,本发明采用的技术方案是:一种空间信息网络任务智能识别方法,包括以下步骤:
S1:空间信息网络任务包含多个空间信息网络业务,提取业务对应的流自身特征项;
S2:对流自身特征项进行降维处理以获得降维后的流自身特征项;
S3:将降维后的流自身特征项进行映射处理以获得映射后的特征项;
S4:将映射后的特征项代入业务类型判断函数以确定该业务的业务种类及数量,所述业务类型判断函数为:
h(f)=w*·f+b* (1)
其中,w*为γ最大化时最小的线性方程的法向量,b*为γ最大化时最小的截距,f为映射后的特征项,γ为分离超平面到训练集样本几何间隔的最小值;
当代入映射后的特征项的业务类型判断函数结果大于0时,则该业务为此时业务类型判断函数所代表的业务种类,并记录相应业务种类的数量;
S5:提取空间信息网络任务的环境特征项,将每种业务的数量以及环境特征项分别进行均值归一化,得到对应的任务特征项;
S6:将步骤S5中得到的任务特征项与多个任务类型对应的判别参数循环相乘,该任务的类型判定为相乘值最大且大于零的结果对应的任务类型。
进一步的,所述步骤S1包括以下具体步骤:
S1.1:提取业务中的24个特征参数作为流自身特征项,所述业务中的24个特征参数具体为:上行包数、上行字节数、上行包头字节数、上行负载字节数、上行包长均值、上行包长方差、上行速率、下行包数、下行字节数、下行包头字节数、下行负载字节数、下行包长均值、下行包长方差、下行速率、总包头字节数、总字节数、包传输起始时间、包到达时间、传输持续时间、丢包率、时延带宽积、往返时间、信道利用率、网络利用率;
S1.2:检测24个特征参数是否提取完全,如果24个特征参数存在缺失则需要重新提取。
进一步的,所述步骤S2包括以下具体步骤:
S2.1:对流自身特征项进行均值归一化,公式为:
其中,x为流自身特征项,μ为流自身特征项的均值,σ2为流自身特征项的标准差,g为均值归一化后的流自身特征项;
S2.2:计算特征参数的协方差Σ,公式为:
其中,m为流自身特征项个数,T为矩阵的转置,g(i)为g的子集;
S2.3:计算得到降维后的流自身特征项h,公式为:
其中,Ureduce是通过奇异值分解获得的一个1×k维度的矩阵,k为降维纬度。
进一步的,所述步骤S3包括以下具体步骤:
S3.1:根据流自身特征项的数量设定地标的数量,将每一个流自身特征项作为一个地标;
S3.2:求出流自身特征项特征与地标特征的映射,以得到映射后的特征项,公式为:
其中,l为地标的特征项,f为映射后的特征项。
进一步的,所述步骤S5包括以下具体步骤:
S5.1:提取任务中的5个特征参数作为环境特征项,所述任务中的5个特征参数具体为:拓扑切换次数、拓扑持续时间、链路抖动、端到端时延、路由跳数;
S5.2:对特征向量进行均值归一化,公式为:
其中,t为任务特征项,μ′为任务特征项的均值,σ′2为任务特征项的标准差,c为均值归一化后的任务特征项;任务特征项t由步骤S4中得到的各业务种类的数量和环境特征项组成。
进一步的,所述的w*和b*是通过如下步骤获得的:
S4.1:采用支持向量机的算法通过寻找一个与数据样本几何间隔最大的分离超平面,将训练集样本按不同类别进行分类,分离超平面的方程为:
w·f+b=0 (7)
其中,w为线性方程的法向量,b为截距;正负类样本分布于超平面两边;
S4.2:计算最大的分离超平面与数据样本的几何间隔,即为分离超平面到训练集样本几何间隔的最小值γ,公式如下:
其中,y为样本类别,其中正类为1,负类为0;||w||为规范化约束,fi为f的子集,yi为y的子集;
当γ最大时,训练集样本内的任意样本与分离超平面的集合距离需都大于γ,即:
S4.3:通过使用拉格朗日乘子法求解:
其中,α为拉格朗日系数,N为训练集样本数量,αi为α的子集;
S4.4:将w和b求偏导为0带入L(w,b,α),在约束条件下求α的最优解α*=(α1 *2 *,...,αN *)T,得到使γ最大化时最小的线性方程的法向量w*和最小的截距b*如下:
其中,为α*的子集,yj为y的子集,fj为f的子集,αj为α的子集;
进一步的,所述的判定参数是通过如下步骤获得的:
S6.1:初始化参数组θ01,...,θn,计算初始化参数组的代价函数J(θ),公式如下:
J(θ)=F(c)-c·θ (13)
其中,θ为任务类型的特征参数,F(c)为训练集样本实际值;
S6.2:通过批量梯度下降算法对参数组θ01,...,θn进行同步更新,公式如下:
其中,β为寻找步长,θj为θ的子集;
S6.3:对步骤S6.1和S6.2进行多次迭代,得到使代价函数J(θ)最小的特征参数,即为判定参数。
本发明的有益效果是:结合流自身特征项及环境特征项相结合进行任务类型识别,识别更加准确;本发明主要基于支持向量机,具有良好的分类准确率和稳定性。
附图说明
图1为任务识别结构示意图;
图2为任务识别算法流程图。
具体实施方式
一种空间信息网络任务智能识别方法,包括以下步骤:
S1:空间信息网络传输的数据流同地面一样,由五元组唯一标识:源地址、目的地址、源端口、目的端口、承载协议;针对流自身的“中继”特性,通过分析数据流自身的特征参数作为流自身特征项来进行业务识别,空间信息网络任务包含多个空间信息网络业务,提取业务对应的流自身特征项;
S1.1:提取业务中的24个特征参数作为流自身特征项,所述业务中的24个特征参数具体为:上行包数、上行字节数、上行包头字节数、上行负载字节数、上行包长均值、上行包长方差、上行速率、下行包数、下行字节数、下行包头字节数、下行负载字节数、下行包长均值、下行包长方差、下行速率、总包头字节数、总字节数、包传输起始时间、包到达时间、传输持续时间、丢包率、时延带宽积、往返时间、信道利用率、网络利用率;
S1.2:检测24个特征参数是否提取完全,如果24个特征参数存在缺失则为提取不完全需要进行重新提取,若特征采集不存在缺失则采集完全,进行下一步;
提取后的流自身特征项如下表:
S2:采用主成分分析法进行降维,将提取的流自身特征项进行降维处理以减少高度冗余的特征,简化模型、压缩数据,最大程度的保持原有数据信息,获得降维后的流自身特征项;
S2.1:对流自身特征项进行均值归一化,公式为:
其中,x为流自身特征项,μ为流自身特征项的均值,σ2为流自身特征项的标准差,g为均值归一化后的流自身特征项;
S2.2:计算特征参数的协方差Σ,公式为:
其中,m为流自身特征项个数,T为矩阵的转置,g(i)为g的子集;
S2.3:计算得到降维后的流自身特征项h,公式为:
其中,Ureduce是通过奇异值分解获得的一个1×k维度的矩阵,用奇异值分解求解获得一个1×1维度的矩阵U,矩阵U是由各特征项之间最小投射误差的方向向量组成的矩阵,选取U中前k个向量,获得一个1×k维度的矩阵Ureduce,k为降维纬度。
S3:业务模型选取:将降维后的流自身特征项进行映射处理以获得映射后的特征项,采用高斯核函数的方法将非线性问题转换为线性问题,将步骤S2中降维后的流自身特征项模型映射到新空间;
S3.1:根据流自身特征项或者训练集样本的数量设定地标的数量,将每一个流自身特征项或训练集样本作为一个地标;
S3.2:求出流自身特征项特征或训练集样本特征与地标特征的映射,以得到映射后的特征项,公式为:
其中,l为地标的特征项,f为映射后的特征项;
映射后的特征项如下表:
S4:通过支持向量机对四种业务的类型进行判断:将映射后的特征项代入业务类型判断函数以确定该业务的业务种类及数量,所述业务类型判断函数为:
h(f)=w*·f+b* (1)
当代入映射后的特征项的业务类型判断函数结果大于0时,则该业务为此时业务类型判断函数所代表的业务种类,并记录相应业务种类的数量;
所述的w*和b*是通过如下步骤获得的:
S4.1:采用支持向量机的算法通过寻找一个与数据样本几何间隔最大的分离超平面,将训练集样本按不同类别进行分类,分离超平面的方程为:
w·f+b=0 (7)
其中,w为线性方程的法向量,b为截距;正负类样本分布于超平面两边;
S4.2:计算最大的分离超平面与数据样本的几何间隔,即为分离超平面到训练集样本几何间隔的最小值γ,公式如下:
其中,y为样本类别,其中正类为1,负类为0;||w||为规范化约束,fi为f的子集,yi为y的子集;
当γ最大时,训练集样本内的任意样本与分离超平面的集合距离需都大于γ,即:
由于γ的取值不影响求解最优解w*和b*且最大化1/||w||等价于最小化||w||2/2,于是求最大超平面最优解w*和b*转换为求min||w||2/2,即yi(w·fi+b)-1≥0的问题;
S4.3:通过使用拉格朗日乘子法求解:
其中,α为拉格朗日系数,N为训练集样本数量,αi为α的子集;
S4.4:将w和b求偏导为0带入L(w,b,α),得到:
在约束条件下求α的最优解α*=(α1 *2 *,...,αN *)T,得到使γ最大化时最小的线性方程的法向量w*和最小的截距b*如下:
其中,αi *为α*的子集,yj为y的子集,fj为f的子集,αj为α的子集;
则得到业务类型判断函数为:
h(f)=w*·f+b* (1);
本实施例中业务类型对应的w*如下表:
本实施例中业务类型对应的b*如下表:
视频业务 数据业务 图像业务 语音业务
7.131295 9.67248 -9.57677 7.974615
将待识别业务1分别与四种业务类型判别方程进行对比:结果分别为-175.51132<0,-3.5173988<0,88.12162>0,-32.79065<0,则业务1为图像业务;
将待识别业务2分别与四种业务类型判别方程进行对比:结果分别为48.65394>0,-20.160458<0,-4.945655<0,-14.212276<0,则业务2为视频业务;
将待识别业务3分别与四种业务类型判别方程进行对比:结果分别为-190.30504<0,102.11677>0,-166.43521<0,-188.2921<0,则业务3为数据业务;
将待识别业务4分别与四种业务类型判别方程进行对比:结果分别为-4.7559633<0,-161.02821<0,-174.2074<0,15.82924>0,则业务4为语音业务。
S5:由于空间信息网络传输的特殊性,单使用业务的数量和种类进行任务识别显然是不准确的,所以在业务识别的基础上结合环境特征项作为辅助,进行空间信息网络任务识别:提取空间信息网络任务的环境特征项,将每种业务的数量和环境特征项分别进行均值归一化,得到对应的任务特征项;
S5.1:提取任务中的5个特征参数作为环境特征项,所述任务中的5个特征参数具体为:拓扑切换次数、拓扑持续时间、链路抖动、端到端时延、路由跳数;
通过步骤S4后,任务所包含的业务种类及数量已经被识别,将业务种类及数量结合空间信息网络特有的环境特征项形成新的识别特征项进行任务识别:特征t1~t4为四种业务的数量,特征t5~t9为环境特征项;
S5.2:对特征向量进行均值归一化,公式为:
其中,t为任务特征项,μ′为任务特征项的均值,σ′2为任务特征项的标准差,c为均值归一化后的任务特征项;任务特征项t由步骤S4中得到的各业务种类的数量和环境特征项组成,即将t1~t4和t5~t9分别代入公式(6)t进行均值归一化;
待识别任务特征项如下表:
任务1 任务2 任务3 任务4 任务5
52 109 328 37 17
780 54 477 671 1047
70 31 296 40 832
1320 317 125 1700 2741
21 3 7 35 68
11.4 4.3 17.1 14.7 37.1
31 1.7 2.1 33 45
7 0.7 1.4 9 3.1
35 18 20 41 62
均值归一化后的任务特征项如下表::
S6:将步骤S5中得到的任务特征项与多个任务类型对应的判别参数循环相乘,该任务的类型判定为相乘值最大且大于零的结果对应的任务类型,若循环所有判别参数后判定结果为不存在大于零的值则该任务为错误任务数据;
S6.1:初始化参数组θ01,...,θn,计算初始化参数组的代价函数J(θ),公式如下:
J(θ)=F(c)-c·θ (13)
其中,θ为任务类型的特征参数,F(c)为训练集样本实际值;
S6.2:通过批量梯度下降算法对参数组θ01,...,θn进行同步更新,公式如下:
其中,β为寻找步长,θj为θ的子集;
S6.3:对步骤S6.1和S6.2进行1000次迭代,得到使代价函数J(θ)最小的特征参数,即为判定参数。
参数组θ01,...,θn如下表:
针对任务1进行任务识别:任务1与联合作战任务权值结果为-0.6113497,与数图传输任务权值结果为0.9997704,与远洋导航任务权值结果为-0.0175633,与遥测任务权值结果为0.8736144,判断结果:任务1为数图传输任务;
针对任务2进行任务识别:任务2与联合作战任务权值结果为1.1566889,与数图传输任务权值结果为0.15926439,与远洋导航任务权值结果为1.1263306,与遥测任务权值结果为0.88714486,判断结果:任务2为联合作战任务;
针对任务3进行任务识别:任务3与联合作战任务权值结果为-0.45452183,与数图传输任务权值结果为-1.3955162,与远洋导航任务权值结果为2.0698996,与遥测任务权值结果为1.8475779,判断结果:任务3为远洋导航任务;
针对任务4进行任务识别:任务4与联合作战任务权值结果为-0.5661146,与数图传输任务权值结果为-1.2896525,与远洋导航任务权值结果为-0.1151704,与遥测任务权值结果为1.6201293,判断结果:任务4为遥测任务;
针对任务5进行任务识别:任务5与联合作战任务权值结果为0.17270105,与数图传输任务权值结果为-1.2019264,与远洋导航任务权值结果为2.1302328,与遥测任务权值结果为2.04231,判断结果:任务5为远洋导航任务。
本发明使用机器学习的一大优点是可移植性,经过样本训练后所得各类型任务自己的参数,在移植到别的设备上仍然保证任务识别的准确性,所以本发明在地面将大量样本进行训练,通过业务特征提取、业务特征降维、业务特征模型选取、模型拟合以及误差检验的几个步骤训练后,会对不同的业务种类有独一的特征参数;当地面训练结束后,将所训练的参数移植到空间信息网络环境的参数库中;当进行任务识别时,本发明会对所输入的任务流进行特征选取并从链路状态监控器中获取当前链路信息,对所采集的任务特征进行循环任务类型检测,每次从参数库输入一种任务类型的特征参数进行检验,如果不是该任务,则参数库将输入另一种任务类型的特征参数进行循环检验,直到任务检验成功或者参数库任务类型的特征参数用尽。
本发明结合流自身特征项及环境特征项相结合进行任务类型识别,由于空间信息网络环境的特殊性,单单使用流自身特征并不能准确的进行业务识别,本发明将空间信息网络传输特性和流自身特征项相结合可以更加准确的在空间信息网络的特殊环境中进行任务识别;其次本发明使用主成分分析法将采集的原始特征项进行进一步的压缩,在保留原95%数据的同时降低特征项数量,降低计算复杂度,使本发明相比现有业务识别方法,更好的节约资源降低成本,同时本发明主要基于支持向量机,在利用非线性变换和结构风险最小化原则将业务分类问题转化为二次寻优问题,具有良好的分类准确率和稳定性,其网络流属性不必满足条件独立假设,无需进行属性过滤,并能够在先验知识相对不足的情况下,仍保持较高的分类准确率,不依赖于样本空间的分布,具有较好的分类稳定性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种空间信息网络任务智能识别方法,其特征在于,包括以下步骤:
S1:空间信息网络任务包含多个空间信息网络业务,提取业务对应的流自身特征项;
S2:对流自身特征项进行降维处理以获得降维后的流自身特征项;
S3:将降维后的流自身特征项进行映射处理以获得映射后的特征项;
S4:将映射后的特征项代入业务类型判断函数以确定该业务的业务种类及数量,所述业务类型判断函数为:
h(f)=w*·f+b* (1)
其中,w*为γ最大化时最小的线性方程的法向量,b*为γ最大化时最小的截距,f为映射后的特征项,γ为分离超平面到训练集样本几何间隔的最小值;
当代入映射后的特征项的业务类型判断函数结果大于0时,则该业务为此时业务类型判断函数所代表的业务种类,并记录相应业务种类的数量;
S5:提取空间信息网络任务的环境特征项,将每种业务的数量和环境特征项分别进行均值归一化,得到对应的任务特征项;
S6:将步骤S5中得到的任务特征项与多个任务类型对应的判别参数循环相乘,该任务的类型判定为相乘值最大且大于零的结果对应的任务类型。
2.根据权利要求1所述的一种空间信息网络任务智能识别方法,其特征在于,所述步骤S1包括以下具体步骤:
S1.1:提取业务中的24个特征参数作为流自身特征项,所述业务中的24个特征参数具体为:上行包数、上行字节数、上行包头字节数、上行负载字节数、上行包长均值、上行包长方差、上行速率、下行包数、下行字节数、下行包头字节数、下行负载字节数、下行包长均值、下行包长方差、下行速率、总包头字节数、总字节数、包传输起始时间、包到达时间、传输持续时间、丢包率、时延带宽积、往返时间、信道利用率、网络利用率;
S1.2:检测24个特征参数是否提取完全,如果24个特征参数存在缺失则需要重新提取。
3.根据权利要求1所述的一种空间信息网络任务智能识别方法,其特征在于,所述步骤S2包括以下具体步骤:
S2.1:对流自身特征项进行均值归一化,公式为:
其中,x为流自身特征项,μ为流自身特征项的均值,σ2为流自身特征项的标准差,g为均值归一化后的流自身特征项;
S2.2:计算特征参数的协方差Σ,公式为:
其中,m为流自身特征项个数,T为矩阵的转置,g(i)为g的子集;
S2.3:计算得到降维后的流自身特征项h,公式为:
其中,Ureduce是通过奇异值分解获得的一个1×k维度的矩阵,k为降维纬度。
4.根据权利要求1所述的一种空间信息网络任务智能识别方法,其特征在于,所述步骤S3包括以下具体步骤:
S3.1:根据流自身特征项的数量设定地标的数量,将每一个流自身特征项作为一个地标;
S3.2:求出流自身特征项特征与地标特征的映射,以得到映射后的特征项,公式为:
其中,l为地标的特征项,f为映射后的特征项。
5.根据权利要求1所述的一种空间信息网络任务智能识别方法,其特征在于,所述步骤S5包括以下具体步骤:
S5.1:提取任务中的5个特征参数作为环境特征项,所述任务中的5个特征参数具体为:拓扑切换次数、拓扑持续时间、链路抖动、端到端时延、路由跳数;
S5.2:对特征向量进行均值归一化,公式为:
其中,t为任务特征项,μ′为任务特征项的均值,σ′2为任务特征项的标准差,c为均值归一化后的任务特征项;任务特征项t由步骤S4中得到的各业务种类的数量和环境特征项组成。
6.根据权利要求1所述的一种空间信息网络任务智能识别方法,其特征在于,所述的w*和b*是通过如下步骤获得的:
S4.1:采用支持向量机的算法通过寻找一个与数据样本几何间隔最大的分离超平面,将训练集样本按不同类别进行分类,分离超平面的方程为:
w·f+b=0 (7)
其中,w为线性方程的法向量,b为截距;正负类样本分布于超平面两边;
S4.2:计算最大的分离超平面与数据样本的几何间隔,即为分离超平面到训练集样本几何间隔的最小值γ,公式如下:
其中,y为样本类别,其中正类为1,负类为0;||w||为规范化约束,fi为f的子集,yi为y的子集;
当γ最大时,训练集样本内的任意样本与分离超平面的集合距离需都大于γ,即:
S4.3:通过使用拉格朗日乘子法求解:
其中,α为拉格朗日系数,N为训练集样本数量,αi为α的子集;
S4.4:将w和b求偏导为0带入L(w,b,α),在约束条件下求α的最优解α*=(α1 *2 *,...,αN *)T,得到使γ最大化时最小的线性方程的法向量w*和最小的截距b*如下:
其中,为α*的子集,yj为y的子集,fj为f的子集,αj为α的子集。
7.根据权利要求5所述的一种空间信息网络任务智能识别方法,其特征在于,所述的判定参数是通过如下步骤获得的:
S6.1:初始化参数组θ01,...,θn,计算初始化参数组的代价函数J(θ),公式如下:
J(θ)=F(c)-c·θ (13)
其中,θ为任务类型的特征参数,F(c)为训练集样本实际值;
S6.2:通过批量梯度下降算法对参数组θ01,...,θn进行同步更新,公式如下:
其中,β为寻找步长,θj为θ的子集;
S6.3:对步骤S6.1和S6.2进行多次迭代,得到使代价函数J(θ)最小的特征参数,即为判定参数。
CN201910266874.4A 2019-04-03 2019-04-03 一种空间信息网络任务智能识别方法 Active CN109978073B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910266874.4A CN109978073B (zh) 2019-04-03 2019-04-03 一种空间信息网络任务智能识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910266874.4A CN109978073B (zh) 2019-04-03 2019-04-03 一种空间信息网络任务智能识别方法

Publications (2)

Publication Number Publication Date
CN109978073A true CN109978073A (zh) 2019-07-05
CN109978073B CN109978073B (zh) 2023-02-28

Family

ID=67082804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910266874.4A Active CN109978073B (zh) 2019-04-03 2019-04-03 一种空间信息网络任务智能识别方法

Country Status (1)

Country Link
CN (1) CN109978073B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111600643A (zh) * 2020-04-09 2020-08-28 中国电子科技集团公司电子科学研究院 一种卫星通信资源调度方法、装置存储介质
CN116805926A (zh) * 2023-08-21 2023-09-26 上海飞旗网络技术股份有限公司 网络业务类型识别模型训练方法、网络业务类型识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130100849A1 (en) * 2011-10-20 2013-04-25 Telefonaktiebolaget Lm Ericsson (Publ) Creating and using multiple packet traffic profiling models to profile packet flows
CN104468567A (zh) * 2014-12-05 2015-03-25 南京邮电大学 一种网络多媒体业务流识别和映射的系统及方法
US20180152467A1 (en) * 2016-11-30 2018-05-31 Cisco Technology, Inc. Leveraging synthetic traffic data samples for flow classifier training
CN108460423A (zh) * 2018-03-26 2018-08-28 大连大学 一种基于sdn架构的业务识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130100849A1 (en) * 2011-10-20 2013-04-25 Telefonaktiebolaget Lm Ericsson (Publ) Creating and using multiple packet traffic profiling models to profile packet flows
CN104468567A (zh) * 2014-12-05 2015-03-25 南京邮电大学 一种网络多媒体业务流识别和映射的系统及方法
US20180152467A1 (en) * 2016-11-30 2018-05-31 Cisco Technology, Inc. Leveraging synthetic traffic data samples for flow classifier training
CN108460423A (zh) * 2018-03-26 2018-08-28 大连大学 一种基于sdn架构的业务识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111600643A (zh) * 2020-04-09 2020-08-28 中国电子科技集团公司电子科学研究院 一种卫星通信资源调度方法、装置存储介质
CN116805926A (zh) * 2023-08-21 2023-09-26 上海飞旗网络技术股份有限公司 网络业务类型识别模型训练方法、网络业务类型识别方法
CN116805926B (zh) * 2023-08-21 2023-11-17 上海飞旗网络技术股份有限公司 网络业务类型识别模型训练方法、网络业务类型识别方法

Also Published As

Publication number Publication date
CN109978073B (zh) 2023-02-28

Similar Documents

Publication Publication Date Title
US10567299B2 (en) Coflow identification method and system, and server using method
CN102685016B (zh) 互联网流量区分方法
CN109284606B (zh) 基于经验特征与卷积神经网络的数据流异常检测系统
CN107786388A (zh) 一种基于大规模网络流数据的异常检测系统
CN109299742A (zh) 自动发现未知网络流的方法、装置、设备及存储介质
CN104899298A (zh) 一种基于大规模语料特征学习的微博情感分析方法
CN109831386A (zh) 一种sdn下基于机器学习的最优路径选择算法
CN109978073A (zh) 一种空间信息网络任务智能识别方法
CN105516020B (zh) 一种基于本体知识推理的并行网络流量分类方法
CN107301163B (zh) 包含公式的文本语义解析方法及装置
CN111786951B (zh) 流量数据特征提取方法、恶意流量识别方法及网络系统
CN104468567B (zh) 一种网络多媒体业务流识别和映射的系统及方法
CN104158627A (zh) 一种异构链路多协议的自动识别系统和方法
CN110414152A (zh) 民机试飞振动故障预测模型和预测系统
CN106778878A (zh) 一种人物关系分类方法及装置
CN111817971B (zh) 一种基于深度学习的数据中心网络流量拼接方法
CN108846275A (zh) 基于ripper算法的未知操作系统类型识别方法
Xiao et al. A traffic classification method with spectral clustering in SDN
CN114048795A (zh) 一种基于PCA和XGBoost融合的业务类型识别方法
CN110351303B (zh) 一种DDoS特征提取方法及装置
CN108460423A (zh) 一种基于sdn架构的业务识别方法
CN110191382B (zh) 一种基于路径排序的虚链路优先映射方法
CN105262534A (zh) 一种适用于卫星通信网络的路由方法和装置
CN102984131B (zh) 一种信息识别方法和装置
CN105577438B (zh) 一种基于MapReduce的网络流量本体构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant