CN117077030B - 一种面向生成模型的少样本视频流分类方法及系统 - Google Patents
一种面向生成模型的少样本视频流分类方法及系统 Download PDFInfo
- Publication number
- CN117077030B CN117077030B CN202311336194.8A CN202311336194A CN117077030B CN 117077030 B CN117077030 B CN 117077030B CN 202311336194 A CN202311336194 A CN 202311336194A CN 117077030 B CN117077030 B CN 117077030B
- Authority
- CN
- China
- Prior art keywords
- video stream
- data
- probability
- network
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000013145 classification model Methods 0.000 claims abstract description 23
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 238000013135 deep learning Methods 0.000 claims abstract description 14
- 238000004140 cleaning Methods 0.000 claims abstract description 13
- 238000010801 machine learning Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 36
- 238000005315 distribution function Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 10
- 208000021907 Central cloudy dystrophy of François Diseases 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000007476 Maximum Likelihood Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 3
- 238000003909 pattern recognition Methods 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000013398 bayesian method Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
- H04L47/2416—Real-time traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
- H04L47/2441—Traffic characterised by specific attributes, e.g. priority or QoS relying on flow classification, e.g. using integrated services [IntServ]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
- H04L47/2483—Traffic characterised by specific attributes, e.g. priority or QoS involving identification of individual flows
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
- H04N21/2402—Monitoring of the downstream path of the transmission network, e.g. bandwidth available
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
- H04N21/2407—Monitoring of transmitted content, e.g. distribution time, number of downloads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
- H04N21/2408—Monitoring of the upstream path of the transmission network, e.g. client requests
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开一种面向生成模型的少样本视频流分类方法及系统,涉及模式识别与网络视频流处理领域,采用Wireshark在不同时间段提取不同类别的网络视频流并进行数据清洗,构建适合机器学习建模的少样本视频流数据集;基于网络业务流的服务质量统计特性,提取少样本视频流数据集特征;建立视频流类别的概率生成模型,采用Metropolis‑Hasting算法扩充用于深度学习的训练集;结合自编码器AE与深度神经网络DNN建立最优的AEDNN视频流分类模型,并对未知视频流数据进行分类,获得分类结果。本发明可准确高效地对网络视频流进行识别与分类,视频业务运营商可依据不同类别的视频流业务的服务质量要求提供不同等级的服务。
Description
技术领域
本发明涉及模式识别与网络视频流处理技术领域,更具体的说是涉及一种面向生成模型的少样本视频流分类方法及系统。
背景技术
随着互联网技术的飞速发展,网络视频业务的增长迅猛。据统计,2022年互联网业务中,视频流的比例达到85%,并且每秒钟超过1000000min的视频内容在网络中传输。对网络视频流分类,可为视频业务运营商依据不同视频业务流的服务质量(QualityofService,QoS)要求提供不同等级的服务,也为视频业务运营商的网络管理、流量工程等应用有着重要意义。由于动态端口、地址伪装等技术的使用,使得基于机器学习的视频流分类方法成为研究的热点。
面对规模庞大且实时性强的网络视频大数据流,建立实时、准确的网络视频流分类模型具有挑战性。现有技术主要有两个:一是,在分类之前,对视频流数据进行特征选择,以降低网络数据流量,提高分类模型的实时性与准确性。但这些特征选择算法假设具有固定特征的静态数据集,而对于实时视频流数据,这些传统的批处理模式特征选择算法在每一轮寻找相关特征是不切实际的。二是,利用深度学习方法提高分类模型的准确度。但深度学习需要大量有标签数据集才能体现出分类器的卓越性能,而收集和标记大量数据集需要耗费巨大的时间和人力成本。
因此,如何准确、高效地对网络视频流进行识别与分类,为视频业务运营商更好地依据不同视频流业务的服务质量要求提供不同等级的服务是本领域技术人员亟需解决的技术问题。
发明内容
有鉴于此,本发明提供了一种面向生成模型的少样本视频流分类方法及系统,解决了背景技术指出的问题。
为了实现上述目的,本发明提供如下技术方案:
一种面向生成模型的少样本视频流分类方法,包括以下步骤:
采用网络数据包分析工具Wireshark在不同时间段提取不同类别的网络视频流并进行数据清洗,构建适合机器学习建模的少样本视频流数据集;
基于网络业务流的服务质量统计特性,提取少样本视频流数据集特征;
建立视频流类别的概率分布生成模型,采用Metropolis-Hasting算法进行采样,生成深度学习所需的训练集;
结合现有自编码器AE(Auto-Encoder)与深度神经网络DNN(DeepNeuralNetworks),对训练集进行训练,直至损失函数最小,得到最优的AEDNN分类模型;
利用最优的AEDNN分类模型对未知视频流数据进行分类,获得分类结果。
可选的,网络视频流的类别包括:标清Web视频流数据、高清Web视频流数据
、超清Web视频流数据、即时视频数据、网络在线直播视频数据、P2P客户端视频数据、Http下载视频数据。
可选的,数据清洗得到的报文样本属性由五元组构成,五元组包括:时间、源IP地址、目的IP地址、协议、报文大小。
可选的,网络业务流的服务质量统计特性包括:包大小的信息熵,包大小的最大值、最小值、均值、方差,包大小的三阶中心距、四阶中心距、四阶累积量,包大小的概率密度函数PDF、分布函数CDF、互补分布函数CCDF,包到达时间间隔的信息熵,包到达时间间隔的最大值、最小值、均值、方差,包到达时间间隔的三阶中心距、四阶中心距、四阶累积量,包到达时间间隔的概率密度函数PDF、分布函数CDF、互补分布函数CCDF,字节速率的最大值、最小值、均值、方差,字节速率的三阶中心距、四阶中心距、四阶累积量,字节速率的概率密度函数PDF、分布函数CDF、互补分布函数CCDF,下上行字节数之比,下上行分组数之比,子流片段数目,分组速率。
可选的,建立视频流类别的概率分布模型,具体包括以下步骤:
设视频流数据集D有m个类别,其大小|D|,记为C1,C2,…,Cm;给定某个类别Ci数据的条件下,其概率密度参数向量Θ={θ1,θ2,…,θk},其中θ1,θ2,…,θk分别表Θ的每一个分量;
设Ci获得视频流数据信息之前,具有先验概P(Ci;Θ),Ci类的大小|Ci|,则先验概率P(Ci;Θ)可表示为
在Ci获得视频流数据x的条件下,概率密度参数向量Θ的分布所发生的改变可通过贝叶斯公式表示为:
公式中:P(Ci|x;Θ)表示后验概率;P(x|Ci;Θ)表示似然概率;P(x)表x的概率;
设Ci中视频流数据x包含个样本且相互独立,Ci的联合概率似然函数可表示如下:
基于中心极限定理,可假设Ci在特征空间上服从正态分布,Θ=(μi,∑),则概率密度f(x|μi,∑)表示如下:
公式中,μi表Ci的均值向量,Σ表示协方差矩阵,V表示数据集的维度,T表示转置;
极大似然函数L(μi,∑)定义如下:
由此,计算μi的最优及Σ的最优∑*:
解得:
则,每个类Ci的概率密度函数可计算如下:
可选的,自编码器AE包括编码器和解码器;
编码器,用于将每个样本映射到低维特征空间的编码
;解码器,用于将编码重构为输出。
可选的,对训练集进行训练的目标是最小化损失函数
LRE;
损失函数LRE的定义如下:
LRE=-∑i∈BS‖Xi-g(f(Xi))‖2
式中:函数f和g分别代表解码器和编码器,Xi表示每次Batch输入,BS表示BatchSize值,f的输出为隐藏变量,用于作为深度神经网络的输入。
一种面向生成模型的少样本视频流分类系统,包括:
数据生成及清洗模块,用于通过网络数据包分析工具Wireshark在不同时间段提取不同类别的网络视频流并进行数据清洗,构建适合机器学习建模的视频流数据集;
特征提取模块,用于通过网络视频业务流的服务质量统计特性,提取视频流数据集特征;数据分布构建模块,用于建立视频流类别的概率分布模型;
深度学习训练集生成模块,用于对视频流类别的概率分布通过Metropolis-Hasting算法进行采样,生成适合于深度学习所需的训练集;分类模型建立及训练模块,用于通过结合自编码器AE与深度神经网络DNN,对训练集进行训练,直至损失函数最小,得到最优的AEDNN分类模型;
分类模块,用于通过最优的AEDNN分类模型对未知视频流数据进行分类,获得分类结果。
经由上述的技术方案可知,与现有技术相比,本发明提供了一种面向生成模型的少样本视频流分类方法及系统,具有以下有益效果:
(1)本发明使用生成学习范式,建立视频流类别的概率分布模型;依据概率分布模型,使用Metropolis-Hasting算法进行采样,自动生成用于深度学习的数据集,解决了数据标注需要大量人力、物力、财力等问题,避免深度学习模型对大规模标注数据的依赖问题;
(2)本发明结合深度堆栈编码器AE与深度神经网络DNN,一方面,采用深度堆栈编码器降低数据维度,而不采用传统特征提取方法,另一方面,采用深度神经网络DNN,提高了视频数据流的分类准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的面向生成模型的少样本视频流分类方法的流程图;
图2为本发明提供的AEDNN分类模型的总体技术路线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种面向生成模型的少样本视频流分类方法,如图1所示,包括以下步骤:
1、数据采集及清洗
网络视频流选取:具有代表性业务的标清Web视频流数据、高清Web视频流数据、超清Web视频流数据,来自于Youku、Tencent、iQIYI等视频网站;即时视频数据,使用网络教育的腾讯会议方式采集;网络在线直播视频数据,使用电视台采集;P2P客户端视频数据,使用Kankan平台采集;Http下载视频数据,共七种类别的视频业务流,将这七种分别记为SD、HD、FHD、IVD、OLV、P2P与HVD。
数据集收集采用Wireshark在不同时间段提取网络视频流,时间跨度从2022年3月到
2022年6月的不定时间段。
对采集的网络视频流进行数据清洗,得到的报文样本属性由五元组构成,五元组包括:时间、源IP地址、目的IP地址、协议、报文大小。每条视频流持续25min,每类数据流收集的比例为:标清Web视频流数据13%、高清Web视频流数据12%、超清Web视频流数据10%、即时视频数据10%、网络在线直播视频数据15%、P2P客户端视频数据13%、Http下载视频数据25%,共700条数据。
2、特征提取
基于网络业务流的服务质量(QoS)统计特性,提取干净的视频流数据集特征。常用网络业务流的统计特性包括下/上行包大小的信息熵、包到达时间间隔的最大/最小值/均值/方差等30多个,具体见表1。
表1常用网络业务流的统计特性
3、建立视频流类别的概率分布模型
由前述内容可以了解到,数据集的QoS统计特性共36个。现有流分类方法均采用特征选取策略来建立分类模型,但这些特征选择算法都假设具有固定特征的静态数据集,而对于实时视频流数据,这些传统的批处理模式特征选择算法在每一轮寻找相关特征是不切实际的;另一方面,不同的特征选择方法生成的最终特征结果也不尽相同,即特征选择具有不稳定性。下面,本实施例不采用特征选择方法来实现,而是通过少量样本数据构建贝叶斯生成模型,以提高模型的鲁棒性。
设视频流数据集D有m个类别,其大小|D|,类别记为C1,C2,…,Cm;下面根据贝叶斯方法建立每个Ci的概率密度分布函数。
给定某个类别Ci数据的条件下,其概率密度参数向量Θ={θ1,θ2,…,θk},其中θ1,θ2,…,θk分别表Θ的每一个分量;
设Ci获得视频流数据信息之前,具有先验概P(Ci;Θ),Ci类的大小|Ci|,则先验概率P(Ci;Θ)可表示为
在Ci获得视频流数据x的条件下,概率密度参数向量Θ的分布所发生的改变可通过贝叶斯公式表示为:
公式中:P(Ci|x;Θ)表示后验概率;P(x|Ci;θ)表示似然概率;P(x)表x的概率;
将P(Ci;Θ)更新为后验分布密度P(Ci|x;Θ),因此,将概率密度参数向量Θ看作随机变量使得贝叶斯方法可以将外生信息融入推导过程。
设Ci中视频流数据x包个样本且相互独立,Ci的联合概率似然函数可表示如下:
对参数向Θ的估计可以采用以下方式进行。
基于中心极限定理,可假设Ci在特征空间上服从正态分布,Θ=(μi,∑),则概率密度f(x|μi,∑)表示如下:
公式中,μi表Ci的均值向量,Σ表示协方差矩阵,V表示数据集的维度,T表示转置;
极大似然函数L(μi,∑)定义如下:
由此,计算μi的最优及∑的最优∑*:
解得:
则,每个类Ci的概率密度函数可计算如下:
有了就能够在Ci上进行采样,生成更大规模的数据集,以此训练准确率更高的分类模型。
4、Metropolis-Hasting采样
在以上所述内容的基础上,采用Metropolis-Hasting算法进行采样,生成深度学习所需的数据集,作为训练集,以更好地训练深度学习模型。该方法能够提高模型的识别率,解决传统深度神经网络在少标注样本的条件下存在的识别精度差的问题。
5、AEDNN分类模型
为提高模型的识别率,除了采用Metropolis-Hasting算法进行采样之外,还结合自编码器AE与深度神经网络DNN,对训练集进行训练,直至损失函数最小,得到最优的AEDNN分类模型。采用自编码器可以降低数据维度,提高视频数据流的分类结果。
自编码器是一种无监督神经网络,它将原始视频流数据映射到一个低维特征空间。自编码器由两部分组成,编码器和解码器;编码器将每个样本映射到低维
特征空间的编码;解码器将编码重构为输出。学习目标是最小化重构损失函数LRE,损失函数定义如下:
LRE=-∑i∈BS‖Xi-g(f(Xi))‖2
式中:函数f和g分别代表解码器和编码器,Xi表示每次Batch输入,BS表示BatchSize值,f的输出为隐藏变量,用于作为深度神经网络的输入。
这样经过降维后减少了分类模型的计算量,也不需要人工设计提取数据特征,其总体技术路线如图2所示。
与图1所述的方法相对应,本发明实施例还提供了一种面向生成模型的少样本视频流
分类系统,用于对图1中方法的具体实现,本发明实施例提供的一种面向生成模型的少样本视频流分类系统可以应用计算机终端或各种移动设备中,具体包括:
数据生成及清洗模块,用于通过网络数据包分析工具Wireshark在不同时间段提取不同类别的网络视频流并进行数据清洗,构建适合机器学习建模的视频流数据集;
特征提取模块,用于通过网络视频业务流的服务质量统计特性,提取视频流数据集特征;数据分布构建模块,用于建立视频流类别的概率分布模型;
深度学习训练集生成模块,用于对视频流类别的概率分布通过Metropolis-Hasting算法进行采样,生成适合于深度学习所需的训练集;分类模型建立及训练模块,用于通过结合自编码器AE与深度神经网络DNN,对训练集进行训练,直至损失函数最小,得到最优的AEDNN分类模型;
分类模块,用于通过最优的AEDNN分类模型对未知视频流数据进行分类,获得分类结果。
接下来,通过具体实验对本实施例的技术方案进行更深一步的了解。
(1)实验数据集
首先,基于以上所述的本发明的技术方案,数据集采用7类视频流数据,统计特性数为36,共700条数据。其次,为了使用深度学习算法,在求得每类概率分布的基础上,使用Metropolis-Hastings采样方法生成35000条数据。35000条数据的比例约为:标清13%,高清12%,超清10%,即时视频数据10%,网络在线直播视频数据15%,P2P客户端视频数据13%,Http下载视频数据25%。
(2)实验设置
①在AE中,使用单层编码器、解码器结构,设置隐变量的维度为15(即特征提取空间为15)。自动编码器模型优化器采用adam,损失采用交叉熵函数。Epochs=50,verbose=2,batch_size=256,shuffle=True。
②DNN网络使用2层隐藏层结构,第一隐藏层80个节点,第二隐藏层60个节点。模型训练优化器采用adam,损失函数采用交叉熵。激活采用tanh函数,epochs=100,batch_size=256,学习率1e-3。
③数据集中分别提取60%、70%、80%的数据作为训练集,其余为测试集。
(3)模型评估
使用总体准确率、查准率、查全率来评估分类性能,其定义在此不赘述。
(4)实验结果
分别使用经典MultiSURF、MSGA模型和本实施例AEDNN三种方法评估总体准确率,结果见表2。
表2总体准确率评估
对经典JGSA方法和本实施例AEDNN方法对7种网络视频流分类结果对比如下表3所示。
表3JGSA方法和AEDNN方法的网络视频流分类结果
由此看出,本实施例提出的网络视频流量分类算法具有很好的分类性能,能够准确、高效地对网络视频流识别与分类,为视频业务运营商更好地依据不同视频流业务的服务质量要求提供不同等级的服务。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种面向生成模型的少样本视频流分类方法,其特征在于,包括以下步骤:
采用网络数据包分析工具 Wireshark 在不同时间段提取不同类别的网络视频流并进行数据清洗,构建适合机器学习建模的少样本视频流数据集;
基于网络业务流的服务质量统计特性,提取少样本视频流数据集特征;
基于所提取的数据集特征建立视频流类别的概率分布模型,得到每一类的概率密度函数,根据所述的每一类的概率密度函数采用Metropolis-Hasting算法进行采样,生成深度学习所需要的大规模训练集,具体包括以下步骤:
设视频流数据集D有m个类别,其大小,类别记为/>;给定某个类别/>数据的条件下,其概率密度参数向量/>,其中/>分别表/>的每一个分量;
设获得视频流数据信息之前,具有先验概率/>,/>类的大小/>,则先验概率可表示为/>;
在获得视频流数据x的条件下,概率密度参数向量/>的分布所发生的改变可通过贝叶斯公式表示为:
公式中:表示后验概率;/>表示似然概率;/>表x的概率;
设中视频流数据x包含/>个样本且相互独立,/>的联合概率似然函数可表示如下:
基于中心极限定理,可假设在特征空间上服从正态分布,/>,则概率密度表示如下:
公式中,表/>的均值向量,/>表示协方差矩阵,/>表示数据集的维度,/>表示转置;
极大似然函定义如下:
由此,计算的最优/>及/>的最优/>:
解得:
则,每个类的概率密度函数可计算如下:
;
结合自编码器AE与深度神经网络DNN,对训练集进行训练,直至损失函数最小,得到最优的 AEDNN分类模型;
利用最优的 AEDNN 分类模型对未知视频流数据进行分类,获得分类结果。
2.根据权利要求 1 所述的一种面向生成模型的少样本视频流分类方法,其特征在于,网络视频流的类别包括:标清Web视频流数据、高清Web视频流数据、超清Web视频流数据、即时视频数据、网络在线直播视频数据、P2P客户端视频数据、Http下载视频数据。
3.根据权利要求1 所述的一种面向生成模型的少样本视频流分类方法,其特征在于,数据清洗得到的报文样本属性由五元组构成,五元组包括:时间、源 IP 地址、目的 IP 地址、协议、报文大小。
4.根据权利要求 1 所述的一种面向生成模型的少样本视频流分类方法,其特征在于,网络业务流的服务质量统计特性包括:包大小的信息熵,包大小的最大值、最小值、均值、方差,包大小的三阶中心距、四阶中心距、四阶累积量,包大小的概率密度函数PDF、分布函数CDF、互补分布函数CCDF,包到达时间间隔的信息熵,包到达时间间隔的最大值、最小值、均值、方差,包到达时间间隔的三阶中心距、四阶中心距、四阶累积量,包到达时间间隔的概率密度函数PDF、分布函数CDF、互补分布函数CCDF,字节速率的最大值、最小值、均值、方差,字节速率的三阶中心距、四阶中心距、四阶累积量,字节速率的概率密度函数PDF、分布函数CDF、互补分布函数CCDF,下上行字节数之比,下上行分组数之比,子流片段数目,分组速率。
5.根据权利要求1 所述的一种面向生成模型的少样本视频流分类方法,其特征在于,自编码器AE包括编码器和解码器;
编码器,用于将每个样本映射到低维特征空间的编码;解码器,用于将编码重构为输出。
6.根据权利要求5 所述的一种面向生成模型的少样本视频流分类方法,其特征在于,对特征训练集进行训练的目标是最小化重构误差;
损失函数的表达式如下:
式中:函数和/>分别代表解码器和编码器,/>表示每次Batch输入,/>表示
BatchSize值,的输出为隐藏变量,用于作为深度神经网络的输入。
7.一种面向生成模型的少样本视频流分类方法的分类系统,其特征在于,包括:
数据生成及清洗模块,用于通过网络数据包分析工具 Wireshark在不同时间段提取不同类别的网络视频流并进行数据清洗,构建适合机器学习建模的少样本视频流数据集;
特征提取模块,用于通过网络视频业务流的服务质量统计特性,提取少样本视频流数据集特征;数据分布构建模块,基于所提取的数据集特征建立视频流类别的概率分布模型,得到每一类的概率密度函数;深度学习训练集生成模块,根据所述的每一类的概率密度函数采用Metropolis-Hasting算法进行采样,生成深度学习所需要的大规模训练集,具体包括以下步骤:
设视频流数据集D有m个类别,其大小,类别记为/>;给定某个类别/>数据的条件下,其概率密度参数向量/>,其中/>分别表/>的每一个分量;
设获得视频流数据信息之前,具有先验概率/>,/>类的大小/>,则先验概率可表示为/>;
在获得视频流数据x的条件下,概率密度参数向量/>的分布所发生的改变可通过贝叶斯公式表示为:
公式中:表示后验概率;/>表示似然概率;/>表x的概率;
设中视频流数据x包含/>个样本且相互独立,/>的联合概率似然函数可表示如下:
基于中心极限定理,可假设在特征空间上服从正态分布,/>,则概率密度表示如下:
公式中,表/>的均值向量,/>表示协方差矩阵,/>表示数据集的维度,/>表示转置;
极大似然函定义如下:
由此,计算的最优/>及的最优/>:
解得:
则,每个类的概率密度函数可计算如下:
;
分类模型建立及训练模块,用于通过结合自编码器AE与深度神经网络DNN,对训练集进行训练,直至损失函数最小,得到最优的 AEDNN 分类模型;
分类模块,用于通过最优的 AEDNN 分类模型对未知视频流数据进行分类,获得分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311336194.8A CN117077030B (zh) | 2023-10-16 | 2023-10-16 | 一种面向生成模型的少样本视频流分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311336194.8A CN117077030B (zh) | 2023-10-16 | 2023-10-16 | 一种面向生成模型的少样本视频流分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117077030A CN117077030A (zh) | 2023-11-17 |
CN117077030B true CN117077030B (zh) | 2024-01-26 |
Family
ID=88717628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311336194.8A Active CN117077030B (zh) | 2023-10-16 | 2023-10-16 | 一种面向生成模型的少样本视频流分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117077030B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787512A (zh) * | 2016-02-29 | 2016-07-20 | 南京邮电大学 | 基于新型特征选择方法的网络浏览与视频分类方法 |
CN106998322A (zh) * | 2017-02-20 | 2017-08-01 | 南京邮电大学 | 一种使用视频业务的平均意见分均值特征的流分类方法 |
WO2018017878A1 (en) * | 2016-07-22 | 2018-01-25 | Dolby Laboratories Licensing Corporation | Network-based processing and distribution of multimedia content of a live musical performance |
CN110036402A (zh) * | 2016-12-02 | 2019-07-19 | 真实眼私人有限公司 | 用于媒体内容表现的预测的数据处理方法 |
WO2019223553A1 (zh) * | 2018-05-22 | 2019-11-28 | 华为技术有限公司 | 一种网络流量识别方法及相关设备 |
CN113052073A (zh) * | 2021-03-25 | 2021-06-29 | 浙江工业大学 | 一种基于元学习的少样本行为识别方法 |
CN113114573A (zh) * | 2021-04-16 | 2021-07-13 | 重庆邮电大学 | Sdn网络中视频流分类与调度系统 |
CN113128626A (zh) * | 2021-05-28 | 2021-07-16 | 安徽师范大学 | 基于一维卷积神经网络模型的多媒体流细分类方法 |
CN113139495A (zh) * | 2021-04-29 | 2021-07-20 | 姜冬阳 | 一种基于深度学习的隧道侧装视频交通流检测方法和系统 |
CN113408202A (zh) * | 2021-06-18 | 2021-09-17 | 国网湖南省电力有限公司 | 面向变电站核心工控业务的流量基线模型构造方法 |
CN115174961A (zh) * | 2022-07-07 | 2022-10-11 | 东南大学 | 一种面向高速网络的多平台视频流量早期识别方法 |
CN115311737A (zh) * | 2022-07-10 | 2022-11-08 | 复旦大学 | 基于深度学习的无察觉式脑卒中患者手部动作识别方法 |
CN115600128A (zh) * | 2022-10-26 | 2023-01-13 | 中国农业银行股份有限公司(Cn) | 一种半监督加密流量分类方法、装置及存储介质 |
CN115731396A (zh) * | 2022-11-28 | 2023-03-03 | 辽宁工程技术大学 | 一种基于贝叶斯变分推断的持续学习方法 |
WO2023087069A1 (en) * | 2021-11-18 | 2023-05-25 | Canopus Networks Pty Ltd | Network traffic classification |
CN116405419A (zh) * | 2023-04-13 | 2023-07-07 | 东南大学 | 一种基于小样本学习的未知网络协议分类方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6847682B2 (en) * | 2002-02-01 | 2005-01-25 | Hughes Electronics Corporation | Method, system, device and computer program product for MPEG variable bit rate (VBR) video traffic classification using a nearest neighbor classifier |
US20160283859A1 (en) * | 2015-03-25 | 2016-09-29 | Cisco Technology, Inc. | Network traffic classification |
US10439947B2 (en) * | 2016-11-17 | 2019-10-08 | Cisco Technology, Inc. | Method and apparatus for providing deadline-based segmentation for video traffic |
EP3439308A1 (en) * | 2017-07-31 | 2019-02-06 | Zhilabs S.L. | Determination of qoe in encrypted video streams using supervised learning |
US20230049770A1 (en) * | 2021-07-12 | 2023-02-16 | Nec Laboratories America, Inc. | Few-shot action recognition |
-
2023
- 2023-10-16 CN CN202311336194.8A patent/CN117077030B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787512A (zh) * | 2016-02-29 | 2016-07-20 | 南京邮电大学 | 基于新型特征选择方法的网络浏览与视频分类方法 |
WO2018017878A1 (en) * | 2016-07-22 | 2018-01-25 | Dolby Laboratories Licensing Corporation | Network-based processing and distribution of multimedia content of a live musical performance |
CN110036402A (zh) * | 2016-12-02 | 2019-07-19 | 真实眼私人有限公司 | 用于媒体内容表现的预测的数据处理方法 |
CN106998322A (zh) * | 2017-02-20 | 2017-08-01 | 南京邮电大学 | 一种使用视频业务的平均意见分均值特征的流分类方法 |
WO2019223553A1 (zh) * | 2018-05-22 | 2019-11-28 | 华为技术有限公司 | 一种网络流量识别方法及相关设备 |
CN113052073A (zh) * | 2021-03-25 | 2021-06-29 | 浙江工业大学 | 一种基于元学习的少样本行为识别方法 |
CN113114573A (zh) * | 2021-04-16 | 2021-07-13 | 重庆邮电大学 | Sdn网络中视频流分类与调度系统 |
CN113139495A (zh) * | 2021-04-29 | 2021-07-20 | 姜冬阳 | 一种基于深度学习的隧道侧装视频交通流检测方法和系统 |
CN113128626A (zh) * | 2021-05-28 | 2021-07-16 | 安徽师范大学 | 基于一维卷积神经网络模型的多媒体流细分类方法 |
CN113408202A (zh) * | 2021-06-18 | 2021-09-17 | 国网湖南省电力有限公司 | 面向变电站核心工控业务的流量基线模型构造方法 |
WO2023087069A1 (en) * | 2021-11-18 | 2023-05-25 | Canopus Networks Pty Ltd | Network traffic classification |
CN115174961A (zh) * | 2022-07-07 | 2022-10-11 | 东南大学 | 一种面向高速网络的多平台视频流量早期识别方法 |
CN115311737A (zh) * | 2022-07-10 | 2022-11-08 | 复旦大学 | 基于深度学习的无察觉式脑卒中患者手部动作识别方法 |
CN115600128A (zh) * | 2022-10-26 | 2023-01-13 | 中国农业银行股份有限公司(Cn) | 一种半监督加密流量分类方法、装置及存储介质 |
CN115731396A (zh) * | 2022-11-28 | 2023-03-03 | 辽宁工程技术大学 | 一种基于贝叶斯变分推断的持续学习方法 |
CN116405419A (zh) * | 2023-04-13 | 2023-07-07 | 东南大学 | 一种基于小样本学习的未知网络协议分类方法 |
Non-Patent Citations (6)
Title |
---|
"Efficient steganalysis using convolutional auto encoder network to ensure original image quality";Ayaluri等;《PeerJ Computer Science》;第7卷;第e356页 * |
"The Effects of Autoencoders on the Robustness of Deep Learning Models";E. Değırmenc等;《2022 30th Signal Processing and Communications Applications Conference (SIU)》;第1-4页 * |
"基于深度学习的视频预测与异常检测方法";范斯诺;《中国优秀硕士学位论文全文数据库 信息科技辑》(第5期);I138-744 * |
"基于深度神经网络和半监督学习的视频流量分类";周明睿;《中国优秀硕士学位论文全文数据库 信息科技辑》(第2期);I139-34 * |
"A network security situation assessment method based on adversarial deep learning Authors";Hongyu Yang;《Applied Soft Computing》;第102卷(第C期);第874页 * |
"元迁移学习在少样本跨域图像分类中的研究";杜彦东等;《中国图象图形学报》;第28卷(第9期);第2899-2912页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117077030A (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qin et al. | Semantic communications: Principles and challenges | |
Tong et al. | Federated learning for audio semantic communication | |
CN110247930B (zh) | 一种基于深度神经网络的加密网络流量识别方法 | |
CN110570346B (zh) | 一种基于循环生成对抗网络对书法进行风格迁移的方法 | |
CN112054967A (zh) | 网络流量分类方法、装置、电子设备及存储介质 | |
CN110460502B (zh) | 基于分布特征随机森林的vpn下应用程序流量识别方法 | |
CN112559764B (zh) | 一种基于领域知识图谱的内容推荐方法 | |
Soleymanpour et al. | CSCNN: cost-sensitive convolutional neural network for encrypted traffic classification | |
CN111597983B (zh) | 基于深度卷积神经网络实现生成式虚假人脸图像鉴定的方法 | |
CN114006870A (zh) | 一种基于自监督卷积子空间聚类网络的网络流量识别方法 | |
CN112019500B (zh) | 一种基于深度学习的加密流量识别方法及电子装置 | |
CN105335476B (zh) | 一种热点事件分类方法及装置 | |
CN114118416A (zh) | 一种基于多任务学习的变分图自动编码器方法 | |
Mansour et al. | Design of integrated artificial intelligence techniques for video surveillance on iot enabled wireless multimedia sensor networks | |
CN114650229B (zh) | 基于三层模型sftf-l的网络加密流量分类方法与系统 | |
Shen et al. | Channel recombination and projection network for blind image quality measurement | |
CN117077030B (zh) | 一种面向生成模型的少样本视频流分类方法及系统 | |
Zheng et al. | Steganographer detection based on multiclass dilated residual networks | |
CN108494620B (zh) | 一种网络业务流特征选择与分类方法 | |
CN112383488A (zh) | 一种适用于加密与非加密数据流的内容识别方法 | |
CN113128626A (zh) | 基于一维卷积神经网络模型的多媒体流细分类方法 | |
Aketi et al. | Neighborhood gradient clustering: An efficient decentralized learning method for non-iid data distributions | |
CN116383744A (zh) | 基于流量图像与低频信息的多模态加密网络流量分类方法 | |
Bruno et al. | Community detection in the hyperbolic space | |
CN113762372B (zh) | 即时通讯信息中组织成员识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |