CN101252480B - 一种建立多媒体网页浏览业务模型的实现方法 - Google Patents
一种建立多媒体网页浏览业务模型的实现方法 Download PDFInfo
- Publication number
- CN101252480B CN101252480B CN2008101033079A CN200810103307A CN101252480B CN 101252480 B CN101252480 B CN 101252480B CN 2008101033079 A CN2008101033079 A CN 2008101033079A CN 200810103307 A CN200810103307 A CN 200810103307A CN 101252480 B CN101252480 B CN 101252480B
- Authority
- CN
- China
- Prior art keywords
- model
- multimedia
- page
- parameter
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Information Transfer Between Computers (AREA)
Abstract
一种建立多媒体网页浏览业务模型的实现方法,先对多媒体网页浏览业务进行理论分析,以传统网页浏览业务模型的三层结构为基础,将统计模型扩展为四层结构,并引入新的模型参数来描述页面层中多媒体业务特征,建立多媒体网页浏览业务模型;再从实际网络中采集模型参数的系列数据,进行分析处理,拟合出模型参数的概率分布函数;这样,由模型框架、各个模型参数对应拟合的概率分布函数及其相关参数一起构建多媒体网页浏览业务模型;最后,采用仿真与理论结合的方法分析、验证和修正该业务模型。本发明建立的业务模型所产生的业务数据更加接近实际网络中采集的数据,能够为当前网络提供更加准确、可靠、有效的服务,应用前景看好。
Description
技术领域
本发明涉及一种建立多媒体网页浏览业务模型的实现方法,属于网络业务分析与建模技术领域。
背景技术
业务模型是对通信系统进行性能评估的关键依据。如果想要对实际通信系统的设计获取有意义的结果,用于仿真的业务源就必须能够比较真实、正确地反映实际业务的统计特性,因此建立业务模型的实质是对用户进行相应的统计分析。
业务模型的作用可以概括为以下三个方面:
(1)业务模型可用于规划网络资源,以满足不同等级的目标QoS。早期基于泊松分布的话音模型及其相关的话务理论被用于估计电话交换容量、估测排队性能等,以改善呼损率,有效降低话音的呼叫建立时间和排队时延,使话音业务的服务质量得到了极大的提高。类似地,分组业务的模型也可用于估计带宽和缓存资源,以提供一个可接受的延时和分组丢失概率。显然,只知晓业务的平均速率是不够的。从排队论的角度可获知,队列长度是随着业务的可变性的增加而增加。因此,对于业务突发性或可变性的确定,有助于确定合适大小容量的缓存。
(2)业务模型可用于验证特定流控策略下的网络性能。比如,某一个固定的分组调度算法在不同的业务场景下会导致不同的网络性能。又如,TCP拥塞控制算法要求多个主机能够稳定、公平地共享带宽,并保证一个较高的吞吐量。如果没有一个比较真实的业务源模型,就没办法有效地衡量算法的稳定性、公平性和吞吐量。因此,业务模型可以用于验证特定流控策略下的网络性能。
(3)业务模型在接入控制中也起着重要的作用。特别的,诸如ATM这样面向连接的网络,它是依靠接入控制来拒绝新的连接,以保证实现设定的QoS。例如,最初一类节点的接入控制的策略是基于新到达连接的峰值速率。但是,当该连接的速率发生动态改变时,此时所需要的带宽就明显小于其峰值速率时的带宽,这样,上述算法就显得过于保守。因此,出现一类基于有效带宽的接入控制策略。而业务源的行为就被转换为有效带宽,从而能够更加精确地表征带宽需求。因此,有效带宽决定于业务源的变化特性。
根据分析方法和侧重面的不同,业务模型有不同的分类方法。根据业务建模的不同对象,业务模型可分为业务模型、业务流量模型和网络模型,下面分别介绍之:
(1)业务模型是描述一个业务操作实例的特征,通常是从使用该业务的用户角度来进行分析。业务模型仅仅是对某类业务的一个实例进行分析。由于不同用户在不同时段使用该业务,其特征模型的区别可能会非常明显和悬殊,即某一类业务就可能对应多个业务模型。在分析某个业务模型时,通常不考虑其他业务对该业务造成的影响,也不考虑实际的网络实现方法。
(2)业务流量模型是利用数学方法描述各种具体业务的流量,进而对承载该项业务的无线资源进行估算,以保证资源能够满足该项业务的需求。当网络中同时执行多个业务实例时,对网络流量进行分析和测量,可获得业务流量模型。业务流量模型是对一类业务的典型情况进行分析,只需要一个业务流量模型就能静态地涵盖该类业务所发生的全部实例。它从系统级别的角度来描述一类业务的流量特性,网络的具体实现与该模型的描述息息相关。
(3)网络模型是从网络中特定的某个测量点对业务量情况的描述。由于业务量情况与具体网络的实现协议非常相关,因此网络模型依赖于具体的网络实现。网络模型专用于描述网络的某个组成部分,尤其适用于某些具体网络层面的分析。但是,正是由于网络模型的专用性,它不适宜用于对与网络特性无关的业务提供全面的描述。
当前广泛应用于各种通信系统协议研究开发的网络浏览业务模型是传统的三层模型(参见图1),该模型所描述的网页主要是以文字、图片为主。随着互联网的发展,以视频图像为主的多媒体网页浏览业务的应用日益广泛。如今,越来越多的网页中嵌入了活动图片、视频动画、音频播放、文件下载等不同业务,这些业务的引入使得网页浏览业务的特征发生了巨大变化,而这种变化使得原先只考虑文字、静止图像的传统网页结构模型不仅失去其准确性,甚至产生很大偏差。因此,研究如何建立多媒体网页浏览业务模型已经成为业内技术人员关注的新焦点,它对研究网页浏览业务及如何设计网络协议都具有非常重要的意义。
众所周知,业务模型应该捕捉和刻画出该业务的主要统计特征,通常应该满足以下几条准则:
(1)真实性:业务量模型应该描述真实业务源的主要统计特征。业务模型应该具有明确的物理意义。
(2)通用性:业务建模应考虑该业务模型可以适应各种不同因素的影响,只是在各个不同参数的数值上有所差别。
(3)简单性:业务量模型的参数应尽量少,并尽可能反映业务的真实特征。
(4)可适配性:业务模型应该容易与真实业务相互拟合,其业务参数应该可以从真实业务量中方便地得到。
(5)易实现性:业务量模型应该可以通过计算机仿真或基于硬件的业务量产生设备来简单地实现或仿真。
如果一个业务模型能够同时满足上述各个特性,那么,它就是一个相当完备的模型。然而,通常这是很难做到的。一般来说,业务模型的参数越多,模型越精准、越接近真实的业务源。但是,付出的代价则是该模型也就越复杂,理论分析和计算机仿真也会越加困难。因此,在实际的业务建模过程中,往往要根据其用途在模型的复杂性和精准性之间进行权衡和取舍。
发明内容
有鉴于此,本发明的目的是提供一种建立多媒体网页浏览业务模型的实现方法,该方法通过统计网页中的多媒体业务的各种特性,并将反映该特性的各种模型参数提取出来,用于建模。本发明方法所建的业务模型能够比较真实地描述当前多媒体网页浏览业务的特点,为网络运营商和业务提供商进一步完善网络和网页提供更加准确、可靠、有效的业务模型分析基础,并为网络协议的分析、改进提供了更可靠的网页浏览业务模型;此外,本发明方法能够兼容传统的普通网页的建模方法。
为了达到上述目的,本发明提供了一种建立多媒体网页浏览业务模型的实现方法,其特征在于:先对多媒体网页浏览业务进行理论分析,以传统的网页浏览业务模型的三层结构框架为基础,将统计模型扩展为下述四层结构:会话层、页面层、对象层和数据包层,并引入新的模型参数来描述页面层中的多媒体业务的特征,建立多媒体网页浏览业务模型;再从实际网络中采集模型参数的系列数据,进行分析处理,拟合出模型参数的概率分布函数;这样,由模型框架、各个模型参数对应拟合的概率分布函数及其相关参数一起构建多媒体网页浏览业务模型;最后,采用仿真与理论结合的方法分析、验证和修正该业务模型;所述方法包括下述操作步骤:
(1)理论分析:从理论上分析多媒体网页浏览业务的不同业务组成成分及每个成分的物理意义与特征;在观察多媒体网页特征的基础上,提出多媒体网页浏览业务模型的框架;
(2)提取参数:提取各种模型参数来描述不同业务成分的物理特征,并用作所述业务模型框架中所包含的各种具有确定物理意义的不同参数;
(3)采集数据,计算得到各项模型参数:采用网络数据采集软件,在设定网络的路由器或其它设定节点上大量采集包括普通网页浏览业务和含有多媒体成分的网页浏览业务的数据,从中进行筛选、过滤,将与建模相关的数据选择出来;再对选出的建模数据进行计算、处理,得到各个模型参数的数据序列;
(4)对各个模型参数的数据序列分别进行计算、分析和拟合处理:先分别计算各个模型参数数据序列的统计特性:均值和方差,以及每个模型参数数据序列的概率累积分布函数CDF;再采用多个不同概率分布函数分别估算每个模型参数的均值和方差,以及分别计算、拟合每个模型参数对应这些不同概率分布函数的CDF;然后,对每个模型参数的CDF与其对应的多个概率分布函数的CDF进行比较,以最小均方误差MMSE方法选择出最佳概率分布函数;藉此,构建完成以模型框架、各个模型参数对应的拟合函数、以及该拟合函数中的对应参数所组成的多媒体网页浏览业务模型;
(5)搭建仿真平台,验证所建业务模型的准确性与有效性:以仿真运行结合理论分析的方法,对该业务模型仿真运行所产生的数据与实际网络中采集到的数据进行分析,以判断、验证该业务模型是否准确与有效,同时,把验证结果反馈到理论分析和数据分析步骤中的相关操作,对所建业务模型进行修改和完善。
所述多媒体网页是在网页中嵌入或链接有包括视频、音频、图像或动画的多媒体业务成分的网页;所述多媒体网页浏览业务模型同样适用于普通网页浏览业务。
所述多媒体网页浏览业务模型框架的四层结构的功能分别是:第一层为会话层,采用ON和OFF分别描述用户发起的网页浏览会话持续时间和相邻的两个浏览会话之间的间隔时间;第二层为页面层,表示每次会话中浏览的普通页面和多媒体页面;第三层为对象层,表示每个页面所包含的对象,包括由文字、页面的基本框架组成的主对象、由包括静止图像和动画组成的嵌入对象或多媒体对象;第四层为数据包层,用于对第三层的包括视频对象的多媒体对象作扩展分析,使用特定参数描述多媒体对象的数据包大小及其到达情况。
所述多媒体网页浏览业务模型包括有下述各层的模型参数:
会话层的参数:
Session interarrival time,表示两个相邻会话session的到达时间之间的间隔;
Session duration,表示一个会话session的持续时长;
Pages per session,表示一个会话session中下载的网页数量;
Multimedia page ratio,表示多媒体页面占总页面的比例;
页面层的参数:
Page size,表示网页的大小;
Object number per page,表示一个网页中包含对象object的数量;
Page interarrival time,表示页面Page到达时间间隔;
对象层的参数:
Main object size,表示主对象Main object大小;
Inline object size,表示嵌入对象Inline object大小;
Object interval,表示Main object和Inline object之间的时间间隔;
Video object size,表示多媒体视频对象Video object大小;
Relative arrive time,表示Video object的启动时间与相应页面page起始时间之间的时间间隔;
数据包层的参数:
Video packet interval,表示不同视频数据包Video packet之间的时间间隔;
Video packet size,表示Video packet大小。
所述步骤(3)进一步包括下列操作内容:
(31)筛选数据:按照IP地址和超文本链接标记语言协议HTTP对数据进行筛选,将HTTP协议数据包和由“GET”引发的传输控制协议TCP数据包筛选出来;
(32)读取信息:读取筛选出来的每个数据包的各种信息:包括IP地址、端口号、到达时间、页面标志、包的大小;
(33)提取会话层模型参数对应数值:对上述数据包的信息进行分析,以便由“GET”区分出页面的开始,继而得到页面到达时间和其它初步信息,再将统计出来的页面到达时间进行排序后,求出其二阶导数,再以二阶导数最大处的数值作为会话间隔的门限值;然后利用该门限值来区分页面间隔与会话间隔,由此获得会话层的各个模型参数的数值;
(34)区分页面的类型:统计多媒体页面的比例,并分别存储普通页面的数据和多媒体页面的数据,对于普通页面,则顺序执行后续操作;对于多媒体页面,则跳转执行步骤(36)的操作;
(35)提取普通页面的页面层模型参数值,并进行统计分析:采用步骤(33)的计算方法得到各个对象间隔的门限值,再计算得到普通页面的页面层的各个模型参数的数值;
(36)提取普通页面的对象层参数值:用端口号区分主对象和嵌入对象,得到普通页面对象层的各项模型参数的数值;
(37)提取多媒体页面的页面层参数值,并进行统计分析:采用步骤(33)的计算方法得到各个对象间隔的门限值,再计算得到多媒体页面的页面层的各个模型参数的数值;
(38)提取多媒体页面的对象层参数值:用端口号区分主对象、嵌入对象和多媒体对象,得到多媒体页面对象层的各个模型参数的数值;
(39)提取多媒体数据包参数值:统计各个多媒体对象所对应的数据包的到达时间、大小和其它信息,得到数据包层的各个模型参数的数值。
所述步骤(4)进一步包括下列操作内容:
(41)分别计算各个模型参数的数据序列的均值和方差,以及每个模型参数数据序列的概率累积分布函数CDF;
(42)利用各个模型参数的均值和方差估算具有该均值和方差的韦布Weibull概率分布函数中的两个参数:尺度参数α和形状参数β,再利用这两个参数计算出Weibull概率分布函数的CDF;
(43)采用步骤(42)的方法,计算各个模型参数的均值和方差分别在帕累托Pareto、指数Exponential、正态Normal、几何Geometric和对数正态Lognormal五个概率分布函数中所对应的相关参数及其CDF;
(44)将各个模型参数的数据序列的CDF与步骤(42)和(43)中计算得到的六个CDF进行比较,采用最小均方误差MMSE准则,从该六种概率分布函数中选出最佳概率分布函数作为每个模型参数的拟合函数;
(45)以所选取的拟合函数中的对应参数来取代步骤(42)和(43)中估算得到的模型参数;
(46)以模型框架、各个模型参数所对应的拟合函数,以及该拟合函数中的对应参数为基础,确立多媒体网页浏览业务模型。
所述步骤(5)进一步包括下列操作内容:
(51)采用OPNET Modeler软件搭建与实际系统相类似的网络的仿真平台要尽可能模仿实际系统的网络架构、协议组成、控制流程和业务状况,以便仿真结果更加接近实际网络运行状况;
(52)在仿真平台中构建业务产生模块,并将各个模型参数用于业务产生模块,以便对由该模型参数产生的业务流量进行分析处理;
(53)在仿真平台的节点上构建业务采集模块,并模仿实际运行网络的数据采集机制采集该仿真平台中的业务流量数据;此时,应确保采集过程不会影响该仿真平台中的业务流量特性;
(54)对采集的数据进行分析处理:先以不同时间单元所采集的数据组成多个序列,分别计算这些数据序列的一阶统计特性:均值、二阶统计特性:平方差、高阶统计特性、自相似性:Hurst值和局部奇异性:多重分形谱,并与实际运行网络中采集到的数据序列的对应统计特性进行比较,以验证所建业务模型是否准确与有效;
(55)将验证结果反馈到理论分析和数据分析步骤中的相关操作,对模型框架、模型参数、拟合函数和该函数的对应参数进行调整,以修正和完善所构建的业务模型。
所述方法对多媒体网页浏览业务模型中的不同属性的嵌入对象或链接对象进行区别后、分别建模,以体现不同性质的嵌入对象或链接对象之间的不同业务特征。
本发明是一种建立多媒体网页浏览业务模型的方法,该方法五个操作步骤中的前两个步骤是整个建模过程中的关键,主要完成模型框架的提出和确定模型参数。其思路是:借鉴以往的业务模型建模方法,分析多媒体网页结构与传统网页结构的异同之处,并在跟踪多媒体网页浏览业务的协议构成及其传输过程的基础上,提取特定的模型参数来描述其结构组成和传输过程的物理意义,以架构新的业务模型。后续两个操作步骤是选择具体网络及其采集点,对相关模型参数进行分析和拟合处理,这两个操作虽然会影响到具体参数的不同取值,但是不会改变模型框架的基本结构。因此,步骤(3)、(4)是业务模型的网络化,即给模型参数赋予与具体网络相对应的数值。最后步骤(5)是用均值、方差以及分形几何学的理论(即自相似、多重分形的相关理论)对仿真业务模型产生的各项数据进行分析,验证、判断所构建的业务模型的准确与有效,并为前面相关步骤的分析提供支持,即从不同角度分析该业务模型所产生的数据与实际网络采集的数据之间的差距,以使今后构建的业务模型更加贴近实际。总之,本发明为构建多媒体网页浏览业务模型提供了一种切实、有效、简单、可行的方法,具有很好的推广应用前景。
附图说明
图1是传统网页浏览业务模型的三层结构示意图。
图2是本发明多媒体网页浏览业务模型的建立方法的操作流程图。
图3是本发明建立的多媒体网页浏览业务模型的会话层和页面层结构图。
图4是本发明建立的多媒体网页浏览业务模型中的普通页面结构图。
图5是本发明建立的多媒体网页浏览业务模型中的多媒体页面结构图。
图6是本发明建立的多媒体网页浏览业务模型的框架结构图。
图7是本发明方法中的分析、处理数据的操作步骤流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
本发明是一种建立多媒体网页浏览业务模型的方法,它是先对多媒体网页浏览业务进行理论分析,以传统的网页浏览业务模型的三层结构框架为基础,将统计模型扩展为四层结构,并引入新的模型参数来描述页面层中的多媒体业务的特征,建立多媒体网页浏览业务模型;再从实际网络中采集模型参数的系列数据,进行分析处理,拟合出模型参数的概率分布函数;这样,由模型框架、各个模型参数对应拟合的概率分布函数及其相关参数一起构建多媒体网页浏览业务模型;最后,采用仿真与理论结合的方法分析、验证和修正该业务模型。
众所周知,多媒体网页是在网页中嵌入或链接有包括视频、音频、图像、动画、数据的多媒体业务成分的网页。而电信业务的建模过程,除了要分析业务源的特性以外,关键是要借助合理的分析方法与适当的建模流程。本发明建立的多媒体网页浏览业务(其能够兼容普通网页浏览业务)模型为网页浏览业务模型。该方法是对多媒体网页浏览业务模型中的不同属性的嵌入对象或链接对象进行区别后、分别建模,以体现不同性质的嵌入对象或链接对象之间的不同业务特征。
参见图2,详细说明本发明建立多媒体网页浏览业务模型方法操作流程的各个具体步骤:
(1)理论分析:从理论上分析多媒体网页浏览业务的自然属性:其不同业务组成成分及每个成分的物理意义与特征;在观察多媒体网页特征的基础上,提出多媒体网页浏览业务模型的框架。
参见图3,介绍本发明构建的多媒体网页浏览业务模型的会话层和页面层结构。图4与图5则分别给出传统三层模型的普通页面结构与本发明所构建模型的多媒体页面结构,两者之间的不同是很显著的。通过理论分析,本发明所要建立的业务模型框架结构有四层(参见图6):第一层为会话层,采用ON和OFF分别描述用户发起的网页浏览会话持续时间和相邻的两个浏览会话之间的间隔时间。第二层为页面层:表示每次会话中浏览的普通页面和多媒体页面。第三层为对象层:表示每个页面所包含的对象,包括主对象(由文字、页面的基本框架组成)、嵌入对象(由包括静止图像和小动画组成)、或多媒体对象。第四层为数据包层,用于对第三层的多媒体对象、即视频对象作扩展分析,使用特定参数描述多媒体对象的数据包大小及其到达情况。
(2)提取参数:根据传统三层业务模型的相关参数及其意义,以及前一步骤的理论分析,提取各种模型参数来描述不同业务成分的物理特征,并用作业务模型框架中各种具有确定物理意义的不同参数。
本发明提取的模型参数如下表所示:
(3)采集数据,计算得到各项模型参数:采用网络数据采集软件,在设定网络的路由器或其它设定节点上采集包括普通网页浏览业务和含有多媒体视频播放的网页浏览业务的大量数据(采集时间要足够长),再从中进行筛选、过滤,将与建模相关的数据选择出来;再对选出的建模数据进行计算、处理,得到各个模型参数的数据序列。该步骤进一步包括下列操作内容(参见图7):
(31)筛选数据:按照IP地址和超文本链接标记语言协议HTTP对数据进行筛选,由于无法对部分视频业务的应用层协议进行解析,只能捕获到其数据包对应的传输层信息,所以数据筛选就是将HTTP协议数据包和由“GET”引发的传输控制协议TCP数据包筛选出来。
(32)读取信息:读取筛选出来的每个数据包的各种信息:包括IP地址、端口号、到达时间、页面标志、包的大小。
(33)提取会话层模型参数对应数值:分析上述数据包的信息,以便由“GET”区分出页面的开始,继而得到页面到达时间和其它初步信息;再将统计出来的页面到达时间进行排序后,求出其二阶导数,再以二阶导数最大处的数值作为会话间隔的门限值;然后利用该门限值来区分页面间隔与会话间隔,由此获得会话层的各个模型参数的数值。
(34)区分页面的类型:统计多媒体页面的比例,并分别存储普通页面的数据和多媒体页面的数据,对于普通页面,则顺序执行后续操作;对于多媒体页面,则跳转执行步骤(36)的操作。
(35)提取普通页面的页面层模型参数值,并进行统计分析:采用步骤(33)的计算方法得到各个对象间隔的门限值,再计算得到普通页面页面层的各个模型参数的数值。
(36)提取普通页面的对象层参数值:用端口号区分主对象和嵌入对象(主要考虑在HTTP 1.1协议情况下),得到普通页面对象层的各项模型参数的数值。
(37)提取多媒体页面的页面层参数值,并进行统计分析:采用步骤(33)的计算方法得到各个对象间隔的门限值,再计算得到多媒体页面页面层的各个模型参数的数值。
(38)提取多媒体页面的对象层参数值:用端口号区分主对象、嵌入对象和多媒体对象,得到多媒体页面对象层的各个模型参数的数值。
(39)提取多媒体数据包参数值:统计各个多媒体对象所对应的数据包的到达时间、大小和其它信息,得到数据包层的各个模型参数的数值。
(4)对各个模型参数的数据序列分别进行计算、分析和拟合处理:先分别计算各个模型参数数据序列的统计特性:均值和方差,以及每个模型参数数据序列的概率累积分布函数CDF;再采用多个不同概率分布函数分别估算每个模型参数的均值和方差,以及分别计算、拟合每个模型参数对应这些不同概率分布函数的CDF;然后,对每个模型参数的CDF与其对应的多个概率分布函数的CDF进行比较,以最小均方误差(MMSE)方法选择出最佳概率分布函数;藉此,构建完成以模型框架、各个模型参数对应的拟合函数、以及该拟合函数中的对应参数所组成的多媒体网页浏览业务模型。
该步骤(4)进一步包括下列操作内容:
(41)分别计算各个模型参数的数据序列的均值和平方差,以及每个模型参数数据序列的概率累积分布函数CDF。
(42)利用各个模型参数的均值和平方差估算具有该均值和方差的韦布Weibull概率分布函数中的两个参数:尺度参数α和形状参数β,再利用这两个参数计算出Weibull概率分布函数的CDF。
(43)采用步骤(42)的方法,计算各个模型参数的均值和方差分别在Pareto、Exponential、Normal、Geometric和Lognormal五个概率分布函数中所对应的相关参数及其CDF。
(44)将各个模型参数的数据序列的CDF与步骤(42)和(43)中计算得到的六个CDF进行比较,采用最小均方误差(MMSE)准则,从该六种概率分布函数中选出最佳概率分布函数作为每个模型参数的拟合函数。
(45)以所选取的拟合分布函数中的对应参数来取代步骤(42)和(43)中估算得到的模型参数。
(46)以模型框架、各个模型参数所对应的拟合函数,以及该拟合函数中的对应参数为基础,基本确立多媒体网页浏览业务模型。
(5)搭建仿真平台,验证所建业务模型的准确性与有效性:以仿真运行结合理论分析的方法,对该业务模型仿真运行所产生的数据与实际网络中采集到的数据进行分析,以判断、验证该业务模型是否准确与有效,同时,把验证结果反馈到理论分析和数据分析步骤中的相关操作,对所建业务模型进行修改和完善。该步骤(5)进一步包括下列操作内容:
(51)采用OPNET Modeler软件搭建与实际系统相类似的网络,该搭建的网络仿真平台要尽可能模仿实际系统的网络架构、协议组成、控制流程和业务状况,以便仿真结果更加接近实际网络运行状况;
(52)在仿真平台中构建业务产生模块,并将各个模型参数用于业务产生模块,以便对由该模型参数产生的业务流量进行分析处理;
(53)在仿真平台的节点上构建业务采集模块,并模仿实际运行网络的数据采集机制采集该仿真网络中的业务流量数据;此时,应确保采集过程不会影响该仿真网络中的业务流量特性;
(54)对采集的数据进行分析处理:先以不同时间单元所采集的数据组成多个序列,分别计算这些数据序列的一阶统计特性:均值、二阶统计特性:平方差、高阶统计特性、自相似性:Hurst值和局部奇异性:多重分形谱,并与实际运行网络中采集到的数据序列的对应统计特性进行比较,以验证所建业务模型是否准确与有效;
(55)将验证结果反馈到理论分析和数据分析步骤中的相关操作,对模型框架、模型参数、拟合函数和该函数的对应参数进行调整,以修正和完善所构建的业务模型。
本发明方法已经进行了试验实施,通过对实施例的分析,利用本发明方法构建的业务模型所产生的业务数据的自相似性Hurst值,要比传统三层业务模型所产生的业务数据的自相似性Hurst值更加接近于实际网络中采集的数据Hurst值。同时,对上述三者的不同多重分形谱进行考察、分析可以发现:本发明方法建立的业务模型所产生的业务数据具有与实际网络中采集的数据更加接近的局部奇异性。因此,本发明的实施例试验是成功的实现了发明目的。使用该方法所建立的多媒体网页浏览业务模型能够为当前网络提供更加准确、可靠、有效的服务。而且,随着网络的发展和多媒体业务的不断推广,多媒体网页浏览业务将会得到更为广泛的应用,本发明也将具有很好的应用前景。
Claims (8)
1.一种建立多媒体网页浏览业务模型的实现方法,其特征在于:先对多媒体网页浏览业务进行理论分析,以传统的网页浏览业务模型的三层结构框架为基础,将统计模型扩展为下述四层结构:会话层、页面层、对象层和数据包层,并引入新的模型参数来描述页面层中的多媒体业务的特征,建立多媒体网页浏览业务模型;再从实际网络中采集模型参数的系列数据,进行分析处理,拟合出模型参数的概率分布函数;这样,由模型框架、各个模型参数对应拟合的概率分布函数及其相关参数一起构建多媒体网页浏览业务模型;最后,采用仿真与理论结合的方法分析、验证和修正该业务模型;所述方法包括下述操作步骤:
(1)理论分析:从理论上分析多媒体网页浏览业务的不同业务组成成分及每个成分的物理意义与特征;在观察多媒体网页特征的基础上,提出多媒体网页浏览业务模型的框架;
(2)提取参数:提取各种模型参数来描述不同业务成分的物理特征,并用作所述业务模型框架中所包含的各种具有确定物理意义的不同参数;
(3)采集数据,计算得到各项模型参数:采用网络数据采集软件,在设定网络的路由器或其它设定节点上大量采集包括普通网页浏览业务和含有多媒体成分的网页浏览业务的数据,从中进行筛选、过滤,将与建模相关的数据选择出来;再对选出的建模数据进行计算、处理,得到各个模型参数的数据序列;
(4)对各个模型参数的数据序列分别进行计算、分析和拟合处理:先分别计算各个模型参数数据序列的统计特性:均值和方差,以及每个模型参数数据序列的概率累积分布函数CDF;再采用多个不同概率分布函数分别估算每个模型参数的均值和方差,以及分别计算、拟合每个模型参数对应这些不同概率分布函数的CDF;然后,对每个模型参数的CDF与其对应的多个概率分布函数的CDF进行比较,以最小均方误差MMSE方法选择出最佳概率分布函数;藉此,构建完成以模型框架、各个模型参数对应的拟合函数、以及该拟合函数中的对应参数所组成的多媒体网页浏览业务模型;
(5)搭建仿真平台,验证所建业务模型的准确性与有效性:以仿真运行结合理论分析的方法,对该业务模型仿真运行所产生的数据与实际网络中采集到的数据进行分析,以判断、验证该业务模型是否准确与有效,同时,把验证结果反馈到理论分析和数据分析步骤中的相关操作,对所建业务模型进行修改和完善。
2.根据权利要求1所述的建立多媒体网页浏览业务模型的实现方法,其特征在于:所述多媒体网页是在网页中嵌入或链接有包括视频、音频、图像或动画的多媒体业务成分的网页;所述多媒体网页浏览业务模型同样适用于普通网页浏览业务。
3.根据权利要求1所述的建立多媒体网页浏览业务模型的实现方法,其特征在于:所述多媒体网页浏览业务模型框架的四层结构的功能分别是:第一层为会话层,采用ON和OFF分别描述用户发起的网页浏览会话持续时间和相邻的两个浏览会话之间的间隔时间;第二层为页面层,表示每次会话中浏览的普通页面和多媒体页面;第三层为对象层,表示每个页面所包含的对象,包括由文字、页面的基本框架组成的主对象、由包括静止图像和动画组成的嵌入对象或多媒体对象;第四层为数据包层,用于对第三层的包括视频对象的多媒体对象作扩展分析,使用特定参数描述多媒体对象的数据包大小及其到达情况。
4.根据权利要求1所述的建立多媒体网页浏览业务模型的实现方法,其特征在于:所述多媒体网页浏览业务模型包括有下述各层的模型参数:
会话层的参数:
Session interarrival time,表示两个相邻会话session的到达时间之间的间隔;
Session duration,表示一个会话session的持续时长;
Pages per session,表示一个会话session中下载的网页数量;
Multimedia page ratio,表示多媒体页面占总页面的比例;
页面层的参数:
Page size,表示网页的大小;
Object number per page,表示一个网页中包含对象object的数量;
Page interarrival time,表示页面Page到达时间间隔;
对象层的参数:
Main object size,表示主对象Main object大小;
Inline object size,表示嵌入对象Inline object大小;
Object interval,表示Main object和Inline object之间的时间间隔;
Video object size,表示多媒体视频对象Video object大小;
Relative arrive time,表示Video object的启动时间与相应页面page起始时间之间的时间间隔;
数据包层的参数:
Video packet interval,表示不同视频数据包Video packet之间的时间间隔;
Video packet size,表示Video packet大小。
5.根据权利要求1所述的建立多媒体网页浏览业务模型的实现方法,其特征在于:所述步骤(3)进一步包括下列操作内容:
(31)筛选数据:按照IP地址和超文本链接标记语言协议HTTP对数据进行筛选,将HTTP协议数据包和由“GET”引发的传输控制协议TCP数据包筛选出来;
(32)读取信息:读取筛选出来的每个数据包的各种信息:包括IP地址、端口号、到达时间、页面标志、包的大小;
(33)提取会话层模型参数对应数值:对上述数据包的信息进行分析,以便由“GET”区分出页面的开始,继而得到页面到达时间和其它初步信息,再将统计出来的页面到达时间进行排序后,求出其二阶导数,再以二阶导数最大处的数值作为会话间隔的门限值;然后利用该门限值来区分页面间隔与会话间隔,由此获得会话层的各个模型参数的数值;
(34)区分页面的类型:统计多媒体页面的比例,并分别存储普通页面的数据和多媒体页面的数据,对于普通页面,则顺序执行后续操作;对于多媒体页面,则跳转执行步骤(36)的操作;
(35)提取普通页面的页面层模型参数值,并进行统计分析:采用步骤(33)的计算方法得到各个对象间隔的门限值,再计算得到普通页面的页面层的各个模型参数的数值;
(36)提取普通页面的对象层参数值:用端口号区分主对象和嵌入对象,得到普通页面对象层的各项模型参数的数值;
(37)提取多媒体页面的页面层参数值,并进行统计分析:采用步骤(33)的计算方法得到各个对象间隔的门限值,再计算得到多媒体页面的页面层的各个模型参数的数值;
(38)提取多媒体页面的对象层参数值:用端口号区分主对象、嵌入对象和多媒体对象,得到多媒体页面对象层的各个模型参数的数值;
(39)提取多媒体数据包参数值:统计各个多媒体对象所对应的数据包的到达时间、大小和其它信息,得到数据包层的各个模型参数的数值。
6.根据权利要求1所述的建立多媒体网页浏览业务模型的实现方法,其特征在于:所述步骤(4)进一步包括下列操作内容:
(41)分别计算各个模型参数的数据序列的均值和方差,以及每个模型参数数据序列的概率累积分布函数CDF;
(42)利用各个模型参数的均值和方差估算具有该均值和方差的韦布Weibull概率分布函数中的两个参数:尺度参数α和形状参数β,再利用这两个参数计算出Weibull概率分布函数的CDF;
(43)采用步骤(42)的方法,计算各个模型参数的均值和方差分别在帕累托Pareto、指数Exponential、正态Normal、几何Geometric和对数正态Lognormal五个概率分布函数中所对应的相关参数及其CDF;
(44)将各个模型参数的数据序列的CDF与步骤(42)和(43)中计算得到的六个CDF进行比较,采用最小均方误差MMSE准则,从该六种概率分布函数中选出最佳概率分布函数作为每个模型参数的拟合函数;
(45)以所选取的拟合函数中的对应参数来取代步骤(42)和(43)中估算得到的模型参数;
(46)以模型框架、各个模型参数所对应的拟合函数,以及该拟合函数中的对应参数为基础,确立多媒体网页浏览业务模型。
7.根据权利要求1所述的建立多媒体网页浏览业务模型的实现方法,其特征在于:所述步骤(5)进一步包括下列操作内容:
(51)采用OPNET Modeler软件搭建与实际系统相类似的网络的仿真平台要尽可能模仿实际系统的网络架构、协议组成、控制流程和业务状况,以便仿真结果更加接近实际网络运行状况;
(52)在仿真平台中构建业务产生模块,并将各个模型参数用于业务产生模块,以便对由该模型参数产生的业务流量进行分析处理;
(53)在仿真平台的节点上构建业务采集模块,并模仿实际运行网络的数据采集机制采集该仿真平台中的业务流量数据;此时,应确保采集过程不会影响该仿真平台中的业务流量特性;
(54)对采集的数据进行分析处理:先以不同时间单元所采集的数据组成多个序列,分别计算这些数据序列的一阶统计特性:均值、二阶统计特性:平方差、高阶统计特性、自相似性:Hurst值和局部奇异性:多重分形谱,并与实际运行网络中采集到的数据序列的对应统计特性进行比较,以验证所建业务模型是否准确与有效;
(55)将验证结果反馈到理论分析和数据分析步骤中的相关操作,对模型框架、模型参数、拟合函数和该函数的对应参数进行调整,以修正和完善所构建的业务模型。
8.根据权利要求1所述的建立多媒体网页浏览业务模型的实现方法,其特征在于:所述方法对多媒体网页浏览业务模型中的不同属性的嵌入对象或链接对象进行区别后、分别建模,以体现不同性质的嵌入对象或链接对象之间的不同业务特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101033079A CN101252480B (zh) | 2008-04-02 | 2008-04-02 | 一种建立多媒体网页浏览业务模型的实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101033079A CN101252480B (zh) | 2008-04-02 | 2008-04-02 | 一种建立多媒体网页浏览业务模型的实现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101252480A CN101252480A (zh) | 2008-08-27 |
CN101252480B true CN101252480B (zh) | 2010-09-15 |
Family
ID=39955677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101033079A Expired - Fee Related CN101252480B (zh) | 2008-04-02 | 2008-04-02 | 一种建立多媒体网页浏览业务模型的实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101252480B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8589863B2 (en) * | 2008-12-11 | 2013-11-19 | International Business Machines Corporation | Capturing information accessed, updated and created by services and using the same for validation of consistency |
CN102104503B (zh) * | 2009-12-21 | 2013-04-17 | 中国移动通信集团设计院有限公司 | 一种网络的传输流量仿真方法及设备 |
CN104462545B (zh) * | 2014-12-24 | 2017-12-19 | 国家电网公司 | 一种基于三层模型的页面构造方法和装置 |
CN108200197B (zh) * | 2018-02-02 | 2020-12-04 | 湘潭大学 | 一种wlan浏览网页业务电磁辐射预测方法 |
CN109768340B (zh) * | 2018-12-05 | 2020-12-22 | 国联汽车动力电池研究院有限责任公司 | 一种电池放电过程电压不一致性估计方法及装置 |
CN111050345B (zh) * | 2019-12-09 | 2022-11-01 | 东南大学 | 用于移动通信系统中业务流量的统计方法和装置 |
CN113364602A (zh) * | 2020-03-03 | 2021-09-07 | 阿里巴巴集团控股有限公司 | 一种触发页面故障报警的方法、装置和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1674513A (zh) * | 2005-04-30 | 2005-09-28 | 北京紫光绿信科技有限公司 | 一种web网页信息推送技术及应用系统 |
CN1866956A (zh) * | 2005-12-23 | 2006-11-22 | 华为技术有限公司 | 实现网页访问的方法、移动终端及系统 |
CN1956404A (zh) * | 2005-10-28 | 2007-05-02 | 国际商业机器公司 | 使用面向消息传送的中间件动态地更新网页的系统和方法 |
CN101140574A (zh) * | 2006-09-05 | 2008-03-12 | 腾讯科技(深圳)有限公司 | 一种网页内容展现方法和一种客户端装置 |
-
2008
- 2008-04-02 CN CN2008101033079A patent/CN101252480B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1674513A (zh) * | 2005-04-30 | 2005-09-28 | 北京紫光绿信科技有限公司 | 一种web网页信息推送技术及应用系统 |
CN1956404A (zh) * | 2005-10-28 | 2007-05-02 | 国际商业机器公司 | 使用面向消息传送的中间件动态地更新网页的系统和方法 |
CN1866956A (zh) * | 2005-12-23 | 2006-11-22 | 华为技术有限公司 | 实现网页访问的方法、移动终端及系统 |
CN101140574A (zh) * | 2006-09-05 | 2008-03-12 | 腾讯科技(深圳)有限公司 | 一种网页内容展现方法和一种客户端装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101252480A (zh) | 2008-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101252480B (zh) | 一种建立多媒体网页浏览业务模型的实现方法 | |
CN107896160B (zh) | 一种基于分布式系统的数据中心网络流量建模方法 | |
Hernández-Campos et al. | Spatio-temporal modeling of traffic workload in a campus WLAN | |
CN106789242A (zh) | 一种基于手机客户端软件动态特征库的识别应用智能分析引擎 | |
CN107579874A (zh) | 一种检测流量采集设备数据采集漏报的方法及装置 | |
CN103716211B (zh) | 网络终端的数据流量测量方法 | |
CN112235254B (zh) | 一种高速主干网中Tor网桥的快速识别方法 | |
CN110266603A (zh) | 基于http协议的身份认证业务网络流量分析系统及方法 | |
CN101986608A (zh) | 一种异构覆盖网络负载均衡程度的评价方法 | |
CN110995770B (zh) | 一种模糊测试应用效果对比方法 | |
CN116521340B (zh) | 一种基于大带宽网络的低延时并行数据处理系统及方法 | |
CN106708417A (zh) | 缓存数据的管理方法及装置 | |
Rolland et al. | Using LitGen, a realistic IP traffic model, to evaluate the impact of burstiness on performance | |
Melo et al. | An overview of self-similar traffic: Its implications in the network design | |
CN105634850B (zh) | Ptn网络的业务流量建模方法及装置 | |
CN104065490B (zh) | 基于在线计费环境实现模拟收发设备信令的系统及方法 | |
CN113726809B (zh) | 基于流量数据的物联网设备识别方法 | |
CN113298125B (zh) | 基于特征选择的物联网设备流量异常检测方法、装置及存储介质 | |
CN107835190A (zh) | 一种恶意sp订购核查方法 | |
CN107145414A (zh) | 一种用于测试分布式对象存储的方法和系统 | |
Cai et al. | Network simulation based on opnte and application | |
CN117313004B (zh) | 一种在物联网中基于深度学习的QoS流分类方法 | |
RU2776023C1 (ru) | Методика оценки параметров качества обслуживания с использованием аналитической и имитационной модели инфокоммуникационной сети с обработкой трафика реального времени | |
CN115766470B (zh) | 一种全场景虚拟网络攻防平台及其方法 | |
CN106657031A (zh) | 一种wlan集中审计方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100915 Termination date: 20150402 |
|
EXPY | Termination of patent right or utility model |