CN104469805A - 基于用户行为分析的即时通讯业务流量生成方法 - Google Patents
基于用户行为分析的即时通讯业务流量生成方法 Download PDFInfo
- Publication number
- CN104469805A CN104469805A CN201310419410.5A CN201310419410A CN104469805A CN 104469805 A CN104469805 A CN 104469805A CN 201310419410 A CN201310419410 A CN 201310419410A CN 104469805 A CN104469805 A CN 104469805A
- Authority
- CN
- China
- Prior art keywords
- user
- packet
- chat
- data
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000004458 analytical method Methods 0.000 title claims abstract description 15
- 238000004891 communication Methods 0.000 title abstract description 5
- 230000009471 action Effects 0.000 claims description 35
- 230000000737 periodic effect Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000009189 diving Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种基于用户行为分析的即时通讯业务的流量生成方法,主要应用于宽带无线通信的流量测试分析,本方法考虑了各用户的消息时间间隔、消息数据大小和在线时长,用于刻画用户的即时聊天行为频率,并以此聚类建立不同的聊天行为模型,同时引入系统数据作为背景流量,因此能够准确地反映最真实的用户在即时通讯时所产生的流量状况。
Description
技术领域
本发明涉及宽带无线通信的流量产生技术,尤其是涉及一种基于用户行为分析的即时通讯业务流量生成方法。
背景技术
随着宽带无线接入技术和移动终端技术的迅速发展,移动互联网的规模逐渐扩大。移动互联网用户数量的攀升,网络应用的多样化,使得网络流量也发生了实质性的变化。为了研究带宽拥塞、网络运行维护、网络攻击、QoE等问题,首先需要了解的是网络流量的特性。在这种情况下,寻找有效方法进行网络模拟和实验变得至关重要,由此发展出了流量生成技术。
目前,流量生成的主要方法是模型流量生成,在了解网络流量特性后对流量进行数学建模,按照数学模型发送数据包,从而产生符合网络特性的网络流量。近年来研究者通过对大量网络流量的测量和分析,网络流量模型已经从泊松分布变成长相关、自相似。但是这些特点是从网络流量的整体概率分布分析得到的,产生的流量与真实流量在整体上较为接近,但是不能反映单一用户的行为特点,在许多情况下显得不足。
在业务模型方面,根据用户使用业务的规律性和业务本身的属性,对现网采集的真实业务数据进行统计分析,可刻画业务流量产生过程的业务模型。目前,针对HTTP业务有ON/OFF模型,研究者在此基础上进行了诸多改进,此方面的技术较为成熟。但是,不同类型业务具有各自的流量特点,模型不具备极强的通用性,以即时通讯业务为研究对象的流量建模方法较少,尤其是基于用户行为刻画的流量产生方法。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于用户行为分析的即时通讯业务流量生成方法,该方法针对移动互联网中的即时通讯业务的即时聊天行为,根据用户聊天的频度对用户群进行聚类建模,由此产生的整体流量能够与真实流量近似,且同时能够体现单一用户的行为特点。
本发明的目的可以通过以下技术方案来实现:
一种基于用户行为分析的即时通讯业务流量生成方法,包括以下步骤:
1)从基站采集用户的数据包;
2)根据用户进行即时通信所使用的软件协议,识别用户的聊天动作和系统动作所对应的数据包;
3)将步骤2)中得到的系统动作数据包按照动作属性分类,分别统计不同系统动作的相邻数据包发送间隔和数据包大小,选择峰值或者次峰值作为系统动作数据包重建的依据值;
4)将步骤2)中得到的聊天动作数据包按照动作属性分类,分别统计不同聊天动作的数据包大小和频次,并选择峰值作为聊天动作数据包重建的依据值;
5)统计各个用户登录和注销的时间差,获取用户进行即时通讯的在线时长,并根据在线时长对用户进行分类;
6)根据用户在单位时间内发送信息的频次,对用户的聊天等级进行划分,并获取每一类用户在其在线时间内的聊天等级分布;
7)根据步骤6)中每一类用户在其在线时间内的聊天等级分布,结合步骤3)和步骤4)获取的系统动作数据包和聊天动作数据包中间的依据值,组合得到每一类用户的流量组合模型,并根据流量组合模型及用户类型产生的数据包流量。
步骤1)中通过抓包软件从基站采集用户数据,得到pcap格式的文件,并从中获取包括数据包序号、时间、源IP地址、目的IP地址、数据长度、数据内容在内的信息。
所述的聊天动作包括但不限于登录、注销、发送消息、接收消息,所述的系统动作包括但不限于心跳数据收发、好友定时刷新。
步骤4)中若系统动作的相邻数据包发送间隔和数据包大小无明显峰值时,则计算其加权平均值作为系统动作数据包重建的依据值。
与现有技术相比,本发明能够逼真地在时间上和流量上模仿用户即时通讯时产生的数据包,搭建的模型完整刻画用户的使用过程,且在实现时可以多线程的方式模拟多用户的使用情况,从而产生大规模网络流量。
附图说明
图1为本发明的整体操作流程图;
图2为本发明实施例的数据包交互方式;
图3为本发明的具体实施流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
如图1所示本发明一种基于用户行为分析的即时通讯业务流量生成方法的整体流程图,本实施例以手机QQ这一即时通讯软件为例,对该方法进行说明,其详细流程如图3所示,包括以下步骤:
步骤1,从基站采集用户使用手机QQ这一即时通讯业务的数据包,得到pcap格式的文件,并从中获取数据包序号、时间、源IP地址、目的IP地址、数据长度、数据内容在内的信息。具体操作时,将pcap文件内容转换为表格形式以便于读取分析,需要提取的内容如表1所示。
表1
数据包序号 | 时间 | 源IP地址 | 目的IP地址 | 数据长度 | 数据内容 |
...... | ...... | ...... | ...... | ...... | ...... |
步骤2,根据手机QQ的软件协议特征,包括动作含义的标志、数据包交互的方式等,识别用户的聊天动作和系统动作所对应的数据包。在数据包的数据内容部分,特定字节位置标记动作含义。手机QQ是基于TCP的数据包传输,客户端Client发送带有动作标志的数据请求,服务器Server先回复ACK,后发送带有相同动作标志的数据响应,客户端Client回复ACK,如此完成一次信息交互,如图2所示。
步骤3,根据动作含义的标志,将用户产生的数据包分为聊天动作(如登录、注销、发送消息、接收消息等)和系统动作(如心跳、刷新好友等)等两部分。聊天动作的数据包是用户主动产生的,系统动作的数据包是用户被动产生的。鉴于其产生原因不同,其流量模型的产生方式也是不同的。
步骤4,将各用户被动产生的系统动作数据包按照动作属性分类,分别统计不同系统动作的相邻数据包发送间隔和数据包大小。
步骤5,步骤4的统计结果,选择峰值或者次峰值作为系统动作数据包重建的依据值。若系统动作的相邻数据包发送间隔和数据包大小无明显峰值时,则计算其加权平均值作为系统动作数据包重建的依据值。
步骤6,对各用户登录和注销动作的数据包大小进行频次统计,同时计算各用户的在线时长ton_line=TLogout-TLogin,其中,TLogout为登录时间,TLogin为注销时间。
步骤7,根据步骤6的统计结果,选择各动作的数据包的频次峰值作为相应动作重建的依据。鉴于在线时长是用户使用习惯的重要表现之一,故根据在线时长将用户聚类,并得出各类时长用户在样本中的分布比例ηj,其中j=1,2,...M,ηi≤1。
步骤8,根据步骤7的用户分类结合系统动作、登录和注销动作等的数据包间隔ti和大小li的重建数据,组合出各类手机QQ用户的在线静默数据包流量模型。其中i=1,2,...,n,为相关动作编号。其全部参数可记作矩阵Θ,
步骤9,将各用户主动产生的聊天动作(如发送消息、接收消息)进行数据包发送间隔和数据包大小的频次统计。
步骤10根据步骤9的统计结果,按照用户单位时间发送消息的数量,对用户聊天的频度进行分级,如潜水用户、轻度用户、重度用户等。对样本中分类用户每单位时间的聊天水平进行评级。
步骤11根据步骤9的统计结果,选择发送消息、接收消息动作的数据包大小作重建数据,在数据包发送间隔方面结合用户聊天频度的分级标准,搭建潜水用户、轻度用户和重度用户的单位时间聊天流量模型。
步骤12,结合步骤8得到的不同用户的在线静默数据包流量模型,以及具有不同聊天水平评级用户的单位时间聊天流量模型,得到样本用户群各类用户的数据包流量模型,并由该数据包流量模型生成即时通讯业务流量。
Claims (4)
1.一种基于用户行为分析的即时通讯业务流量生成方法,其特征在于,包括以下步骤:
1)从基站采集用户的数据包;
2)根据用户进行即时通信所使用的软件协议,识别用户的聊天动作和系统动作所对应的数据包;
3)将步骤2)中得到的系统动作数据包按照动作属性分类,分别统计不同系统动作的相邻数据包发送间隔和数据包大小,选择峰值或者次峰值作为系统动作数据包重建的依据值;
4)将步骤2)中得到的聊天动作数据包按照动作属性分类,分别统计不同聊天动作的数据包大小和频次,并选择峰值作为聊天动作数据包重建的依据值;
5)统计各个用户登录和注销的时间差,获取用户进行即时通讯的在线时长,并根据在线时长对用户进行分类;
6)根据用户在单位时间内发送信息的频次,对用户的聊天等级进行划分,并获取每一类用户在其在线时间内的聊天等级分布;
7)根据步骤6)中每一类用户在其在线时间内的聊天等级分布,结合步骤3)和步骤4)获取的系统动作数据包和聊天动作数据包中间的依据值,组合得到每一类用户的流量组合模型,并根据流量组合模型及用户类型产生的数据包流量。
2.根据权利要求1所述的一种基于用户行为分析的即时通讯业务流量生成方法,其特征在于,步骤1)中通过抓包软件从基站采集用户数据,得到pcap格式的文件,并从中获取包括数据包序号、时间、源IP地址、目的IP地址、数据长度、数据内容在内的信息。
3.根据权利要求1所述的一种基于用户行为分析的即时通讯业务流量生成方法,其特征在于,所述的聊天动作包括但不限于登录、注销、发送消息、接收消息,所述的系统动作包括但不限于心跳数据收发、好友定时刷新。
4.根据权利要求1所述的一种基于用户行为分析的即时通讯业务流量生成方法,其特征在于,步骤4)中若系统动作的相邻数据包发送间隔和数据包大小无明显峰值时,则计算其加权平均值作为系统动作数据包重建的依据值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310419410.5A CN104469805B (zh) | 2013-09-13 | 2013-09-13 | 基于用户行为分析的即时通讯业务流量生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310419410.5A CN104469805B (zh) | 2013-09-13 | 2013-09-13 | 基于用户行为分析的即时通讯业务流量生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104469805A true CN104469805A (zh) | 2015-03-25 |
CN104469805B CN104469805B (zh) | 2018-04-27 |
Family
ID=52915013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310419410.5A Expired - Fee Related CN104469805B (zh) | 2013-09-13 | 2013-09-13 | 基于用户行为分析的即时通讯业务流量生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104469805B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016180267A1 (zh) * | 2015-05-13 | 2016-11-17 | 阿里巴巴集团控股有限公司 | 交互数据的处理方法及装置 |
CN107465519A (zh) * | 2017-08-18 | 2017-12-12 | 青岛数与信息科技有限公司 | 一种基于即时通讯应用的数据管理系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101990003A (zh) * | 2010-10-22 | 2011-03-23 | 西安交通大学 | 一种基于ip地址属性的用户行为监控系统与方法 |
US8331618B1 (en) * | 2008-12-16 | 2012-12-11 | Symantec Corporation | Method and apparatus for monitoring instant messaging with visual identification |
CN103001805A (zh) * | 2012-12-17 | 2013-03-27 | 重庆邮电大学 | 基于用户行为分析的web用户流量产生方法 |
-
2013
- 2013-09-13 CN CN201310419410.5A patent/CN104469805B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8331618B1 (en) * | 2008-12-16 | 2012-12-11 | Symantec Corporation | Method and apparatus for monitoring instant messaging with visual identification |
CN101990003A (zh) * | 2010-10-22 | 2011-03-23 | 西安交通大学 | 一种基于ip地址属性的用户行为监控系统与方法 |
CN103001805A (zh) * | 2012-12-17 | 2013-03-27 | 重庆邮电大学 | 基于用户行为分析的web用户流量产生方法 |
Non-Patent Citations (1)
Title |
---|
杨阳: "即时通讯流量识别还原技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016180267A1 (zh) * | 2015-05-13 | 2016-11-17 | 阿里巴巴集团控股有限公司 | 交互数据的处理方法及装置 |
KR20180006955A (ko) * | 2015-05-13 | 2018-01-19 | 알리바바 그룹 홀딩 리미티드 | 상호작용 데이터 프로세싱 방법, 및 이를 이용하는 장치 |
KR102127039B1 (ko) | 2015-05-13 | 2020-06-26 | 알리바바 그룹 홀딩 리미티드 | 상호작용 데이터 프로세싱 방법, 및 이를 이용하는 장치 |
US10956847B2 (en) | 2015-05-13 | 2021-03-23 | Advanced New Technologies Co., Ltd. | Risk identification based on historical behavioral data |
CN107465519A (zh) * | 2017-08-18 | 2017-12-12 | 青岛数与信息科技有限公司 | 一种基于即时通讯应用的数据管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104469805B (zh) | 2018-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | Characterizing user behavior in mobile internet | |
Pietilänen et al. | Dissemination in opportunistic social networks: the role of temporal communities | |
CN102685790B (zh) | 模拟用户行为的移动流媒体业务感知体验QoE的测评方法 | |
CN103763149B (zh) | 网络用户数的实时统计方法 | |
CN105447147B (zh) | 一种数据处理方法及装置 | |
CN110445653A (zh) | 网络状态预测方法、装置、设备及介质 | |
CN103716826B (zh) | 基于无线数据业务仿真场景的用户体验质量测试方法 | |
CN104378264B (zh) | 一种基于sFlow的虚拟机进程流量监控方法 | |
CN101789887A (zh) | 网络用户分类方法、装置和网络业务监控系统 | |
CN107360586B (zh) | 一种网络质量的评估方法及装置 | |
Jun et al. | Mining and modelling the dynamic patterns of service providers in cellular data network based on big data analysis | |
CN102916854A (zh) | 流量统计方法、装置及代理服务器 | |
CN103945219A (zh) | 一种网络侧视频质量监测系统 | |
CN109359686A (zh) | 一种基于校园网流量的用户画像方法及系统 | |
CN113111271A (zh) | 出行od数据扩样方法、装置、计算机设备及存储介质 | |
CN109194533A (zh) | 数据传输延迟的测评方法及装置 | |
CN103188348A (zh) | 一种基于文件分享的联系人管理方法 | |
CN103716211B (zh) | 网络终端的数据流量测量方法 | |
Calegari et al. | CTG: A connectivity trace generator for testing the performance of opportunistic mobile systems | |
Bao et al. | User behavior and user experience analysis for social network services | |
CN102801548A (zh) | 一种智能预警的方法、装置及信息系统 | |
CN104469805A (zh) | 基于用户行为分析的即时通讯业务流量生成方法 | |
CN106878965B (zh) | 一种评估移动终端性能的方法和装置 | |
CN101986608B (zh) | 一种异构覆盖网络负载均衡程度的评价方法 | |
CN104219090A (zh) | 一种媒体多径中继传输业务体验质量协同评价系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180427 |