CN106202094B - 一种吸引力指数信息的确定方法和装置 - Google Patents

一种吸引力指数信息的确定方法和装置 Download PDF

Info

Publication number
CN106202094B
CN106202094B CN201510223543.4A CN201510223543A CN106202094B CN 106202094 B CN106202094 B CN 106202094B CN 201510223543 A CN201510223543 A CN 201510223543A CN 106202094 B CN106202094 B CN 106202094B
Authority
CN
China
Prior art keywords
period
data
internet behavior
active state
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510223543.4A
Other languages
English (en)
Other versions
CN106202094A (zh
Inventor
田旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201510223543.4A priority Critical patent/CN106202094B/zh
Publication of CN106202094A publication Critical patent/CN106202094A/zh
Application granted granted Critical
Publication of CN106202094B publication Critical patent/CN106202094B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种吸引力指数信息的确定方法和装置,用以解决现有技术中存在的确定吸引力指数信息时准确性较差的问题。该方法包括:获取第一预设时间内第一用户的上网行为数据;其中,所述第一用户在所述第一预设时间内参加第一指定活动;将所述第一预设时间划分为多个时间段,并确定每个时间段对应的上网行为数据;对每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据;根据得到的每个时间段对应的上网行为统计数据,以及预先得到的用于区分每个时间段内的活动状态的分类器,分别确定每个时间段内的活动状态;根据确定的每个时间段内的活动状态,确定所述第一指定活动的吸引力指数信息。

Description

一种吸引力指数信息的确定方法和装置
技术领域
本发明涉及数据业务技术领域,尤其涉及一种吸引力指数信息的确定方法和装置。
背景技术
演讲与会议是人们进行交流的重要方式,对于有经验的演讲者或者会议组织者而言,可以通过对现场观众行为的观察来评估主题的吸引力,即演讲、会议效果评估。但是这种判断属于一种主观感性的经验主义的定性判断,对于如何客观定量地对演讲和会议交流的效果进行评估,长期以来一直没有较为客观的评估标准和标准的方法。
目前,对于演讲和会议等主题效果评估的方法的主要思路如下所述:
方案1)记录演讲、会议的视频、音频信息,通过人工的图像分析和声音分析来标记主题,对会议主题进行标记。
方案2)会后调查问卷。
上述方案1提出的方法仅适用于有现场录音录像的情况,通过事后人工离线分析来完成,通过计算机自动化分析较为困难。而上述方案2提出的方法也需要事后人工分析来完成。
发明内容
本发明实施例提供一种确定吸引力指数信息的方法和装置,用以解决现有技术中存在的确定吸引力指数信息时准确性较差的问题。
本发明实施例采用以下技术方案:
一种吸引力指数信息的确定方法,包括:
获取第一预设时间内第一用户的上网行为数据;其中,所述第一用户在所述第一预设时间内参加第一指定活动;
将所述第一预设时间划分为多个时间段,并确定每个时间段对应的上网行为数据;
对每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据;
根据得到的每个时间段对应的上网行为统计数据,以及预先得到的用于区分每个时间段内的活动状态的分类器,分别确定每个时间段内的活动状态;
根据确定的每个时间段内的活动状态,确定所述第一指定活动的吸引力指数信息。
其中,所述用于区分每个时间段内的活动状态的分类器按照如下方式得到:
预先获取第二预设时间内第二用户的上网行为数据样本;其中,所述第二用户在所述第二预设时间内参加第二指定活动;
针对每个第二预设时间内获取的上网行为数据样本执行:将该第二预设时间划分成多个时间段,并确定每个时间段对应的上网行为数据样本;对每个时间段对应的上网行为数据样本进行统计,得到每个时间段对应的上网行为统计数据样本;对每个时间段对应的上网行为统计数据样本进行聚类,得到每个时间段内的活动状态;将每个时间段内的活动状态与对应的上网行为统计数据样本进行关联,得到该时间段的数据集;
对得到的每个时间段的数据集进行训练,得到用于区分每个时间段内的活动状态的分类器。
其中,获取第一预设时间内第一用户的上网行为数据,具体包括:
获得第一预设时间内接入预先部署的接入点AP的用户终端的位置信息和业务流数据;其中,所述位置信息携带所述用户终端的IP地址和接入AP的AP标识,所述业务流数据携带所述用户终端的IP地址;
根据获得的位置信息和业务流数据,建立所述业务流数据中的IP地址和所述位置信息中的AP标识之间的对应关系;
根据所述对应关系和预先设置的指定AP标识,从获取的位置信息和业务流数据中,筛选出携带所述指定AP标识的位置信息和携带所述指定AP标识对应的IP地址的业务流数据;
将筛选出的位置信息和业务流数据确定为所述第一预设时间内第一用户的上网行为数据。
其中,所述上网行为数据包括:用户终端的IP地址、用户访问的业务名称以及用户访问所述业务而产生的上下行流量三者之间的第一对应关系,以及用户终端的IP地址和媒体访问控制MAC地址二者之间的第二对应关系;则
对每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据,具体包括:
针对每个时间段对应的上网行为数据执行下述操作:
根据所述第一对应关系中包含的用户终端的IP地址的数量,确定表征用户密度的第一统计数据;
根据所述第二对应关系中包含的用户终端的IP地址对应的MAC地址的数量,确定表征用户流动性的第二统计数据;
根据所述第一对应关系中包含的用户访问的业务名称以及用户访问所述业务而产生的上下行流量,确定表征各类业务的上下行流量的第三统计数据;
将所述第一统计数据、所述第二统计数据和所述第三统计数据确定为该时间段内的上网行为统计数据。
其中,根据确定的每个时间段内的活动状态,确定所述第一指定活动的吸引力指数信息,具体包括:
根据确定的每个时间段内的活动状态,确定每种活动状态对应的时间段数量;
根据确定的每种活动状态对应的时间段数量,确定所述第一指定活动的吸引力指数信息。
其中,根据确定的每种活动状态对应的时间段数量,确定所述第一指定活动的吸引力指数信息,具体包括:
根据确定的每种活动状态对应的时间段数量以及预先针对每种活动状态而设置的权重值,确定所述第一指定活动的吸引力指数信息。
一种吸引力指数信息的确定装置,包括:
上网行为数据获取模块,用于获取第一预设时间内第一用户的上网行为数据;其中,所述第一用户在所述第一预设时间内参加第一指定活动;
划分模块,用于将所述第一预设时间划分为多个时间段,并确定每个时间段对应的上网行为数据;
统计模块,用于对所述划分模块确定的每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据;
活动状态确定模块,用于根据所述统计模块得到的每个时间段对应的上网行为统计数据,以及预先得到的用于区分每个时间段内的活动状态的分类器,分别确定每个时间段内的活动状态;
吸引力指数信息确定模块,用于根据所述活动状态确定模块确定的每个时间段内的活动状态,确定所述第一指定活动的吸引力指数信息。
其中,所述活动状态确定模块中的用于区分每个时间段内的活动状态的分类器按照如下方式得到:
预先获取第二预设时间内第二用户的上网行为数据样本;其中,所述第二用户在所述第二预设时间内参加第二指定活动;
针对每个第二预设时间内获取的上网行为数据样本执行:将该第二预设时间划分成多个时间段,并确定每个时间段对应的上网行为数据样本;对每个时间段对应的上网行为数据样本进行统计,得到每个时间段对应的上网行为统计数据样本;对每个时间段对应的上网行为统计数据样本进行聚类,得到每个时间段内的活动状态;将每个时间段内的活动状态与对应的上网行为统计数据样本进行关联,得到该时间段的数据集;
对得到的每个时间段的数据集进行训练,得到用于区分每个时间段内的活动状态的分类器。
其中,所述上网行为数据获取模块,具体包括:
位置信息和业务流数据获得单元,用于获得第一预设时间内接入预先部署的接入点AP的用户终端的位置信息和业务流数据;其中,所述位置信息携带所述用户终端的IP地址和接入AP的AP标识,所述业务流数据携带所述用户终端的IP地址;
对应关系建立单元,用于根据所述位置信息和业务流数据获得单元获得的位置信息和业务流数据,建立所述业务流数据中的IP地址和所述位置信息中的AP标识之间的对应关系;
筛选单元,用于根据所述对应关系建立单元建立的对应关系和预先设置的指定AP标识,从获取的位置信息和业务流数据中,筛选出携带所述指定AP标识的位置信息和携带所述指定AP标识对应的IP地址的业务流数据;
上网行为数据确定单元,用于将所述筛选单元筛选出的位置信息和业务流数据确定为所述第一预设时间内第一用户的上网行为数据。
其中,所述上网行为数据包括:用户终端的IP地址、用户访问的业务名称以及用户访问所述业务而产生的上下行流量三者之间的第一对应关系,以及用户终端的IP地址和媒体访问控制MAC地址二者之间的第二对应关系;则
所述统计模块,具体用于:
针对每个时间段对应的上网行为数据执行下述操作:
根据所述第一对应关系中包含的用户终端的IP地址的数量,确定表征用户密度的第一统计数据;
根据所述第二对应关系中包含的用户终端的IP地址对应的MAC地址的数量,确定表征用户流动性的第二统计数据;
根据所述第一对应关系中包含的用户访问的业务名称以及用户访问所述业务而产生的上下行流量,确定表征各类业务的上下行流量的第三统计数据;
将所述第一统计数据、所述第二统计数据和所述第三统计数据确定为该时间段内的上网行为统计数据。
其中,所述吸引力指数信息确定模块,具体包括:
时间段数量确定单元,用于根据确定的每个时间段内的活动状态,确定每种活动状态对应的时间段数量;
吸引力指数信息确定单元,用于根据所述时间段数量确定单元确定的每种活动状态对应的时间段数量,确定所述第一指定活动的吸引力指数信息。
其中,所述吸引力指数信息确定单元,具体用于:
根据确定的每种活动状态对应的时间段数量以及预先针对每种活动状态而设置的权重值,确定所述第一指定活动的吸引力指数信息。
本发明实施例的有益效果如下:
本发明实施例中,获取第一预设时间内第一用户的上网行为数据,第一用户在该第一预设时间内参加第一指定活动,并通过对第一预设时间内每个时间段对应的上网行为数据进行分析,并结合预先得到的用于区分每个时间段内的活动状态的分类器,对第一用户在每个时间段内的上网行为进行判断,进而确定出第一预设时间内每个时间段内的活动状态,并最终确定出第一指定活动的吸引力指数信息。与现有技术相比,本方案无需记录活动现场的音频和视频,便能够实现对吸引力指数信息的自动化评估,且评估结果更加准确。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例提供的一种吸引力指数信息的确定方法的实现流程图;
图2为现有技术中瘦AP模式下的WLAN部署示意图;
图3为现有技术中胖AP模式下的WLAN部署示意图;
图4为本发明实施例提供的吸引力指数信息的确定方法的实现装置示意图;
图5为本发明实施例提供的一种吸引力指数信息的确定装置的实现示意图。
具体实施方式
为了解决现有技术中存在的确定活动的吸引力指数信息时准确性较差的问题,本发明实施例提供了一种吸引力指数信息的确定方案。该技术方案中,获取第一预设时间内第一用户的上网行为数据,其中,第一用户在该第一预设时间内参加第一指定活动,通过对第一预设时间内每个时间段对应的上网行为数据进行分析,并结合预先得到的用于区分每个时间段内的活动状态的分类器,对第一用户在每个时间段内的上网行为进行判断,进而确定出第一预设时间内每个时间段内的活动状态,并最终确定出第一指定活动的吸引力指数信息。与现有技术相比,本方案无需记录活动现场的音频和视频,便能够实现对吸引力指数信息的自动化评估,且评估结果更加准确。
以下结合说明书附图对本发明的实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限制本发明。并且在不冲突的情况下,本发明中的实施例及实施例的特征可以互相结合。
本发明实施例提供了一种吸引力指数信息的确定方法,如图1所示,为该方法的实现流程图,具体包括下述步骤:
步骤11,获取第一预设时间内第一用户的上网行为数据,其中,第一用户在该第一预设时间内参加第一指定活动。
其中,第一预设时间为该第一指定活动的持续发生时间。
第一用户的上网行为数据指第一用户通过终端设备(比如智能手机)进行上网行为时涉及的数据。
本发明实施例可以但不限于应用于演讲和会议等活动场景,在该类活动场景下,通常会在活动会场部署接入点(Access Point,AP)来实现无线局域网(Wireless LocalArea Network,WLAN)的部署。
在这种情况下,用户典型的上网方式可以是接入活动会场部署的AP,因此,在步骤11中,可以通过活动会场部署的AP来获取第一预设时间内第一用户的上网行为数据。
具体的,步骤11可以但不限于按照如下方式实现:
首先,获得第一预设时间内接入预先部署的AP的用户终端的位置信息和业务流数据;其中,用户终端的位置信息携带有用户终端的IP地址和接入AP的AP标识,用户终端的业务流数据携带有用户终端的IP地址;
然后,根据获得的位置信息和业务流数据,建立业务流数据中的IP地址和位置信息中的AP标识之间的对应关系;
再根据上述对应关系和预先设置的指定AP标识,从获取的位置信息和业务流数据中,筛选出携带该指定AP标识的位置信息和携带该指定AP标识对应的IP地址的业务流数据;
最后,将筛选出的位置信息和业务流数据确定为第一预设时间内第一用户的上网行为数据。
如图2和图3所示,图2为现有技术中瘦AP模式下的WLAN部署示意图,图3为现有技术中胖AP模式下的WLAN部署示意图。
步骤11可以利用深度包检测(Deep Packet Inspection,DPI)设备获得第一预设时间内接入预先部署的接入点AP的用户终端的业务流数据,以及利用WLAN网管系统获得第一预设时间内接入预先部署的接入点AP的用户终端的位置信息。
其中,利用DPI设备获取第一预设时间内接入预先部署的AP的用户终端的业务流数据时,DPI设备可以以话单的形式将业务流数据输出,并存入磁盘。其中,每条话单的格式可以参见下表1。
表1:
输出字段
业务类型码
开始时间
结束时间
上行流量(bytes)
下行流量(bytes)
用户终端的IP地址
网址URL
其中,用户终端为演讲、会议现场的观众所持有的用户终端,一般在一段时间内,每个用户终端对应一个IP地址。
利用WLAN网管系统获得第一预设时间内接入预先部署的AP的用户终端的位置信息时,用户终端的位置信息可以但不限于包括:用户终端的MAC地址、IP地址以及接入AP的AP标识,而AP标识可以为AP的IP地址,并结合预先部署AP时为AP设置的编号。用户终端的位置信息可以按照下述表2进行记录。
表2:
步骤12,将第一预设时间划分为多个时间段,并确定每个时间段对应的上网行为数据。
其中,可以预先设置时间长度,并以该时间长度为一个时间段对第一预设时间进行划分,也可以预先设置时间段的数量,并以该时间段的数量对第一预设时间进行划分。
步骤13,对每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据。
其中,上网行为数据可以包括:
用户终端的IP地址、用户访问的业务名称以及用户访问业务而产生的上下行流量三者之间的第一对应关系,以及用户终端的IP地址和MAC地址二者之间的第二对应关系。
参考图2和图3,上述第一对应关系可以根据DPI设备输出的话单确定,上述第二对应关系可以根据WLAN网管系统记录的用户终端的位置信息确定。
因此,步骤13可以具体包括:
针对每个时间段对应的上网行为数据执行下述操作:
根据上述第一对应关系中包含的用户终端的IP地址的数量,确定表征用户密度的第一统计数据;
根据上述第二对应关系中包含的各用户终端的IP地址对应的MAC地址的数量,确定表征用户流动性的第二统计数据;
根据上述第一对应关系中包含的用户访问的业务名称以及用户访问业务而产生的上下行流量,确定表征各类业务的上下行流量的第三统计数据;
将第一统计数据、第二统计数据和第三统计数据确定为该时间段内的上网行为统计数据。
如表3所示,为本发明实施例中的上网行为统计数据列表。
表3:
步骤14,根据得到的每个时间段对应的上网行为统计数据,以及预先得到的用于区分每个时间段对应的活动状态的分类器,分别确定每个时间段内的活动状态。
以演讲和会议等活动为例,本发明实施例中可以根据现场观众对活动主题的反应,将活动现场分为三种不同的状态,即对活动主题感兴趣状态(即兴趣点)、聆听状态(聆听点)和对活动主题失去兴趣状态(失去兴趣点)。其中,兴趣点定义为:现场观众对演讲、会议讨论的活动主题很感兴趣并踊跃参与发言或者讨论:聆听点定义为:现场观众对演讲、会议讨论的活动主题感兴趣并接受活动主题信息,但并未活跃的参与讨论或者交流互动;失去兴趣点定义为:现场观众对演讲、会议讨论的活动主题不感兴趣或者失去兴趣,并开始走神做与活动主题无关的事情。
对于有经验的演讲者或者会议组织者,这三种状态可以凭借经验进行判断,并根据现场观众的状态调整活动主题的表述方式以吸引现场观众。但是上述判断属于主观感性的定性判断,而且由于判断者(通常指有经验的演讲者或者会议组织者)注意力不一定集中,无法对整个演讲、会议主题进行中的观众状态进行全程实时的判断。
根据观察发现当演讲、会议主题进行中,上述三种状态是随时可能发生转换的,而且每种状态都会持续一段时间。因此本发明实施例旨在通过数据挖掘领域的分类算法,代替人工判断上述三种状态,并最终得出主题吸引力指数。而分类算法,需要预先制作训练集,再对训练集进行训练得到用于区分每个时间段对应的活动状态的分类器。
步骤14中预先得到的用于区分每个时间段对应的活动状态的分类器可以按照如下方式得到:
首先,预先获取第二预设时间内第二用户的上网行为数据样本;其中,第二用户在第二预设时间内参加第二指定活动;
记预先选定的j个第二指定活动为M={M1,M2,…,Mj},j为大于0的整数,用于产生训练数据集。
然后,针对每个第二预设时间内获取的上网行为数据样本执行:将该第二预设时间划分成多个时间段,并确定每个时间段对应的上网行为数据样本;对每个时间段对应的上网行为数据样本进行统计,得到每个时间段对应的上网行为统计数据样本,并对每个时间段对应的上网行为统计数据样本进行聚类,得到每个时间段内的活动状态,将每个时间段内的活动状态与对应的上网行为统计数据样本进行关联,得到该时间段的数据集。
具体的,在获取上网行为数据样本的同时,记录每个第二指定活动(如Mj)的开始时间和结束时间,得出该第二指定活动的持续时间为Lj;
以k分钟为时间片对M中的第二指定活动Mj进行划分,则该第二指定活动可以被划分为个时间片,其中运算为上取整函数。所以整个第二指定活动的时间序列为{T}={t1,t2,…,tn};
对活动状态-时间序列进行聚类,比如K-Means聚类方法。
将活动状态与上网行为统计数据样本进行关联:以时间段为索引,将ti时间内的活动状态添加到ti时间对应的上网行为统计数据样本数据表中,其格式如表4所示。
表4:
对M中的每个第二指定活动重复上述步骤,最终得到对于主题集M的数据集,其数据表述形式如表4,然后保存于磁盘作为训练集,记为A。
最后,对得到的每个时间段的数据集,即A进行训练,得到用于区分每个时间段内的活动状态的分类器。
得到分类器之后,通过分类器便可以根据每个时间段对应的上网行为统计数据,确定出每个时间段内的活动状态。
步骤15,根据确定的每个时间段内的活动状态,确定第一指定活动的吸引力指数信息。
具体的,可以根据确定的每个时间段内的活动状态,先确定出每种活动状态对应的时间段数量,再根据确定的每种活动状态对应的时间段数量,确定第一指定活动的吸引力指数信息。
进一步的,已知每种活动状态对应的时间段数量时,可以根据预先针对每种活动状态设置的权重值,确定出第一预设活动的吸引力指示信息。
比如活动状态为m∈{兴趣点,聆听点,失去兴趣点},而每种活动状态对应的时间段的数量分别为c1、c2和c3。则该第一预设活动的吸引力指示信息可以表示为:
F=k1×c1+k2×c2+k3×c3;
其中,F为吸引力指示信息,k1、k2和k3分别为活动状态兴趣点、聆听点和失去兴趣点的权重值。
如图4所示,为本发明实施例提供的吸引力指数信息的确定方法的实现装置示意图。其中,DPI设备和WLAN网管系统用于获取第一预设时间内第一用户的上网行为数据,获取的数据存储在数据存储服务器中,并由数据分析服务器对获取的数据进行分析,分析的结果,即确定出的吸引力指数信息通过数据展示服务器进行展示,比如通过电视、显示屏和投影仪等显示设备实时反馈第一指定活动的吸引力指数信息。
本发明实施例中,获取第一预设时间内第一用户的上网行为数据,其中,第一用户在该第一预设时间内参加第一指定活动,通过对第一预设时间内每个时间段对应的上网行为数据进行分析,并结合预先得到的用于区分每个时间段内的活动状态的分类器,对第一用户在每个时间段内的上网行为进行判断,进而确定出第一预设时间内每个时间段内的活动状态,并最终确定出第一指定活动的吸引力指数信息。与现有技术相比,本方案无需记录活动现场的音频和视频,便能够实现对吸引力指数信息的自动化评估,且评估结果更加准确。
基于同一发明构思,本发明实施例中还分别提供了一种吸引力指数信息的确定装置,由于上述装置解决问题的原理与吸引力指数的确定方法相似,因此上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图5所示,为本发明实施例提供的吸引力指数信息的确定装置的结构示意图,包括:
上网行为数据获取模块51,用于获取第一预设时间内第一用户的上网行为数据;其中,所述第一用户在所述第一预设时间内参加第一指定活动;
划分模块52,用于将所述第一预设时间划分为多个时间段,并确定每个时间段对应的上网行为数据;
统计模块53,用于对所述划分模块52确定的每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据;
活动状态确定模块54,用于根据所述统计模块53得到的每个时间段对应的上网行为统计数据,以及预先得到的用于区分每个时间段内的活动状态的分类器,分别确定每个时间段内的活动状态;
吸引力指数信息确定模块55,用于根据所述活动状态确定模块54确定的每个时间段内的活动状态,确定所述第一指定活动的吸引力指数信息。
其中,所述活动状态确定模块54中用于区分每个时间段内的活动状态的分类器按照如下方式得到:
预先获取第二预设时间内第二用户的上网行为数据样本;其中,所述第二用户在所述第二预设时间内参加第二指定活动;
针对每个第二预设时间内获取的上网行为数据样本执行:将该第二预设时间划分成多个时间段,并确定每个时间段对应的上网行为数据样本;对每个时间段对应的上网行为数据样本进行统计,得到每个时间段对应的上网行为统计数据样本;对每个时间段对应的上网行为统计数据样本进行聚类,得到每个时间段内的活动状态;将每个时间段内的活动状态与对应的上网行为统计数据样本进行关联,得到该时间段的数据集;
对得到的每个时间段的数据集进行训练,得到用于区分每个时间段内的活动状态的分类器。
其中,所述上网行为数据获取模块51,具体包括:
位置信息和业务流数据获得单元511,用于获得活动时间内接入预先部署的接入点AP的用户终端的位置信息和业务流数据;其中,所述位置信息携带所述用户终端的IP地址和接入AP的AP标识,所述业务流数据携带所述用户终端的IP地址;
对应关系建立单元512,用于根据所述位置信息和业务流数据获得单元511获得的位置信息和业务流数据,建立所述业务流数据中的IP地址和所述位置信息中的AP标识之间的对应关系;
筛选单元513,用于根据所述对应关系建立单元512建立的对应关系和预先设置的指定AP标识,从获取的位置信息和业务流数据中,筛选出携带所述指定AP标识的位置信息和携带所述指定AP标识对应的IP地址的业务流数据;
上网行为数据确定单元514,用于将所述筛选单元513筛选出的位置信息和业务流数据确定为所述第一预设时间内第一用户的上网行为数据。
其中,所述上网行为数据包括:用户终端的IP地址、用户访问的业务名称以及用户访问所述业务而产生的上下行流量三者之间的第一对应关系,以及用户终端的IP地址和媒体访问控制MAC地址二者之间的第二对应关系;则
所述统计模块53,具体用于:
针对每个时间段对应的上网行为数据执行下述操作:
根据所述第一对应关系中包含的用户终端的IP地址的数量,确定表征用户密度的第一统计数据;
根据所述第二对应关系中包含的用户终端的IP地址对应的MAC地址的数量,确定表征用户流动性的第二统计数据;
根据所述第一对应关系中包含的用户访问的业务名称以及用户访问所述业务而产生的上下行流量,确定表征各类业务的上下行流量的第三统计数据;
将所述第一统计数据、所述第二统计数据和所述第三统计数据确定为该时间段内的上网行为统计数据。
其中,所述吸引力指数信息确定模块55,具体包括:
时间段数量确定单元551,用于根据确定的每个时间段内的活动状态,确定每种活动状态对应的时间段数量;
吸引力指数信息确定单元552,用于根据所述时间段数量确定单元551确定的每种活动状态对应的时间段数量,确定所述第一指定活动的吸引力指数信息。
其中,所述吸引力指数信息确定单元552,具体用于:
根据确定的每种活动状态对应的时间段数量以及预先针对每种活动状态而设置的权重值,确定所述第一指定活动的吸引力指数信息。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种吸引力指数信息的确定方法,其特征在于,包括:
获取第一预设时间内第一用户的上网行为数据;其中,所述第一用户在所述第一预设时间内参加第一指定活动;
将所述第一预设时间划分为多个时间段,并确定每个时间段对应的上网行为数据;
对每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据;
根据得到的每个时间段对应的上网行为统计数据,以及预先得到的用于区分每个时间段内的活动状态的分类器,分别确定每个时间段内的活动状态;
根据确定的每个时间段内的活动状态,确定所述第一指定活动的吸引力指数信息。
2.如权利要求1所述的方法,其特征在于,所述用于区分每个时间段内的活动状态的分类器按照如下方式得到:
预先获取第二预设时间内第二用户的上网行为数据样本;其中,所述第二用户在所述第二预设时间内参加第二指定活动;
针对每个第二预设时间内获取的上网行为数据样本执行:将该第二预设时间划分成多个时间段,并确定每个时间段对应的上网行为数据样本;对每个时间段对应的上网行为数据样本进行统计,得到每个时间段对应的上网行为统计数据样本;对每个时间段对应的上网行为统计数据样本进行聚类,得到每个时间段内的活动状态;将每个时间段内的活动状态与对应的上网行为统计数据样本进行关联,得到该时间段的数据集;
对得到的每个时间段的数据集进行训练,得到用于区分每个时间段内的活动状态的分类器。
3.如权利要求1所述的方法,其特征在于,获取第一预设时间内第一用户的上网行为数据,具体包括:
获得第一预设时间内接入预先部署的接入点AP的用户终端的位置信息和业务流数据;其中,所述位置信息携带所述用户终端的IP地址和接入AP的AP标识,所述业务流数据携带所述用户终端的IP地址;
根据获得的位置信息和业务流数据,建立所述业务流数据中的IP地址和所述位置信息中的AP标识之间的对应关系;
根据所述对应关系和预先设置的指定AP标识,从获取的位置信息和业务流数据中,筛选出携带所述指定AP标识的位置信息和携带所述指定AP标识对应的IP地址的业务流数据;
将筛选出的位置信息和业务流数据确定为所述第一预设时间内第一用户的上网行为数据。
4.如权利要求1所述的方法,其特征在于,所述上网行为数据包括:用户终端的IP地址、用户访问的业务名称以及用户访问所述业务而产生的上下行流量三者之间的第一对应关系,以及用户终端的IP地址和媒体访问控制MAC地址二者之间的第二对应关系;则
对每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据,具体包括:
针对每个时间段对应的上网行为数据执行下述操作:
根据所述第一对应关系中包含的用户终端的IP地址的数量,确定表征用户密度的第一统计数据;
根据所述第二对应关系中包含的用户终端的IP地址对应的MAC地址的数量,确定表征用户流动性的第二统计数据;
根据所述第一对应关系中包含的用户访问的业务名称以及用户访问所述业务而产生的上下行流量,确定表征各类业务的上下行流量的第三统计数据;
将所述第一统计数据、所述第二统计数据和所述第三统计数据确定为该时间段内的上网行为统计数据。
5.如权利要求1所述的方法,其特征在于,根据确定的每个时间段内的活动状态,确定所述第一指定活动的吸引力指数信息,具体包括:
根据确定的每个时间段内的活动状态,确定每种活动状态对应的时间段数量;
根据确定的每种活动状态对应的时间段数量,确定所述第一指定活动的吸引力指数信息。
6.如权利要求5所述的方法,其特征在于,根据确定的每种活动状态对应的时间段数量,确定所述第一指定活动的吸引力指数信息,具体包括:
根据确定的每种活动状态对应的时间段数量以及预先针对每种活动状态而设置的权重值,确定所述第一指定活动的吸引力指数信息。
7.一种吸引力指数信息的确定装置,其特征在于,包括:
上网行为数据获取模块,用于获取第一预设时间内第一用户的上网行为数据;其中,所述第一用户在所述第一预设时间内参加第一指定活动;
划分模块,用于将所述第一预设时间划分为多个时间段,并确定每个时间段对应的上网行为数据;
统计模块,用于对所述划分模块确定的每个时间段对应的上网行为数据进行统计,得到每个时间段对应的上网行为统计数据;
活动状态确定模块,用于根据所述统计模块得到的每个时间段对应的上网行为统计数据,以及预先得到的用于区分每个时间段内的活动状态的分类器,分别确定每个时间段内的活动状态;
吸引力指数信息确定模块,用于根据所述活动状态确定模块确定的每个时间段内的活动状态,确定所述第一指定活动的吸引力指数信息。
8.如权利要求7所述的装置,其特征在于,所述活动状态确定模块中的用于区分每个时间段内的活动状态的分类器按照如下方式得到:
预先获取第二预设时间内第二用户的上网行为数据样本;其中,所述第二用户在所述第二预设时间内参加第二指定活动;
针对每个第二预设时间内获取的上网行为数据样本执行:将该第二预设时间划分成多个时间段,并确定每个时间段对应的上网行为数据样本;对每个时间段对应的上网行为数据样本进行统计,得到每个时间段对应的上网行为统计数据样本;对每个时间段对应的上网行为统计数据样本进行聚类,得到每个时间段内的活动状态;将每个时间段内的活动状态与对应的上网行为统计数据样本进行关联,得到该时间段的数据集;
对得到的每个时间段的数据集进行训练,得到用于区分每个时间段内的活动状态的分类器。
9.如权利要求7所述的装置,其特征在于,所述上网行为数据获取模块,具体包括:
位置信息和业务流数据获得单元,用于获得第一预设时间内接入预先部署的接入点AP的用户终端的位置信息和业务流数据;其中,所述位置信息携带所述用户终端的IP地址和接入AP的AP标识,所述业务流数据携带所述用户终端的IP地址;
对应关系建立单元,用于根据所述位置信息和业务流数据获得单元获得的位置信息和业务流数据,建立所述业务流数据中的IP地址和所述位置信息中的AP标识之间的对应关系;
筛选单元,用于根据所述对应关系建立单元建立的对应关系和预先设置的指定AP标识,从获取的位置信息和业务流数据中,筛选出携带所述指定AP标识的位置信息和携带所述指定AP标识对应的IP地址的业务流数据;
上网行为数据确定单元,用于将所述筛选单元筛选出的位置信息和业务流数据确定为所述第一预设时间内第一用户的上网行为数据。
10.如权利要求7所述的装置,其特征在于,所述上网行为数据包括:用户终端的IP地址、用户访问的业务名称以及用户访问所述业务而产生的上下行流量三者之间的第一对应关系,以及用户终端的IP地址和媒体访问控制MAC地址二者之间的第二对应关系;则
所述统计模块,具体用于:
针对每个时间段对应的上网行为数据执行下述操作:
根据所述第一对应关系中包含的用户终端的IP地址的数量,确定表征用户密度的第一统计数据;
根据所述第二对应关系中包含的用户终端的IP地址对应的MAC地址的数量,确定表征用户流动性的第二统计数据;
根据所述第一对应关系中包含的用户访问的业务名称以及用户访问所述业务而产生的上下行流量,确定表征各类业务的上下行流量的第三统计数据;
将所述第一统计数据、所述第二统计数据和所述第三统计数据确定为该时间段内的上网行为统计数据。
11.如权利要求7所述的装置,其特征在于,所述吸引力指数信息确定模块,具体包括:
时间段数量确定单元,用于根据确定的每个时间段内的活动状态,确定每种活动状态对应的时间段数量;
吸引力指数信息确定单元,用于根据所述时间段数量确定单元确定的每种活动状态对应的时间段数量,确定所述第一指定活动的吸引力指数信息。
12.如权利要求11所述的装置,其特征在于,所述吸引力指数信息确定单元,具体用于:
根据确定的每种活动状态对应的时间段数量以及预先针对每种活动状态而设置的权重值,确定所述第一指定活动的吸引力指数信息。
CN201510223543.4A 2015-05-05 2015-05-05 一种吸引力指数信息的确定方法和装置 Active CN106202094B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510223543.4A CN106202094B (zh) 2015-05-05 2015-05-05 一种吸引力指数信息的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510223543.4A CN106202094B (zh) 2015-05-05 2015-05-05 一种吸引力指数信息的确定方法和装置

Publications (2)

Publication Number Publication Date
CN106202094A CN106202094A (zh) 2016-12-07
CN106202094B true CN106202094B (zh) 2019-06-25

Family

ID=57457986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510223543.4A Active CN106202094B (zh) 2015-05-05 2015-05-05 一种吸引力指数信息的确定方法和装置

Country Status (1)

Country Link
CN (1) CN106202094B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170765B (zh) * 2017-12-25 2021-11-12 合肥城市云数据中心股份有限公司 基于在校行为数据多维分析的贫困生资助推荐方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101355504A (zh) * 2008-08-14 2009-01-28 成都市华为赛门铁克科技有限公司 一种用户行为的确定方法和装置
CN101572629A (zh) * 2009-05-31 2009-11-04 腾讯科技(深圳)有限公司 一种ip数据的处理方法及装置
CN103365851A (zh) * 2012-03-27 2013-10-23 深圳市惠尔顿信息技术有限公司 一种基于虚拟组织分享用户上网行为的方法及系统
JP2014010478A (ja) * 2012-06-27 2014-01-20 Ntt Docomo Inc 情報処理装置及び情報処理方法
CN104102648A (zh) * 2013-04-07 2014-10-15 腾讯科技(深圳)有限公司 基于用户行为数据的兴趣推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101355504A (zh) * 2008-08-14 2009-01-28 成都市华为赛门铁克科技有限公司 一种用户行为的确定方法和装置
CN101572629A (zh) * 2009-05-31 2009-11-04 腾讯科技(深圳)有限公司 一种ip数据的处理方法及装置
CN103365851A (zh) * 2012-03-27 2013-10-23 深圳市惠尔顿信息技术有限公司 一种基于虚拟组织分享用户上网行为的方法及系统
JP2014010478A (ja) * 2012-06-27 2014-01-20 Ntt Docomo Inc 情報処理装置及び情報処理方法
CN104102648A (zh) * 2013-04-07 2014-10-15 腾讯科技(深圳)有限公司 基于用户行为数据的兴趣推荐方法及装置

Also Published As

Publication number Publication date
CN106202094A (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
CN103718166B (zh) 信息处理设备、信息处理方法
Ghadiyaram et al. Study of the effects of stalling events on the quality of experience of mobile streaming videos
CN107240319B (zh) 一种用于k12阶段的互动情景教学系统
DE202014011337U1 (de) Anpassung von Audio-Wiedergabevorrichtungen
CN107911646A (zh) 一种会议分享、生成会议记录的方法及装置
CN104486649B (zh) 视频内容评级方法及装置
CN106341706B (zh) 一种向用户推荐虚拟礼物的方法和装置
CN106454748B (zh) 一种幼儿园儿童视频及数据采集与分析系统
CN107179995A (zh) 一种计算机网络应用程序的性能测试方法
Muhammad et al. Audio-video virtual reality environments in building acoustics: An exemplary study reproducing performance results and subjective ratings of a laboratory listening experiment
CN107888579B (zh) 一种非干扰式的移动视频用户体验质量指标建模方法
Francombe et al. Elicitation of attributes for the evaluation of audio-on-audio interference
Jensen et al. Media Audiences| Introduction~ Audiences Across Media: A Comparative Agenda for Future Research on Media Audiences
CN107702273A (zh) 空调控制方法和装置
DE112017005879T5 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und programm
WO2018014872A1 (zh) 一种以mac码为主键的数据整合方法
EP2930926A1 (de) Verfahren, Softwareprodukt und Vorrichtung zur Steuerung einer Konferenz
CN104537011B (zh) 歌唱排名方法及装置
CN111353439A (zh) 一种教学行为的分析方法、装置、系统及设备
CN114024737B (zh) 确定直播间刷量的方法、装置及计算机可读存储介质
CN106202094B (zh) 一种吸引力指数信息的确定方法和装置
Davies et al. Reproducibility of soundscape dimensions
CN109862375A (zh) 云录播系统
CN105307031B (zh) 一种多用户信息的推送方法及装置
CN104933058B (zh) 一种监测网络访问活动的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant