CN108549685A - 行为分析方法、装置、系统及可读存储介质 - Google Patents
行为分析方法、装置、系统及可读存储介质 Download PDFInfo
- Publication number
- CN108549685A CN108549685A CN201810308170.4A CN201810308170A CN108549685A CN 108549685 A CN108549685 A CN 108549685A CN 201810308170 A CN201810308170 A CN 201810308170A CN 108549685 A CN108549685 A CN 108549685A
- Authority
- CN
- China
- Prior art keywords
- behavior
- data
- network
- employee
- network behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 claims abstract description 50
- 230000006399 behavior Effects 0.000 claims description 303
- 230000003542 behavioural effect Effects 0.000 claims description 48
- 210000002569 neuron Anatomy 0.000 claims description 43
- 238000012549 training Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012790 confirmation Methods 0.000 claims description 5
- 238000013502 data validation Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 abstract description 45
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000010428 oil painting Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 95
- 230000006870 function Effects 0.000 description 20
- 238000013528 artificial neural network Methods 0.000 description 14
- 230000006854 communication Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013529 biological neural network Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000003323 beak Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 210000000078 claw Anatomy 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种行为分析方法、装置、系统及可读存储装置,涉及数据处理技术领域。本发明提出了一种将员工上网行为数据抽象为类似于油画的多维空间数据结构,从而可以使用卷积神经网络对其进行智能分析。本发明使用人工智能技术中最先进的卷积神经网络方法对员工完成工作和社交的上网行为数据进行分析,可以客观、高效、准确、实时地对全体员工的职业素养进行定量描述。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种行为分析方法、装置、系统及可读存储介质。
背景技术
随着计算机技术和网络技术的不断发展,员工使用计算机和网络完成工作和进行社交活动的比重越来越高。但是绝大多数企业和单位仍然在使用传统的方式,如问卷调查,面对面交流,部门领导汇报或人力资源部门检测等,对员工的职业素养进行评定。传统的方法不仅费时费力,需要花费大量资源,并且带有强烈的主观因素,只有具有丰富经验的人力资源部门才能对员工的职业素养得出比较合理的结论。
发明内容
有鉴于此,本发明提供了一种行为分析方法、装置、系统及可读存储介质。
本发明提供的技术方案如下:
一种行为分析方法,应用于行为分析系统,所述行为分析系统与多个员工设备通信连接,所述行为分析系统预先配置员工设备与员工信息的对应关系,该行为分析方法包括:
获得多个所述员工设备的网络行为数据;
确定与所述网络行为数据对应的每个员工设备的员工信息;
根据所述网络行为数据和员工信息,确定与每个所述员工信息对应的网络行为;
建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签。
本发明还提供了一种行为分析装置,应用于行为分析系统,所述行为分析系统与多个员工设备通信连接,所述行为分析系统预先配置员工设备与员工信息的对应关系,该行为分析装置包括:
数据获取模块,用于获得多个所述员工设备的网络行为数据;
数据确认模块,用于确定与所述网络行为数据对应的每个员工设备的员工信息;
行为确认模块,用于根据所述网络行为数据和员工信息,确定与每个所述员工信息对应的网络行为;
素养确定模块,用于建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签。
本发明还提供了一种行为分析系统,所述行为分析系统包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述行为分析系统执行上述行为分析方法。
本发明还提供了一种可读存储装置,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在用户终端执行上述行为分析方法。
本申请实施例中,通过采用建立行为感知模型对员工设备的网络行为数据的分析,可以客观、高效、准确、实时地对全体员工的职业素养进行定量描述,避免素养分析过程中的主观因素的干扰,提高员工素养分析的客观性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种行为分析方法的流程示意图。
图2为本发明实施例提供的一种行为分析方法中步骤S103的子步骤的流程示意图。
图3为本发明实施例提供的一种行为分析方法中步骤S104的子步骤的流程示意图。
图4为本发明实施例提供的一种行为分析方法中对员工上网时间进行划分的示意图。
图5为本发明实施例提供的一种行为分析方法中卷积过滤器的示意图。
图6为本发明实施例提供的一种行为分析方法中激励函数的示意图。
图7为本发明实施例提供的一种行为分析方法中进行均值池化的示意图。
图8为本发明实施例提供的一种行为分析方法中步骤S104的另一子步骤的流程示意图。
图9为本发明实施例提供的一种行为分析方法的另一流程示意图。
图10为本发明实施例提供的一种行为分析装置的功能模块示意图。
图标:100-行为分析装置;101-数据获取模块;102-数据确认模块;103-行为确认模块;104-素养确定模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本发明使用人工智能技术中最先进的卷积神经网络方法对员工完成工作、社交、以及其他所有的上网行为数据进行智能分析,从而可以客观、高效、准确、实时地对全体员工的职业素养进行定量描述。
本申请实施例提供了一种行为分析方法,应用于行为分析系统,所述行为分析系统与多个员工设备通信连接,所述行为分析系统预先配置员工设备与员工信息的对应关系,如图1所示,该行为分析方法包括以下步骤。
步骤S101,获得多个所述员工设备的网络行为数据。
在本申请实施例中,员工设备可以包括移动终端、个人电脑等电子设备,员工在使用这些电子设备时,会出现利用这些设备访问外部网络的行为,员工设备在访问外部网络时产生的数据即为网络行为数据。在本申请实施例中,在工作场合,员工使用电子设备访问网络的行为首先需要操作电子设备,其次,这些员工设备需要预先建立与一个或多个交换机、路由器等设备的通信连接,行为分析系统可以通过从交换机、路由器获取员工设备访问外部网络的数据。如果用户使用移动终端的运营商网络直接访问外部网络,则该行为分析系统无法获取到用户的访问数据。
详细的,获得的网络行为数据可以根据预先规则进行分类,例如,可以包括访问专业类网站、新闻类网站、游戏类网站、娱乐类网站、生活类网站、求职类网站等网站的访问数据,此外,还可以包括使用微信、QQ等其他即时通信应用的访问数据。网络行为数据中不仅可以包括访问的网站或使用的应用的具体类型,还可以包括访问不同网站的次数、访问时长、是否上传数据、是否下载数据等信息。或者还可以包括使用即时通信应用发送信息的次数、使用的时长、发送数据的次数、接收数据的次数、视频次数、视频时长、语音次数、语音时长等信息。网络行为数据的分类规则可以根据实际需要确定,本申请实施例并不限制网络行为数据的具体形式。
在对网络行为数据进行采集时,可以通过采集卡获取用户上网数据,经过去冗处理后,写入Kafka消息队列;再从Kafka消息队列获取用户行为数据;然后对用户数据进行实时处理,并把结果发送到前端进行可视化展示,包括报警信息;还可以对用户行为数据进行分解归类,并把数据按照类型写入行为数据存储系统。
步骤S102,确定与所述网络行为数据对应的每个员工设备的员工信息。
由于获得的网络行为数据可能是不同员工设备产生的,为了对每个员工进行行为分析,就需要确定网络行为数据与员工设备的对应关系。详细的,可以预先为员工设备与员工的对应关系进行配置,建立并存储员工与一个或多个员工设备的对应关系,并确定每个员工设备的标识信息,在获得的网络行为数据中,根据员工设备的标识信息将网络行为数据进行划分,再根据员工设备与员工的对应关系确定每个员工对应的网络行为数据。在本申请实施例中,员工信息可以包括员工的姓名、所属部门等基本信息。例如,员工信息为A的员工分别使用设备a和设备b在不同时间段访问了外部网络,行为分析系统获得的网络行为数据就包括设备a和设备b的网络数据,行为分析系统中可以预先保存有设备a和设备b的设备标识,例如设备的物理IP地址、MAC地址等信息,根据网络行为数据中的设备标识即可将设备a和设备b的数据分类。然后根据设备a和设备b与员工A的对应关系,即可确定员工A的网络行为数据,以便根据该员工A的网络行为数据对其进行的网络行为进行分析。
步骤S103,根据所述网络行为数据和员工信息,确定与每个所述员工信息对应的网络行为。
在确定了员工信息对应的网络行为数据后,即可根据网络行为数据中的信息确定员工的网络行为。例如,网络行为数据包括访问新闻网站的数据,那么就可以确定员工进行了访问新闻网站的网络行为。
系统会对每个员工每天的上网行为数据进行实时采集和分类,然后把分类的结果存入到“行为数据存储系统”中。“行为数据存储系统”中既要保留对上网行为分类后的原始的流水数据,也会保存后期经过“行为数据统计分析”模块对每个员工上网行为按各种时间粒度,比如小时、天、周等统计后的数据。
详细的,如图2所示,在确定员工信息对应的网络行为的过程中,可以采用以下子步骤进行。
子步骤S131,将所述网络行为数据与所述预设网络服务的数据内容进行比对。
子步骤S132,当所述网络行为数据包括访问所述预设网络服务的数据内容时,确定所述员工的网络行为与所述预设网络服务对应的网络行为。
在本申请实施例中,预设网络服务可以包括预设的网站、预设应用的服务器等等。行为分析系统可以预先与不同的网站或不同应用的服务器建立通信连接,例如可以使用网络爬虫工具和人工辅助的手段建立与各个网站的通信连接,获取访问各个网站过程中的交互数据。可以采用文本数据挖掘算法分析各个网站的内容后,对各个网站标记对应的标签。例如,行为分析系统预先建立与某一新闻网站的连接,在通信过程中,可以了解该新闻网站的网站内容和交互数据,通过预先建立的规则,如通过文字语义分析等规则,确定该新闻网站为新闻类网站。用户访问该网站产生的数据即可被归类为访问新闻类网站产生的网络行为数据。
此外,行为分析系统可以预先建立与即时通信软件服务器的通信连接,确定与即时通信软件服务器通信过程中不同行为的数据特征,例如发送语音信息的数据特征、发送视频数据的数据特征,根据这些预先获得的数据特征,在网络行为数据中包含与这些数据特征相同的数据时,即可将这些网络行为数据确定为使用即时通信软件的网络行为数据。
由于网络通信数据的繁杂,如果不能准确的确定不同通信数据的具体类别,在后续的素养标签的确定过程中就会出现错误。因此,在进行网络行为数据的确定过程中,可以预先确定不同网络行为的数据特征或不同网站的数据内容,将获得的网络行为数据与确定的数据特征或数据内容进行比对,以获得准确的网络行为数据,确定准确的网络行为。
步骤S104,建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签。
在确定了网络行为数据与员工的对应关系后,即可根据行为感知模型,确定员工的素养标签。在本申请实施例中,采用卷积神经网络建立行为感知模型,下面先简要介绍卷积神经网络。
CNN(Convolutional Neural Network,卷积神经网络)是一种特殊的深层的神经网络模型,它的特殊性体现在两个方面,一方面它的神经元的连接是非全连接的,另一方面同一层中某些神经元之间的连接的权重是共享的(即相同的)。它的非全连接和权值共享的网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,对于很难学习的深层结构来说,这是非常重要的,减少了权值的数量。
稀疏连接:在BP(Back Propagation,反向传播)神经网络中,每一层的神经元节点是一个线性一维排列结构,层与层各神经元节点之间是全连接的。卷积神经网络中,层与层之间的神经元节点不再是全连接形式,利用层间局部空间相关性将相邻每一层的神经元节点只与和它相近的上层神经元节点连接,即局部连接。这样大大降低了神经网络架构的参数规模。
权重共享:在卷积神经网络中,卷积层的每一个卷积过滤器重复的作用于整个输入图像数据空间中,对输入图像进行卷积,卷积结果构成了输入图像的特征图,提取出图像的局部特征。每一个卷积过滤器共享相同的参数,包括相同的权重矩阵和偏置项。共享权重的好处是在对图像进行特征提取时不用考虑局部特征的位置。而且权重共享提供了一种有效的方式,使要学习的卷积神经网络模型参数数量大大降低。
池化采样:它是一种非线性降采样方法。在通过卷积获取图像特征之后是利用这些特征进行分类。可以用所有提取到的特征数据进行分类器的训练,但这通常会产生极大的计算量。所以在获取图像的卷积特征后,要通过池化采样(最大池化、平均池化)方法对卷积特征进行降维。将卷积特征划分为数个n*n的不相交区域,用这些区域的最大(或平均)特征来表示降维后的卷积特征。这些降维后的特征更容易进行分类。
详细的,所述行为感知模型包括输入层、卷积层、池化层、全连层以及输出层。卷积神经网络是一种多层的监督学习神经网络,卷积神经网络(CNN)可以由输入层、卷积层、激活函数、池化层、全连接层、输出层组成,即INPUT(输入层)-CONV(卷积层)-RELU(激活函数)-POOL(池化层)-FC(全连接层)-OUTPUT(输出层)。
卷积层和池化层是实现卷积神经网络特征提取功能的核心模块。CNN网络模型通过采用梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,通过频繁的迭代训练提高网络的精度。
卷积层:使用卷积层的原因是卷积运算的一个重要特点是,通过卷积运算,可以使原信号特征增强,并且降低噪音。
池化层:根据图像局部相关性的原理,对图像进行子采样可以减少计算量,同时保持图像旋转不变性。
全连接层的输入是由卷积层和池化层进行特征提取得到的特征图像。最后一层输出层是一个分类器,可以采用逻辑回归,Softmax回归对输入图像进行分类。
卷积神经网络利用输入是图片的特点,把输入数据设计成三个维度:高(height)、宽(width)、深(depth)。比如输入的图片大小是32×32×3(RGB),那么CNN的输入层就也具有32×32×3的维度。
当计算机看到一张图片时,它所看到的是一系列的像素值。根据图片的分辨率与大小,计算机将看到的是一个32×32×3的数字阵列(3指代的是RGB—颜色值)。这些数字中的每一个值都可以从0取到255,它描述了在这一点上的像素强度。这些数字虽然对于人们进行图像分类时没有任何意义,但其却是计算机在图像输入时唯一获取的数据。通过给电脑指定相关数据排列,它将图像是一个特定的类别的可能性进行输出(如80—猫,15—狗,05—鸟等)。
为了解决全连接神经网络带来的需要学习的参数过多,从而需要耗费太多时间进行学习的问题,CNN卷积层对隐含单元和输入单元间的连接加以限制:每个隐含单元仅仅只能连接输入单元的一部分。例如,每个隐含单元仅仅连接输入图像的一小片相邻区域。每个隐含单元连接的输入区域大小叫神经元的感受域(receptive field)。
卷积层的神经元也是三维的,也具有深度。卷积层包含一系列过滤器(filter),每个过滤器代表一个深度,有几个过滤器输出单元就具有多少深度。
样例输入单元大小是32×32×3,输出单元的深度是5,也就是有5个过滤器,对于输出单元不同深度的同一位置,与输入图片连接的区域是相同的,但是过滤器不同。
另外,过滤器的深度必须与输入的深度相同,样例输入单元大小是32×32×3,所以每个过滤器的尺寸必须是m×n×3,比如5×5×3。现在,首先拿第一个位置的过滤器为例。由于过滤器在输入图像上是卷积的,它是相乘的值在滤波器的原始图像的像素值,这些乘法全部相加(从数学上讲,这将是75次乘法总和)。所以现在得到一个数字,这个数字只是当过滤器在图像的左上角时才有代表性,然后在每一个位置上重复这个过程。下一步将过滤器移动到右边的1个单位,然后再向右移动1个单位等等,每一个输入层上独特的位置都会产生一个数字。将过滤器滑动完所有位置的,就会形成一个28×28×1的系列数字,称之为特征图。只得到一个28×28阵列的原因是因为移动到第28个以后,就到达了32的边界。所以,使用一个5×5的过滤器可以适配一个32×32的输入图像,被映射到一个28×28阵列。
输入图像是32*32*3,3是它的通道个数(即R、G、B),卷积层是一个5*5*3的过滤器。通过一个过滤器与输入图像的卷积可以得到一个28*28*1的特征图通过使用更多的过滤器,可以更好地维持空间尺寸。在数学层面上来说,这些是在一个卷积层中进行的任务。
池化层主要的作用是下采样,通过去掉特征图中不重要的样本,进一步减少参数数量。池化的方法很多,最常用的是最大池化(Max Pooling),实际上就是在n*n的样本中取最大值,作为采样后的样本值。
最常见的池化层是规模为2*2,步幅为2,对输入的每个深度切片进行下采样。每个MAX操作对四个数进行,除了Max Pooing之外,常用的还有Mean Pooling——取各样本的平均值。对于深度为D的特征图,各层独立做池化,因此池化后的深度仍然为D。
如果池化层的输入单元大小不是二的整数倍,一般采取边缘补零(zero-padding)的方式补成2的倍数,然后再池化。
如图3所示,建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签的步骤可以包括以下子步骤。
子步骤S141,根据预设时间段内的网络行为数据,获得所述行为感知模型的输入数据。
在本申请实施例中,可以采用卷积神经网络进行行为感知模型的建立。在获取输入数据时,可以建立二维空间坐标轴,按照预设规则将所述网络行为数据与所述二维空间坐标轴相对应,其中,所述二维空间坐标轴的横坐标为日期,纵坐标为时刻。依据所述预设网站和预设软件的类别,确定所述输入数据的输入通道。按照预设分值计算规则,分别计算访问所述预设网站的行为数据和使用所述预设软件的行为数据对应的分值,确定所述网络行为数据对应的输入数值。
详细的,如图4所示,可以以天和小时两个时间单位把员工的上网时间划分为二维空间,从而可以把用户上网时间由二维坐标来确定,因为每个月的天数不同,为了统一输入数据,本申请实施例可以只使用每个月的前28天作为输入。
用户上网行为数据可以按月进行统计,比如,坐标(15,10)表示15日10点钟,坐标(11,16)表示11日16点。这种抽象类似于使用卷积神经网络从油画中设别人脸应用时,把油画分割为28*28的小格一样。
再进一步,在识别人脸应用中把油画的每个单元格用色光三原色(红绿蓝)的像素强度来表示,称为3个通道。本申请实施例中可以把用户在每天每个小时的上网行为用员工访问和不同类别网站和应用的数据来表示,例如,网站可以被分类为9类,与色光三原色相对应,所以本申请实施例的卷积神经网络输入就有9个通道。
对于每类网站和应用,本申请实施例中可以采集每小时内用户访问的次数、总时长、上传数据次数、下载数据次数等参数。对于聊天类工具,本申请实施例中可以采集发送信息次数、使用总时长、发送数据次数、接收数据次数、视频次数、视频总时长、语音次数、语音总时长等参数。本申请实施例首先把每类网站和应用的使用数据按公式转换为一个数字,作为对应时间格的相应通道的输入数据。例如,每个时间格共有9个通道输入值,对应于9大类网站和应用。
每类网站和应用的上网行为分数计算可以参考下面的公式进行计算:
score=vn+vt+10*un+10*dn
其中,vn为访问某类网站的次数;vt为访问某类网站的总时长,按分为单位;un为上传数据的次数;dn为下载数据的次数。
微信、QQ和其他聊天工具的上网行为分数计算可以参考下面的公式进行计算:
score=sn+ut+10*un+10*dn+20*an+2*at+30*vn+3*vt
其中,sn为发送信息次数;ut为使用总时长,按分为单位;un为发送文档的次数;dn为接收文档的次数;an为语音聊天次数;at为语音聊天总时长,单位为分;vn为视频聊天次数;vt为视频聊天总时长,单位为分。
例如,通过分析某个员工的网络行为数据,确定该员工在某个时间格,比如3号早上10点的行为数据,其中:
1.专业类网站和应用:43。
2.新闻类网站和应用:22。
3.游戏类网站和应用:10。
4.娱乐类网站和应用:54。
5.生活类网站和应用:32。
6.找工作类网站和应用:0。
7.微信:40。
8.qq:80。
9.其他聊天类:0。
本申请实施例的员工职业素养卷积神经网络的输入可以为28*24*9,其中28为每个月的天数,为横坐标,每个月29号到31号的数据不采用。24为每天的24个小时,为纵坐标;9对应9类网站和应用的分类,为通道数量。
子步骤S142,确定过滤器的大小和步长,对所述输入数据进行卷积处理,得到多个第一素养特征图。
卷积阶段首先要确定过滤器的大小和步长,从而可以对输入进行卷积操作。本申请实施例中可以设定过滤器的大小为3x3x9矩阵,分别表示过滤器的长、宽和深度。其中,长对应输入的横坐标,也就是天;宽对应输入的纵坐标,也就是小时;深度对应输入的通道,也就是网络和应用的分类。如图5所示。
通过使用卷积过滤器对输入层进行卷积操作以后就会得到一个特征图,这个特征图就是由该卷积过滤器中3x3x9个权重和1个偏值来确定的。
每个特征图只能识别一个局部特性,为了能够对问题进行全面的理解,就需要多个特征图,从而可以通过多个特征图所识别的多个局部特性达到对全局的理解。
为了能够全面分析员工的职业素养,本申请实施例使用20个特征图进行分析,也就是说,通过发现20个不同的局部特性来全面分析员工的职业素养。
每个特征图都是通过一个对应的卷积过滤器中的3x3x9个权重和1个偏值来定义的,所以员工职业素养分析卷积神经网络的卷积层共有3x3x9x20=1620个权重和20个偏值。
卷积层使用激活函数是ReLU(Rectified Liner Unit,修正线性单元),f(x)=max(0,x),其特点是收敛快,求梯度简单,从而运算量小,很大程度的解决了神经网络算法在优化深层神经网络时的梯度耗散问题。ReLU的图像如图6所示。
子步骤S143,对多个所述第一素养特征图进行均值池化,得到对应的第二素养特征图,所述第二素养特征图包括多个特征神经元。
本申请实施例在池化层采用规模为2x2,步长为2的均值池化(Mean Pooling)方法,也就是取4个点的平均值,如图7所示。对26x22的卷积层的特征图进行规模为2x2,步长为2的均值池化后生成一个13x11的特征图。本申请实施例的员工职业素养分析卷积神经网络在卷积层共有20个特征图,通过对这20个特征图分别进行池化操作后,池化层将得到20个13x11的特征图。
所以,经过卷积和池化之后,员工职业素养分析卷积神经网络得到了20个13x11的特征图,总共拥有2860个特征神经元。池化层不引入新的权重和偏值,所以员工职业素养分析卷积神经网络卷积和池化层共有3x3x9x20=1620个权重和20个偏值。
池化层的作用在于压缩数据和权重参数的量,从而减少过度拟合,所以,池化层不引入新的权重和偏值参数,也不使用激活函数。
子步骤S144,建立全连层神经元与所述特征神经元的连接。
员工职业素养卷积神经网络模型在卷积层和池化层从多个特征方面对问题进行理解,为了对问题进行更全面和更抽象级别的理解,本申请实施例在卷积层和池化层后面添加了一个100个神经元的全连接层。
全连层共有100个神经元,这100个神经元需要与池化层的每一个神经元进行连接,也就是说在全连层的每一个神经元都会从池化层的2860个神经元的每一个神经元中接收信息,所以,全连层将引进2860x100=286000个权重和一个偏值。
前面卷积层和池化层具有3x3x9x20=1620个权重和20个偏值,所以,加入全连层以后,神经网络共含有287620个权重和21个偏值。
子步骤S145,建立输出层神经元与所述全连层神经元的连接,输出与所述网络行为数据对应的素养标签。
员工职业素养卷积神经网络的最后一层是输出层。本申请实施例对员工职业素养分析的结果分为优、良、中、差、劣五个等级,所以输出层有5个神经元。从全连层到输出层也是采用全连接,也就是输出层的每一个神经元会接收全连层的每一个神经元的信息,通过softmax激活函数计算后输出结果,得到不同等级的概率值,输出概率值最大的就是该输入的等级。
输出层共有5个神经元,这5个神经元需要与全连层的100个神经元进行连接。所以,输出层将引进5x100个权重和1个偏值。
整个模型包含(3x3x9x20)+(2860x100)+(100x5)=1620+28600+500=288120个权重参数和20+1+1=22个偏值参数。
此外,行为感知模型是基于卷积神经网络的,训练是神经网络的一个重要部分。通过训练卷积神经网络获取过滤器的过滤值、权重参数值和偏值参数的值。本申请实施例采用一个称为反向转播的训练过程对员工职业素养分析卷积神经网络模型进行训练。如图8所示。建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签的步骤还包括以下子步骤。
子步骤S146,根据所述员工信息和所述预设服务对应的行为类别,确定所述网络行为数据中与所述预设网络服务对应的行为数据。
在进行行为感知模型的训练时,可以根据预先建立的行为分类规则,确定员工信息对应的行为类别,行为类别包括但不限于访问新闻网站、访问娱乐类网站、访问求职类网站、使用即时通信软件、使用邮件软件等等。
子步骤S147,建立与所述员工信息对应的素养标签。
在进行训练时,为了得到网络行为数据与素养标签的对应关系,可以预先根据进行不同网络行为以及员工的其他行为,为每个员工打标签。素养标签包括忠诚度、工作态度、遵纪守规程度等多个维度,不同维度中可以包括多个等级,例如可以包括优、良、中、差、劣五个等级。不同员工信息对应的素养标签可以包括一个或多个,例如预先对员工A进行素养标签的标记,可以将该员工A的忠诚度标记为优、工作态度标记为良等等。
子步骤S148,根据所述素养标签和行为数据建立训练数据集。
通过上述素养标签的标定,具有标签的员工对应的网络行为数据形成了训练数据集。
子步骤S149,将所述训练数据集作为所述行为感知模型的输入数据,对所述行为感知模型进行训练。
在获得了训练数据集后,即可将训练数据集输入至行为感知模型中,进行数据训练。
子步骤S1410,根据所述行为感知模型的输出结果,确定所述过滤器的过滤值、权重参数值以及偏值参数的值。
本申请实施例的行为感知模型是基于卷积神经网络的,训练是神经网络的一个重要部分。通过训练卷积神经网络获取过滤器的过滤值、权重参数值和偏值参数的值。本申请实施例采用一个称为反向转播的训练过程对员工职业素养分析卷积神经网络模型进行训练。
在介绍反向传播之前,必须先谈谈神经网络运行所需要的是什么。在人们出生的那一刻,人门的思想是全新的,不知道什么是猫,什么是鸟。类似地,在卷积神经网络开始之前,权重或过滤器的值是随机的,过滤器并不知道去寻找边缘和曲线,在更高阶的层过滤器不知道去寻找爪子和喙。然而当人们稍微大了一点之后,父母和老师给他们展示不同的图片和图像,并给了他们一个相应的标签。给图像以标签这个想法既是卷积神经网络的训练过程。
所以在对卷积神经网络模型进行训练之前,需要有一个训练集,其中有成千上万的员工的职业素养的上网行为数据,每一个员工有一个标签对应该员工的职业素养的级别是什么。
反向传播主要分为4个不同的部分:前向传播、损失计算、反向传播、权重更新。
在前向传播的过程中,需要一个数字阵列为28×24×9的训练数据,并将其传递通过整个网络。在第一个训练例子中,所有的权重或过滤器的值被随机初始化,输出的权重值可能是类似[.1.1.1.1.1.1.1.1.1.1]的结果,基本上是一个不能优先考虑任何职业素养级别的输出。目前权重的网络是无法寻找那些低阶的功能,因此也无法对职业素养级别的可能性作出任何合理的结论。
前向传播后就到了损失计算部分。因为使用的是训练数据,此数据有一个用户的上网行为数据和一个标签。比方说,第一个输入的训练数据是一个职业素养级别为良的员工A的上网行为数据,则该训练数据的标签将是[0 1 0 0 0]。
损失计算可以按许多不同的方式定义,但对于使用激活函数为softmax,则通常使用log-likelihood作为损失函数。
1)softmax多分类器定义
在神经网络的前馈(feedforward)过程中,输出层(L层)的输入为:
在softmax的机制中,为获得输出层的输出,采用softmax function:
2)loss的计算公式
softmax的损失函数为:
其中L是损失。Sj是softmax的输出向量S的第j个值,表示的是这个样本属于第j个类别的概率。yj前面有个求和符号,j的范围也是1到类别数T,因此y是一个1*T的向量,里面的T个值,而且只有真实标签对应的位置的那个值是1,其他都是0。所以这个公式其实有一个更简单的形式:
L=-logsj
当然此时要限定j是指向当前样本的真实标签。
比如,一个员工样本A的标签y=[0,0,0,1,0],也就是说样本A的真实标签是4,假设模型预测的结果概率(softmax的输出)p=[0.2,0.3,0.4,0.6,0.5],可以看出这个预测是对的,那么对应的损失L=-log(0.6),也就是当这个样本经过这样的网络参数产生这样的预测p时,它的损失是-log(0.6)。
如果假设p=[0.2,0.3,0.4,0.1,0.5],这个预测结果就很离谱了,因为真实标签是4,而这个样本是4的概率只有0.1,对应损失L=-log(0.1)。如果假设p=[0.2,0.3,0.4,0.3,0.5],这个预测结果虽然也不正确,但是没有前面那个预测结果偏差那么大,对应的损失L=-log(0.3)。因为log函数在输入小于1的时候是个负数,而且log函数是递增函数,所以-log(0.6)<-log(0.3)<-log(0.1)。简单讲就是预测错比预测对的损失要大,预测错得离谱比预测错得轻微的损失要大。
为了能够尽量降低损失量,就需要找出哪些输入,也就是权重参数,最直接导致神经网络模型的损失。这是一个dL/DW的数学等价,其中L是损失变量,W是在一个特定层的权重。现在需要做的就是通过神经网络执行一个反向传播过程,检测哪个权重导致损失最大并且寻找方法来调整它们使损失降低。一旦将这个计算过程进行完,就可以到最后一步--权重更新。把所有的过滤器的权重进行更新,使它们在梯度方向上进行改变。
其中,w为weight,wi为Initial Weight,η为Learning Rate。
学习速率是在训练过程中选择的一个参数。一个高的学习率意味着更多步骤是在权重更新部分,因此它可能需要更少的时间为最佳的权重在模型上进行收敛。然而学习率太高,可能会导致跨越太大而不够精准达到最佳点。
前向传播、损失计算、反向传播、参数更新的过程也称为一个批次。程序会对于每一个固定数量的批次、每个训练例子重复这一过程。在最后一个训练例子中完成了参数更新后,网络应该都训练的足够好了,各层的权重也应该调参正确了。
最后通过测试训练后的卷积神经网络是否工作,将不同的员工上网行为数据和标签集通过卷积神经网络,将输出结果与真实值进行对比,即可测试出其是否正常运行。
在另一种具体实施方式中,该方法还包括以下步骤。
步骤S105,根据所述员工信息,对所述网络行为数据按照预设维度和预设粒度进行归类统计。
在进行素养标签的确定过程中,还可以根据分类确定的网络行为数据进行进一步的归类统计,并可以将统计结果实时通过显示设备显示。
在另一种具体实施方式中,如图9所示,所述行为分析系统预先配置有违规网络行为数据库,该方法还包括以下步骤。
步骤S106,将所述网络行为数据与所述违规网络行为数据库进行比对。
行为分析系统中可以预先建立包含有违规网络行为的数据库,违规网络行为可以包括访问违规网站、违规发送文件、违规接收文件等等,违规网络行为的具体通信数据形式可以根据实际需要确定。例如,可以预先将某些网站设置为违规网站,如果网络行为数据中包含了访问这些违规网站的数据,那么这样的网络行为数据就会被认定为违规网络行为。
步骤S107,当所述网络行为数据中包含所述违规网络行为数据库中的违规行为时,生成报警信号。
当网络行为数据中的通信数据被认定为了违规行为,则可以通过报警信号进行报警提醒,可以通过显示设备将违规行为对应的员工设备的信息进行显示,还可以将违规行为产生的时间点、员工设备的信息、使用员工设备的员工信息等数据进行记录,以便进行追溯。
本申请实施例公开了一种基于员工上网行为数据使用卷积神经网络对员工职业素养进行分析的方法和机制。卷积神经网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对卷积网络加以训练,网络就具有输入输出对之间的映射能力。由于卷积神经网络的卷积层通过训练数据进行学习,所以在使用卷积神经网络时,避免了显式的特征抽取,而隐式地从训练数据中进行学习。
卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。
卷积神经网络目前主要用于图像处理和语音设别等领域,本申请实施例提出了一种将员工上网行为数据抽象为类似于油画的多维空间数据结构,从而可以使用卷积神经网络对其进行智能分析。本申请实施例通过使用当前最先进的卷积神经网络方法对员工的上网行为进行分析可以高效准确的对员工的职业素养进行定量描述。
使用传统的方式,如问卷调查,面对面交流,部门领导汇报和人力资源部门检测等,对员工的职业素养进行评定不仅费时费力,需要花费大量资源,并且带有强烈的主观因素,只有具有丰富经验的人力资源部门才能对员工的职业素养得出比较合理的结论。本申请实施例使用人工智能技术中最先进的卷积神经网络方法对员工完成工作和社交的上网行为数据进行分析可以客观、高效、准确、实时地对全体员工的职业素养进行定量描述。
综上所述,本申请实施例中,通过采用建立行为感知模型对员工设备的网络行为数据的分析,可以客观、高效、准确、实时地对全体员工的职业素养进行定量描述,避免素养分析过程中的主观因素的干扰,提高员工素养分析的客观性。
如图10所示,本申请实施例还提供了一种行为分析装置,应用于行为分析系统,所述行为分析系统与多个员工设备通信连接,所述行为分析系统预先配置员工设备与员工信息的对应关系,该行为分析装置包括:
数据获取模块101,用于获得多个所述员工设备的网络行为数据;
数据确认模块102,用于确定与所述网络行为数据对应的每个员工设备的员工信息;
行为确认模块103,用于根据所述网络行为数据和员工信息,确定与每个所述员工信息对应的网络行为;
素养确定模块104,用于建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签。
所述数据获取模块101在确定与每个所述员工信息对应的网络行为之前,还用于:预先建立与预设网络服务的网络连接,获取所述预设网络服务的数据内容;根据所述预设网络服务的数据内容,确定与所述预设网络服务对应的网络行为。
所述行为确认模块根据所述网络行为数据,确定所述网络行为数据对应的网络行为的方法包括:将所述网络行为数据与所述预设网络服务的数据内容进行比对;当所述网络行为数据包括访问所述预设网络服务的数据内容时;确定所述员工的网络行为与所述预设网络服务对应的网络行为。
所述行为感知模型包括输入层、卷积层、池化层、全连层以及输出层,所述素养确定模块建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签的方法包括:根据预设时间段内的网络行为数据,获得所述行为感知模型的输入数据;确定过滤器的大小和步长,对所述输入数据进行卷积处理,得到多个第一素养特征图;对多个所述第一素养特征图进行均值池化,得到对应的第二素养特征图,所述第二素养特征图包括多个特征神经元;建立全连层神经元与所述特征神经元的连接;建立输出层神经元与所述全连层神经元的连接,输出与所述网络行为数据对应的素养标签。
所述素养确定模块建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签的方法还包括:根据所述员工信息和所述预设服务对应的行为类别,确定所述网络行为数据中与所述预设网络服务对应的行为数据;建立与所述员工信息对应的素养标签;根据所述素养标签和行为数据建立训练数据集;将所述训练数据集作为所述行为感知模型的输入数据,对所述行为感知模型进行训练;根据所述行为感知模型的输出结果,确定所述过滤器的过滤值、权重参数值以及偏值参数的值。
所述预设网络服务包括预设网站和预设软件,所述网络行为数据包括访问所述预设网站的行为数据和/使用所述预设软件的行为数据,所述素养确定模块获得所述行为感知模型的输入数据的方法包括:建立二维空间坐标轴,按照预设规则将所述网络行为数据与所述二维空间坐标轴相对应,其中,所述二维空间坐标轴的横坐标为日期,纵坐标为时刻;依据所述预设网站和预设软件的类别,确定所述输入数据的输入通道;按照预设分值计算规则,分别计算访问所述预设网站的行为数据和使用所述预设软件的行为数据对应的分值,确定所述网络行为数据对应的输入数值。
该装置还包括:统计模块,用于根据所述员工信息,对所述网络行为数据按照预设维度和预设粒度进行归类统计。
所述行为分析系统预先配置有违规网络行为数据库,该装置还包括:报警模块,用于将所述网络行为数据与所述违规网络行为数据库进行比对;当所述网络行为数据中包含所述违规网络行为数据库中的违规行为时,生成报警信号。
本申请实施例还提供了一种行为分析系统,所述行为分析系统包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述电子设备执行上述行为分析方法。
本申请实施例还提供了一种可读存储装置,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在用户终端执行上述行为分析方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (18)
1.一种行为分析方法,其特征在于,应用于行为分析系统,所述行为分析系统与多个员工设备通信连接,所述行为分析系统预先配置员工设备与员工信息的对应关系,该行为分析方法包括:
获得多个所述员工设备的网络行为数据;
确定与所述网络行为数据对应的每个员工设备的员工信息;
根据所述网络行为数据和员工信息,确定与每个所述员工信息对应的网络行为;
建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签。
2.根据权利要求1所述的行为分析方法,其特征在于,在确定与每个所述员工信息对应的网络行为的步骤之前,该方法还包括:
预先建立与预设网络服务的网络连接,获取所述预设网络服务的数据内容;
根据所述预设网络服务的数据内容,确定与所述预设网络服务对应的网络行为。
3.根据权利要求2所述的行为分析方法,其特征在于,根据所述网络行为数据,确定所述网络行为数据对应的网络行为的步骤包括:
将所述网络行为数据与所述预设网络服务的数据内容进行比对;
当所述网络行为数据包括访问所述预设网络服务的数据内容时;
确定所述员工的网络行为与所述预设网络服务对应的网络行为。
4.根据权利要求1所述的行为分析方法,其特征在于,所述行为感知模型包括输入层、卷积层、池化层、全连层以及输出层,建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签的步骤包括:
根据预设时间段内的网络行为数据,获得所述行为感知模型的输入数据;
确定过滤器的大小和步长,对所述输入数据进行卷积处理,得到多个第一素养特征图;
对多个所述第一素养特征图进行均值池化,得到对应的第二素养特征图,所述第二素养特征图包括多个特征神经元;
建立全连层神经元与所述特征神经元的连接;
建立输出层神经元与所述全连层神经元的连接,输出与所述网络行为数据对应的素养标签。
5.根据权利要求4所述的行为分析方法,其特征在于,建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签的步骤还包括:
根据所述员工信息和所述预设服务对应的行为类别,确定所述网络行为数据中与所述预设网络服务对应的行为数据;
建立与所述员工信息对应的素养标签;
根据所述素养标签和行为数据建立训练数据集;
将所述训练数据集作为所述行为感知模型的输入数据,对所述行为感知模型进行训练;
根据所述行为感知模型的输出结果,确定所述过滤器的过滤值、权重参数值以及偏值参数的值。
6.根据权利要求4所述的行为分析方法,其特征在于,所述预设网络服务包括预设网站和预设软件,所述网络行为数据包括访问所述预设网站的行为数据和/使用所述预设软件的行为数据,获得所述行为感知模型的输入数据的步骤包括:
建立二维空间坐标轴,按照预设规则将所述网络行为数据与所述二维空间坐标轴相对应,其中,所述二维空间坐标轴的横坐标为日期,纵坐标为时刻;
依据所述预设网站和预设软件的类别,确定所述输入数据的输入通道;
按照预设分值计算规则,分别计算访问所述预设网站的行为数据和使用所述预设软件的行为数据对应的分值,确定所述网络行为数据对应的输入数值。
7.根据权利要求1所述的行为分析方法,其特征在于,该方法还包括:
根据所述员工信息,对所述网络行为数据按照预设维度和预设粒度进行归类统计。
8.根据权利要求1所述的行为分析方法,其特征在于,所述行为分析系统预先配置有违规网络行为数据库,该方法还包括:
将所述网络行为数据与所述违规网络行为数据库进行比对;
当所述网络行为数据中包含所述违规网络行为数据库中的违规行为时,生成报警信号。
9.一种行为分析装置,其特征在于,应用于行为分析系统,所述行为分析系统与多个员工设备通信连接,所述行为分析系统预先配置员工设备与员工信息的对应关系,该行为分析装置包括:
数据获取模块,用于获得多个所述员工设备的网络行为数据;
数据确认模块,用于确定与所述网络行为数据对应的每个员工设备的员工信息;
行为确认模块,用于根据所述网络行为数据和员工信息,确定与每个所述员工信息对应的网络行为;
素养确定模块,用于建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签。
10.根据权利要求9所述的行为分析装置,其特征在于,所述数据获取模块在确定与每个所述员工信息对应的网络行为之前,还用于:
预先建立与预设网络服务的网络连接,获取所述预设网络服务的数据内容;
根据所述预设网络服务的数据内容,确定与所述预设网络服务对应的网络行为。
11.根据权利要求10所述的行为分析装置,其特征在于,所述行为确认模块根据所述网络行为数据,确定所述网络行为数据对应的网络行为的方法包括:
将所述网络行为数据与所述预设网络服务的数据内容进行比对;
当所述网络行为数据包括访问所述预设网络服务的数据内容时;
确定所述员工的网络行为与所述预设网络服务对应的网络行为。
12.根据权利要求9所述的行为分析装置,其特征在于,所述行为感知模型包括输入层、卷积层、池化层、全连层以及输出层,所述素养确定模块建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签的方法包括:
根据预设时间段内的网络行为数据,获得所述行为感知模型的输入数据;
确定过滤器的大小和步长,对所述输入数据进行卷积处理,得到多个第一素养特征图;
对多个所述第一素养特征图进行均值池化,得到对应的第二素养特征图,所述第二素养特征图包括多个特征神经元;
建立全连层神经元与所述特征神经元的连接;
建立输出层神经元与所述全连层神经元的连接,输出与所述网络行为数据对应的素养标签。
13.根据权利要求12所述的行为分析装置,其特征在于,所述素养确定模块建立行为感知模型,根据所述网络行为数据,确定与每个员工对应的素养标签的方法还包括:
根据所述员工信息和所述预设服务对应的行为类别,确定所述网络行为数据中与所述预设网络服务对应的行为数据;
建立与所述员工信息对应的素养标签;
根据所述素养标签和行为数据建立训练数据集;
将所述训练数据集作为所述行为感知模型的输入数据,对所述行为感知模型进行训练;
根据所述行为感知模型的输出结果,确定所述过滤器的过滤值、权重参数值以及偏值参数的值。
14.根据权利要求12所述的行为分析装置,其特征在于,所述预设网络服务包括预设网站和预设软件,所述网络行为数据包括访问所述预设网站的行为数据和/使用所述预设软件的行为数据,所述素养确定模块获得所述行为感知模型的输入数据的方法包括:
建立二维空间坐标轴,按照预设规则将所述网络行为数据与所述二维空间坐标轴相对应,其中,所述二维空间坐标轴的横坐标为日期,纵坐标为时刻;
依据所述预设网站和预设软件的类别,确定所述输入数据的输入通道;
按照预设分值计算规则,分别计算访问所述预设网站的行为数据和使用所述预设软件的行为数据对应的分值,确定所述网络行为数据对应的输入数值。
15.根据权利要求9所述的行为分析装置,其特征在于,该装置还包括:
统计模块,用于根据所述员工信息,对所述网络行为数据按照预设维度和预设粒度进行归类统计。
16.根据权利要求9所述的行为分析装置,其特征在于,所述行为分析系统预先配置有违规网络行为数据库,该装置还包括:
报警模块,用于将所述网络行为数据与所述违规网络行为数据库进行比对;
当所述网络行为数据中包含所述违规网络行为数据库中的违规行为时,生成报警信号。
17.一种行为分析系统,所述行为分析系统包括处理器及存储有计算机指令的非易失性存储器,其特征在于,所述计算机指令被所述处理器执行时,所述行为分析系统执行权利要求1-8中任意一项所述的行为分析方法。
18.一种可读存储装置,所述可读存储介质包括计算机程序,其特征在于:
所述计算机程序运行时控制所述可读存储介质所在用户终端执行权利要求1-8中任意一项所述的行为分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810308170.4A CN108549685A (zh) | 2018-04-08 | 2018-04-08 | 行为分析方法、装置、系统及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810308170.4A CN108549685A (zh) | 2018-04-08 | 2018-04-08 | 行为分析方法、装置、系统及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108549685A true CN108549685A (zh) | 2018-09-18 |
Family
ID=63514174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810308170.4A Pending CN108549685A (zh) | 2018-04-08 | 2018-04-08 | 行为分析方法、装置、系统及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108549685A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544204A (zh) * | 2018-10-15 | 2019-03-29 | 浙江工业大学 | 一种基于轻量化多任务卷积神经网络的导购行为分析方法 |
CN110188796A (zh) * | 2019-04-25 | 2019-08-30 | 博彦科技股份有限公司 | 用户识别方法、装置、存储介质和处理器 |
CN110210750A (zh) * | 2019-05-29 | 2019-09-06 | 北京天正聚合科技有限公司 | 一种识别导购员业务的方法、装置、电子设备及存储介质 |
CN111127056A (zh) * | 2018-10-31 | 2020-05-08 | 北京国双科技有限公司 | 用户等级划分方法及装置 |
CN111399951A (zh) * | 2020-03-05 | 2020-07-10 | 北京云族佳科技有限公司 | 计算机工作数据采集、分析和显示方法、装置及电子设备 |
CN113298841A (zh) * | 2021-07-26 | 2021-08-24 | 四川大学华西医院 | 一种肤质油份分型方法、计算机设备、系统及存储介质 |
CN113793048A (zh) * | 2021-09-23 | 2021-12-14 | 北京明略昭辉科技有限公司 | 员工行为评估方法、系统、存储介质及电子设备 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103458051A (zh) * | 2013-09-16 | 2013-12-18 | 南京大学 | 体感网及基于体感网的居家行为感知方法 |
CN103761296A (zh) * | 2014-01-20 | 2014-04-30 | 北京集奥聚合科技有限公司 | 移动终端用户网络行为分析方法及系统 |
CN103873583A (zh) * | 2014-03-24 | 2014-06-18 | 北京聚思信息咨询有限公司 | 基于云平台针对互联网用户行为进行分析的方法和系统 |
US20150220959A1 (en) * | 2014-02-03 | 2015-08-06 | LiveDial, LLC | Adaptable and Intelligent User Incentive System |
CN105447566A (zh) * | 2014-05-30 | 2016-03-30 | 富士通株式会社 | 训练装置、训练方法以及检测装置 |
CN105447147A (zh) * | 2015-11-26 | 2016-03-30 | 晶赞广告(上海)有限公司 | 一种数据处理方法及装置 |
CN105868302A (zh) * | 2016-03-24 | 2016-08-17 | 北京小米移动软件有限公司 | 获取素养信息的方法和装置 |
CN106056407A (zh) * | 2016-06-03 | 2016-10-26 | 北京网智天元科技股份有限公司 | 基于用户行为分析的网银用户画像方法及设备 |
CN106202498A (zh) * | 2016-07-20 | 2016-12-07 | 淮阴工学院 | 一种基于分类语料库‑关键词词频‑记录关联的网络行为习惯量化方法 |
CN106446115A (zh) * | 2016-09-18 | 2017-02-22 | 成都九鼎瑞信科技股份有限公司 | 移动上网用户分类方法及装置 |
CN106534902A (zh) * | 2016-12-14 | 2017-03-22 | 北京数码视讯软件技术发展有限公司 | 一种行为分析方法及系统 |
CN107169796A (zh) * | 2017-05-12 | 2017-09-15 | 深圳市浩天投资有限公司 | 一种用户行为数据的分析方法、系统及计算机可读存储介质 |
CN107578272A (zh) * | 2017-08-10 | 2018-01-12 | 上海斐讯数据通信技术有限公司 | 一种为家庭成员画像的方法及装置 |
CN107766643A (zh) * | 2017-10-16 | 2018-03-06 | 华为技术有限公司 | 数据处理方法及相关装置 |
-
2018
- 2018-04-08 CN CN201810308170.4A patent/CN108549685A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103458051A (zh) * | 2013-09-16 | 2013-12-18 | 南京大学 | 体感网及基于体感网的居家行为感知方法 |
CN103761296A (zh) * | 2014-01-20 | 2014-04-30 | 北京集奥聚合科技有限公司 | 移动终端用户网络行为分析方法及系统 |
US20150220959A1 (en) * | 2014-02-03 | 2015-08-06 | LiveDial, LLC | Adaptable and Intelligent User Incentive System |
CN103873583A (zh) * | 2014-03-24 | 2014-06-18 | 北京聚思信息咨询有限公司 | 基于云平台针对互联网用户行为进行分析的方法和系统 |
CN105447566A (zh) * | 2014-05-30 | 2016-03-30 | 富士通株式会社 | 训练装置、训练方法以及检测装置 |
CN105447147A (zh) * | 2015-11-26 | 2016-03-30 | 晶赞广告(上海)有限公司 | 一种数据处理方法及装置 |
CN105868302A (zh) * | 2016-03-24 | 2016-08-17 | 北京小米移动软件有限公司 | 获取素养信息的方法和装置 |
CN106056407A (zh) * | 2016-06-03 | 2016-10-26 | 北京网智天元科技股份有限公司 | 基于用户行为分析的网银用户画像方法及设备 |
CN106202498A (zh) * | 2016-07-20 | 2016-12-07 | 淮阴工学院 | 一种基于分类语料库‑关键词词频‑记录关联的网络行为习惯量化方法 |
CN106446115A (zh) * | 2016-09-18 | 2017-02-22 | 成都九鼎瑞信科技股份有限公司 | 移动上网用户分类方法及装置 |
CN106534902A (zh) * | 2016-12-14 | 2017-03-22 | 北京数码视讯软件技术发展有限公司 | 一种行为分析方法及系统 |
CN107169796A (zh) * | 2017-05-12 | 2017-09-15 | 深圳市浩天投资有限公司 | 一种用户行为数据的分析方法、系统及计算机可读存储介质 |
CN107578272A (zh) * | 2017-08-10 | 2018-01-12 | 上海斐讯数据通信技术有限公司 | 一种为家庭成员画像的方法及装置 |
CN107766643A (zh) * | 2017-10-16 | 2018-03-06 | 华为技术有限公司 | 数据处理方法及相关装置 |
Non-Patent Citations (3)
Title |
---|
GANG WANG 等: "Unsupervised Clickstream Clustering for User Behavior Analysis", 《HUMAN FACTORS IN COMPUTING SYSTEMS》 * |
李恒超 等: "一种用于构建用户画像的二级融合算法框架", 《计算机科学》 * |
池志攀: "智慧家庭环境下的老人日常行为识别", 《生产力研究》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544204A (zh) * | 2018-10-15 | 2019-03-29 | 浙江工业大学 | 一种基于轻量化多任务卷积神经网络的导购行为分析方法 |
CN111127056A (zh) * | 2018-10-31 | 2020-05-08 | 北京国双科技有限公司 | 用户等级划分方法及装置 |
CN110188796A (zh) * | 2019-04-25 | 2019-08-30 | 博彦科技股份有限公司 | 用户识别方法、装置、存储介质和处理器 |
CN110210750A (zh) * | 2019-05-29 | 2019-09-06 | 北京天正聚合科技有限公司 | 一种识别导购员业务的方法、装置、电子设备及存储介质 |
CN111399951A (zh) * | 2020-03-05 | 2020-07-10 | 北京云族佳科技有限公司 | 计算机工作数据采集、分析和显示方法、装置及电子设备 |
CN113298841A (zh) * | 2021-07-26 | 2021-08-24 | 四川大学华西医院 | 一种肤质油份分型方法、计算机设备、系统及存储介质 |
CN113298841B (zh) * | 2021-07-26 | 2024-01-12 | 四川大学华西医院 | 一种肤质油份分型方法、计算机设备、系统及存储介质 |
CN113793048A (zh) * | 2021-09-23 | 2021-12-14 | 北京明略昭辉科技有限公司 | 员工行为评估方法、系统、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108549685A (zh) | 行为分析方法、装置、系统及可读存储介质 | |
Hobbs et al. | Fuzzy cognitive mapping as a tool to define management objectives for complex ecosystems | |
Kotu et al. | Predictive analytics and data mining: concepts and practice with rapidminer | |
Corchado et al. | Ibr retrieval method based on topology preserving mappings | |
Yu | Academic Performance Prediction Method of Online Education using Random Forest Algorithm and Artificial Intelligence Methods. | |
CN109766454A (zh) | 一种投资者分类方法、装置、设备及介质 | |
Kerr et al. | Collaborative deep learning models to handle class imbalance in flowcam plankton imagery | |
CN109033356A (zh) | 为客服系统日志打标签的方法及客服系统 | |
CN112257841A (zh) | 图神经网络中的数据处理方法、装置、设备及存储介质 | |
Mehta et al. | Employee attrition system using tree based ensemble method | |
Hu | Deep learning for ranking response surfaces with applications to optimal stopping problems | |
Wong et al. | Development of species recognition models using Google teachable machine on shorebirds and waterbirds | |
Tay et al. | Agent-based modeling of ambidextrous organizations: virtualizing competitive strategy | |
Vergara et al. | A Schematic Review of Knowledge Reasoning Approaches Based on the Knowledge Graph | |
Haroon et al. | Application of machine learning in forensic science | |
Mujthaba et al. | Data Science Techniques, Tools and Predictions | |
CN114202428A (zh) | 基于图卷积神经网络的资产数据处理方法、装置及设备 | |
Setiono et al. | Automatic knowledge extraction from survey data: Learning M-of-N constructs using a hybrid approach | |
Lurstwut et al. | Rice seed germination analysis | |
Teoh et al. | Artificial Intelligence in Business Management | |
Mahalle et al. | Data Acquisition and Preparation | |
Sabbella et al. | Artificial intelligence in 3D CAD modelling | |
Kumar | Automated Field Boundary Detection Using Modern Machine Learning Techniques | |
Heinonen et al. | Combining socio-economic and ecological modelling to inform natural resource management strategies | |
Nordbotten | Editing and imputation by means of neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210305 Address after: Room 1904, unit 2, building 10, area B, China Resources Oak Bay, 1398 West Avenue, hi tech West District, Chengdu, Sichuan 610000 Applicant after: Wu Zhixue Applicant after: Zhonghui Yunqi Technology Group Co.,Ltd. Address before: Maulamu, yingpingtun, Cambridge, England, CB24 9na, UK Applicant before: Wu Zhixue |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180918 |