CN109361529A - 一种终端类型识别方法、装置、电子设备及存储介质 - Google Patents
一种终端类型识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN109361529A CN109361529A CN201810875847.2A CN201810875847A CN109361529A CN 109361529 A CN109361529 A CN 109361529A CN 201810875847 A CN201810875847 A CN 201810875847A CN 109361529 A CN109361529 A CN 109361529A
- Authority
- CN
- China
- Prior art keywords
- terminal
- classifier
- sub
- information
- training set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种终端类型识别方法、装置、电子设备及存储介质。所述方法包括:获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;根据所述终端属性信息确定至少一组影响因子;根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。本发明实施例提供的终端类型识别方法,预先通过终端属性信息训练的贝叶斯分类器,根据接入网络中的未识别终端的终端属性信息和贝叶斯分类器确定终端的类型,通过贝叶斯分类器进行深度学习,提高了终端类型识别率。
Description
技术领域
本发明实施例涉及通信技术领域,具体涉及一种终端类型识别方法、装置、电子设备及存储介质。
背景技术
WLAN(Wireless Local Area Network)无线局域网中,站点(STA,Station)接入并通过接入设备(AP,Access Point)接入网络。随着技术的发展,通过WIFI(WirelessFidelity,高保真无线网络)接入网络的智能移动终端越来越多。识别加入网络的终端类型,对网络管理者的业务开展有意义。比如在高校,学生一般有台式机,笔记本和智能手机,都有上网需求。台式机通过传统的RJ45接口接入有线网络,智能手机通过WIFI接入无线网络。笔记本可以通过RJ45接口或者WIFI接入。随着高校扩招,学生人数不断增多,而学校的信息化建设水平,跟不上学生终端数量的增长,给学校出口带宽,网络运行都带来很大的压力。通过识别用户的终端类型,控制上网终端的数量,是一种解决方法。
现有终端识别的技术方案,主要有以下几种。
技术方案1:MAC信息识别
MAC(Media Access Control,媒体访问控制)地址信息用来定义设备在网络中的位置,每一个网卡都会有全球唯一固定的MAC地址。该地址由IEEE统一管理和分配,未经认证和授权的厂家无权生产网卡。MAC OUI(Organizationally Unique Identifier,组织唯一标识符)代表IEEE分配给各个厂商的公司ID,是MAC地址的前六位。通过MAC OUI,系统可以判断终端设备的生产厂商。但是,该方案存在以下不足:识别不准确,一般只能识别到厂商,无法识别出具体设备。终端厂商采购其他厂商的WIFI芯片进行组装,或多款终端采用统一MAC地址段时,会降低相关终端识别率。
技术方案2:DHCP信息识别
DHCP协议(Dynamic Host Configuration Protocol,动态主机分配协议)本身是各个网络终端设备都能够支持的必备协议之一,用来申请获得动态IP地址,DHCP本身包含操作系统信息。通过识别用户发起DHCP请求中的Option字段,来确定终端的类型,其中比较有效的方法是识别Option 55(Parameter Request List,参数请求表)和Option 60(Vendor class identifier,厂商类标识符),相同系统采用的DHCP请求基本相同。但是这种识别方法存在以下不足:识别不准确,一般只能识别到操作系统,无法识别出具体设备,并且需要建立终端DHCP特征的库,数据库需要定期更新,此外有些有终端不上报DHCPOption 60信息,会降低相关终端识别率。
技术方案3:HTTP报文识别
HTTP(Hypertext Transfer Protocol,超文本传输协议)是Web访问的基础协议,为了提供功能和使用效果,这个协议的定义和实现中加入了很多客户端/服务器端的信息。
为了让服务器更好地提供数据,客户端主动把浏览器版本、操作系统类型、操作系统版本等信息积极主动地告诉服务器端。该信息通常由HTTP头中User-Agent字段提供。对于移动智能终端,各制造商通常在User-Agent字段中提供设备的类型、型号、操作系统和制造商信息。用户进行Web认证时,通过浏览器发出的HTTP请求中的User-Agent字段识别用户终端类型。User-Agent字段一般会带上操作系统类型、版本,浏览器类型及版本信息,通过这些,就可以识别用户终端类型。但是,有的终端只上报浏览器类型和操作系统的类型,不上报终端类型,所以会导致识别不准确。
技术方案4:IMEI识别
IMEI(International Mobile Equipment Identity)是国际移动设备身份码的缩写,国际移动装备辨识码,是由15位数字组成的“电子串号”,它与每台手机终端一一对应,而且该码是全世界唯一的。IMEI由15位数字组成,其组成为:前6位数(TAC,TypeApprovalCode)是“型号核准号码”,代表终端机型;后续2位(FAC,Final Assembly Code)是“最后装配号”,代表产地;后续6位数是“串号”,代表生产顺序号;最后1位数SP为检验码。IMEI识别中,一般根据IMEI TAC号与终端类型进行一一匹配,当匹配成功时,确认所述终端为已识别类型终端,当未获取到IMEI码时,确认所述终端为未识别类型终端。然而,IMEI只能识别手机终端,受IMEI影响,只能识别非山寨手机,无法区分PC用户。
综上,现有技术方案中存在终端识别率不高的问题。
发明内容
针对现有技术中的缺陷,本发明实施例提供了一种终端类型识别方法、装置、电子设备及存储介质。
第一方面,本发明实施例提供一种终端类型识别方法,包括:
获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;
根据所述终端属性信息确定至少一组影响因子;
根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
如上述方法,可选地,所述获取接入网络中的未识别终端的终端属性信息,包括:
接收接入设备发送的携带接入终端信息的请求报文;
解析所述请求报文,判断所述接入终端是否为未识别终端;
若所述接入终端为未识别终端,则根据所述请求报文确定所述未识别终端的终端属性信息;
若未获取到所述未识别终端的终端属性信息,则向所述接入设备发送获取所述未识别终端的终端属性信息的探测报文;
接收所述接入设备发送的所述探测报文对应的响应报文;
根据所述响应报文,确定所述未识别终端的终端属性信息。
如上述方法,可选地,所述贝叶斯分类器根据以下步骤确定:
根据已识别终端的终端类型Ci,确定有类标训练集T,其中所述有类标训练集T中,每个终端类型Ci对应的终端数量相同,其中i∈[1,N],N为终端类型数;
获取所述有类标训练集T中每个终端的终端属性信息,并根据所述终端属性信息确定每个终端的至少一组影响因子wj,其中j∈[1,K],K为影响因子组数;
令所述有类标训练集T每个终端d对应的P(Ci|d)的期望值为所述已识别终端的终端类型Ci,其中P(Ci|d)为Ci类的后验概率;
根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器:
P(Ci|d)=argmax{P(d|Ck)P(Ck)},k∈[1,N] 公式(1)
其中,P(d|Ck)为终端d属于Ci类的条件概率,P(Ck)为Ci类的先验概率,P(wj|Ck)为分类器预测影响因子wj在类Ci的行为中发生的概率;
根据所述子分类器确定贝叶斯分类器。
如上述方法,可选地,所述根据已识别终端的终端类型Ci,确定有类标训练集T,还包括:
根据未识别终端,确定无类标训练集D,其中所述无类标训练集D的终端数量大于所述有类标训练集T的终端数量;
相应地,所述根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器,包括:根据E步骤和M步骤确定每组影响因子wj对应的子分类器:
M步骤:对有类标训练集T中的每个终端d,根据公式(2)计算每组影响因子对每个终端类型Ci最大概率估计P(wj|Ci),确定子分类器;
E步骤:根据所述子分类器和公式(2)确定所述无类标训练集D中每个终端的终端类型,将所述终端加入至有类标训练集T中,重新执行M步骤,直至收敛。
如上述方法,可选地,所述根据E步骤和M步骤确定每组影响因子wj对应的子分类器,包括:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
令所述E步骤中,每个子分类器的初始权重等于1;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每个子分类器的分类结果是否错误;
若分类结果错误,则令所述子分类器的权重小于1;
根据更新后的权重重新执行M步骤,直至收敛;
获取收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重;
相应地,所述根据所述子分类器确定贝叶斯分类器,包括:
根据收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重,确定贝叶斯分类器。
如上述方法,可选地,所述根据所述子分类器确定贝叶斯分类器,包括:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每种分类器组合Zi的第一识别正确率,其中i∈[1,L],Zi表示包括i个子分类器的分类器组合,L为子分类器的个数;
步骤a、若所述分类器组合Zi中多种分类器组合的第一识别正确率相同,则获取所述多种分类器组合中子分类器个数的最大值N1;
步骤b、若所述最大值N1大于1,则计算每个子分类器Ri的第二识别正确率,其中i∈[1,L],否则将所述最大值N1对应的子分类器作为最优子分类器;
步骤c、若所述第二识别正确率的最大值对应的子分类器数N2大于1,则令i∈[1,L-1],继续执行步骤c,否则,将所述最大值N2对应的子分类器作为最优子分类器;
令所述最优子分类器的权重大于其他子分类器的权重;
根据每个子分类器和其对应的权重,确定贝叶斯分类器。
第二方面,本发明实施例提供一种终端类型识别装置,包括:
获取模块,用于获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;
数字化模块,用于根据所述终端属性信息确定至少一组影响因子;
识别模块,用于根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
如上述装置,可选地,所述获取模块包括:
第一接收单元,用于接收接入设备发送的携带接入终端信息的请求报文;
解析判断单元,用于解析所述请求报文,判断所述接入终端是否为未识别终端;
第一获取单元,用于若所述接入终端为未识别终端,则根据所述请求报文确定所述未识别终端的终端属性信息;
发送单元,用于若未获取到所述未识别终端的终端属性信息,则向所述接入设备发送获取所述未识别终端的终端属性信息的探测报文;
第二接收单元,用于接收所述接入设备发送的所述探测报文对应的响应报文;
第二获取单元,用于根据所述响应报文,确定所述未识别终端的终端属性信息。
如上述装置,可选地,还包括:
训练模块,所述训练模块包括:
训练集确定单元,用于根据已识别终端的终端类型Ci,确定有类标训练集T,其中所述有类标训练集T中,每个终端类型Ci对应的终端数量相同,其中i∈[1,N],N为终端类型数;
第三获取单元,用于获取所述有类标训练集T中每个终端的四元组属性信息,并根据所述终端属性信息确定每个终端的至少一组影响因子wj,其中j∈[1,K],K为影响因子组数;
赋值单元,用于令所述有类标训练集T每个终端d对应的P(Ci|d)的期望值为所述已识别终端的终端类型Ci,其中P(Ci|d)为Ci类的后验概率;
计算单元,用于根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器:
P(Ci|d)=argmax{P(d|Ck)P(Ck)},k∈[1,N] 公式(1)
其中,P(d|Ck)为终端d属于Ci类的条件概率,P(Ck)为Ci类的先验概率,P(wj|Ck)为分类器预测影响因子wj在类Ci的行为中发生的概率;
分类器确定单元,用于根据所述子分类器确定贝叶斯分类器。
如上述装置,可选地,所述训练集确定单元还用于:
根据未识别终端,确定无类标训练集D,其中所述无类标训练集D的终端数量大于所述有类标训练集T的终端数量;
相应地,所述计算单元具体用于:
根据E步骤和M步骤确定每组影响因子wj对应的子分类器:
M步骤:对有类标训练集T中的每个终端d,根据公式(2)计算每组影响因子对每个终端类型Ci最大概率估计P(wj|Ci),确定子分类器;
E步骤:根据所述子分类器和公式(2)确定所述无类标训练集D中每个终端的终端类型,将所述终端加入至有类标训练集T中,重新执行M步骤,直至收敛。
如上述装置,可选地,所述计算单元具体用于:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
令所述E步骤中,每个子分类器的初始权重等于1;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每个子分类器的分类结果是否错误;
若分类结果错误,则令所述子分类器的权重小于1;
根据更新后的权重重新执行M步骤,直至收敛;
获取收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重;
相应地,所述分类器确定单元具体用于:
根据收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重,确定贝叶斯分类器。
如上述装置,可选地,所述分类器确定单元具体用于:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每种分类器组合Zi的识别正确率,其中i∈[1,L],Zi表示包括i个子分类器的分类器组合,L为子分类器的个数;
步骤a、若所述分类器组合Zi中多种分类器组合的识别正确率相同,则获取所述多种分类器组合中子分类器个数的最大值N1;
步骤b、若所述最大值N1大于1,则计算每个子分类器Ri的第二识别正确率,其中i∈[1,L],否则将所述最大值N1对应的子分类器作为最优子分类器;
步骤c、若所述第二识别正确率的最大值对应的子分类器数N2大于1,则令i∈[1,L-1],继续执行步骤c,否则,将所述最大值N2对应的子分类器作为最优子分类器;
令所述最优子分类器的权重大于其他子分类器的权重;
根据每个子分类器和其对应的权重,确定贝叶斯分类器。
第三方面,本发明实施例提供一种电子设备,包括:
存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;根据所述终端属性信息确定至少一组影响因子;根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
第四方面,本发明实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下方法:获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;根据所述终端属性信息确定至少一组影响因子;根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
本发明实施例提供的终端类型识别方法,预先通过终端属性信息训练的贝叶斯分类器,根据接入网络中的未识别终端的终端属性信息和贝叶斯分类器确定终端的类型,通过贝叶斯分类器进行深度学习,提高了终端类型识别率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的终端类型识别方法流程示意图;
图2为本发明实施例提供的地图坐标示意图;
图3为本发明实施例提供的CAPWAP控制报文结构示意图;
图4为本发明实施例提供的封装参数的消息内容格式示意图;
图5为本发明实施例提供的终端类型识别装置的结构示意图;
图6为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的终端类型识别方法流程示意图,如图1所示,该方法包括:
步骤S11、获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;
具体地,终端接入网络之后,首先通过现有技术识别终端类型,例如,通过DHCP信息识别终端是否为移动终端或非移动终端等,若现有技术无法识别出终端类型,则将终端记为未识别终端,获取未识别终端的终端属性信息,终端属性信息包括与未识别终端关联的用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种信息。例如,终端属性信息包括用户信息、上网行为信息、上网设备信息和用户坐标信息的四元组属性信息,或者终端属性信息包括上网行为信息、上网设备信息和用户坐标信息的三元组属性信息,或者终端属性信息包括上网设备信息和用户坐标信息的二元组属性信息等。其中,用户信息为与用户相关的基本信息,例如用户ID,上网行为信息为用户使用未识别终端进行上网的具体上网信息,例如浏览网页URL等,上网设备信息为终端的MAC地址信息,用户坐标信息为用户的位置信息。
以校园用户为例,用户信息可以包括学生基本信息,关联院系专业,上网行为,一卡通数据,图书馆借阅数据等,当用户使用终端设备接入网络之后,需要登陆账号密码进行认证,只有认证通过的用户才能联网,通过获取登录账号信息,就可以确定用户的基本信息,例如,学生id,所在院系,一卡通数据,图书馆借阅数据等,之后在联网之后,获取上网行为信息,例如,上网时段等信息,将上面这些信息作为四元组属性信息中的用户信息。终端属性信息中的上网行为信息是指学生具体的上网行为信息,例如,浏览的网址,各个时间段浏览信息,WIFI定位中的MAC地址信息等,上网行为信息属性判断用户是否在校、进行上网沉迷与网络借贷及WIFI上网内容分析,上网设备信息属性主要包括设备MAC地址信息,实现用户与WIFI定位信息中MAC地址的匹配,用户坐标信息是指用户的位置属性,以校园地图构建坐标系,确定用户每个时刻的坐标信息,用户坐标信息属性提供了学生的位置移动信息,判断是否在校,分析学校wifi使用情况,异常访客等。通过上述四种属性信息,一方面可以从多个角度分析未识别终端的终端类型,另一方面,还可以通过识别对用户进行管理,提前预防一些安全事件并辅助教学管理,例如,通过用户坐标信息可以避免人工点名的弊端。
步骤S12、根据所述终端属性信息确定至少一组影响因子;
具体地,获取到终端属性信息之后,将终端属性信息中每个参数信息数字化,确定至少一组影响因子。用户信息影响因子user_info可以包括:用户身份user_id、用户名user_name、用户性别sex、所在院系institute、专业major、年级grade、班级class和手机号phone等参数信息;上网行为信息影响因子online_detail包括:用户名user_name和终端MAC地址、登陆时间login_time、url访问日志和虚拟认证virtualid信息等参数信息;上网设备信息影响因子auth_mac_info包括:用户身份user_id和WIFI定位中的MAC地址信息等参数信息。将上面的参数信息用对应的数值表示,就可得到对应组的影响因子,例如将用户信息影响因子表示为user_info(12123340,333,2,01,08,12,13,1300000000)。
用户坐标信息影响因子Coordinate(X,Y,Z),将其对应的数值设置为0.0~1.0的坐标系中,X坐标:4Bytes,Y坐标:4Bytes,Z坐标:4Bytes,整个坐标为立体坐标。XY坐标值为单精度浮点型,小数点后保留6-7位,Z代表立体,和坐标系有关的地图信息包括楼层ID(MapID)和区域ID(POI ID)。
具体地,为了将地图信息转换为0.0~1.0的坐标系,首先将地图所在图层的左上角坐标设置为(0.0,0.0),然后将地图所在图层的右下角坐标设置为(1.0,1.0),将地图的最大外轮廓和图层范围相切,就形成了按地图坐标范围为0.0到1.0的坐标系。图2为本发明实施例提供的地图坐标示意图,如图2所示,将地图信息转换为坐标系之后,就可将每个用户的坐标信息属性数字化为坐标属性影响因子。
通过将终端属性信息中每个参数信息数字化之后,可以确定多组影响因子,例如,终端属性为四元组属性信息时,经过数字化之后,可以得到四组影响因子,终端属性为三元组属性信息时,经过数字化之后,可以得到三组影响因子。
步骤S13、根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
具体地,在对未识别终端进行识别之前,按照上面的步骤,预先对大量的终端的至少一组影响因子进行了深度学习,训练出贝叶斯分类器。当获取到某个未识别终端的影响因子之后,将这些影响因子作为贝叶斯分类器的输入值,就可确定未识别终端的终端类型,由于通过大量训练集训练贝叶斯分类器,能够显著提高终端类型的识别率。此外,终端属性信息中包括了丰富的用户信息,通过终端识别精准关注人群,解决考勤耗时费力不配合问题,通过上网行为信息防止校园借贷,提前识别学生失联、朋友圈审计突发事件等,结合信息化建设实现校园管理。
本发明实施例提供的终端类型识别方法,预先通过终端属性信息训练的贝叶斯分类器,根据接入网络中的未识别终端的终端属性信息和贝叶斯分类器确定终端的类型,通过贝叶斯分类器进行深度学习,提高了终端类型识别率。
在上述实施例的基础上,进一步地,所述获取接入网络中的未识别终端的终端属性信息,包括:
接收接入设备发送的携带接入终端信息的请求报文;
解析所述请求报文,判断所述接入终端是否为未识别终端;
若所述接入终端为未识别终端,则根据所述请求报文确定所述未识别终端的终端属性信息;
若未获取到所述未识别终端的终端属性信息,则向所述接入设备发送获取所述未识别终端的终端属性信息的探测报文;
接收所述接入设备发送的所述探测报文对应的响应报文;
根据所述响应报文,确定所述未识别终端的终端属性信息。
具体地,当终端设备(也称为STA,Station)连接接入设备(Access Point,AP)之后,接入设备获取终端属性信息,将终端属性信息以TLV(Type类型-Lenght长度-Value值)格式封装为无线接入点控制和配置协议(Control And Provisioning of WirelessAccess Points Protocol Specification,CAPWAP)请求报文,即CAPWAP echo request报文,通过CAPWAP隧道,发送至接入控制器(Access Control,AC),AC收到请求报文后,首先判断终端设备是否为未识别终端,例如通过现有技术无法识别类型的终端确定为未识别终端。
AC入口接收到AP发送的CAPWAP echo request报文之后,若查找到CAPWAP echorequest报文上存在终端属性信息,则采集来自未识别终端数据信息,提取来自终端设备的终端属性信息,包括用户信息、上网行为信息、上网设备信息或坐标信息。然后将终端属性信息数字化,形成终端属性的影响因子,作为深度学习数据集,以该深度学习数据集作为基于贝叶斯网络的终端类型识别的数据输入,通过预先训练的贝叶斯分类器,输出终端设备的终端类型。
若CAPWAP echo request报文中不存在定义的终端属性信息,则需要重新获取终端属性信息。具体地,AC向网络内对应的AP发送CAPWAP探测报文,请求AP发送未识别终端的终端属性信息,AP接收到探测报文之后,获取终端设备的属性信息,通过CAPWAP隧道向AC发送响应报文CAPWAP echo response,响应报文为CAPWAP协议的控制报文,图3为本发明实施例提供的CAPWAP控制报文结构示意图,如图3所示,CAPWAP控制报文包括:IP报文头部,UDP报文头部,CAPWAP报文头部,CAPWAP控制层和消息内容。CAPWAP协议基于IP和UDP协议之上,消息内容由TLV格式表示,图4为本发明实施例提供的封装参数的消息内容格式示意图,包含厂商信息,位置信息,STA相关自定义参数信息和AP运行信息,这些信息通过TLV格式封装到CAPWAP报文中,并集成了CAPWAP隧道的优点,包括NAT(Network Address Translation,网络地址转换)穿透性和安全特性。
AC接收到AP发送的CAPWAP echo request报文之后,解析报文,提取来自终端设备的终端属性信息,然后将终端属性信息数字化,形成终端属性的影响因子,作为深度学习数据集,以该深度学习数据集作为基于贝叶斯网络的终端类型识别的数据输入,通过预先训练的贝叶斯分类器,输出终端设备的终端类型。
在实际应用中,AC可以周期性地获取终端属性信息。具体地,AP向AC发送CAPWAPecho request报文,AC以T时长为周期,周期性采集其管理的网络中目标终端的多个运行属性和参数,提取终端属性信息。或者当AC获取到终端设备的MAC地址信息起开始计时,到达周期T时长之后,AC向AP发送探测报文时,探测报文携带响应的周期T,AP收到探测报文之后,获取终端设备的属性信息之后,按照周期T,周期性地向AC发送响应消息CAPWAP echoresponse,响应消息携带其管理的网络中目标终端的多个运行属性和参数。若AC等待超时未接到响应消息,则向AP重新发送探测报文,若重发多次之后,例如三次,仍未收到响应消息,则AC不再向AP发送探测报文。AP周期性的接收探测报文,每隔T时间响应一次报文。终端属性信息携带在CAPWAP echo request报文和CAPWAP echo response报文自定义TLV格式中,周期性获取终端设备目标网络节点的多个终端设备的终端属性信息,从而得到多组影响因子,无需增加额外资源和性能消耗。之后AC将周期性获得的每个未识别终端的多组影响因子作为贝叶斯算法队列,输入到预先训练的贝叶斯分类器中,输出的队列即为每个未识别终端的终端类型。
本发明实施例提供的终端类型识别方法,在请求报文和响应报文中携带终端属性信息,无需增加额外资源和性能消耗,进一步提高了终端类型识别率。
在上述各实施例的基础上,进一步地,所述贝叶斯分类器根据以下步骤确定:
根据已识别终端的终端类型Ci,确定有类标训练集T,其中所述有类标训练集T中,每个终端类型Ci对应的终端数量相同,其中i∈[1,N],N为终端类型数;
获取所述有类标训练集T中每个终端的终端属性信息,并根据所述终端属性信息确定每个终端的至少一组影响因子wj,其中j∈[1,K],K为影响因子组数;
令所述有类标训练集T每个终端d对应的P(Ci|d)的期望值为所述已识别终端的终端类型Ci,其中P(Ci|d)为Ci类的后验概率;
根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器:
P(Ci|d)=argmax{P(d|Ck)P(Ck)},k∈[1,N] 公式(1)
其中,P(d|Ck)为终端d属于Ci类的条件概率,P(Ck)为Ci类的先验概率,P(wj|Ck)为分类器预测影响因子wj在类Ci的行为中发生的概率;
根据所述子分类器确定贝叶斯分类器。
具体地,预先获取大量的已识别终端,标注每个已识别终端的终端类型,确定有类标训练集T,并且,在有类标训练集T中,共有N中终端类型,记为C={C1,C2,...Ci,...CN},每种终端类型Ci对应的终端数量相同。然后获取有类标训练集T中每个终端的终端属性信息,并对终端属性信息数字化,生成每个终端的影响因子w={w1,w2,...wj,...wK},K为影响因子组数,如果有四组影响因子,则K=4。
在有类标训练集T中每个终端类型Ci的先验概率为P(Ci),i=1,2,…,N,将Ci类的样本数除以训练集中总样本数,就可以得到P(Ci)。对于一个新终端d属于Ci类的条件概率是P(d|Ci),根据贝叶斯定理,Ci类的后验概率为P(Ci|d),并且:
其中,P(d)为终端d的先验概率,对于所有的终端类型,P(d)为常数,可以忽略,公式(3)简化为:
P(Ci|d)∝P(d|Ci)P(Ci) 公式(4)
根据公式(4),贝叶斯分类器将未知样本归类的依据为:
P(Ci|d)=argmax{P(d|Ck)P(Ck)},k∈[1,N] 公式(1)
由于终端d由其包含的影响因子表示,即d={w1,...,wj,...,wK},K为终端d中的影响因子组数,wj是第j组影响因子,在本发明实施例中,要求终端的各种终端属性线之间相互独立,同时要求组成每种属性的影响因子之间也具有相互独立性。由特征独立性,则有
式中,P(wj|Ck)为分类器预测影响因子wj在类Ci的行为中发生的概率,根据上述公式,将影响因子作为贝叶斯网络的训练集,训练贝叶斯分类器贝叶斯分类器,对每组影响因子wj训练一个子分类器,然后将各子分类的分类结果进行组合,形成训练好的贝叶斯分类器,若只有一组影响因子,则将该影响因子对应的子分类器直接作为最终的贝叶斯分类器。
例如,将终端类型分类移动终端M1和非移动终端M2两种类型,则在有类标训练集T中,移动终端的数量与非移动终端的数量相同,终端类型C={C1,C2}={M1,M2}。当终端接入网络后,终端类型先定义为NULL,表示没有识别出来。然后采用已知方法,例如用户信息,DHCP信息识别,HTTP报文的UA字段,IMEI识别等方法,识别终端类型,根据表1对终端进行分类。
表1终端类型分类表
对终端进行分类之后,从中抽取相同数量的移动终端和非移动终端,组成有类标训练集T,将这些终端的终端属性信息对应的影响因子作为贝叶斯网络的训练数据,训练出每组影响因子对应的子分类器,然后通过各子分类器产生最终的贝叶斯分类器。训练集中包含的终端数量越大,训练出的贝叶斯分类器的终端识别率越高。
本发明实施例提供的终端类型识别方法,通过终端属性信息构建贝叶斯网络,通过概率推理的贝叶斯算法,解决终端设备不确定性和关联性引起的终端类型识别不准问题,根据影响因子进行深度学习,解决了现有终端识别技术需要持续升级特征库,识别率不高的问题。
在上述各实施例的基础上,进一步地,所述根据已识别终端的终端类型Ci,确定有类标训练集T,还包括:
根据未识别终端,确定无类标训练集D,其中所述无类标训练集D的终端数量大于所述有类标训练集T的终端数量;
相应地,所述根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器,包括:根据E步骤和M步骤确定每组影响因子wj对应的子分类器:
M步骤:对有类标训练集T中的每个终端d,根据公式(2)计算每组影响因子对每个终端类型Ci最大概率估计P(wj|Ci),确定子分类器;
E步骤:根据所述子分类器和公式(2)确定所述无类标训练集D中每个终端的终端类型,将所述终端加入至有类标训练集T中,重新执行M步骤,直至收敛。
具体地,使用贝叶斯网络要有训练样本,训练样本中的样本数越大精度越高。但现实中并不能找到比较多的已经正确标注类型的终端集合,而未标注的终端集合却极其丰富,因此可以运用少量有类标的终端集合和大量无类标的终端集合组成训练集,分别记为有类标训练集T和无类标训练集D,在有类标训练集T中,要求每种终端类型的终端数相同。此时由于缺少足够的有类标训练终端,采用最大期望算法(EM)进行无指导神经网络学习,最后得到训练好的贝叶斯分类器。对贝叶斯分类器采用EM算法的基本做法是首先利用由少量有类型标注的终端组成的有类标训练集T,一般可选有类标训练集T中的终端数为20,初始化贝叶斯网络的参数,然后利用EM算法调整贝叶斯网络,从而进一步优化贝叶斯分类器的参数,提高其分类性能。
整个EM算法的流程如下:
输入:少量有类标训练集T,大量无类标训练集D,类型序列C
处理:1)对于T中每个终端d,令P(Ci|d)的期望值为该终端的终端类型Ci;
2)反复执行下列E步骤与M步骤,直到收敛,其中收敛是指分类器的识别正确率趋于一个数值不再变化:
M步骤:对T中的每个终端,根据公式(2)计算每组影响因子对每个终端类型Ci最大概率估计P(wj|Ci),得到子分类器参数;
E步骤:用M步骤求出的子分类器参数,根据公式(2)计算无类标训练集D中每个终端的终端类型,然后将该终端加入到有类标训练集T中,重新执行M步骤操作。
输出:一个训练好的贝叶斯分类器。
由于初始化时有类标训练集对每个类都撒下了种子,所以EM算法找到的局部最大值就是希望结果,EM算法最终将给所有训练样本终端标上终端类型。
本发明实施例提供的终端类型识别方法,通过终端属性信息构建贝叶斯网络,根据EM算法解决了训练样本中已识别终端数较小的问题,通过贝叶斯网络解决终端设备不确定性和关联性引起的终端类型识别不准问题,根据影响因子进行深度学习,进一步提高了终端识别率。
在上述各实施例的基础上,进一步地,所述根据E步骤和M步骤确定每组影响因子wj对应的子分类器,包括:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
令所述E步骤中,每个子分类器的初始权重等于1;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每个子分类器的分类结果是否错误;
若分类结果错误,则令所述子分类器的权重小于1;
根据更新后的权重重新执行M步骤,直至收敛;
获取收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重;
相应地,所述根据所述子分类器确定贝叶斯分类器,包括:
根据收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重,确定贝叶斯分类器。
具体地,由于输入的影响因子有多组,每组影响因子训练出的子分类器对一个未知终端的识别结果可能不相同,为了进一步提高终端识别率,首先通过无类标训练集D中每个终端在预设周期T内的移动性值Mx,对于未识别终端d,统计其T周期的移动性值时设置至关重要,如对于一个移动终端,如果T设置为24小时,可能是在晚上统计若该生晚上总在宿舍睡觉,那么对应终端设备的移动值Mx=0,判断为非移动终端,判断出错。如果将T设置成较小的值可能判断不出移动性,因此可以设置移动周期T=24小时,T=t1+t2+…+t24,t1,…,t24将大周期T分为24个小周期,每个小周期为1小时,Mx为24个小周期移动距离总和,这样可以比较清楚的判断出其移动性,得到移动性值Mx之后,根据移动性值Mx确定无类标训练集D中每个终端的终端类型,记为第一终端类型。
之后,在EM算法过程中,首先令每个子分类器的初始权重等于1,然后每训练出一组子分类器之后,确定每个子分类器识别的无类标训练集D中终端的终端类型,记为第二终端类型,并与第一终端类型进行对比,判断子分类器的分类结果是否错误,如果分类结果错误,则更新对应的子分类器的权重,令更新后的权重大于0且小于1,目的是当上一次预测没有预测正确时时,降低对应状态的概率。然后根据更新权重后的子分类器继续执行M步骤,根据分类器参数再一次判断分类是否正确并更新权重,直至收敛,此时就可通过EM算法得到每组影响因子wj对应的子分类器和权重,最后根据每组影响因子wj对应的子分类器和权重,确定贝叶斯分类器,最终得到的贝叶斯分类器能够自动选择出最优的影响因子,并输出预测结果。
本发明实施例提供的终端类型识别方法,通过终端属性信息构建贝叶斯网络,通过深度学习在大数据中获取各个运行参数对应的权值,对多组影响因子进行贝叶斯计算,从而可以确定出未识别终端的精准识别情况进一步提高了终端识别率。
在上述各实施例的基础上,进一步地,所述根据所述子分类器确定贝叶斯分类器,包括:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每种分类器组合Zi的第一识别正确率,其中i∈[1,L],Zi表示包括i个子分类器的分类器组合,L为子分类器的个数;
步骤a、若所述分类器组合Zi中多种分类器组合的第一识别正确率相同,则获取所述多种分类器组合中子分类器个数的最大值N1;
步骤b、若所述最大值N1大于1,则计算每个子分类器Ri的第二识别正确率,其中i∈[1,L],否则将所述最大值N1对应的子分类器作为最优子分类器;
步骤c、若所述第二识别正确率的最大值对应的子分类器数N2大于1,则令i∈[1,L-1],继续执行步骤c,否则,将所述最大值N2对应的子分类器作为最优子分类器;
令所述最优子分类器的权重大于其他子分类器的权重;
根据每个子分类器和其对应的权重,确定贝叶斯分类器。
具体地,除了在EM算法过程中不断更新子分类器的权重之外,还可以根据最终分类结果筛选最优子分类器,对最优子分类赋予较高的权重。首先统计无类标训练集D中每个终端在预设周期内的移动性值,根据移动性值确定无类标训练集D中每个终端的第一终端类型,然后根据第一终端类型和每个子分类器确定的该终端的第二终端类型,确定每一种分类器组合Zi的识别正确率其中i∈[1,L],Zi表示包括i个子分类器的分类器组合,L为子分类器的个数,例如分类器组合Z4为四种影响因子,分别为用户信息影响因子、上网行为信息影响因子、上网设备信息影响因子和用户坐标信息影响因子,分类器组合Z3为三种影响因子,分别为上网行为信息影响因子、上网设备信息影响因子和用户坐标信息影响因子,分类器组合Z2为两种影响因子,分别为上网设备信息影响因子和用户坐标信息影响因子,分类器组合Z1为一种影响因子,即用户坐标信息影响因子。分类器Z4的识别正确率表示采用四种影响因子时,训练得到的分类器正确识别未知终端的概率。Zi的第一识别正确率其中Fir表示根据Zi组合判断对的次数,Fi表示根据Zi组合判断的总次数。
之后,按照下述步骤a-步骤c筛选出最优子分类器:
步骤a、若分类器组合Zi中多种分类器组合的第一识别正确率相同,则获取多种分类器组合中子分类器个数的最大值N1,例如,Z2和Z3的第一识别正确率相同,则最大值N1=3。
步骤b、若最大值N1等于1,则将最大值N1对应的子分类器作为最优子分类器;若最大值N1大于1,则计算每个子分类器Ri的第二识别正确率其中i∈[1,L],Eir表示根据子分类器Ri判断对的次数,Ei表示根据子分类器Ri判断的总次数。
步骤c、按第二识别正确率降序排列,若子分类器Ri中第二识别正确率的最大值对应的子分类器数N2=1,则将最大值N2对应的子分类器作为最优子分类器;若所述第二识别正确率的最大值对应的子分类器数N2大于1,则令i∈[1,L-1],继续执行步骤c,计算其他L-1个子分类器的第二识别正确率的最大值,最后输出最优子分类器。
例如,根据总的四种分类器组合Z1、Z2、Z3、Z4的第一识别正确率降序排列,当两个或以上分类器组合的第一识别正确率相同时,则取不同分类器组合中子分类器最多的,设子分类器数最大值为N1。若最大值N1对应的只有1个子分类器,则将该子分类器作为最优子分类器;若最大值N1对应的有多个子分类器,则将四种子分类器中每个子分类器的第二识别正确率存放在矩阵M中,执行步骤(1)。
步骤(1)将矩阵M按照对应的第二识别正确率进行降序排列,若最大值只有1个,则将该子分类器作为最优子分类器。若最大值对应的子分类器数N2有多个,则将后三种子分类器中每个子分类器的第二识别正确率存放在矩阵N中,执行步骤(2)。
步骤(2)矩阵N按照对应的第二识别正确率进行降序排列,若最大值只有1个,则将该子分类器作为最优子分类器。若最大值对应的子分类器数N2有多个,则将后两种子分类器中每个子分类器的第二识别正确率存放在矩阵N中,执行步骤(3)。
(3)将矩阵N按照对应的第二识别正确率进行降序排列,若最大值只有1个,则将该子分类器作为最优子分类器。若最大值对应的子分类器数N2有多个,则将最后一种子分类器作为最优子分类器。
根据上述步骤得到最优子分类器之后,为最优子分类器分配较大的权重,如权重为5,其它子分类器权重为1。如果最优子分类器判断该终端为移动终端,而其它3个子分类器判断为非移动终端,则1*5>3*1,最终该设备被贝叶斯分类器器判断为移动终端,并通过终端识别到的属性信息和影响因子,对学生进行智能化管理,根据这些信息,可以得到学生日常生活规律,如是否在学校,在上课还是在宿舍,平时浏览的信息类型,根据这些日常习惯可以判断学生是否出事,如是否旷课,有无夜不归宿的等情况。
本发明实施例提供的终端类型识别方法,通过终端属性信息构建贝叶斯网络,通过深度学习在大数据中获取各个运行参数对应的权值,对多组影响因子进行贝叶斯计算,从而可以确定出未识别终端的精准识别情况进一步提高了终端识别率。
图5为本发明实施例提供的终端类型识别装置的结构示意图,如图5所示,该装置包括:获取模块51、数字化模块52和识别模块53,其中:
获取模块51用于获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;数字化模块52用于根据所述终端属性信息确定至少一组影响因子;识别模块53用于根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
具体地,终端接入网络之后,获取模块51获取未识别终端的终端属性信息,终端属性信息包括与未识别终端关联的用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种信息。数字化模块52将终端属性信息中每个参数信息数字化,确定至少一组影响因子。识别模块53将这些影响因子作为贝叶斯分类器的输入值,就可确定未识别终端的终端类型,由于通过大量训练集训练贝叶斯分类器,能够显著提高终端类型的识别率。此外,终端属性信息中包括了丰富的用户信息,通过终端识别精准关注人群,解决考勤耗时费力不配合问题,通过上网行为信息防止校园借贷,提前识别学生失联、朋友圈审计突发事件等,结合信息化建设实现校园管理。本发明实施例提供的装置,用于实现上述方法,其功能具体参照上述方法实施例,此处不再赘述。
本发明实施例提供的终端类型识别装置,预先通过终端属性信息训练的贝叶斯分类器,根据接入网络中的未识别终端的终端属性信息和贝叶斯分类器确定终端的类型,通过贝叶斯分类器进行深度学习,提高了终端类型识别率。
在上述实施例的基础上,进一步地,所述获取模块包括:
第一接收单元,用于接收接入设备发送的携带接入终端信息的请求报文;
解析判断单元,用于解析所述请求报文,判断所述接入终端是否为未识别终端;
第一获取单元,用于若所述接入终端为未识别终端,则根据所述请求报文确定所述未识别终端的终端属性信息;
发送单元,用于若未获取到所述未识别终端的终端属性信息,则向所述接入设备发送获取所述未识别终端的终端属性信息的探测报文;
第二接收单元,用于接收所述接入设备发送的所述探测报文对应的响应报文;
第二获取单元,用于根据所述响应报文,确定所述未识别终端的终端属性信息。
具体地,当终端设备连接接入设备AP之后,接入设备获取终端属性信息,将终端属性信息以TLV格式封装为CAPWAP请求报文,即CAPWAP echo request报文,通过CAPWAP隧道,发送至第一接收单元,第一接收单元收到请求报文后,解析判断单元判断终端设备是否为未识别终端,例如通过现有技术无法识别类型的终端确定为未识别终端。第一获取单元采集来自未识别终端数据信息,提取来自终端设备的终端属性信息,包括用户信息、上网行为信息、上网设备信息或坐标信息。然后将终端属性信息数字化,形成终端属性的影响因子,作为深度学习数据集,以该深度学习数据集作为基于贝叶斯网络的终端类型识别的数据输入,通过预先训练的贝叶斯分类器,输出终端设备的终端类型。
若CAPWAP echo request报文中不存在定义的终端属性信息,则需要重新获取终端属性信息。具体地,发送单元向网络内对应的AP发送CAPWAP探测报文,请求AP发送未识别终端的终端属性信息,AP接收到探测报文之后,获取终端设备的属性信息,通过CAPWAP隧道向第二接收单元发送响应报文CAPWAP echo response,响应报文为CAPWAP协议的控制报文,第二获取单元解析报文,提取来自终端设备的终端属性信息,然后将终端属性信息数字化,形成终端属性的影响因子,作为深度学习数据集,以该深度学习数据集作为基于贝叶斯网络的终端类型识别的数据输入,通过预先训练的贝叶斯分类器,输出终端设备的终端类型。本发明实施例提供的装置,用于实现上述方法,其功能具体参照上述方法实施例,此处不再赘述。
本发明实施例提供的终端类型识别装置,在请求报文和响应报文中携带终端属性信息,无需增加额外资源和性能消耗,进一步提高了终端类型识别率。
在上述各实施例的基础上,进一步地,该装置还包括:
训练模块,所述训练模块包括:
训练集确定单元,用于根据已识别终端的终端类型Ci,确定有类标训练集T,其中所述有类标训练集T中,每个终端类型Ci对应的终端数量相同,其中i∈[1,N],N为终端类型数;
第三获取单元,用于获取所述有类标训练集T中每个终端的四元组属性信息,并根据所述终端属性信息确定每个终端的至少一组影响因子wj,其中j∈[1,K],K为影响因子组数;
赋值单元,用于令所述有类标训练集T每个终端d对应的P(Ci|d)的期望值为所述已识别终端的终端类型Ci,其中P(Ci|d)为Ci类的后验概率;
计算单元,用于根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器:
P(Ci|d)=argmax{P(d|Ck)P(Ck)},k∈[1,N] 公式(1)
其中,P(d|Ck)为终端d属于Ci类的条件概率,P(Ck)为Ci类的先验概率,P(wj|Ck)为分类器预测影响因子wj在类Ci的行为中发生的概率;
分类器确定单元,用于根据所述子分类器确定贝叶斯分类器。
具体地,终端类型识别装置还包括训练模块,训练模块包括:训练集确定单元、第三获取单元、赋值单元、计算单元和分类器确定单元。其中:
训练集确定单元预先获取大量的已识别终端,标注每个已识别终端的终端类型,确定有类标训练集T,并且,在有类标训练集T中,共有N中终端类型,记为C={C1,C2,...Ci,...CN},每种终端类型Ci对应的终端数量相同。第三获取单元获取有类标训练集T中每个终端的终端属性信息,赋值单元对终端属性信息数字化,生成每个终端的影响因子w={w1,w2,...wj,...wK},K为影响因子组数,如果有四组影响因子,则K=4。计算单元根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器,分类器确定单元,然后将各子分类的分类结果进行组合,形成训练好的贝叶斯分类器,若只有一组影响因子,则将该影响因子对应的子分类器直接作为最终的贝叶斯分类器。本发明实施例提供的装置,用于实现上述方法,其功能具体参照上述方法实施例,此处不再赘述。
本发明实施例提供的终端类型识别装置,通过终端属性信息构建贝叶斯网络,通过概率推理的贝叶斯算法,解决终端设备不确定性和关联性引起的终端类型识别不准问题,根据影响因子进行深度学习,解决了现有终端识别技术需要持续升级特征库,识别率不高的问题。
在上述各实施例的基础上,进一步地,所述训练集确定单元还用于:
根据未识别终端,确定无类标训练集D,其中所述无类标训练集D的终端数量大于所述有类标训练集T的终端数量;
相应地,所述计算单元具体用于:
根据E步骤和M步骤确定每组影响因子wj对应的子分类器:
M步骤:对有类标训练集T中的每个终端d,根据公式(2)计算每组影响因子对每个终端类型Ci最大概率估计P(wj|Ci),确定子分类器;
E步骤:根据所述子分类器和公式(2)确定所述无类标训练集D中每个终端的终端类型,将所述终端加入至有类标训练集T中,重新执行M步骤,直至收敛。
具体地,使用少量有类标的终端集合和大量无类标的终端集合组成训练集,分别记为有类标训练集T和无类标训练集D,在有类标训练集T中,要求每种终端类型的终端数相同。此时由于缺少足够的有类标训练终端,采用最大期望算法(EM)进行无指导神经网络学习,最后得到训练好的贝叶斯分类器。对贝叶斯分类器采用EM算法的基本做法是首先利用由少量有类型标注的终端组成的有类标训练集T,一般可选有类标训练集T中的终端数为20,初始化贝叶斯网络的参数,然后利用EM算法调整贝叶斯网络,从而进一步优化贝叶斯分类器的参数,提高其分类性能。
整个EM算法的流程如下:
输入:少量有类标训练集T,大量无类标训练集D,类型序列C
处理:1)对于T中每个终端d,令P(Ci|d)的期望值为该终端的终端类型Ci;
2)反复执行下列E步骤与M步骤,直到收敛:
M步骤:对T中的每个终端,根据公式(2)计算每组影响因子对每个终端类型Ci最大概率估计P(wj|Ci),得到子分类器参数;
E步骤:用M步骤求出的子分类器参数,根据公式(2)计算无类标训练集D中每个终端的终端类型,然后将该终端加入到有类标训练集T中,重新执行M步骤操作。
输出:一个训练好的贝叶斯分类器。
由于初始化时有类标训练集对每个类都撒下了种子,所以EM算法找到的局部最大值就是希望结果,EM算法最终将给所有训练样本终端标上终端类型。本发明实施例提供的装置,用于实现上述方法,其功能具体参照上述方法实施例,此处不再赘述。
本发明实施例提供的终端类型识别装置,通过终端属性信息构建贝叶斯网络,根据EM算法解决了训练样本中已识别终端数较小的问题,通过贝叶斯网络解决终端设备不确定性和关联性引起的终端类型识别不准问题,根据影响因子进行深度学习,进一步提高了终端识别率。
在上述各实施例的基础上,进一步地,所述计算单元具体用于:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
令所述E步骤中,每个子分类器的初始权重等于1;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每个子分类器的分类结果是否错误;
若分类结果错误,则令所述子分类器的权重小于1;
根据更新后的权重重新执行M步骤,直至收敛;
获取收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重;
相应地,所述分类器确定单元具体用于:
根据收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重,确定贝叶斯分类器。
具体地,由于输入的影响因子有多组,每组影响因子训练出的子分类器对一个未知终端的识别结果可能不相同,为了进一步提高终端识别率,首先通过无类标训练集D中每个终端在预设周期T内的移动性值Mx,对于未识别终端d,统计其T周期的移动性值时设置至关重要,如对于一个移动终端,如果T设置为24小时,可能是在晚上统计若该生晚上总在宿舍睡觉,那么对应终端设备的移动值Mx=0,判断为非移动终端,判断出错。如果将T设置成较小的值可能判断不出移动性,因此可以设置移动周期T=24小时,T=t1+t2+…+t24,t1,…,t24将大周期T分为24个小周期,每个小周期为1小时,Mx为24个小周期移动距离总和,这样可以比较清楚的判断出其移动性,得到移动性值Mx之后,根据移动性值Mx确定无类标训练集D中每个终端的终端类型,记为第一终端类型。
之后,在EM算法过程中,首先令每个子分类器的初始权重等于1,然后每训练出一组子分类器之后,确定每个子分类器识别的无类标训练集D中终端的终端类型,记为第二终端类型,并与第一终端类型进行对比,判断子分类器的分类结果是否错误,如果分类结果错误,则更新对应的子分类器的权重,令更新后的权重大于0且小于1,目的是当上一次预测没有预测正确时时,降低对应状态的概率。然后根据更新权重后的子分类器继续执行M步骤,根据分类器参数再一次判断分类是否正确并更新权重,直至收敛,EM算法最后得到每组影响因子wj对应的子分类器和权重,根据每组影响因子wj对应的子分类器和权重,确定贝叶斯分类器。最终得到的贝叶斯分类器能够自动选择出最优的影响因子,并输出预测结果。本发明实施例提供的装置,用于实现上述方法,其功能具体参照上述方法实施例,此处不再赘述。
本发明实施例提供的终端类型识别装置,通过终端属性信息构建贝叶斯网络,通过深度学习在大数据中获取各个运行参数对应的权值,对多组影响因子进行贝叶斯计算,从而可以确定出未识别终端的精准识别情况进一步提高了终端识别率。
在上述各实施例的基础上,进一步地,所述分类器确定单元具体用于:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每种分类器组合Zi的识别正确率,其中i∈[1,L],Zi表示包括i个子分类器的分类器组合,L为子分类器的个数;
步骤a、若所述分类器组合Zi中多种分类器组合的识别正确率相同,则获取所述多种分类器组合中子分类器个数的最大值N1;
步骤b、若所述最大值N1大于1,则计算每个子分类器Ri的第二识别正确率,其中i∈[1,L],否则将所述最大值N1对应的子分类器作为最优子分类器;
步骤c、若所述第二识别正确率的最大值对应的子分类器数N2大于1,则令i∈[1,L-1],继续执行步骤c,否则,将所述最大值N2对应的子分类器作为最优子分类器;
令所述最优子分类器的权重大于其他子分类器的权重;
根据每个子分类器和其对应的权重,确定贝叶斯分类器。
具体地,除了在EM算法过程中不断更新子分类器的权重之外,还可以根据最终分类结果筛选最优子分类器,对最优子分类赋予较高的权重。首先统计无类标训练集D中每个终端在预设周期内的移动性值,根据移动性值确定无类标训练集D中每个终端的第一终端类型,然后根据第一终端类型和每个子分类器确定的该终端的第二终端类型,确定每一种分类器组合Zi的识别正确率其中i∈[1,L],Zi表示包括i个子分类器的分类器组合,L为子分类器的个数,例如分类器组合Z4为四种影响因子,分别为用户信息影响因子、上网行为信息影响因子、上网设备信息影响因子和用户坐标信息影响因子,分类器组合Z3为三种影响因子,分别为上网行为信息影响因子、上网设备信息影响因子和用户坐标信息影响因子,分类器组合Z2为两种影响因子,分别为上网设备信息影响因子和用户坐标信息影响因子,分类器组合Z1为一种影响因子,即用户坐标信息影响因子。分类器Z4的识别正确率表示采用四种影响因子时,训练得到的分类器正确识别未知终端的概率。Zi的第一识别正确率其中Fir表示根据Zi组合判断对的次数,Fi表示根据Zi组合判断的总次数。
之后,按照下述步骤a-步骤c筛选出最优子分类器:
步骤a、若分类器组合Zi中多种分类器组合的第一识别正确率相同,则获取多种分类器组合中子分类器个数的最大值N1,例如,Z2和Z3的第一识别正确率相同,则最大值N1=3。
步骤b、若最大值N1等于1,则将最大值N1对应的子分类器作为最优子分类器;若最大值N1大于1,则计算每个子分类器Ri的第二识别正确率其中i∈[1,L],Eir表示根据子分类器Ri判断对的次数,Ei表示根据子分类器Ri判断的总次数。
步骤c、按第二识别正确率降序排列,若子分类器Ri中第二识别正确率的最大值对应的子分类器数N2=1,则将最大值N2对应的子分类器作为最优子分类器;若所述第二识别正确率的最大值对应的子分类器数N2大于1,则令i∈[1,L-1],继续执行步骤c,计算其他L-1个子分类器的第二识别正确率的最大值,最后输出最优子分类器。本发明实施例提供的装置,用于实现上述方法,其功能具体参照上述方法实施例,此处不再赘述。
本发明实施例提供的终端类型识别装置,通过终端属性信息构建贝叶斯网络,通过深度学习在大数据中获取各个运行参数对应的权值,对多组影响因子进行贝叶斯计算,从而可以确定出未识别终端的精准识别情况进一步提高了终端识别率。
图6为本发明实施例提供的电子设备的结构示意图,如图6所示,所述设备包括:处理器(processor)61、存储器(memory)62和总线63;
其中,处理器61和存储器62通过所述总线63完成相互间的通信;
处理器61用于调用存储器62中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;根据所述终端属性信息确定至少一组影响因子;根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;根据所述终端属性信息确定至少一组影响因子;根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;根据所述终端属性信息确定至少一组影响因子;根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明的实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明的各实施例技术方案的范围。
Claims (14)
1.一种终端类型识别方法,其特征在于,包括:
获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;
根据所述终端属性信息确定至少一组影响因子;
根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
2.根据权利要求1所述的方法,其特征在于,所述获取接入网络中的未识别终端的终端属性信息,包括:
接收接入设备发送的携带接入终端信息的请求报文;
解析所述请求报文,判断所述接入终端是否为未识别终端;
若所述接入终端为未识别终端,则根据所述请求报文确定所述未识别终端的终端属性信息;
若未获取到所述未识别终端的终端属性信息,则向所述接入设备发送获取所述未识别终端的终端属性信息的探测报文;
接收所述接入设备发送的所述探测报文对应的响应报文;
根据所述响应报文,确定所述未识别终端的终端属性信息。
3.根据权利要求1所述的方法,其特征在于,所述贝叶斯分类器根据以下步骤确定:
根据已识别终端的终端类型Ci,确定有类标训练集T,其中所述有类标训练集T中,每个终端类型Ci对应的终端数量相同,其中i∈[1,N],N为终端类型数;
获取所述有类标训练集T中每个终端的终端属性信息,并根据所述终端属性信息确定每个终端的至少一组影响因子wj,其中j∈[1,K],K为影响因子组数;
令所述有类标训练集T每个终端d对应的P(Ci|d)的期望值为所述已识别终端的终端类型Ci,其中P(Ci|d)为Ci类的后验概率;
根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器:
P(Ci|d)=argmax{P(d|Ck)P(Ck)},k∈[1,N] 公式(1)
其中,P(d|Ck)为终端d属于Ci类的条件概率,P(Ck)为Ci类的先验概率,P(wj|Ck)为分类器预测影响因子wj在类Ci的行为中发生的概率;
根据所述子分类器确定贝叶斯分类器。
4.根据权利要求3所述的方法,其特征在于,所述根据已识别终端的终端类型Ci,确定有类标训练集T,还包括:
根据未识别终端,确定无类标训练集D,其中所述无类标训练集D的终端数量大于所述有类标训练集T的终端数量;
相应地,所述根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器,包括:根据E步骤和M步骤确定每组影响因子wj对应的子分类器:
M步骤:对有类标训练集T中的每个终端d,根据公式(2)计算每组影响因子对每个终端类型Ci最大概率估计P(wj|Ci),确定子分类器;
E步骤:根据所述子分类器和公式(2)确定所述无类标训练集D中每个终端的终端类型,将所述终端加入至有类标训练集T中,重新执行M步骤,直至收敛。
5.根据权利要求4所述的方法,其特征在于,所述根据E步骤和M步骤确定每组影响因子wj对应的子分类器,包括:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
令所述E步骤中,每个子分类器的初始权重等于1;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每个子分类器的分类结果是否错误;
若分类结果错误,则令所述子分类器的权重小于1;
根据更新后的权重重新执行M步骤,直至收敛;
获取收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重;
相应地,所述根据所述子分类器确定贝叶斯分类器,包括:
根据收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重,确定贝叶斯分类器。
6.根据权利要求4所述的方法,其特征在于,所述根据所述子分类器确定贝叶斯分类器,包括:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每种分类器组合Zi的第一识别正确率,其中i∈[1,L],Zi表示包括i个子分类器的分类器组合,L为子分类器的个数;
步骤a、若所述分类器组合Zi中多种分类器组合的第一识别正确率相同,则获取所述多种分类器组合中子分类器个数的最大值N1;
步骤b、若所述最大值N1大于1,则计算每个子分类器Ri的第二识别正确率,其中i∈[1,L],否则将所述最大值N1对应的子分类器作为最优子分类器;
步骤c、若所述第二识别正确率的最大值对应的子分类器数N2大于1,则令i∈[1,L-1],继续执行步骤c,否则,将所述最大值N2对应的子分类器作为最优子分类器;
令所述最优子分类器的权重大于其他子分类器的权重;
根据每个子分类器和其对应的权重,确定贝叶斯分类器。
7.一种终端类型识别装置,其特征在于,包括:
获取模块,用于获取接入网络中的未识别终端的终端属性信息,所述终端属性信息包括:用户信息、上网行为信息、上网设备信息和用户坐标信息中的至少一种;
数字化模块,用于根据所述终端属性信息确定至少一组影响因子;
识别模块,用于根据所述影响因子和预先训练的贝叶斯分类器,确定所述未识别终端的终端类型。
8.根据权利要求7所述的装置,其特征在于,所述获取模块包括:
第一接收单元,用于接收接入设备发送的携带接入终端信息的请求报文;
解析判断单元,用于解析所述请求报文,判断所述接入终端是否为未识别终端;
第一获取单元,用于若所述接入终端为未识别终端,则根据所述请求报文确定所述未识别终端的终端属性信息;
发送单元,用于若未获取到所述未识别终端的终端属性信息,则向所述接入设备发送获取所述未识别终端的终端属性信息的探测报文;
第二接收单元,用于接收所述接入设备发送的所述探测报文对应的响应报文;
第二获取单元,用于根据所述响应报文,确定所述未识别终端的终端属性信息。
9.根据权利要求7所述的装置,其特征在于,还包括:
训练模块,所述训练模块包括:
训练集确定单元,用于根据已识别终端的终端类型Ci,确定有类标训练集T,其中所述有类标训练集T中,每个终端类型Ci对应的终端数量相同,其中i∈[1,N],N为终端类型数;
第三获取单元,用于获取所述有类标训练集T中每个终端的四元组属性信息,并根据所述终端属性信息确定每个终端的至少一组影响因子wj,其中j∈[1,K],K为影响因子组数;
赋值单元,用于令所述有类标训练集T每个终端d对应的P(Ci|d)的期望值为所述已识别终端的终端类型Ci,其中P(Ci|d)为Ci类的后验概率;
计算单元,用于根据公式(1)和公式(2)确定每组影响因子wj对应的子分类器:
P(Ci|d)=argmax{P(d|Ck)P(Ck)},k∈[1,N] 公式(1)
其中,P(d|Ck)为终端d属于Ci类的条件概率,P(Ck)为Ci类的先验概率,P(wj|Ck)为分类器预测影响因子wj在类Ci的行为中发生的概率;
分类器确定单元,用于根据所述子分类器确定贝叶斯分类器。
10.根据权利要求9所述的装置,其特征在于,所述训练集确定单元还用于:
根据未识别终端,确定无类标训练集D,其中所述无类标训练集D的终端数量大于所述有类标训练集T的终端数量;
相应地,所述计算单元具体用于:
根据E步骤和M步骤确定每组影响因子wj对应的子分类器:
M步骤:对有类标训练集T中的每个终端d,根据公式(2)计算每组影响因子对每个终端类型Ci最大概率估计P(wj|Ci),确定子分类器;
E步骤:根据所述子分类器和公式(2)确定所述无类标训练集D中每个终端的终端类型,将所述终端加入至有类标训练集T中,重新执行M步骤,直至收敛。
11.根据权利要求10所述的装置,其特征在于,所述计算单元具体用于:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
令所述E步骤中,每个子分类器的初始权重等于1;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每个子分类器的分类结果是否错误;
若分类结果错误,则令所述子分类器的权重小于1;
根据更新后的权重重新执行M步骤,直至收敛;
获取收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重;
相应地,所述分类器确定单元具体用于:
根据收敛后的M步骤确定的每组影响因子wj对应的子分类器和权重,确定贝叶斯分类器。
12.根据权利要求10所述的装置,其特征在于,所述分类器确定单元具体用于:
统计所述无类标训练集D中每个终端在预设周期内的移动性值;
根据所述移动性值确定所述无类标训练集D中每个终端的第一终端类型;
根据所述第一终端类型和每个所述子分类器确定的所述终端的第二终端类型,确定每种分类器组合Zi的识别正确率,其中i∈[1,L],Zi表示包括i个子分类器的分类器组合,L为子分类器的个数;
步骤a、若所述分类器组合Zi中多种分类器组合的识别正确率相同,则获取所述多种分类器组合中子分类器个数的最大值N1;
步骤b、若所述最大值N1大于1,则计算每个子分类器Ri的第二识别正确率,其中i∈[1,L],否则将所述最大值N1对应的子分类器作为最优子分类器;
步骤c、若所述第二识别正确率的最大值对应的子分类器数N2大于1,则令i∈[1,L-1],继续执行步骤c,否则,将所述最大值N2对应的子分类器作为最优子分类器;
令所述最优子分类器的权重大于其他子分类器的权重;
根据每个子分类器和其对应的权重,确定贝叶斯分类器。
13.一种电子设备,其特征在于,包括:
存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至6任一所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810875847.2A CN109361529B (zh) | 2018-08-03 | 2018-08-03 | 一种终端类型识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810875847.2A CN109361529B (zh) | 2018-08-03 | 2018-08-03 | 一种终端类型识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109361529A true CN109361529A (zh) | 2019-02-19 |
CN109361529B CN109361529B (zh) | 2022-03-18 |
Family
ID=65349815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810875847.2A Active CN109361529B (zh) | 2018-08-03 | 2018-08-03 | 一种终端类型识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109361529B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110009045A (zh) * | 2019-04-09 | 2019-07-12 | 中国联合网络通信集团有限公司 | 物联网终端的识别方法和装置 |
CN110851817A (zh) * | 2019-10-29 | 2020-02-28 | 锐捷网络股份有限公司 | 一种终端类型识别方法及装置 |
CN111432396A (zh) * | 2020-03-09 | 2020-07-17 | 安徽继远软件有限公司 | 保障NB-IoT可靠性的eSIM卡网络的配置方法、系统及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1838832A (zh) * | 2006-04-27 | 2006-09-27 | 中国移动通信集团公司 | 网络侧识别移动终端类型的方法 |
CN101959178A (zh) * | 2010-08-12 | 2011-01-26 | 百度在线网络技术(北京)有限公司 | 一种用于识别无线终端的终端属性的方法与设备 |
US7974475B1 (en) * | 2009-08-20 | 2011-07-05 | Thomas Cecil Minter | Adaptive bayes image correlation |
CN102469435A (zh) * | 2010-11-08 | 2012-05-23 | 中国移动通信集团广东有限公司 | 一种提高移动终端的终端型号识别准确率的方法及装置 |
CN104079680A (zh) * | 2014-06-30 | 2014-10-01 | 珠海市君天电子科技有限公司 | 设备的识别方法和装置 |
CN104699772A (zh) * | 2015-03-05 | 2015-06-10 | 孟海东 | 一种基于云计算的大数据文本分类方法 |
CN105592169A (zh) * | 2014-10-21 | 2016-05-18 | 杭州迪普科技有限公司 | 终端识别方法及装置 |
CN105656683A (zh) * | 2016-02-03 | 2016-06-08 | 北京星网锐捷网络技术有限公司 | 一种终端类型识别方法及装置 |
CN106712986A (zh) * | 2015-07-31 | 2017-05-24 | 深圳触云科技有限公司 | 一种识别智能终端的方法 |
-
2018
- 2018-08-03 CN CN201810875847.2A patent/CN109361529B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1838832A (zh) * | 2006-04-27 | 2006-09-27 | 中国移动通信集团公司 | 网络侧识别移动终端类型的方法 |
US7974475B1 (en) * | 2009-08-20 | 2011-07-05 | Thomas Cecil Minter | Adaptive bayes image correlation |
CN101959178A (zh) * | 2010-08-12 | 2011-01-26 | 百度在线网络技术(北京)有限公司 | 一种用于识别无线终端的终端属性的方法与设备 |
CN102469435A (zh) * | 2010-11-08 | 2012-05-23 | 中国移动通信集团广东有限公司 | 一种提高移动终端的终端型号识别准确率的方法及装置 |
CN104079680A (zh) * | 2014-06-30 | 2014-10-01 | 珠海市君天电子科技有限公司 | 设备的识别方法和装置 |
CN105592169A (zh) * | 2014-10-21 | 2016-05-18 | 杭州迪普科技有限公司 | 终端识别方法及装置 |
CN104699772A (zh) * | 2015-03-05 | 2015-06-10 | 孟海东 | 一种基于云计算的大数据文本分类方法 |
CN106712986A (zh) * | 2015-07-31 | 2017-05-24 | 深圳触云科技有限公司 | 一种识别智能终端的方法 |
CN105656683A (zh) * | 2016-02-03 | 2016-06-08 | 北京星网锐捷网络技术有限公司 | 一种终端类型识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
李静梅 等: "一种文本处理中的朴素贝叶斯分类器", 《哈尔滨工程大学学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110009045A (zh) * | 2019-04-09 | 2019-07-12 | 中国联合网络通信集团有限公司 | 物联网终端的识别方法和装置 |
CN110851817A (zh) * | 2019-10-29 | 2020-02-28 | 锐捷网络股份有限公司 | 一种终端类型识别方法及装置 |
CN111432396A (zh) * | 2020-03-09 | 2020-07-17 | 安徽继远软件有限公司 | 保障NB-IoT可靠性的eSIM卡网络的配置方法、系统及存储介质 |
CN111432396B (zh) * | 2020-03-09 | 2023-02-21 | 安徽继远软件有限公司 | 保障NB-IoT可靠性的eSIM卡网络的配置方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109361529B (zh) | 2022-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110535777A (zh) | 访问请求控制方法、装置、电子设备以及可读存储介质 | |
CN105608179B (zh) | 确定用户标识的关联性的方法和装置 | |
CN108280115B (zh) | 识别用户关系的方法及装置 | |
CN110462604A (zh) | 基于设备使用关联互联网设备的数据处理系统和方法 | |
CN107516090A (zh) | 一体化人脸识别方法和系统 | |
CN109361529A (zh) | 一种终端类型识别方法、装置、电子设备及存储介质 | |
US11483408B2 (en) | Feature-based network embedding | |
CN113360777B (zh) | 内容推荐模型训练方法、内容推荐方法及相关设备 | |
CN108197592A (zh) | 信息获取方法和装置 | |
WO2020257993A1 (zh) | 内容推送方法、装置、服务端及存储介质 | |
US10778665B2 (en) | System and method for matching dynamically validated network data | |
CN103970891A (zh) | 一种基于情境的用户兴趣信息查询方法 | |
CN109783459A (zh) | 从日志中提取数据的方法、装置及计算机可读存储介质 | |
CN108702334B (zh) | 用于针对零费率的网络配置的分布式测试的方法和系统 | |
CN107609487B (zh) | 一种用户头像的生成方法和装置 | |
CN114157710A (zh) | 通信策略配置方法、装置、存储介质及设备 | |
CN105656683A (zh) | 一种终端类型识别方法及装置 | |
CN113763043B (zh) | 广告落地页的展示方法、装置、存储介质及计算机设备 | |
CN116094907B (zh) | 投诉信息的处理方法、装置及存储介质 | |
CN112529027A (zh) | 数据处理方法、客户端、装置及计算机可读存储介质 | |
CN107003930B (zh) | 用户信息记录方法、装置及电子设备 | |
Zhou et al. | User interest acquisition by adding home and work related contexts on mobile big data analysis | |
CN108880870A (zh) | 一种即插即用物联设备的云端扁平化访问与控制方法 | |
CN107920164A (zh) | 应用的排序方法、系统和服务器 | |
CN113971422A (zh) | 样本数据标注系统、方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |