CN109951846B - 无线网络识别方法、装置、存储介质及计算机设备 - Google Patents

无线网络识别方法、装置、存储介质及计算机设备 Download PDF

Info

Publication number
CN109951846B
CN109951846B CN201910228455.1A CN201910228455A CN109951846B CN 109951846 B CN109951846 B CN 109951846B CN 201910228455 A CN201910228455 A CN 201910228455A CN 109951846 B CN109951846 B CN 109951846B
Authority
CN
China
Prior art keywords
network
wireless network
word
vector
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910228455.1A
Other languages
English (en)
Other versions
CN109951846A (zh
Inventor
段永耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910228455.1A priority Critical patent/CN109951846B/zh
Publication of CN109951846A publication Critical patent/CN109951846A/zh
Application granted granted Critical
Publication of CN109951846B publication Critical patent/CN109951846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本申请提供的一种无线网络识别方法、装置、存储介质及计算机设备,对于无线网络管理应用搜索到附近的无线网络后,可以将其作为待识别无线网络,并由待识别无线网络的网络名称的词向量,生成词向量矩阵后,将该词向量矩阵输入网络类型识别模型,以快速得到该待识别无线网络是否为私人无线网络的识别结果,以便据此拒绝对私人无线网络的共享,提高了私人无线网络合法使用者的安全。而且,在训练网络类型识别模型时,采用具有不同尺寸的卷积核的卷积神经网络,对样本网络名称进行训练,提高了模型输出结果的准确性。

Description

无线网络识别方法、装置、存储介质及计算机设备
技术领域
本申请涉及通信技术领域,具体涉及一种无线网络识别方法、装置、存储介质及计算机设备。
背景技术
随着无线通信技术的发展,无线网络的覆盖范围越来越广泛,如高级宾馆、住宅、飞机场、火车站、公交车以及各种商店等场所,通常会设置wifi热点供用户终端上网使用。
在实际应用中,在用户需要使用无线网络的情况下,可以使用终端中的无线网络管理应用对附件无线网络进行搜索,之后,会将搜索到的各类型的无线网络的网络名称输出,供用户选择一无线网络并输入登录密码,使用该无线网络上网,非常方便,但这种方式并不会对搜索到的各无线网络区分,往往会导致私人无线网络被共享,威胁私人无线网络合法使用者的安全。
发明内容
本申请实施例提供一种无线网络识别方法、装置、存储介质及计算机设备,对于搜索到的各无线网络,将采用卷积神经网络训练而成的网络类型识别模型,对无线网络的网络类型进行自动识别,以避免私人无线网络被共享,提高了私人无线网络合法使用者的安全。
为实现上述目的,本申请实施例提供如下技术方案:
一种无线网络识别方法,所述方法包括:
获取待识别无线网络的网络名称;
获取所述网络名称的词向量,生成词向量矩阵;
将所述词向量矩阵输入网络类型识别模型,得到所述待识别无线网络的识别结果;
其中,所述网络类型识别模型是基于卷积神经网络,对多个无线网络的样本网络名词进行训练得到的,所述卷积神经网络的卷积层由不同尺寸的卷积核构成。
一种无线网络识别装置,所述装置包括:
网络名称获取模块,用于获取待识别无线网络的网络名称;
词向量获取模块,用于获取所述网络名词的词向量,生成词向量矩阵;
网络类型识别模块,用于将所述词向量矩阵输入网络类型识别模型,得到所述待识别无线网络的识别结果;
其中,所述网络类型识别模型是基于卷积神经网络,对多个无线网络的样本网络名词进行训练得到的,所述卷积神经网络的卷积层由不同尺寸的卷积核构成。
一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行,实现如单所述的无线网络识别方法的各步骤。
一种计算机设备,所述计算机设备包括:
通信接口;
存储器,用于存储实现如上所述的无线网络识别方法的程序;
处理器,用于记载并执行所述存储器存储的程序,所述程序用于实现以下步骤:
获取待识别无线网络的网络名称;
获取所述网络名词的词向量,生成词向量矩阵;
将所述词向量矩阵输入网络类型识别模型,得到所述待识别无线网络的识别结果;
其中,所述网络类型识别模型是基于卷积神经网络,对多个无线网络的样本网络名词进行训练得到的,所述卷积神经网络的卷积层由不同尺寸的卷积核构成。
基于上述技术方案,本申请实施例提供的一种无线网络识别方法、装置、存储介质及计算机设备,对于无线网络管理应用搜索到附近的无线网络后,可以将其作为待识别无线网络,并由待识别无线网络的网络名称的词向量,生成词向量矩阵后,将该词向量矩阵输入网络类型识别模型,以快速得到该待识别无线网络是否为私人无线网络的识别结果,以便据此拒绝对私人无线网络的共享,提高了私人无线网络合法使用者的安全。
而且,在训练网络类型识别模型时,采用具有不同尺寸的卷积核的卷积神经网络,对样本网络名称进行训练,提高了模型输出结果的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种无线网络识别系统的结构示意图;
图2为本申请实施例提供的一种无线网络识别方法的流程示意图;
图3为本申请实施例提供的一种无线网络识别方法中,待识别无线网络的词向量及其词向量矩阵的生成过程示意图;
图4为本申请实施例提供的一种无线网络识别方法中,网络类型识别模型的训练过程示意图;
图5为本申请实施例提供的一种无线网络识别方法中,卷积神经网络的计算图;
图6为本申请实施例提供的一种无线网络识别方法中,卷积神经网络的卷积层处理过程的示意图;
图7为本申请实施例提供的一种无线网络识别方法中,卷积神经网络的全连接层处理过程的示意图;
图8为本申请实施例提供的一种无线网络识别方法中,优化网络类型识别模型的效果示意图;
图9为本申请实施例提供的另一种无线网络识别方法的流程示意图;
图10为本申请实施例提供的一种无线网络识别装置的结构示意图;
图11为本申请实施例提供的另一种无线网络识别装置的结构示意图;
图12为本申请实施例提供的一种计算机设备的硬件结构示意图。
具体实施方式
结合上文背景技术部分的分析,为了避免私人wifi热点被共享,可以在识别出私人wifi热点后不显示,如在用户使用终端进行wifi热点搜索,显示搜索到的各WIFI热点名称的情况下,可以对搜索到的各wifi热点进行分类,拒绝对私人wifi热点的显示,此处的私人wifi热点可以指不希望被预设群体外的用户终端使用的wifi热点,通常是家庭wifi热点,但并不局限于此。
对于wifi热点的分类,可以基于wifi热点的名称实现,如wifi的SSID(ServiceSet Identifier,服务集标识符),本申请可以利用文本分类的构思,实现对wifi热点的分类,以精确识别私人wifi热点。
具体的,本申请可以将待分类无线网络的无线网络标识符(如wifi热点的SSID),输入预先训练出的网络类型识别模型,得到待分类无线网络的类型,据此确定该待分类无线网络属于私人无线网络,可以拒绝将该无线网络的名称展示在无线网络搜索界面,进而避免了非法用户对私人无线网络的非法使用,提高了私人无线网络的安全性。
其中,网络类型识别模型可以利用卷积神经网络(ConvolutionalNeuralNetworks,CNN),对样本数据进行训练得到,该CNN是利用了若干卷积核、池化层(poolinglayer)及末端的全连接层组成,与其他类型的神经网络相比,在图像和音频处理方面的输出结果更好,且涉及到的参数较少。
由于无线网络的标识符通常是文本,所以,本申请选用的神经网络具体可以是用于文本分类的卷积神经网络,即TextCNN,本申请对这类神经网络的原理不做详述。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参照图1,为实现本申请提供的无线网络识别方法的系统架构示意图,该系统可以包括终端11、无线网络设备12及服务器13,其中:
终端11可以是用户使用上网的电子设备,如手机、笔记本电脑、iPAD、移动互联网设备、智能手表、智能手环等,该终端其通常具有无线通信模块,以实现与无线网络设备的无线网络连接,根据需要,终端也可以具有其他类型的通信模块,实现其他类型的通信,本申请对终端的通信组件的具体结构不作详述。
无线网络设备12可以是提供无线网络热点的设备,可以通过无线方式与用户的终端连接,以使终端能够通过该无线网络设备访问互联网。本实施例中,该无线网络设备12可以是无线路由器、无线适配器、随身wifi等。
服务器13可以是对终端及无线网络设备进行管理的服务设备,在确定针对某终端搜索到多个无线网络热点的情况下,可以为终端分配无线网络热点,满足该终端的使用者的上文需求。
在本申请实际应用中,终端11中可以安装无线网络管理应用,此时,该服务器13可以是为该无线网络管理应用提供服务,以保证无线网络管理应用的功能能够正常运行,可见,该服务器可以与该无线网络管理应用相匹配,本申请对该无线网络管理应用的类型不做限定。
需要说明,对于上述系统架构的组成,并不局限于上文给出的组成部分,根据需要,还可以包括数据存储设备等,本申请在此不再一一详述。
结合上图1所示的系统架构,参照图2,为本申请实施例提供了一种无线网络识别方法的流程示意图,该方法可以应用于服务侧,即该方法可以由服务器执行实现,具体可以包括但并不局限于以下步骤:
步骤S101,获取待识别无线网络的网络名称;
其中,网络名词可以是待识别无线网络的SSID,通常情况下,其可以由用户自由更改,并显示在无线网络搜索界面中,如“陈记包点”、“shine”等,本申请对无线网络的网络名词的内容,及其设置方式不做详述,本实施例可以使用汉字、英文、符号及组合的方式,得到无线网络的网络名称。
步骤S102,对该网络名词进行分词处理,得到待识别无线网络的词序列;
本实施例中,可以使用hanlp分词工具对网络名词进行处理,得到组成该网络名词的各个词,需要说明的是,对于包含英文和/或符号的网络名词,可以将英文、符号中的一个字符作为一个词,而对于网络名词中的汉字,可以其语义进行分词处理。
以“陈记包点”、“shine”这两个待识别无线网络的网络名词为例进行说明,使用hanlp分词工具对“陈记包点”进行分词处理,可以得到“陈”、“记”、“包点”三个词,按照分词顺序,生成相应的词序列{陈,记,包点};使用hanlp分词工具对“shine”进行分词处理,可以得到“s”、“h”、“i”、“n”、“e”五个词,由此生成的词序列可以为{s,h,i,n,e}。对于由汉字、英文和/或符号组合的网络名词,分词过程类似,本申请不再一一详述。
步骤S103,获取词序列的词向量矩阵;
其中,词向量矩阵的列数不小于词序列的长度,具体数值不做限定,可以通过统计网络名词的词序列的长度确定,如经过统计得知99.9%的词序列的长度不大于24,因此,可以将该预设列数确定为24,但并不局限于该数值。
本实施例中,可以使用Random_Normal的方式,随机初始化词典,以得到词序列中的各元素的词向量,进而构建具有预设列数的词向量矩阵,本申请对获取词序列的词向量的实现方法,以及由词向量构建词向量矩阵的方法均不作限定。
具体的,本实施例可以先获取词序列中每个词的one-hot向量,再采用Random_Normal方式,将每个one-hot向量映射成一个稠密向量,具体实现过程本实施例不作详述。
其中,one-hot是一种数据预处理技术,即在机器学习中,在处理类别性数据时,将索引的数字转换成一个维度等于索引总数的向量,向量中元素的值只有一个1,其余为0,为1的元素的位置和索引一一对应。
稠密向量是相对于one-hot处理之后得到的稀疏向量(即one-hot向量)来说的,稀疏向量是指整个向量的维度较高,但大多数元素都是0;稠密向量与其相反,大多数元素都非0。本实施例可以采用Embedding技术实现稀疏向量向稠密向量的转换。
Embedding技术就是通过一层神经网络,将one-hot的编码的词投影到低维空间,获得相比于one-hot更加稠密的向量,经过训练后,embedding的编码可以通过欧式或余弦距离等相似度算法,得到词之间的相似度,如目前常用的word2vector。
而本实施例则采用了Random_Normal这一种随机初始化Embedding技术,将one-hot的编码的词映射成每个维度都是正态分布的稠密向量,即词向量,具体实现过程不作详述。
举例说明,若用来获取词向量的词典大小为4000,每个向量为24维,那么该词典包含的元素共有96000个,对其随机初始化之后可以不参与后续模型训练,因为在网络名词数量不够的情况下,词典中的所有元素参与模型训练,将无法训练出效果较高的向量化隐藏层。
以“陈记包点”这一网络名词为例,其对应的词序列为{陈,记,包点},通过查询预设词典,获取该词序列中的三个元素,即陈、记和包点各自对应的向量,记为这三个元素各自的词向量,如词典中的第2个向量E1对应“陈”,第270个向量E2对应“记”,第400个向量E3对应“包点”,可以将词典中的这三个向量作为该词序列中对应元素的词向量。
之后,本实施例可以采用补零的方式,由得到的词向量生成具有预设列举的词向量矩阵,继上段举例,参照图3,由词序列得到的词向量E1、E2和E3构成矩阵的前三列,后面21列可以补零向量,即由0组成的向量。对于其他内容的词序列,也可以按照上文描述的方式,获取对应的词向量矩阵。
步骤S104,将词向量矩阵输入网络类型识别模型,得到待识别无线网络的识别结果;
其中,该网络类型识别模型可以基于卷积神经网络,对样本无线网络的样本网络名称进行训练得到,且该卷积神经网络具有多种尺寸的卷积核,各尺寸的卷积核数量可以相同,通常情况下,每种尺寸的卷积核的数量为多个,本申请对卷积神经网络包含的卷积核数量,以及各卷积核的具体尺寸不做限定。
可选的,本申请可以通过统计大量样本网络名称包含的词的平均值,来确定该卷积神经网络需要包含哪些尺寸的卷积核,以便使用不大于该平均值的各尺寸的卷积核进行卷积处理,这样,将词向量矩阵输入网络类型识别模型后,可以同时使用多种尺寸的卷积核,对词向量进行卷积处理,以使得卷积层输出的一维向量包含了不同尺寸卷积核对词向量的卷积结果,相对于采用一种尺寸的卷积核(尤其是采用尺寸不合适的卷积核)对词向量进行卷积处理,提高了网络类型识别模型输出结果的准确率及效率。
步骤S105,若该识别结果为待识别无线网络属于预定类型的无线网络,屏蔽对该待识别无线网络的访问请求。
本实施例实际应用中,如上述分析,预定类型的无线网络是指不希望被公开的无线网络,即私人无线网络,为了避免这类无线网络被其他用户(不允许使用该无线网络的用户)使用,本申请可以其他用户在终端上搜索附近无线网络的情况下,若服务器搜索到该预定类型的无线网络,会拒绝其他用户对该预定类型的无线网络的访问请求,避免了该预定类型的无线网络被共享,提高了预定类型的无线网络的安全性。
可选的,本申请按照上述方式确定待识别无线网络的网络类型,即确定待识别无线网络是否为私人无线网络,还可以具体对该待识别无线网络的安全机制进行调整,对于私人无线网络,可以提高其安全机制的安全级别,具体实现方式不做限定,比如隐藏该待识别无线网络的网络名称、对该待识别无线网络的登录密码进行二次加密,如其他用户希望登录该待识别无线网络时,需要创建该待识别无线网络的用户同意等等,并不局限于上文实施例步骤S105描述的处理方式。
下面将对上述网络类型识别模型的训练过程进行说明,但并不局限于本实施例描述的模型训练过程,参照图4,为本申请实施例提供的无线网络识别方法中,网络类型识别模型的训练过程的流程示意图,本实施例主要对该模型训练过程进行描述,关于对网络类型识别模型的应用过程,可以参照上述实施例的描述,如图4所示,训练过程可以包括:
步骤S201,获取预设时间段内多个无线网络的历史状态数据;
其中,无线网络的历史状态数据可以表明该无线网络预设时间段内是否被终端连接,被多少终端连接以及终端的连接时间等,本申请对该历史状态数据的内容不做限定。另外,上述预设时间段可以是最近一个或多个月等,本申请对其具体数值不做限定。
需要说明,由于本实施例需要训练的网络类型识别模型是用来识别私人无线网络,而私人无线网络的网络名词往往是非默认名称,即用户通常会更改私人无线网络的网络模型,所以,本实施例可以对具有非默认网络名称的无线网络,获取预设时间段内的运行状态数据。
步骤S202,利用该历史状态数据,确定多个无线网络中的训练样本;
本实施例中,可以将最近预设时间段内活跃n天以上,同时连接中断少于m个的非默认名称的无线网络,确定为正样本;将最近预设时间段内历史连接终端多于p个的非默认名称的无线网络,确定为负样本。其中,n可以大于预设时间段的三分之一时间,如预设时间段为3个月,n可以为45,m可以是比较小的数值,如15;p可以是大于m的较大的数值,如100,本申请对n、m、p的具体数值不做限定。
基于上文对正负样本的定义,可以对获取的无线网络的历史状态数据进行分析,从而确定这些无线网络中,哪些可以作为正样本,哪些可以作为负样本,进而由正负样本构成模型训练所需的训练样本。
步骤S203,对训练样本的网络名词进行预处理,得到词向量矩阵;
其中,关于网络名词的预处理过程可以参照上文实施例步骤S102和步骤S103的描述,如对网络名词进行分词处理后,对得到的词序列进行Embedding处理,得到训练样本的网络名称对应的词向量矩阵,该词向量矩阵包含了训练样本的网络名称对应的词向量。
步骤S204,基于各训练样本的网络名称包含的平均词数量,确定卷积神经网络中卷积核的多个尺寸;
可选的,本申请通过统计大量网络名称包含的词数量,对统计的词数量求平均值,得到平均词数量,之后,再确定模型训练所需要哪几种尺寸的卷积核,需要卷积核的尺寸不大于平均词数量,若平均词数据为6,那么,卷积核的尺寸可以包括2、3、4、5和6,这种情况下,卷积神经网络的卷积层,需要具有5种尺寸的卷积核,每一种尺寸的卷积核的数量相同,本实施例以设置32个卷积核为例进行说明。
参照图5所示的卷积神经网络的计算图,若将卷积ID(ConvID)分别记为conv1d_1、conv1d_2、conv1d_3、conv1d_4、conv1d_5,其分别对应了上述举例的五种尺寸的卷积核,且每一种尺寸的卷积核的数量为32,但并不局限于图5所示的卷积层架构。
步骤S205,利用不同尺寸的卷积核对词向量矩阵进行卷积处理,得到不同尺寸卷积核分别对应的、长度等于同一尺寸卷积核数量的一维向量;
仍以上述实施例中的“陈记包点”这一网络名称为例,其得到的24列词向量构成的词向量矩阵中,前三列词向量E1、E2和E3是该网络名词实际对应的词向量,后21个词向量是零向量。若对得到的词向量矩阵进行尺寸为3,步长为1的一堆卷积,即对词向量矩阵中的每三列进行一次卷积,再向后进一列进行一次卷积,依次推进,每次卷积将输出一个值,利用一个卷积核进行多次卷积,可以得到22个值,且该22个值中的第一个值是由E1、E2和E3进行卷积得到的,可以将其记为C1,其他21个值需要使用零向量进行卷积得到的,因此,对于一个卷积核(本实施例以尺寸为3的卷积核为例进行说明的)来说,词向量矩阵进行多次卷积后,就可以得到长度为22的一维向量,对于同一尺寸的32个卷积核,按照这种方式就可以得到32个长度相同的一维向量。
参照图6所示卷积层的处理过程,按照上述尺寸为3的32个卷积核对词向量矩阵的处理过程,对于其他尺寸的卷积核,也可以按照上述方式对词向量矩阵进行卷积处理,可以得到每个尺寸的卷积核对应的32个相应长度的一维向量,如图5中(None,23,32)、(None,22,32)、(None,21,32)、(None,20,32)、(None,19,32),具体过程本实施例不再一一详述。
需要说明,对于本申请的卷积神经网络的卷积层可以采用incepion网络结构,且在卷积运算过程中,对于每次卷积结果可以采用MaxPoolling运算进行处理,选择本次卷积结果中的最大值作为本次卷积结果,以构成如上述长度为22的一维向量。
其中,incepion网络是一种通过使用多种尺寸的卷积核,并且把卷积的结果拼起来,都参与模型训练,让模型自动选择卷积尺寸的神经网络结构,避免人工调节引入偏差。
步骤S206,对得到的一维向量进行拼接,得到网络名称的编码向量;
参照上图5,每种尺寸的卷积核对同一词向量矩阵进行卷积处理,都可以得到32个一维向量,区别在于不同尺寸的卷积核得到的一维向量的长度不同,在卷积步长相同的情况下,向量长度取决于卷积核的尺寸。
本实施例可以将得到各一维向量展开后拼接在一起,得到一个向量,仍以上文卷积示例进行说明,5种尺寸的卷积核,得到32*5个一维向量,经过拼接处理后可以得到一个160维向量,如图5所示的(None,160),。本实施例可以将该160维向量作为对网络名称编码,得到的编码向量,用以后续全连接层计算。
步骤S207,利用多种激活函数,对编码向量进行训练,得到网络类型识别模型。
可选的,参照图7所示的全连接层的处理流程示意图,为了避免过拟合,本实施例可以在将编码向量输入全连接层之前进行drop-out运算,并在不同网络层使用不同的激活函数进行处理,本申请对该激活函数的内容不做限定。
如图7所示,第一层网络可以使用relu激活函数,来加快训练,第二层网络可以使用sigmoid激活函数,本实施例对这两种激活函数的工作原理不做详述。
进一步地,为了避免过拟合,本实施例还可以在不同网络层之间,对上一层网络的输出结果进行一次drop-out运算,
其中,drop-out运算是一种通过在深度网络训练的过程中,随机丢弃神经元来避免模型过拟合的技术,该技术使得在每次迭代中,只有部分神经元在发挥作用,从而使模型的网络结构都变得简单,并且由于发挥作用的神经元是随机挑选的,进一步避免了对特定神经元的依赖,从而抑制了过拟合。
需要说明,为了避免过拟合问题发生,本申请还可以采用其他方式实现,如L1和L2正则等,并不局限于上文给出的drop-out运算。
综上,本实施例采用具有多种尺寸的卷积核的卷积神经网络,对大量非默认名称的无线网络的网络名词进行训练,相对于具有一种尺寸卷积核的卷积神经网络的模型训练方法,提高了训练所得网络类型识别模型的准确性。
优选的,本申请使用inception网络,实现对卷积神经网络卷积核的不同尺寸的自动选择,无需人工选择卷积核尺寸,使得卷积神经网络在文本分类中的应用更加便捷,提高了调参效率,进而提高了网络类型识别模型的训练效率及准确性。
可选的,为了优化网络类型识别模型,进一步提高模型输出结果的准确性,本申请还可以在上述模型训练过程中,使用二分类交叉熵作为损失函数,并基于该损失函数,对计算得到的训练样本的识别结果进行网络训练,得到网络类型识别模型,本申请对这种损失函数在模型训练过程中具体使用方法不做详述。
在上述各实施例的基础上,本申请还可以在模型训练过程中,使用adam优化算法和/或学习率衰减技术,以加快模型收敛速度,提高模型训练效率。
其中,学习率衰减技术是指:在整个模型训练过程中,保持学习率不变,模型训练到一定程度后,通常会在某个效果附件盘旋,收敛速度变慢,难以获得最好的效果,因此,提出动态改变学习率,使得学习率随着迭代周期逐渐减小,使最后的模型在最好效果的附近非常小的范围内盘旋,以得到更让人满意的结果,如图8所示的学习率衰减示意图。
结合上文实施例描述的网络类型识别模型训练过程,参照图9所示的无线网络识别方法的流程示意图,获得待识别无线网络的网络名称SSID后,先对其进行文本预处理,得到相应的词向量矩阵,预处理过程可以参照上文实施例相应步骤的描述,之后,将词向量矩阵输入网络类型识别模型,以确定该待识别无线网络是否为私人无线网络。
其中,基于上文描述的网络类型识别模型训练过程,将词向量矩阵输入网络类型识别模型后,先由卷积层的多个不同尺寸的卷积核,对词向量矩阵中的多个词向量进行卷积处理,处理过程可以参照上文模型训练过程中的卷积处理过程,最终可以得到多维向量(如上述举例的160维向量),再经全连接层处理,得到一个输出值。
本申请可以预先设置一阈值,若输出值大于该阈值,可以认为待识别无线网络为私人无线网络(如图9中的私人WIFI),不允许其他用户随意使用;反之,可以认为该待识别无线网络不是私人WIFI,可以展示给其他用户,以供其他用户终端登录上网。
基于此,在得到输出值后,可以将其与阈值进行比较,得到待识别无线网络的识别结果,即该待识别无线网络是否为私人无线网络,之后,可以根据具体应用场景的需要,对该待识别无线网络进行后续处理,如将识别结果发送至无线网络管理应用,以使无线网络管理应用据此确定是否响应对该待识别无线网络的访问请求,如若为私人无线网络,将拒绝对其访问请求,从而避免了私人无线网络被共享,提高了私人无线网络的安全性,但并不局限于这一应用场景。
参照图10,为本申请实施例提供的一种无线网络识别装置的结构示意图,该装置可以包括:
网络名称获取模块21,用于获取待识别无线网络的网络名称;
词向量获取模块22,用于获取所述网络名词的词向量,生成词向量矩阵;
可选的,该词向量获取模块22可以包括:
分词处理单元,用于对所述网络名称进行分词处理,得到词序列;
词向量获取单元,用于获取所述词序列包含的各元素的词向量;
矩阵生成单元,用于采用补零向量的方式,利用获取的词向量生成词向量矩阵,所述词向量矩阵的列数不小于所述预定无线网络的网络名词包含的词数量。
网络类型识别模块23,用于将所述词向量矩阵输入网络类型识别模型,得到所述待识别无线网络的识别结果;
其中,网络类型识别模型23是基于卷积神经网络,对多个无线网络的样本网络名词进行训练得到的,所述卷积神经网络的卷积层由不同尺寸的卷积核构成。
可选的,在上述实施例的基础上,该装置还可以包括:
请求屏蔽模块,用于在识别结果为所述待识别无线网络为私人无线网络的情况下,屏蔽对所述待识别无线网络的访问请求;和/或;
数据发送模块,用于将所述待识别无线网络的识别结果发送至客户端,以使所述客户端基于所述识别结果,确定是否输出所述待识别无线网络的网络名称。
作为本申请另一实施例,如图11所示,为了实现模型训练,该装置还可以包括:
数据获取模块24,用于获取预设时间段内多个无线网络的历史状态数据;
训练样本确定模块25,用于依据所述历史状态数据,确定所述多个无线网络中的训练样本;
预处理模块26,用于对所述训练样本的网络名称进行预处理,得到词向量矩阵;
卷积核尺寸确定模块27,用于依据所述训练样本的网络名词包含词的平均数量,确定卷积神经网络中卷积核的多个尺寸;
可选的,该卷积核尺寸确定模块27具体可以用于获取不小于所述平均数量且大于1的各整数,并将所述各整数作为卷积核的不同尺寸。
卷积处理模块28,用于利用不同尺寸的卷积核分别对所述词向量矩阵进行卷积处理,得到所述不同尺寸的卷积核分别对应的一维向量,所述一维向量的长度等于同一尺寸的卷积核的数量,且不同尺寸卷积核的数量相同;
向量拼接模块29,用于对得到的多个一维向量进行拼接,得到所述训练样本的网络名称的编码向量;
模型训练模块210,用于利用多种激活函数,对所述编码向量进行训练,得到所述网络类型识别模型。
进一步地,为了提高网络类型识别模型的准确率,该装置还可以包括:
优化模块,用于利用损失函数和/或学习率衰减算法和/或adam优化算法,对所述网络类型识别模型进行优化,但并不局限于本实施例列举的优化方式,具体模型优化过程,可以基于这些优化算法的原理确定,本申请不再一一详述。
基于上述实施例,网络类型识别模块23可以包括:
分值确定单元,用于将所述词向量矩阵输入网络类型识别模型,输出所述待识别无线网络的分值;
比较单元,用于将所述分值与阈值进行比较;
识别结果获取单元,用于依据比较结果,得到所述待识别无线网络的识别结果。
本申请还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器加载并执行,实现上述方法实施例描述的无线网络识别方法的各步骤,具体实现过程可以参照上述方法实施例的描述,本实施例不再赘述。
参照图12,为本申请实施例提供的一种计算机设备的硬件结构示意图,该计算机设备可以是服务器,如图12所示,该计算机设备的硬件结构可以包括:通信接口31、存储器32和处理器33;
在本申请实施例中,通信接口31、存储器32、处理器33可以通过通信总线实现相互间的通信,且该通信接口31、存储器32、处理器33及通信总线的数量可以为至少一个。
可选的,通信接口31可以为通信模块的接口,如GSM模块的接口;
处理器33可能是一个中央处理器CPU,或者是特定集成电路ASIC
(Application Specific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。
存储器32可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,存储器32存储有计算机程序,处理器33调用存储器32所存储的计算机程序,以实现上述应用于计算机设备的无线网络识别方法的各步骤,具体实现过程可以参照上述方法实施例的描述,本实施例不做赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、计算机设备而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的核心思想或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种无线网络识别方法,其特征在于,所述方法包括:
获取待识别无线网络的网络名称,所述待识别无线网络包括私人无线网络和非私人无线网络;
对所述网络名称进行分词处理,得到词序列;
获取词序列中每个词的稀疏向量,所述稀疏向量中元素值只有一个1,其余均为0;
采用随机正态方式,将每个稀疏向量映射成一个稠密向量,得到所述词序列包含的各元素的词向量;
采用补零向量的方式,利用获取的词向量生成词向量矩阵,所述词向量矩阵的列数不小于预定无线网络的网络名词包含的词数量,所述零向量是由0组成的向量;
将所述词向量矩阵输入网络类型识别模型,同时使用所述网络类型识别模型中不同尺寸的卷积核对词向量进行卷积处理,得到所述待识别无线网络的识别结果;
如果所述识别结果表征所述待识别无线网络是私人无线网络,拒绝将所述私人无线网络的网络名称展示在无线网络搜索界面;
其中,所述网络类型识别模型是基于卷积神经网络,对多个无线网络的样本网络名词进行训练得到的,所述卷积神经网络的卷积层由不同尺寸的卷积核构成,所述卷积层输出的一维向量包含了不同尺寸卷积核对输入的词向量的卷积结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述识别结果为所述待识别无线网络为私人无线网络,屏蔽对所述待识别无线网络的访问请求;和/或;
将所述待识别无线网络的识别结果发送至客户端,以使所述客户端基于所述识别结果,确定是否输出所述待识别无线网络的网络名称。
3.根据权利要求1~2任一项所述的方法,其特征在于,所述网络类型识别模型的训练过程包括:
获取预设时间段内多个无线网络的历史状态数据;
依据所述历史状态数据,确定所述多个无线网络中的训练样本;
对所述训练样本的网络名称进行预处理,得到词向量矩阵;
依据所述训练样本的网络名词包含词的平均数量,确定卷积神经网络中卷积核的多个尺寸;
利用不同尺寸的卷积核分别对所述词向量矩阵进行卷积处理,得到所述不同尺寸的卷积核分别对应的一维向量,所述一维向量的长度等于同一尺寸的卷积核的数量,且不同尺寸卷积核的数量相同;
对得到的多个一维向量进行拼接,得到所述训练样本的网络名称的编码向量;
利用多种激活函数,对所述编码向量进行训练,得到所述网络类型识别模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述词向量矩阵输入网络类型识别模型,得到所述待识别无线网络的识别结果,包括:
将所述词向量矩阵输入网络类型识别模型,输出所述待识别无线网络的分值;
将所述分值与阈值进行比较;
依据比较结果,得到所述待识别无线网络的识别结果,所述识别结果表明所述待识别对象是否为私人无线网络。
5.根据权利要求3所述的方法,其特征在于,所述依据所述训练样本的网络名词包含词的平均数量,确定卷积神经网络中卷积核的多个尺寸,包括:
获取不小于所述平均数量且大于1的各整数,并将所述各整数作为卷积核的不同尺寸。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
利用损失函数和/或学习率衰减算法和/或adam优化算法,对所述网络类型识别模型进行优化。
7.一种无线网络识别装置,其特征在于,所述装置包括:
网络名称获取模块,用于获取待识别无线网络的网络名称,所述待识别无线网络包括私人无线网络和非私人无线网络;
词向量获取模块,用于对所述网络名称进行分词处理,得到词序列;获取词序列中每个词的稀疏向量,所述稀疏向量中元素值只有一个1,其余均为0;采用随机正态方式,将每个稀疏向量映射成一个稠密向量,得到所述词序列包含的各元素的词向量;采用补零向量的方式,利用获取的词向量生成词向量矩阵,所述词向量矩阵的列数不小于预定无线网络的网络名词包含的词数量,所述零向量是由0组成的向量;
网络类型识别模块,用于将所述词向量矩阵输入网络类型识别模型,同时使用所述网络类型识别模型中不同尺寸的卷积核对词向量进行卷积处理,得到所述待识别无线网络的识别结果;
如果所述识别结果表征所述待识别无线网络是私人无线网络,拒绝将所述私人无线网络的网络名称展示在无线网络搜索界面;
其中,所述网络类型识别模型是基于卷积神经网络,对多个无线网络的样本网络名词进行训练得到的,所述卷积神经网络的卷积层由不同尺寸的卷积核构成,所述卷积层输出的一维向量包含了不同尺寸卷积核对输入的词向量的卷积结果。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行,实现如权利要求1-6任意一项所述的无线网络识别方法的各步骤。
9.一种计算机设备,其特征在于,所述计算机设备包括:
通信接口;
存储器,用于存储实现如权利要求1-6任意一项所述的无线网络识别方法的程序;
处理器,用于记载并执行所述存储器存储的程序,所述程序用于实现以下步骤:
获取待识别无线网络的网络名称,所述待识别无线网络包括私人无线网络和非私人无线网络;
对所述网络名称进行分词处理,得到词序列;
获取词序列中每个词的稀疏向量,所述稀疏向量中元素值只有一个1,其余均为0;
采用随机正态方式,将每个稀疏向量映射成一个稠密向量,得到所述词序列包含的各元素的词向量;
采用补零向量的方式,利用获取的词向量生成词向量矩阵,所述词向量矩阵的列数不小于所述预定无线网络的网络名词包含的词数量,所述零向量是由0组成的向量;
将所述词向量矩阵输入网络类型识别模型,同时使用所述网络类型识别模型中不同尺寸的卷积核对词向量进行卷积处理,得到所述待识别无线网络的识别结果;
如果所述识别结果表征所述待识别无线网络是私人无线网络,拒绝将所述私人无线网络的网络名称展示在无线网络搜索界面;
其中,所述网络类型识别模型是基于卷积神经网络,对多个无线网络的样本网络名词进行训练得到的,所述卷积神经网络的卷积层由不同尺寸的卷积核构成,所述卷积层输出的一维向量包含了不同尺寸卷积核对输入的词向量的卷积结果。
CN201910228455.1A 2019-03-25 2019-03-25 无线网络识别方法、装置、存储介质及计算机设备 Active CN109951846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910228455.1A CN109951846B (zh) 2019-03-25 2019-03-25 无线网络识别方法、装置、存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910228455.1A CN109951846B (zh) 2019-03-25 2019-03-25 无线网络识别方法、装置、存储介质及计算机设备

Publications (2)

Publication Number Publication Date
CN109951846A CN109951846A (zh) 2019-06-28
CN109951846B true CN109951846B (zh) 2020-10-27

Family

ID=67011047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910228455.1A Active CN109951846B (zh) 2019-03-25 2019-03-25 无线网络识别方法、装置、存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN109951846B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110353693A (zh) * 2019-07-09 2019-10-22 中国石油大学(华东) 一种基于WiFi的手写字母识别方法及系统
CN110636445B (zh) * 2019-10-16 2022-09-16 腾讯科技(深圳)有限公司 基于wifi的室内定位方法、装置、设备及介质
CN114207605A (zh) * 2019-10-31 2022-03-18 深圳市欢太科技有限公司 一种文本分类方法、装置、电子设备及存储介质
CN111091489B (zh) * 2019-11-01 2024-05-07 平安科技(深圳)有限公司 图片优化方法、装置、电子设备及存储介质
CN111274216B (zh) * 2020-01-09 2023-05-23 腾讯科技(深圳)有限公司 无线局域网的识别方法、识别装置、存储介质及电子设备
CN112135334B (zh) * 2020-10-27 2023-07-14 上海连尚网络科技有限公司 一种用于确定无线接入点的热点类型的方法与设备
CN114269001A (zh) * 2021-12-20 2022-04-01 北京达佳互联信息技术有限公司 网络热点类型识别方法和网络热点识别模型训练方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016192081A1 (en) * 2015-06-04 2016-12-08 Hewlett-Packard Development Company, L.P. Enable access point availability prediction
CN106714225A (zh) * 2016-12-29 2017-05-24 北京酷云互动科技有限公司 网络设备的识别方法及其系统、智能终端
CN109429229B (zh) * 2017-09-05 2021-06-01 腾讯科技(深圳)有限公司 获取网络接入信息的方法、装置及计算机可读存储介质
CN108112026B (zh) * 2017-12-13 2021-10-22 北京奇虎科技有限公司 WiFi识别方法及装置
CN109214333A (zh) * 2018-08-31 2019-01-15 厦门中控智慧信息技术有限公司 卷积神经网络结构、人脸属性识别方法、装置及终端设备

Also Published As

Publication number Publication date
CN109951846A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109951846B (zh) 无线网络识别方法、装置、存储介质及计算机设备
US11227118B2 (en) Methods, devices, and systems for constructing intelligent knowledge base
CN110636445B (zh) 基于wifi的室内定位方法、装置、设备及介质
CN107240029B (zh) 一种数据处理方法及装置
CN107025216A (zh) 句子提取方法及系统
CN110569354B (zh) 弹幕情感分析方法及装置
CN113379176B (zh) 电信网络异常数据检测方法、装置、设备和可读存储介质
US11301556B2 (en) Verification method and device
CN111182332B (zh) 视频处理方法、装置、服务器及存储介质
CN112214677B (zh) 一种兴趣点推荐方法、装置、电子设备及存储介质
CN112749280A (zh) 网络舆情的分类方法、装置、电子装置和存储介质
CN110609958A (zh) 数据推送方法、装置、电子设备及存储介质
CN111159404A (zh) 文本的分类方法及装置
CN110807476B (zh) 一种密码安全等级分类方法、装置及电子设备
CN103914479B (zh) 资源请求的匹配方法和装置
CN111222005A (zh) 声纹数据重排序方法、装置、电子设备及存储介质
CN110162769B (zh) 文本主题输出方法和装置、存储介质及电子装置
CN112973122A (zh) 游戏角色上妆方法、装置及电子设备
US20230104345A1 (en) Image attack detection method and apparatus, and image attack detection model training method and apparatus
CN115129976B (zh) 一种资源召回方法、装置、设备及存储介质
CN113098974B (zh) 一种确定人口数量的方法、服务器及存储介质
CN115937574A (zh) 敏感图片检测方法、装置、存储介质及终端
KR102060110B1 (ko) 컨텐츠에 포함되는 객체를 분류하는 방법, 장치 및 컴퓨터 프로그램
CN113869041A (zh) 关键词组合提取方法、装置和电子设备
CN111191675A (zh) 行人属性识别模型实现方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant