CN112135334B - 一种用于确定无线接入点的热点类型的方法与设备 - Google Patents

一种用于确定无线接入点的热点类型的方法与设备 Download PDF

Info

Publication number
CN112135334B
CN112135334B CN202011162754.9A CN202011162754A CN112135334B CN 112135334 B CN112135334 B CN 112135334B CN 202011162754 A CN202011162754 A CN 202011162754A CN 112135334 B CN112135334 B CN 112135334B
Authority
CN
China
Prior art keywords
information
identified
hotspot
feature
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011162754.9A
Other languages
English (en)
Other versions
CN112135334A (zh
Inventor
徐伟
罗琨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Lianshang Network Technology Co Ltd
Original Assignee
Shanghai Lianshang Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Lianshang Network Technology Co Ltd filed Critical Shanghai Lianshang Network Technology Co Ltd
Priority to CN202011162754.9A priority Critical patent/CN112135334B/zh
Publication of CN112135334A publication Critical patent/CN112135334A/zh
Application granted granted Critical
Publication of CN112135334B publication Critical patent/CN112135334B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/16Discovering, processing access restriction or access information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请的目的是提供一种用于确定无线接入点的热点类型的方法与设备,该方法包括:获取待识别热点的特征向量以及基本特征信息;将所述特征向量以及所述基本特征信息组合生成多维特征信息;将所述多维特征信息输入多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。通过所述多分类模型的输出结果更加准确,由此得到的所述待识别热点的热点类型也就更加准确。

Description

一种用于确定无线接入点的热点类型的方法与设备
技术领域
本申请涉及通信领域,尤其涉及一种用于确定无线接入点的热点类型的技术。
背景技术
随着时代的发展,网络已经成为人们日常生活中不可缺少的一部分。无论人们在日常商务办公,还是在购物、消费、直播等过程中,都离不开无线热点(WiFi)的使用。
现如今人们接收和传递信息的方式更加多元化,同时在工作、学习、娱乐消费等场景下,用户连接无线热点的类型也越来越广泛。比如用户可以在家庭中使用个人的家庭热点,也可以在办公时使用公司的热点,另外在商场、超市、餐饮店等公共场合还可以使用公共热点等。因为无线热点(WiFi)的类别很多,诸如钓鱼和欺诈热点事件时有发生,如何更安全和高效地使用网络是用户的众多诉求之一,其中热点类型识别即是基础也是核心。
发明内容
本申请的一个目的是提供一种用于确定无线接入点的热点类型的方法与设备。
根据本申请的一个方面,提供了一种用于确定无线接入点的热点类型的方法,该方法包括:
获取待识别热点的特征向量以及基本特征信息;
将所述特征向量以及所述基本特征信息组合生成多维特征信息;
将所述多维特征信息输入多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。
根据本申请的一个方面,提供了一种用于确定无线接入点的热点类型的设备,该设备包括:
一一模块,用于获取待识别热点的特征向量以及基本特征信息;
一二模块,用于将所述特征向量以及所述基本特征信息组合生成多维特征信息;
一三模块,用于将所述多维特征信息输入多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。
根据本申请的一个方面,提供了一种用于确定无线接入点的热点类型的设备,其中,该设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上所述任一方法的操作。
根据本申请的一个方面,提供了一种存储指令的计算机可读介质,所述指令在被执行时使得系统进行如上所述任一方法的操作。
与现有技术相比,本申请通过获取待识别热点的特征向量以及基本特征信息,将所述特征向量以及所述基本特征信息组合生成多维特征信息,通过将所述多维特征信息输入多分类模型中,根据输出结果确定所述待识别热点的热点类型。通过所述基本特征信息反映所述待识别热点的特征属性,当所述待识别热点存在目标数量的目标关联热点时,通过所述特征向量表征所述待识别热点与其对应的目标数量的目标关联热点之间内在的一些属性特点。这样的多维度特征组合,特征信息更全面,作为后续热点分类的输入特征,能更精确描绘出热点的特点属性。并且,所述多分类模型是通过机器学习的方式由多个训练样本训练构建而成的,因此,所述多分类模型的输出结果更加准确,由此得到的所述待识别热点的热点类型也就更加准确。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个实施例的一种用于确定无线接入点的热点类型的方法流程图;
图2示出根据本申请一个实施例的一种用于确定无线接入点的热点类型的网络设备的设备结构图;
图3示出根据本申请一个实施例的一种多分类模型的结构示意图;
图4示出根据本申请一个实施例的一种特征向量模型的结构示意图;
图5示出根据本申请另一个实施例的一种用于确定无线接入点的热点类型的方法流程图;
图6示出可被用于实施本申请中所述的各个实施例的示例性系统。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如,中央处理器(Central Processing Unit,CPU))、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(Flash Memory)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-Change Memory,PCM)、可编程随机存取存储器(Programmable Random Access Memory,PRAM)、静态随机存取存储器(Static Random-Access Memory,SRAM)、动态随机存取存储器(Dynamic Random AccessMemory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Versatile Disc,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本申请所指设备包括但不限于终端、网络设备、或终端与网络设备通过网络相集成所构成的设备。所述终端包括但不限于任何一种可与用户进行人机交互(例如通过触摸板进行人机交互)的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作系统,如Android操作系统、iOS操作系统等。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑器件(Programmable Logic Device,PLD)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)、嵌入式设备等。所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。优选地,所述设备还可以是运行于所述终端、网络设备、或终端与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的程序。
当然,本领域技术人员应能理解上述设备仅为举例,其他现有的或今后可能出现的设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
在本申请的描述中,“多个”的含义是两个或者更多,除非另有明确具体的限定。
在此,本申请所述的“热点类型”包括但不限于家庭热点、商业热点(例如,餐饮美食、生活服务、宾馆酒店等)、公共热点(例如,医疗健康、文化教育等)等。从机器学习的角度来看,热点类型的识别属于多分类问题,本申请旨在借助机器学习及NLP(NaturalLanguage Processing)自然语言处理等技术,提出了一种用于确定热点类型的方法。
图1示出了根据本申请一个实施例的一种用于确定无线接入点的热点类型的方法流程图,该方法包括步骤S11、步骤S12以及步骤S13。在步骤S11中,网络设备获取待识别热点的特征向量以及基本特征信息。在步骤S12中,网络设备将所述特征向量以及所述基本特征信息组合生成多维特征信息。在步骤S13中,网络设备将所述多维特征信息输入多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。
具体而言,在步骤S11中,网络设备获取待识别热点的特征向量以及基本特征信息。在一些实施例中,所述特征向量用于表征所述待识别热点内在的一些属性特点。在一些实施例中,所述待识别热点存在目标数量的目标关联热点,所述特征向量是基于所述待识别热点以及该待识别热点的目标关联热点获取的;在另一些实施例中,所述待识别热点不存在目标数量的目标关联热点,将固定特征向量作为所述待识别热点的特征向量。在一些实施例中,所述基本特征信息是从与所述待识别热点相关的多个行为特征信息中提取获得的,例如,所述基本特征信息包括但不限于所述待识别热点近3天、近一周等的热点连接次数、热点连接设备数、热点连接城市信息、关联热点的个数等。
在步骤S12中,网络设备将所述特征向量以及所述基本特征信息组合生成多维特征信息。在一些实施例中,所述网络设备将所述特征向量以及所述基本特征信息直接拼接,以组成多维特征信息;在一些实施例中,所述网络设备将所述特征向量及所述基本特征信息进行特征交叉,以组成所述多维特征信息。
在步骤S13中,网络设备将所述多维特征信息输入多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。在一些实施例中,所述网络设备将所述多维特征信息输入到训练好的多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。在一些实施例中,如图3所示,所述多分类模型是通过机器学习技术构建的一个多层神经网络模型,包括输入层、隐藏层以及输出层。所述多分类模型利用多分类交叉熵损失函数及随机梯度下降优化算法进行训练(softmax_cross_entropy),用于热点类型的预测输出。例如,经输入层输入多维特征信息,经过多层隐藏层后,输出层输出各热点类别的置信度信息(如家庭热点0.8,餐饮美食0.1…交通枢纽0.01),最终取最大置信度作为输出结果(如家庭热点0.8)。
在一些实施例中,所述获取待识别热点的特征向量,包括:若所述待识别热点存在目标数量的目标关联热点,网络设备根据所述待识别热点以及所述目标数量的目标关联热点,获取所述待识别热点的特征向量;否则,获取所述待识别热点的固定特征向量,将所述固定特征向量作为所述待识别热点的特征向量。在一些实施例中,所述目标数量包括但不限于3、5、7等具体的数值,例如,所述待识别热点需存在5个所述目标关联热点,网络设备才能根据所述待识别热点以及该5个目标关联热点获取所述待识别热点的特征向量,否则,所述网络设备直接获取一个固定特征向量(例如,全部赋值为0),将该固定特征向量作为所述待识别热点的特征向量。在一些实施例中,用户设备每次连接无线接入点并上报到网络设备(例如,服务器)时,会带上其当时扫描到的热点列表信息,将所述热点列表信息中记录的无线接入点作为所述待识别热点的关联热点。在一些实施例中,所述网络设备基于所述待识别热点对应的热点列表信息检测所述待识别热点是否存在目标数量的目标关联热点。在一些实施例中,所述目标关联热点包括出现在所述待识别热点的热点列表信息的频次等于或大于第一频次阈值(例如,3次等),并且基于频次排名排在前目标数量的关联热点(例如,排在前5的关联热点作为目标关联热点,并且,目标关联热点出现的频次均等于或大于3次)。
在一些实施例中,所述方法在获取待识别热点的特征向量,之前还包括步骤S14(未示出)。在步骤S14中,网络设备检测所述待识别热点是否存在目标数量的目标关联热点。例如,若所述待识别热点存在目标数量的目标关联热点,所述网络设备基于所述待识别热点以及所述目标数量的目标关联热点获取所述待识别热点的特征向量,若所述待识别热点不存在目标数量的目标关联热点,所述网络设备直接将固定特征向量作为所述待识别热点的特征向量。因此,所述网络设备在获取所述待识别热点的特征向量之前,需检测所述待识别热点是否存在目标数量的目标关联热点。
在一些实施例中,所述步骤S14包括:网络设备根据所述待识别热点的标识信息从热点数据库中查询获取与该待识别热点存在映射关系的一个或多个热点列表信息,其中,每个所述热点列表信息包括至少一个关联热点;网络设备根据每个所述关联热点出现的频次对所述至少一个关联热点进行排序;若排在前目标数量的关联热点出现的频次均等于或大于第一频次阈值,确定所述待识别热点存在目标数量的目标关联热点,并将所述排在前目标数量的关联热点作为所述待识别热点的目标数量的目标关联热点。例如,每次有用户设备上报其当前连接的无线接入点以及其当时扫描到的热点列表信息(将所述热点列表信息中包括的、与该无线接入点一起扫描到的无线接入点作为该无线接入点的关联热点)时,所述网络设备将所述无线接入点以及其对应的热点列表信息记录在热点数据库中。所述网络设备根据所述待识别热点的标识信息(例如,SSID)从所述热点数据库中查询与该待识别热点存在映射关系的一个或多个热点列表信息,每个所述热点列表信息包括至少一个关联热点。在一些实施例中,所述网络设备根据所述待识别热点的标识信息从所述热点数据库中查询获取近期(例如,3天内)上报的所述待识别热点的热点列表信息。在一些实施例中,所述网络设备根据每个关联热点出现的频次对所述至少一个关联热点进行排序,若排在前目标数量(例如5)的关联热点出现的频次均等于或大于第一频次阈值,确定所述待识别热点存在目标数量的目标关联热点,并将所述排在前目标数量的关联热点作为所述待识别热点的目标数量的目标关联热点。例如,待识别热点的SSID为‘wifi_xxx’,根据该SSID从热点数据库中查询得到该待识别热点的一个或多个热点列表信息,例如,记为neighbour_list1、neighbour_list2、neighbour_list3。neighbour_list1:[neighbour_1,neighbour_2,…,neighbour_K];neighbour_list2:[neighbour_3,neighbour_2,…,neighbour_K];neighbour_list3:[neighbour_2,neighbour_5,…,neighbour_M]。所述网络设备统计neighbour_list1、neighbour_list2、neighbour_list3中关联热点出现的频次,并基于出现的频次对所述关联热点进行排序。例如可以根据热点列表信息中关联热点近期出现的频次(一般为了减少干扰,需对于频次做一定限制,如最少应该出现3次)进行排序,取topN(如N为预设的目标数量,N可以取5~10)个关联热点作为其目标关联热点。例如neighbour_activate_list:[ngb_act_1,ngb_act_2,…,ngb_act_N]。如果存在,则进入后续基于所述待识别热点以及该待识别热点的目标关联热点提取特征向量的环节,否则则进入基本特征信息的提取环节。
在一些实施例中,所述根据所述待识别热点以及所述目标数量的目标关联热点,获取所述待识别热点的特征向量,包括:网络设备获取所述待识别热点与所述目标数量的目标关联热点的词向量信息;网络设备将所述词向量信息输入特征向量模型中,通过所述特征向量模型输出特征向量,将该特征向量作为所述待识别热点的特征向量。由于事物的联系具有普遍性:任何事物都与周围其它事物相互联系着。某种意义上看,对于处在生活圈或者商业圈中的热点来说,往往这些类别的热点之间的共存关系(或者说存在聚类效应),能够代表其内在的一些特点属性。比如居民区,工作日热点连接的高峰时段可能在晚间,而周末连接时段可能全天较为平均;对于商业圈或者商务办公区域,由于存在营业时段,故无线接入点的连接时段可能集中在早间9-10点到晚间21-22点等。因此我们认为无线接入点与其关联热点之间也存在某种关联,而我们无法单纯靠人工去构建其内在的联系,所以我们借助现有的一些机器学习的方法来帮助我们去挖掘。由于无线接入点的名称(例如,所述SSID)较短,而且没有句子一样的句法结构,因此单独靠某一无线接入点的名称很难得到有效信息,但通过大量的无线接入点及其目标关联热点,我们可以将一批无线接入点的名称拼接构造出一个个的“句子”。通过自然语言处理方法,类似TextCNN,Word2Vec等方法,对每个无线接入点及其目标关联热点提取其隐向量信息(例如,所述特征向量),从而提取出更有效的特征,来表征其内在的一些属性特点。而为了实现特征向量的提取,需要基于丰富的热点数据库,构建样本并训练所需的特征向量模型。一旦所述特征向量模型构建完毕,后续通过得到的所述待识别热点及其目标关联热点,基于所述特征向量模型获取其特征向量。在一些实施例中,首先要获取所述待识别热点与所述目标数量的目标关联热点的词向量信息,将所述词向量信息输入到所述特征向量模型中,以输出对应的特征向量。
在一些实施例中,所述获取所述待识别热点与所述目标数量的目标关联热点的词向量信息,包括:网络设备根据所述待识别热点以及所述目标数量的目标关联热点的标识信息从词汇表中查询获取对应的索引信息;网络设备通过词嵌入矩阵得到所述索引信息对应的词向量信息。在一些实施例中,所述标识信息包括但不限于无线接入点的名称。在一些实施例中,所述网络设备中建立有所述词汇表,通过所述词汇表将所述待识别热点以及所述目标数量的目标关联热点的标识信息转换为对应的索引信息,再通过所述词嵌入矩阵,将所述词向量信息转换为对应的词向量信息。
在一些实施例中,所述根据所述待识别热点以及所述目标数量的目标关联热点的标识信息从词汇表中查询获取对应的索引信息,包括:网络设备将所述待识别热点以及所述目标数量的目标关联热点的标识信息进行组合,以得到所述待识别热点与所述目标数量的目标关联热点的组合标识信息,其中,所述组合标识信息包括多个字符信息;网络设备从词汇表中查询获取每个所述字符信息的索引信息,其中,所述词汇表包括多个目标字符信息以及每个目标字符信息对应的索引信息。在一些实施例中,所述标识信息包括但不限于无线接入点的名称。例如,所述词汇表为{‘__PADDING__’:-1,‘__UNK__’:0,‘a’:1,‘b’:2,‘c’:3,‘d’:4,‘e’:5,‘f’:6},其中‘__PADDING__’和‘__UNK__’为保留字段信息,前者用于进行对齐操作,后者用于处理词汇表未出现字的情况,目标字符信息‘a’的索引信息为1,目标字符信息‘b’的索引信息为2…所述网络设备将所述待识别热点以及所述目标数量的目标关联热点的名称拼接成“句子”(例如,所述组合标识信息),将所述“句子”中的各词通过所述词汇表转换为词汇对应的id索引,并对齐“句子”长度为MAX_WORDS,大于MAX_WORDS的词汇被舍弃,而小于MAX_WORDS的需要补充默认padding值,如’__PADDING__’的id索引为0。例如,{[“a”,“b”],[“c”,“a”]}通过所述词汇表转化为{[1,2],[3,1]}。
在一些实施例中,所述方法还包括步骤S15(未示出),在步骤S15中,网络设备基于热点数据库中的多个无线接入点的标识信息构建所述词汇表。例如,每次有用户设备上报其当前连接的无线接入点以及其当时扫描到的热点列表信息(将所述热点列表信息中包括的、与该无线接入点一起扫描到的无线接入点作为该无线接入点的关联热点)时,所述网络设备将所述无线接入点以及其对应的热点列表信息记录在热点数据库中。因此,所述热点数据库中记录有多个无线接入点的名称。所述网络设备基于所述热点数据库中多个无线接入点的标识信息(例如,名称)构建所述词汇表。
在一些实施例中,所述基于热点数据库中的多个无线接入点的标识信息构建所述词汇表,包括:网络设备从所述热点数据库中提取多个无线接入点的标识信息;对每个所述无线接入点的标识信息进行分词操作,得到多个词汇信息;删除所述多个词汇信息中出现频次小于第二频次阈值的词汇信息,将保留下来的词汇信息作为目标词汇信息;对所有目标词汇信息进行字符拆分,得到多个字符;统计每个字符出现的频次,并删除频次小于第三频次阈值的字符,将保留下来的字符作为目标字符;生成每个所述目标字符的索引信息;将所述目标字符以及每个目标字符对应的索引信息记录在所述词汇表中。在一些实施例中,所述标识信息包括但不限于所述无线接入点的名称。例如,所述网络设备对所述热点数据库中的多个无线接入点的标识信息进行分词操作,得到多个词汇信息,并通过统计每个词汇出现的频次,删除频次小于第二频次阈值的词汇信息,以去除脏数据。并将保留下来的词汇信息作为目标词汇信息,进行字符拆分,得到多个字符,再统计这多个字符的频次,并删除小于第三频次阈值的字符,将保留下来的字符确定为目标字符,并生成每个目标字符的索引信息。例如,所述网络设备基于所述热点数据库,按照一定规则(如近1年内的)从所述热点数据库中提取无线接入点的标识信息(例如,名称)作为词库,去除脏数据,将热点数据库的无线接入点的名称按字统计每个词汇信息出现的频次;对于频次低于第二频次信息(例如,3次)的词汇信息进行排除,并构建最终的词汇表。例如:有一组词库为:[‘abc’,‘acd’,‘def’,‘bbc’,‘ce’],统计所有字出现的词汇表信息,那么将所有词进行字符拆分,并统计每个字符出现的频次,得到word_freq为{’a’:2,‘b’:3,‘c’:4,‘d’:2,‘e’:2,‘f’:1},如果需要排除词频低于几次的词汇,则word_freq需要去除符合条件的词汇信息,然后根据生成的词频信息,生成词汇对应id索引信息并保存作为词汇表信息,方便后续处理。
在一些实施例中,所述方法还包括步骤S16(未示出),在步骤S16中,网络设备根据词向量长度信息以及所述词汇表的词汇表长度信息确定所述词嵌入矩阵的维度信息,其中,所述维度信息包括所述词汇表长度信息以及所述词向量长度信息;初始化所述词嵌入矩阵,以构建所述词嵌入矩阵。例如,词汇表{“__PADDING__”:-1,“__UNK__”:0,a:1,b:2,c:3,d:4},则所述词汇表的词汇表长度为6,假设词向量长度为3,则词嵌入矩阵embed_matrix的维度为[6,3],假如说随机初始化为:[[0.5,0.1,-0.3][-0.6,0.3,0.4][0.8,-0.2,-0.3][0.1,-0.2,0.3][-0.3,0.5,0.1][-0.9,-0.2,0.8]]那么现在有两个样本(且MAX_WORDS为2){[“a”,“b”],[“c”,“a”]},转化为input_x:{[1,2],[3,1]},那么此时基于上面的词嵌入矩阵,对于每个word查找对应向量值,结果为:[[[0.8,-0.2,-0.3],[0.1,-0.2,0.3]],[[-0.3,0.5,0.1],[0.8,-0.2,-0.3]]],维度为[2,2,3],得到所对应的输入词向量input_embed。
在一些实施例中,所述方法还包括步骤S17(未示出),在步骤S17中,网络设备通过多个无线接入点的特征向量训练样本构建所述特征向量模型。在一些实施例中,对大量热点构建训练样本,构建样本标签,经过批量样本数据经过分类模型进行训练,训练完毕得到所需的特征向量模型。
在一些实施例中,所述通过多个无线接入点的特征向量训练样本构建所述特征向量模型,包括:网络设备根据多个无线接入点、每个所述无线接入点的关联热点以及所述无线接入点的标签信息,构造多个特征向量训练样本;通过词汇表获取所述多个特征向量训练样本中每个所述特征向量训练样本对应的索引信息;基于词嵌入模型获取所述多个特征向量训练样本中每个所述特征向量训练样本对应的词向量信息;根据所述多个特征向量训练样本的词向量信息构建所述特征向量模型。例如,一个无线接入点及其关联热点作为一个训练样本,进一步地,对于每个训练样本,根据所述无线接入点及其关联热点中已知热点类型的多个热点属性,对该无线接入点打上相应标签(如neighbour_activate_list列表的K个热点中超过一定比例的热点属于家庭热点,那么该热点就会被打上家庭热点的标签),一般C个分类的类别标签离散化为如0,1,…,C,一般在训练时需要进行one-hot编码。进一步地,所述网络设备通过所述词汇表获取每个训练样本的索引信息,并通过词嵌入模型将所述索引信息转换为对应的词向量信息。根据多个热点的词向量信息以及训练构建所述特征向量模型。例如,采用类似TextCNN的模型架构,如图4所示。模型主要结构基于由CNN(Convolution Neural Network)卷积神经网络层,Pooling池化层,全连接层(FullyConnect Layer),以及为了防止过拟合的Dropout层等常见的深度学习网络层组成。通过大批量训练样本,基于多分类模型的损失函数及随机梯度下降等优化算法,经过迭代的模型训练,得到所需的特征向量模型,用于特征向量提取(这里经过Pooling池化层后的特征向量即为所需),设为hs_list_embed_vec=[e1,e2,…,em]。
在一些实施例中,所述获取待识别热点的基本特征信息,包括:网络设备从与所述待识别热点相关的多个行为特征信息中提取基本特征信息。在一些实施例中,所述行为特征信息包括多个维度(例如,时间维度),每个维度对应有特征集合(例如,热点连接次数,热点连接设备数,热点连接城市信息以及热点周围邻居热点个数等等),所述网络设备从与所述待识别热点的多个行为特征信息中提取基本特征信息。在一些实施例中,所述网络设备在行为特征数据库中记录多个热点的行为特征信息,并从该行为特征数据库中查找该待识别热点的行为特征信息,进一步地,从所述行为特征信息中提取基本特征信息。
在一些实施例中,所述行为特征信息包括多个维度,以及每个维度对应的特征集合,所述特征集合中包括与所述待识别热点相关的行为特征信息,所述从与所述待识别热点相关的多个行为特征信息中提取基本特征信息,包括:网络设备从所述多个维度的特征集合中提取至少一个维度的特征集合作为所述待识别热点的基本特征信息。在一些实施例中,所述维度包括但不限于时间维度(例如近3天、1周、2周、1个月等);在一些实施例中,所述行为特征包括但不限于:热点连接次数、热点连接设备数、热点连接城市信息、关联热点的数量等。例如,近三天的时间维度W1对应特征集合{x1,x2,x3,x4};近一周的时间维度W2对应特征集合{x5,x6,x7,x8};近一个月的时间维度W3对应特征集合{x9,x10,x11,x12},所述网络设提取特征集合{x1,x2,x3,x4}、特征集合{x5,x6,x7,x8}、特征集合{x9,x10,x11,x12}作为所述待识别热点的基本特征信息(例如,所述基本特征信息包括{x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12})。在一些实施例中,所述维度时间维度(例如近3天、1周、2周、1个月等),所述时间维度还包括时间段维度(例如凌晨、早上、中午、下午、晚间等),每个时间段维度对应有特征集合,例如,所述时间维度包括近三天W1、近一周W2、近一个月W3,其中近三天的时间维度W1包括早上W11、中午W12以及晚上W13三个时间段维度;近一个周的时间维度W2包括早上W21、中午W22以及晚上W23三个时间段维度;近一个月的时间维度W3包括早上W31、中午W32以及晚上W33三个时间段维度。每个时间维度中的每个时间段维度对应自己的特征集合,例如,W1的W11对应特征集合{x1,x2,x3,x4};W1的W12对应特征集合{x5,x6,x7,x8};W1的W13对应特征集合{x9,x10,x11,x12},W2的W21对应特征集合{x13,x14,x15,x16};W2的W22对应特征集合{x17,x18,x19,x20};W2的W23对应特征集合{x17,x18,x19,x20},所述网络设备提取{x1,x2,x3,x4}{x5,x6,x7,x8}{x9,x10,x11,x12}作为所述待识别热点的基本特征信息(例如,所述基本特征信息包括{x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12})。
在此,本领域技术人员应能理解,上述提取基本特征信息的具体操作仅为举例,其旨在从所述特征集合的行为特征中提取需要的行为特征作为所述待识别热点的基本特征信息。
在一些实施例中,所述方法还包括步骤S18(未示出),在步骤S18中,网络设备根据多个无线接入点的基本特征信息、每个所述无线接入点的标签信息以及每个所述无线接入点对应的特征向量训练样本的特征向量通过机器学习构建所述多分类模型。例如,基于多个组合后的多维特征信息,基于机器学习中常用的神经网络模型(如图3所示),利用多分类交叉熵损失函数及随机梯度下降优化算法进行训练(softmax_cross_entropy),用于热点类型预测输出。而多个组合后的多维特征信息,需要多个训练样本。例如,将一个无线接入点及其对应的关联热点作为一个训练样本,则需要通过特征向量模型提取这多个训练样本的特征向量,需要提取这多个无线接入点的基本特征信息,通过多个特征向量以及多个基本特征信息组合成多个多维特征信息,通过多个多维特征信息对所述多分类模型进行机器学习训练。
图5示出了根据本申请另一个实施例的一种用于确定无线接入点的热点类型的方法流程图。该方法包括:
1.基于待识别热点信息,匹配热点库(例如,所述热点数据库)里其邻居热点信息(例如,所述关联热点);一般用户终端每次连接热点(例如,所述无线接入点)并上报到服务端时,会带上其当时扫描到的热点列表信息,我们称之为“邻居热点”(例如,所述关联热点)。所以对于待识别热点,可以通过匹配热点库(例如,所述热点数据库),提取近一段时间内(如3个月)其邻居热点信息(例如,关联热点),用于后续处理。如待识别热点SSID为’wifi_xxx’,匹配得到的邻居热点的SSID列表,记为neighbour_list:[neighbour_1,neighbour_2,…,neighbour_N]。
2.根据匹配热点库(例如,所述热点数据库)里是否存在一定数量的活跃邻居热点(例如,所述目标数量的目标关联热点),如果不存在进入热点特征提取环节(例如,获取所述基本特征信息),否则继续下一步;
根据待识别热点的邻居热点neighbour_list信息,判断是否存在一定数量的活跃邻居热点,如可以根据列表中邻居热点近期出现的频次(一般为了减少干扰,需对于频次做一定限制,如最少应该出现3次)进行排序,取topK(如K取5~10)个邻居热点作为其活跃邻居热点,如neighbour_activate_list:[ngb_act_1,ngb_act_2,…,ngb_act_k]。如果存在,则进入后续提取热点名称列表向量环节(例如,所述获取所述待识别热点的特征向量),否则则进入热点特征提取环节(例如,获取所述待识别热点的基本特征信息)。
3.热点名称列表向量提取(例如,获取所述特征向量):
由于事物的联系具有普遍性:任何事物都与周围其它事物相互联系着。某种意义上看,对于处在生活圈或者商业圈中的热点(例如,所述无线接入点)来说,往往这些类别的热点之间的共存关系(或者说存在聚类效应),能够代表其内在的一些特点属性。比如居民区,工作日热点连接的高峰时段可能在晚间,而周末连接时段可能全天较为平均;对于商业圈或者商务办公区域,由于存在营业时段,故热点的连接时段可能集中在早间9-10点到晚间21-22点等。
因此我们认为热点与其周围热点之间也存在某种关联,而我们无法单纯靠人工去构建其内在的联系,所以我们借助现有的一些机器学习的方法来帮助我们去挖掘。
由于热点名称(例如,所述标识信息)较短,而且没有句子一样的句法结构,因此单独靠某一热点名称很难得到有效信息,但通过大量的热点及其活跃邻居热点信息(例如,所述目标关联热点),我们可以将一批热点的名称拼接构造出一个个的“句子”。通过自然语言处理方法,类似TextCNN,Word2Vec等方法,对每个热点名称列表提取其隐向量信息,从而提取出更有效的特征,来表征其内在的一些属性特点。
而为了实现特征向量的提取,我们需要基于丰富的热点库(例如,所述热点数据库),构建样本并训练所需模型(例如,所述特征向量模型)。一旦模型构建完毕,后续经过第2步得到的热点及其活跃邻居热点列表neighbour_activate_list,就可以基于模型获取其特征向量信息(例如,所述特征向量)。
3.1词汇表构建与词频统计
基于热点库,按照一定规则(如近1年内的)提取热点名称作为词库,去除脏数据,将热点库的热点名称按字统计每个词汇的词频信息;对于词频低于一定次数的词汇进行排除,并构建最终词汇表信息。
例如:有一组词库为:[‘abc’,‘acd’,‘def’,‘bbc’,‘ce’],统计所有字出现的词汇表信息,那么将所有词进行字符拆分,并统计每个字符出现的频次,得到word_freq为{’a’:2,‘b’:3,‘c’:4,‘d’:2,‘e’:2,‘f’:1},如果需要排除词频低于几次的词汇,则word_freq需要去除符合条件的词汇信息,然后根据生成的词频信息,生成词汇(例如,所述目标字符)对应id索引信息并保存作为词汇表信息,方便后续处理。
例如:{‘__PADDING__’:-1,‘__UNK__’:0,‘a’:1,‘b’:2,‘c’:3,‘d’:4,‘e’:5,‘f’:6},其中‘__PADDING__’和‘__UNK__’为保留字段信息,前者用于进行对齐操作,后者用于处理词汇表未出现字的情况。
3.2构造训练样本
根据热点及其邻居热点信息,并根据列表中已知热点类型的多个热点属性,对该热点打上相应标签(如neighbour_activate_list列表的K个热点中超过一定比例的热点属于家庭热点,那么该热点就会被打上家庭热点的标签),一般C个分类的类别标签离散化为如0,1,…,C,一般在训练时需要进行one-hot编码;
设词汇表长度为VOCAB_LEN,词向量长度为EMBED_SIZE,模型训练的句子最长长度为MAX_WORDS,构建的词嵌入矩阵(设为embed_matrix)维度为[VOCAB_LEN,EMBED_SIZE],可选择随机初始化该矩阵(既可以固定,也可参与训练)。
为了使用类似TextCNN算法,需要对训练样本进行输入特征构建,将第二步得到的每个热点及其对应列表neighbour_activate_list拼接成“句子”。并将“句子”中的各词汇通过词汇表转换为词汇对应id索引,并对齐“句子”长度为MAX_WORDS,大于MAX_WORDS的词汇被舍弃,而小于MAX_WORDS的需要补充默认padding值,如’__PADDING__’的id索引为0。最终转换后该句子的输入特征维度为[N,MAX_WORDS],记为input_x,其中N表示样本数量,对应的标签(设为y)的维度为[N]。
此时,可以根据词嵌入矩阵embed_matrix,将input_x中每条样本的输入id索引都转换为词向量,得到的结果记做input_embed,维度为[N,MAX_WORDS,EMBED_SIZE],构建好的样本输入特征可以送入模型进行训练。
3.3模型构建、训练与特征向量提取
我们可以采用类似TextCNN的模型架构,如图4所示。模型主要结构基于由CNN(Convolution Neural Network)卷积神经网络层,Pooling池化层,全连接层(FullyConnect Layer),以及为了防止过拟合的Dropout层等常见的深度学习网络层组成。
通过大批量训练样本,基于多分类模型的损失函数及随机梯度下降等优化算法,经过迭代的模型训练,得到所需模型,用于热点名称列表的特征向量提取(这里经过Pooling池化层后的特征向量即为所需),设为hs_list_embed_vec=[e1,e2,…,em]。
4.热点特征提取(例如,所述获取基本特征信息)
构建一系列热点相关的行为特征,如近3天,1周,2周,1个月,2个月等,分时段(如凌晨、早上、中午、下午、晚间等)的热点连接次数,热点连接设备数,热点连接城市信息以及热点周围邻居热点个数等等,主要是构建与热点相关的各维度特征信息用于后续模型训练和预测。
提取基本的行为特征信息,设为hs_behaviour_info=[x1,x2,x3,…,xn]。
5.多维特征信息组合
此时,如图5所示,我们根据待识别热点是否存在一定数量的活跃邻居热点信息,分为两种情况来处理:
1)对于有neighbour_activate_list(例如,所述目标数量的目标关联热点)的,直接基于热点名称列表向量提取环节,得到hs_list_embed_vec;
2)对于没有neighbour_activate_list(例如,所述目标数量的目标关联热点)的,我们可以用固定向量(例如,所述固定特征向量)表示(如全部赋值为0,或者利用训练集上提取到的特征向量平均值),得到hs_list_embed_vec。
最后,将热点的基本行为特征hs_behaviour_info和热点名称列表向量特征hs_list_embed_vec,进行组合得到组合特征信息(例如,所述多维特征信息),设为hs_feature_comb_vec,特征维度为M维。其中特征组合方式可以有多种,如直接拼接,特征交叉等等。这样的多维度特征组合,即考虑了热点本身的一些行为属性,也考虑了热点所处上下文信息,特征信息更全面,作为后续热点分类的输入特征,能更精确描绘出热点的特点属性。
6.热点多分类模型
基于上步组合后的多维度特征hs_feature_comb_vec,基于批量样本,我们可以基于机器学习中常用的神经网络模型(如图4所示),利用多分类交叉熵损失函数及随机梯度下降优化算法进行训练(softmax_cross_entropy),用于热点类型预测输出。
基于已训练完毕的多分类模型,经输入层输入多维度特征(例如,所述多维特征信息),经过多层隐藏层后,输出层输出各热点类别的置信度信息(如家庭热点0.8,餐饮美食0.1,…,交通枢纽0.01),最终取最大置信度作为输出结果(如家庭热点0.8)。
图2示出了根据本申请一个实施例的一种用于确定无线接入点的热点类型的设备结构图,该设备包括一一模块、一二模块以及一三模块。一一模块,用于获取待识别热点的特征向量以及基本特征信息。一二模块,用于将所述特征向量以及所述基本特征信息组合生成多维特征信息。一三模块,用于将所述多维特征信息输入多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。
具体而言,一一模块,用于获取待识别热点的特征向量以及基本特征信息。在一些实施例中,所述特征向量用于表征所述待识别热点内在的一些属性特点。在一些实施例中,所述待识别热点存在目标数量的目标关联热点,所述特征向量是基于所述待识别热点以及该待识别热点的目标关联热点获取的;在另一些实施例中,所述待识别热点不存在目标数量的目标关联热点,将固定特征向量作为所述待识别热点的特征向量。在一些实施例中,所述基本特征信息是从与所述待识别热点相关的多个行为特征信息中提取获得的,例如,所述基本特征信息包括但不限于所述待识别热点近3天、近一周等的热点连接次数、热点连接设备数、热点连接城市信息、关联热点的个数等。
一二模块,用于将所述特征向量以及所述基本特征信息组合生成多维特征信息。在一些实施例中,所述网络设备将所述特征向量以及所述基本特征信息直接拼接,以组成多维特征信息;在一些实施例中,所述网络设备将所述特征向量及所述基本特征信息进行特征交叉,以组成所述多维特征信息。
一三模块,用于将所述多维特征信息输入多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。在一些实施例中,所述网络设备将所述多维特征信息输入到训练好的多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型。在一些实施例中,如图3所示,所述多分类模型是通过机器学习技术构建的一个多层神经网络模型,包括输入层、隐藏层以及输出层。所述多分类模型利用多分类交叉熵损失函数及随机梯度下降优化算法进行训练(softmax_cross_entropy),用于热点类型的预测输出。例如,经输入层输入多维特征信息,经过多层隐藏层后,输出层输出各热点类别的置信度信息(如家庭热点0.8,餐饮美食0.1…交通枢纽0.01),最终取最大置信度作为输出结果(如家庭热点0.8)。
在一些实施例中,所述获取待识别热点的特征向量,包括:若所述待识别热点存在目标数量的目标关联热点,网络设备根据所述待识别热点以及所述目标数量的目标关联热点,获取所述待识别热点的特征向量;否则,获取所述待识别热点的固定特征向量,将所述固定特征向量作为所述待识别热点的特征向量。在一些实施例中,所述目标数量包括但不限于3、5、7等具体的数值,例如,所述待识别热点需存在5个所述目标关联热点,网络设备才能根据所述待识别热点以及该5个目标关联热点获取所述待识别热点的特征向量,否则,所述网络设备直接获取一个固定特征向量(例如,全部赋值为0),将该固定特征向量作为所述待识别热点的特征向量。在一些实施例中,用户设备每次连接无线接入点并上报到网络设备(例如,服务器)时,会带上其当时扫描到的热点列表信息,将所述热点列表信息中记录的无线接入点作为所述待识别热点的关联热点。在一些实施例中,所述网络设备基于所述待识别热点对应的热点列表信息检测所述待识别热点是否存在目标数量的目标关联热点。在一些实施例中,所述目标关联热点包括出现在所述待识别热点的热点列表信息的频次等于或大于第一频次阈值(例如,3次等),并且基于频次排名排在前目标数量的关联热点(例如,排在前5的关联热点作为目标关联热点,并且,目标关联热点出现的频次均等于或大于3次)。
在一些实施例中,所述设备还包括一四模块(未示出)。一四模块,用于检测所述待识别热点是否存在目标数量的目标关联热点。
在此,有关上述一四模块的具体实现方式的示例与上述步骤S14的实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述一四模块用于根据所述待识别热点的标识信息从热点数据库中查询获取与该待识别热点存在映射关系的一个或多个热点列表信息,其中,每个所述热点列表信息包括至少一个关联热点;网络设备根据每个所述关联热点出现的频次对所述至少一个关联热点进行排序;若排在前目标数量的关联热点出现的频次均等于或大于第一频次阈值,确定所述待识别热点存在目标数量的目标关联热点,并将所述排在前目标数量的关联热点作为所述待识别热点的目标数量的目标关联热点。
在此,有关上述一四模块的具体实现方式的示例与上述步骤S14的实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述根据所述待识别热点以及所述目标数量的目标关联热点,获取所述待识别热点的特征向量,包括:网络设备获取所述待识别热点与所述目标数量的目标关联热点的词向量信息;网络设备将所述词向量信息输入特征向量模型中,通过所述特征向量模型输出特征向量,将该特征向量作为所述待识别热点的特征向量。由于事物的联系具有普遍性:任何事物都与周围其它事物相互联系着。某种意义上看,对于处在生活圈或者商业圈中的热点来说,往往这些类别的热点之间的共存关系(或者说存在聚类效应),能够代表其内在的一些特点属性。比如居民区,工作日热点连接的高峰时段可能在晚间,而周末连接时段可能全天较为平均;对于商业圈或者商务办公区域,由于存在营业时段,故无线接入点的连接时段可能集中在早间9-10点到晚间21-22点等。因此我们认为无线接入点与其关联热点之间也存在某种关联,而我们无法单纯靠人工去构建其内在的联系,所以我们借助现有的一些机器学习的方法来帮助我们去挖掘。由于无线接入点的名称(例如,所述SSID)较短,而且没有句子一样的句法结构,因此单独靠某一无线接入点的名称很难得到有效信息,但通过大量的无线接入点及其目标关联热点,我们可以将一批无线接入点的名称拼接构造出一个个的“句子”。通过自然语言处理方法,类似TextCNN,Word2Vec等方法,对每个无线接入点及其目标关联热点提取其隐向量信息(例如,所述特征向量),从而提取出更有效的特征,来表征其内在的一些属性特点。而为了实现特征向量的提取,需要基于丰富的热点数据库,构建样本并训练所需的特征向量模型。一旦所述特征向量模型构建完毕,后续通过得到的所述待识别热点及其目标关联热点,基于所述特征向量模型获取其特征向量。在一些实施例中,首先要获取所述待识别热点与所述目标数量的目标关联热点的词向量信息,将所述词向量信息输入到所述特征向量模型中,以输出对应的特征向量。
在一些实施例中,所述获取所述待识别热点与所述目标数量的目标关联热点的词向量信息,包括:网络设备根据所述待识别热点以及所述目标数量的目标关联热点的标识信息从词汇表中查询获取对应的索引信息;网络设备通过词嵌入矩阵得到所述索引信息对应的词向量信息。在一些实施例中,所述标识信息包括但不限于无线接入点的名称。在一些实施例中,所述网络设备中建立有所述词汇表,通过所述词汇表将所述待识别热点以及所述目标数量的目标关联热点的标识信息转换为对应的索引信息,再通过所述词嵌入矩阵,将所述词向量信息转换为对应的词向量信息。
在一些实施例中,所述根据所述待识别热点以及所述目标数量的目标关联热点的标识信息从词汇表中查询获取对应的索引信息,包括:网络设备将所述待识别热点以及所述目标数量的目标关联热点的标识信息进行组合,以得到所述待识别热点与所述目标数量的目标关联热点的组合标识信息,其中,所述组合标识信息包括多个字符信息;网络设备从词汇表中查询获取每个所述字符信息的索引信息,其中,所述词汇表包括多个目标字符信息以及每个目标字符信息对应的索引信息。在一些实施例中,所述标识信息包括但不限于无线接入点的名称。例如,所述词汇表为{‘__PADDING__’:-1,‘__UNK__’:0,‘a’:1,‘b’:2,‘c’:3,‘d’:4,‘e’:5,‘f’:6},其中‘__PADDING__’和‘__UNK__’为保留字段信息,前者用于进行对齐操作,后者用于处理词汇表未出现字的情况,目标字符信息‘a’的索引信息为1,目标字符信息‘b’的索引信息为2…所述网络设备将所述待识别热点以及所述目标数量的目标关联热点的名称拼接成“句子”(例如,所述组合标识信息),将所述“句子”中的各词通过所述词汇表转换为词汇对应的id索引,并对齐“句子”长度为MAX_WORDS,大于MAX_WORDS的词汇被舍弃,而小于MAX_WORDS的需要补充默认padding值,如’__PADDING__’的id索引为0。例如,{[“a”,“b”],[“c”,“a”]}通过所述词汇表转化为{[1,2],[3,1]}。
在一些实施例中,所述设备还包括一五模块(未示出),一五模块,用于基于热点数据库中的多个无线接入点的标识信息构建所述词汇表。
在此,有关上述一五模块的具体实现方式的示例与上述步骤S15的实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述基于热点数据库中的多个无线接入点的标识信息构建所述词汇表,包括:网络设备从所述热点数据库中提取多个无线接入点的标识信息;对每个所述无线接入点的标识信息进行分词操作,得到多个词汇信息;删除所述多个词汇信息中出现频次小于第二频次阈值的词汇信息,将保留下来的词汇信息作为目标词汇信息;对所有目标词汇信息进行字符拆分,得到多个字符;统计每个字符出现的频次,并删除频次小于第三频次阈值的字符,将保留下来的字符作为目标字符;生成每个所述目标字符的索引信息;将所述目标字符以及每个目标字符对应的索引信息记录在所述词汇表中。在一些实施例中,所述标识信息包括但不限于所述无线接入点的名称。例如,所述网络设备对所述热点数据库中的多个无线接入点的标识信息进行分词操作,得到多个词汇信息,并通过统计每个词汇出现的频次,删除频次小于第二频次阈值的词汇信息,以去除脏数据。并将保留下来的词汇信息作为目标词汇信息,进行字符拆分,得到多个字符,再统计这多个字符的频次,并删除小于第三频次阈值的字符,将保留下来的字符确定为目标字符,并生成每个目标字符的索引信息。例如,所述网络设备基于所述热点数据库,按照一定规则(如近1年内的)从所述热点数据库中提取无线接入点的标识信息(例如,名称)作为词库,去除脏数据,将热点数据库的无线接入点的名称按字统计每个词汇信息出现的频次;对于频次低于第二频次信息(例如,3次)的词汇信息进行排除,并构建最终的词汇表。例如:有一组词库为:[‘abc’,‘acd’,‘def’,‘bbc’,‘ce’],统计所有字出现的词汇表信息,那么将所有词进行字符拆分,并统计每个字符出现的频次,得到word_freq为{’a’:2,‘b’:3,‘c’:4,‘d’:2,‘e’:2,‘f’:1},如果需要排除词频低于几次的词汇,则word_freq需要去除符合条件的词汇信息,然后根据生成的词频信息,生成词汇对应id索引信息并保存作为词汇表信息,方便后续处理。
在一些实施例中,所述设备还包括一六模块(未示出),一六模块,用于根据词向量长度信息以及所述词汇表的词汇表长度信息确定所述词嵌入矩阵的维度信息,其中,所述维度信息包括所述词汇表长度信息以及所述词向量长度信息;初始化所述词嵌入矩阵,以构建所述词嵌入矩阵。
在此,有关上述一六模块的具体实现方式的示例与上述步骤S16的实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述设备还包括一七模块(未示出),一七模块,用于通过多个无线接入点的特征向量训练样本构建所述特征向量模型。
在此,有关上述一七模块的具体实现方式的示例与上述步骤S17的实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述通过多个无线接入点的特征向量训练样本构建所述特征向量模型,包括:网络设备根据多个无线接入点、每个所述无线接入点的关联热点以及所述无线接入点的标签信息,构造多个特征向量训练样本;通过词汇表获取所述多个特征向量训练样本中每个所述特征向量训练样本对应的索引信息;基于词嵌入模型获取所述多个特征向量训练样本中每个所述特征向量训练样本对应的词向量信息;根据所述多个特征向量训练样本的词向量信息构建所述特征向量模型。例如,一个无线接入点及其关联热点作为一个训练样本,进一步地,对于每个训练样本,根据所述无线接入点及其关联热点中已知热点类型的多个热点属性,对该无线接入点打上相应标签(如neighbour_activate_list列表的K个热点中超过一定比例的热点属于家庭热点,那么该热点就会被打上家庭热点的标签),一般C个分类的类别标签离散化为如0,1,…,C,一般在训练时需要进行one-hot编码。进一步地,所述网络设备通过所述词汇表获取每个训练样本的索引信息,并通过词嵌入模型将所述索引信息转换为对应的词向量信息。根据多个热点的词向量信息以及训练构建所述特征向量模型。例如,采用类似TextCNN的模型架构,如图4所示。模型主要结构基于由CNN(Convolution Neural Network)卷积神经网络层,Pooling池化层,全连接层(FullyConnect Layer),以及为了防止过拟合的Dropout层等常见的深度学习网络层组成。通过大批量训练样本,基于多分类模型的损失函数及随机梯度下降等优化算法,经过迭代的模型训练,得到所需的特征向量模型,用于特征向量提取(这里经过Pooling池化层后的特征向量即为所需),设为hs_list_embed_vec=[e1,e2,…,em]。
在一些实施例中,所述获取待识别热点的基本特征信息,包括:网络设备从与所述待识别热点相关的多个行为特征信息中提取基本特征信息。在一些实施例中,所述行为特征信息包括多个维度(例如,时间维度),每个维度对应有特征集合(例如,热点连接次数,热点连接设备数,热点连接城市信息以及热点周围邻居热点个数等等),所述网络设备从与所述待识别热点的多个行为特征信息中提取基本特征信息。在一些实施例中,所述网络设备在行为特征数据库中记录多个热点的行为特征信息,并从该行为特征数据库中查找该待识别热点的行为特征信息,进一步地,从所述行为特征信息中提取基本特征信息。
在一些实施例中,所述行为特征信息包括多个维度,以及每个维度对应的特征集合,所述特征集合中包括与所述待识别热点相关的行为特征信息,所述从与所述待识别热点相关的多个行为特征信息中提取基本特征信息,包括:网络设备从所述多个维度的特征集合中提取至少一个维度的特征集合作为所述待识别热点的基本特征信息。在一些实施例中,所述维度包括但不限于时间维度(例如近3天、1周、2周、1个月等);在一些实施例中,所述行为特征包括但不限于:热点连接次数、热点连接设备数、热点连接城市信息、关联热点的数量等。例如,近三天的时间维度W1对应特征集合{x1,x2,x3,x4};近一周的时间维度W2对应特征集合{x5,x6,x7,x8};近一个月的时间维度W3对应特征集合{x9,x10,x11,x12},所述网络设提取特征集合{x1,x2,x3,x4}、特征集合{x5,x6,x7,x8}作为所述待识别热点的基本特征信息(例如,所述基本特征信息为{x1,x2,x3,x4,x5,x6,x7,x8})。在一些实施例中,所述维度时间维度(例如近3天、1周、2周、1个月等),所述时间维度还包括时间段维度(例如凌晨、早上、中午、下午、晚间等),每个时间段维度对应有特征集合,例如,所述时间维度包括近三天W1、近一周W2、近一个月W3,其中近三天的时间维度W1包括早上W11、中午W12以及晚上W13三个时间段维度;近一个周的时间维度W2包括早上W21、中午W22以及晚上W23三个时间段维度;近一个月的时间维度W3包括早上W31、中午W32以及晚上W33三个时间段维度。每个时间维度中的每个时间段维度对应自己的特征集合,例如,W1的W11对应特征集合{x1,x2,x3,x4};W1的W12对应特征集合{x5,x6,x7,x8};W1的W13对应特征集合{x9,x10,x11,x12},W2的W21对应特征集合{x13,x14,x15,x16};W2的W22对应特征集合{x17,x18,x19,x20};W2的W23对应特征集合{x17,x18,x19,x20},所述网络设备提取{x1,x2,x3,x4}{x5,x6,x7,x8}{x9,x10,x11,x12}作为所述待识别热点的基本特征信息(例如,所述基本特征信息为{x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12})。
在一些实施例中,所述设备还包括一八模块(未示出),一八模块,用于根据多个无线接入点的基本特征信息、每个所述无线接入点的标签信息以及每个所述无线接入点对应的特征向量训练样本的特征向量通过机器学习构建所述多分类模型。
在此,有关上述一八模块的具体实现方式的示例与上述步骤S18的实施例相同或相近,故不再赘述,在此以引用方式包含于此。
除上述各实施例介绍的方法和设备外,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如前任一项所述的方法被执行。
本申请还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。
本申请还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。
图6示出了可被用于实施本申请中所述的各个实施例的示例性系统;
如图6所示在一些实施例中,系统300能够作为各所述实施例中的任意一个设备。在一些实施例中,系统300可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或NVM/存储设备320)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本申请中所述的动作的一个或多个处理器(例如,(一个或多个)处理器305)。
对于一个实施例,系统控制模块310可包括任意适当的接口控制器,以向(一个或多个)处理器305中的至少一个和/或与系统控制模块310通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块310可包括存储器控制器模块330,以向系统存储器315提供接口。存储器控制器模块330可以是硬件模块、软件模块和/或固件模块。
系统存储器315可被用于例如为系统300加载和存储数据和/或指令。对于一个实施例,系统存储器315可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器315可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块310可包括一个或多个输入/输出(I/O)控制器,以向NVM/存储设备320及(一个或多个)通信接口325提供接口。
例如,NVM/存储设备320可被用于存储数据和/或指令。NVM/存储设备320可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备320可包括在物理上作为系统300被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备320可通过网络经由(一个或多个)通信接口325进行访问。
(一个或多个)通信接口325可为系统300提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统300可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。
对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器(例如,存储器控制器模块330)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统300可以但不限于是:服务器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统300可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统300包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个系统传送到另一系统的介质。通信介质可包括有导的传输介质(诸如电缆和线(例如,光纤、同轴等))和能传播能量波的无线(未有导的传输)介质,诸如声音、电磁、RF、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。
作为示例而非限制,计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括,但不限于,易失性存储器,诸如随机存储器(RAM,DRAM,SRAM);以及非易失性存储器,诸如闪存、各种只读存储器(ROM,PROM,EPROM,EEPROM)、磁性和铁磁/铁电存储器(MRAM,FeRAM);以及磁性和光学存储设备(硬盘、磁带、CD、DVD);或其它现在已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息/数据。
在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (13)

1.一种用于确定无线接入点的热点类型的方法,其中,该方法包括:
若待识别热点存在目标数量的目标关联热点,根据所述待识别热点以及所述目标数量的目标关联热点,获取待识别热点的特征向量,其中,所述特征向量用于表征所述待识别热点及所述目标关联热点的内在的属性特点,所述目标关联热点包含于用户设备扫描到的热点列表信息中;从与所述待识别热点相关的多个行为特征信息中提取所述待识别热点的基本特征信息;
将所述特征向量以及所述基本特征信息组合生成多维特征信息;
将所述多维特征信息输入多分类模型中,根据所述多分类模型的输出结果确定所述待识别热点的热点类型;
其中,所述根据所述待识别热点以及所述目标数量的目标关联热点,获取所述待识别热点的特征向量,包括:
将所述待识别热点以及所述目标数量的目标关联热点的标识信息进行组合,以得到所述待识别热点与所述目标数量的目标关联热点的组合标识信息,其中,所述组合标识信息包括多个字符信息;从词汇表中查询获取每个所述字符信息的索引信息,其中,所述词汇表包括多个目标字符信息以及每个目标字符信息对应的索引信息;通过词嵌入矩阵得到所述索引信息对应的词向量信息;将所述词向量信息输入特征向量模型中,通过所述特征向量模型输出特征向量,将该特征向量作为所述待识别热点的特征向量。
2.根据权利要求1所述的方法,其中,所述获取待识别热点的特征向量,还包括:
若待识别热点不存在目标数量的目标关联热点,获取所述待识别热点的固定特征向量,将所述固定特征向量作为所述待识别热点的特征向量。
3.根据权利要求2所述的方法,其中,所述方法在获取待识别热点的特征向量,之前还包括:
检测所述待识别热点是否存在目标数量的目标关联热点。
4.根据权利要求3所述的方法,其中,所述检测所述待识别热点是否存在目标数量的目标关联热点,包括:
根据所述待识别热点的标识信息从热点数据库中查询获取与该待识别热点存在映射关系的一个或多个热点列表信息,其中,每个所述热点列表信息包括至少一个关联热点;
根据每个所述关联热点出现的频次对所述至少一个关联热点进行排序;
若排在前目标数量的关联热点出现的频次均等于或大于第一频次阈值,确定所述待识别热点存在目标数量的目标关联热点,并将所述排在前目标数量的关联热点作为所述待识别热点的目标数量的目标关联热点。
5.根据权利要求1所述的方法,其中,所述方法还包括:
基于热点数据库中的多个无线接入点的标识信息构建所述词汇表。
6.根据权利要求5所述的方法,其中,所述基于热点数据库中的多个无线接入点的标识信息构建所述词汇表,包括:
从所述热点数据库中提取多个无线接入点的标识信息;
对每个所述无线接入点的标识信息进行分词操作,得到多个词汇信息;
删除所述多个词汇信息中出现频次小于第二频次阈值的词汇信息,将保留下来的词汇信息作为目标词汇信息;
对所有目标词汇信息进行字符拆分,得到多个字符;
统计每个字符出现的频次,并删除频次小于第三频次阈值的字符,将保留下来的字符作为目标字符;
生成每个所述目标字符的索引信息;
将所述目标字符以及每个目标字符对应的索引信息记录在所述词汇表中。
7.根据权利要求1所述的方法,其中,所述方法还包括:
根据词向量长度信息以及所述词汇表的词汇表长度信息确定所述词嵌入矩阵的维度信息,其中,所述维度信息包括所述词汇表长度信息以及所述词向量长度信息;
初始化所述词嵌入矩阵,以构建所述词嵌入矩阵。
8.根据权利要求1所述的方法,其中,所述方法还包括:
通过多个无线接入点的特征向量训练样本构建所述特征向量模型。
9.根据权利要求8所述的方法,其中,所述通过多个无线接入点的特征向量训练样本构建所述特征向量模型,包括:
根据多个无线接入点、每个所述无线接入点的关联热点以及所述无线接入点的标签信息,构造多个特征向量训练样本;
通过词汇表获取所述多个特征向量训练样本中每个所述特征向量训练样本对应的索引信息;
基于词嵌入模型获取所述多个特征向量训练样本中每个所述特征向量训练样本对应的词向量信息;
根据所述多个特征向量训练样本的词向量信息构建所述特征向量模型。
10.根据权利要求1所述的方法,其中,所述行为特征信息包括多个维度,以及每个维度对应的特征集合,所述特征集合中包括与所述待识别热点相关的行为特征信息,所述从与所述待识别热点相关的多个行为特征信息中提取基本特征信息,包括:
从所述多个维度的特征集合中提取至少一个维度的特征集合作为所述待识别热点的基本特征信息。
11.根据权利要求1所述的方法,其中,所述方法还包括:
根据多个无线接入点的基本特征信息、每个所述无线接入点的标签信息以及每个所述无线接入点对应的特征向量训练样本的特征向量通过机器学习构建所述多分类模型。
12.一种用于确定无线接入点的热点类型的设备,其中,该设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1至11中任一项所述方法的操作。
13.一种存储指令的计算机可读介质,所述指令在被执行时使得系统进行执行如权利要求1至11中任一项所述方法的操作。
CN202011162754.9A 2020-10-27 2020-10-27 一种用于确定无线接入点的热点类型的方法与设备 Active CN112135334B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011162754.9A CN112135334B (zh) 2020-10-27 2020-10-27 一种用于确定无线接入点的热点类型的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011162754.9A CN112135334B (zh) 2020-10-27 2020-10-27 一种用于确定无线接入点的热点类型的方法与设备

Publications (2)

Publication Number Publication Date
CN112135334A CN112135334A (zh) 2020-12-25
CN112135334B true CN112135334B (zh) 2023-07-14

Family

ID=73853960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011162754.9A Active CN112135334B (zh) 2020-10-27 2020-10-27 一种用于确定无线接入点的热点类型的方法与设备

Country Status (1)

Country Link
CN (1) CN112135334B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399488A (zh) * 2019-07-05 2019-11-01 深圳和而泰家居在线网络科技有限公司 文本分类方法及装置
CN111090763A (zh) * 2019-11-22 2020-05-01 北京视觉大象科技有限公司 一种图片自动标签方法及装置
CN111324698A (zh) * 2020-02-20 2020-06-23 苏宁云计算有限公司 深度学习方法、评价观点提取方法、装置和系统
CN111737484A (zh) * 2020-05-15 2020-10-02 浙江工业大学 一种基于联合学习的警情知识图谱构建方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106488493B (zh) * 2015-08-24 2020-06-02 阿里巴巴集团控股有限公司 识别用户的网络热点类型的方法和装置及电子设备
CN107659982B (zh) * 2016-07-26 2020-08-14 腾讯科技(深圳)有限公司 一种无线网络接入点的分类方法及装置
US20180205749A1 (en) * 2017-01-18 2018-07-19 Qualcomm Incorporated Detecting A Rogue Access Point Using Network-Independent Machine Learning Models
US10216766B2 (en) * 2017-03-20 2019-02-26 Adobe Inc. Large-scale image tagging using image-to-topic embedding
US10735274B2 (en) * 2018-01-26 2020-08-04 Cisco Technology, Inc. Predicting and forecasting roaming issues in a wireless network
CN108595519A (zh) * 2018-03-26 2018-09-28 平安科技(深圳)有限公司 热点事件分类方法、装置及存储介质
CN109871535B (zh) * 2019-01-16 2020-01-10 四川大学 一种基于深度神经网络的法语命名实体识别方法
CN109951846B (zh) * 2019-03-25 2020-10-27 腾讯科技(深圳)有限公司 无线网络识别方法、装置、存储介质及计算机设备
CN111615178B (zh) * 2020-05-09 2022-04-15 腾讯科技(深圳)有限公司 识别无线网络类型及模型训练的方法、装置及电子设备
CN111737586B (zh) * 2020-08-19 2020-12-04 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399488A (zh) * 2019-07-05 2019-11-01 深圳和而泰家居在线网络科技有限公司 文本分类方法及装置
CN111090763A (zh) * 2019-11-22 2020-05-01 北京视觉大象科技有限公司 一种图片自动标签方法及装置
CN111324698A (zh) * 2020-02-20 2020-06-23 苏宁云计算有限公司 深度学习方法、评价观点提取方法、装置和系统
CN111737484A (zh) * 2020-05-15 2020-10-02 浙江工业大学 一种基于联合学习的警情知识图谱构建方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Zhang Chunsen.Spectral–Spatial Classification of Hyperspectral Images Using Probabilistic Weighted Strategy for Multifeature Fusion.《IEEE》.2016,全文. *
尚美辰.基于UMLS和通路数据的潜在语义分析技术的研究与实现.《中国硕士学位论文全文数据库》.2016,全文. *
张宇昂 ; 贾云鹏 ; 刘家鹏 ; .一种多特征融合的长文本分类方法.中国电子科学研究院学报.2020,(09),全文. *
陶林润德 ; .机器学习方法在文本分类中的应用.中国战略新兴产业.2017,(40),全文. *

Also Published As

Publication number Publication date
CN112135334A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN112685565B (zh) 基于多模态信息融合的文本分类方法、及其相关设备
US8849854B2 (en) Method and system for providing detailed information in an interactive manner in a short message service (SMS) environment
US20230260303A1 (en) Cross-Modal Weak Supervision For Media Classification
US10936645B2 (en) Method and apparatus for generating to-be-played multimedia content
CN111104507B (zh) 一种用于提供关联书籍信息的方法与设备
CN109359237B (zh) 一种用于搜索寄宿程序的方法与设备
CN107885873A (zh) 用于输出信息的方法和装置
CN108664665A (zh) 数据格式转化方法、装置、设备及可读存储介质
CN111930277A (zh) 一种用于提供呈现信息的方法与设备
CN115018549A (zh) 广告文案生成方法及其装置、设备、介质、产品
CN110502299B (zh) 一种用于提供小说信息的方法与设备
CN111488097A (zh) 一种用于提供阅读呈现信息的方法与设备
CN115952346A (zh) 利用稀疏特征编码的推荐系统
CN111506232A (zh) 一种用于在阅读应用中控制菜单显示的方法与设备
US20230315990A1 (en) Text detection method and apparatus, electronic device, and storage medium
CN112135334B (zh) 一种用于确定无线接入点的热点类型的方法与设备
CN111327518B (zh) 一种拼接消息的方法与设备
KR20240020166A (ko) Esg 보조 툴을 이용하여 정형화된 esg 데이터로 기계학습 모델을 학습하는 방법 및 기계학습 모델로 자동완성된 esg 문서를 생성하는 서비스 서버
WO2021000411A1 (zh) 基于神经网络的文档分类方法、装置、设备及存储介质
CN110505143A (zh) 一种用于发送目标视频的方法与设备
CN116150371A (zh) 基于shardingJDBC的资产还款计划海量数据处理方法
CN112685534B (zh) 在创作过程中生成已创作内容的脉络信息的方法与设备
CN111615178B (zh) 识别无线网络类型及模型训练的方法、装置及电子设备
CN113536742A (zh) 基于知识图谱的描述文本生成方法、装置及电子设备
CN113918796A (zh) 信息搜索方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant