CN111511016B - 确定同源无线网络的方法、装置、服务器及存储介质 - Google Patents
确定同源无线网络的方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN111511016B CN111511016B CN202010273860.8A CN202010273860A CN111511016B CN 111511016 B CN111511016 B CN 111511016B CN 202010273860 A CN202010273860 A CN 202010273860A CN 111511016 B CN111511016 B CN 111511016B
- Authority
- CN
- China
- Prior art keywords
- mac addresses
- initial
- neural network
- determining
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/618—Details of network addresses
- H04L2101/622—Layer-2 addresses, e.g. medium access control [MAC] addresses
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/69—Types of network addresses using geographic information, e.g. room number
Abstract
本申请公开了一种确定同源无线网络的方法、装置、服务器及存储介质,属于定位技术领域。所述方法包括:确定在终端一次扫描无线网络的过程中得到的多个无线网络分别对应的MAC地址的初始特征。将多个MAC地址的初始特征分别输入目标神经网络模型中,输出各个MAC地址的特征向量,该特征向量用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系。基于多个MAC地址的特征向量,确定多个无线网络中的同源无线网络。如此,可以避免使用编辑距离时无法识别出编辑距离较大的同源无线网络的问题,且使用MAC地址的特征向量提高了确定同源无线网络的准确性,进而提高了确定的终端的位置的准确性。
Description
技术领域
本申请涉及定位技术领域,特别涉及一种确定同源无线网络的方法、装置、服务器及存储介质。
背景技术
同源无线网络是来自同一个无线AP(Access Point,访问接入点)的多个无线网络,且该多个无线网络中任意两个无线网络的MAC(Media Access Control,媒体介入控制)地址互不相同。例如,无线网络可以为Wi-Fi(Wireless Fidelity,无线保真),同源无线网络可以是同一个路由器发射的Wi-Fi。在基于无线网络进行定位的场景下,可以根据多个无线网络的MAC地址确定终端的位置。但多个无线网络中可能存在同源无线网络,由于同源无线网络可能会影响定位的准确性,导致确定的终端的位置不准确,因此,亟需一种可以确定同源无线网络的方法。
相关技术中,对于多个无线网络中的任意两个无线网络,可以先确定该任意两个无线网络的MAC地址之间的编辑距离,若该编辑距离小于编辑距离阈值,可以确定该任意两个无线网络是同源无线网络。但这种方法无法识别出MAC地址之间的编辑距离较大的同源无线网络,因此,使用该种方式确定同源无线网络后进行定位,仍然可能导致确定的终端的位置不准确。
发明内容
本申请提供了一种确定同源无线网络的方法、装置、服务器及存储介质,可以提高相关技术中确定的终端的位置的准确性。所述技术方案如下:
一方面,提供了一种确定同源无线网络的方法,所述方法包括:
确定多个无线网络分别对应的MAC地址的初始特征,所述多个无线网络的MAC地址是在终端一次扫描无线网络的过程中得到的;
将所述多个MAC地址的初始特征分别输入目标神经网络模型中,输出所述多个MAC地址中各个MAC地址的特征向量,所述特征向量用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系;
基于所述多个MAC地址的特征向量,确定所述多个无线网络中的同源无线网络,所述同源无线网络是来自同一个无线访问接入点的多个无线网络。
另一方面,提供了一种确定同源无线网络的装置,所述装置包括:
第一确定模块,用于确定多个无线网络分别对应的MAC地址的初始特征,所述多个无线网络的MAC地址是在终端一次扫描无线网络的过程中得到的;
输出模块,用于将所述多个MAC地址的初始特征分别输入目标神经网络模型中,输出所述多个MAC地址中各个MAC地址的特征向量,所述特征向量用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系;
第二确定模块,用于基于所述多个MAC地址的特征向量,确定所述多个无线网络中的同源无线网络,所述同源无线网络是来自同一个无线访问接入点的多个无线网络。
另一方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现上述所述的确定同源无线网络的方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现上述所述的确定同源无线网络的方法。
另一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的确定同源无线网络的方法。
本申请提供的技术方案至少可以带来以下有益效果:
在确定同源无线网络的过程中,由于仅通过各个无线网络的MAC地址的初始特征可能无法识别出一些同源无线网络,因此,对于获取到的终端一次扫描过程中得到的多个无线网络,确定多个无线网络分别对应的MAC地址的初始特征后,可以将多个MAC地址的初始特征分别输入目标神经网络模型中,通过目标神经网络模型对各个MAC地址的初始特征进行转换,得到多个MAC地址中各个MAC地址的特征向量。由于特征向量可以用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系,能够更好地对相应的MAC地址进行表示,因此,基于多个MAC地址的特征向量,可以确定多个无线网络中来自同一个无线访问接入点的无线网络,即同源无线网络。如此,可以避免使用编辑距离时无法识别出编辑距离较大的同源无线网络的问题,且使用MAC地址的特征向量提高了确定同源无线网络的准确性,进而提高了确定的终端的位置的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种实施环境的示意图;
图2是根据一示例性实施例示出的一种确定同源无线网络的方法的流程图;
图3是根据一示例性实施例示出的一种确定终端的位置信息的流程图;
图4是根据一示例性实施例示出的一种训练框架的结构示意图;
图5是根据一示例性实施例示出的一种确定样本二元组以及各个样本二元组的标签的流程图;
图6是根据一示例性实施例示出的一种确定同源无线网络的装置的结构示意图;
图7是根据一示例性实施例示出的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
本申请中术语“至少一个”是指一个或多个,“多个”的含义是指两个或两个以上,例如,多个第一位置是指两个或两个以上的第一位置。
在对本申请实施例提供的确定同源无线网络的方法进行详细的解释说明之前,先对本申请实施例提供的应用场景和实施环境进行介绍。
首先,对本申请实施例提供的应用场景进行介绍。
本申请实施例提供的确定同源无线网络的方法可以应用在多种场景中,接下来,以定位场景为例,对本方案的应用场景进行介绍。
在基于无线网络进行定位的场景下,若终端中包括定位功能的应用需要进行定位,可以在终端上显示获取当前位置的窗口,该窗口包括“是”和“否”两个选项,响应于对“是”选项的触发操作,终端可以对周围的无线网络进行一次扫描,可以扫描到多个无线网络,并获取各个无线网络对应的MAC地址,然后终端向服务器发送定位请求,该定位请求中携带多个无线网络对应的MAC地址,服务器接收到该定位请求后,可以基于该多个无线网络对应的MAC地址确定终端的位置信息。为了减轻多个无线网络中同源无线网络对定位准确性的影响,可以先确定多个无线网络中的同源无线网络,然后对多组同源无线网络分别进行去重处理,再基于去重处理后的多个无线网络确定终端的位置信息。
例如,服务器接收到携带多个无线网络的MAC地址的定位请求后,对于多个无线网络中的任意两个无线网络,可以确定该任意两个无线网络的MAC地址中,相同位置的字符之间的字符距离,可以得到至少一个字符距离,将该至少一个字符距离之和确定为该任意两个无线网络的MAC地址之间的字符串距离,若该字符串距离小于字符串距离阈值,可以确定该任意两个无线网络是同源无线网络,进而可以确定出多个无线网络中的多组同源无线网络。然后对多组同源无线网络进行去重,基于去重后的多个无线网络确定终端的位置信息。但这种方法无法识别出MAC地址之间的字符串距离较大的同源无线网络,因此,使用该种方式确定的同源无线网络可能不完全,去重后的多个无线网络中可能仍然包括同源无线网络,导致得到的定位结果可能不准确。
为此,本申请实施例提供了一种确定同源无线网络的方法,可以解决上述问题,具体实现可以参见下述各个实施例。
接下来,对本申请实施例提供的实施环境进行介绍。
参见图1,图1是根据一示例性实施例示出的一种实施环境的示意图。该实施环境包括终端101和服务器102,终端101可以与服务器102进行通信连接。该通信连接可以为有线或者无线连接,本申请实施例对此不做限定。
作为一种示例,终端101可以安装有包括定位功能的应用,在该应用需要定位时,终端101可以扫描周围的无线网络,并向服务器102发送包括扫描到的无线网络的MAC地址的定位请求,并接收服务器102发送的包括终端的位置信息的定位响应。该终端101可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如PC(Personal Computer,个人计算机)、手机、智能手机、PDA(Personal Digital Assistant,个人数字助手)、掌上电脑PPC(Pocket PC)、平板电脑、智能车机、智能电视等,本申请实施例对此不做限定。
作为一种示例,服务器102可以接收终端101发送的携带多个无线网络的MAC地址的定位请求,基于多个MAC地址,确定多个无线网络中的同源无线网络,然后对同源无线网络进行去重处理,基于去重处理后的多个无线网络分别对应的MAC地址确定终端101的位置信息,并向终端101发送携带该位置信息的定位响应。该服务器102可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心,本申请实施例对此不作限定。
本领域技术人员应能理解上述终端101和服务器102仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
介绍完本申请实施例提供的应用场景和实施环境之后,接下来对本申请实施例提供的确定同源无线网络的方法进行详细的解释说明。
图2是根据一示例性实施例示出的一种确定同源无线网络的方法的流程图,该方法应用于上述实施环境的服务器中。请参考图2,该方法可以包括如下步骤:
步骤201:确定多个无线网络分别对应的MAC地址的初始特征,该多个无线网络的MAC地址是在终端一次扫描无线网络的过程中得到的。
在实施中,无线网络对应的MAC地址的初始特征可以包括频次、实际物理位置和独热码。其中,频次为相应的MAC地址在第一时长内被扫描到的次数。作为一种示例,无线网络对应的MAC地址的初始特征还可以包括无线网络的信号强度、网速等。
需要说明的是,第一时长可以由用户根据实际需求进行设置,也可以由服务器默认设置,本申请实施例对此不做限定。例如,第一时长可以为一个月、一周等。
也就是说,对于多个无线网络中的一个无线网络,可以确定该无线网络对应的MAC地址的频次、实际物理位置和独热码,进而确定该无线网络对应的MAC地址的初始特征,对于多个无线网络均进行上述操作后,可以确定多个无线网络分别对应的MAC地址的初始特征。
在一些实施例中,服务器中可以预先存储有MAC地址库、MAC地址与实际物理位置的对应关系、以及MAC地址的字符与独热码的字符的转换关系。其中,MAC地址库中可以包括当前时间之前多次扫描到的无线网络的MAC地址。为了方便理解,将多个无线网络中的一个无线网络称为参考无线网络,将参考无线网络对应的MAC地址称为参考MAC地址。
在这种情况下,确定参考MAC地址的频次的具体实现可以包括:在MAC地址库中统计参考MAC地址在第一时长内被扫描到的次数,将统计到的次数确定为该参考MAC地址的频次。例如,假设第一时长为1个月,在1个月内,参考MAC地址被扫描到28次,可以确定该参考MAC地址的频次为28。
作为一种示例,确定参考MAC地址的实际物理位置的具体实现可以包括:根据存储的MAC地址与实际物理位置的对应关系,直接确定参考MAC地址对应的实际物理位置。
作为一种示例,确定参考MAC地址的独热码的具体实现可以包括:根据存储的MAC地址的字符与独热码的字符的转换关系,对参考MAC地址的字符进行转换,可以确定参考MAC地址的独热码。
步骤202:将多个MAC地址的初始特征分别输入目标神经网络模型中,输出多个MAC地址中各个MAC地址的特征向量,特征向量用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系。
其中,目标神经网络模型为经过训练的神经网络模型。作为一种示例,该目标神经网络模型可以Embedding(嵌入)神经网络模型、自动编码机等。
虽然MAC地址的初始特征包括相应的MAC地址的频次、实际物理位置和独热码,但在初始特征中这三个特征是独立的,相互之间没有任何关联关系,对于相应的MAC地址的描述有限。因此,可以将该MAC地址的初始特征输入目标神经网络模型中,由目标神经网络模型对该初始特征进行处理,得到该MAC地址的特征向量。该特征向量不仅可以指示该MAC地址的初始特征,还可以指示初始特征中各个特征之间的关联关系,相比于初始特征,该特征向量能够更好地描述该MAC地址。
在实施中,可以将参考MAC地址的初始特征输入目标神经网络模型中,由目标神经网络模型对该参考MAC地址的初始特征进行处理,得到该参考MAC的特征向量。对于多个MAC地址均进行上述操作后,可以得到多个MAC地址中各个MAC地址的特征向量。
进一步地,训练得到目标神经网络模型的具体实现可以包括如下几个步骤:
(1)确定多个样本二元组以及各个样本二元组的标签,该样本二元组包括两个不同MAC地址的初始特征,该标签用于指示相应的样本二元组中两个不同MAC地址分别对应的无线网络是否为同源无线网络。
作为一种示例,标签可以用数字进行表示。例如,标签可以为1或0。若标签为1,表示相应的样本二元组中两个不同MAC地址分别对应的无线网络是同源无线网络,若标签为0,表示相应的样本二元组中两个不同MAC地址分别对应的无线网络不是同源无线网络。
对于模型训练来说,训练数据为样本和样本的真实标签。因此,可以先确定多个样本二元组以及各个样本二元组的标签。
在实施中,确定多个样本二元组的具体实现可以包括:获取多个目标MAC地址。分别确定与各个目标MAC地址对应的关联MAC地址,得到多个MAC地址组,其中,同一MAC地址组中的目标MAC地址与关联MAC地址在同一次扫描无线网络的过程中被扫描到。对于多个MAC地址组,将同一MAC地址组中两个不同MAC地址的初始特征确定为一个样本二元组,得到多个样本二元组。
也就是说,可以先获取多个目标MAC地址,然后分别确定与各个目标MAC地址在同一次扫描无线网络的过程中被扫描到的关联MAC地址,可以得到多个关联MAC地址。将一个目标MAC地址和一个与该目标MAC地址对应的关联MAC地址确定为一个MAC地址组,进而可以得到多个MAC地址组。对于一个MAC地址组来说,将该一个MAC地址组中两个不同MAC地址的初始特征确定为一个样本二元组,对于多个MAC地址组均进行上述操作后,可以得到多个样本二元组。
作为一种示例,服务器中可以预先存储有MAC地址库,可以直接从MAC地址库中随机获取多个目标MAC地址。
作为另一种示例,可以从MAC地址库中确定在第三时长内出现的频次大于频次阈值的多个MAC地址,得到多个目标MAC地址。
需要说明的是,第三时长可以由用户根据实际需求进行设置,也可以由服务器默认设置,本申请实施例对此不做限定。例如,第三时长可以为一年、三个月、一个月等。另外,第三时长与第一时长可以相同也可以不同,且第三时长和第一时长没有大小关系的限制。
需要说明的是,频次阈值可以由用户根据实际需求进行设置,也可以由服务器默认设置,本申请实施例对此不做限定。另外,频次阈值与第三时长相关。例如,若第三时长为一个月,频次阈值可以为25,若第三时长为三个月,频次阈值可以为60等。
也就是说,可以在MAC地址库中统计各个MAC地址在第三时长内被扫描到的次数,得到各个MAC地址在第三时长内出现的频次,然后将频次大于频次阈值的MAC地址确定为多个目标MAC地址。
作为一种示例,在MAC地址库中,可以将终端同一次扫描得到的多个MAC地址分为一组。在这种情况下,确定多个MAC地址组的具体实现可以包括:对于多个目标MAC地址中的一个目标MAC地址,确定MAC地址库中与该一个目标MAC地址在同一组的一个或多个MAC地址,将确定的一个或多个MAC地址确定为与该一个MAC地址对应的关联MAC地址。若与该一个MAC地址对应的关联MAC地址的数量为一个,可以得到一个MAC地址组,若与该一个MAC对应的关联MAC地址的数量为多个,可以得到多个MAC地址组。对于多个目标MAC地址均进行上述操作后,可以得到各个目标MAC地址对应的关联MAC地址,进而得到多个MAC地址组。
在实施中,确定各个样本二元组的标签的具体实现可以包括:确定参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离。其中,共现频次用于指示在第二时长内参考样本二元组中两个不同MAC地址被同时扫描到的次数,实际距离用于指示参考样本二元组中两个MAC地址对应的实际物理位置之间的距离,字符串距离用于指示参考样本二元组中两个不同MAC地址相同位置的字符之间的距离和,参考样本二元组为多个样本二元组中的一个样本二元组。将参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离进行加权运算,得到标签指示数值。根据标签指示数值,确定参考样本二元组的标签。
也就是说,可以确定参考样本二元组中两个不同MAC地址在第二时长内被同时扫描到的次数,即共现频次,两个不同MAC地址对应的实际物理位置之间的实际距离,两个不同MAC地址的编辑距离,以及两个不同MAC地址相同位置的字符之间的距离和,即字符串距离。然后分别确定该参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离的加权值,将该四个加权值进行求和运算,得到标签指示数值,然后根据标签指示数值确定参考样本二元组的标签。
作为一种示例,确定参考样本二元组中两个不同MAC地址的共现频次的具体实现可以包括:从MAC地址库中统计在第二时长内参考样本二元组中两个不同MAC地址被同时扫描到的次数,将统计的次数确定该参考样本二元组中两个不同MAC地址的共现频次。
作为一种示例,确定参考样本二元组中两个不同MAC地址的实际距离的具体实现可以包括:根据MAC地址与实际物理位置的对应关系,分别确定参考样本二元组中两个不同MAC地址对应的实际物理位置,然后基于两个不同MAC地址分别对应的实际物理位置,可以确定参考样本二元组中两个不同MAC地址的实际距离。
作为一种示例,确定参考样本二元组中两个不同MAC地址的编辑距离的具体实现可以包括:基于参考样本二元组中两个不同MAC地址,确定参考样本二元组中两个不同MAC地址的编辑距离。
例如,假设参考样本二元组中两个不同MAC地址分别为B808D7CAEAC0和B808D7CAECC1,这两个不同MAC地址的倒数第一位和倒数第三位的字符不同,通过修改倒数第一位和倒数第三位这两个位置的字符,可以使得两个MAC地址相同,因此编辑距离为2。
作为一种示例,确定参考样本二元组中两个不同MAC地址的字符串距离的具体实现可以包括:基于参考样本二元组中两个不同MAC地址,确定参考样本二元组中两个不同MAC地址中相同位置的字符之间的距离和,可以得到该参考样本二元组中两个不同MAC地址的字符串距离。
继续上述举例,假设参考样本二元组中两个不同MAC地址分别为B808D7CAEAC0和B808D7CAECC1,这两个不同MAC地址的倒数第一位和倒数第三位的字符不同,且倒数第一位两个字符分别为0和1,这两个字符之间的距离为1,倒数第三位两个字符分别为A与C,这两个字符之间的距离为2,因此,字符串距离为1+2=3。
作为一种示例,将参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离进行加权运算,得到标签指示数值的具体实现可以包括:将该共现频次与第一权重相乘,得到第一数值,将该实际距离与第二权重相乘,得到第二数值,将该编辑距离与第三权重相乘,得到第三距离,以及将该字符串距离与第四权重相乘,得到第四数值。然后将第一数值、第二数值、第三数值和第四数值之和确定为该参考样本二元组的标签指示数值。
需要说明的是,第一权重、第二权重、第三权重和第四权重均可以由用户根据实际需求进行设置,且可以根据实际情况进行修改,也可以由服务器默认设置,本申请实施例对此不做限定。例如,第一权重为0.2、第二权重为0.4、第三权重为0.2、第四权重为0.2。
作为一种示例,确定参考样本二元组的标签指示数值后,根据标签指示数值,确定参考样本二元组的标签的具体实现可以包括:根据标签指示数值和标签指示数值阈值,确定参考样本二元组的标签。
需要说明的是,标签指示数值阈值可以由用户根据实际需求进行设置,也可以由服务器默认设置,本申请实施例对此不做限定。
示例性地,若该标签指示数值大于标签指示数值阈值,说明该参考样本二元组中两个不同的MAC地址比较相似,可以确定该参考样本二元组中两个不同MAC地址对应的无线网络为同源无线网络,进而可以确定该参考样本二元组的标签为1,该标签用于指示该参考样本二元组中两个不同MAC地址对应的无线网络为同源无线网络。若该标签指示数值小于或等于标签指示数值阈值,说明该参考样本二元组中两个不同的MAC地址差别较大,可以确定该参考样本二元组中两个不同MAC地址对应的无线网络不是同源无线网络,进而可以确定该参考样本二元组的标签为0,该标签用于指示该参考样本二元组中两个不同MAC地址对应的无线网络不是同源无线网络。
在实施中,对多个样本二元组均进行上述操作后,可以确定各个样本二元组的标签。
需要说明的是,上述是通过参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离确定该参考样本二元组的标签。在另一些实施例中,可以由用户根据经验来标记各个样本二元组的标签,这样可以减少服务器的数据运算,减少对服务器计算资源的消耗。
(2)基于多个样本二元组和各个样本二元组的标签,对初始孪生神经网络模型进行训练,得到目标孪生神经网络模型,该初始孪生神经网络模型包括两个初始神经网络模型,且该两个初始神经网络模型的初始参数和架构相同。
其中,孪生神经网络模型是一种可以用来衡量两个输入数据的相似度的神经网络模型。而且,两个输入数据中一个输入孪生神经网络模型的一个神经网络模型中,另一个输入孪生神经网络模型的另一个神经网络模型中。
在实施中,基于多个样本二元组和各个样本二元组的标签,对初始孪生神经网络模型进行训练,得到目标孪生神经网络模型的具体实现可以包括:将多个样本二元组和各个样本二元组的标签输入第一初始神经网络模型,输出各个样本二元组的第一特征向量,以及将多个样本二元组和各个样本二元组的标签输入第二初始神经网络模型,输出各个样本二元组的第二特征向量,第一初始神经网络模型和第二初始神经网络模型为初始孪生神经网络模型包括的两个初始神经网络模型。基于各个样本二元组的第一特征向量、第二特征向量以及标签,确定多个样本二元组中各个样本二元组的交叉熵损失概率,得到多个交叉熵损失概率。若多个交叉熵损失概率中包括大于概率阈值的交叉熵损失概率,基于多个交叉熵损失概率,对第一初始神经网络模型和第二初始神经网络模型的初始参数分别进行调整,按照参数调整后的第一初始神经网络模型和第二初始神经网络模型,返回执行将多个样本二元组和各个样本二元组的标签输入第一初始神经网络模型的步骤,直到确定的多个交叉熵损失概率均小于概率阈值,将最后一次参数调整后的第一初始神经网络模型和第二初始神经网络模型确定为目标孪生神经网络模型。
需要说明的是,概率阈值可以由用户根据实际需求进行设置,也可以由服务器默认设置,本申请实施例对此不做限定。
其中,第一特征向量与相应的样本二元组中一个MAC地址对应,且第二特征向量与相应的样本二元组中另一个MAC地址对应。
也就是说,可以将初始孪生神经网络模型中的两个初始神经网络模型分别称为第一初始神经网络模型和第二初始神经网络模型。将多个样本二元组和各个样本二元组的标签输入第一初始神经网络模型中,可以得到各个样本二元组的第一特征向量,将多个样本二元组和各个样本二元组的标签输入第二初始神经网络模型中,可以得到各个样本二元组的第二特征向量。然后根据各个样本二元组的第一特征向量、第二特征向量和标签,可以确定各个样本二元组的交叉熵损失概率。若多个交叉熵损失概率中不包括大于概率阈值的交叉熵损失概率,说明第一神经网络模型和第二神经网络模型已经可以达到训练要求,可以将当前的第一神经网络模型和第二神经网络模型确定为目标孪生神经网络模型。若多个交叉熵损失概率中包括大于概率阈值的交叉熵损失概率,说明该第一神经网络模型和第二神经网络模型还未达到训练要求,可以基于多个交叉熵损失概率,对第一初始神经网络模型和第二初始神经网络模型的初始参数分别进行调整,然后基于参数调整后的第一初始神经网络模型和第二神经网络模型,重新执行将多个样本二元组和各个样本二元组的标签输入第一初始神经网络模型中的步骤,按照上述操作重新进行,直到确定的多个交叉熵损失概率中不包括大于概率阈值的交叉熵损失概率,说明第一神经网络模型和第二神经网络模型已经达到训练要求,可以停止训练,并且可以将距离当前时间最近一次参数调整后的第一神经网络模型和第二神经网络模型确定为目标孪生神经网络模型。
作为一种示例,对于参考样本二元组来说,可以基于该参考样本二元组的第一特征向量、第二特征向量以及标签,通过如下公式(1)确定该参考样本二元组的交叉熵损失概率。其中,参考样本二元组为多个样本二元组中的一个样本二元组。
Loss=cross_entropy{softmax(|Maci-Macj|2),labelij} (1)
其中,Maci表示参考样本二元组的第一特征向量,Macj表示参考样本二元组的第二特征向量,labelij表示参考样本二元组的标签,softmax(|Maci-Macj|2)表示参考样本二元组的预测标签,Loss表示该参考样本二元组的交叉熵损失概率。
对于多个样本二元组,均按照公式(1)进行计算后,可以得到多个样本二元组中各个样本二元组的交叉熵损失概率。
(3)将目标孪生神经网络模型中的任一个神经网络模型确定为目标神经网络模型。
由于初始孪生神经网络模型中的两个初始神经网络模型的初始参数和模型架构是相同的,且在训练过程中,基于相同的交叉熵损失概率对这两个初始神经网络模型的参数进行调整,因此,目标孪生神经网络模型中的两个神经网络模型的模型参数和模型架构是相同的,而且模型性能也是相同的。所以,可以将目标孪生神经网络模型中的任一个神经网络模型确定为目标神经网络模型。
步骤203:基于多个MAC地址的特征向量,确定多个无线网络中的同源无线网络,同源无线网络是来自同一个无线访问接入点的多个无线网络。
由于特征向量能够更好地描述对应的MAC地址,因此,可以基于多个MAC地址的特征向量,确定多个无线网络中的同源无线网络。
在实施中,基于多个MAC地址的特征向量,确定多个无线网络中的同源无线网络的具体实现可以包括:基于多个MAC地址的特征向量,确定多个MAC地址中任意两个MAC地址的相似度。将相似度大于相似度阈值的两个MAC地址对应的无线网络确定为同源无线网络。
需要说明的是,相似度阈值可以由用户根据实际需求进行设置,也可以由服务器默认设置,本申请实施例对此不做限定。
也就是说,可以确定多个MAC地址中任意两个MAC地址的相似度,然后根据相似度与相似度阈值的大小关系,确定多个无线网络中的同源无线网络。
作为一种示例,可以将多个MAC地址随机进行两两配对,得到多个MAC地址对,该多个MAC地址对包括多个MAC地址两两配对的所有组合方式。然后基于多个MAC地址的特征向量,分别确定每个MAC地址对中两个MAC地址的相似度,得到多个相似度,将相似度大于相似度阈值的MAC地址对中的两个MAC地址对应的无线网络确定为同源网络。
示例性地,假设多个MAC地址分别表示为X、Y、Z、Q,对该多个MAC地址进行两两配对,可以得到三个MAC地址对,分别为(X,Y)、(Y,Z)、(X,Z)、(X,Q)、(Y,Q)、(Z,Q)。假设X和Y的相似度大于相似度阈值,Y和Z的相似度小于相似度阈值,X和Z的相似度小于相似度阈值X和Q的相似度小于相似度阈值,Y和Q的相似度小于相似度阈值,Z和Q的相似度大于相似度阈值。可以确定X和Y对应的无线网络为同源无线网络,Z和Q对应的无线网络为同源无线网络。
作为一种示例,确定两个MAC地址的相似度的具体实现可以包括:确定两个MAC地址的特征向量之间的距离,该距离可以为欧式距离、马氏距离、曼哈顿距离、切比雪夫距离等,且该距离与相似度负相关,即距离越大,相似度越低,距离越小,相似度越高。
作为一种示例,确定两个MAC地址的特征向量之间的距离之后,由于距离与相似度负相关,因此,可以直接将距离的倒数确定为该两个MAC地址的相似度。
需要说明的是,上述实施例中均是以目标神经网络模型为Embedding(嵌入)神经网络模型或自动编码机为例对本方案进行说明。在另一些实施例中,目标神经网络模型可以为CNN(Convolutional Neural Network)卷积神经网络模型,在这种情况下,可以将MAC地址的初始特征转化为图像特征,然后将MAC地址的图像特征输入目标神经网络模型中,输出该MAC地址的特征向量。另外,目标神经网络模型为CNN模型,说明两个初始神经网络模型也为CNN模型,因此,在对初始孪生神经网络模型进行训练的过程中,输入的样本二元组中包括的是两个不同MAC地址的图像特征。
需要说明的是,基于上述几个步骤,已经可以实现本申请的技术方案。由于本申请的技术方案可以应用在多个场景中,接下来以定位场景为例,介绍确定同源无线网络的方法的应用。
在通过无线网络进行定位的场景中,服务器可以接收终端发送的定位请求,该定位请求中携带多个无线网络对应的MAC地址。然后服务器可以按照上述步骤201-步骤203确定多个无线网络中的同源无线网络,确定同源无线网络后,服务器可以将多个MAC地址中属于同一组同源无线网络中的MAC地址进行去重处理。基于去重处理后的多个MAC地址,确定终端的位置信息。再向终端发送定位响应,定位响应中携带位置信息。
也就是说,在通过无线网络进行定位场景中,多个无线网络的MAC地址被携带在终端发送给服务器的定位请求中,服务器接收到该定位请求后,可以按照上述步骤201-步骤203确定多个无线网络中的同源无线网络。确定同源无线网络后,服务器可以对每一组同源无线网络对应的MAC地址进行去重处理,在每一组同源无线网络中保留一个同源无线网络,然后根据去重处理后的多个MAC地址确定终端的位置信息,并向终端发送携带该位置信息的定位响应。
作为一种示例,在需要定位时,终端可以对周围的无线网络进行一次扫描,得到多个无线网络对应的MAC地址,并向服务器发送携带该多个无线网络对应的MAC地址的定位请求。服务器接收到终端发送的定位请求后,可以对该定位请求携带的多个无线网络分别对应的MAC地址进行上述步骤201-步骤203的操作,确定该多个无线网络中的同源无线网络。
作为一种示例,对多个MAC地址中属于同一组同源无线网络中的MAC地址进行去重处理后,基于去重处理后的多个MAC地址,确定终端的位置信息的具体实现可以包括:对去重处理后的多个MAC地址进行聚类,将该多个MAC地址分为N个簇,将包括的MAC地址的数量最多的簇确定为目标簇,然后确定目标簇中各个MAC地址的实际物理位置,对该目标簇中多个MAC地址的实际物理位置进行加权取平均,得到终端的位置信息。
其中,N为大于1的正整数,且N可以由用户根据实际需求进行设置,也可以由服务器默认设置,本申请实施例对此不做限定。
在本申请实施例中,在确定同源无线网络的过程中,由于仅通过各个无线网络的MAC地址的初始特征可能无法识别出一些同源无线网络,因此,对于获取到的终端一次扫描过程中得到的多个无线网络,确定多个无线网络分别对应的MAC地址的初始特征后,可以将多个MAC地址的初始特征分别输入目标神经网络模型中,通过目标神经网络模型对各个MAC地址的初始特征进行转换,得到多个MAC地址中各个MAC地址的特征向量。由于特征向量可以用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系,能够更好地对相应的MAC地址进行表示,因此,基于多个MAC地址的特征向量,可以确定多个无线网络中来自同一个无线访问接入点的无线网络,即同源无线网络。如此,可以避免使用编辑距离时无法识别出编辑距离较大的同源无线网络的问题,且使用MAC地址的特征向量提高了确定同源无线网络的准确性,进而提高了确定的终端的位置的准确性。
为了便于理解,接下来结合图3、图4和图5,对本申请实施例提出的确定同源无线网络的方法进行解释说明。
参见图3,图3是根据一示例性实施例示出的一种确定终端的位置信息的流程图。图3中包括定位请求模块301、同源无线网络识别模块302和无线网络定位模块303。定位请求模块301用于从定位请求中获取多个MAC地址,然后从MAC地址库中确定各个MAC地址的频次,根据MAC地址与实际物理位置的对应关系,确定各个MAC地址的实际物理位置。同源无线网络识别模块302用于根据MAC地址的频次、实际物理位置和独热码,确定相应的MAC地址的初始特征,然后将MAC地址的初始特征输入目标神经网络模型中,可以输出相应的MAC地址的特征向量,如此可以确定多个MAC地址中各个MAC地址的特征向量,然后可以计算任意两个MAC地址之间的欧氏距离,用欧式距离来表示该任意两个MAC地址的相似度。无线网络定位模块303用于对属于同一组同源无线网络中的MAC地址进行去重处理,然后基于去重后的多个MAC地址确定终端的位置信息,并向终端返回携带位置信息的定位响应。
作为一种示例,图3中的目标神经网络模型是经过训练得到的。模型训练的过程可以参见图4,图4是根据一示例性实施例示出的一种训练框架的结构示意图。该训练框架可以包括同源无线网络采样层401、深度网络表示层402和同源无线网络度量层403。其中,深度网络表示层402和同源无线网络度量层403属于初始孪生神经网络模型,初始孪生神经网络模型包括两个初始神经网络模型。
其中,同源无线网络采样层401用于确定多个样本二元组。深度网络表示层402用于确定各个样本二元组的第一特征向量和第二特征向量,并将第一特征向量和第二特征向量输入至同源无线网络度量层403。深度网络表示层402包括第一初始神经网络模型M+和第二初始神经网络模型M-,Mi +和Mi -是任一个样本二元组中包括的两个MAC地址的初始特征,第一初始神经网络模型用于确定Mi +的特征向量M(Pi +),即该任一样本二元组的第一特征向量。第二初始神经网络模型用于确定Mi -的特征向量M(Pi -),即该任一样本二元组的第二特征向量。同源无线网络度量层403用于根据样本二元组的第一特征向量M(Pi +)和第二特征向量M(Pi -)以及标签,确定该样本二元组的交叉熵损失概率,并将交叉熵损失概率返回给深度网络表示层402。深度网络表示层402还用于基于该交叉熵损失概率对第一初始神经网络模型和第二初始神经网络模型的参数进行调整,即对初始孪生神经网络模型的参数进行调整。对初始孪生神经网络模型训练结束后,可以得到目标孪生神经网络模型,将目标孪生神经网络模型中的任一神经网络模型可以确定为目标神经网络模型。
作为一种示例,同源无线网络采样层401确定多个样本二元组的具体实现可以参见图5,图5是根据一示例性实施例示出的一种确定样本二元组以及各个样本二元组的标签的流程图。在图5中,步骤501是从MAC地址库中确定目标MAC地址。其中,Mac1-Macn表示多个目标MAC地址。步骤502是基于目标MAC地址,构造多个MAC地址组。其中,(Mac1,Macq)是一个MAC地址组,Mac1表示目标MAC地址,Macq表示与该目标MAC地址Mac1对应的关联MAC地址。步骤503是根据MAC地址的频次、实际距离、编辑距离和字符串距离确定对应的样本二元组的标签,或者,直接由人工标注样本二元组的标签。其中,<Mac1,Macq>是MAC地址组(Mac1,Macq)对应的样本二元组,L1q表示样本二元组<Mac1,Macq>的标签,<Mac1,Macq>=L1q表示样本二元组<Mac1,Macq>的标签为L1q。
图6是根据一示例性实施例示出的一种确定同源无线网络的装置的结构示意图,该确定同源无线网络的装置可以由软件、硬件或者两者的结合实现成为服务器的部分或者全部,服务器可以为图1所示的服务器。请参考图6,该装置包括:第一确定模块601、输出模块602和第二确定模块603。
第一确定模块601,用于确定多个无线网络分别对应的媒体接入控制MAC地址的初始特征,该多个无线网络的MAC地址是在终端一次扫描无线网络的过程中得到的;
输出模块602,用于将多个MAC地址的初始特征分别输入目标神经网络模型中,输出多个MAC地址中各个MAC地址的特征向量,该特征向量用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系;
第二确定模块603,用于基于多个MAC地址的特征向量,确定多个无线网络中的同源无线网络,该同源无线网络是来自同一个无线访问接入点的多个无线网络。
在本申请一种可能的实现方式中,无线网络对应的MAC地址的初始特征包括频次、实际物理位置和独热码,该频次为相应的MAC地址在第一时长内被扫描到的次数。
在本申请一种可能的实现方式中,该第二确定模块603还用于:
确定多个样本二元组以及各个样本二元组的标签,样本二元组包括两个不同MAC地址的初始特征,该标签用于指示相应的样本二元组中两个不同MAC地址分别对应的无线网络是否为同源无线网络;
基于多个样本二元组和各个样本二元组的标签,对初始孪生神经网络模型进行训练,得到目标孪生神经网络模型,该初始孪生神经网络模型包括两个初始神经网络模型,两个初始神经网络模型的初始参数和架构相同;
将目标孪生神经网络模型中的任一个神经网络模型确定为目标神经网络模型。
在本申请一种可能的实现方式中,该第二确定模块603还用于:
获取多个目标MAC地址;
分别确定与各个目标MAC地址对应的关联MAC地址,得到多个MAC地址组,其中,同一MAC地址组中的目标MAC地址与关联MAC地址在同一次扫描无线网络的过程中被扫描到;
对于多个MAC地址组,将同一MAC地址组中两个不同MAC地址的初始特征确定为一个样本二元组,得到多个样本二元组。
在本申请一种可能的实现方式中,该第二确定模块603还用于:
确定参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离,该共现频次用于指示在第二时长内参考样本二元组中两个不同MAC地址被同时扫描到的次数,该实际距离用于指示参考样本二元组中两个MAC地址对应的实际物理位置之间的距离,该字符串距离用于指示参考样本二元组中两个不同MAC地址相同位置的字符之间的距离和,该参考样本二元组为多个样本二元组中的一个样本二元组;
将参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离进行加权运算,得到标签指示数值;
根据标签指示数值,确定参考样本二元组的标签。
在本申请一种可能的实现方式中,该第二确定模块603还用于:
将多个样本二元组和各个样本二元组的标签输入第一初始神经网络模型,输出各个样本二元组的第一特征向量,以及将多个样本二元组和各个样本二元组的标签输入第二初始神经网络模型,输出各个样本二元组的第二特征向量,第一初始神经网络模型和第二初始神经网络模型为初始孪生神经网络模型包括的两个初始神经网络模型;
基于各个样本二元组的第一特征向量、第二特征向量以及标签,确定多个样本二元组中各个样本二元组的交叉熵损失概率,得到多个交叉熵损失概率;
若多个交叉熵损失概率中包括大于概率阈值的交叉熵损失概率,基于多个交叉熵损失概率,对第一初始神经网络模型和第二初始神经网络模型的初始参数分别进行调整,按照参数调整后的第一初始神经网络模型和第二初始神经网络模型,返回执行将多个样本二元组和各个样本二元组的标签输入第一初始神经网络模型的步骤,直到确定的多个交叉熵损失概率均小于概率阈值,将最后一次参数调整后的第一初始神经网络模型和第二初始神经网络模型确定为目标孪生神经网络模型。
在本申请一种可能的实现方式中,该第一确定模块601还用于:
接收终端发送的定位请求,定位请求中携带多个无线网络对应的MAC地址;
该第二确定模块603还用于:
将多个MAC地址中属于同一组同源无线网络中的MAC地址进行去重处理;
基于去重处理后的多个MAC地址,确定终端的位置信息;
向终端发送定位响应,定位响应中携带位置信息。
在本申请实施例中,在确定同源无线网络的过程中,由于仅通过各个无线网络的MAC地址的初始特征可能无法识别出一些同源无线网络,因此,对于获取到的终端一次扫描过程中得到的多个无线网络,确定多个无线网络分别对应的MAC地址的初始特征后,可以将多个MAC地址的初始特征分别输入目标神经网络模型中,通过目标神经网络模型对各个MAC地址的初始特征进行转换,得到多个MAC地址中各个MAC地址的特征向量。由于特征向量可以用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系,能够更好地对相应的MAC地址进行表示,因此,基于多个MAC地址的特征向量,可以确定多个无线网络中来自同一个无线访问接入点的无线网络,即同源无线网络。如此,可以避免使用编辑距离时无法识别出编辑距离较大的同源无线网络的问题,且使用MAC地址的特征向量提高了确定同源无线网络的准确性,进而提高了确定的终端的位置的准确性。
需要说明的是:上述实施例提供的确定同源无线网络的装置在确定同源无线网络时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的确定同源无线网络的装置与确定同源无线网络的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7是根据一示例性实施例示出的一种服务器的结构示意图。服务器700包括中央处理单元(CPU,Central Processing Unit)701、包括随机存取存储器(RAM,Random AccessMemory)702和只读存储器(ROM,Read-Only Memory)703的系统存储器704,以及连接系统存储器704和中央处理单元701的系统总线705。服务器700还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统,Input/Output系统)706,和用于存储操作系统713、应用程序714和其他程序模块715的大容量存储设备707。
基本输入/输出系统706包括有用于显示信息的显示器708和用于用户输入信息的诸如鼠标、键盘之类的输入设备709。其中显示器708和输入设备709都通过连接到系统总线705的输入输出控制器710连接到中央处理单元701。基本输入/输出系统706还可以包括输入输出控制器710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器710还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备707通过连接到系统总线705的大容量存储控制器(未示出)连接到中央处理单元701。大容量存储设备707及其相关联的计算机可读介质为服务器700提供非易失性存储。也就是说,大容量存储设备707可以包括诸如硬盘或者CD-ROM(CompactDisc Read-Only Memory,压缩光盘-只读存储器)驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM(Erasable Programmable Read-Only Memory,可擦除可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,带电可擦可编程只读存储器)、闪存或其他固态存储其技术,CD-ROM、DVD(Digital Versatile Disc,数字通用光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器704和大容量存储设备707可以统称为存储器。
根据本申请的各种实施例,服务器700还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器700可以通过连接在系统总线705上的网络接口单元711连接到网络712,或者说,也可以使用网络接口单元711来连接到其他类型的网络或远程计算机系统(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。
在一些实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述实施例中确定同源无线网络的方法。例如,所述计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘和光数据存储设备等。
值得注意的是,本申请提到的计算机可读存储介质可以为非易失性存储介质,换句话说,可以是非瞬时性存储介质。
应当理解的是,实现上述实施例的全部或部分步骤可以通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。所述计算机指令可以存储在上述计算机可读存储介质中。
也即是,在一些实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的确定同源无线网络的方法。
以上所述为本申请提供的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (9)
1.一种确定同源无线网络的方法,其特征在于,所述方法包括:
确定多个无线网络分别对应的媒体接入控制MAC地址的初始特征,所述多个无线网络的MAC地址是在终端一次扫描无线网络的过程中得到的,所述无线网络对应的MAC地址的初始特征包括频次、实际物理位置和独热码,所述频次为相应的MAC地址在第一时长内被扫描到的次数;
将所述多个MAC地址的初始特征分别输入目标神经网络模型中,输出所述多个MAC地址中各个MAC地址的特征向量,所述特征向量用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系;
基于所述多个MAC地址的特征向量,确定所述多个无线网络中的同源无线网络,所述同源无线网络是来自同一个无线访问接入点的多个无线网络。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定多个样本二元组以及各个样本二元组的标签,所述样本二元组包括两个不同MAC地址的初始特征,所述标签用于指示相应的样本二元组中两个不同MAC地址分别对应的无线网络是否为同源无线网络;
基于所述多个样本二元组和各个样本二元组的标签,对初始孪生神经网络模型进行训练,得到目标孪生神经网络模型,所述初始孪生神经网络模型包括两个初始神经网络模型,所述两个初始神经网络模型的初始参数和架构相同;
将所述目标孪生神经网络模型中的任一个神经网络模型确定为所述目标神经网络模型。
3.如权利要求2所述的方法,其特征在于,所述确定多个样本二元组,包括:
获取多个目标MAC地址;
分别确定与各个目标MAC地址对应的关联MAC地址,得到多个MAC地址组,其中,同一MAC地址组中的目标MAC地址与关联MAC地址在同一次扫描无线网络的过程中被扫描到;
对于所述多个MAC地址组,将同一MAC地址组中两个不同MAC地址的初始特征确定为一个样本二元组,得到所述多个样本二元组。
4.如权利要求2所述的方法,其特征在于,所述确定各个样本二元组的标签,包括:
确定参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离,所述共现频次用于指示在第二时长内所述参考样本二元组中两个不同MAC地址被同时扫描到的次数,所述实际距离用于指示所述参考样本二元组中两个MAC地址对应的实际物理位置之间的距离,所述字符串距离用于指示所述参考样本二元组中两个不同MAC地址相同位置的字符之间的距离和,所述参考样本二元组为所述多个样本二元组中的一个样本二元组;
将所述参考样本二元组中两个不同MAC地址的共现频次、实际距离、编辑距离和字符串距离进行加权运算,得到标签指示数值;
根据所述标签指示数值,确定所述参考样本二元组的标签。
5.如权利要求2所述的方法,其特征在于,所述基于所述多个样本二元组和各个样本二元组的标签,对初始孪生神经网络模型进行训练,得到目标孪生神经网络模型,包括:
将所述多个样本二元组和各个样本二元组的标签输入第一初始神经网络模型,输出各个样本二元组的第一特征向量,以及将所述多个样本二元组和各个样本二元组的标签输入第二初始神经网络模型,输出各个样本二元组的第二特征向量,所述第一初始神经网络模型和所述第二初始神经网络模型为所述初始孪生神经网络模型包括的两个初始神经网络模型;
基于各个样本二元组的第一特征向量、第二特征向量以及标签,确定所述多个样本二元组中各个样本二元组的交叉熵损失概率,得到多个交叉熵损失概率;
若所述多个交叉熵损失概率中包括大于概率阈值的交叉熵损失概率,基于所述多个交叉熵损失概率,对所述第一初始神经网络模型和所述第二初始神经网络模型的初始参数分别进行调整,按照参数调整后的第一初始神经网络模型和第二初始神经网络模型,返回执行所述将所述多个样本二元组和各个样本二元组的标签输入第一初始神经网络模型的步骤,直到确定的多个交叉熵损失概率均小于所述概率阈值,将最后一次参数调整后的第一初始神经网络模型和第二初始神经网络模型确定为所述目标孪生神经网络模型。
6.如权利要求1所述的方法,其特征在于,所述确定多个无线网络分别对应的MAC地址的初始特征之前,还包括:
接收所述终端发送的定位请求,所述定位请求中携带所述多个无线网络对应的MAC地址;
所述基于所述多个MAC地址的特征向量,确定所述多个无线网络中的同源无线网络之后,还包括:
将所述多个MAC地址中属于同一组同源无线网络中的MAC地址进行去重处理;
基于去重处理后的多个MAC地址,确定所述终端的位置信息;
向所述终端发送定位响应,所述定位响应中携带所述位置信息。
7.一种确定同源无线网络的装置,其特征在于,所述装置包括:
第一确定模块,用于确定多个无线网络分别对应的MAC地址的初始特征,所述多个无线网络的MAC地址是在终端一次扫描无线网络的过程中得到的,所述无线网络对应的MAC地址的初始特征包括频次、实际物理位置和独热码,所述频次为相应的MAC地址在第一时长内被扫描到的次数;
输出模块,用于将所述多个MAC地址的初始特征分别输入目标神经网络模型中,输出所述多个MAC地址中各个MAC地址的特征向量,所述特征向量用于指示相应的MAC地址的初始特征以及初始特征中的各个特征之间的关联关系;
第二确定模块,用于基于所述多个MAC地址的特征向量,确定所述多个无线网络中的同源无线网络,所述同源无线网络是来自同一个无线访问接入点的多个无线网络。
8.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至6任一所述的确定同源无线网络的方法。
9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至6任一所述的确定同源无线网络的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010273860.8A CN111511016B (zh) | 2020-04-09 | 2020-04-09 | 确定同源无线网络的方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010273860.8A CN111511016B (zh) | 2020-04-09 | 2020-04-09 | 确定同源无线网络的方法、装置、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111511016A CN111511016A (zh) | 2020-08-07 |
CN111511016B true CN111511016B (zh) | 2021-10-08 |
Family
ID=71870868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010273860.8A Active CN111511016B (zh) | 2020-04-09 | 2020-04-09 | 确定同源无线网络的方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111511016B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113766545B (zh) * | 2021-09-30 | 2024-04-09 | 贝壳找房(北京)科技有限公司 | 无线网络的身份识别方法和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8989101B1 (en) * | 2013-06-27 | 2015-03-24 | Google Inc. | Systems, methods, and computer-readable media for identifying virtual access points of wireless networks |
CN104618521A (zh) * | 2013-11-05 | 2015-05-13 | 太阳风环球有限责任公司 | 网络监测系统中的节点去重 |
CN105850200A (zh) * | 2013-11-12 | 2016-08-10 | 高通股份有限公司 | 用于将识别虚拟接入点的辅助数据从服务器递送到装置的方法和设备 |
CN108363783A (zh) * | 2018-02-11 | 2018-08-03 | 杭州中奥科技有限公司 | Mac地址与身份信息的绑定方法及装置 |
CN108449778A (zh) * | 2018-06-01 | 2018-08-24 | 上海连尚网络科技有限公司 | 一种无线接入点展示方法及装置、以及终端设备 |
CN110475274A (zh) * | 2018-05-09 | 2019-11-19 | 北京智慧图科技有限责任公司 | 一种移动定位技术中异常ap的识别方法 |
CN110474905A (zh) * | 2019-08-16 | 2019-11-19 | 北京百度网讯科技有限公司 | 实体识别方法、装置、电子设备和存储介质 |
CN110659744A (zh) * | 2019-09-26 | 2020-01-07 | 支付宝(杭州)信息技术有限公司 | 训练事件预测模型、评估操作事件的方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160027861A (ko) * | 2014-09-02 | 2016-03-10 | 삼성전자주식회사 | 통신 채널 운용 방법 및 이를 지원하는 전자 장치 |
CN110033023B (zh) * | 2019-03-11 | 2021-06-15 | 北京光年无限科技有限公司 | 一种基于绘本识别的图像数据处理方法及系统 |
-
2020
- 2020-04-09 CN CN202010273860.8A patent/CN111511016B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8989101B1 (en) * | 2013-06-27 | 2015-03-24 | Google Inc. | Systems, methods, and computer-readable media for identifying virtual access points of wireless networks |
CN104618521A (zh) * | 2013-11-05 | 2015-05-13 | 太阳风环球有限责任公司 | 网络监测系统中的节点去重 |
CN105850200A (zh) * | 2013-11-12 | 2016-08-10 | 高通股份有限公司 | 用于将识别虚拟接入点的辅助数据从服务器递送到装置的方法和设备 |
CN108363783A (zh) * | 2018-02-11 | 2018-08-03 | 杭州中奥科技有限公司 | Mac地址与身份信息的绑定方法及装置 |
CN110475274A (zh) * | 2018-05-09 | 2019-11-19 | 北京智慧图科技有限责任公司 | 一种移动定位技术中异常ap的识别方法 |
CN108449778A (zh) * | 2018-06-01 | 2018-08-24 | 上海连尚网络科技有限公司 | 一种无线接入点展示方法及装置、以及终端设备 |
CN110474905A (zh) * | 2019-08-16 | 2019-11-19 | 北京百度网讯科技有限公司 | 实体识别方法、装置、电子设备和存储介质 |
CN110659744A (zh) * | 2019-09-26 | 2020-01-07 | 支付宝(杭州)信息技术有限公司 | 训练事件预测模型、评估操作事件的方法及装置 |
Non-Patent Citations (1)
Title |
---|
一种基于word2vec的文本分类方法;薛炜明;《北京信息科技大学学报》;20180215;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111511016A (zh) | 2020-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110636445B (zh) | 基于wifi的室内定位方法、装置、设备及介质 | |
CN109948735B (zh) | 一种多标签分类方法、系统、装置及存储介质 | |
CN112328715B (zh) | 视觉定位方法及相关模型的训练方法及相关装置、设备 | |
CN111368636B (zh) | 目标分类方法、装置、计算机设备和存储介质 | |
US11714921B2 (en) | Image processing method with ash code on local feature vectors, image processing device and storage medium | |
CN113298197B (zh) | 数据聚类方法、装置、设备及可读存储介质 | |
CN110705489B (zh) | 目标识别网络的训练方法、装置、计算机设备和存储介质 | |
CN112200173B (zh) | 多网络模型训练方法、图像标注方法和人脸图像识别方法 | |
CN111144402A (zh) | Ocr识别准确率的计算方法、装置、设备以及存储介质 | |
CN111125658A (zh) | 识别欺诈用户的方法、装置、服务器和存储介质 | |
CN113315851A (zh) | 域名检测方法、装置及存储介质 | |
CN115496970A (zh) | 图像任务模型的训练方法、图像识别方法以及相关装置 | |
CN111511016B (zh) | 确定同源无线网络的方法、装置、服务器及存储介质 | |
CN115331213A (zh) | 字符识别方法、芯片、电子设备及存储介质 | |
CN115311469A (zh) | 图像标注方法、训练方法、图像处理方法以及电子设备 | |
CN113568836A (zh) | 多时间序列的样本特征提取方法以应用其的软件检测方法 | |
CN111241106A (zh) | 近似数据处理方法、装置、介质及电子设备 | |
CN110717405A (zh) | 人脸特征点定位方法、装置、介质及电子设备 | |
CN111444319B (zh) | 文本匹配方法、装置和电子设备 | |
CN114741697A (zh) | 恶意代码分类方法、装置、电子设备和介质 | |
CN113051400A (zh) | 标注数据确定方法、装置、可读介质及电子设备 | |
CN116029492B (zh) | 派单方法和装置 | |
CN115618043B (zh) | 文本操作图互检方法及模型训练方法、装置、设备、介质 | |
CN115563964B (zh) | 短信文本正则生成方法、装置、电子设备及存储介质 | |
CN113221920B (zh) | 图像识别方法、装置、设备、存储介质以及计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |