CN111814036A

CN111814036A - 基于搜索引擎的无线热点与兴趣点匹配方法、电子设备及存储介质

Info

Publication number: CN111814036A
Application number: CN201911259406.0A
Authority: CN
Inventors: 尹誉玮; 杨晓庆
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2019-12-10
Filing date: 2019-12-10
Publication date: 2020-10-23

Abstract

本发明公开一种基于搜索引擎的无线热点与兴趣点匹配方法、电子设备及存储介质，方法包括：获取待匹配无线热点的待匹配标识，获取待匹配兴趣点；在搜索引擎中对所述待匹配标识进行搜索，得到关于所述待匹配标识的搜索集合；基于所述待匹配标识的搜索集合确定所述待匹配标识与每个所述待匹配兴趣点的匹配结果。本方案通过利用搜索引擎中获得的知识帮助匹配无线热点与兴趣点。通过利用搜索引擎中的信息大幅提升匹配效果，解决了原始SSID文本与兴趣点文本具有隐含语义相关的困难问题；匹配分类模型可处理多语言混合的复杂文本，具有良好的稳定性和拓展性。

Description

基于搜索引擎的无线热点与兴趣点匹配方法、电子设备及存储介质

技术领域

本发明涉及自然语言分析相关技术领域，特别是一种基于搜索引擎的无线热点与兴趣点匹配方法、电子设备及存储介质。

背景技术

现如今，无线热点因其能为移动设备提供方便快捷的互联网接入服务而被广泛应用于各种场合。公共服务场所(如图书馆，机场等)，商业活动场所(如商场，电影院，咖啡厅等)都覆盖有无线热点。在移动设备定位不准确的情况下，可以根据移动设备连接的无线热点确定设备所处的位置，即无线热点与兴趣点匹配，使用兴趣点位置作为设备位置。

现有的无线热点-兴趣点匹配方案主要处理全英文的无线热点SSID与英文兴趣点匹配。该方案使用向量空间模型(Vector Space Model)将无线热点SSID与兴趣点表示为向量，通过计算向量间余弦相似度表示SSID与兴趣点的匹配程度，高于设定的阈值的SSID-兴趣点对被认定为具有匹配关系。

然而这种方案主要处理英文匹配，难以适用于包含多语言多模式的复杂匹配场景。同时，这种方案没有考虑SSID与兴趣点名称中单词的顺序，丢失顺序信息降低方案的准确度。这种方案仅使用原始文本信息进行匹配，没有使用其他相关知识，对于可能包含更复杂的语义知识的文本难以识别出匹配关系。

发明内容

基于此，有必要针对现有无线热点与兴趣点匹配的技术，未能适用于包含多语言多模式的复杂匹配场景的技术问题，提供一种基于搜索引擎的无线热点与兴趣点匹配方法、电子设备及存储介质。

本发明提供一种基于搜索引擎的无线热点与兴趣点匹配方法，包括：

获取待匹配无线热点的待匹配标识，获取待匹配兴趣点；

在搜索引擎中对所述待匹配标识进行搜索，得到关于所述待匹配标识的搜索集合；

基于所述待匹配标识的搜索集合确定所述待匹配标识与每个所述待匹配兴趣点的匹配结果。

进一步地，所述获取待匹配兴趣点，具体包括：

获取连接所述待匹配无线热点的设备的位置；

获取在所述位置附近预设范围内的待选择兴趣点；

计算所述待选择兴趣点与所述无线热点在文本上的相似性；

选择在文本上的相似性大于预设相似性阈值的待选择兴趣点作为待匹配兴趣点。

进一步地，所述在搜索引擎中对所述待匹配标识进行搜索，得到关于所述待匹配标识的搜索集合，具体包括：

在搜索引擎中对所述待匹配标识进行搜索；

从搜索得到的搜索页面中，得到关于所述待匹配标识的搜索结果集合，所述搜索结果集合包括一个或多个搜索结果；

从搜索引擎提供的搜索栏中得到关于所述待匹配标识的搜索推荐集合，所述搜索推荐集合包括一个或多个搜索推荐；

将所述搜索结果集合和所述搜索推荐集合作为关于所述待匹配标识的搜索集合。

更进一步地，所述基于所述搜索集合确定所述待匹配标识与每个所述待匹配兴趣点的匹配结果，具体包括：

将所述待匹配标识转换为包括待匹配标识向量的待匹配标识向量序列，将所述待匹配兴趣点转换为包括待匹配兴趣点向量的待匹配兴趣点向量序列，将关于所述待匹配标识的所述搜索结果转换为包括待匹配搜索结果向量的待匹配搜索结果向量序列，将关于所述待匹配标识的所述搜索推荐转换为包括待匹配搜索推荐向量的待匹配搜索推荐向量序列；

将所述待匹配标识向量序列、每个所述待匹配兴趣点向量序列、所述待匹配搜索结果向量序列、以及所述待匹配搜索推荐向量序列输入训练后的模型，得到所述待匹配标识向量序列与每个所述待匹配兴趣点向量序列的匹配程度，其中：

所述模型采用如下方式训练得到：

获取监督搜索结果、监督搜索推荐、监督标识、以及监督兴趣点；

将所述监督搜索结果转换为包括监督搜索结果向量的监督搜索结果序列，将所述监督搜索推荐转换为包括监督搜索推荐向量的监督搜索推荐向量序列，将所述监督标识转换为包括监督标识向量的监督标识向量序列，将所述监督兴趣点转换为包括监督兴趣点向量的监督兴趣点向量序列；

采用监督搜索结果向量序列、监督搜索推荐向量序列、监督标识向量序列、以及监督兴趣点向量序列，训练有监督分类模型，所述模型的输入为标识向量序列、兴趣点向量序列、搜索结果向量序列、以及搜索推荐向量序列，所述模型的输出为标识向量序列与兴趣点向量序列的匹配程度。

再进一步地，所述模型包括：

计算标识向量序列与兴趣点向量序列的匹配程度的基础子模型；

将标识向量序列、兴趣点向量序列、与搜索结果向量序列进行注意力机制聚合的搜索结果子模型；

将兴趣点向量序列对多个搜索推荐向量序列进行注意力机制聚合的搜索推荐子模型；以及

将所述基础子模型、所述搜索结果子模型、所述搜索推荐子模型的输出进行结合后输出匹配程度的输出函数。

再进一步地：

所述基础子模型，具体地：

将标识向量序列输入第一带门控循环单元的双向循环神经网络模型得到神经网络标识向量v_SSID，将兴趣点向量序列输入第一带门控循环单元的双向循环神经网络模型得到第一神经网络兴趣点向量v_POI1，计算v_SSID与v_POI1的差的绝对值向量序列v_basic＝‖v_SSID-v_POI1‖。

再进一步地：

所述搜索结果子模型，具体地：

将兴趣点向量序列输入第一带门控循环单元的双向循环神经网络模型得到包括神经网络兴趣点状态向量的神经网络兴趣点状态向量序列；

计算搜索结果向量序列中，每个搜索结果向量与聚合的神经网络兴趣点状态向量序列的差作为单向信息差向量；

使用自注意力机制将多个单向信息差向量聚合成一个向量作为该搜索结果的搜索结果处理后向量V_SR；

将标识与兴趣点的文本联合后转换为标识兴趣点联合向量序列，将标识兴趣点联合向量序列输入第一带门控循环单元的双向循环神经网络模型得到神经网络标识兴趣点联合向量序列v_{SSID_POI}；

计算所述神经网络标识兴趣点联合向量序列v_{SSID_POI}对每个搜索结果处理后向量V_SR进行点积模式的注意力机制聚合v_SR＝Attention(v_{SSID_POI}，V_SR)。

再进一步地：

所述搜索推荐子模型，具体地：

计算搜索推荐向量序列中，每个搜索推荐向量与聚合的神经网络兴趣点状态向量序列的差作为第一双向信息差向量；

计算神经网络兴趣点状态向量序列中，每个神经网络兴趣点状态向量与聚合的搜索推荐向量序列的差作为第二双向信息差向量；

将包括第一双向信息差向量的第一双向信息差向量序列输入第二带门控循环单元的双向循环神经网络模型得到第一双向信息差神经网络向量；

将包括第二双向信息差向量的第一双向信息差向量序列输入第二带门控循环单元的双向循环神经网络模型得到第二双向信息差神经网络向量；

计算第一双向信息差神经网络向量与第二双向信息差神经网络向量的平均值作为该搜索推荐的搜索推荐处理后向量V_REC；

将兴趣点向量序列输入第二带门控循环单元的双向循环神经网络模型得到第二神经网络兴趣点向量v_POI2；

计算所述第二神经网络兴趣点向量v_POI2对每个搜索推荐处理后向量V_REC进行点积模式的注意力机制聚合v_REC＝Attention(v_POI2，V_REC)。

再进一步地：

所述将所述监督搜索结果转换为包括监督搜索结果向量的监督搜索结果序列，将所述监督搜索推荐转换为包括监督搜索推荐向量的监督搜索推荐向量序列，将所述监督标识转换为包括监督标识向量的监督标识向量序列，将所述监督兴趣点转换为包括监督兴趣点向量的监督兴趣点向量序列，具体包括：

将所述监督标识进行N-gram处理，得到关于所述监督标识的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述监督标识的字符表长度的类独热表示作为监督标识向量，将监督标识向量的序列作为监督标识向量序列；

将所述监督兴趣点进行N-gram处理，得到关于所述监督兴趣点的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述监督兴趣点的字符表长度的类独热表示作为监督兴趣点向量，将监督兴趣点向量的序列作为监督兴趣点向量序列；

将所述监督搜索结果进行N-gram处理，得到关于所述监督搜索结果的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述监督搜索结果的字符表长度的类独热表示作为监督搜索结果向量，将监督搜索结果向量的序列作为监督搜索结果向量序列；

将所述监督搜索推荐进行N-gram处理，得到关于所述监督搜索推荐的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述监督搜索推荐的字符表长度的类独热表示作为监督搜索推荐向量，将监督搜索推荐向量的序列作为监督搜索推荐向量序列；

所述将所述待匹配标识转换为包括待匹配标识向量的待匹配标识向量序列，将所述待匹配兴趣点转换为包括待匹配兴趣点向量的待匹配兴趣点向量序列，将关于所述待匹配标识的所述搜索结果转换为包括待匹配搜索结果向量的待匹配搜索结果向量序列，将关于所述待匹配标识的所述搜索推荐转换为包括待匹配搜索推荐向量的待匹配搜索推荐向量序列，具体包括：

将所述待匹配标识进行N-gram处理，得到关于所述待匹配标识的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述待匹配标识的字符表长度的类独热表示作为待匹配标识向量，将待匹配标识向量的序列作为待匹配标识向量序列；

将所述待匹配兴趣点进行N-gram处理，得到关于所述待匹配兴趣点的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述待匹配兴趣点的字符表长度的类独热表示作为待匹配兴趣点向量，将待匹配兴趣点向量的序列作为待匹配兴趣点向量序列；

将关于所述待匹配标识的所述搜索结果进行N-gram处理，得到关于所述待匹配标识的所述搜索结果的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述待匹配标识的所述搜索结果的字符表长度的类独热表示作为待匹配搜索结果向量，将待匹配搜索结果向量的序列作为待匹配搜索结果向量序列；

将关于所述待匹配标识的所述搜索推荐进行N-gram处理，得到关于所述待匹配标识的所述搜索推荐的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述待匹配标识的所述搜索推荐的字符表长度的类独热表示作为待匹配搜索推荐向量，将待匹配搜索推荐向量的序列作为待匹配搜索推荐向量序列。

再进一步地，还包括：

以匹配结果符合预设匹配条件的待匹配兴趣点的位置作为连接所述待匹配无线热点设备的位置。

本发明提供一种基于搜索引擎的无线热点与兴趣点匹配电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

获取待匹配无线热点的待匹配标识，获取待匹配兴趣点；

进一步地，所述获取待匹配兴趣点，具体包括：

获取连接所述待匹配无线热点的设备的位置；

获取在所述位置附近预设范围内的待选择兴趣点；

计算所述待选择兴趣点与所述无线热点在文本上的相似性；

在搜索引擎中对所述待匹配标识进行搜索；

所述模型采用如下方式训练得到：

再进一步地，所述模型包括：

再进一步地：

所述基础子模型，具体地：

将标识向量序列输入第一带门控循环单元的双向循环神经网络模型得到神经网络标识向量v_SSID，将兴趣点向量序列输入第一带门控循环单元的双向循环神经网络模型得到第一神经网络兴趣点向量v_POI10，计算v_SSID与v_POI10的差的绝对值向量序列v_basic＝‖v_SSID-v_POI10‖。

再进一步地：

所述搜索结果子模型，具体地：

再进一步地：

所述搜索推荐子模型，具体地：

将兴趣点向量序列输入第二带门控循环单元的双向循环神经网络模型得到第二神经网络兴趣点向量v_POI11；

计算所述第二神经网络兴趣点向量v_POI11对每个搜索推荐处理后向量V_REC进行点积模式的注意力机制聚合v_REC＝Attention(v_POI11，V_REC)。

再进一步地：

再进一步地，所述处理器还能够：

本发明提供一种存储介质，所述存储介质存储计算机指令，当计算机执行所述计算机指令时，用于执行如前所述的基于搜索引擎的无线热点与兴趣点匹配方法的所有步骤。

本方案利用无线热点与兴趣点的匹配关系进行用户设备的精确定位。通过利用搜索引擎中获得的知识帮助匹配无线热点与兴趣点。通过利用搜索引擎中的信息大幅提升匹配效果，解决了原始SSID文本与兴趣点文本具有隐含语义相关的困难问题；匹配分类模型可处理多语言混合的复杂文本，具有良好的稳定性和拓展性。

附图说明

图1为本发明一种基于搜索引擎的无线热点与兴趣点匹配方法的工作流程图；

图2为本发明一实施例一种基于搜索引擎的无线热点与兴趣点匹配方法的工作流程图；

图3为搜索结果示意图；

图4为搜索推荐示意图；

图5为本发明最佳实施例一种基于搜索引擎的无线热点与兴趣点匹配方法的工作流程图；

图6为本发明一种基于搜索引擎的无线热点与兴趣点匹配电子设备的硬件结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步详细的说明。

实施例一

如图1所示为本发明一种基于搜索引擎的无线热点与兴趣点匹配方法的工作流程图，包括：

步骤S101，获取待匹配无线热点的待匹配标识，获取待匹配兴趣点；

步骤S102，在搜索引擎中对所述待匹配标识进行搜索，得到关于所述待匹配标识的搜索集合；

步骤S103，基于所述待匹配标识的搜索集合确定所述待匹配标识与每个所述待匹配兴趣点的匹配结果。

用户在使用移动设备时经常需要使用位置服务，但在定位时可能由于GPS信号弱、地形复杂等原因产生定位偏移，对此我们利用设备连接的无线热点所包含的信息辅助定位用户设备。相较于已有技术方案，我们开创性地使用搜索引擎相关资源作为外部知识来源，在较难处理的匹配问题上得到了明显的效果提升。

具体来说，当移动设备连接到无线热点时，获取到无线热点的标识，例如服务集标识(Service Set Identifier，SSID)，指无线热点的广播名称。此时，触发步骤S101。待匹配兴趣点来自公开提供的地图服务以及兴趣点点评网站，信息包含兴趣点名称与位置(经纬度)。例如，SSID为wangsteak，兴趣点可以为王品、王品台塑牛排、王者品味、等等。

步骤S102通过搜索引擎确定相应的搜索集合，将标识，例如SSID输入搜索引擎后，将会得到关于标识的搜索集合。最后，步骤S103，确定标识与兴趣点的匹配结果。一般来说，匹配结果可以为范围为(0,1)的评分，设定分类阈值为θ(一般为0.5)，评分高于θ认为输入SSID与兴趣点有匹配关系，否则没有匹配关系。

本方案通过利用搜索引擎中获得的知识帮助匹配无线热点与兴趣点。通过利用搜索引擎中的信息大幅提升匹配效果，解决了原始SSID文本与兴趣点文本具有隐含语义相关的困难问题；匹配分类模型可处理多语言混合的复杂文本，具有良好的稳定性和拓展性。

实施例二

实施例一

如图2所示为本发明一实施例一种基于搜索引擎的无线热点与兴趣点匹配方法的工作流程图，包括：

步骤S201，获取待匹配无线热点的待匹配标识。

步骤S202，获取连接所述待匹配无线热点的设备的位置。

步骤S203，获取在所述位置附近预设范围内的待选择兴趣点。

步骤S204，计算所述待选择兴趣点与所述无线热点在文本上的相似性。

步骤S205，选择在文本上的相似性大于预设相似性阈值的待选择兴趣点作为待匹配兴趣点。

为提高方案效率，减少计算量提高响应时间，本实施例使用规则过滤不可能匹配的兴趣点并提取出有更大匹配可能的兴趣点。首先，方案只搜索在设备GPS定位附近一定距离内(可设定)的兴趣点；其次，兴趣点与SSID在原始文本与N-gram级别上应当有一定程度的相似性，使用Jaccard系数和文本编辑距离作为度量方法。最后，在训练模型时，可以随机抽取少量位置范围内文本相关性较低的兴趣点样本作为可能的非文本相关匹配可能的样本。

步骤S206，在搜索引擎中对所述待匹配标识进行搜索。

步骤S207，从搜索得到的搜索页面中，得到关于所述待匹配标识的搜索结果集合，所述搜索结果集合包括一个或多个搜索结果。

步骤S208，从搜索引擎提供的搜索栏中得到关于所述待匹配标识的搜索推荐集合，所述搜索推荐集合包括一个或多个搜索推荐。

步骤S209，将所述搜索结果集合和所述搜索推荐集合作为关于所述待匹配标识的搜索集合。

具体来说，本实施例使用两种搜索引擎信息，对于待匹配的无线热点SSID，将SSID原文进行搜索和预搜索。搜索得到的第一个页面中，一个标题、相关段落、链接组成一个搜索结果，所有搜索结果称为搜索结果集合(简称SR)；预搜索得到搜索栏的下拉菜单中的多个相关搜索推荐称为搜索推荐集合(简称REC)。搜索结果与搜索推荐示例见图3所示的搜索结果31和图4所示的搜索推荐41。

步骤S210，将所述待匹配标识转换为包括待匹配标识向量的待匹配标识向量序列，将所述待匹配兴趣点转换为包括待匹配兴趣点向量的待匹配兴趣点向量序列，将关于所述待匹配标识的所述搜索结果转换为包括待匹配搜索结果向量的待匹配搜索结果向量序列，将关于所述待匹配标识的所述搜索推荐转换为包括待匹配搜索推荐向量的待匹配搜索推荐向量序列。

在其中一个实施例中，所述将所述待匹配标识转换为包括待匹配标识向量的待匹配标识向量序列，将所述待匹配兴趣点转换为包括待匹配兴趣点向量的待匹配兴趣点向量序列，将关于所述待匹配标识的所述搜索结果转换为包括待匹配搜索结果向量的待匹配搜索结果向量序列，将关于所述待匹配标识的所述搜索推荐转换为包括待匹配搜索推荐向量的待匹配搜索推荐向量序列，具体包括：

由于SSID与兴趣点名可能包含多种语言、符号，为便于处理，本实施例将所有中文通过现有工具(如HanLP)表示成拼音，使文本主要字符为英文字符。同时由于较难进行分词，本实施例对SSID与兴趣点名进行了tri-gram处理，将连续的字符串分割成连续重叠的3字符字串。例如：PacificCoffee表示为Pac、aci、cif、……、ffe、fee。tri-gram进行独热表示所产生向量维度过大，本实施例进行了字符级别的哈希，将每个tri-gram表示成字符表长度的类独热表示，即向量中最多含有三个1(表示3个不同字符)，最少含有一个1(表示3个相同字符)。

步骤S211，将所述待匹配标识向量序列、每个所述待匹配兴趣点向量序列、所述待匹配搜索结果向量序列、以及所述待匹配搜索推荐向量序列输入训练后的模型，得到所述待匹配标识向量序列与每个所述待匹配兴趣点向量序列的匹配程度。

其中：

所述模型采用如下方式训练得到：

在其中一个实施例中，所述将所述监督搜索结果转换为包括监督搜索结果向量的监督搜索结果序列，将所述监督搜索推荐转换为包括监督搜索推荐向量的监督搜索推荐向量序列，将所述监督标识转换为包括监督标识向量的监督标识向量序列，将所述监督兴趣点转换为包括监督兴趣点向量的监督兴趣点向量序列，具体包括：

将所述监督搜索推荐进行N-gram处理，得到关于所述监督搜索推荐的N字符字串序列，将每个N字符字串进行字符级别的哈希运算，得到关于所述监督搜索推荐的字符表长度的类独热表示作为监督搜索推荐向量，将监督搜索推荐向量的序列作为监督搜索推荐向量序列。

在其中一个实施例中，所述模型包括：

SSID-兴趣点(POI)匹配模型是使用根据SSID获取的搜索结果与搜索推荐帮助决策是否匹配的有监督分类模型，模型输入为SSID、兴趣点名称、SSID的搜索结果和搜索推荐；模型输出为范围在(0,1)的匹配程度打分。模型包括三个子模型，基础子模型，搜索结果SR子模型与搜索推荐REC子模型。

所述基础子模型，具体地：

基础子模型使用第一带门控循环单元的双向循环神经网络(BiGRU₁)比较SSID与兴趣点的匹配程度。模型输出为SSID与兴趣点tri-gram的向量序列经过BiGRU₁得到的向量表示v_SSID与v_POI1的差的绝对值向量。

所述搜索结果子模型，具体地：

SR子模型使用单向对齐的注意力机制将经过BiGRU₁处理的兴趣点状态向量序列与搜索结果文档向量对齐，计算搜索结果文档的每个tri-gram向量与聚合的兴趣点状态向量的差，再使用自注意力机制将每个tri-gram的信息差聚合成一个向量表示该搜索结果文档，最后使用经过BiGRU₁处理的SSID-兴趣点联合向量v_{SSID_POI}对多个搜索结果文档V_SR进行点积模式的注意力机制聚合。

其中，BiGRU₁的输入为向量序列，输出为序列，同时，BiGRU₁还可以为每个输入的序列引出状态向量，形成状态向量序列。搜索结果的每个搜索结果的tri-gram向量与聚合的兴趣点状态向量的差指的是搜索结果的每个搜索结果的tri-gram与兴趣点状态向量先进行加权聚合，之后计算该tri-gram与该加权聚合值的差值。每个搜索结果的tri-gram均与兴趣点状态向量进行加权聚合。例如，一个搜索结果包括100个搜索结果tri-gram，一个兴趣点包括10个兴趣点tri-gram，则该10个兴趣点tri-gram经过BiGRU₁处理后可以从中引出10个兴趣点状态tri-gram。每个搜索结果tri-gram均先与10个兴趣点状态tri-gram进行加权聚合，然后将搜索结果tri-gram与该加权聚合值计算差值，最终得到100个信息差。将这100个信息差使用自注意力机制聚合成一个向量表示该搜索结果。

所述搜索推荐子模型，具体地：

REC子模型使用双向对齐的注意力机制将经过BiGRU₁处理的兴趣点状态向量序列与搜索推荐字串向量进行对齐，计算搜索推荐字串的每个tri-gram向量与聚合的兴趣点向量的差、兴趣点的每个tri-gram向量与聚合的搜索推荐字串向量的差。对于每个方向对齐产生的信息差向量，使用BiGRU₂进行聚合为一个向量表示，两个方向的向量取平均作为该搜索推荐与兴趣点的信息差表示。最后使用经过BiGRU₂处理的兴趣点向量v_POI对多个搜索推荐字串V_REC进行点积模式的注意力机制聚合。

上述三个模型结果连接为经过多层感知机(MLP)处理最后经过sigmoid激活函数得到范围(0,1)的评分，设定分类阈值为θ(一般为0.5)，评分高于θ认为输入SSID与兴趣点有匹配关系，否则没有匹配关系，得到多个匹配兴趣点时可根据距离GPS定位的距离选择最近的兴趣点位置作为输出。模型使用交叉熵函数作为损失函数，adam方法作为优化方法。

步骤S212，以匹配结果符合预设匹配条件的待匹配兴趣点的位置作为连接所述待匹配无线热点设备的位置。

本实施例利用无线热点与兴趣点的匹配关系进行用户设备的精确定位，大幅增强无线热点与兴趣点匹配方案的效果，使无线热点信息能用于帮助定位用户设备。同时，提高方案效率，减少计算量，提高响应时间。通过建立有监督分类模型，使用搜索引擎相关资源作为外部知识来源，在较难处理的匹配问题上得到了明显的效果提升。

实施例三

如图5所示为本发明最佳实施例一种基于搜索引擎的无线热点与兴趣点匹配方法的工作流程图，包括：

步骤S501，获取设备GPS定位；

步骤S502，如果设备连接有无线热点，则执行步骤S503，否则执行步骤S507；

步骤S503，搜索位置附近范围内可能的匹配兴趣点；

步骤S504，进行SSID-兴趣点匹配；

步骤S505，如果成功匹配兴趣点，则执行步骤S506，否则执行步骤S507；

步骤S506，匹配兴趣点位置作为最终定位，并结束。

步骤S507，GPS定位作为最终定位，并结束。

实施例四

如图6所示为本发明一种基于搜索引擎的无线热点与兴趣点匹配电子设备的硬件结构示意图，包括：

至少一个处理器601；以及，

与所述至少一个处理器601通信连接的存储器602；其中，

所述存储器602存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

获取待匹配无线热点的待匹配标识，获取待匹配兴趣点；

图6中以一个处理器601为例。

电子设备还可以包括：输入装置603和显示装置604。

处理器601、存储器602、输入装置603及显示装置604可以通过总线或者其他方式连接，图中以通过总线连接为例。

存储器602作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中的基于搜索引擎的无线热点与兴趣点匹配方法对应的程序指令/模块，例如，图1所示的方法流程。处理器601通过运行存储在存储器602中的非易失性软件程序、指令以及模块，从而执行各种功能应用以及数据处理，即实现上述实施例中的基于搜索引擎的无线热点与兴趣点匹配方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据基于搜索引擎的无线热点与兴趣点匹配方法的使用所创建的数据等。此外，存储器602可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至执行基于搜索引擎的无线热点与兴趣点匹配方法的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置603可接收输入的用户点击，以及产生与基于搜索引擎的无线热点与兴趣点匹配方法的用户设置以及功能控制有关的信号输入。显示装置604可包括显示屏等显示设备。

在所述一个或者多个模块存储在所述存储器602中，当被所述一个或者多个处理器601运行时，执行上述任意方法实施例中的基于搜索引擎的无线热点与兴趣点匹配方法。

实施例五

本发明第五实施例一种基于搜索引擎的无线热点与兴趣点匹配电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

获取待匹配无线热点的待匹配标识；

获取连接所述待匹配无线热点的设备的位置；

获取在所述位置附近预设范围内的待选择兴趣点；

计算所述待选择兴趣点与所述无线热点在文本上的相似性；

选择在文本上的相似性大于预设相似性阈值的待选择兴趣点作为待匹配兴趣点；

在搜索引擎中对所述待匹配标识进行搜索；

将所述搜索结果集合和所述搜索推荐集合作为关于所述待匹配标识的搜索集合；

以匹配结果符合预设匹配条件的待匹配兴趣点的位置作为连接所述待匹配无线热点设备的位置；

本发明第六实施例提供一种存储介质，所述存储介质存储计算机指令，当计算机执行所述计算机指令时，用于执行如前所述的基于搜索引擎的无线热点与兴趣点匹配方法的所有步骤。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于，包括：

获取待匹配无线热点的待匹配标识，获取待匹配兴趣点；

2.根据权利要求1所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于，所述获取待匹配兴趣点，具体包括：

获取连接所述待匹配无线热点的设备的位置；

获取在所述位置附近预设范围内的待选择兴趣点；

计算所述待选择兴趣点与所述无线热点在文本上的相似性；

3.根据权利要求1所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于，所述在搜索引擎中对所述待匹配标识进行搜索，得到关于所述待匹配标识的搜索集合，具体包括：

在搜索引擎中对所述待匹配标识进行搜索；

4.根据权利要求3所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于，所述基于所述搜索集合确定所述待匹配标识与每个所述待匹配兴趣点的匹配结果，具体包括：

所述模型采用如下方式训练得到：

5.根据权利要求4所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于，所述模型包括：

6.根据权利要求5所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于：

所述基础子模型，具体地：

将标识向量序列输入第一带门控循环单元的双向循环神经网络模型得到神经网络标识向量v_SSID，将兴趣点向量序列输入第一带门控循环单元的双向循环神经网络模型得到第一神经网络兴趣点向量v_POI1，计算v_SSID与v_POI1的差的绝对值向量序列v_basic＝||v_SSID-v_POI1||。

7.根据权利要求5所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于：

所述搜索结果子模型，具体地：

8.根据权利要求5所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于：

所述搜索推荐子模型，具体地：

9.根据权利要求4所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于：

10.根据权利要求1至9任一项所述的基于搜索引擎的无线热点与兴趣点匹配方法，其特征在于，还包括：

11.一种基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

获取待匹配无线热点的待匹配标识，获取待匹配兴趣点；

12.根据权利要求11所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于，所述获取待匹配兴趣点，具体包括：

获取连接所述待匹配无线热点的设备的位置；

获取在所述位置附近预设范围内的待选择兴趣点；

计算所述待选择兴趣点与所述无线热点在文本上的相似性；

13.根据权利要求11所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于，所述在搜索引擎中对所述待匹配标识进行搜索，得到关于所述待匹配标识的搜索集合，具体包括：

在搜索引擎中对所述待匹配标识进行搜索；

14.根据权利要求13所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于，所述基于所述搜索集合确定所述待匹配标识与每个所述待匹配兴趣点的匹配结果，具体包括：

所述模型采用如下方式训练得到：

15.根据权利要求14所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于，所述模型包括：

16.根据权利要求15所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于：

所述基础子模型，具体地：

将标识向量序列输入第一带门控循环单元的双向循环神经网络模型得到神经网络标识向量v_SSID，将兴趣点向量序列输入第一带门控循环单元的双向循环神经网络模型得到第一神经网络兴趣点向量v_POI10，计算v_SSID与v_POI10的差的绝对值向量序列v_basic＝||v_SSID-v_POI10||。

17.根据权利要求15所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于：

所述搜索结果子模型，具体地：

18.根据权利要求15所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于：

所述搜索推荐子模型，具体地：

19.根据权利要求14所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于：

20.根据权利要求11至19任一项所述的基于搜索引擎的无线热点与兴趣点匹配电子设备，其特征在于，所述处理器还能够：

21.一种存储介质，其特征在于，所述存储介质存储计算机指令，当计算机执行所述计算机指令时，用于执行如权利要求1-10任一项所述的基于搜索引擎的无线热点与兴趣点匹配方法的所有步骤。