CN111046669A - 一种兴趣点的匹配方法、装置及计算机系统 - Google Patents

一种兴趣点的匹配方法、装置及计算机系统 Download PDF

Info

Publication number
CN111046669A
CN111046669A CN201911244459.5A CN201911244459A CN111046669A CN 111046669 A CN111046669 A CN 111046669A CN 201911244459 A CN201911244459 A CN 201911244459A CN 111046669 A CN111046669 A CN 111046669A
Authority
CN
China
Prior art keywords
word segmentation
address
geographic
preset
analyzed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911244459.5A
Other languages
English (en)
Inventor
田宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Suning Logistics Co ltd
Original Assignee
Jiangsu Suning Logistics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Suning Logistics Co ltd filed Critical Jiangsu Suning Logistics Co ltd
Priority to CN201911244459.5A priority Critical patent/CN111046669A/zh
Publication of CN111046669A publication Critical patent/CN111046669A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种兴趣点的匹配方法、装置及计算机系统,其中所述方法包括:获取待解析地址,根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级,将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点,实现了对待解析地址对应的兴趣点的准确匹配。

Description

一种兴趣点的匹配方法、装置及计算机系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种兴趣点的匹配方法、装置及计算机系统。
背景技术
随着电子商务的迅速扩张,物流作为电子商务的一个重要环节也得到了飞速发展。当用户下单时,需要填写订单的收货地址,然后承接运输的物流公司根据收货地址进行配送。当用户填写的收货地址不准确或者不完整时,物流公司不能根据收货地址准确定位订单收货地址的具体位置,无法对用户的订单进行及时地配送,影响用户的使用体验。
发明内容
为了解决现有技术的不足,本发明的主要目的在于提供一种兴趣点的匹配方法、装置及计算机系统,以实现对待解析地址对应的兴趣点的自动匹配。
为了达到上述目的,本发明第一方面提供了一种兴趣点的匹配方法,所述方法包括:
获取待解析地址;
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量;
将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
在一些实施例中,所述方法还包括:
查找所述兴趣点对应的配送网点,将包含所述待解析地址的订单分配给所述对应的配送网点。
在一些实施例中,所述将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量包括:
将所述位置分词及所述位置分词对应的地理层级输入预先配置的Word2Vec模型中转化为向量。
在一些实施例中,所述预设模型是通过如下的方法获得的:
获取历史地址及所述历史地址对应的兴趣点;
根据预设的地理层级分词规则,对所述历史进行地理层级分词,获得每个所述历史地址包含的历史位置分词及每个所述历史位置分词对应的地理层级;
将所述历史位置分词及所述历史位置分词对应的地理层级作为训练样本,对Word2Vec模型进行训练,获得所述预先配置的Word2Vec模型;
将所述历史位置分词及所述历史位置分词对应的地理层级输入所述预先配置的Word2Vec模型中,转化为历史向量;
将所述历史向量及对应的所述兴趣点作为正样本,对预设的神经网络模型进行训练,获得所述预设模型。
在一些实施例中,所述预设的地理层级分词规则包含每一地理层级与可识别分词的对应关系及预设的分词识别规则,所述根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级包括:
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获取所述待解析地址包含的位置分词,所述位置分词包含可识别分词及未识别分词;
根据所述每一地理层级与可识别分词的对应关系,确定每一所述可识别分词对应的地理层级;
根据所述预设的分词识别规则,推测所述未识别分词对应的地理层级,并将所述未识别分词标记为未识别;
所述将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量还包括:
将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,根据所述标记降低所述未识别分词在转化获得所述向量时的权重。
在一些实施例中,所述方法还包括:
根据包含所述待解析地址的订单的实际签收位置,确定所述待解析地址的实际兴趣点;
将所述向量及所述实际兴趣点作为正样本对所述预设模型进行训练。
第二方面,本申请提供了一种兴趣点的匹配装置,所述装置包括:
获取模块,用于获取待解析地址;
分词模块,用于根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
处理模块,用于将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,
匹配模块,用于将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
在一些实施例中,所述预设的地理层级分词规则包含每一地理层级与可识别分词的对应关系及预设的分词识别规则,所述分词模块还可用于
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获取所述待解析地址包含的位置分词,所述位置分词包含可识别分词及未识别分词;
根据所述每一地理层级与可识别分词的对应关系,确定每一所述可识别分词对应的地理层级;
根据所述预设的分词识别规则,推测所述未识别分词对应的地理层级,并将所述未识别分词标记为未识别;
所述处理模块还可用于
将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,根据所述标记降低所述未识别分词在转化获得所述向量时的权重。
在一些实施例中,所述匹配装置还包括训练模块,用于根据包含所述待解析地址的订单的实际签收位置,确定所述待解析地址的实际兴趣点;将所述向量及所述实际兴趣点作为正样本对所述预设模型进行训练。
第三方面,本申请提供了一种计算机系统,所述系统包括:
一个或多个处理器;以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
获取待解析地址;
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,
将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
根据本申请提供的具体实施例,本申请公开了以下技术效果:
本申请公开了通过获取待解析地址;根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点,实现了对待解析地址对应的兴趣点的准确匹配,进一步地可通过查找兴趣点对应的配送网点,将包含所述待解析地址的订单分配给所述配送网点,实现了对订单的自动分配;
本申请还公开了根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获取所述待解析地址包含的位置分词,所述位置分词包含可识别分词及未识别分词;根据地理层级与可识别分词的对应关系,确定每一所述可识别分词对应的地理层级;根据所述预设的分词识别规则,推测所述未识别分词对应的地理层级,并将所述未识别分词标记为未识别,以便在生成所述向量时根据所述标记降低所述未识别分词在所述向量中的权重,提升了使用预设模型根据所述向量进行兴趣点匹配的准确性;
进一步地,本申请还公开了根据包含所述待解析地址的订单的实际签收位置,确定包含所述待解析地址的订单的实际兴趣点,将所述待解析地址及所述实际兴趣点作为正样本对所述预设模型进行训练,实现了对用于匹配兴趣点的预设模型的自动更新。
实施本申请的任一产品并不需要同时达到以上所述的所有的技术效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的地址分词流程图;
图2是本申请实施例提供的方法流程图;
图3是本申请实施例提供的装置结构图;
图4是本申请实施例提供的计算机系统结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如背景技术中所述,为了实现对订单收货地址的具体位置的准确定位,本申请提出通过获取待解析地址,根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点,实现对待解析地址对应的兴趣点的自动匹配。
兴趣点是地理信息系统中的一个术语,泛指一切可以抽象为点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、银行、餐馆、加油站、医院、超市等。兴趣点的主要用途是对事物或事件的地址进行描述,一个兴趣点代表着一个具体的地理位置。
基于匹配获得的兴趣点,可准确定位待解析地址所指的具体地理位置,进一步地可查找兴趣点对应的配送网点并将订单分配给所述配送网点,实现对订单的自动分配。
例如,当用户填写的订单收货地址为E省F市I小区,使用上述方法进行匹配,获得的对应兴趣点为E省F市G区H路I小区,则可确定该订单的实际收货地址就是获得的对应兴趣点E省F市G区H路I小区,然后将该订单分配给负责E省F市G区H路I小区的配送网点。
所述配送网点负责当订单的货品经过中转站到达所述配送网点时,将货品派送到订单的指定收货地址。
实施例一
为了实现上述目的,以使用卷积神经网络模型进行兴趣点匹配为例,上述方法可通过如下步骤实现:
步骤一、对卷积神经网络模型进行训练,获得已训练的卷积神经网络模型;
所述训练过程包括:
A、获取历史订单记录包含的历史收货地址及所述历史收货地址对应的兴趣点;
具体的,可根据历史订单记录的实际签收位置,确定所述历史收货地址对应的兴趣点。
例如,历史订单的历史收货地址为A省B市C小区,而未写明C小区所属的区或街道等信息。根据配送网点最终完成送货时的实际签收位置,可确定该C小区的实际地理位置,该实际地理位置对应的兴趣点就是所述收货地址对应的兴趣点。
B、对历史收货地址进行预处理;
具体的,所述预处理过程包括:
去除历史收货地址中包含的特殊符号,将历史订单地址中包含的繁体中文字符转换为简体中文字符;
根据预设的地址分词方法,对历史收货地址进行地址分词,获得地址分词及每个地址分词对应的地理层级。
所述特殊符号包含了数学符号、拼音字符等无法用于识别历史收货地址的位置的字符。
图1示出了所述地址分词的方法流程图,当一个地址被输入时,根据预存的每个地理层级的数据词包,对地址进行匹配,将匹配成功的分词从所述地址中切分出来,并标记每个匹配成功的分词所对应的地理层级,所述地理层级包含省、市、区/县、乡/镇/街道、村、村组、热点地名、道路,以1_1-8_1表示。将剩余匹配不成功的地址分词首先标记为16,然后根据预存的通用词词包、同义词词包及连锁品牌词包,与剩余的未匹配成功的字符进行匹配,以推测剩余的未匹配成功的字符的对应的地理层级并标记,以9_2-14_2表示,其中10_2是根据历史收货地址对应的兴趣点,预测的待解析地址对应的兴趣点。对于未匹配成功的字符,其对应的地理层级的标记都包含了_2,表明这些字符的地理层级是推测获得的,在生成向量时降低这些未匹配成功的字符的权重。
具体的,还可根据每个历史地址包含的地址分词及每个地址分词对应的地理层级及每个历史地址对应的兴趣点,生成兴趣点数据库,用于查找每个兴趣点对应的省、市、区/县、乡/镇/街道、村、村组、道路、电话等信息。
C、使用历史收货地址包含的地址分词及每个地址分词对应的地理层级作为训练样本,对word2Vec模型进行训练,获得训练后的word2Vec模型,用以通过输入每个地址包含的地址分词及每个地址分词对应的地理层级,生成每个地址对应的向量,降低标记了未匹配成功的字符在生成所述历史向量时的权重。
Word2Vec是一种用于自然语言处理的神经网络模型,可以将自然语言中的字词转换为向量。
D、将每个历史收货地址对应的向量及每个历史收货地址对应的兴趣点作为正样本,对卷积神经网络模型进行训练,获得已训练的卷积神经网络模型。
在获得已训练的卷积神经网络模型后,使用所述卷积神经网络模型对用户订单中包含的待解析地址进行匹配,获得待解析地址对应的兴趣点。
步骤二、接收用户订单,获取用户订单中包含的待解析地址;
步骤三、对所述待解析地址进行预处理;
具体的,所述预处理过程包括:
去除待解析地址中包含的特殊符号,将待解析地址中包含的繁体中文字符转换为简体中文字符;
根据所述预设的地址分词方法,对待解析地址进行地址分词,获得目标地址分词及每个目标地址分词对应的地理层级,所述目标地址分词包含可识别分词与未识别分词,对未识别分词标记未识别;
将所述目标地址分词及每个目标地址分词对应的地理层级输入所述训练后的word2Vec模型,获得目标向量,降低标记了未识别的分词在生成所述目标向量时的权重。
步骤四、将所述目标向量输入所述已训练的卷积神经网络模型,匹配所述目标向量对应的兴趣点;
具体的,所述匹配过程包括:
S1、使用所述已训练的卷积神经网络模型的卷积层的卷积操作对所述目标向量进行特征提取,获得所述目标向量的特征映射;
S2、使用所述已训练的卷积神经网络模型的池化层包含的最大池化层下采样方法,从每个所述特征映射中提取最大值,作为全连接层中的节点;
通过从每个所述特征映射中提取最大值作为全连接层中的节点的方法,可以从每个所述特征映射中提取最重要的信号来作为所述已训练的卷积神经网络模型的全连接层中的节点,减小后续计算所需的运算规模。
S3、将每个所述特征映射中提取的最大值作为所述全连接层中的节点输入所述全连接层,将所述已训练的卷积神经网络模型的全连接层全连接一个Softmax层,根据所述Softmax层预设的任务参数对所述目标向量进行兴趣点匹配,给出目标向量可能匹配的兴趣点及对应的匹配概率;
S4、取对应的匹配概率最大的兴趣点为待解析地址对应的兴趣点。
步骤六、查找所述对应的兴趣点对应的配送网点,将包含所述待解析地址的订单分配给所述配送网点;
在对包含所述待解析地址的订单分配给所述配送网点完成配送后,可根据所述包含所述待解析地址的订单的实际签收位置,确定所述订单的实际兴趣点。
步骤七、将所述目标向量及所述实际兴趣点作为正样本,对所述已训练的卷积神经网络模型进行训练,以实现对所述已训练的卷积神经网络模型的更新;
根据所述待解析地址包含的目标地址分词及每个目标地址分词对应的地理层级及所述实际兴趣点,对所述兴趣点数据库进行更新。
实施例二
对应上述实施例,本申请提供了一种兴趣点的匹配方法,如图2所示,所述方法包括:
210、获取待解析地址;
所述待解析地址可以从用户订单中读取,也可以是直接输入的地址,本申请对此不加限定。
优选的,获取所述待解析地址前,所述方法还包括:
211、获取历史地址及所述历史地址对应的兴趣点;
根据预设的地理层级分词规则,对所述历史进行地理层级分词,获得每个所述历史地址包含的历史位置分词及每个所述历史位置分词对应的地理层级;
将所述历史位置分词及所述历史位置分词对应的地理层级作为训练样本,对Word2Vec模型进行训练,获得所述预先配置的Word2Vec模型;
将所述历史位置分词及所述历史位置分词对应的地理层级输入所述预先配置的Word2Vec模型中,转化为历史向量;
将所述历史向量及对应的所述兴趣点作为正样本,对预设的神经网络模型进行训练,获得所述预设模型。
优选的,所述预设的神经网络模型为卷积神经网络模型。
220、根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
优选的,所述预设的地理层级分词规则包含每一地理层级与可识别分词的对应关系及预设的分词识别规则,所述根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级包括:
221、根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获取所述待解析地址包含的位置分词,所述位置分词包含可识别分词及未识别分词;
根据所述每一地理层级与可识别分词的对应关系,确定每一所述可识别分词对应的地理层级;
根据所述预设的分词识别规则,推测所述未识别分词对应的地理层级,并将所述未识别分词标记为未识别,以便根据所述标记降低所述未识别分词在生成所述向量时的权重。
230、将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量;
优选的,所述将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量包括:
根据包含所述待解析地址的订单的实际签收位置,确定所述待解析地址的实际兴趣点;
将所述向量及所述实际兴趣点作为正样本对所述预设模型进行训练。
231、将所述位置分词及所述位置分词对应的地理层级输入预先配置的Word2Vec模型中转化为向量。
优选的,将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量后,所述方法还包括:
232、根据包含所述待解析地址的订单的实际签收位置,确定所述待解析地址的实际兴趣点;
将所述向量及所述实际兴趣点作为正样本对所述预设模型进行训练。
240、将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
优选的,匹配获得所述待解析地址对应的兴趣点后,所述方法还包括:
241、查找所述兴趣点对应的配送网点,将包含所述待解析地址的订单分配给所述对应的配送网点。
实施例三
对应上述方法,本申请提供了一种兴趣点的匹配装置,如图3所示,所述装置包括:
获取模块310,用于获取待解析地址;
分词模块320,用于根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
处理模块330,用于将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,
匹配模块340,用于将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
优选的,所述预设的地理层级分词规则包含每一地理层级与可识别分词的对应关系及预设的分词识别规则,所述分词模块320还可用于
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获取所述待解析地址包含的位置分词,所述位置分词包含可识别分词及未识别分词;
根据所述每一地理层级与可识别分词的对应关系,确定每一所述可识别分词对应的地理层级;
根据所述预设的分词识别规则,推测所述未识别分词对应的地理层级,并将所述未识别分词标记为未识别,以便根据所述标记降低所述未识别分词在生成所述向量时的权重。
优选的,所述匹配装置还包括训练模块350,用于根据包含所述待解析地址的订单的实际签收位置,确定所述待解析地址的实际兴趣点;将所述向量及所述实际兴趣点作为正样本对所述预设模型进行训练。
优选的,所述训练模块350还可以用于
将所述历史位置分词及所述历史位置分词对应的地理层级作为训练样本,对Word2Vec模型进行训练,获得所述预先配置的Word2Vec模型;
将所述历史位置分词及所述历史位置分词对应的地理层级输入所述预先配置的Word2Vec模型中,转化为历史向量;
将所述历史向量及对应的所述兴趣点作为正样本,对预设的神经网络模型进行训练,获得所述预设模型。
优选的,所述匹配装置还包括分配模块360,用于查找所述兴趣点对应的配送网点,将包含所述待解析地址的订单分配给所述对应的配送网点。
优选的,所述处理模块330还可用于将所述位置分词及所述位置分词对应的地理层级输入预先配置的Word2Vec模型中转化为向量。
实施例四
对应上述实施例,本申请还提供了一种计算机系统,包括一个或多个处理器;以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
获取待解析地址;
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,
将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
其中,图4示例性的展示出了计算机系统的架构,具体可以包括处理器1510,视频显示适配器1511,磁盘驱动器1512,输入/输出接口1513,网络接口1514,以及存储器1520。上述处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520之间可以通过通信总线1530进行通信连接。
其中,处理器1510可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请所提供的技术方案。
存储器1520可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1520可以存储用于控制计算机系统1500运行的操作系统1521,用于控制计算机系统1500的低级别操作的基本输入输出系统(BIOS)。另外,还可以存储网页浏览器1523,数据存储管理系统1524,以及图标字体处理系统1525等等。上述图标字体处理系统1525就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本申请所提供的技术方案时,相关的程序代码保存在存储器1520中,并由处理器1510来调用执行。
输入/输出接口1513用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
网络接口1514用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1530包括一通路,在设备的各个组件(例如处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520)之间传输信息。
另外,该计算机系统1500还可以从虚拟资源对象领取条件信息数据库1541中获得具体领取条件的信息,以用于进行条件判断,等等。
需要说明的是,尽管上述设备仅示出了处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,存储器1520,总线1530等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,云服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种兴趣点的匹配方法,其特征在于,所述方法包括:
获取待解析地址;
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量;
将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
2.根据权利要求1所述的匹配方法,其特征在于,所述方法还包括:
查找所述兴趣点对应的配送网点,将包含所述待解析地址的订单分配给所述对应的配送网点。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量包括:
将所述位置分词及所述位置分词对应的地理层级输入预先配置的Word2Vec模型中转化为向量。
4.根据权利要求3所述的方法,其特征在于,所述预设模型是通过如下的方法获得的:
获取历史地址及所述历史地址对应的兴趣点;
根据预设的地理层级分词规则,对所述历史进行地理层级分词,获得每个所述历史地址包含的历史位置分词及每个所述历史位置分词对应的地理层级;
将所述历史位置分词及所述历史位置分词对应的地理层级作为训练样本,对Word2Vec模型进行训练,获得所述预先配置的Word2Vec模型;
将所述历史位置分词及所述历史位置分词对应的地理层级输入所述预先配置的Word2Vec模型中,转化为历史向量;
将所述历史向量及对应的所述兴趣点作为正样本,对预设的神经网络模型进行训练,获得所述预设模型。
5.根据权利要求1或2所述的方法,其特征在于,所述预设的地理层级分词规则包含每一地理层级与可识别分词的对应关系及预设的分词识别规则,所述根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级包括:
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获取所述待解析地址包含的位置分词,所述位置分词包含可识别分词及未识别分词;
根据所述每一地理层级与可识别分词的对应关系,确定每一所述可识别分词对应的地理层级;
根据所述预设的分词识别规则,推测所述未识别分词对应的地理层级,并将所述未识别分词标记为未识别;
所述将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量还包括:
将所述位置分词及所述位置分词对应的地理层级使用所述预设的自然语言处理方法转化为向量,根据所述标记降低所述未识别分词在转化获得所述向量时的权重。
6.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据包含所述待解析地址的订单的实际签收位置,确定所述待解析地址的实际兴趣点;
将所述向量及所述实际兴趣点作为正样本对所述预设模型进行训练。
7.一种兴趣点的匹配装置,其特征在于,所述装置包括:
获取模块,用于获取待解析地址;
分词模块,用于根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
处理模块,用于将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量;
匹配模块,用于将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
8.根据权利要求7所述的匹配装置,其特征在于,所述预设的地理层级分词规则包含每一地理层级与可识别分词的对应关系及预设的分词识别规则,所述分词模块还可用于
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获取所述待解析地址包含的位置分词,所述位置分词包含可识别分词及未识别分词;
根据所述每一地理层级与可识别分词的对应关系,确定每一所述可识别分词对应的地理层级;
根据所述预设的分词识别规则,推测所述未识别分词对应的地理层级,并将所述未识别分词标记为未识别;
所述处理模块还可用于
将所述位置分词及所述位置分词对应的地理层级使用所述预设的自然语言处理方法转化为向量,根据所述标记降低所述未识别分词在转化获得所述向量时的权重。
9.根据权利要求7或8所述的匹配装置,其特征在于,所述匹配装置还包括训练模块,用于根据包含所述待解析地址的订单的实际签收位置,确定所述待解析地址的实际兴趣点;将所述向量及所述实际兴趣点作为正样本对所述预设模型进行训练。
10.一种计算机系统,其特征在于,所述系统包括:
一个或多个处理器;以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
获取待解析地址;
根据预设的地理层级分词规则,对所述待解析地址进行地理层级分词,获得位置分词及每个所述位置分词对应的地理层级;
将所述位置分词及所述位置分词对应的地理层级使用预设的自然语言处理方法转化为向量,
将所述向量输入预设模型,匹配获得所述待解析地址对应的兴趣点。
CN201911244459.5A 2019-12-06 2019-12-06 一种兴趣点的匹配方法、装置及计算机系统 Pending CN111046669A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911244459.5A CN111046669A (zh) 2019-12-06 2019-12-06 一种兴趣点的匹配方法、装置及计算机系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911244459.5A CN111046669A (zh) 2019-12-06 2019-12-06 一种兴趣点的匹配方法、装置及计算机系统

Publications (1)

Publication Number Publication Date
CN111046669A true CN111046669A (zh) 2020-04-21

Family

ID=70233689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911244459.5A Pending CN111046669A (zh) 2019-12-06 2019-12-06 一种兴趣点的匹配方法、装置及计算机系统

Country Status (1)

Country Link
CN (1) CN111046669A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052673A (zh) * 2020-08-28 2020-12-08 丰图科技(深圳)有限公司 物流网点识别方法、装置、计算机设备和存储介质
CN112052672A (zh) * 2020-08-28 2020-12-08 丰图科技(深圳)有限公司 基于地址文本的单元区域识别方法、装置和计算机设备
CN112069273A (zh) * 2020-08-13 2020-12-11 丰图科技(深圳)有限公司 地址文本的分类方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264652A1 (en) * 2010-04-26 2011-10-27 Cyberpulse, L.L.C. System and methods for matching an utterance to a template hierarchy
CN104484790A (zh) * 2014-12-26 2015-04-01 清华大学深圳研究生院 一种物流业务的地址匹配方法及装置
CN109684440A (zh) * 2018-12-13 2019-04-26 北京惠盈金科技术有限公司 基于层级标注的地址相似度度量方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264652A1 (en) * 2010-04-26 2011-10-27 Cyberpulse, L.L.C. System and methods for matching an utterance to a template hierarchy
CN104484790A (zh) * 2014-12-26 2015-04-01 清华大学深圳研究生院 一种物流业务的地址匹配方法及装置
CN109684440A (zh) * 2018-12-13 2019-04-26 北京惠盈金科技术有限公司 基于层级标注的地址相似度度量方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112069273A (zh) * 2020-08-13 2020-12-11 丰图科技(深圳)有限公司 地址文本的分类方法、装置、电子设备及存储介质
CN112052673A (zh) * 2020-08-28 2020-12-08 丰图科技(深圳)有限公司 物流网点识别方法、装置、计算机设备和存储介质
CN112052672A (zh) * 2020-08-28 2020-12-08 丰图科技(深圳)有限公司 基于地址文本的单元区域识别方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
WO2021017679A1 (zh) 地址信息解析方法、装置、系统及数据获取方法
CN111277706B (zh) 一种应用推荐方法、装置、存储介质及电子设备
CN112016304A (zh) 文本纠错方法、装置、电子设备及存储介质
CN109255564B (zh) 一种取件点地址推荐方法及装置
CN111046669A (zh) 一种兴趣点的匹配方法、装置及计算机系统
CN110222330B (zh) 语义识别方法及装置、存储介质、计算机设备
CN111488468B (zh) 地理信息知识点抽取方法、装置、存储介质及计算机设备
CN111611797B (zh) 基于Albert模型的预测数据标注的方法、装置及设备
CN113947147A (zh) 目标地图模型的训练方法、定位方法及相关装置
CN112906361A (zh) 文本数据的标注方法和装置、电子设备和存储介质
CN113887930A (zh) 问答机器人健康度评估方法、装置、设备及存储介质
CN117312140A (zh) 测试用例的生成方法、装置、电子设备及存储介质
CN110674208B (zh) 用于确定用户的职住地信息的方法和装置
CN113344125A (zh) 长文本匹配识别方法、装置、电子设备及存储介质
CN110688995B (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
CN114036414A (zh) 兴趣点的处理方法、装置、电子设备、介质及程序产品
CN114518993A (zh) 基于业务特征的系统性能监控方法、装置、设备及介质
CN114780688A (zh) 基于规则匹配的文本质检方法、装置、设备及存储介质
CN111125272B (zh) 一种区域特征获取方法、装置、计算机设备及介质
CN109815307B (zh) 位置确定方法、装置、设备和介质
CN113688232A (zh) 招标文本分类方法、装置、存储介质及终端
CN111680122A (zh) 空间数据主动推荐方法、装置、存储介质及计算机设备
US20220252423A1 (en) Polygon search method
CN112487897A (zh) 笔迹内容评价方法、装置及电子设备
CN113822057B (zh) 地点信息确定方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination