CN109145068A - 地图更新方法及装置 - Google Patents
地图更新方法及装置 Download PDFInfo
- Publication number
- CN109145068A CN109145068A CN201810764381.9A CN201810764381A CN109145068A CN 109145068 A CN109145068 A CN 109145068A CN 201810764381 A CN201810764381 A CN 201810764381A CN 109145068 A CN109145068 A CN 109145068A
- Authority
- CN
- China
- Prior art keywords
- comment information
- word
- corresponding vector
- map
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种地图更新方法及装置,其中方法包括:获取地图中待处理的兴趣点的评论信息;对评论信息进行分词,获取评论信息对应的词语序列,以及词语序列中各个词语对应的向量;根据各个词语对应的向量,确定评论信息对应的向量;将评论信息对应的向量输入预设的分类模型,获取评论信息的类型;根据评论信息的类型,确定是否删除地图中的待处理的兴趣点,从而能够根据评论信息对地图中的兴趣点进行更新,而不需要手动进行更新,能够及时对地图进行更新,提高了地图更新效率,且降低了更新成本。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种地图更新方法及装置。
背景技术
目前,对地图中的兴趣点进行更新的方法为,在地图上有个用户报错的入口,当用户发现某个兴趣点在现实世界中不存在时,通过该入口进行报错,技术人员会对用户报错进行核实,如果属实,会将地图上的该兴趣点进行下线处理,导致地图更新效率低,且更新成本高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种地图更新方法,用于解决现有技术中地图更新效率低,且更新成本高的问题。
本发明的第二个目的在于提出一种地图更新装置。
本发明的第三个目的在于提出一种电子设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种地图更新方法,包括:
获取地图中待处理的兴趣点的评论信息;
对所述评论信息进行分词,获取所述评论信息对应的词语序列,以及所述词语序列中各个词语对应的向量;
根据各个词语对应的向量,确定所述评论信息对应的向量;
将所述评论信息对应的向量输入预设的分类模型,获取所述评论信息的类型;
根据所述评论信息的类型,确定是否删除所述地图中的所述待处理的兴趣点。
进一步的,所述根据各个词语对应的向量,确定所述评论信息对应的向量,包括:
将所述各个词语对应的向量输入双向GRU模型,获取所述双向GRU模型中各个词语对应的隐层状态;
针对各个词语,根据所述词语对应的隐层状态,计算所述词语对应的权重;
根据各个词语对应的向量以及权重,计算所述评论信息对应的向量。
进一步的,获取所述词语序列中各个词语对应的向量,包括:
将所述词语序列输入连续词袋模型CBOW,获取各个词语对应的向量;
其中,针对所述词语序列中的各个词语,所述CBOW模型结合所述词语的上下文词语确定所述词语对应的向量。
进一步的,所述的方法还包括:
获取训练数据;所述训练数据中包括:满足预设数量阈值的评论信息对应的向量,以及所述评论信息的类型;
采用所述训练数据对初始的分类模型进行训练,得到所述预设的分类模型。
进一步的,采用所述训练数据对初始的分类模型进行训练,得到所述预设的分类模型,包括:
针对所述训练数据中的每个评论信息对应的向量以及类型,采用所述评论信息对应的向量以及类型对所述分类模型进行训练;
获取所述分类模型的损失函数;
根据所述损失函数对所述分类模型中的分类系数进行调整。
进一步的,所述类型包括:正常和删除;
对应的,所述根据所述评论信息的类型,确定是否删除所述地图中的所述待处理的兴趣点,包括:
若所述评论信息的类型为删除,则删除所述地图中的所述待处理的兴趣点;
若所述评论信息的类型为正常,则保留所述地图中的所述待处理的兴趣点。
本发明实施例的地图更新方法,通过获取地图中待处理的兴趣点的评论信息;对评论信息进行分词,获取评论信息对应的词语序列,以及词语序列中各个词语对应的向量;根据各个词语对应的向量,确定评论信息对应的向量;将评论信息对应的向量输入预设的分类模型,获取评论信息的类型;根据评论信息的类型,确定是否删除地图中的待处理的兴趣点,从而能够根据评论信息对地图中的兴趣点进行更新,而不需要手动进行更新,能够及时对地图进行更新,提高了地图更新效率,且降低了更新成本。
为达上述目的,本发明第二方面实施例提出了一种地图更新装置,包括:
获取模块,用于获取地图中待处理的兴趣点的评论信息;
分词模块,用于对所述评论信息进行分词,获取所述评论信息对应的词语序列,以及所述词语序列中各个词语对应的向量;
确定模块,用于根据各个词语对应的向量,确定所述评论信息对应的向量;
所述获取模块,还用于将所述评论信息对应的向量输入预设的分类模型,获取所述评论信息的类型;
所述确定模块,还用于根据所述评论信息的类型,确定是否删除所述地图中的所述待处理的兴趣点。
进一步的,所述确定模块具体用于,
将所述各个词语对应的向量输入双向GRU模型,获取所述双向GRU模型中各个词语对应的隐层状态;
针对各个词语,根据所述词语对应的隐层状态,计算所述词语对应的权重;
根据各个词语对应的向量以及权重,计算所述评论信息对应的向量。
进一步的,所述获取模块具体用于,
将所述词语序列输入连续词袋模型CBOW,获取各个词语对应的向量;
其中,针对所述词语序列中的各个词语,所述CBOW模型结合所述词语的上下文词语确定所述词语对应的向量。
进一步的,所述的装置还包括:训练模块;
所述获取模块,还用于获取训练数据;所述训练数据中包括:满足预设数量阈值的评论信息对应的向量,以及所述评论信息的类型;
所述训练模块,用于采用所述训练数据对初始的分类模型进行训练,得到所述预设的分类模型。
进一步的,所述训练模块具体用于,
针对所述训练数据中的每个评论信息对应的向量以及类型,采用所述评论信息对应的向量以及类型对所述分类模型进行训练;
获取所述分类模型的损失函数;
根据所述损失函数对所述分类模型中的分类系数进行调整。
进一步的,所述类型包括:正常和删除;
对应的,所述确定模块具体用于,
若所述评论信息的类型为删除,则删除所述地图中的所述待处理的兴趣点;
若所述评论信息的类型为正常,则保留所述地图中的所述待处理的兴趣点。
本发明实施例的地图更新装置,通过获取地图中待处理的兴趣点的评论信息;对评论信息进行分词,获取评论信息对应的词语序列,以及词语序列中各个词语对应的向量;根据各个词语对应的向量,确定评论信息对应的向量;将评论信息对应的向量输入预设的分类模型,获取评论信息的类型;根据评论信息的类型,确定是否删除地图中的待处理的兴趣点,从而能够根据评论信息对地图中的兴趣点进行更新,而不需要手动进行更新,能够及时对地图进行更新,提高了地图更新效率,且降低了更新成本。
为达上述目的,本发明第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上所述的地图更新方法。
为了实现上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的地图更新方法。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如上所述的地图更新方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的一种地图更新方法的流程示意图;
图2为本发明实施例提供的另一种地图更新方法的流程示意图;
图3为本发明实施例提供的一种地图更新装置的结构示意图;
图4为本发明实施例提供的另一种地图更新装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的地图更新方法及装置。
图1为本发明实施例提供的一种地图更新方法的流程示意图。如图1所示,该地图更新方法包括以下步骤:
S101、获取地图中待处理的兴趣点的评论信息。
本发明提供的地图更新方法的执行主体为地图更新装置,地图更新装置可以为终端设备、服务器等硬件设备,或者为硬件设备上安装的软件。本实施例中,待处理的兴趣点例如可以为,地图中对应的评论信息存在更新的兴趣点。兴趣点例如酒店、餐厅、超市、便利店、公园等。若某个用户在某个超市进行一次购物行为,并针对该购物行为对该超市发表评论,则确定超市对应的评论信息存在更新,对应的,步骤101中的评论信息为更新的评论信息。
本实施例中,评论信息指的是一条评论信息。若评论信息包括多条评论信息,则可以针对每条评论信息分别执行以下步骤。
S102、对评论信息进行分词,获取评论信息对应的词语序列,以及词语序列中各个词语对应的向量。
例如,若评论信息为“关门中,不知道为什么不营业,下次再看看”,则对应的词语序列为“关门、中、不、知道、为什么、不、营业、下次、再、看看”。其中,“关门”对应的向量例如可以为[0.1,0.6,-0.5];“中”对应的向量例如可以为[-0.2,0.9,0.7]。
本实施例中,地图更新装置获取词语序列中各个词语对应的向量的过程具体可以为,将词语序列输入连续词袋模型CBOW,获取各个词语对应的向量;其中,针对词语序列中的各个词语,CBOW模型结合词语的上下文词语确定词语对应的向量。
本实施例中,连续词袋模型CBOW为Word2vec模型,针对含义相近的词语,分配的向量的相似度较高;针对含义不相近的词语,分配的向量的相似度较低。连续词袋模型CBOW在确定词语对应的向量时,还可以结合词语的上下文词语的向量来确定该词语对应的向量。
S103、根据各个词语对应的向量,确定评论信息对应的向量。
本实施例中,地图更新装置执行步骤103的过程具体可以为,将各个词语对应的向量输入双向GRU模型,获取双向GRU模型中各个词语对应的隐层状态;针对各个词语,根据词语对应的隐层状态,计算词语对应的权重;根据各个词语对应的向量以及权重,计算评论信息对应的向量。
其中,双向GRU模型为双向循环神经网络模型。双向GRU模型中的前向GRU按照词语序列(x1,x2,...,xT)的顺序依次编码每一个词语,并得到一系列隐层状态类似的,后向GRU按照(xT,xT-1,...,x1)的顺序依次编码每一个词语,得到一系列隐层状态最后对于词语xi,通过拼接两个GRU的结果得到xi的隐层状态,即
本实施例中,根据词语对应的隐层状态,计算词语对应的权重的计算公式具体可以为如下公式(1)和公式(2)所示。
ut=tanh(Wwht+bw)
其中,ht表示词语序列中第t个词语对应的隐层状态;αt表示词语序列中第t个词语对应的权重;Ww、bw为系数;uw为随机初始化得到的权重向量。
本实施例中,地图更新装置根据各个词语对应的向量以及权重,计算评论信息对应的向量的过程具体可以为,对词语序列中各个词语对应的向量以及权重进行加权求和,得到评论信息对应的向量。评论信息对应的向量的计算公式可以如以下公式(3)所示。
其中,c表示评论信息对应的向量。
S104、将评论信息对应的向量输入预设的分类模型,获取评论信息的类型。
S105、根据评论信息的类型,确定是否删除地图中的待处理的兴趣点。
其中,评论信息的类型例如可以包括:正常和删除。对应的,地图更新装置执行步骤105的过程具体可以为,若评论信息的类型为删除,则删除地图中的待处理的兴趣点;若评论信息的类型为正常,则保留地图中的待处理的兴趣点。
本发明实施例的地图更新方法,通过获取地图中待处理的兴趣点的评论信息;对评论信息进行分词,获取评论信息对应的词语序列,以及词语序列中各个词语对应的向量;根据各个词语对应的向量,确定评论信息对应的向量;将评论信息对应的向量输入预设的分类模型,获取评论信息的类型;根据评论信息的类型,确定是否删除地图中的待处理的兴趣点,从而能够根据评论信息对地图中的兴趣点进行更新,而不需要手动进行更新,能够及时对地图进行更新,提高了地图更新效率,且降低了更新成本。
结合参考图2,在图1所示实施例的基础上,所述的方法还可以包括以下步骤:
S106、获取训练数据;训练数据中包括:满足预设数量阈值的评论信息对应的向量,以及评论信息的类型。
其中,训练数据中,评论信息的类型,可以为由人工对评论信息进行标注后得到的类型。
S107、采用训练数据对初始的分类模型进行训练,得到预设的分类模型。
本实施例中,地图更新装置执行步骤107的过程具体可以为,针对训练数据中的每个评论信息对应的向量以及类型,采用评论信息对应的向量以及类型对分类模型进行训练;获取分类模型的损失函数;根据损失函数对分类模型中的分类系数进行调整。
其中,分类模型的损失函数的计算公式可以如以下公式(4)和公式(5)所示。
pj=softmax(Wfv+bj) (5)
其中,v表示评论信息对应的向量;pj表示评论信息属于第j个类型的概率;I{.}是示性函数,取值规则为I{值为真的表达式}=1,I{值为假的表达式}=0;m表示训练数据中评论信息的总条数。i表示训练数据中第i条评论信息。k表示训练数据中评论信息的类型总数;yi表示训练数据中第i条评论信息的类型。
本实施例中,根据损失函数计算分类系数的公式可以如以下公式(6)所示。
其中,Wj为分类模型中的分类系数。
本实施例中,根据训练后的分类模型的损失函数,对分类模型中的分类系数进行调整,能够加快分类模型的收敛速度,提高训练得到的分类模型的准确度,从而进一步提高地图更新的准确度。
图3为本发明实施例提供的一种地图更新装置的结构示意图。如图3所示,包括:获取模块31、分词模块32和确定模块33。
其中,获取模块31,用于获取地图中待处理的兴趣点的评论信息;
分词模块32,用于对所述评论信息进行分词,获取所述评论信息对应的词语序列,以及所述词语序列中各个词语对应的向量;
确定模块33,用于根据各个词语对应的向量,确定所述评论信息对应的向量;
所述获取模块31,还用于将所述评论信息对应的向量输入预设的分类模型,获取所述评论信息的类型;
所述确定模块33,还用于根据所述评论信息的类型,确定是否删除所述地图中的所述待处理的兴趣点。
本发明提供的地图更新装置可以为终端设备、服务器等硬件设备,或者为硬件设备上安装的软件。本实施例中,待处理的兴趣点例如可以为,地图中对应的评论信息存在更新的兴趣点。兴趣点例如酒店、餐厅、超市、便利店、公园等。若某个用户在某个超市进行一次购物行为,并针对该购物行为对该超市发表评论,则确定超市对应的评论信息存在更新,对应的,上述获取模块31获取到的是更新的评论信息。
本实施例中,分词模块32具体可以用于,将词语序列输入连续词袋模型CBOW,获取各个词语对应的向量;其中,针对词语序列中的各个词语,CBOW模型结合词语的上下文词语确定词语对应的向量。
本实施例中,连续词袋模型CBOW为Word2vec模型,针对含义相近的词语,分配的向量的相似度较高;针对含义不相近的词语,分配的向量的相似度较低。连续词袋模型CBOW在确定词语对应的向量时,还可以结合词语的上下文词语的向量来确定该词语对应的向量。
进一步的,在上述实施例的基础上,确定模块33具体可以用于,将各个词语对应的向量输入双向GRU模型,获取双向GRU模型中各个词语对应的隐层状态;针对各个词语,根据词语对应的隐层状态,计算词语对应的权重;根据各个词语对应的向量以及权重,计算评论信息对应的向量。
其中,双向GRU模型为双向循环神经网络模型。双向GRU模型中的前向GRU按照词语序列(x1,x2,...,xT)的顺序依次编码每一个词语,并得到一系列隐层状态类似的,后向GRU按照(xT,xT-1,...,x1)的顺序依次编码每一个词语,得到一系列隐层状态最后对于词语xi,通过拼接两个GRU的结果得到xi的隐层状态,即
本实施例中,地图更新装置根据各个词语对应的向量以及权重,计算评论信息对应的向量的过程具体可以为,对词语序列中各个词语对应的向量以及权重进行加权求和,得到评论信息对应的向量。
其中,评论信息的类型例如可以包括:正常和删除。对应的,地图更新装置执行步骤105的过程具体可以为,若评论信息的类型为删除,则删除地图中的待处理的兴趣点;若评论信息的类型为正常,则保留地图中的待处理的兴趣点。
本发明实施例的地图更新装置,通过获取地图中待处理的兴趣点的评论信息;对评论信息进行分词,获取评论信息对应的词语序列,以及词语序列中各个词语对应的向量;根据各个词语对应的向量,确定评论信息对应的向量;将评论信息对应的向量输入预设的分类模型,获取评论信息的类型;根据评论信息的类型,确定是否删除地图中的待处理的兴趣点,从而能够根据评论信息对地图中的兴趣点进行更新,而不需要手动进行更新,能够及时对地图进行更新,提高了地图更新效率,且降低了更新成本。
结合参考图4,在图3所示实施例的基础上,所述的装置还包括:训练模块34。
所述获取模块31,还用于获取训练数据;所述训练数据中包括:满足预设数量阈值的评论信息对应的向量,以及所述评论信息的类型;
所述训练模块34,用于采用所述训练数据对初始的分类模型进行训练,得到所述预设的分类模型。
其中,训练模块34具体可以用于,针对训练数据中的每个评论信息对应的向量以及类型,采用评论信息对应的向量以及类型对分类模型进行训练;获取分类模型的损失函数;根据损失函数对分类模型中的分类系数进行调整。
其中,分类模型的损失函数的计算公式可以如以下公式(4)和公式(5)所示。
pj=softmax(Wjv+vj) (5)
其中,v表示评论信息对应的向量;pj表示评论信息属于第j个类型的概率;I{.}是示性函数,取值规则为I{值为真的表达式}=1,I{值为假的表达式}=0;m表示训练数据中评论信息的总条数。i表示训练数据中第i条评论信息。k表示训练数据中评论信息的类型总数;yi表示训练数据中第i条评论信息的类型。
本实施例中,根据损失函数计算分类系数的公式可以如以下公式(6)所示。
其中,Wj为分类模型中的分类系数。
本实施例中,根据训练后的分类模型的损失函数,对分类模型中的分类系数进行调整,能够加快分类模型的收敛速度,提高训练得到的分类模型的准确度,从而进一步提高地图更新的准确度。
图5为本发明实施例提供的一种电子设备的结构示意图。该电子设备包括:
存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算机程序。
处理器1002执行所述程序时实现上述实施例中提供的地图更新方法。
进一步地,电子设备还包括:
通信接口1003,用于存储器1001和处理器1002之间的通信。
存储器1001,用于存放可在处理器1002上运行的计算机程序。
存储器1001可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器1002,用于执行所述程序时实现上述实施例所述的地图更新方法。
如果存储器1001、处理器1002和通信接口1003独立实现,则通信接口1003、存储器1001和处理器1002可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器1001、处理器1002及通信接口1003,集成在一块芯片上实现,则存储器1001、处理器1002及通信接口1003可以通过内部接口完成相互间的通信。
处理器1002可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。
本发明还提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的地图更新方法。
本发明还提供一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如上所述的地图更新方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (15)
1.一种地图更新方法,其特征在于,包括:
获取地图中待处理的兴趣点的评论信息;
对所述评论信息进行分词,获取所述评论信息对应的词语序列,以及所述词语序列中各个词语对应的向量;
根据各个词语对应的向量,确定所述评论信息对应的向量;
将所述评论信息对应的向量输入预设的分类模型,获取所述评论信息的类型;
根据所述评论信息的类型,确定是否删除所述地图中的所述待处理的兴趣点。
2.根据权利要求1所述的方法,其特征在于,所述根据各个词语对应的向量,确定所述评论信息对应的向量,包括:
将所述各个词语对应的向量输入双向GRU模型,获取所述双向GRU模型中各个词语对应的隐层状态;
针对各个词语,根据所述词语对应的隐层状态,计算所述词语对应的权重;
根据各个词语对应的向量以及权重,计算所述评论信息对应的向量。
3.根据权利要求1所述的方法,其特征在于,获取所述词语序列中各个词语对应的向量,包括:
将所述词语序列输入连续词袋模型CBOW,获取各个词语对应的向量;
其中,针对所述词语序列中的各个词语,所述CBOW模型结合所述词语的上下文词语确定所述词语对应的向量。
4.根据权利要求1所述的方法,其特征在于,还包括:
获取训练数据;所述训练数据中包括:满足预设数量阈值的评论信息对应的向量,以及所述评论信息的类型;
采用所述训练数据对初始的分类模型进行训练,得到所述预设的分类模型。
5.根据权利要求4所述的方法,其特征在于,采用所述训练数据对初始的分类模型进行训练,得到所述预设的分类模型,包括:
针对所述训练数据中的每个评论信息对应的向量以及类型,采用所述评论信息对应的向量以及类型对所述分类模型进行训练;
获取所述分类模型的损失函数;
根据所述损失函数对所述分类模型中的分类系数进行调整。
6.根据权利要求1所述的方法,其特征在于,所述类型包括:正常和删除;
对应的,所述根据所述评论信息的类型,确定是否删除所述地图中的所述待处理的兴趣点,包括:
若所述评论信息的类型为删除,则删除所述地图中的所述待处理的兴趣点;
若所述评论信息的类型为正常,则保留所述地图中的所述待处理的兴趣点。
7.一种地图更新装置,其特征在于,包括:
获取模块,用于获取地图中待处理的兴趣点的评论信息;
分词模块,用于对所述评论信息进行分词,获取所述评论信息对应的词语序列,以及所述词语序列中各个词语对应的向量;
确定模块,用于根据各个词语对应的向量,确定所述评论信息对应的向量;
所述获取模块,还用于将所述评论信息对应的向量输入预设的分类模型,获取所述评论信息的类型;
所述确定模块,还用于根据所述评论信息的类型,确定是否删除所述地图中的所述待处理的兴趣点。
8.根据权利要求7所述的装置,其特征在于,所述确定模块具体用于,
将所述各个词语对应的向量输入双向GRU模型,获取所述双向GRU模型中各个词语对应的隐层状态;
针对各个词语,根据所述词语对应的隐层状态,计算所述词语对应的权重;
根据各个词语对应的向量以及权重,计算所述评论信息对应的向量。
9.根据权利要求7所述的装置,其特征在于,所述获取模块具体用于,
将所述词语序列输入连续词袋模型CBOW,获取各个词语对应的向量;
其中,针对所述词语序列中的各个词语,所述CBOW模型结合所述词语的上下文词语确定所述词语对应的向量。
10.根据权利要求7所述的装置,其特征在于,还包括:训练模块;
所述获取模块,还用于获取训练数据;所述训练数据中包括:满足预设数量阈值的评论信息对应的向量,以及所述评论信息的类型;
所述训练模块,用于采用所述训练数据对初始的分类模型进行训练,得到所述预设的分类模型。
11.根据权利要求10所述的装置,其特征在于,所述训练模块具体用于,
针对所述训练数据中的每个评论信息对应的向量以及类型,采用所述评论信息对应的向量以及类型对所述分类模型进行训练;
获取所述分类模型的损失函数;
根据所述损失函数对所述分类模型中的分类系数进行调整。
12.根据权利要求7所述的装置,其特征在于,所述类型包括:正常和删除;
对应的,所述确定模块具体用于,
若所述评论信息的类型为删除,则删除所述地图中的所述待处理的兴趣点;
若所述评论信息的类型为正常,则保留所述地图中的所述待处理的兴趣点。
13.一种电子设备,其特征在于,包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的地图更新方法。
14.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的地图更新方法。
15.一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如权利要求1-6中任一所述的地图更新方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810764381.9A CN109145068B (zh) | 2018-07-12 | 2018-07-12 | 地图更新方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810764381.9A CN109145068B (zh) | 2018-07-12 | 2018-07-12 | 地图更新方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109145068A true CN109145068A (zh) | 2019-01-04 |
CN109145068B CN109145068B (zh) | 2021-06-04 |
Family
ID=64800390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810764381.9A Active CN109145068B (zh) | 2018-07-12 | 2018-07-12 | 地图更新方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109145068B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559649A (zh) * | 2019-09-25 | 2021-03-26 | 阿里巴巴集团控股有限公司 | 兴趣点状态的识别方法及装置 |
CN113360590A (zh) * | 2021-06-22 | 2021-09-07 | 北京百度网讯科技有限公司 | 兴趣点信息的更新方法、装置、电子设备及存储介质 |
CN113516242A (zh) * | 2021-08-10 | 2021-10-19 | 中国科学院空天信息创新研究院 | 一种基于自注意力机制的神经网络模型的训练方法 |
CN114860836A (zh) * | 2022-05-24 | 2022-08-05 | 北京百度网讯科技有限公司 | 失效兴趣点的挖掘方法及装置、设备和介质 |
CN115292342A (zh) * | 2022-10-09 | 2022-11-04 | 湖北省国土测绘院 | 一种基于poi数据更新城市用地现状图的方法、系统及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593200A (zh) * | 2009-06-19 | 2009-12-02 | 淮海工学院 | 基于关键词频度分析的中文网页分类方法 |
CN107168945A (zh) * | 2017-04-13 | 2017-09-15 | 广东工业大学 | 一种融合多特征的双向循环神经网络细粒度意见挖掘方法 |
CN107220358A (zh) * | 2017-06-05 | 2017-09-29 | 江苏省基础地理信息中心 | 兴趣点的推荐方法及装置 |
CN107544957A (zh) * | 2017-07-05 | 2018-01-05 | 华北电力大学 | 一种面向商品目标词的情感倾向分析方法 |
CN107679189A (zh) * | 2017-09-30 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 一种兴趣点更新方法、装置、服务器和介质 |
US9984062B1 (en) * | 2015-07-10 | 2018-05-29 | Google Llc | Generating author vectors |
-
2018
- 2018-07-12 CN CN201810764381.9A patent/CN109145068B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593200A (zh) * | 2009-06-19 | 2009-12-02 | 淮海工学院 | 基于关键词频度分析的中文网页分类方法 |
US9984062B1 (en) * | 2015-07-10 | 2018-05-29 | Google Llc | Generating author vectors |
CN107168945A (zh) * | 2017-04-13 | 2017-09-15 | 广东工业大学 | 一种融合多特征的双向循环神经网络细粒度意见挖掘方法 |
CN107220358A (zh) * | 2017-06-05 | 2017-09-29 | 江苏省基础地理信息中心 | 兴趣点的推荐方法及装置 |
CN107544957A (zh) * | 2017-07-05 | 2018-01-05 | 华北电力大学 | 一种面向商品目标词的情感倾向分析方法 |
CN107679189A (zh) * | 2017-09-30 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 一种兴趣点更新方法、装置、服务器和介质 |
Non-Patent Citations (3)
Title |
---|
孙庆辉: "《空间位置信息服务系统原理和方法》", 28 February 2009, 西安地图出版社 * |
陕西年鉴社编: "《陕西年鉴 2013年》", 31 October 2013 * |
黄磊等: "基于递归神经网络的文本分类研究", 《北京化工大学学报( 自然科学版)》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559649A (zh) * | 2019-09-25 | 2021-03-26 | 阿里巴巴集团控股有限公司 | 兴趣点状态的识别方法及装置 |
CN113360590A (zh) * | 2021-06-22 | 2021-09-07 | 北京百度网讯科技有限公司 | 兴趣点信息的更新方法、装置、电子设备及存储介质 |
CN113360590B (zh) * | 2021-06-22 | 2024-03-12 | 北京百度网讯科技有限公司 | 兴趣点信息的更新方法、装置、电子设备及存储介质 |
CN113516242A (zh) * | 2021-08-10 | 2021-10-19 | 中国科学院空天信息创新研究院 | 一种基于自注意力机制的神经网络模型的训练方法 |
CN113516242B (zh) * | 2021-08-10 | 2024-05-14 | 中国科学院空天信息创新研究院 | 一种基于自注意力机制的穿墙雷达人体动作识别方法 |
CN114860836A (zh) * | 2022-05-24 | 2022-08-05 | 北京百度网讯科技有限公司 | 失效兴趣点的挖掘方法及装置、设备和介质 |
CN114860836B (zh) * | 2022-05-24 | 2023-03-10 | 北京百度网讯科技有限公司 | 失效兴趣点的挖掘方法及装置、设备和介质 |
CN115292342A (zh) * | 2022-10-09 | 2022-11-04 | 湖北省国土测绘院 | 一种基于poi数据更新城市用地现状图的方法、系统及设备 |
CN115292342B (zh) * | 2022-10-09 | 2022-12-20 | 湖北省国土测绘院 | 一种基于poi数据更新城市用地现状图的方法、系统及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109145068B (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145068A (zh) | 地图更新方法及装置 | |
CN106570477B (zh) | 基于深度学习的车型识别模型构建方法及车型识别方法 | |
CN110084216B (zh) | 人脸识别模型训练和人脸识别方法、系统、设备及介质 | |
Wu et al. | Object detection based on RGC mask R‐CNN | |
CN109002845B (zh) | 基于深度卷积神经网络的细粒度图像分类方法 | |
CN108197532A (zh) | 人脸识别的方法、装置及计算机装置 | |
CN110473083B (zh) | 树状风险账户识别方法、装置、服务器及存储介质 | |
CN108090433A (zh) | 人脸识别方法及装置、存储介质、处理器 | |
CN108320278A (zh) | 产品缺陷检测定位方法、装置、设备及计算机可读介质 | |
CN108363690A (zh) | 基于神经网络的对话语义意图预测方法及学习训练方法 | |
CN106844341A (zh) | 基于人工智能的新闻摘要提取方法及装置 | |
CN109801260A (zh) | 牲畜个数的识别方法及装置 | |
CN110175850A (zh) | 一种交易信息的处理方法及装置 | |
CN110232340A (zh) | 建立视频分类模型以及视频分类的方法、装置 | |
CN108961180A (zh) | 红外图像增强方法及系统 | |
CN110414586B (zh) | 基于深度学习的防伪标签验伪方法、装置、设备及介质 | |
CN107203265A (zh) | 信息交互方法和装置 | |
CN110471915A (zh) | 账户路由确定方法及装置 | |
CN109447129A (zh) | 一种多模式情绪识别方法、装置及计算机可读存储介质 | |
CN107193941A (zh) | 基于图片内容的故事生成方法和装置 | |
Yu | Emotion monitoring for preschool children based on face recognition and emotion recognition algorithms | |
CN110378254A (zh) | 车损图像修改痕迹的识别方法、系统、电子设备及存储介质 | |
CN101393608A (zh) | 一种基于流形距离分析的视觉对象识别方法和装置 | |
CN111340057A (zh) | 一种分类模型训练的方法及装置 | |
CN114419378A (zh) | 图像分类的方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |