CN112559649B - 兴趣点状态的识别方法及装置 - Google Patents

兴趣点状态的识别方法及装置 Download PDF

Info

Publication number
CN112559649B
CN112559649B CN201910909658.7A CN201910909658A CN112559649B CN 112559649 B CN112559649 B CN 112559649B CN 201910909658 A CN201910909658 A CN 201910909658A CN 112559649 B CN112559649 B CN 112559649B
Authority
CN
China
Prior art keywords
interest
point
state
comment information
interest point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910909658.7A
Other languages
English (en)
Other versions
CN112559649A (zh
Inventor
曹雪娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910909658.7A priority Critical patent/CN112559649B/zh
Publication of CN112559649A publication Critical patent/CN112559649A/zh
Application granted granted Critical
Publication of CN112559649B publication Critical patent/CN112559649B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种兴趣点状态的识别方法及装置,涉及计算机技术领域,能够解决现有技术中无法及时识别出兴趣点状态的问题。本发明的方法主要包括:获取待识别兴趣点的评论信息;根据预设识别规则识别所述评论信息所表征的兴趣点状态;所述预设识别规则包括由与兴趣点当前状态相关的时间、关键词构成的规则;当识别出所述评论信息所表征的兴趣点状态为兴趣点不在线时,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态;所述兴趣点状态识别模型是通过对基于所述预设识别规则识别出的表征兴趣点状态为兴趣点不在线的评论信息进行训练而得的模型。本发明主要适用于对电子地图中的兴趣点状态进行识别的场景中。

Description

兴趣点状态的识别方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种兴趣点状态的识别方法及装置。
背景技术
兴趣点是地理信息系统中的一个术语,泛指一切可以抽象为点的地理对象,尤其指一些与人们生活密切相关的地理实体,如学校、银行、餐馆、加油站、医院、超市等。用户可在电子地图上进行兴趣点查询,搜索到达兴趣点的推荐路线,并根据推荐路线到达兴趣点。也可在提供有兴趣点预约消费的APP上进行兴趣点查询,并提前预约消费所需的兴趣点,例如提前预定KTV的房间、提前购买某景点的门票。
然而,由于在实际生活中,不是每个兴趣点都会一直营业下去,可能会因为生意不好、搬迁等原因而在对应位置处停止营业,也可能会因为个人原因暂停营业一段时间,所以当用户根据推荐路线到达搜索的兴趣点后,可能会因遇到兴趣点关门、倒闭等情况,而白跑一趟。由此可知,如何及时识别出兴趣点的状态,以便及时更新电子地图、更新其他提供有兴趣点相关服务的APP或网站(如提供有兴趣点预约消费的APP),从而提高用户体验,是亟待解决的。
发明内容
有鉴于此,本发明提供的兴趣点状态的识别方法及装置,其目的在于解决现有技术中无法及时识别出兴趣点状态的问题。
第一方面,本发明提供了一种兴趣点状态的识别方法,所述方法包括:
获取待识别兴趣点的评论信息;
根据预设识别规则识别所述评论信息所表征的兴趣点状态;所述预设识别规则包括由与兴趣点当前状态相关的时间、关键词构成的规则;
当识别出所述评论信息所表征的兴趣点状态为兴趣点不在线时,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态;所述兴趣点状态识别模型是通过对基于所述预设识别规则识别出的表征兴趣点状态为兴趣点不在线的评论信息进行训练而得的模型。
可选的,根据预设识别规则识别所述评论信息所表征的兴趣点状态包括:
获取所述待识别兴趣点的评论信息中最新生成的N条评论信息,所述N为正整数;
将所述N条评论信息中包含预设过期关键词且语义不满足预设歧义规则的评论信息所表征的兴趣点状态确定为兴趣点不在线,并将所述待识别兴趣点的评论信息中的剩余评论信息所表征的兴趣点状态确定为兴趣点在线,所述预设歧义规则用于识别包含预设过期关键词但不表征兴趣点不在线的评论信息。
可选的,预设过期关键词包括:从已知表征兴趣点不在线的评论信息中提取的语义为不在线的关键词、所述提取的语义为不在线的关键词的同义词。
可选的,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态包括:
利用所述兴趣点识别模型对表征兴趣点状态为兴趣点不在线的的评论信息进行二次识别,获得二次识别后的评论信息;
当二次识别后的评论信息中存在所表征的兴趣点状态为不在线时,确定所述待识别兴趣点的当前状态为不在线。
可选的,在利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态之前,所述方法还包括:
根据所述预设识别规则识别各个兴趣点的评论信息所表征的兴趣点状态,并筛选出所表征兴趣点状态为兴趣点不在线的评论信息,以便针对筛选出的评论信息所表征的兴趣点状态进行人工确定,并根据人工确定结果获得正样本和负样本,所述正样本由表征兴趣点状态为兴趣点不在线的评论信息组成,所述负样本由表征兴趣点状态为兴趣点在线的评论信息组成;
根据预设比例将人工确定后的评论信息划分到训练集和测试集中,所述训练集和所述测试集均包括正样本和负样本;
利用预设模型算法对所述训练集进行训练,获得初始的兴趣点状态识别模型;
利用所述初始的兴趣点状态识别模型对所述测试集中的评论信息进行识别,获得识别后的测试集;
判断所述识别后的测试集中评论信息所表征的兴趣点状态与人工针对相同评论信息的识别结果是否相同;
若均相同,则将本次训练所得的兴趣点状态识别模型确定为最终所需的兴趣点状态识别模型;
若存在不同,则根据人工识别结果为存在不同的评论信息添加状态标记;从所述训练集中提取与添加状态标记后的测试集数量相同的评论信息作为下次训练所需的测试集,并将所述添加状态标记后的测试集中的评论信息添加到提取操作后训练集中生成下次训练所需的训练集,以便利用所述下次所需的训练集重新训练兴趣点状态识别模型,并利用所述下次所需的测试集进行验证,直至使得利用兴趣点状态识别模型对测试集中正样本的识别结果与人工识别结果完全相同时,获得最终所需的兴趣点状态识别模型。
可选的,当所述待识别兴趣点是从即时通信软件的聊天消息中获取到的兴趣点时,所述方法还包括:
在与包含所述待识别兴趣点的聊天消息的关联区域输出关于所述待识别兴趣点当前状态的提示信息。
可选的,当所述待识别兴趣点是包含用户当前地理位置的预设范围内的目标兴趣点时,所述方法还包括:
输出关于所述目标兴趣点状态的提醒信息,所述目标兴趣点为根据预设规则确定的用户感兴趣的兴趣点。
可选的,所述目标兴趣点包括以下至少一项:
所述用户到达次数大于预设次数阈值的兴趣点、与用户当前使用的电子设备相关联的兴趣点。
可选的,所述兴趣点状态识别模型属于TextCNN模型。
第二方面,本发明提供了一种兴趣点状态的识别装置,所述装置包括:
获取单元,用于获取待识别兴趣点的评论信息;
识别单元,用于根据预设识别规则识别所述评论信息所表征的兴趣点状态;所述预设识别规则包括由与兴趣点当前状态相关的时间、关键词构成的规则;
状态确定单元,用于当识别出所述评论信息所表征的兴趣点状态为兴趣点不在线时,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态;所述兴趣点状态识别模型是通过对基于所述预设识别规则识别出的表征兴趣点状态为兴趣点不在线的评论信息进行训练而得的模型。
可选的,所述识别单元包括:
获取模块,用于获取所述待识别兴趣点的评论信息中最新生成的N条评论信息,所述N为正整数;
第一确定模块,用于将所述N条评论信息中包含预设过期关键词且语义不满足预设歧义规则的评论信息所表征的兴趣点状态确定为兴趣点不在线,并将所述待识别兴趣点的评论信息中的剩余评论信息所表征的兴趣点状态确定为兴趣点在线,所述预设歧义规则用于识别包含预设过期关键词但不表征兴趣点不在线的评论信息。
可选的,所述第一确定模块所使用的预设过期关键词包括:从已知表征兴趣点不在线的评论信息中提取的语义为不在线的关键词、所述提取的语义为不在线的关键词的同义词。
可选的,所述状态确定单元包括:
识别模块,用于利用所述兴趣点识别模型对表征兴趣点状态为兴趣点不在线评论信息进行二次识别,获得二次识别后的评论信息;
第二确定模块,用于当二次识别后的评论信息中存在所表征的兴趣点状态为不在线时,确定所述待识别兴趣点的当前状态为不在线。
可选的,所述识别单元,还用于在利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态之前,根据所述预设识别规则识别各个兴趣点的评论信息所表征的兴趣点状态,并筛选出所表征兴趣点状态为兴趣点不在线的评论信息,以便针对筛选出的评论信息所表征的兴趣点状态进行人工确定,并根据人工确定结果获得正样本和负样本,所述正样本由表征兴趣点状态为兴趣点不在线的评论信息组成,所述负样本由表征兴趣点状态为兴趣点在线的评论信息组成;
所述装置还包括:
划分单元,用于根据预设比例将人工确定后的评论信息划分到训练集和测试集中,所述训练集和所述测试集均包括正样本和负样本;
训练单元,用于利用预设模型算法对所述训练集进行训练,获得初始的兴趣点状态识别模型;
所述识别单元,还用于利用所述初始的兴趣点状态识别模型对所述测试集中的评论信息进行识别,获得识别后的测试集;
判断单元,用于判断所述识别后的测试集中评论信息所表征的兴趣点状态与人工针对相同评论信息的识别结果是否相同;
模型确定单元,用于当均相同时,将本次训练所得的兴趣点状态识别模型确定为最终所需的兴趣点状态识别模型;
添加单元,用于当存在不同时,根据人工识别结果为存在不同的评论信息添加状态标记;
设置单元,用于从所述训练集中提取与添加状态标记后的测试集数量相同的评论信息作为下次训练所需的测试集,并将所述添加状态标记后的测试集中的评论信息添加到提取操作后训练集中生成下次训练所需的训练集,以便利用所述下次所需的训练集重新训练兴趣点状态识别模型,并利用所述下次所需的测试集进行验证,直至使得利用兴趣点状态识别模型对测试集中正样本的识别结果与人工识别结果完全相同时,获得最终所需的兴趣点状态识别模型。
可选的,所述装置还包括:
第一提醒单元,用于当所述待识别兴趣点是从即时通信软件的聊天消息中获取到的兴趣点时,在与包含所述待识别兴趣点的聊天消息的关联区域输出关于所述待识别兴趣点当前状态的提示信息。
可选的,所述装置还包括:
第二提醒单元,用于当所述待识别兴趣点是包含用户当前地理位置的预设范围内的目标兴趣点时,输出关于所述目标兴趣点状态的提醒信息,所述目标兴趣点为根据预设规则确定的用户感兴趣的兴趣点。
可选的,所述第二提醒单元所使用的目标兴趣点包括以下至少一项:
所述用户到达次数大于预设次数阈值的兴趣点、与用户当前使用的电子设备相关联的兴趣点。
可选的,所述状态确定单元所使用的所述兴趣点状态识别模型属于TextCNN模型。
第三方面,本发明提供了一种存储介质,所述存储介质存储有多条指令,所述指令适用于由处理器加载并执行如第一方面所述的兴趣点状态的识别方法。
第四方面,本发明提供了一种电子设备,所述电子设备包括存储介质和处理器;
所述处理器,适于实现各指令;
所述存储介质,适于存储多条指令;
所述指令适于由所述处理器加载并执行如第一方面所述的兴趣点状态的识别方法。
借由上述技术方案,本发明提供的兴趣点状态的识别方法及装置,能够先获取待识别兴趣点的评论信息,然后根据预设识别规则初步识别出该评论信息所表征的兴趣点状态,并利用兴趣点状态识别模型对所表征兴趣点状态为兴趣点不在线的评论信息进行二次识别,实现对初步识别结果的修正,从而更准确地确定出待识别兴趣点的当前状态,进而及时更新电子地图或其他软件、网站中待识别兴趣点的当前状态,可以使得用户及时获知每个兴趣点的最新状态。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种兴趣点状态的识别方法的流程图;
图2示出了本发明实施例提供的电子地图中兴趣点状态更新示例图;
图3示出了本发明实施例提供的一种兴趣点状态识别模型训练的方法流程图;
图4示出了本发明实施例提供的一种兴趣点状态智能提醒的示例图;
图5示出了本发明实施例提供的一种兴趣点状态的识别装置的组成框图;
图6示出了本发明实施例提供的另一种兴趣点状态的识别装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种兴趣点状态的识别方法,如图1所示,所述方法主要包括:
101、获取待识别兴趣点的评论信息。
在实际应用中,用户可以在能够用于服务兴趣点的软件或网站(例如电子地图、美食团购APP等)的兴趣点详情中对其进行评论,如对一家餐厅的食品进行评论、对该餐厅的营业情况进行评论,当遇到兴趣点关门、拆迁等情况下,用户也会直接在对应软件或网站的反馈功能中对兴趣点进行评论。因此,本发明实施例中涉及的兴趣点的评论信息至少包括:兴趣点详情中的评论信息和反馈功能中的评论信息。
为了及时获知待识别兴趣点的状态,可以定期获取全网用户对该待识别兴趣点的评论信息,以便根据评论信息中的内容识别待识别兴趣点的状态。
102、根据预设识别规则识别所述评论信息所表征的兴趣点状态。
其中,所述预设识别规则包括由与兴趣点当前状态相关的时间、关键词构成的规则。也就是说,在实际应用中,通过时间的先后与表征兴趣点不在线的关键词(可称为过期关键词)可以设置多条预设识别规则,然后将待识别兴趣点的评论信息与预设识别规则进行匹配,将与所有预设识别规则都匹配的评论信息所表征的状态为兴趣点不在线,将剩余评论信息所表征的状态为兴趣点在线。其中,兴趣点在线是指兴趣点处于营业状态,兴趣点不在线是指兴趣点处于未营业状态。
由于语言博大精深,单凭一些关键词和时间就确定兴趣点不在线是存在一定误差的,例如虽然评论信息中有“黄了”一词,但可能不是说兴趣点不在线,而是说其他事物发黄了,所以需要将识别结果为兴趣点不在线的评论信息进行二次识别,即继续执行步骤103。而对于与兴趣点当前状态无关的时间下发表的评论信息和不包含过期关键词的评论信息,则无法明确反映兴趣点当前的状态信息,所以直接将这些评论信息表征的兴趣点状态确定为兴趣点在线,从而不再进行二次识别。
103、当识别出所述评论信息所表征的兴趣点状态为兴趣点不在线时,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态。
其中,所述兴趣点状态识别模型是通过对基于所述预设识别规则识别出的表征兴趣点状态为兴趣点不在线的评论信息进行训练而得的模型。具体的,在对某一兴趣点的状态进行识别之前,可以先对不同兴趣点的多条评论信息进行预设识别规则匹配,并筛选出识别结果为表征兴趣点不在线的评论信息进行模型训练,以机器自学习的方法训练出准确率相对更高的兴趣点识别模型,以便后续先对待识别兴趣点的评论信息进行预设识别规则的初步识别后,对于初步识别结果为兴趣点不在线的评论信息,再利用兴趣点状态识别模型进行二次识别,对错误的状态识别结果进行修正,最终根据二次识别的结果确定待识别兴趣点的当前状态。
此外,所述兴趣点状态识别模型可以属于TextCNN(Text Convolutional NeuralNetworks,Text卷积神经网络)模型(即利用卷积神经网络对文本进行分类的模型),也可以属于RNN(Recurrent Neural Network,循环神经网络)模型或者其他模型。其中,由于评论信息(尤其是表征兴趣点不在线的评论信息)具有长度短、内容复杂、局部内容与不在线相关等特点,TextCNN模型具有简单、稳定、善于捕捉局部特征以及能很好的刻画较短时序的信息的特点,RNN模型具有独特的时序记忆性以及善于处理较长时间段上的时序信息的特点,所以这两种模型相比较,TextCNN模型能够更好地对评论信息进行分析,从中识别出兴趣点状态。
本发明实施例提供的兴趣点状态的识别方法,能够先获取待识别兴趣点的评论信息,然后根据预设识别规则初步识别出该评论信息所表征的兴趣点状态,并利用兴趣点状态识别模型对所表征兴趣点状态为兴趣点不在线的评论信息进行二次识别,实现对初步识别结果的修正,从而更准确地确定出待识别兴趣点的当前状态,进而及时更新电子地图或其他软件、网站中待识别兴趣点的当前状态,可以使得用户及时获知每个兴趣点的最新状态。
在本发明的另一个实施例中,进一步介绍上述步骤102的一种可选实施方式,该过程包括:
获取所述待识别兴趣点的评论信息中最新生成的N条评论信息,所述N为正整数;将所述N条评论信息中包含预设过期关键词且语义不满足预设歧义规则的评论信息所表征的兴趣点状态确定为兴趣点不在线,并将所述待识别兴趣点的评论信息中的剩余评论信息所表征的兴趣点状态确定为兴趣点在线,所述预设歧义规则用于识别包含预设过期关键词但不表征兴趣点不在线的评论信息。
具体的,由于本发明实施例是要识别出兴趣点的当前状态,而对于他的历史状态,本发明实施例是不关注的,而能够反映兴趣点当前状态的往往是用户最新发表的评论,所以可以先根据评论信息的生成时间筛选出最新生成的N条评论信息,以作进一步判断,而对于位于第N条以后的评论信息,无论实际表征的当时兴趣点在不在线,其均不能表征兴趣点最新状态是不在线,故将这些评论信息默认为表征兴趣点在线。由于当用户发现兴趣点不在线时,会在电子地图中使用明显表示兴趣点不在线的一些过期关键词(如关门、倒闭、搬迁等),所以在对N条评论信息作进一步识别时,可以检测评论信息中是否包含预设过期关键词;但包含预设过期关键词的评论信息中也可能具有其他含义,例如“晚上10点来已经关门了”只是表征用户去的时间点不是兴趣点的营业时间,而不表征兴趣点在营业时间也不会营业,因此对于包含预设过期关键词的评论信息还要判断其是否符合其他含义,若不符合其他含义,才能确定评论信息所表征的兴趣点状态为不在线。
其中,预设过期关键词包括:从已知表征兴趣点不在线的评论信息(如已经人工确定的一些表征兴趣点不在线的评论信息)中提取的语义为不在线的关键词、所述提取的语义为不在线的关键词的同义词。所述预设歧义规则可以包括时间、预设过期关键词和语气词。
进一步的,由于根据实际经验设置的预设歧义规则涉及的歧义情况往往是有限的,无法包括所有的歧义情况,所以基于预设识别规则识别时,可能会将表征兴趣点在线的评论信息,识别为表征兴趣点不在线。因此,为了提高兴趣点状态识别的准确性,可以使用兴趣点识别模型对表征兴趣点不在线的评论信息进行二次识别。具体的,步骤103确定待识别兴趣点当前状态的具体实施方式可以为:先利用所述兴趣点识别模型对表征兴趣点状态为兴趣点不在线的的评论信息进行二次识别,获得二次识别后的评论信息;当二次识别后的评论信息中存在所表征的兴趣点状态为不在线时,确定所述待识别兴趣点的当前状态为不在线;也就是说,当经过二次识别的评论信息中有一条表征兴趣点不在线,即可确定兴趣点的当前状态为不在线。
示例性的,如图2所示,用户1、2、3、4、5在使用电子地图客户端搜索某兴趣点(如饭店1)后,按照电子地图中推荐的路线到达饭店1,并在电子地图的兴趣点反馈区,对该饭店1做出了相关评价,用户1的评论信息1为“2018年8月1日12:00:饭菜不错,服务很好”,用户2的评论信息2为“2019年1月1日12:00:餐桌布都黄了,吃饭真扫兴”,用户3的评论信息3为“2019年1月2日14:00:饭店暂停营业了”,用户4的评论信息4为“2019年1月3日10:00:门店装修中”,用户5的评论信息5为“2019年1月4日23:35:晚上11点半来已经关门了”电子地图客户端在接收到用户的评论信息后,会将评论信息上报给电子地图服务器,电子地图服务器接收到评论信息后,会定期根据这些评论信息,对兴趣点的当前状态进行识别,并对电子地图数据中的记录的兴趣点的当前状态进行更新。
具体的,已知预设识别规则包括将最近4条评论信息以前的评论信息所表征的兴趣点状态为在线,将最近4条评论信息中包括过期关键词(关门、搬家、拆迁、倒闭、暂停营业、黄了、装修)且不满足预设歧义规则(例如评论信息中描述的时间为兴趣点非营业时间且包含过期关键词“关门”)的评论信息所表征的兴趣点状态确定为不在线,将最近4条评论信息中其他评论信息所表征的兴趣点状态确定为在线。先使用预设识别规则分别对这5条评论信息所表征的兴趣点状态进行识别:由于评论信息1不是最近4条评论信息,所以评论信息1所表征的兴趣点状态是在线;评论信息2为“2019年1月1日12:00:餐桌布都黄了,吃饭真扫兴”,其属于最近4条评论信息中的一条评论信息,且包括过期关键词“黄了”,又不满足预设歧义规则,故评论信息2所表征的兴趣点状态是不在线;评论信息3为“2019年1月2日14:00:饭店暂停营业了”,其属于最近4条评论信息中的一条评论信息,并且包括过期关键词“暂停营业”,又不满足预设歧义规则,故评论信息3所表征的兴趣点状态是不在线;评论信息4为“2019年1月3日10:00:门店装修中”,其属于最近4条评论信息中的一条评论信息,并且包括过期关键词“装修”,又不满足预设歧义规则,故评论信息4所表征的兴趣点状态是不在线;评论信息5为“2019年1月4日23:35:晚上11点半来已经关门了”,其属于最近4条评论信息中的一条评论信息,且包含过期关键词“关门”,但用户是在23:30到达饭店1的,不属于饭店1的营业时间,即满足预设歧义规则,故评论信息5所表征的兴趣点状态是在线。由于在实际应用中,包含过期关键词的真实语句的含义不一定是指兴趣点不在线,且预设歧义规则涉及的歧义情况往往是有限的,所以需要对识别结果为表征兴趣点不在线的评论信息进行二次识别,以提高兴趣点状态识别的准确率。具体的,可以将表征兴趣点不在线的评论信息2-4输入到兴趣点状态识别模型中进行二次识别,由于在根据大量历史评论信息进行模型训练时,对于“**黄了”这种评论进行了训练,其能够识别出所表达的真实含义是否指兴趣点黄了,所以对评论信息4的二次识别结果为兴趣点在线,而对于评论信息2和3的二次识别结果则与第一次识别结果一致,均为兴趣点不在线。由于3条评论信息中存在表征兴趣点不在线的评论信息,所以将饭店1当前状态确定为不在线。当电子地图数据中记录的关于该饭店的当前状态是在线(例如用“营业中”表示在线)时,可以及时更新状态,将当前状态修改为不在线(例如用“休息中”表示不在线),以便用户搜索到该饭店时,能够及时获知该饭店不在线的消息,从而避免白跑一趟。
可选的,在执行步骤103之前,需要先训练出兴趣点状态识别模型,如图3所示,下面阐述一种可选的训练方法:
104、根据所述预设识别规则识别各个兴趣点的评论信息所表征的兴趣点状态,并筛选出所表征兴趣点状态为兴趣点不在线的评论信息,以便针对筛选出的评论信息所表征的兴趣点状态进行人工确定,并根据人工确定结果获得正样本和负样本。
所述正样本由表征兴趣点状态为兴趣点不在线的评论信息组成,所述负样本由表征兴趣点状态为兴趣点在线的评论信息组成。
105、根据预设比例将人工确定后的评论信息划分到训练集和测试集中。
其中,预设比例可以为“训练集数量:测试集数量=4:1”,所述训练集和所述测试集均包括正样本和负样本。
106、利用预设模型算法对所述训练集进行训练,获得初始的兴趣点状态识别模型。
其中,预设模型算法可以为TextCNN算法,也可以为RNN等算法。在使用TextCNN算法对训练集进行训练的具体可以为:先对训练集的评论信息进行切词,并且构建词典,将词典中的每个词转成word2vec向量,再对切词后的评论信息按原有顺序拼装成一个词向量,并使用三种不同大小的卷积核进行卷积,最后进行池化、输出。其中,为避免过拟合,可以加入dropout和L2正则。
107、利用所述初始的兴趣点状态识别模型对所述测试集中的评论信息进行识别,获得识别后的测试集。
108、判断所述识别后的测试集中评论信息所表征的兴趣点状态与人工针对相同评论信息的识别结果是否相同。
在利用初始的兴趣点状态识别模型对测试集进行识别后,为了验证初始的兴趣点状态识别模型的识别结果是否准确,可以对测试集进行一下人工识别,然后比较自动识别结果与人工识别结果是否存在差异,若存在差异,则说明初始的兴趣点状态识别模型的识别准确率还没有达到100%,需要进一步调整,若不存在差异,说明此时的初始的兴趣点状态识别模型的识别准确率已经达到100%,可以直接用来对待识别兴趣点的评论信息进行识别。
109、若均相同,则将本次训练所得的兴趣点状态识别模型确定为最终所需的兴趣点状态识别模型。
110、若存在不同,则根据人工识别结果为存在不同的评论信息添加状态标记。
111、从所述训练集中提取与添加状态标记后的测试集数量相同的评论信息作为下次训练所需的测试集,并将所述添加状态标记后的测试集中的评论信息添加到提取操作后训练集中生成下次训练所需的训练集,以便利用所述下次所需的训练集重新训练兴趣点状态识别模型,并利用所述下次所需的测试集进行验证,直至使得利用兴趣点状态识别模型对测试集中正样本的识别结果与人工识别结果完全相同时,获得最终所需的兴趣点状态识别模型。其中,最终所需的兴趣点状态识别模型中的正负样本可以符合预设比例,如正负样本比例1:2。添加状态标记后的测试集是指经过处理后的整个测试集,并且将该测试集作为下次训练集的一部分时,可以在模型训练时根据状态标记进行模型参数调整,使得下次训练出的兴趣点状态模型的识别准确率更高。
示例性的,已知最初获得的训练集中有4份数据,测试集中有1份数据,每份数据包括相同数量的评论信息。服务器先对训练集中的4份数据进行模型训练,获得初始的兴趣点状态识别模型,然后利用初始的兴趣点状态识别模型对测试集中的1份数据进行识别,获得自动化识别结果,并与人工对测试集的识别结果进行比较,当存在不同时,为存在不同的评论信息添加状态标记(即添加人工识别结果);再从初始的训练集中获取1份数据作为新的测试集,并将修改识别结果的1份数据与初始的训练集中的剩余3份数据作为新的训练集;获得新的训练集和新的测试集后,开始第二次模型训练,直至某次获得的兴趣点状态识别模型对测试集的识别结果与人工识别结果完全相同为止。其中,每次重新构建测试集时,都是从当前的训练集中获取未作为测试集的一份数据作为新的测试集。
可选的,本发明实施例提供的兴趣点状态的识别方法,不仅可以应用于用户经过电子地图、美食团购等APP或网站查询兴趣点的场景中,还可以应用于智能推荐或智能提醒等场景中。
例如,可以应用于基于即时通信APP进行智能提醒的场景中。当所述待识别兴趣点是从即时通信APP的聊天内容中获取到的兴趣点时,可以在与包含所述待识别兴趣点的聊天消息的关联区域输出关于所述待识别兴趣点当前状态的提示信息。具体的,在用户通过电子设备(包括手机、电脑、物联网设备等)上的即时通信APP进行聊天时,可以监控聊天内容(包括文字、语音、图片等),当检测到聊天内容中包含兴趣点时,可以利用本发明的识别方法对该兴趣点的当前状态进行识别,并在与相应聊天消息的关联区域输出关于该兴趣点状态的提示信息,以便用户在聊天过程中就可以知道兴趣点真实状态。其中,关联区域可以为聊天消息附近的区域,也可以为独立于当前聊天界面的一个提醒界面,其具体展示方式在此不做限定。如图4所示,当聊天消息为“我们去XXX购物广场吧”,可以在该条消息右下角输出提示信息“!XXX购物广场装修中”。
又如,还可以应用于根据用户所处的地理环境进行智能推荐或智能提醒的场景中。具体的,可以获取电子设备的地理位置,然后查找包含该地理位置的预设范围内是否含有兴趣点,若含有兴趣点,则判断这些兴趣点的当前状态,并向用户推荐在线的兴趣点,或者向用户发出兴趣点不在线的提醒信息。
进一步的,在不同场景下,用户所关注的兴趣点不同,若直接将预设范围内的兴趣点的状态直接发送给用户,用户可能因为兴趣点太多而不愿关注,或产生搜索麻烦的问题。为了解决该技术问题,在确定包含该地理位置的预设范围内含有兴趣点时,也可以先判断这些兴趣点中是否含有目标兴趣点,若含有目标兴趣点,则识别目标兴趣点的当前状态,并输出关于所述目标兴趣点状态的提醒信息,所述目标兴趣点为根据预设规则确定的用户感兴趣的兴趣点。
由于用户对于熟悉的兴趣点往往不会通过电子地图查询路径,也不会通过团购、旅游等APP查询介绍,而会直接徒步或驾驶车辆去该兴趣点,在这种情况下,很容易遇到到达兴趣点后发现兴趣点不在线的情况,从而导致用户白跑一趟,所以可以通过将目标兴趣点设置为用户经常去的兴趣点来解决该技术问题。并且可以只向用户发出目标兴趣点不在线的提醒信息,避免用户从所有目标兴趣点中查找不在线的提醒信息而浪费时间。其中,用户经常去的兴趣点可以为到达次数大于预设次数阈值的兴趣点。
由于在用户当前使用的电子设备不同时,其所关注的兴趣点可能不同,所以为了提高用户使用电子设备的体现,可以针对与电子设备关联的兴趣点对用户进行智能提醒。例如,在用户当前使用的电子设备是车辆时,其在驾驶车辆过程中所关注的兴趣点包括停车场、加油站、充电站、4S店等,则可以针对这些兴趣点向用户发出状态提醒;又如,在用户当前使用的电子设备是智能音箱时,用户所感兴趣的兴趣点包括KTV;再如,在用户当前使用的电子设备是智能运动手表时,用户所感兴趣的兴趣点包括健身房、健身公园、健身器材商店等。
需要补充的是,关于目标兴趣点状态的提醒信息包括但不限于:文字提醒和/或语音提醒。
进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种兴趣点状态的识别装置,如图5所示,所述装置包括:
获取单元21,用于获取待识别兴趣点的评论信息;
识别单元22,用于根据预设识别规则识别所述评论信息所表征的兴趣点状态;所述预设识别规则包括由与兴趣点当前状态相关的时间、关键词构成的规则;
状态确定单元23,用于当识别出所述评论信息所表征的兴趣点状态为兴趣点不在线时,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态;所述兴趣点状态识别模型是通过对基于所述预设识别规则识别出的表征兴趣点状态为兴趣点不在线的评论信息进行训练而得的模型。
可选的,如图6所示,所述识别单元22包括:
获取模块221,用于获取所述待识别兴趣点的评论信息中最新生成的N条评论信息,所述N为正整数;
第一确定模块222,用于将所述N条评论信息中包含预设过期关键词且语义不满足预设歧义规则的评论信息所表征的兴趣点状态确定为兴趣点不在线,并将所述待识别兴趣点的评论信息中的剩余评论信息所表征的兴趣点状态确定为兴趣点在线,所述预设歧义规则用于识别包含预设过期关键词但不表征兴趣点不在线的评论信息。
可选的,第一确定模块222所使用的预设过期关键词包括:从已知表征兴趣点不在线的评论信息中提取的语义为不在线的关键词、所述提取的语义为不在线的关键词的同义词。
可选的,如图6所示,所述状态确定单元23包括:
识别模块231,用于利用所述兴趣点识别模型对表征兴趣点状态为兴趣点不在线的的评论信息进行二次识别,获得二次识别后的评论信息;
第二确定模块232,用于当二次识别后的评论信息中存在所表征的兴趣点状态为不在线时,确定所述待识别兴趣点的当前状态为不在线。
可选的,所述识别单元22,还用于在利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态之前,根据所述预设识别规则识别各个兴趣点的评论信息所表征的兴趣点状态,并筛选出所表征兴趣点状态为兴趣点不在线的评论信息,以便针对筛选出的评论信息所表征的兴趣点状态进行人工确定,并根据人工确定结果获得正样本和负样本,所述正样本由表征兴趣点状态为兴趣点不在线的评论信息组成,所述负样本由表征兴趣点状态为兴趣点在线的评论信息组成;
如图6所示,所述装置还包括:
划分单元24,用于根据预设比例将人工确定后的评论信息划分到训练集和测试集中,所述训练集和所述测试集均包括正样本和负样本;
训练单元25,用于利用预设模型算法对所述训练集进行训练,获得初始的兴趣点状态识别模型;
所述识别单元22,还用于利用所述初始的兴趣点状态识别模型对所述测试集中的评论信息进行识别,获得识别后的测试集;
判断单元26,用于判断所述识别后的测试集中评论信息所表征的兴趣点状态与人工针对相同评论信息的识别结果是否相同;
模型确定单元27,用于当均相同时,将本次训练所得的兴趣点状态识别模型确定为最终所需的兴趣点状态识别模型;
添加单元28,用于当存在不同时,根据人工识别结果为存在不同的评论信息添加状态标记;
设置单元29,用于从所述训练集中提取与添加状态标记后的测试集数量相同的评论信息作为下次训练所需的测试集,并将所述添加状态标记后的测试集中的评论信息添加到提取操作后训练集中生成下次训练所需的训练集,以便利用所述下次所需的训练集重新训练兴趣点状态识别模型,并利用所述下次所需的测试集进行验证,直至使得利用兴趣点状态识别模型对测试集中正样本的识别结果与人工识别结果完全相同时,获得最终所需的兴趣点状态识别模型。
可选的,如图6所示,所述装置还包括:
第一提醒单元210,用于当所述待识别兴趣点是从即时通信软件的聊天消息中获取到的兴趣点时,在与包含所述待识别兴趣点的聊天消息的关联区域输出关于所述待识别兴趣点当前状态的提示信息。
可选的,如图6所示,所述装置还包括:
第二提醒单元211,用于当所述待识别兴趣点是包含用户当前地理位置的预设范围内的目标兴趣点时,输出关于所述目标兴趣点状态的提醒信息,所述目标兴趣点为根据预设规则确定的用户感兴趣的兴趣点。
可选的,所述第二提醒单元211所使用的目标兴趣点包括以下至少一项:
所述用户到达次数大于预设次数阈值的兴趣点、与用户当前使用的电子设备相关联的兴趣点。
可选的,所述状态确定单元23所使用的所述兴趣点状态识别模型属于TextCNN模型。
本发明实施例提供的兴趣点状态的识别装置,能够先获取待识别兴趣点的评论信息,然后根据预设识别规则初步识别出该评论信息所表征的兴趣点状态,并利用兴趣点状态识别模型对所表征兴趣点状态为兴趣点不在线的评论信息进行二次识别,实现对初步识别结果的修正,从而更准确地确定出待识别兴趣点的当前状态。
进一步的,本发明的另一个实施例还提供了一种存储介质,所述存储介质存储有多条指令,所述指令适用于由处理器加载并执行如上所述的兴趣点状态的识别方法。
本发明实施例提供的存储介质中存储的指令,能够先获取待识别兴趣点的评论信息,然后根据预设识别规则初步识别出该评论信息所表征的兴趣点状态,并利用兴趣点状态识别模型对所表征兴趣点状态为兴趣点不在线的评论信息进行二次识别,实现对初步识别结果的修正,从而更准确地确定出待识别兴趣点的当前状态。
进一步的,本发明的另一个实施例还提供了一种电子设备,所述电子设备包括存储介质和处理器;
所述处理器,适于实现各指令;
所述存储介质,适于存储多条指令;
所述指令适于由所述处理器加载并执行如上所述的兴趣点状态的识别方法。
本发明实施例提供的电子设备,能够先获取待识别兴趣点的评论信息,然后根据预设识别规则初步识别出该评论信息所表征的兴趣点状态,并利用兴趣点状态识别模型对所表征兴趣点状态为兴趣点不在线的评论信息进行二次识别,实现对初步识别结果的修正,从而更准确地确定出待识别兴趣点的当前状态。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的兴趣点状态的识别方法及装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (20)

1.一种兴趣点状态的识别方法,其特征在于,所述方法包括:
获取待识别兴趣点的评论信息;
根据预设识别规则识别所述评论信息所表征的兴趣点状态;所述预设识别规则包括由与兴趣点当前状态相关的时间、关键词构成的规则;
当识别出所述评论信息所表征的兴趣点状态为兴趣点不在线时,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态;所述兴趣点状态识别模型是通过对基于所述预设识别规则识别出的表征兴趣点状态为兴趣点不在线的评论信息进行训练而得的模型。
2.根据权利要求1所述的方法,其特征在于,根据预设识别规则识别所述评论信息所表征的兴趣点状态包括:
获取所述待识别兴趣点的评论信息中最新生成的N条评论信息,所述N为正整数;
将所述N条评论信息中包含预设过期关键词且语义不满足预设歧义规则的评论信息所表征的兴趣点状态确定为兴趣点不在线,并将所述待识别兴趣点的评论信息中的剩余评论信息所表征的兴趣点状态确定为兴趣点在线,所述预设歧义规则用于识别包含预设过期关键词但不表征兴趣点不在线的评论信息。
3.根据权利要求2所述的方法,其特征在于,预设过期关键词包括:从已知表征兴趣点不在线的评论信息中提取的语义为不在线的关键词、所述提取的语义为不在线的关键词的同义词。
4.根据权利要求2所述的方法,其特征在于,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态包括:
利用所述兴趣点状态识别模型对表征兴趣点状态为兴趣点不在线的评论信息进行二次识别,获得二次识别后的评论信息;
当二次识别后的评论信息中存在所表征的兴趣点状态为不在线时,确定所述待识别兴趣点的当前状态为不在线。
5.根据权利要求1所述的方法,其特征在于,在利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态之前,所述方法还包括:
根据所述预设识别规则识别各个兴趣点的评论信息所表征的兴趣点状态,并筛选出所表征兴趣点状态为兴趣点不在线的评论信息,以便针对筛选出的评论信息所表征的兴趣点状态进行人工确定,并根据人工确定结果获得正样本和负样本,所述正样本由表征兴趣点状态为兴趣点不在线的评论信息组成,所述负样本由表征兴趣点状态为兴趣点在线的评论信息组成;
根据预设比例将人工确定后的评论信息划分到训练集和测试集中,所述训练集和所述测试集均包括正样本和负样本;
利用预设模型算法对所述训练集进行训练,获得初始的兴趣点状态识别模型;
利用所述初始的兴趣点状态识别模型对所述测试集中的评论信息进行识别,获得识别后的测试集;
判断所述识别后的测试集中评论信息所表征的兴趣点状态与人工针对相同评论信息的识别结果是否相同;
若均相同,则将本次训练所得的兴趣点状态识别模型确定为最终所需的兴趣点状态识别模型;
若存在不同,则根据人工识别结果为存在不同的评论信息添加状态标记;从所述训练集中提取与添加状态标记后的测试集数量相同的评论信息作为下次训练所需的测试集,并将所述添加状态标记后的测试集中的评论信息添加到提取操作后训练集中生成下次训练所需的训练集,以便利用所述下次所需的训练集重新训练兴趣点状态识别模型,并利用所述下次所需的测试集进行验证,直至使得利用兴趣点状态识别模型对测试集的识别结果与人工识别结果完全相同时,获得最终所需的兴趣点状态识别模型。
6.根据权利要求1所述的方法,其特征在于,当所述待识别兴趣点是从即时通信软件的聊天消息中获取到的兴趣点时,所述方法还包括:
在与包含所述待识别兴趣点的聊天消息的关联区域输出关于所述待识别兴趣点当前状态的提示信息。
7.根据权利要求1所述的方法,其特征在于,当所述待识别兴趣点是包含用户当前地理位置的预设范围内的目标兴趣点时,所述方法还包括:
输出关于所述目标兴趣点状态的提醒信息,所述目标兴趣点为根据预设规则确定的用户感兴趣的兴趣点。
8.根据权利要求7所述的方法,其特征在于,所述目标兴趣点包括以下至少一项:
所述用户到达次数大于预设次数阈值的兴趣点、与用户当前使用的电子设备相关联的兴趣点。
9.根据权利要求1-8中任一项所述的方法,其特征在于,所述兴趣点状态识别模型属于TextCNN模型。
10.一种兴趣点状态的识别装置,其特征在于,所述装置包括:
获取单元,用于获取待识别兴趣点的评论信息;
识别单元,用于根据预设识别规则识别所述评论信息所表征的兴趣点状态;所述预设识别规则包括由与兴趣点当前状态相关的时间、关键词构成的规则;
状态确定单元,用于当识别出所述评论信息所表征的兴趣点状态为兴趣点不在线时,利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态;所述兴趣点状态识别模型是通过对基于所述预设识别规则识别出的表征兴趣点状态为兴趣点不在线的评论信息进行训练而得的模型。
11.根据权利要求10所述的装置,其特征在于,所述识别单元包括:
获取模块,用于获取所述待识别兴趣点的评论信息中最新生成的N条评论信息,所述N为正整数;
第一确定模块,用于将所述N条评论信息中包含预设过期关键词且语义不满足预设歧义规则的评论信息所表征的兴趣点状态确定为兴趣点不在线,并将所述待识别兴趣点的评论信息中的剩余评论信息所表征的兴趣点状态确定为兴趣点在线,所述预设歧义规则用于识别包含预设过期关键词但不表征兴趣点不在线的评论信息。
12.根据权利要求11所述的装置,其特征在于,所述第一确定模块所使用的预设过期关键词包括:从已知表征兴趣点不在线的评论信息中提取的语义为不在线的关键词、所述提取的语义为不在线的关键词的同义词。
13.根据权利要求10所述的装置,其特征在于,所述状态确定单元包括:
识别模块,用于利用所述兴趣点状态识别模型对表征兴趣点状态为兴趣点不在线的评论信息进行二次识别,获得二次识别后的评论信息;
第二确定模块,用于当二次识别后的评论信息中存在所表征的兴趣点状态为不在线时,确定所述待识别兴趣点的当前状态为不在线。
14.根据权利要求10所述的装置,其特征在于,所述识别单元,还用于在利用兴趣点状态识别模型对所述评论信息进行二次识别,确定所述待识别兴趣点的当前状态之前,根据所述预设识别规则识别各个兴趣点的评论信息所表征的兴趣点状态,并筛选出所表征兴趣点状态为兴趣点不在线的评论信息,以便针对筛选出的评论信息所表征的兴趣点状态进行人工确定,并根据人工确定结果获得正样本和负样本,所述正样本由表征兴趣点状态为兴趣点不在线的评论信息组成,所述负样本由表征兴趣点状态为兴趣点在线的评论信息组成;
所述装置还包括:
划分单元,用于根据预设比例将人工确定后的评论信息划分到训练集和测试集中,所述训练集和所述测试集均包括正样本和负样本;
训练单元,用于利用预设模型算法对所述训练集进行训练,获得初始的兴趣点状态识别模型;
所述识别单元,还用于利用所述初始的兴趣点状态识别模型对所述测试集中的评论信息进行识别,获得识别后的测试集;
判断单元,用于判断所述识别后的测试集中评论信息所表征的兴趣点状态与人工针对相同评论信息的识别结果是否相同;
模型确定单元,用于当均相同时,将本次训练所得的兴趣点状态识别模型确定为最终所需的兴趣点状态识别模型;
添加单元,用于当存在不同时,根据人工识别结果为存在不同的评论信息添加状态标记;
设置单元,用于从所述训练集中提取与添加标记后的测试集数量相同的评论信息作为下次训练所需的测试集,并将所述添加状态标记后的测试集中的评论信息添加到提取操作后训练集中生成下次训练所需的训练集,以便利用所述下次所需的训练集重新训练兴趣点状态识别模型,并利用所述下次所需的测试集进行验证,直至使得利用兴趣点状态识别模型对测试集中正样本的识别结果与人工识别结果完全相同时,获得最终所需的兴趣点状态识别模型。
15.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第一提醒单元,用于当所述待识别兴趣点是即时通信软件的聊天消息中获取到的兴趣点时,在与包含所述待识别兴趣点的聊天消息的关联区域输出关于所述待识别兴趣点当前状态的提示信息。
16.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第二提醒单元,用于当所述待识别兴趣点是包含用户当前地理位置的预设范围内的目标兴趣点时,输出关于所述目标兴趣点状态的提醒信息,所述目标兴趣点为根据预设规则确定的用户感兴趣的兴趣点。
17.根据权利要求16所述的装置,其特征在于,所述第二提醒单元所使用的目标兴趣点包括以下至少一项:
所述用户到达次数大于预设次数阈值的兴趣点、与用户当前使用的电子设备相关联的兴趣点。
18.根据权利要求10-17中任一项所述的装置,其特征在于,所述状态确定单元所使用的所述兴趣点状态识别模型属于TextCNN模型。
19.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适用于由处理器加载并执行如权利要求1至9中任一项所述的兴趣点状态的识别方法。
20.一种电子设备,其特征在于,所述电子设备包括存储介质和处理器;
所述处理器,适于实现各指令;
所述存储介质,适于存储多条指令;
所述指令适于由所述处理器加载并执行如权利要求1至9中任意一项所述的兴趣点状态的识别方法。
CN201910909658.7A 2019-09-25 2019-09-25 兴趣点状态的识别方法及装置 Active CN112559649B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910909658.7A CN112559649B (zh) 2019-09-25 2019-09-25 兴趣点状态的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910909658.7A CN112559649B (zh) 2019-09-25 2019-09-25 兴趣点状态的识别方法及装置

Publications (2)

Publication Number Publication Date
CN112559649A CN112559649A (zh) 2021-03-26
CN112559649B true CN112559649B (zh) 2024-07-16

Family

ID=75029254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910909658.7A Active CN112559649B (zh) 2019-09-25 2019-09-25 兴趣点状态的识别方法及装置

Country Status (1)

Country Link
CN (1) CN112559649B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115309999B (zh) * 2022-10-11 2023-01-31 北京高德云信科技有限公司 兴趣点状态预测方法、装置、电子设备及计算机存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737048A (zh) * 2011-04-01 2012-10-17 北京千橡网景科技发展有限公司 用于修正社交网站中保存的poi的方法和设备
CN104080054A (zh) * 2014-07-18 2014-10-01 百度在线网络技术(北京)有限公司 一种异常兴趣点的获取方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9165206B2 (en) * 2011-12-12 2015-10-20 Google Inc. Updating point of interest data based on an image
US8892355B2 (en) * 2011-12-21 2014-11-18 Telenav, Inc. Navigation system with point of interest validation mechanism and method of operation thereof
US8983976B2 (en) * 2013-03-14 2015-03-17 Microsoft Technology Licensing, Llc Dynamically expiring crowd-sourced content
US9817907B1 (en) * 2014-06-18 2017-11-14 Google Inc. Using place of accommodation as a signal for ranking reviews and point of interest search results
CN106649459A (zh) * 2016-09-23 2017-05-10 珠海市魅族科技有限公司 管理电子地图的方法和装置
CN109145068B (zh) * 2018-07-12 2021-06-04 百度在线网络技术(北京)有限公司 地图更新方法及装置
CN109325091B (zh) * 2018-10-30 2021-02-19 百度在线网络技术(北京)有限公司 兴趣点属性信息的更新方法、装置、设备及介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737048A (zh) * 2011-04-01 2012-10-17 北京千橡网景科技发展有限公司 用于修正社交网站中保存的poi的方法和设备
CN104080054A (zh) * 2014-07-18 2014-10-01 百度在线网络技术(北京)有限公司 一种异常兴趣点的获取方法及装置

Also Published As

Publication number Publication date
CN112559649A (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
CN107291888B (zh) 基于机器学习统计模型的入住酒店附近生活推荐系统方法
CN106095833B (zh) 人机对话内容处理方法
WO2017066543A1 (en) Systems and methods for automatically analyzing images
CN109582969A (zh) 实体匹配方法、装置及电子设备
CN108596695B (zh) 实体推送方法及系统
CN109471981B (zh) 评论信息排序方法、装置、服务器及存储介质
CN108062366B (zh) 公共文化信息推荐系统
CN108230040B (zh) 到店预测方法及装置
CN108717519B (zh) 一种文本分类方法及装置
CN108416314A (zh) 图片重要人脸检测方法
CN111382744A (zh) 商铺信息获取方法、装置、终端设备及存储介质
CN110674208A (zh) 用于确定用户的职住地信息的方法和装置
CN109145146A (zh) 一种数据对象推荐方法、装置及电子设备
CN112559649B (zh) 兴趣点状态的识别方法及装置
CN111294620A (zh) 视频的推荐方法及装置
CN113407849B (zh) 一种粗排序的方法及装置
CN112446214A (zh) 广告关键词的生成方法、装置、设备及存储介质
CN109933784B (zh) 一种文本识别方法和装置
CN111782676A (zh) 概率预测模型训练方法、概率预测方法及装置
CN111782973A (zh) 兴趣点状态预测方法、装置、电子设备及存储介质
CN110992076A (zh) 商家质量评价方法、装置、电子设备及可读存储介质
CN111198960A (zh) 用户画像数据的确定方法、装置、电子设备及存储介质
CN112966947B (zh) 一种基于物联网的智慧旅游景区管理方法及系统
CN113411749B (zh) 入口位置确定方法及装置
CN110310146A (zh) 确定网红商户的方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant