CN108241678B - 兴趣点数据的挖掘方法和装置 - Google Patents

兴趣点数据的挖掘方法和装置 Download PDF

Info

Publication number
CN108241678B
CN108241678B CN201611219558.4A CN201611219558A CN108241678B CN 108241678 B CN108241678 B CN 108241678B CN 201611219558 A CN201611219558 A CN 201611219558A CN 108241678 B CN108241678 B CN 108241678B
Authority
CN
China
Prior art keywords
target
interest point
input content
scene
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611219558.4A
Other languages
English (en)
Other versions
CN108241678A (zh
Inventor
郭利凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Information Service Co Ltd
Original Assignee
Beijing Sogou Information Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Information Service Co Ltd filed Critical Beijing Sogou Information Service Co Ltd
Priority to CN201611219558.4A priority Critical patent/CN108241678B/zh
Publication of CN108241678A publication Critical patent/CN108241678A/zh
Application granted granted Critical
Publication of CN108241678B publication Critical patent/CN108241678B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Abstract

本发明实施例提供了一种兴趣点数据的挖掘方法和装置,其中的方法具体包括:获取用户在智能终端的预置平台中产生的输入内容;从所述输入内容中挖掘出目标兴趣点;获取所述目标兴趣点的地理位置信息。本发明实施例能够能够自动地从用户的输入内容中挖掘出目标兴趣点,故能够节省人力成本,提高兴趣点的挖掘效率,且能节省反馈接口对应的推广成本。

Description

兴趣点数据的挖掘方法和装置
技术领域
本发明涉及地理信息技术领域,特别是涉及一种POI(兴趣点,Point OfInterest)数据的挖掘方法和装置、一种用于兴趣点数据挖掘的装置。
背景技术
在地理信息系统中,一个兴趣点可以是一栋房子、一个商铺、一个邮筒、一个公交站等。每个POI的数据通常包含:名称、类别、地址、经纬度等方面信息,是导航地图等地理信息服务的必备资讯。
目前,地图数据库中的POI数据主要通过如下方案得到:
通过地图测绘人员采用精密的测绘仪器去获取各POI的经纬度,然后再通过人工方式针对各POI获得符合规范的POI数据。由于该现有方案需要通过人工方式进行,故需要耗费较多的人力成本,且导致POI数据的获取效率较低。
或者,地图APP(应用,Application)可以提供接口,以使用户通过该接口反馈地图数据库中不存在的POI数据。然而,由于用户在反馈过程中往往需要填写较多的内容,故容易使反馈的POI数据产生错误;并且,在大多数情况下,用户反馈POI数据的主动意愿差,故该现有方案通常需要耗费较高的推广成本。
发明内容
鉴于上述问题,本发明实施例提出了一种克服上述问题或者至少部分地解决上述问题的兴趣点数据的挖掘方法、兴趣点数据的挖掘装置及用于兴趣点数据挖掘的装置,本发明实施例能够自动地从用户的输入内容中挖掘出目标兴趣点,故能够节省人力成本,提高兴趣点的挖掘效率,且能节省反馈接口对应的推广成本。
为了解决上述问题,本发明公开了一种兴趣点数据的挖掘方法,包括:
获取用户在智能终端的预置平台中产生的输入内容;
从所述输入内容中挖掘出目标兴趣点;
获取所述目标兴趣点的地理位置信息。
可选地,所述从所述输入内容中挖掘出目标兴趣点的步骤,包括:
识别所述输入内容对应的目标兴趣点场景;
依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点。
可选地,所述依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点的步骤,包括:
依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式;
依据所述目标兴趣点语句模式,从所述输入内容中提取目标兴趣点的兴趣点特征词。
可选地,所述依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式的步骤,包括:
将所述输入内容对应语句模式与所述目标兴趣点场景对应预置兴趣点语句模式进行匹配,将匹配成功的预置兴趣点语句模式作为所述输入内容对应的目标兴趣点语句模式;和/或
依据所述目标兴趣点场景,对所述输入内容对应的语句模式进行分类,将分类结果作为所述输入内容对应的目标兴趣点语句模式。
可选地,所述依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点的步骤,包括:
从第一目标兴趣点场景下的一次输入内容中提取出目标兴趣点;和/或
判断第二目标兴趣点场景下预设时间段内的连续多次输入内容是否符合预置的纠正输入条件,若是,则从所述连续多次输入内容中选择目标输入内容,并从所述目标输入内容中提取出目标兴趣点;和/或
从第二目标兴趣点场景下预设时间段内的多次输入内容中提取相应的备选兴趣点,向用户输出所述备选兴趣点的第一提示信息,并依据用户对于所述第一提示信息的第一响应操作,确定目标兴趣点。
可选地,所述识别所述输入内容对应的目标兴趣点场景的步骤,包括:
依据所述输入内容对应的输入环境信息,确定所述输入内容对应的目标兴趣点场景,所述输入环境信息包括:上下文环境信息、位置环境信息、时间环境信息、以及平台环境信息中的至少一种;和/或
对所述输入内容、以及所述位置环境信息对应的周边兴趣点进行分类,以得到所述输入内容对应的目标兴趣点场景。
可选地,所述方法还包括:
在多次输入内容均命中所述目标兴趣点时,增加所述目标兴趣点的可信度;所述可信度用于作为是否采信目标兴趣点的依据。
可选地,所述方法还包括:
向用户输出所述目标兴趣点的第二提示信息;
依据用户对于所述第二提示信息的第二响应操作,判断所述目标兴趣点的数据的真实性。
另一方面,本发明公开了一种兴趣点数据的挖掘装置,包括:
输入内容获取模块,用于获取用户在智能终端的预置平台中产生的输入内容;
兴趣点挖掘模块,用于从所述输入内容中挖掘出目标兴趣点;以及
位置获取模块,用于获取所述目标兴趣点的地理位置信息。
可选地,所述兴趣点挖掘模块包括:
场景识别子模块,用于识别所述输入内容对应的目标兴趣点场景;以及
场景兴趣点挖掘子模块,用于依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点。
可选地,所述场景兴趣点挖掘子模块包括:
模式确定单元,用于依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式;
特征词提取单元,用于依据所述目标兴趣点语句模式,从所述输入内容中提取目标兴趣点的兴趣点特征词。
可选地,所述模式确定单元包括:
模式匹配子单元,用于将所述输入内容对应语句模式与所述目标兴趣点场景对应预置兴趣点语句模式进行匹配,将匹配成功的预置兴趣点语句模式作为所述输入内容对应的目标兴趣点语句模式;和/或
模式分类单元,用于依据所述目标兴趣点场景,对所述输入内容对应的语句模式进行分类,将分类结果作为所述输入内容对应的目标兴趣点语句模式。
可选地,所述场景兴趣点挖掘子模块包括:
第一兴趣点提取单元,用于从第一目标兴趣点场景下的一次输入内容中提取出目标兴趣点;和/或
第二兴趣点提取单元,用于判断第二目标兴趣点场景下预设时间段内的连续多次输入内容是否符合预置的纠正输入条件,若是,则从所述连续多次输入内容中选择目标输入内容,并从所述目标输入内容中提取出目标兴趣点;和/或
第三兴趣点提取单元,用于从第二目标兴趣点场景下预设时间段内的多次输入内容中提取相应的备选兴趣点,向用户输出所述备选兴趣点的第一提示信息,并依据用户对于所述第一提示信息的第一响应操作,确定目标兴趣点。
可选地,所述场景识别子模块包括:
第一场景识别单元,用于依据所述输入内容对应的平台环境信息,确定所述输入内容对应的目标兴趣点场景;和/或
第二场景识别单元,用于对所述输入内容、以及所述位置环境信息对应的周边兴趣点进行分类,以得到所述输入内容对应的目标兴趣点场景。
可选地,所述装置还包括:
可信度增加模块,用于在多次输入内容均命中所述目标兴趣点时,增加所述目标兴趣点的可信度;所述可信度用于作为是否采信目标兴趣点的依据。
可选地,所述装置还包括:
提示模块,用于向用户输出所述目标兴趣点的第二提示信息;
真实性判断模块,用于依据用户对于所述第二提示信息的第二响应操作,判断所述目标兴趣点的数据的真实性。
再一方面,本发明公开了一种用于兴趣点数据挖掘的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户在智能终端的预置平台中产生的输入内容;
从所述输入内容中挖掘出目标兴趣点;
获取所述目标兴趣点的地理位置信息。
本发明实施例包括以下优点:
本发明实施例可以获取用户在智能终端的预置平台中产生的输入内容,并从所述输入内容中挖掘出目标兴趣点,进而获取所述目标兴趣点的地理位置信息。由于本发明实施例可以自动地从用户的输入内容中挖掘出目标兴趣点,故能够节省人力成本,提高兴趣点的挖掘效率。并且,本发明实施例可以在不借助客户端用户的反馈的情况下完成兴趣点的挖掘,因此能节省反馈接口对应的推广成本。
附图说明
图1是本发明的一种兴趣点数据的挖掘方法实施例一的步骤流程图;
图2是本发明的一种兴趣点数据的挖掘方法实施例二的步骤流程图;
图3是本发明的一种兴趣点数据的挖掘装置实施例的结构框图;
图4是本发明的一种用于兴趣点数据挖掘的装置作为智能终端时的结构框图;及
图5是本发明的一种用于兴趣点数据挖掘的装置作为服务器时的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
随着互联网技术及移动互联网技术的发展,用户会在各种场景下使用不同的预置平台,产生兴趣点相关的输入内容。上述输入内容可用于表示,用户使用智能终端上的预置平台的过程中,通过主动输入方式产生的内容,其中,上述主动输入方式包括但不限于:文本输入、语音输入方式等等。无论何种方式产生的输入内容,本发明实施例均可以将其识别为计算设备所能理解的文本信息流。下面主要以文本信息流形式的输入内容为例对输入内容的处理过程进行说明。
在本发明的一种应用示例1中,用户A要去一个从未去过的办公场所P1见客户,其通常要提前查询地图,通过地图导航获得行走路线和花费时间,其中,在查询地图的过程中,用户A可以在地图平台中产生该办公场所P1相关的输入内容(如行政区划道路、大厦、以及公司名称等信息中的至少一种)。应用示例1中,用户A通过地图平台产生了办公场所P1相关的输入内容。
在本发明的一种应用示例2中,用户B准备去或者已经在一个新开的购物场所P2逛街,则用户B可能通过IM(即时通讯,Instant Messaging)平台产生该购物场所P2相关的输入内容,例如,用户B可以向其好友用户C发送相应的通信内容“我在P2逛街呢,有双鞋不错”,且用户C也回复了相应的输入内容“那就买吧”。应用示例2中,用户B通过IM平台产生了购物场所P2相关的输入内容。
在本发明的一种应用示例3中,用户D通过社交平台发布活动时,可以输入活动场所P3相关的输入内容,其中,该活动场所P3的类型可以为:体育、娱乐、休闲等等。
在本发明的一种应用示例4中,用户E在筹备出游时,可以通过旅游平台输入景点P4相关的输入内容等等。
可以理解,上述地图平台、IM平台、社交平台和旅游平台只是作为预置平台的可选实施例,实际上,用户可以通过任意的平台产生任意POI相关的输入内容,也即,有可能产生POI相关的输入内容的平台均在本发明实施例的保护范围之内。可选地,上述预置平台可以包括:预置应用和/或预置网站。
进一步可选地,所述预置平台的类别可以包括:LBS(基于位置的服务,LocationBased Service)类别、搜索类别、社交类别、即时通讯类别、旅游类别、电商类别、以及输入法类别中的至少一种,可以理解,本发明实施例对于预置平台的具体类别不加以限制。
其中,上述LBS类别的预置平台可以指利用移动设备和技术给用户提供地理位置信息服务的平台,上述LBS类别的预置平台可以包括但不限于:地图类应用,如地图应用A、地图应用B、地图应用C、地图应用D、地图应用E等;打车类应用,如打车应用、租车应用等;生活服务类应用,如旅游应用、点评应用、房产中介应用等。例如,用户在打车的时候,会启动打车类应用;又如,用户想去往某个餐馆,会启动点评应用等生活服务类应用;再如,如果想租房买房,会使用房产中介应用等生活服务类应用。
上述搜索类别的预置平台可以包括但不限于:搜索引擎、搜索APP等搜索平台。由于搜索平台的用户使用规模较大,故本发明实施例从搜索平台中准确客观地挖掘出用户所关注的POI,且能够契合不习惯使用地图类应用但习惯使用搜索平台的用户的习惯。
作为寄宿程序,输入法程序可以寄宿于任意的宿主程序中,故输入法程序可以监测所处的当前宿主程序环境,若该当前宿主程序环境为预置平台的环境或者预置平台的搜索框环境,则可以将用户在搜索框中的输入内容作为输入内容记录至输入法日志。也即输入法类别的平台可以获取用户通过任意平台产生的输入内容。
本发明实施例提供了一种兴趣点数据的挖掘方案,该方案可以获取用户在智能终端的预置平台中产生的输入内容,并从所述输入内容中挖掘出目标POI,进而获取所述目标POI的地理位置信息。由于本发明实施例可以自动地从用户的输入内容中挖掘出目标POI,故能够节省人力成本,提高POI的挖掘效率。并且,本发明实施例可以在不借助客户端用户的反馈的情况下完成POI的挖掘,因此能节省反馈接口对应的推广成本。
方法实施例一
参照图1,示出了本发明的一种兴趣点数据的挖掘方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤101、获取用户在智能终端的预置平台中产生的输入内容;
步骤102、从所述输入内容中挖掘出目标兴趣点;
步骤103、获取所述目标兴趣点的地理位置信息。
本发明实施例中,上述智能终端具体包括但不限:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group AudioLayer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture ExpertsGroup Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
在本发明的一种可选实施例中,还可以获取上述输入内容对应的输入环境信息,所述输入环境信息包括:上下文环境信息、位置环境信息、时间环境信息、以及平台环境信息中的至少一种。其中,对于一次或者多次输入内容而言,上下文环境可以包括:该一次或多次输入内容对应用户的一系列完整输入内容。例如,对于即时通讯平台产生的输入内容而言,该输入内容对应的上下文环境可以为用户在该输入内容对应时间段内对应的通信内容,例如,用户要去或者已经去了一个POI,则其会与一个或多个用户分享对应POI的内容,因此,其与一个或者多个用户之间的通信内容均可以作为某次输入内容的上下文环境。又如,随着移动互联网技术及通信技术的发展,一个用户通常会产生某POI相关的多次输入内容,例如,用户在打算去一个POI时(也即去一个POI之前)可能通过导航平台、旅游平台、或者即时通讯平台产生该POI相关的一次或多次输入内容;进一步,用户在到达该POI之后还可能通过即时通讯平台、社交平台产生该POI相关的一次或多次输入内容,以在朋友圈分享该POI的信息;并且,用户在离开该POI之后,还可能通过旅游平台产生该POI相关的游记内容等等,因此,用户在预设时间段内产生的某POI相关的多次输入内容是具有相关性的,因此可以相互作为上下文环境。
可选地,上述智能终端可以为具有定位功能的终端,这样,可以通过该智能终端获取上述输入内容对应的位置环境信息,其中,智能终端可以利用GPS(全球定位系统,GlobalPositioning System)、IP(网络之间互联的协议,Internet Protocol)等技术实现定位功能。
本发明实施例中,用户可以包括互联网的用户。在本发明的一种可选实施例中,互联网的用户在预置平台中产生输入内容时,预置平台可以生成相应的日志,则本发明实施例可以从上述预置平台收集日志,以获取用户在预置平台中产生的输入内容。
在实际应用中,日志的私密性等因素导致一些预置平台不会开放各自的查询日志,针对上述问题,在本发明的另一种可选实施例中,可以从输入法日志中获取用户在预置平台中产生的输入内容。其中,作为寄宿程序,输入法程序可以寄宿于任意的宿主程序中,故输入法程序可以监测所处的当前宿主程序环境,若该当前宿主程序环境为预置平台的环境或者预置平台的搜索框环境,则可以将用户在搜索框中的输入内容作为输入内容记录至输入法日志。可选地,输入法程序对所寄宿的宿主程序进行过滤,从上述宿主程序中过滤POI相关的输入内容的出现概率低于概率阈值的应用,以得到预置应用。例如,游戏类别的应用、或者办公类别的应用中POI相关的输入内容的出现概率较低,故可以将其从预置应用中排除,可以理解,本领域技术人员可以根据实际应用需求确定上述概率阈值的值,本发明实施例对于具体的概率阈值不加以限制。
可选地,上述输入内容的输入方式可以包括:键盘输入方式、手写输入方式、或者语音输入法方式等,也即,输入法程序可以捕获用户通过任意方式输入的输入内容,并进行记录。
本发明实施例的兴趣点挖掘方法可由客户端和/或服务器执行。其中,当客户端执行本发明实施例的兴趣点挖掘方法时,客户端可以实时获取用户在智能终端的预置平台中产生的输入内容,并通过执行步骤102和步骤103挖掘并获取目标兴趣点的地理位置信息。当服务器执行本发明实施例的兴趣点挖掘方法时,客户端可以定期或者即时向服务器发送用户在智能终端的预置平台中产生的输入内容,服务器可以通过执行步骤102和步骤103对客户端发送的输入内容进行即时处理,或者,服务器可以将客户端发送的输入内容记录至日志,并通过步骤101定期从日志中获取用户在智能终端的预置平台中产生的输入内容,然后通过执行步骤102和步骤103挖掘并获取目标兴趣点的地理位置信息。可以理解,本发明实施例对于具体的执行主体不加以限制。
步骤102可以针对步骤101获取的一次或者多次输入内容,从中挖掘出目标兴趣点。其中,挖掘所针对的一次或多次输入内容可以为同一用户产生的输入内容、或者多个用户产生的输入内容;该多个用户可以为即时通讯对应的多个用户、或者同一群组或者同一话题所关联的多个用户。
在实际应用中,步骤102利用任意的语义理解技术,从一次或者多次输入内容挖掘出目标兴趣点。可选地,上述从所述输入内容中挖掘出目标兴趣点的步骤,可以包括:识别所述输入内容对应的目标兴趣点场景;依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点。由于上述兴趣点场景可用于表示有可能产生POI相关的输入内容的场景,若无法识别得到输入内容对应的目标兴趣点场景,则可以说明输入内容与POI不相关,因此本发明实施例可以通过目标兴趣点场景的识别过滤出大量的与POI不相关的输入内容,提高POI的挖掘效率。另外,由于特定POI场景下的输入内容通常具有特定的规律,也即,在特定POI场景下的输入内容是相对收敛的,因此依据该目标POI场景的输入内容的规律,从所述输入内容中提取目标POI的POI,能够提高POI挖掘的精准度。
本发明实施例可以提供识别所述输入内容对应的目标兴趣点场景的如下识别方式:
识别方式1、依据所述输入内容对应的输入环境信息,确定所述输入内容对应的目标兴趣点场景;和/或
识别方式2、对所述输入内容、以及所述位置环境信息对应的周边兴趣点进行分类,以得到所述输入内容对应的目标兴趣点场景。
其中,识别方式1可以对输入内容对应的输入环境信息进行分析,以得到对应的目标POI场景。例如,可以对所述输入内容对应的上下文环境信息进行分析,以确定所述输入内容对应的目标POI场景属于预置POI场景中的哪一种。又如,可以对在当前输入内容对应的位置环境信息下多用户的输入内容所属的目标POI场景进行分析,以得到当前输入内容对应的目标POI场景。
或者,识别方式1还可以依据平台环境信息,在预置平台或者预置平台类别与预置POI场景之间的映射关系中进行查找,以得到对应的目标POI场景。
在本发明的一种可选实施例中,上述预置POI场景的获取过程可以包括:针对有可能产生POI相关的输入内容的预置平台,分析得到对应的预置POI场景。例如,可以针对地图应用A、地图应用B、地图应用C、地图应用D、地图应用E等地图类别的预置平台,分析得到对应的导航场景;又如,可以针对电商平台1、电商平台2等购物类别的预置平台,分析得到对应的购物场景等。进一步,还可以建立预置平台或者预置平台类别与预置POI场景之间的映射关系,以方便输入内容对应的POI场景的确定。
在本发明的另一种可选实施例中,预置POI场景的获取过程可以包括:获取输入内容样本、及其位置环境信息对应的周边兴趣点信息,依据上述周边兴趣点信息,得到预置POI场景。其中,上述周边兴趣点与输入内容样本对应的位置环境信息之间的距离可以小于距离阈值,可选地,该距离阈值可以为50m、100m、200m等,本发明实施例对于具体的距离阈值不加以限制。
识别方式2可以通过机器分类的方法实现对于输入内容对应的目标兴趣点场景的识别。由于特定周边兴趣点的输入内容所属的POI场景通常具有特定的规律,故可以通过机器学习获得上述规律。
在本发明的一种可选实施例中,可以获取输入内容样本、及其位置环境信息对应的周边兴趣点信息,依据上述周边兴趣点信息,人工标注上述输入内容样本的场景,得到预置POI场景;并对该输入内容样本进行训练,训练得到场景分类器,并利用该场景分类器实时对输入内容及周边兴趣点进行分类,以得到对应的目标POI场景。
本发明实施例可以提供依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点的如下挖掘方案:
挖掘方案1、
技术方案1中,上述依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点的步骤,可以包括:依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式;依据所述目标兴趣点语句模式,从所述输入内容中提取目标兴趣点的兴趣点特征词。
在实际应用中,用户通过预置平台产生的输入内容多种多样,有POI相关的输入内容,同样也有大量的POI不相关的输入内容。技术方案1可以依据兴趣点语句模式从上述输入内容中过滤掉POI不相关的输入内容,并可以得到POI相关的输入内容及POI相关的输入内容对应的目标兴趣点语句模式。
本发明实施例中,语句又称句子,是语言运用的基本单位,通常语句由词、词组(短语)构成,能表达一个完整的意思,如告诉别人一件事,提出一个问题,表示要求或者制止,表示某种感慨,表示对一段话的延续或省略等。语句模式可定义有语句所包含词汇的词性、词序及位置等特征信息对应的规律。
本发明实施例中,兴趣点语句模式可用于表示与POI相关的且包含POI特征词的语句的模式。本发明实施例中,POI特征词可用于标识POI,其具体可以包括但不限于:POI对应行政区划道路、大厦、以及公司名称等特征。例如,常见的兴趣点语句模式可以包括:“要去XXX”、“我打算去XXX”、“XXX怎么走”、“从***到XXX怎么走”、“XXX开业”、“XXX有活动吗”、“怎么去XXX”等等;其中,“XXX”可用于表示POI特征词对应的预置字符串,“XXX”还可用“###”等字符串代替,可以理解,本发明实施例对于POI特征词对应的具体预置字符串不加以限制。
由于本发明实施例的兴趣点语句模式可以定义有:预置特征词的词序、位置等特征信息,故本发明实施例可以依据确定的目标兴趣点语句模式,从所述输入内容中提取目标兴趣点的兴趣点特征词。例如,输入内容为“要去中央电视台总部大楼”,该输入内容对应的目标兴趣点语句模式“要去XXX”,故可以依据该目标兴趣点语句模式“要去XXX”包含的预置特征词的特征信息,从该输入内容中提取出POI特征词“中央电视台总部大楼”。
本发明实施例可以提供依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式的如下确定方案:
确定方案1、
确定方案1中,所述确定所述输入内容对应的目标兴趣点语句模式的步骤,可以包括:将所述输入内容对应语句模式与所述目标兴趣点场景对应预置兴趣点语句模式进行匹配,将匹配成功的预置兴趣点语句模式作为所述输入内容对应的目标兴趣点语句模式。
在实际应用中,可以预先获取预置兴趣点语句模式。相应的预先获取方式可以包括:设定可能产生POI相关的输入内容对应的预置POI场景(如导航场景、购物场景、旅游场景、出差场景等),并对上述预置POI场景下的输入内容进行分析,以得到对应的预置兴趣点语句模式。
由于POI场景可用于表示有可能产生POI相关的输入内容的场景,特定POI场景下的兴趣点语句模式通常具有特定的规律,也即,在特定POI场景下的输入内容的语句模式是相对收敛的,因此可以对特定POI场景下的输入内容进行分析和总结,以得到对应的预置兴趣点语句模式。例如,导航场景下的预置兴趣点语句模式可以包括:“要去XXX”,购物场景下的预置兴趣点语句模式可以包括:“我在XXX逛街”,旅游场景下的预置兴趣点语句模式可以包括:“XXX N日行”,其中,N为正整数,出差场景下的预置兴趣点语句模式可以包括:“明天去XXX出差”等等。
本发明实施例将目标POI场景对应的兴趣点语句模式,作为上述输入内容对应的预置兴趣点语句模式,由此可以实现预置兴趣点语句模式和匹配的精度。
在实际应用中,可以将所述输入内容对应语句模式与所述目标兴趣点场景对应预置兴趣点语句模式进行匹配,若匹配成功,则可以确定所述输入内容与POI相关,否则,若匹配失败,则可以确定所述输入内容与POI不相关。可选地,将所述输入内容对应语句与预置兴趣点语句模式进行匹配的过程可以包括:分别针对所述输入内容对应语句和预置兴趣点语句模式分析得到对应的第一语句结构和第二语句结构,例如,该第一语句结构或者该第二语句结构可以包括:主语、谓语、宾语等结构成分,则可以对第一语句结构和第二语句结构进行比对,若比对成功,则可以对各结构成分对应的词汇进行比对,若比对成功,则可以认为匹配成功。当然,上述匹配的过程只是作为可选实施例,实际上本领域技术人员可以根据实际应用需求,采用其他匹配的过程,例如,对所述输入内容对应语句的第一字符串与预置的查询语句模式的第二字符串进行比较等,本发明实施例对于将历史查询串对应语句与预置的查询语句模式进行匹配的具体过程不加以限制。
可选地,在针对所述输入内容对应语句分析得到对应的第一语句结构的过程中,可以利用分词词典对上述输入内容进行分词,以得到对应的第一词汇,并对该第一词汇进行词性标注,以得到第一词汇的第一词性,进一步对该第一词汇的词性、词序、位置等信息获得第一语句结构。对于第二语句结构的获取过程而言,由于其与第一语句结构的获取过程类似,故在此不作赘述,相互参照即可。
确定方案2、
确定方案2中,所述确定所述输入内容对应的目标兴趣点语句模式的步骤,可以包括:依据所述目标兴趣点场景,对所述输入内容对应的语句模式进行分类,将分类结果作为所述输入内容对应的目标兴趣点语句模式。
确定方案1基于语句模式的匹配确定目标兴趣点模式,在输入内容对应语句模式与预置兴趣点语句模式之间的匹配度较高时,才认为匹配成功,进而能得到对应的目标兴趣点语句模式;而在匹配不成功时,将无法得到对应的目标兴趣点语句模式。例如,假设预置兴趣点语句模式1“要去XXX”,则若输入内容1为“要去五道口”,则认为该输入内容1与预置兴趣点语句模式1匹配成功;而若输入内容2为“打算去五道口”,则认为该输入内容2与预置兴趣点语句模式1匹配不成功。可以看出,确定方案1的获取成功率取决于预置兴趣点语句模式的全面性,因此无法保证目标兴趣点语句模式的获取成功率。
针对确定方案1无法保证目标兴趣点语句模式的获取成功率的问题,确定方案2可以对所述输入内容对应的语句模式进行分类,在输入内容对应语句模式与预置兴趣点语句模式之间的匹配度较低时,分类方法也可以基于语句模式的结构得到输入内容对应的语句模式的分类结果,因此能够提高目标兴趣点语句模式的获取成功率。
在实际应用中,可以利用语句模式分类器对所述输入内容对应的语句模式进行分类,其中,该语句模式分类器可以从目标兴趣点场景对应的多种预置兴趣点语句模式中选择一种,作为分类结果,其中,不同的目标兴趣点场景可以具有不同的语句模式分类器。该语句模式分类器的训练过程可以包括:获取输入内容样本,利用上述预置POI场景对上述输入内容样本进行语句模式标注,采用机器学习方式依据上述输入内容样本及语句模式标注结果对该语句模式分类器进行训练,以得到具备语句模式识别能力的语句模式分类器,该语句模式分类器可用于描述特征向量与目标兴趣点语句模式之间的对应关系,其中该特征向量可以包括:语句的词性、词序、位置等特征。在分类过程中,可以将输入内容对应语句的特征信息作为输入向量、输入至上述语句模式分类器,由上述语句模式分类器输出对应的分类结果,该分类结果可以作为目标兴趣点语句模式。
可选地,该语句模式分类器的类型可以包括:SVM(支持向量机,Support VectorMachine)、贝叶斯、KNN(K最邻近结点算法,k-Nearest Neighbor algorithm)等,本发明实施例对于该意图分类器的具体类型不加以限制。
挖掘方案2、
挖掘方案2可以按照所述目标兴趣点场景下的语义理解规则,从所述输入内容中挖掘出目标兴趣点。
由于在特定POI场景下的输入内容模式是相对收敛的,这样,特定POI场景下POI的挖掘有规律可循,故可以利用目标兴趣点场景下的语义理解规则,从所述输入内容中挖掘出目标兴趣点,以提高POI挖掘的准确度。
可选地,上述依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点的步骤,可以包括:
从第一目标兴趣点场景下的一次输入内容中提取出目标兴趣点;和/或
判断第二目标兴趣点场景下预设时间段内的连续多次输入内容是否符合预置的纠正输入条件,若是,则从所述连续多次输入内容中选择目标输入内容,并从所述目标次输入内容中提取出目标兴趣点。
在例如购物场景、出差场景的第一目标兴趣点场景下,用户的一次输入内容即符合用户的输入意图,因此可从第一目标兴趣点场景下的一次输入内容中提取出目标兴趣点。例如,一次输入内容为“我在XXX逛街”、“我来XXX”出差了,说明该次输入内容就包含需要输入的POI,故可以从中提取“XXX”作为目标POI。
在例如导航场景的第二目标兴趣点场景下,用户在预设时间段内可能连续输入多次输入内容,以获得所需的导航结果。例如,用户在预设时间段内容的首次输入内容为“恒电大厦”,在没有得到所需的导航结果后,再次输入内容为“北京市朝阳区望京东路4号院”,得到了所需的导航结果,故未产生新的输入内容,因此可以认为,首次输入内容和再次输入内容符合预置的纠正输入条件,因此可从连续多次输入内容中选择目标输入内容,并从目标输入内容中提取出目标POI“朝阳区望京东路4号院”或者“朝阳区望京东路4号院”对应的大厦,例如,该大厦可以包括“恒电大厦”等等。可以理解,可以利用任意的语义理解技术,从所述连续多次输入内容中选择目标输入内容,例如,可以首先识别某次输入内容对应的目标POI场景,若识别成功,则将其作为目标输入内容,若识别失败,则丢弃该次输入内容等等,本发明实施例对于目标输入内容的具体选择过程不加以限制。
在例如导航场景的第二目标兴趣点场景下,还可以从第二目标兴趣点场景下预设时间段内的多次输入内容中提取相应的备选兴趣点,向用户输出所述备选兴趣点的第一提示信息,并依据用户对于所述第一提示信息的第一响应操作,确定目标兴趣点。在备选POI的数量为1时,相应的第一提示信息可以为“您最终是否到了备选POI1?”;在备选POI的数量大于等于2时,相应的第一提示信息可以为“您最终到了备选POI2还是备选POI3?”,这样,可以根据用户的第一响应操作,确定备选POI1是否为用户所需的POI,或者,备选POI2和备选POI3中的哪一个为用户所需的POI,由此可以提高目标POI的精准度。
可以理解,本领域技术人员可以通过分析得到特定POI场景下POI的挖掘对应的任意语义理解规则,可以理解,本发明实施例对于按照所述目标兴趣点场景内的语义理解规则,从所述输入内容中挖掘出目标兴趣点的具体过程不加以限制。
以上通过挖掘方案1—挖掘方案2对依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点的过程进行了说明,可以理解,本领域技术人员可以根据实际应用需求,采用挖掘方案1—挖掘方案2中的任一或者组合,或者,还可以采用从所述输入内容中挖掘出目标兴趣点的其他挖掘方案,本发明实施例对于具体的挖掘方案不加以限制。
由于地理位置信息为POI的重要信息,其能够决定一个POI在地图上的位置,故在通过步骤102挖掘得到目标POI后,还需要通过步骤103获取所述目标POI的地理位置信息。
目标POI的地理位置信息的获取方式可以有多种,例如,可以通过人工方式获取目标POI的地理位置信息。
在本发明的一种可选实施例中,可以预先获取所述输入内容对应的位置环境信息;则所述获取所述目标兴趣点的地理位置信息的步骤,可以包括:从所述目标兴趣点相关的输入内容所对应的位置环境信息中挖掘出所述目标兴趣点的地理位置信息。
随着终端技术的发展,具有定位功能的智能终端越来越多,其中,智能终端可以利用GPS、IP等技术实现定位功能。由于用户在产生POI相关的输入内容时,其智能终端可能处于对应POI的地理位置环境中,故本发明实施例从所述目标兴趣点相关的输入内容所对应的位置环境信息中挖掘出所述目标兴趣点的地理位置信息,能够节省目标POI的地理位置信息的获取所需的人力成本,提高目标POI的地理位置信息的获取效率。
在实际应用中,上述从所述目标兴趣点相关的输入内容所对应的位置环境信息中挖掘出所述目标兴趣点的地理位置信息的步骤,可以包括:从所述目标兴趣点相关的输入内容所对应的位置环境信息中,提取与所述目标兴趣点相匹配的地理位置环境信息,作为目标POI的地理位置信息。
可选地,上述从所述目标兴趣点相关的输入内容所对应的位置环境信息中,提取与所述目标兴趣点相匹配的地理位置环境信息的过程可以包括:获取目标POI的粗略位置范围,判断目标POI相关的输入内容所对应的位置环境信息是否与该粗略位置范围相匹配。例如,目标POI为“国贸中央电视台总部大楼”,则可以首先将“国贸”的位置范围作为粗略位置范围,然后将目标POI相关的输入内容所对应的位置环境信息与该粗略位置范围匹配。例如,用户A产生过2次该目标POI相关的输入内容,第一次输入内容“要去国贸中央电视台总部大楼”是在海淀区通过地图平台产生的,第二次输入内容“我到中央电视台总部大楼了”是在朝阳区通过即时通讯平台产生的,则可以将每次输入内容对应的位置环境信息与上次粗略位置范围进行匹配,并得到与该粗略位置范围相匹配的第二次输入内容对应的地理位置环境信息,将其作为目标POI的地理位置信息。
可选地,上述从所述目标兴趣点相关的输入内容所对应的位置环境信息中,提取与所述目标兴趣点相匹配的地理位置环境信息的过程可以包括:对目标兴趣点相关的输入内容进行语义分析,判断所述输入内容对应的地理位置环境信息是否为所述目标POI的地理位置信息,也即,判断用户产生输入内容时是否在所述POI的地理位置。例如,若输入内容为“我在XXX”、“我到XXX了”,则说明用户产生输入内容时在POI“XXX”的地理位置;又如,若输入内容为“我要去XXX”、“我打算去XXX”、“我明天去XXX”,则说明产生输入内容时不在POI“XXX”的地理位置,由此可以提取出POI“XXX”的准确地理位置信息。
在本发明的一种可选实施例中,本发明实施例的方法还可以包括:在多次输入内容均命中所述目标兴趣点时,增加所述目标兴趣点的可信度;所述可信度用于作为是否采信目标兴趣点的依据。这里,多次输入内容可以为一个用户或者多个用户产生的输入内容。例如,若在M次输入内容中挖掘到同一城市相同位置的目标POI,则将该目标POI的可信度+M。本发明实施例中,可信度可以作为是否采信目标POI的依据,例如,若目标POI的可信度大于可信度阈值,则可以对其进行采信,将其添加到POI数据库中,该POI数据库可用于存储POI的名称等信息。可选地,该POI数据库中的POI可被显示在地图中,例如,可以依据用户所处的目标位置或者用户的搜索词对应的目标位置,从该POI数据库中获取该目标位置对应的POI,并将该目标位置对应的POI显示在地图中。
在本发明的另一种可选实施例中,本发明实施例的方法还可以包括:向用户输出所述目标兴趣点的第二提示信息;依据用户对于所述第二提示信息的第二响应操作,判断所述目标兴趣点的数据的真实性。其中,上述第二提示信息中可以包括:目标兴趣点的名称、坐标、地址、类别等信息,若用户对上述第二提示信息满意,则产生的第二响应操作可以为确认操作,此种情况下,所述目标兴趣点的数据的真实性为True(真),反之,若用户对上述第二提示信息不满意,则产生的第二响应操作可以为否认操作,此种情况下,所述目标兴趣点的数据的真实性为False(假)。
需要说明的是,本发明实施例的第一提示信息或者第二提示信息可由产生POI对应输入内容的预置平台提供,也可由其他平台提供。例如,用户通过即时通讯平台产生的输入内容命中了POI,则可由该即时通讯平台提供上述第一提示信息或者第二提示信息,也可由输入法平台等其他平台提供上述第一提示信息或者第二提示信息。另外,可以通过弹窗、浮层等方式向用户输出上述第一提示信息或者第二提示信息,本发明实施例对于第一提示信息或者第二提示信息的具体输出方式不加以限制。
在本发明的再一种可选实施例中,为了避免POI数据库中POI的重复性,可以将步骤102得到的目标POI与POI数据库中的已有POI进行对比,以判断该目标POI是否为新发现的POI,若一致,则说明该目标POI不是新发现的POI,并依据该目标POI的数据对已知POI进行名称和地理位置等字段的更新;若不一致,则说明该目标POI为新发现的POI,并将其添加到POI数据库中。
综上,本发明实施例的兴趣点数据的挖掘方法,可以获取用户在智能终端的预置平台中产生的输入内容,并从所述输入内容中挖掘出目标POI,进而获取所述目标POI的地理位置信息。由于本发明实施例可以自动地从用户的输入内容中挖掘出目标POI,故能够节省人力成本,提高POI的挖掘效率。并且,本发明实施例可以在不借助客户端用户的反馈的情况下完成POI的挖掘,因此能节省反馈接口对应的推广成本。
并且,本发明实施例在从上述输入内容中挖掘出目标POI的过程中,可以首先识别所述输入内容对应的目标兴趣点场景,然后依据所述目标兴趣点场景从所述输入内容中挖掘出目标兴趣点等等;由于上述兴趣点场景可用于表示有可能产生POI相关的输入内容的场景,若无法识别得到输入内容对应的目标兴趣点场景,则可以说明输入内容与POI不相关,因此本发明实施例可以通过目标兴趣点场景的识别过滤出大量的与POI不相关的输入内容,提高POI的挖掘效率。另外,由于特定POI场景下的输入内容通常具有特定的规律,也即,在特定POI场景下的输入内容是相对收敛的,因此依据该目标POI场景的输入内容的规律,从所述输入内容中提取目标POI的POI,能够提高POI挖掘的精准度。
方法实施例二
参照图2,示出了本发明的一种兴趣点数据的挖掘方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤201、服务器通过输入法日志,获取用户在智能终端的预置平台中产生的输入内容、以及所述输入内容对应的输入环境信息;
可选地,所述输入环境信息可以包括:位置环境信息、平台环境信息、上下文环境信息、时间环境信息等。
步骤202、服务器识别所述输入内容对应的目标POI场景;
步骤203、服务器依据所述目标POI场景,确定所述输入内容对应的目标POI语句模式;
步骤204、服务器依据所述目标POI语句模式,从所述输入内容中提取目标POI的POI特征词;
步骤205、服务器从所述目标POI相关的输入内容所对应的位置环境信息中挖掘出所述目标POI的地理位置信息;
步骤206、服务器依据目标POI的POI特征词和地理位置信息,生成对应的第二提示信息,并向客户端发送所述第二提示信息;
步骤207、客户端向用户输出所述目标POI的第二提示信息,接收并向服务器发送用户对于所述第二提示信息的第二响应操作;
步骤208、服务器依据用户对于所述第二提示信息的第二响应操作,判断所述目标POI的数据的真实性。
可选地,在所述目标POI的真实性为真时,将目标POI与POI数据库中的已有POI进行对比,若不一致,则将该目标POI添加到POI数据库中。
综上,本发明实施例的兴趣点数据的挖掘方法,在识别输入内容对应的目标POI场景后,依据该目标POI场景获取输入内容对应的目标POI语句模式;由于特定POI场景下的兴趣点语句模式通常具有特定的规律,也即,在特定POI场景下的输入内容的语句模式是相对收敛的,因此依据该目标POI场景获取输入内容对应的目标POI语句模式从所述输入内容中提取目标POI的POI特征词,能够提高POI挖掘的精准度。
另外,由于上述兴趣点场景可用于表示有可能产生POI相关的输入内容的场景,若无法识别得到输入内容对应的目标兴趣点场景,则可以说明输入内容与POI不相关,因此本发明实施例可以通过目标兴趣点场景的识别过滤出大量的与POI不相关的输入内容,提高POI的挖掘效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图3,示出了本发明的一种兴趣点数据的挖掘装置实施例的结构框图,具体可以包括:输入内容获取模块301、兴趣点挖掘模块302和位置获取模块303。
其中,输入内容获取模块301,用于获取用户在智能终端的预置平台中产生的输入内容;
兴趣点挖掘模块302,用于从所述输入内容中挖掘出目标兴趣点;以及
位置获取模块303,用于获取所述目标兴趣点的地理位置信息。
可选地,所述兴趣点挖掘模块302可以包括:
场景识别子模块,用于识别所述输入内容对应的目标兴趣点场景;以及
场景兴趣点挖掘子模块,用于依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点。
可选地,所述场景兴趣点挖掘子模块可以包括:
模式确定单元,用于依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式;
特征词提取单元,用于依据所述目标兴趣点语句模式,从所述输入内容中提取目标兴趣点的兴趣点特征词。
可选地,所述模式确定单元可以包括:
模式匹配子单元,用于将所述输入内容对应语句模式与所述目标兴趣点场景对应预置兴趣点语句模式进行匹配,将匹配成功的预置兴趣点语句模式作为所述输入内容对应的目标兴趣点语句模式;和/或
模式分类单元,用于依据所述目标兴趣点场景,对所述输入内容对应的语句模式进行分类,将分类结果作为所述输入内容对应的目标兴趣点语句模式。
可选地,所述场景兴趣点挖掘子模块可以包括:
第一兴趣点提取单元,用于从第一目标兴趣点场景下的一次输入内容中提取出目标兴趣点;和/或
第二兴趣点提取单元,用于判断第二目标兴趣点场景下预设时间段内的连续多次输入内容是否符合预置的纠正输入条件,若是,则从所述连续多次输入内容中选择目标输入内容,并从所述目标输入内容中提取出目标兴趣点;和/或
第三兴趣点提取单元,用于从第二目标兴趣点场景下预设时间段内的多次输入内容中提取相应的备选兴趣点,向用户输出所述备选兴趣点的第一提示信息,并依据用户对于所述第一提示信息的第一响应操作,确定目标兴趣点。
可选地,所述场景识别子模块可以包括:
第一场景识别单元,用于依据所述输入内容对应的平台环境信息,确定所述输入内容对应的目标兴趣点场景;和/或
第二场景识别单元,用于对所述输入内容、以及所述位置环境信息对应的周边兴趣点进行分类,以得到所述输入内容对应的目标兴趣点场景。
可选地,所述装置还可以包括:
可信度增加模块,用于在多次输入内容均命中所述目标兴趣点时,增加所述目标兴趣点的可信度;所述可信度用于作为是否采信目标兴趣点的依据。
可选地,所述装置还可以包括:
提示模块,用于向用户输出所述目标兴趣点的第二提示信息;
真实性判断模块,用于依据用户对于所述第二提示信息的第二响应操作,判断所述目标兴趣点的数据的真实性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种用于兴趣点数据挖掘的装置作为终端时的框图。例如,装置900可以是前述的智能终端,也可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动运动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由装置900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由智能终端的处理器执行时,使得智能终端能够执行一种兴趣点数据的挖掘方法,所述方法包括:获取用户在智能终端的预置平台中产生的输入内容;从所述输入内容中挖掘出目标兴趣点;获取所述目标兴趣点的地理位置信息。
图5是根据一示例性实施例示出的一种用于兴趣点数据挖掘的装置作为服务器时的框图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行一种兴趣点数据的挖掘方法,所述方法包括:获取用户在智能终端的预置平台中产生的输入内容;从所述输入内容中挖掘出目标兴趣点;获取所述目标兴趣点的地理位置信息。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种兴趣点数据的挖掘方法、一种兴趣点数据的挖掘装置和一种用于兴趣点数据的挖掘的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (19)

1.一种兴趣点数据的挖掘方法,其特征在于,包括:
获取用户在智能终端的预置平台中产生的输入内容;
从所述输入内容中挖掘出目标兴趣点;
获取所述目标兴趣点的地理位置信息;
所述从所述输入内容中挖掘出目标兴趣点的步骤,包括:
识别所述输入内容对应的目标兴趣点场景;
依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式;
依据所述目标兴趣点语句模式,从所述输入内容中提取目标兴趣点的兴趣点特征词。
2.根据权利要求1所述的方法,其特征在于,所述依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式的步骤,包括:
将所述输入内容对应语句模式与所述目标兴趣点场景对应预置兴趣点语句模式进行匹配,将匹配成功的预置兴趣点语句模式作为所述输入内容对应的目标兴趣点语句模式;和/或
依据所述目标兴趣点场景,对所述输入内容对应的语句模式进行分类,将分类结果作为所述输入内容对应的目标兴趣点语句模式。
3.根据权利要求1所述的方法,其特征在于,所述从所述输入内容中挖掘出目标兴趣点的步骤,还包括:
从第一目标兴趣点场景下的一次输入内容中提取出目标兴趣点;和/或
判断第二目标兴趣点场景下预设时间段内的连续多次输入内容是否符合预置的纠正输入条件,若是,则从所述连续多次输入内容中选择目标输入内容,并从所述目标输入内容中提取出目标兴趣点;和/或
从第二目标兴趣点场景下预设时间段内的多次输入内容中提取相应的备选兴趣点,向用户输出所述备选兴趣点的第一提示信息,并依据用户对于所述第一提示信息的第一响应操作,确定目标兴趣点。
4.根据权利要求1所述的方法,其特征在于,所述识别所述输入内容对应的目标兴趣点场景的步骤,包括:
依据所述输入内容对应的输入环境信息,确定所述输入内容对应的目标兴趣点场景,所述输入环境信息包括:上下文环境信息、位置环境信息、时间环境信息、以及平台环境信息中的至少一种;和/或
对所述输入内容、以及所述位置环境信息对应的周边兴趣点进行分类,以得到所述输入内容对应的目标兴趣点场景。
5.根据权利要求1至4中任一所述的方法,其特征在于,所述方法还包括:
在多次输入内容均命中所述目标兴趣点时,增加所述目标兴趣点的可信度;所述可信度用于作为是否采信目标兴趣点的依据。
6.根据权利要求1至4中任一所述的方法,其特征在于,所述方法还包括:
向用户输出所述目标兴趣点的第二提示信息;
依据用户对于所述第二提示信息的第二响应操作,判断所述目标兴趣点的数据的真实性。
7.一种兴趣点兴趣点数据的挖掘装置,其特征在于,包括:
输入内容获取模块,用于获取用户在智能终端的预置平台中产生的输入内容;
兴趣点挖掘模块,用于从所述输入内容中挖掘出目标兴趣点;以及
位置获取模块,用于获取所述目标兴趣点的地理位置信息;
所述兴趣点挖掘模块包括:
场景识别子模块,用于识别所述输入内容对应的目标兴趣点场景;以及
场景兴趣点挖掘子模块,用于依据所述目标兴趣点场景,从所述输入内容中挖掘出目标兴趣点;
所述场景兴趣点挖掘子模块包括:
模式确定单元,用于依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式;
特征词提取单元,用于依据所述目标兴趣点语句模式,从所述输入内容中提取目标兴趣点的兴趣点特征词。
8.根据权利要求7所述的装置,其特征在于,所述模式确定单元包括:
模式匹配子单元,用于将所述输入内容对应语句模式与所述目标兴趣点场景对应预置兴趣点语句模式进行匹配,将匹配成功的预置兴趣点语句模式作为所述输入内容对应的目标兴趣点语句模式;和/或
模式分类单元,用于依据所述目标兴趣点场景,对所述输入内容对应的语句模式进行分类,将分类结果作为所述输入内容对应的目标兴趣点语句模式。
9.根据权利要求7所述的装置,其特征在于,所述场景兴趣点挖掘子模块包括:
第一兴趣点提取单元,用于从第一目标兴趣点场景下的一次输入内容中提取出目标兴趣点;和/或
第二兴趣点提取单元,用于判断第二目标兴趣点场景下预设时间段内的连续多次输入内容是否符合预置的纠正输入条件,若是,则从所述连续多次输入内容中选择目标输入内容,并从所述目标输入内容中提取出目标兴趣点;和/或
第三兴趣点提取单元,用于从第二目标兴趣点场景下预设时间段内的多次输入内容中提取相应的备选兴趣点,向用户输出所述备选兴趣点的第一提示信息,并依据用户对于所述第一提示信息的第一响应操作,确定目标兴趣点。
10.根据权利要求7所述的装置,其特征在于,所述场景识别子模块包括:
第一场景识别单元,用于依据所述输入内容对应的平台环境信息,确定所述输入内容对应的目标兴趣点场景;和/或
第二场景识别单元,用于对所述输入内容、以及所述位置环境信息对应的周边兴趣点进行分类,以得到所述输入内容对应的目标兴趣点场景。
11.根据权利要求7至10中任一所述的装置,其特征在于,所述装置还包括:
可信度增加模块,用于在多次输入内容均命中所述目标兴趣点时,增加所述目标兴趣点的可信度;所述可信度用于作为是否采信目标兴趣点的依据。
12.根据权利要求7至10中任一所述的装置,其特征在于,所述装置还包括:
提示模块,用于向用户输出所述目标兴趣点的第二提示信息;
真实性判断模块,用于依据用户对于所述第二提示信息的第二响应操作,判断所述目标兴趣点的数据的真实性。
13.一种用于兴趣点数据挖掘的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户在智能终端的预置平台中产生的输入内容;
从所述输入内容中挖掘出目标兴趣点;
获取所述目标兴趣点的地理位置信息;
所述从所述输入内容中挖掘出目标兴趣点,包括:
识别所述输入内容对应的目标兴趣点场景;
依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式;
依据所述目标兴趣点语句模式,从所述输入内容中提取目标兴趣点的兴趣点特征词。
14.根据权利要求13所述的装置,其特征在于,所述依据所述目标兴趣点场景,确定所述输入内容对应的目标兴趣点语句模式,包括:
将所述输入内容对应语句模式与所述目标兴趣点场景对应预置兴趣点语句模式进行匹配,将匹配成功的预置兴趣点语句模式作为所述输入内容对应的目标兴趣点语句模式;和/或
依据所述目标兴趣点场景,对所述输入内容对应的语句模式进行分类,将分类结果作为所述输入内容对应的目标兴趣点语句模式。
15.根据权利要求13所述的装置,其特征在于,所述从所述输入内容中挖掘出目标兴趣点,还包括:
从第一目标兴趣点场景下的一次输入内容中提取出目标兴趣点;和/或
判断第二目标兴趣点场景下预设时间段内的连续多次输入内容是否符合预置的纠正输入条件,若是,则从所述连续多次输入内容中选择目标输入内容,并从所述目标输入内容中提取出目标兴趣点;和/或
从第二目标兴趣点场景下预设时间段内的多次输入内容中提取相应的备选兴趣点,向用户输出所述备选兴趣点的第一提示信息,并依据用户对于所述第一提示信息的第一响应操作,确定目标兴趣点。
16.根据权利要求13所述的装置,其特征在于,所述识别所述输入内容对应的目标兴趣点场景,包括:
依据所述输入内容对应的输入环境信息,确定所述输入内容对应的目标兴趣点场景,所述输入环境信息包括:上下文环境信息、位置环境信息、时间环境信息、以及平台环境信息中的至少一种;和/或
对所述输入内容、以及所述位置环境信息对应的周边兴趣点进行分类,以得到所述输入内容对应的目标兴趣点场景。
17.根据权利要求13至16中任一所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在多次输入内容均命中所述目标兴趣点时,增加所述目标兴趣点的可信度;所述可信度用于作为是否采信目标兴趣点的依据。
18.根据权利要求13至16中任一所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
向用户输出所述目标兴趣点的第二提示信息;
依据用户对于所述第二提示信息的第二响应操作,判断所述目标兴趣点的数据的真实性。
19.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至6中一个或多个所述的方法。
CN201611219558.4A 2016-12-26 2016-12-26 兴趣点数据的挖掘方法和装置 Active CN108241678B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611219558.4A CN108241678B (zh) 2016-12-26 2016-12-26 兴趣点数据的挖掘方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611219558.4A CN108241678B (zh) 2016-12-26 2016-12-26 兴趣点数据的挖掘方法和装置

Publications (2)

Publication Number Publication Date
CN108241678A CN108241678A (zh) 2018-07-03
CN108241678B true CN108241678B (zh) 2021-10-15

Family

ID=62701930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611219558.4A Active CN108241678B (zh) 2016-12-26 2016-12-26 兴趣点数据的挖掘方法和装置

Country Status (1)

Country Link
CN (1) CN108241678B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126120B (zh) * 2018-11-01 2024-02-23 百度在线网络技术(北京)有限公司 城市区域分类方法、装置、设备和介质
CN109982250A (zh) * 2019-03-26 2019-07-05 北京泰迪熊移动科技有限公司 一种位置数据采集方法、设备及计算机存储介质
CN112399201B (zh) * 2020-10-09 2023-11-14 腾讯科技(深圳)有限公司 一种视频时效确定方法、装置、电子设备和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782923A (zh) * 2009-01-15 2010-07-21 罗伯特·博世有限公司 使用自然语言文档中的地理信息的基于位置的系统
CN103577386A (zh) * 2012-08-06 2014-02-12 腾讯科技(深圳)有限公司 一种基于用户输入场景动态加载语言模型的方法及装置
CN104133918A (zh) * 2014-08-15 2014-11-05 百度在线网络技术(北京)有限公司 一种兴趣点信息的获取方法及装置、推送方法及装置
CN104462063A (zh) * 2014-12-12 2015-03-25 武汉大学 基于语义位置模型的位置信息结构化提取方法及系统
CN104794122A (zh) * 2014-01-20 2015-07-22 腾讯科技(北京)有限公司 一种位置信息推荐方法、装置和系统
CN105701254A (zh) * 2016-03-09 2016-06-22 北京搜狗科技发展有限公司 一种信息处理方法和装置、一种用于信息处理的装置
CN105845133A (zh) * 2016-03-30 2016-08-10 乐视控股(北京)有限公司 语音信号处理方法及装置
CN106021600A (zh) * 2016-06-12 2016-10-12 腾讯科技(深圳)有限公司 信息提示方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782923A (zh) * 2009-01-15 2010-07-21 罗伯特·博世有限公司 使用自然语言文档中的地理信息的基于位置的系统
CN103577386A (zh) * 2012-08-06 2014-02-12 腾讯科技(深圳)有限公司 一种基于用户输入场景动态加载语言模型的方法及装置
CN104794122A (zh) * 2014-01-20 2015-07-22 腾讯科技(北京)有限公司 一种位置信息推荐方法、装置和系统
CN104133918A (zh) * 2014-08-15 2014-11-05 百度在线网络技术(北京)有限公司 一种兴趣点信息的获取方法及装置、推送方法及装置
CN104462063A (zh) * 2014-12-12 2015-03-25 武汉大学 基于语义位置模型的位置信息结构化提取方法及系统
CN105701254A (zh) * 2016-03-09 2016-06-22 北京搜狗科技发展有限公司 一种信息处理方法和装置、一种用于信息处理的装置
CN105845133A (zh) * 2016-03-30 2016-08-10 乐视控股(北京)有限公司 语音信号处理方法及装置
CN106021600A (zh) * 2016-06-12 2016-10-12 腾讯科技(深圳)有限公司 信息提示方法及装置

Also Published As

Publication number Publication date
CN108241678A (zh) 2018-07-03

Similar Documents

Publication Publication Date Title
KR101782754B1 (ko) 템플릿 구축 방법 및 장치, 정보 인식 방법 및 장치
CN110781813B (zh) 图像识别方法及装置、电子设备和存储介质
US20100130236A1 (en) Location assisted word completion
US20220051668A1 (en) Speech control method, terminal device, and storage medium
KR101626874B1 (ko) 이동 단말기 및 이동 단말기에서의 컨텐츠 전송 방법
KR20170023746A (ko) 티켓 정보 표시 방법, 장치, 프로그램 및 컴퓨터가 판독가능한 기록매체
CN108241678B (zh) 兴趣点数据的挖掘方法和装置
CN112417318A (zh) 一种兴趣点的状态确定方法、装置、电子设备及介质
CN112291614A (zh) 一种视频生成方法及装置
CN111984749A (zh) 一种兴趣点排序方法和装置
CN111209354A (zh) 一种地图兴趣点判重的方法、装置及电子设备
KR102149914B1 (ko) 클라우드 소싱 기반 관심 지점 정보 업데이트 방법, 및 이를 위한 장치
CN110929176A (zh) 一种信息推荐方法、装置及电子设备
CN109521888B (zh) 一种输入方法、装置和介质
CN109783244B (zh) 处理方法和装置、用于处理的装置
CN110928425A (zh) 信息监控方法及装置
CN111523599B (zh) 目标检测方法及装置、电子设备和存储介质
CN110110046B (zh) 同名实体推荐方法及装置
CN109799916B (zh) 一种候选项联想方法和装置
CN109961646B (zh) 一种路况信息的纠错方法及装置
CN110020082B (zh) 一种搜索方法及装置
CN111355999B (zh) 视频播放的方法、装置、终端设备及服务器
CN110069577B (zh) 一种线路规划方法、装置及电子设备
CN107454121B (zh) 一种位置追踪的方法、装置、移动终端和服务器
CN111597431A (zh) 一种推荐方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant