CN112825090B - 一种兴趣点确定的方法、装置、设备和介质 - Google Patents
一种兴趣点确定的方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN112825090B CN112825090B CN201911148596.9A CN201911148596A CN112825090B CN 112825090 B CN112825090 B CN 112825090B CN 201911148596 A CN201911148596 A CN 201911148596A CN 112825090 B CN112825090 B CN 112825090B
- Authority
- CN
- China
- Prior art keywords
- pinyin
- sequence
- communication
- identification information
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004891 communication Methods 0.000 claims abstract description 174
- 230000011218 segmentation Effects 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 33
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 5
- 230000002093 peripheral effect Effects 0.000 claims description 3
- 238000000060 site-specific infrared dichroism spectroscopy Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 21
- 238000005516 engineering process Methods 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000013473 artificial intelligence Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Abstract
本申请属于数据处理技术领域,主要涉及人工智能中的自然语言处理技术,公开了一种兴趣点确定的方法、装置、设备和介质,本申请公开的一种兴趣点确定的方法包括,根据终端设备周边的短距离无线通信的通信标识信息,确定终端设备周边的多个兴趣点的地点名称,获得相应的地点拼音序列,并根据通信标识信息,获得相应的通信拼音序列,以及根据各地点拼音序列与通信音频序列之间的匹配度,确定与通信标识信息最匹配的目标兴趣点。这样,将地点名称和通信标识信息均转换为拼音,提高了兴趣点匹配的准确度,减少了兴趣点确定的人力成本和时间成本。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种兴趣点确定的方法、装置、设备和介质。
背景技术
随着互联网技术以及智能终端技术的发展,人们可以通过智能终端等设备搜素周边的商店以及景点等兴趣点(Point of Interest,POI),以确定距离最近的POI。
但是,手动搜索的步骤较为繁琐,会耗费用户大量的时间成本和人力成本,兴趣点确定的准确度较低,由此,亟待需要一种可以提高兴趣点确定的准确率,减少兴趣点确定的人力成本和时间成本的技术方案。
发明内容
本申请实施例提供一种兴趣点确定的方法、装置、设备和介质,用以在确定兴趣点时,提高兴趣点确定的准确率,减少兴趣点确定的人力成本和时间成本。
一方面,提供一种兴趣点确定的方法,包括:
接收终端设备发送的通信标识信息,通信标识信息是终端设备根据周边的短距离无线通信获取的;
获取通信标识信息对应设置的各兴趣点的地点名称;
分别将每一地点名称进行拼音转换处理,获得相应的地点拼音序列,拼音转换处理用于将中文转换为拼音;
将通信标识信息进行拼音分词处理,获得拼音分词后的各拼音组成的通信拼音序列,拼音分词处理用于将多个字母划分为多个拼音;
分别确定每一地点拼音序列与通信拼音序列之间的匹配度;
将匹配度符合匹配条件的地点拼音序列对应的兴趣点,确定为终端设备的目标兴趣点。
一方面,提供一种兴趣点确定的装置,包括:
接收单元,用于接收终端设备发送的通信标识信息,通信标识信息是终端设备根据周边的短距离无线通信获取的;
获取单元,用于获取通信标识信息对应设置的各兴趣点的地点名称;
转换单元,用于分别将每一地点名称进行拼音转换处理,获得相应的地点拼音序列,拼音转换处理用于将中文转换为拼音;
分词单元,用于将通信标识信息进行拼音分词处理,获得拼音分词后的各拼音组成的通信拼音序列,拼音分词处理用于将多个字母划分为多个拼音;
匹配单元,用于分别确定每一地点拼音序列与通信拼音序列之间的匹配度;
确定单元,用于将匹配度符合匹配条件的地点拼音序列对应的兴趣点,确定为终端设备的目标兴趣点。
较佳的,转换单元用于:
分别将每一地点名称中包含的每一中文转换为相应的拼音;
分别将每一地点名称中包含的多个中文对应的拼音组成的序列,确定为相应的地点拼音序列。
较佳的,分词单元用于:
按照由前向后的顺序,依次划分出通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音;
根据获得的多个拼音,组成通信拼音序列;
其中,拼音词库集合为所有拼音的集合。
较佳的,分词单元用于:
按照由后向前的顺序,依次划分出通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音;
根据获得的多个拼音,组成通信拼音序列;
其中,拼音词库集合为所有拼音的集合。
较佳的,拼音词库集合为前缀字典树。
较佳的,匹配单元用于:
分别确定每一地点拼音序列与通信拼音序列之间的最大公共子序列;
分别将每一最大公共子序列与通信拼音序列比值,确定为相应的匹配度。
较佳的,确定单元用于:
在各匹配度中,筛选出最大匹配度;
当最大匹配度高于预设匹配阈值时,确定最大匹配度对应的目标地点拼音序列;
将目标地点拼音序列对应的兴趣点,确定为目标兴趣点。
一方面,提供一种控制设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时执行上述任一种兴趣点确定的方法的步骤。
一方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一种兴趣点确定的方法的步骤。
本申请实施例提供的一种兴趣点确定的方法、装置、设备和介质中,根据终端设备周边的短距离无线通信的通信标识信息,确定终端设备周边的多个兴趣点的地点名称,获得相应的地点拼音序列,并根据通信标识信息,获得相应的通信拼音序列,以及根据各地点拼音序列与通信音频序列之间的匹配度,确定与通信标识信息最匹配的目标兴趣点。这样,将地点名称和通信标识信息均转换为拼音,提高了兴趣点匹配的准确度,减少了兴趣点确定的人力成本和时间成本。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施方式中一种兴趣点确定的系统的架构示意图;
图2为本申请实施方式中一种兴趣点确定的方法的实施流程图;
图3a为本申请实施方式中一种逆向最大匹配算法的实施流程图;
图3b为本申请实施方式中一种前缀字典树搜索的示例图;
图3c为本申请实施方式中一种字符串提取的示意图一;
图3d为本申请实施方式中一种字符串分割的示意图;
图3e为本申请实施方式中一种字符串提取的示意图二;
图4a为本申请实施方式中一种应用场景示例图;
图4b为本申请实施方式中一种拼音匹配的示例图;
图5为本申请实施方式中一种兴趣点确定的示例图;
图6为本申请实施方式中一种兴趣点确定的装置的结构示意图;
图7为本申请实施方式中一种控制设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
首先,对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
终端设备:可以安装各类应用,并且能够将已安装的应用中提供的对象进行显示的设备,该电子设备可以是移动的,也可以是固定的。例如,手机、平板电脑、各类可穿戴设备、车载设备、个人数字助理(personal digital assistant,PDA)、销售终端(point ofsales,POS)或其它能够实现上述功能的电子设备等。
应用:即应用程序,可以完成某项或多项业务的计算机程序,一般具有可视的显示界面,能与用户进行交互,比如电子地图和微信等都可以称为应用。
人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
拼音词库集合:为所有拼音的集合。
前缀字典树:又称Trie树、字典树以及单词查找树,把字符串的前缀作为树的节点,每个树的终点作为一个词,查询的时候直接通过对应的节点查找,减少了大量的字符串比较,速度极快,常应用于数据压缩和查找。本申请中,前缀字典树中的词均为拼音。
拼音转换处理:用于将中文转换为拼音。
拼音分词处理:用于将多个字母划分为多个拼音。
最大匹配算法(Max Match,MM):按照一定顺序划窗取词,和词库进行比较,如果匹配到词库就记录下来,然后跳过匹配到的词,继续比较,否则继续划窗,直到整个字符串的结尾。本申请中,以词库为拼音词库集合为例进行说明。
正向最大匹配算法:按照由前向后的顺序划窗取词,和词库进行比较,如果匹配到词库就记录下来,然后跳过匹配到的词,继续比较,否则继续划窗,直到整个字符串的结尾。
逆向最大匹配算法(Reverse Max Match,RMM):按照由后向前的顺序划窗取词,和词库进行比较,如果匹配到词库就记录下来,然后跳过匹配到的词,继续比较,否则继续划窗,直到整个字符串的结尾。
最大公共子序列(Longest Common Subsequence,LCS):一个序列如果是某两个原始序列的子序列,而且是这两个原始序列的子序列中最长的,那么这个序列就是这两个原始序列的最大公共子序列。
POI:在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。
服务集标识(Service Set Identifier,SSID):无线宽带(Wireless-Fidelity,WIFI)的名称。
基本服务集标识(Basic Service Set Identifier,BSSID):为WIFI的物理地址(Media Access Control,MAC)。
下面介绍本申请实施例的设计思想。
随着互联网技术以及智能终端技术的发展,互联网服务越来越融入人们的日常生活中。人们可以通过智能终端中的应用搜索周边的商店以及景点等,也可以根据用户搜索到的周边的POI向用户的智能终端提供相应的推荐内容。但是,用户手动搜索周边兴趣点的步骤较为繁琐,这会耗费用户的大量时间成本和人力成本。
传统方式中,通常通过WIFI的SSID和BSSID确定周边的兴趣点,并根据SSID中的各字母与各兴趣点对应的各字母之间的匹配度,确定SSID匹配的兴趣点。
但是,采用字符级别的方式确定匹配度,获得的兴趣点的错误率较高。例如,SSID为hangkong,兴趣点的拼音为changkong,两者的最大公共子序列为hangkong,显然,两者相似度非常高,但是,两者实际是完全不同的拼音。
显然,传统技术中并没有提供一种可以提高兴趣点确定的准确率,减少兴趣点确定的人力成本和时间成本的技术方案,因此,亟待需要一种兴趣点确定的技术方案,在确定兴趣点时,可以提高兴趣点确定的准确率,减少兴趣点确定的人力成本和时间成本。
鉴于以上分析和考虑,本申请实施例中提供了一种兴趣点确定的方案,该方案中,根据终端设备周边的短距离无线通信的通信标识信息,确定终端设备周边的多个兴趣点的地点名称,根据地点名称中包含的中文,获得相应的地点拼音序列,并根据通信标识信息,获得相应的通信拼音序列,以及根据各地点拼音序列与通信音频序列之间的匹配度,确定与通信标识信息最匹配的目标兴趣点。这样,将地点名称和通信标识信息均转换为拼音,提高了兴趣点匹配的准确度,减少了兴趣点确定的人力成本和时间成本。
本申请实施例的一种应用场景为:终端设备根据短距离无线通信的通信标识信息,确定匹配的目标兴趣点,并根据获得的目标兴趣点,向用户推送目标兴趣点相关的推荐内容,如,目标商店的优惠活动以及目标景点的购票网页等。
为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。方法在实际的处理过程中或者装置执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。
参阅图1所示,为本申请提供的一种兴趣点确定的系统的架构示意图,包括多个终端设备100和服务器101。
终端设备100:用于对周边的短距离无线通信进行搜索,获得搜索到的短距离无线通信的通信标识信息,并将该通信标识信息发送至服务器101。进一步地,还用于接收服务器101根据通信标识信息返回的推荐内容。
其中,推荐内容为根据通信标识信息确定的兴趣点的相关信息。短距离无线通信包括但不限于:WIFI和蓝牙。通信标识信息可以包括短距离无线通信的名称以及地址等信息。
例如,当短距离无线通信为WIFI时,通信标识信息包括SSID和BSSID。当短距离无线通信为蓝牙时,通信标识信息包括蓝牙名称和蓝牙地址。
服务器101:用于接收终端设备100发送的通信标识信息,获取通信标识信息对应设置的各兴趣点的地点名称,将地点名称转换为地点拼音序列,并将通信标识信息转换为通信拼音序列,以及根据每一地点拼音序列与通信拼音序列之间的匹配度,确定与通信标识信息最匹配的兴趣点,作为终端设备100的目标兴趣点。
本申请实施例中,将兴趣点的地点名称和通信标识信息均转换为拼音,提高了兴趣点匹配的准确度,减少了兴趣点确定的人力成本和时间成本。
参阅图2所示,为本申请提供的一种兴趣点确定的方法的实施流程图。该方法的具体流程如下:
步骤200:终端设备对周边的短距离无线通信进行搜索,获得短距离无线通信的通信标识信息。
具体的,通信标识信息是所述终端设备根据周边的短距离无线通信获取的。短距离无线通信包括但不限于:WIFI和蓝牙。通信标识信息用于确定短距离无线通信的名称以及地址。
例如,当短距离无线通信为WIFI时,通信标识信息包括SSID和BSSID。当短距离无线通信为蓝牙时,通信标识信息包括蓝牙名称和蓝牙地址。
本申请实施例中,仅以短距离无线通信为WIFI,通信标识信息包括SSID和BSSID为例进行举例说明,短距离无线通信也可以为其它方式,在此不再赘述。
步骤201:服务器接收终端设备发送的通信标识信息。
步骤202:服务器获取通信标识信息对应设置的各兴趣点的地点名称。
具体的,服务器根据通信标识信息,确定短距离无线通信的地理位置,并根据地理系统(如,地图应用的地点数据库),获得该地理位置的指定区域范围内的POI。
实际应用中,指定区域范围可以根据实际应用场景进行设置,在此不作限制,如,指定区域范围为原点的500米范围内。
例如,服务器获得WIFI的SSID和BSSID,并根据SSID和BSSID,确定相应地理位置为经纬度(113.2971,23.1418)。服务器搜索(113.2971,23.1418)附近的POI,获得沃尔玛、友谊超市、盒马生鲜等POI,并在获得的各POI中,筛选出距离(113.2971,23.1418)500米范围内的POI,获得沃尔玛和友谊超市。
这样,就可以根据通信标识信息,获取终端设备周边的POI。
步骤203:服务器分别将每一地点名称进行拼音转换处理,获得相应的地点拼音序列。
具体的,拼音转换处理用于将中文转换为拼音。执行步骤203时,服务器可以采用以下步骤:
S2031:分别将每一地点名称中包含的每一中文转换为相应的拼音。
这是由于地点名称可能为中文,也可能为英文或中英文的组合。本申请实施例中,主要应用于包含中文的地点名称。
S2032:分别将每一地点名称中包含的多个中文对应的拼音组成的序列,确定为相应的地点拼音序列。
其中,地点拼音序列中的最小单位均为拼音。
这样,就可以将终端设备周边的兴趣点的地点名称转换为拼音,获得相应的地点拼音序列。
步骤204:服务器将通信标识信息进行拼音分词处理,获得拼音分词后的各拼音组成的通信拼音序列。
具体的,拼音分词处理用于将多个字母划分为多个拼音。执行步骤204时,可以采用以下几种方式:
第一种方式为逆向最大匹配算法:按照由后向前的顺序,依次划分出通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音,并根据获得的多个拼音,组成通信拼音序列。
需要说明的是,由于中文词语大约有40万个,因此,若采用中文分词的方式进行分词,需要耗费大量的时间和计算资源,并且采用的中文词库通常只能覆盖一小部分常用的词语,对于少见词汇或命名词效果很差,而拼音总共有411种,因此,通过拼音分词的方式进行分词,可以极大的较少耗费的时间,提高处理速度。
第二种方式为正向最大匹配算法:按照由前向后的顺序,依次划分出通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音,并根据获得的多个拼音,组成通信拼音序列。
其中,拼音词库集合为所有拼音的集合,为提高拼音词库集合遍历和查找的速度,拼音词库集合可以为前缀字典树。
参阅图3a所示,为一种逆向最大匹配算法的实施流程图,一种实施方式中,执行上述第一种方式时,服务器可以采用以下步骤:
S300:获取通信标识信息中包含的标识文本信息。
其中,通信标识信息中包含的标识文本信息,为短距离无线通信的名称,如,SSID。
S301:判断标识文本信息的文本长度是否大于零,若是,则执行S302,否则,执行S309。
S302:按照由后向前的顺序,获取文本信息中的设置的字符串长度的字符串。
具体的,字符串长度的初始值为设定值,可选的,设定值为1。
其中,字符串为字母组成的,即仅提取文本信息中的字母。
S303:判断获取的字符串是否被拼音词库集合包含,若是,则执行S304,否则,执行S305。
具体的,字符串不一定为拼音词库集合中的拼音,但是,若字符串被拼音词库集合中的任意拼音包含,则说明字符串被拼音词库集合包含。也就是说,若字符串为拼音的一部分,或为一个拼音,则字符串被拼音词库集合包含。
例如,字符串sh并不是拼音词库集合中的拼音,但是,sh被拼音词库集合中的拼音shi所包含,则sh被拼音词库集合包含。
其中,在判断字符串是否被拼音词库集合包含时,若采用普通遍历的方式,会耗费大量的时间和计算资源,为减少耗费的时间成本和资源成本,拼音词库集合可以采用前缀字典树。前缀字典树是一种快速搜索词库的算法,可以利用词的前缀,依次迭代加速搜索。
当字符串被前缀字典树中的任意子树包含时,说明字符串被拼音词库集合包含。其中,子树为前缀字典树中的一个节点以及该节点的所有后裔导出的子图,该节点为子树的根。
例如,a是前缀字典树中的一个顶点,由a以及a的所有后裔(后代)导出的子图称为前缀字典树的子树,a是子树的根。
例如,参阅图3b所示,为一种前缀字典树搜索的示例图。假设,标识文本信息youyichaoshi。在搜索chao时,首先找到“o”对应的子树,而不用查找其它的子树,极大地提高了搜索查询的速度。
S304:字符串长度加一,执行S302。
参阅图3c所示,为一种字符串提取的示意图一。图3c中,设置的初始的字符串长度为1,则服务器获取字符串i,并确定i被拼音词库集合包含,则将字符串长度加一。
S305:去掉字符串中最左边的一个字母,获得新的字符串。
这是由于当字符串不被拼音词库集合包含时,说明新的字符串为拼音词库集合中包含的最大长度的组合。
例如,字符串oshi不被拼音词库集合包含,去掉字符串中最左边的字母o,获得被拼音词库集合包含的字符串shi。
S306:判断拼音库集合中是否存在与新的字符串匹配的拼音,若是,则执行S307,否则,执行S308。
具体的,若拼音库集合中存在与新的字符串匹配的拼音,也就是说,字符串为一个拼音,则执行S307。
例如,shi为拼音库集合中的一个拼音,则拼音库集合中存在与shi匹配的拼音,sh被拼音库集合中包含,但是,拼音库集合中不存在与sh匹配的拼音。
当字符串被前缀字典树中的一个包含叶子节点的树枝匹配时,说明字符串与拼音词库集合中的拼音匹配。例如,参阅图3b所示,为一种前缀字典树搜索的示例图。假设,标识文本信息youyichaoshi。在搜索chao时,首先找到“o”对应的子树,然后,找到根节点至叶子节点的路径上经过的字符为chao的树枝。这样,就可以依次确定标识文本信息中与拼音词库集合匹配的每一拼音。
S307:从标识文本信息中分割出新的字符串,并将新的字符串添加到通信标识序列中,以及将字符串长度初始化,执行S301。
参阅图3d所示,为一种字符串分割的示意图。图3d中,字符串oshi不被拼音词库集合包含,则去掉字符串中最左边的字母o,获得新的字符串shi,确定拼音词集合中包含字符串shi,从标识文本信息中分割出字符串shi。
参阅图3e所示,为一种字符串提取的示意图二,图3e中,标识文本信息中分割去shi后,将字符串长度初始化为1,服务器获取字符串o,并确定o被拼音词库集合包含,将字符串长度加一。
S308:从标识文本信息中去掉最后边的一个字母,执行S301。
这是由于若拼音库集合中不存在与新的字符串匹配的拼音,则说明新的字符串不是拼音,则舍去最后边的一个字母。
例如,标识文本信息为shia,新的字符串为a,则确定拼音库集合中不存在与新的字符串a匹配的拼音,获得去掉a之后的标识文本信息shi。
S309:获得通信拼音序列。
由于在判断字符串是否被拼音词库集合包含,或者匹配时,若采用普通遍历查找的方式会耗费大量的计算资源以及时间,因此,拼音词库集合可以采用前缀字典树。
本申请实施例中,通过S300-S309执行上述第一种方式逆向最大匹配算法,采用与上述第一种方式相似的原理,还可以执行上述第二种方式,在此不再赘述。
步骤205:服务器分别确定每一地点拼音序列与通信拼音序列之间的匹配度。
具体的,一种实施方式中,服务器分别确定每一地点拼音序列与通信拼音序列之间的最大公共子序列,并分别将每一最大公共子序列与通信拼音序列比值,确定为相应的匹配度。
需要说明的是,本申请实施例中,仅以通过最大公共子序列确定匹配度的方式为例对确定拼音序列之间的匹配度进行说明,实际应用中,还可以采用编辑距离等方式,确定地点拼音序列与通信拼音序列之间的匹配度,在此不作限制。
传统方式中,通常从字符级别确定文本相似度,但是,采用这种方式无法解决韵母导致的相似度过高的问题。本申请实施例中,将通信标识信息中包含的标识文本信息进行拼音分词处理,获得通信拼音序列,并根据地点名称中的每一汉字对应设置的拼音,获得相应地点拼音序列,从而可以从拼音级别确定地点拼音序列与通信拼音序列之间的最大公共子序列,并根据最大公共子序列与通信拼音序列比值,确定为相应的匹配度。
例如,WIFI的SSID为“youyichaoshi”,对应的通信拼音序列为“you,yi,chao,shi”,地点名称友谊超市对应的地点拼音序列为“you,yi,chao,shi”,两者的最大公共子序列为“you,yi,chao,shi”,匹配度为100%。
又例如,WIFI的SSID为“changkong”,对应的通信拼音序列为“chang,kong”POI“航空”对应的地点拼音序列为“hang,kong”,两者的最大公共子序列为“kong”,匹配度为50%。
这样,就可以确定地点名称与通信标识信息之间的匹配度。
步骤206:服务器将匹配度符合匹配条件的地点拼音序列对应的兴趣点,确定为终端设备的目标兴趣点。
具体的,执行步骤206时,服务器可以采用以下步骤:
S2061:在获得的各匹配度中,筛选出最大匹配度。
S2062:当获得的最大匹配度高于预设匹配阈值时,确定最大匹配度对应的目标地点拼音序列。
实际应用中,匹配阈值可以根据实际应用场景进行设置,如,预设匹配阈值为0.9,在此不作限制。
S2063:将目标地点拼音序列对应的兴趣点,确定为目标兴趣点。
进一步地,当最大匹配度不高于预设匹配阈值时,还可以采用多种匹配方式,如,中英文匹配,综合确定目标兴趣点。
一种实施方式中,当最大匹配度不高于预设匹配阈值时,依次选择其它匹配方式(如,中英文匹配,英文匹配……)确定匹配度,直到存在一种匹配方式获得的最大匹配度高于匹配阈值,将根据该最大匹配度确定的兴趣点确定为目标兴趣点。
当各种匹配方式确定的匹配度均不高于预设匹配阈值时,分别针对每一地点名称,将采用各种匹配方式获得的该地点名称与通信标识信息之间的匹配度,进行加权求和,并将获得的最大的加权求和值对应的兴趣点,确定为目标兴趣点。
例如,当SSID为“babytree”时,通过拼音序列的匹配方式,无法获得目标兴趣点,则采用中英文匹配的方式,确定“babytree”匹配的兴趣点为“宝宝树”。
这样,将多种匹配方式进行相结合,提高了应用的覆盖范围,可以获得更好的效果。
进一步地,在确定终端设备的目标兴趣点后,即确定终端设备最近的POI后,就可以向终端设备提供相应的基于位置的服务(Location Based Service,LBS)服务,如,推荐目标兴趣点相关的优惠活动以及热门商品等。
本申请实施例中,采用拼音级别的匹配方式,避免了传统方式中基于字符级别的匹配方式导致的相似度过高的问题,提高了兴趣点确定的准确度,以及将拼音分词与前缀字典树相结合,优化了繁琐的遍历查找过程,极大地减少了耗费的时间,极大地提高了兴趣点确定的处理效率。
参阅图4a所示,为一种应用场景示例图,下面采用一个具体的应用场景,对上述实施例进行具体说明,具体流程如下:
步骤400:终端设备将获取的周边的通信标识信息发送至服务器。
具体的,用户靠近WIFI时,用户的终端设备获得该WIFI的通信标识信息,并将获得的通信标识信息发送至服务器。其中,通信标识信息中包含SSID“youyichaoshi”。
步骤401:服务器根据接收的通信标识信息,搜索附近的兴趣点。
具体的,服务器根据接收的通信标识信息,确定终端设备的位置信息,并获取该位置信息周边的POI:沃尔玛以及友谊超市等。
步骤402:服务器确定通信标识信息分别与每一兴趣点的地点名称之间的匹配度。
例如,参阅图4b所示,为一种拼音匹配的示例图。图4b中,服务器对SSID:youyichaoshi进行拼音分词,获得通信拼音序列“you,yi,chao,shi”,对兴趣点:友谊超市进行拼音转换,获得地点拼音序列为“you,yi,chao,shi”,两者的最大公共子序列为“you,yi,chao,shi”,匹配度为100%,确定匹配成功。
步骤403:服务器将匹配度符合匹配条件的地点拼音序列对应的兴趣点,确定为终端设备的目标兴趣点。
具体的,服务器确定匹配度符合匹配条件的地点拼音序列对应的兴趣点为友谊超市,并将友谊超市确定为终端设备的目标兴趣点。
步骤404:服务器向终端设备推送目标兴趣点相关的推荐内容。
具体的,服务器向终端设备发送友谊超市相关的优惠等网页。
参阅图5所示,为一种兴趣点确定的示例图,下面对上述实施例进行进一步详细说明。兴趣点确定的方法流程如下:
步骤500:终端设备获取连接的WIFI的通信标识信息。
步骤501:终端设备获取检测到的WIFI的通信标识信息。
步骤502:服务器接收终端设备上报的通信标识信息。
步骤503:服务器对通信标识信息进行拼音分词,获得通信拼音序列。
步骤504:服务器根据通信标识信息,确定兴趣点的地点名称。
步骤505:服务器对地点名称进行拼音转换,获得地点拼音序列。
步骤506:服务器根据通信拼音序列分别与每一地点拼音序列之间的匹配度,判断是否匹配成功,若是,则执行步骤507,否则,执行步骤509。
步骤507:服务器确定匹配成功的目标兴趣点。
步骤508:服务器向终端设备推送目标兴趣点相关的推荐内容。
步骤509:服务器确定匹配失败。
步骤510:服务器采用其它匹配方式,进行匹配。
步骤511:服务器获得综合匹配的匹配结果。
步骤512:服务器判断是否匹配成功,若是,则执行步骤508,否则,执行步骤513。
步骤513:服务器丢弃该通信标识信息。
这样,在用户连接或靠近某个WIFI时,就可以获取该WIFI的SSID以及多个店铺名称,通过多种匹配方式,确定SSID最匹配的店铺,进而可以为LBS服务提供支持,向终端设备发送店铺推荐以及到店服务等。
这样,在SSID是拼音时,通过RMM算法和前缀字典树,对SSID进行拼音分词,同时,将地点名称转换为拼音,获得SSID的通信拼音序列以及兴趣点的地点名称的地点拼音序列,然后,将两者进行比对,从而判断两者是否匹配。若SSID不是拼音,则也可以结合其他匹配方式进行匹配,确定相应的目标兴趣点。
基于同一发明构思,本申请实施例中还提供了一种兴趣点确定的装置,由于上述装置及设备解决问题的原理与一种兴趣点确定的方法相似,因此,上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图6示,其为本申请实施例提供的一种兴趣点确定的装置的结构示意图。
一种兴趣点确定的装置包括:
接收单元601,用于接收终端设备发送的通信标识信息,通信标识信息是终端设备根据周边的短距离无线通信获取的;
获取单元602,用于获取通信标识信息对应设置的各兴趣点的地点名称;
转换单元603,用于分别将每一地点名称进行拼音转换处理,获得相应的地点拼音序列,拼音转换处理用于将中文转换为拼音;
分词单元604,用于将通信标识信息进行拼音分词处理,获得拼音分词后的各拼音组成的通信拼音序列,拼音分词处理用于将多个字母划分为多个拼音;
匹配单元605,用于分别确定每一地点拼音序列与通信拼音序列之间的匹配度;
确定单元606,用于将匹配度符合匹配条件的地点拼音序列对应的兴趣点,确定为终端设备的目标兴趣点。
较佳的,转换单元603用于:
分别将每一地点名称中包含的每一中文转换为相应的拼音;
分别将每一地点名称中包含的多个中文对应的拼音组成的序列,确定为相应的地点拼音序列。
较佳的,分词单元604用于:
按照由前向后的顺序,依次划分出通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音;
根据获得的多个拼音,组成通信拼音序列;
其中,拼音词库集合为所有拼音的集合。
较佳的,分词单元604用于:
按照由后向前的顺序,依次划分出通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音;
根据获得的多个拼音,组成通信拼音序列;
其中,拼音词库集合为所有拼音的集合。
较佳的,拼音词库集合为前缀字典树。
较佳的,匹配单元605用于:
分别确定每一地点拼音序列与通信拼音序列之间的最大公共子序列;
分别将每一最大公共子序列与通信拼音序列比值,确定为相应的匹配度。
较佳的,确定单元606用于:
在各匹配度中,筛选出最大匹配度;
当最大匹配度高于预设匹配阈值时,确定最大匹配度对应的目标地点拼音序列;
将目标地点拼音序列对应的兴趣点,确定为目标兴趣点。
本申请实施例提供的一种兴趣点确定的方法、装置、设备和介质中,根据终端设备周边的短距离无线通信的通信标识信息,确定终端设备周边的多个兴趣点的地点名称,获得相应的地点拼音序列,并根据通信标识信息,获得相应的通信拼音序列,以及根据各地点拼音序列与通信音频序列之间的匹配度,确定与通信标识信息最匹配的目标兴趣点。这样,将地点名称和通信标识信息均转换为拼音,提高了兴趣点匹配的准确度,减少了兴趣点确定的人力成本和时间成本。
图7示出了一种控制设备7000的结构示意图。参阅图7所示,控制设备7000包括:处理器7010、存储器7020、电源7030、显示单元7040、输入单元7050。
处理器7010是控制设备7000的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在存储器7020内的软件程序和/或数据,执行控制设备7000的各种功能,从而对控制设备7000进行整体监控。
本申请实施例中,处理器7010调用存储器7020中存储的计算机程序时执行如图2中所示的实施例提供的兴趣点确定的方法。
可选的,处理器7010可包括一个或多个处理单元;优选的,处理器7010可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器7010中。在一些实施例中,处理器、存储器、可以在单一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
存储器7020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、各种应用等;存储数据区可存储根据控制设备7000的使用所创建的数据等。此外,存储器7020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件等。
控制设备7000还包括给各个部件供电的电源7030(比如电池),电源可以通过电源管理系统与处理器7010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
显示单元7040可用于显示由用户输入的信息或提供给用户的信息以及控制设备7000的各种菜单等,本发明实施例中主要用于显示控制设备7000中各应用的显示界面以及显示界面中显示的文本、图片等对象。显示单元7040可以包括显示面板7041。显示面板7041可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置。
输入单元7050可用于接收用户输入的数字或字符等信息。输入单元7050可包括触控面板7051以及其他输入设备7052。其中,触控面板7051,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触摸笔等任何适合的物体或附件在触控面板7051上或在触控面板7051附近的操作)。
具体的,触控面板7051可以检测用户的触摸操作,并检测触摸操作带来的信号,将这些信号转换成触点坐标,发送给处理器7010,并接收处理器7010发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7051。其他输入设备7052可以包括但不限于物理键盘、功能键(比如音量控制按键、开关机按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
当然,触控面板7051可覆盖显示面板7041,当触控面板7051检测到在其上或附近的触摸操作后,传送给处理器7010以确定触摸事件的类型,随后处理器7010根据触摸事件的类型在显示面板7041上提供相应的视觉输出。虽然在图7中,触控面板7051与显示面板7041是作为两个独立的部件来实现控制设备7000的输入和输出功能,但是在某些实施例中,可以将触控面板7051与显示面板7041集成而实现控制设备7000的输入和输出功能。
控制设备7000还可包括一个或多个传感器,例如压力传感器、重力加速度传感器、接近光传感器等。当然,根据具体应用中的需要,上述控制设备7000还可以包括摄像头等其它部件,由于这些部件不是本申请实施例中重点使用的部件,因此,在图7中没有示出,且不再详述。
本领域技术人员可以理解,图7仅仅是控制设备的举例,并不构成对控制设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意方法实施例中的兴趣点确定的方法。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台控制设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (8)
1.一种兴趣点确定的方法,其特征在于,包括:
接收终端设备发送的通信标识信息,所述通信标识信息是所述终端设备根据周边的短距离无线通信获取的;
获取所述通信标识信息对应设置的各兴趣点的地点名称;
分别将每一地点名称中包含的每一中文进行拼音转换处理,获得相应的地点拼音序列,所述拼音转换处理用于将中文转换为拼音;
按照由后向前的顺序,将所述通信标识信息进行拼音分词处理,依次划分出所述通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音,获得拼音分词后的各拼音组成的通信拼音序列,所述拼音分词处理用于将多个字母划分为多个拼音,所述拼音词库集合为所有拼音的集合;
分别确定每一地点拼音序列与所述通信拼音序列之间的匹配度;在获得的各匹配度中,筛选出最大匹配度,当所述最大匹配度高于预设匹配阈值时,确定所述最大匹配度对应的目标地点拼音序列;将所述目标地点拼音序列对应的兴趣点,确定为所述终端设备的目标兴趣点;
若确定所述每一地点拼音序列与所述通信拼音序列之间的匹配度均不符合匹配条件,则基于中英文匹配规则,分别确定每一地点名称与所述通信标识信息之间的匹配度;将匹配度符合匹配条件的地点名称对应的兴趣点,确定为所述终端设备的目标兴趣点。
2.如权利要求1所述的方法,其特征在于,分别将每一地点名称进行拼音转换处理,获得相应的地点拼音序列,包括:
分别将每一地点名称中包含的每一中文转换为相应的拼音;
分别将每一地点名称中包含的多个中文对应的拼音组成的序列,确定为相应的地点拼音序列。
3.如权利要求1所述的方法,其特征在于,将所述通信标识信息进行拼音分词处理,获得拼音分词后的各拼音组成的通信拼音序列,包括:
按照由前向后的顺序,依次划分出所述通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音;
根据获得的多个拼音,组成通信拼音序列;
其中,所述拼音词库集合为所有拼音的集合。
4.如权利要求1或3所述的方法,其特征在于,所述拼音词库集合为前缀字典树。
5.如权利要求1或3所述的方法,其特征在于,分别确定每一地点拼音序列与所述通信拼音序列之间的匹配度,包括:
分别确定每一地点拼音序列与所述通信拼音序列之间的最大公共子序列;
分别将每一最大公共子序列与所述通信拼音序列比值,确定为相应的匹配度。
6.一种兴趣点确定的装置,其特征在于,包括:
接收单元,用于接收终端设备发送的通信标识信息,所述通信标识信息是所述终端设备根据周边的短距离无线通信获取的;
获取单元,用于获取所述通信标识信息对应设置的各兴趣点的地点名称;
转换单元,用于分别将每一地点名称中包含的每一中文进行拼音转换处理,获得相应的地点拼音序列,所述拼音转换处理用于将中文转换为拼音;
分词单元,用于按照由后向前的顺序,将所述通信标识信息进行拼音分词处理,依次划分出所述通信标识信息中被获取的拼音词库集合中的拼音匹配的多个字母组成的拼音,获得拼音分词后的各拼音组成的通信拼音序列,所述拼音分词处理用于将多个字母划分为多个拼音,所述拼音词库集合为所有拼音的集合;
匹配单元,用于分别确定每一地点拼音序列与所述通信拼音序列之间的匹配度;在获得的各匹配度中,筛选出最大匹配度,当所述最大匹配度高于预设匹配阈值时,确定所述最大匹配度对应的目标地点拼音序列;
确定单元,用于将所述目标地点拼音序列对应的兴趣点,确定为所述终端设备的目标兴趣点;若确定所述每一地点拼音序列与所述通信拼音序列之间的匹配度均不符合匹配条件,则基于中英文匹配规则,分别确定每一地点名称与所述通信标识信息之间的匹配度;将匹配度符合匹配条件的地点名称对应的兴趣点,确定为所述终端设备的目标兴趣点。
7.一种控制设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-5任一项所述的方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1~5任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911148596.9A CN112825090B (zh) | 2019-11-21 | 2019-11-21 | 一种兴趣点确定的方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911148596.9A CN112825090B (zh) | 2019-11-21 | 2019-11-21 | 一种兴趣点确定的方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112825090A CN112825090A (zh) | 2021-05-21 |
CN112825090B true CN112825090B (zh) | 2024-01-05 |
Family
ID=75907402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911148596.9A Active CN112825090B (zh) | 2019-11-21 | 2019-11-21 | 一种兴趣点确定的方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112825090B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1674091A (zh) * | 2005-04-18 | 2005-09-28 | 南京师范大学 | 地理信息的语音识别方法及其在导航系统中的应用 |
JP2007265203A (ja) * | 2006-03-29 | 2007-10-11 | Denso Corp | 変換辞書生成装置及び漢字変換装置 |
CN101539433A (zh) * | 2009-04-28 | 2009-09-23 | 北京四维图新科技股份有限公司 | 导航系统中拼音首字母加声调检索的方法及装置 |
CN102254557A (zh) * | 2011-07-04 | 2011-11-23 | 深圳市子栋科技有限公司 | 基于自然语音识别的导航方法和系统 |
CN103853740A (zh) * | 2012-11-29 | 2014-06-11 | 北京百度网讯科技有限公司 | 一种基于用户定位请求的poi数据更新方法和装置 |
CN103945007A (zh) * | 2014-05-08 | 2014-07-23 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN104102661A (zh) * | 2013-04-09 | 2014-10-15 | 重庆新媒农信科技有限公司 | 一种拼音流切分方法及系统 |
CN107273359A (zh) * | 2017-06-20 | 2017-10-20 | 北京四海心通科技有限公司 | 一种文本相似度确定方法 |
CN107783976A (zh) * | 2016-08-25 | 2018-03-09 | 腾讯科技(深圳)有限公司 | 用户信息挖掘方法及装置 |
CN108304378A (zh) * | 2018-01-12 | 2018-07-20 | 深圳壹账通智能科技有限公司 | 文本相似度计算方法、装置、计算机设备和存储介质 |
CN109413687A (zh) * | 2018-10-25 | 2019-03-01 | 深圳壹账通智能科技有限公司 | Wi-fi网络分析方法、装置、设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105404401A (zh) * | 2015-11-23 | 2016-03-16 | 小米科技有限责任公司 | 输入处理方法、装置及设备 |
-
2019
- 2019-11-21 CN CN201911148596.9A patent/CN112825090B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1674091A (zh) * | 2005-04-18 | 2005-09-28 | 南京师范大学 | 地理信息的语音识别方法及其在导航系统中的应用 |
JP2007265203A (ja) * | 2006-03-29 | 2007-10-11 | Denso Corp | 変換辞書生成装置及び漢字変換装置 |
CN101539433A (zh) * | 2009-04-28 | 2009-09-23 | 北京四维图新科技股份有限公司 | 导航系统中拼音首字母加声调检索的方法及装置 |
CN102254557A (zh) * | 2011-07-04 | 2011-11-23 | 深圳市子栋科技有限公司 | 基于自然语音识别的导航方法和系统 |
CN103853740A (zh) * | 2012-11-29 | 2014-06-11 | 北京百度网讯科技有限公司 | 一种基于用户定位请求的poi数据更新方法和装置 |
CN104102661A (zh) * | 2013-04-09 | 2014-10-15 | 重庆新媒农信科技有限公司 | 一种拼音流切分方法及系统 |
CN103945007A (zh) * | 2014-05-08 | 2014-07-23 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN107783976A (zh) * | 2016-08-25 | 2018-03-09 | 腾讯科技(深圳)有限公司 | 用户信息挖掘方法及装置 |
CN107273359A (zh) * | 2017-06-20 | 2017-10-20 | 北京四海心通科技有限公司 | 一种文本相似度确定方法 |
CN108304378A (zh) * | 2018-01-12 | 2018-07-20 | 深圳壹账通智能科技有限公司 | 文本相似度计算方法、装置、计算机设备和存储介质 |
CN109413687A (zh) * | 2018-10-25 | 2019-03-01 | 深圳壹账通智能科技有限公司 | Wi-fi网络分析方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112825090A (zh) | 2021-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240029464A1 (en) | Method, apparatus, and computer program product for classification of documents | |
CN108701161B (zh) | 为搜索查询提供图像 | |
Van Aart et al. | Mobile cultural heritage guide: location-aware semantic search | |
CN108549656B (zh) | 语句解析方法、装置、计算机设备及可读介质 | |
CN111782977A (zh) | 兴趣点处理方法、装置、设备及计算机可读存储介质 | |
CN111414763A (zh) | 一种针对手语计算的语义消歧方法、装置、设备及存储装置 | |
CN105637509A (zh) | 在图像内搜索和注释 | |
CN102930048A (zh) | 使用参考和视觉数据的语义自动发现的数据丰富 | |
CN111611452A (zh) | 搜索文本的歧义识别方法、系统、设备及存储介质 | |
CN111737430A (zh) | 实体链接方法、装置、设备以及存储介质 | |
Bogdanović et al. | Methodology for geospatial data source discovery in ontology-driven geo-information integration architectures | |
CN112711645B (zh) | 一种位置点信息扩展方法、装置、存储介质和电子设备 | |
CN107239209B (zh) | 一种拍照搜索方法、装置、终端及存储介质 | |
CN113822038A (zh) | 一种摘要生成方法和相关装置 | |
CN112818072A (zh) | 旅游知识图谱更新方法、系统、设备及存储介质 | |
CN111553163A (zh) | 文本相关度的确定方法、装置、存储介质及电子设备 | |
CN112825090B (zh) | 一种兴趣点确定的方法、装置、设备和介质 | |
JP2011165092A (ja) | 文書画像関連情報提供装置、及び文書画像関連情報取得システム | |
CN111984876A (zh) | 兴趣点处理方法、装置、设备及计算机可读存储介质 | |
WO2012015021A1 (en) | Stroke and structure input method and system | |
Jaiswal et al. | GeoCAM: A geovisual analytics workspace to contextualize and interpret statements about movement | |
US20230376691A1 (en) | Method for point-of-interest information management, electronic device, and storage medium | |
Tabarcea et al. | Framework for location-aware search engine | |
CN114579883A (zh) | 地址查询方法、获取地址向量表示模型的方法及对应装置 | |
EP3553696B1 (en) | Generating a structured document based on a machine readable document and artificial intelligence-generated annotations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |