CN111209491A - 用于数据库构建的系统和方法 - Google Patents
用于数据库构建的系统和方法 Download PDFInfo
- Publication number
- CN111209491A CN111209491A CN201811399017.3A CN201811399017A CN111209491A CN 111209491 A CN111209491 A CN 111209491A CN 201811399017 A CN201811399017 A CN 201811399017A CN 111209491 A CN111209491 A CN 111209491A
- Authority
- CN
- China
- Prior art keywords
- poi
- index
- interest
- point
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 238000010276 construction Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims description 153
- 238000005516 engineering process Methods 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 38
- 235000013305 food Nutrition 0.000 description 27
- 238000010586 diagram Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 17
- 238000011156 evaluation Methods 0.000 description 16
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 235000012054 meals Nutrition 0.000 description 10
- 230000003796 beauty Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 235000013410 fast food Nutrition 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 235000005135 Micromeria juliana Nutrition 0.000 description 3
- 241000246354 Satureja Species 0.000 description 3
- 235000007315 Satureja hortensis Nutrition 0.000 description 3
- 235000021168 barbecue Nutrition 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- ORKBYCQJWQBPFG-WOMZHKBXSA-N (8r,9s,10r,13s,14s,17r)-13-ethyl-17-ethynyl-17-hydroxy-1,2,6,7,8,9,10,11,12,14,15,16-dodecahydrocyclopenta[a]phenanthren-3-one;(8r,9s,13s,14s,17r)-17-ethynyl-13-methyl-7,8,9,11,12,14,15,16-octahydro-6h-cyclopenta[a]phenanthrene-3,17-diol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1.O=C1CC[C@@H]2[C@H]3CC[C@](CC)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 ORKBYCQJWQBPFG-WOMZHKBXSA-N 0.000 description 2
- 241000221931 Hypomyces rosellus Species 0.000 description 2
- 101100366434 Mus musculus Spidr gene Proteins 0.000 description 2
- 244000299492 Thespesia populnea Species 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 235000015220 hamburgers Nutrition 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 235000019640 taste Nutrition 0.000 description 2
- HJOCKFVCMLCPTP-UHFFFAOYSA-N 2-[(2-ethoxyphenoxy)methyl]morpholine;hydron;chloride Chemical compound Cl.CCOC1=CC=CC=C1OCC1OCCNC1 HJOCKFVCMLCPTP-UHFFFAOYSA-N 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 241001122315 Polites Species 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Navigation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种数据库构建方法,所述方法包括从第一在线平台获取兴趣点的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据。所述方法进一步包括确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括至少两个级别。所述至少两个级别中的每个级别包括至少一个索引标签。所述方法进一步包括基于所述兴趣点POI的第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配以及存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。本发明采用金字塔结构的数据库并从多个线上和线下服务平台抓取POI数据,可提高POI查询的准确度。
Description
技术领域
本申请涉及线上至线下,尤其涉及用于构建数据库的系统和方法。
背景技术
随着因特网的发展,越来越多的信息可以经由网络从在线服务平台获取和/或检索。例如,用户可以查询存储在运输服务平台的数据库中的感兴趣点POI(point ofinterest,POI)及相关信息。然而,时常地,POI的查询可能是模糊的和不明确的,这可能导致查询的结果不准确。例如,POI的查询可以是短语“美味餐厅”,这对于检索准确地POI太过于模糊。另外,存储在当前数据库中的POI的数据和/或信息可能不全面,其可能无法准确地向用户提供POI的信息。因此,希望提供用于构建能够通过查询检索POI的有效数据库的系统和方法。
发明内容
在本发明的第一方面,提供了一种数据库构建方法,所述方法包括从第一在线平台获取兴趣点的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据。所述方法进一步包括确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括至少两个级别。所述至少两个级别中的每个级别包括至少一个索引标签。所述方法进一步包括基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与来自所述至少一组索引标签的至少一个目标索引标签相匹配以及存储所述兴趣点POI的第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。
在本发明中,所述POI的所述第一特征数据包括所述兴趣点POI的地址、所述兴趣点POI的名称、所述兴趣点POI的坐标、所述兴趣点POI的标签,或所述兴趣点POI的类型中的至少一个。
在本发明中,所述兴趣点POI的所述第二特征数据包括所述兴趣点POI的评价分数、所述兴趣点POI的消费总次数,或所述兴趣点POI的评价总次数中的至少一个。
在本发明中,所述第一在线平台用于提供地图服务。
在本发明中,所述第二在线平台用于提供评价服务。
在本发明中,可以使用Python技术从所述第二在线平台获取所述兴趣点POI的所述第二特征数据。
在本发明中,基于所述兴趣点POI的所述第一特征数据将所述兴趣点POI与所述至少一组索引标签中的目标索引标签进行匹配包括:将所述兴趣点POI与所述至少一组索引标签中的其中一组的至少部分索引标签从最高级别到最低级别进行比较;以及基于所述比较确定所述目标索引标签。
在本发明中,将所述兴趣点POI的所述第一特征数据与至少一组索引标签其中一组的索引标签进行比较包括确定所述兴趣点POI与所述至少一组索引标签的其中一组中的至少部分索引标签之间的相似度;以及确定所述目标索引标签,所述目标索引标签与所述兴趣点POI的相似度满足条件。
在本发明中,所述方法还包括获取用户通过客户端指定的兴趣点POI的查询;从所述数据库中检索与所述查询匹配的至少一个候选兴趣点POI相关联的数据;以及基于与所述至少一个候选兴趣点POI相关联的所述检索数据,向所述用户推荐所述至少一个候选兴趣点POI中的至少一个。
在本发明中,基于与所述至少一个候选兴趣点POI相关联的所述检索数据向所述用户推荐所述至少一个候选兴趣点POI中的至少一个包括从所述客户端获取与所述用户相关联的历史数据;以及基于与所述至少一个候选兴趣点POI相关联的所述检索数据和与所述用户相关联的所述历史数据,向所述用户推荐所述至少一个候选POI中的至少一个。
在本发明的第二方面,提供了一种POI查询方法,所述方法包括获取用户通过客户端指定的兴趣点POI的查询以及从包括至少两个兴趣点POI的数据库中检索与所述查询匹配的至少一个候选POI相关联的数据。所述数据库由以下步骤构建:从第一在线平台获取兴趣点POI的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据;确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括两个级别。所述至少两个级别中的每个级别包括至少一个索引标签。基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配以及存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。所述方法进一步包括基于与所述至少一个候选POI相关联的所述检索数据,向所述用户推荐所述至少一个候选POI中的至少一个。
在本发明的第三方面,提供了一种处理数据的装置,所述装置包括处理器,所述处理器用于执行上述用于数据库构建和POI查询的方法。
在本发明的第四方面,提供了一种计算机可读存储介质,所述存储介质存储计算机指令,当所述计算机指令被计算机执行时,计算机运行上述用于数据库构建和POI查询的方法。
在本发明的第五方面,提供了一种数据库构建的系统。所述系统包括获取模块、确定模块、匹配模块以及存储模块。所述获取模块用于从第一在线平台获取兴趣点POI的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据。所述确定模块用于确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括两个级别。所述至少两个级别中的每个级别包括至少一个索引标签。所述匹配模块用于基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配,以及所述存储模块用于存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。
本发明相对于现有技术,可实现的有益效果包括:
(一)本发明采用金字塔结构的数据库,设置不同级别的索引标签,可以提高检索速度,便于数据存储和更新;
(二)本发明通过从多个线上和线下服务平台,例如大众点评,百度地图等抓取兴趣点POI相关数据,可丰富数据库内容,提高POI查询的准确度。
本申请的一部分附加特征将在下面的描述中进行说明。通过对以下描述和相应附图的检查或者对实例的生产或操作的了解,本申请的一部分附加特征对本领域技术人员来说是显而易见的。本申请的特征可以通过对以下描述的具体实施例的各个方面的方法、手段及组合的实践或使用得以实现和达到。
附图说明
本申请通过示例性实施例进一步进行描述。这些示例性实施例将通过附图进行详细描述。附图没有按比例绘制。这些实施例并非限制性的,在这些实施例中,相同的附图标记表示相同的结构,其中:
图1是根据本申请的一些实施例所示的示例性数据库系统的示意图;
图2是根据本申请的一些实施例所示的可在其上实施处理引擎的示例性计算设备的示例性硬件和/或软件组件的示意图;
图3是根据本申请的一些实施例所示的可以在其上实现终端的示例性移动设备的示例性硬件和/或软件组件的示意图;
图4是根据本申请所示的一些实施例的示例性终端的框图;
图5是根据本申请的一些实施例所示的用于构建数据库的示例性过程的流程图;
图6是根据本申请的一些实施例所示的用于向客户终端推荐POI的示例性过程的流程图;
图7是根据本申请的一些实施例所示的用于确定目标索引标签的示例性过程的流程图;
图8是根据本申请的一些实施例所示的数据库系统的示例性结构的示意图;以及
图9是根据本申请的一些实施例所示的示例性数据库的示意图。
具体实施方式
为了更清楚地说明本申请的实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。然而,本领域技术人员应该明白,可以在没有这些细节的情况下实施本申请。在其他情况下,为了避免不必要地模糊本披露的一些方面,本披露以相对高级别且不添加细节的方式描述了公知的方法、程序、系统、组件和/或电路。对于本领域的普通技术人员来讲,对本申请披露的实施例进行的各种修改是显而易见的,并且本申请定义的通则可以适用于其他实施例和应用,而不背离本申请的精神和范围。因此,本申请并不限于所披露的实施例,而应被给予与申请专利范围一致的最宽泛的范围。
本申请所使用的术语仅为了描述特定范例性实施例,并不限制本申请的范围。如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。应该被理解的是,本申请中所使用的术语“包括”与“包含”仅提示已明确标识的特征、整数、步骤、步、元素、及/或组件,而不排除可以存在和添加其他一个或多个特征、整数、步骤、操作、元素、组件、及/或其组合。
应当理解,这里使用的术语“系统”、“引擎”、“单元”、“模块”和/或“块”是以升序区分不同级别的不同组件、元件、部件、部分或组件的一种方法。然而,如果它们实现相同的目的,则可以通过其他表达来替换这些术语。
通常,这里使用的词语“模块”、“单元”或“块”是指体现在硬件或固件中的逻辑,或者是软件指令的集合。本文描述的模块,单元或块可以实现为软件和/或硬件,并且可以存储在任何类型的非暂时性计算机可读介质或其他存储设备中。在一些实施例中,可以编译软件模块/单元/块并将其链接到可执行程序中。应当理解,软件模块可以从其他模块/单元/块或从它们自身调用,和/或可以响应检测到的事件或中断来调用。配置用于在计算设备(例如,如图2所示的处理器220)上执行的软件模块/单元/块可以在计算机可读介质上提供,例如光盘、数字视频盘、闪存驱动器、磁盘或任何其他有形介质,或作为数字下载(并且最初可以以压缩或可安装的格式存储,在执行之前需要安装,解压缩或解密)。这里的软件代码可以被部分的或全部的储存在执行操作的计算设备的存储设备中,并应用在计算设备的操作之中。软件指令可以嵌入固件中,例如EPROM。还应当理解,硬件模块/单元/块可以包括在连接的逻辑组件中,例如门和触发器,和/或可以包括在可编程单元中,例如可编程门阵列或处理器。本文描述的模块/单元/块或计算设备功能可以实现为软件模块/单元/块,但是可以用硬件或固件表示。通常,这里描述的模块/单元/块指的是逻辑模块/单元/块,其可以与其他模块/单元/块组合或者分成子模块/子单元/子块,尽管它们的物理组织或存储。该描述可适用于系统,引擎或其一部分。
应当理解,当单元、发动机、模块或块被称为“开启”、“连接到”或“耦合到”另一个单元,发动机、模块或块时,它可以是除非上下文另有明确说明,否则可以存在直接在其上,连接或耦合到或与其他单元,发动机,模块或块或与中间单元,引擎,模块或块通信的通信。在本申请中,术语“和/或”可包括任何一个或多个相关所列条目或其组合。
根据以下对附图的描述,本申请的这些和其他的特征、特点、以及结构的相关元件的功能和操作方法,以及部件组合和制造经济更加显而易见,这些都构成说明书的一部分。然而,应当理解,附图仅仅是为了说明和描述的目的,并不旨在限制本申请的范围。应当理解的是附图并不是按比例的。
本申请中使用了流程图用于说明根据本申请的实施例的系统所执行的操作。应当理解的是,流程图的操作不一定按照顺序来精确地执行。相反,可以按照倒序执行或同时处理各种步骤。同时,也可以将一个或多个其他操作添加到这些流程图中,或从这些流程图移除一个或多个操作。
图1是根据本申请的一些实施例所示的示例性线上至线下服务系统100的示意图。线上至线下服务系统可以是用于运输服务的线上至线下服务平台(例如,出租车、司机服务、送货车辆、拼车、公交服务、司机租用、短程运输服务等)、在线导航服务、在线评价服务、餐饮预订服务、网上购物服务等。线上至线下服务系统100可以包括服务器110、网络120、存储设备130和客户端140。
服务器110可包含处理引擎112。处理引擎112可以用于为与至少一个兴趣点(point of interest,POI)相关的处理信息和/或数据。例如,处理引擎112可以从至少一个线上或线下服务平台(例如,评价服务平台、地图服务平台等)获取与POI有关的数据和/或信息以构建至少一个与POI相关的数据库。与一个或以上兴趣点POI相关的信息和/或数据可以包括每个POI的特征数据。POI的示例性特征数据可以包括POI的地址、POI的名称、POI的坐标、POI的标签、POI的类型、POI的评价分数、POI的评价总次数、POI的消费总次数等或其任何组合。进一步地,处理引擎112可以基于与POI相关的特征数据来构建POI的数据库。处理引擎112可以确定至少两个索引标签组。至少两组索引标签的每个组可以被分成至少两个级别。处理引擎112可以基于POI的特征数据将POI与来自索引标签的至少一组的目标索引标签进行匹配。并将POI的特征数据以及匹配的目标索引标签存储于例如,存储设备130,或任何其他存储器,用于形成数据库。又如此,处理引擎112可以接收用户通过客户端140生成的POI查询。处理引擎112可以从由处理引擎112构建的至少一个数据库检索和/或确定一个或以上候选POI。处理引擎112还可以将包括至少一个候选POI的信号发送到客户端140。该信号也可以被配置为使客户端140向用户显示至少一个候选POI。
在一些实施例中,所述处理引擎112可包括至少一个处理引擎(例如,单芯片处理引擎或多芯片处理引擎)。仅仅作为示例,处理引擎112可以包括一个或多个硬件处理器,例如中央处理器(CPU)、专用集成电路(ASIC)、专用指令集处理器(ASIP)、图像处理器(GPU)、物理运算处理单元(PPU)、数字信号处理器(DSP)、现场可程序门阵列(FPGA)、可编辑逻辑装置(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等或上述举例的任意组合。
在一些实施例中,服务器110可以是单一服务器或一服务器组。该服务器组可以是集中式或分布式的(例如,服务器110可以是分布式系统)。在一些实施例中,服务器110可以是本地的或远程的。例如,服务器110可以经由网络120访问存储设备130中存储的信息和/或数据。又如,服务器110可以连接到存储设备130以访问存储的信息和/或数据。在一些实施例中,服务器110可以在一云平台上实施。仅仅作为示例,所述云平台可以包括私有云、公共云、混合云、小区云、分布云、跨云、多云等或上述举例的任意组合。在一些实施例中,服务器110可以在图2中描述的包含了至少一个组件的计算设备200上执行。
网络120可以促进信息和/或数据的交换。在一些实施例中,线上至线下服务系统100的至少一个组件(例如,服务器110、客户端140和存储设备130)可以通过网络120将信息和/或数据发送到线上至线下服务系统100的其他组件。例如,服务器110可以经由网络120从在客户端140上实现的至少一个线上至线下服务平台获取与至少一个POI有关的数据或信息。又如此,客户端140可以经由线上至线下服务平台(例如,运输服务平台)发送用于POI及有关信息或数据的查询。在一些实施例中,网络120可以是有线网络或无线网络中的任意一种,或其组合。仅仅作为示例,网络120可以包括电缆网络、有线网络、光纤网络、远程通信网路、内部网络、因特网、局域网络(LAN)、广域网络(WAN)、无线局域网络(WLAN)、城域网络(MAN)、公共交换电话网络(PSTN)、蓝牙网络、ZigBee网络、近场通讯(NFC)网络等或上述举例的任意组合。在一些实施例中,网络120可以包括一个或多个网络交换点。例如,网络120可能包括有线或无线网络交换点,如基站和/或互联网交换点120-1、120-2、……,通过交换点,按需服务系统100的一个或多个部件可以连接到网络120以交换数据和/或信息。
存储设备130可以存储数据和/或指令。例如,存储设备130可以存储与一个或以上在线服务平台(例如,地图服务平台、评价服务平台等)提供的一个或以上POI有关的数据或信息。进一步地,存储设备130可以存储由处理引擎112确定的与一个或以上POI有关的特征数据。又例如,存储设备130可以存储至少两组索引标签和相应的POI。作为又一示例,存储设备130可以存储服务器110可以执行或使用的数据和/或指令,以执行本申请中描述的示例性方法。在一些实施例中,储存器130可包括一大容量储存器、可移动储存器、易失性读写内存、只读存储器(ROM)等或其任意组合。示例性的大容量储存器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性的挥发性只读存储器可以包括随机存取内存(RAM)。示例性的RAM可包括动态RAM(DRAM)、双倍速率同步动态RAM(DDRSDRAM)、静态RAM(SRAM)、闸流体RAM(T-RAM)和零电容RAM(Z-RAM)等。示例性的ROM可以包括掩模ROM(MROM)、可编程ROM(PROM)、可擦除可编程ROM(PEROM)、电子可擦除可编程ROM(EEPROM)、光盘ROM(CD-ROM)和数字通用磁盘ROM等。在一些实施例中,所述存储设备130可以在云平台上实现。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
在一些实施例中,存储设备130可以包括至少一个网络端口,用于与线上至线下服务系统100中的其他设备通信。例如,存储设备130可以连接到网络120,以经由至少一个网络端口与线上至线下服务系统100的至少一个组件(例如,服务器110、客户端140)通信。线上至线下服务系统100中的至少一个组件可以经由网络120访问存储设备130中存储的数据或指令。在一些实施例中,存储设备130可以直接连接到线上至线下服务系统100(例如,服务器110、客户端140)中的一个或以上组件或与之通信。在一些实施例中,存储设备130可以是服务器110的一部分。
客户端140可以是用户用来查询所需信息的任何类型的设备。例如,客户端140可以向服务器110发送查询。客户端140的用户可以是发送查询,例如,购物中心的地址、美味的西餐厅等或其任何组合的任何组织或个人。
在一些实施例中,客户端140可包括任何类型的设备,例如,移动设备、电子设备、汽车等或其任何组合。例如,客户端140可以包括移动设备140-1、膝上型计算机140-2、台式计算机140-3、机动车辆140-4中的内置设备等或者任何组合。内置设备140-3可以包括车载计算机、车载电视、车载定位系统等。移动设备140-1可以包括可穿戴设备,智能移动设备,虚拟现实设备,增强现实设备等或其任何组合。在一些实施例中,该可穿戴设备可包括智能手镯、智能鞋袜、智能眼镜、智能头盔、智能手表、智能穿着、智能背包、智能配件等或其任意组合。在一些实施例中,智能移动设备可以包括智能电话、个人数字助理(PDA)、游戏设备、导航设备、POS机等或其任意组合。在一些实施例中,虚拟现实设备和/或增强型虚拟现实设备可以包括虚拟现实头盔、虚拟现实眼镜、虚拟现实补丁、增强型虚拟现实头盔、增强型虚拟现实眼镜、增强型虚拟现实补丁等或其任意组合。例如,虚拟现实装置和/或增强实境装置可以包括Google GlassTM、RiftConTM、FragmentsTM、Gear VRTM等。在一些实施例中,客户端140可以是具有定位技术的设备,用于定位客户端140和/或其用户的位置。在一些实施例中,客户端140可以在具有图2中所示的至少一个组件的计算设备200上实现,或者在本申请中具有图3中所示的至少一个组件的移动设备300上实现。
在一些实施例中,客户端140可以经由用户界面向和/或从服务器110发送和/或接收与POI有关的数据和/或信息。用户界面可以是以线上至线下服务应用程序的形式在客户端140上实现。用户界面可以被配置为促进客户端140与客户端140相关联的用户之间的通信。在一些实施例中,用户界面可以通过,例如用户界面屏幕接收用户对POI的查询请求(或请求、或查询)的输入。客户端140可以经由用户界面向服务器110发送POI的查询请求(或请求,或查询)。处理装置120可以从由本申请中其他地方描述的服务器110构建的数据库中检索和/或确定一个或以上候选POI。在一些实施例中,处理装置120可以经由用户界面将包括至少一个候选POI的信号发送到客户端140。在一些实施例中,服务器110还可以基于至少一个候选POI经由用户界面向客户端140推荐至少一个目标POI。
本领域的普通技术人员可以理解,当线上至线下服务系统100的元件(或组件)执行时,该元件可以通过电信号和/或电磁信号执行。例如,当客户端140向服务器110发送请求时,客户端140的处理器可以生成编码请求的电信号。然后,客户端140的处理器可以将电信号发送到输出端口。若请客户端140经由有线网络与服务器110通讯,则输出端口可物理连接至电缆,电缆还可以将电信号传输给服务器110的输入端口。如果客户端140经由无线网络与服务器110通信,则客户端140的输出端口可以是至少一个天线,其将电信号转换为电磁信号。在诸如客户端140和/或服务器110的电子设备内,当其处理器处理指令,发出指令和/或执行动作时,指令和/或动作通过电子进行。例如,当处理器从存储介质检索或保存数据时,其可以将电信号发送到存储介质的读/写设备,该读/写设备可以在存储介质中读取或写入结构化数据。结构化数据可以电信号的形式经由电子装置的总线传输至处理器。此处,电信号可以指一个电信号、一系列电信号和/或多个不连续的电信号。
图2是计算设备200所示的示例性硬件和软件组件的示意图,在该计算设备200上可以根据本申请的一些实施例实现服务器110和/或客户端140。例如,处理引擎112可以在计算设备200上实施并执行本申请所披露的处理引擎112的功能。
计算设备200可用于实现线上至线下服务系统100的任何组件,其执行本申请中公开的至少一个功能。例如,处理引擎112可以在计算设备200上通过其硬件、软件程序、固件或其组合实现。尽管仅示出了一个这样的计算机,但是为了方便起见,如本文所述的线上至线下服务相关的计算机功能可以在多个类似平台上以分布式方式实现,以分配处理负荷。
计算设备200可以例如包括与网络相连接并促进数据通讯的通讯(COM)端口250。COM端口250可以指代任何网络端口、信息交换端口或任何信息传输端口以促进数据通信。计算设备200还可以包括处理器(例如,处理器220),其形式为至少一个处理器(例如,逻辑电路),用于执行程序指令。例如,处理器可以包括接口电路和其中的处理电路。接口电路可以用于为从总线210接收电子信号,其中电子信号编码结构化数据和/或指令以供处理电路处理。处理电路可以进行逻辑计算,然后确定结果、结果和/或编码为电子信号的指令。处理电路还可以生成包括结论或结果(例如,POI的特征数据)和触发代码的电子信号。在一些实施例中,触发代码可以是线上至线下服务系统100中的电子设备(例如,客户端140)的操作系统(或其中安装的应用程序)可识别的格式。例如,触发代码可以包括指令、代码、标记、符号等或其任何组合,其可以激活移动电话的某些功能和/或操作或者让移动电话执行预定的程式。在一些实施例中,触发代码可以配置为更新电子设备的操作系统(或应用程序)以在电子设备的接口上生成结论或结果(例如,POI的特征数据)的呈现。然后,接口电路可以经由总线210从处理电路发出电子信号。
示例性计算设备可以包括内部通信总线210,程序存储和不同形式的数据存储,包括例如磁盘270、只读存储器(ROM)230或随机存取存储器(RAM)240,用于由计算设备处理和/或发送的各种数据文件。示例性计算平台也可以包存储存于ROM 230,RAM 240及/或其他形式的非暂时性储存媒体中的能够被处理器220执行的程序指令。本申请的方法和/或流程可以以程序指令的方式实现。示例性计算设备还可以包括存储在ROM 230、RAM 240和/或由处理器220执行的其他类型的非暂时性存储介质中的操作系统。程序指令可以与用于提供线上至线下服务的操作系统兼容。计算设备200还包括I/O组件260,支持计算机和其他组件之间的输入/输出。计算设备200也可以通过网络通信接收程序设计和数据。
仅用于说明,图2中仅示出了一个处理器。还考虑了多个处理器;因此,由本申请中描述的一个处理器执行的操作和/或方法步骤也可以由多个处理器联合或单独执行。例如,在本申请中,如果计算设备200的处理器执行操作A和操作B,应当被理解为是操作A和操作B也可以由计算设备200的两个不同的处理器共同或分别执行(例如,第一处理器执行操作A、第二处理器执行操作B、或者第一处理器和第二处理器共同执行操作A和B)。
图3是根据本申请的一些实施例所示的可以在其上实现用户终端130的示例性移动设备300的示例性硬件和/或软件组件的示意图。
如图3所示,移动设备300可以包括通信平台310、显示器320、图形处理单元(GPU)330、中央处理单元(CPU)340、I/O350、内存360和存储器390。CPU可以包括接口电路和类似于处理器220的处理电路。在一些实施例中,任何其他合适的组件,包括但不限于系统总线或控制器(未示出),也可包括在移动设备300内。在一些实施例中,移动操作系统370(例如,iOSTM、AndroidTM、Windows PhoneTM等)和至少一个应用程序380可以从存储器390加载到内存360中,以便由CPU340执行。应用程序380可以包括浏览器或用于接收和呈现与服务的语音请求有关的信息的任何其他合适的移动应用程序。用户与信息流的交互可以经由I/O350实现,并经由网络120提供给处理引擎112和/或AI系统100的其他组件。通信单元310可以是任何信息交换端口、信息发送端口或网络端口,以便于数据通信。
为了实现本申请中描述的各种模块、单元及其功能,计算机硬件平台可以用作至少一个本文所述元件的硬件平台(例如,线上至线下服务系统100)和/或关于图1-7描述的线上至线下服务系统100的其他组件。这种计算机的硬件元件,操作系统和编程语言本质上是常规的,并且假定本领域技术人员对其充分熟悉以使那些技术适应于在此描述的语音请求中提供服务响应。具有用户界面元件的计算机可以用于实现个人计算机(PC)或另一个类型的工作站或终端设备,如果适当地编程,计算机也可以充当服务器。可以认为本领域技术人员对这样的结构、程序以及这类计算机设备的一般操作都是熟悉的,因此所有附图也都不需要额外的解释。
本领域普通技术人员将理解,当线上至线下服务系统100的元件执行时,该元件可以通过电信号和/或电磁信号执行。例如,当客户端140发出查询时,客户端140的处理器可以生成编码事故报告的电信号。客户端140的处理器然后可以将电信号发送到与客户端140相关联的信息提供系统的至少一个信息接收端口。在如客户端140和/或服务器110的电子设备内,当其处理器处理指令,发出指令和/或执行动作时,指令和/或动作通过电信号进行。例如,当处理器从存储介质(例如,存储设备130)检索或保存数据时,它可以将电信号发送到存储介质的读/写设备,该读/写设备可以在存储介质中读取或写入结构化数据。结构化数据可以电信号的形式经由电子装置的总线传输至处理器。此处,电信号可以指一个电信号,一系列电信号和/或多个不连续的电信号。在服务器110的处理器确定结果之后,处理器可以生成对结果进行编码的电信号,并将电信号发送到信息接收系统的至少一个信息传输端口。
图4是根据本申请的所示的一些实施例示例性处理引擎112的框图。处理引擎112可包括获取模块410、确定模块420、匹配模块430和存储模块440。
获取模块410可以用于为从在线服务平台获取POI的特征数据。例如,获取模块410可以用于为从第一线上至线下服务平台获取第一特征数据。第一特征数据可以包括POI的地址、POI的名称、POI的坐标、POI的标签、或POI的类型等或其任何组合。第一线上至线下服务平台可以配置为提供导航和/或地图服务,例如百度地图、谷歌地图、高德地图、腾讯地图、北斗地图、GPS地图、搜狗地图等。再例如,获取模块410可以用于为从第二线上至线下服务平台获取第二特征数据。第二特征数据可以包括POI的评价分数、POI的评价总次数、POI的消费总次数等或者任何数据等或其组合。
确定模块420可以用于确定至少一组的索引标签。索引标签可以表示POI的特性,例如POI的类型、POI的标签等。所述至少一组的索引标签的每组可以包括至少两个级别。每个级别可包括至少两个索引标签。例如,索引标签可以包括“电影”、“酒店”、“旅游”、“美容”等。在每组索引标签中,较高级别的索引标签可以比较低级别的索引标签具有更高的搜索优先级。例如,一组中的第一索引标签可以是“美食”,第二索引标签可以是“快餐”、或“中餐”、或“咖啡”、或“烧烤”等。又例如,另一组中的第一索引标签可以是“旅游”,第二索引标签可以是“展览”、“景点”、“动物园”等。在一些实施例中,确定模块420可以基于POI的特征数据(例如,第一特征数据)确定组中的至少一个索引标签。例如,POI的第一特征数据可以包括POI的类型或标签。确定模块420可以将POI的类型或标签指定为索引标签。作为另一示例,从第一线上至线下服务平台获取的POI“重庆火锅”的类型或标签可以是“美食”和“火锅”。确定模块420可以指定“美食”作为第一级别(或最高级别)的索引标签,并将“火锅”指定为低于第一级别的第二级别(或次级别)的索引标签。
匹配模块430可以将POI与目标索引标签匹配。在一些实施例中,匹配模块430可以通过将POI与多个组中具有相同级别的索引标签进行比较,以确定与POI匹配的目标组。例如,具有相同级别的索引标签可以是具有最高级别(或第一级别)的索引标签。匹配模块430可以基于所述比较来确定目标组。例如,匹配模块430可以确定POI的第一特征数据与多个组中具有相同级别的索引标签之间的相似性。匹配模块430可以确定与第一特征数据具有最大相似性的索引标签所在的组为目标组。然后,匹配模块430可以将POI与目标组中具有不同级别的一个或以上目标索引标签匹配。在一些实施例中,匹配模块430可以将至少两个POI与对应的目标索引标签匹配,以形成对应于目标索引标签的多个数据库。例如,如果目标索引标签是“咖啡”,则处理引擎112可以形成包括至少两个咖啡馆的咖啡数据库以及与每个咖啡馆相关的数据和/或信息(例如,第一特征数据、第二特征数据)。
存储模块440可以被配置为用于存储POI的第一特征数据、第二特征数据和匹配的目标索引标签以形成数据库。存储模块440可以使用存储模型存储POI的第一特征数据、第二特征数据和匹配的目标索引标签。例如,如果存储模块440使用MySQL存储POI的第一特征数据、第二特征数据和匹配的目标索引标签,则处理引擎112可以使用闭包表模型来存储数据。
处理引擎112中的模块可以通过有线连接或无线连接以互相连接或互相通讯。有线连接可以包括金属线缆,光缆,混合电缆等或其任意组合。无线连接可以包括局域网络(LAN)、广域网路(WAN)、蓝牙、ZigBee网络、近场通讯(NFC)等或上述举例的任意组合。两个或更多个模块可以合并成单个模块,且任何一个模块可以被分成两个或更多个单元。例如,获取模块410和存储模块440可以组合为单个模块,其可以获取并存储特征数据和匹配的目标索引标签。又例如,处理引擎112可包括用于存储用于确定索引标签的数据和/或信息的存储模块(未示出)。
图5是根据本申请的一些实施例所示的用于构建数据库的示例性过程的流程图。过程500可以由线上至线下服务系统100执行。例如,过程500可以实现为存储在存储ROM230或RAM 240中的一组指令(例如,应用程序)。处理器220可以执行该组指令,并且当执行指令时,可以将其配置为执行过程500。以下呈现的所示过程的操作旨在是说明性的。在一些实施例中,过程500可以通过未描述的一个或多个以上附加操作和/或没有所讨论的操作的一个或以上来完成。另外,如图5中所示和下面描述的过程的操作的顺序不旨在是限制性的。
在510中,处理引擎112(例如,处理器220,获取模块410)可以从第一线上至线下服务平台获取兴趣点POI的第一特征数据。所述POI可以是餐馆、高级时装店、酒店、观景点、娱乐场所(例如,KTV、电影院等)、健身中心、美容院、艺术画廊、超市、咖啡馆、购物中心、游乐中心等。如本文所使用的,特定POI的第一特征数据可以由特定POI的特性来定义,该特性可以用于识别特定POI或将所述特定POI与其他POI或其他类型的POI进行区分。所述POI的第一特征数据可以包括POI的地址、POI的名称、POI的坐标、POI的标签、POI的类型、与所述POI相关联的电话号码等或其任何组合。例如,第一POI可以是“星巴克”,第二POI可以是“麦当劳”。可以使用第一POI“星巴克”的名称和第二POI“麦当劳”的名称区分第一POI和第二POI。第一POI“星巴克”的类型是咖啡店(或咖啡馆),且第一POI“星巴克”的标签是“咖啡”。第二POI“麦当劳”的类型是餐馆,第二POI“麦当劳”的标签是“西餐”。第一POI“星巴克”的类型或标签以及第二POI“麦当劳”的类型或标签可用于将第一POI与第二POI区分开。
第一线上至线下服务服务平台可以被配置为提供第一线上至线下服务。示例性线上至线下服务可以包括运输服务、购物服务、餐饮预订服务、地图服务、导航服务、评价服务、旅行服务、社交服务、餐饮预订、在线购物等。在一些实施例中,第一线上至线下服务平台可以是在线导航和/或地图平台等。示例性在线导航和/或地图平台可以包括谷歌地图、百度地图、高德地图、苹果地图、北斗导航卫星系统、腾讯地图、搜狗地图、凯立德地图(Careland Mape)、GPS导航和地图等。导航和/或地图平台可以提供多个POI相关的信息和/或数据,例如坐标、地址、名称等。在一些实施例中,第一线上至线下服务平台可以是在线评价平台等。示例性在线评价平台可以包括美团、大众点评、口碑、ENJOY、YHOUSE、MARS、携程、Lvmama等。在线评价平台可以提供与多个POI相关的信息和/或数据,例如地址、姓名、电话号码、类型、标签等。
在一些实施例中,处理引擎112(例如,处理器220、获取模块410)可以使用网络爬虫技术经由网络(例如,网络120)从第一线上至线下服务平台获取第一特征数据。示例性网络爬虫技术可以包括通用网络爬虫技术、聚焦网络爬虫技术、增量网络爬虫技术、深度网络爬虫技术等。网络爬虫技术可以使用,例如超文本预处理器(PHP)(例如,Phpspider,Beanbun,PHPCrawl等)、Python(例如,Crawley,Scrapy,Portia,PySpider等)、Java(例如,Apache Nutch2,Crawler4j,WebMagic,WebCollector,Heritrix,Spiderman,SeimiCrawler,Jsoup等)、C#(例如,DotnetSpider,NWebCrawler,SmartSpider,Abot,XNET,AngleSharp,HtmlAgilityPack,CSQuery等)、C/C++(例如,开源搜索引擎、Cobweb,Opton,Wombat,Spidr,Larbin等)等开发。处理引擎112可以基于抓取策略,使用Web爬虫技术,从第一线上至线下服务平台获取第一特征数据。示例性抓取策略可以包括深度优先遍历策略、广度优先遍历策略、非完全页面序列策略、后向链路数策略、OPIC策略、大站链路优先遍历策略等。例如,处理引擎112可以使用Python网络爬虫通过第一线上至线下服务平台提供的应用程序编程接口(API)获取所述POI的第一特征数据。API可以包括至少两个预定义的功能,这些功能可以用于基于一段软件或硬件访问一组例程。处理引擎112(例如,处理器220、获取模块410)可以根据不同平台设置不同的API访问参数来获取至少两个POI。与POI有关的数据或信息(例如,POI的第一特征数据)可以以特定格式保存,例如Json、XML等。在进一步处理之后,POI可以保存在数据库(例如,MySQL、MongoDB、Oracle等)中。
在520中,处理引擎112(例如,处理器220、获取模块410)可以从第二在线服务平台获取所述POI的第二特征数据。如本文所使用的,所述POI的第二特征数据可以通过POI的评估或评价来定义。所述POI的评估涉及人均消费、环境、折扣、交通、位置、POI提供的产品/服务等。例如,如果所述POI是餐馆,则所述POI的评估涉及人均消费金额、提供菜肴的速度、菜肴的类型、菜肴的口味、美食材料是否新鲜、菜肴是否美味、餐厅是否方便停车、餐厅是否干净整洁、服务员是否礼貌、是否有折扣活动等。又如,如果所述POI是旅游景点,所述POI的评估涉及人均消费金额、交通是否便利、环境是否卫生、服务是否良好、旅游景点是否拥挤、旅游景点是否令人印象深刻、停车是否方便等。在一些实施例中,POI的评估可以由至少一个用户(例如,消费者)由第二线上至线下服务平台生成。
在一些实施例中,所述POI的第二特征数据可以包括所述POI的评价分数、所述POI的评价总次数、所述POI的消费总次数、所述POI的正反馈率、负反馈率、投诉等或其任何组合。第二线上至线下服务平台可以用于提供第二线上至线下服务。示例性线上至线下服务可以包括运输服务、购物服务、餐饮预订服务、地图服务、导航服务、评价服务、旅行服务、住宿服务等如本文其他地方所述申请。在一些实施例中,第二线上至线下服务平台可以是在线评价和/或交易平台。例如,在线评价和/或交易平台可以包括“美团”、“大众点评”、“口碑”、“ENJOY”、“YHOUSE”、“MARS”、“Ctrip”、“Lvmama”等。在线评价和/或交易平台可以提供与多个POI相关的信息和/或数据,例如评价、折扣、与POI相关联的电话号码、地址、姓名等。例如,“大众点评”可以提供本地商业搜索、评价、详细商业信息、折扣、团购和其他商家服务。在一些实施例中,第一线上至线下服务平台可以与第二线上至线下服务平台相同。例如,第一线上至线下服务平台和第二在线平台可以是评价平台,例如“大众点评”。又例如,第一在线平台可以是导航和/或地图平台,例如百度地图,并且第二线上至线下服务平台可以是评价平台,例如“大众点评”。
在一些实施例中,处理引擎112(例如,处理器220、获取模块410)可以使用本申请其他地方描述的网络爬虫技术经由网络(例如,网络120)从第二线上至线下服务平台获取所述第二特征数据。例如,网络爬虫技术可以包括通用网络爬虫技术、聚焦网络爬虫技术、增量网络爬虫技术、深度网络爬虫技术等。网络爬虫技术可以使用,例如超文本预处理器(PHP)(例如,Phpspider,Beanbun,PHPCrawl等)、Python(例如,Crawley,Scrapy,Portia,PySpider等)、Java(例如,Apache Nutch2,Crawler4j,WebMagic,WebCollector,Heritrix,Spiderman,SeimiCrawler,Jsoup等)、C#(例如,DotnetSpider,NWebCrawler,SmartSpider,Abot,XNET,AngleSharp,HtmlAgilityPack,CSQuery等)、C/C++(例如,开源搜索引擎、Cobweb,Opton,Wombat,Spidr,Larbin等)等开发。在一些实施例中,处理引擎112可以经由使用Python Web爬虫的第二线上至线下服务平台提供的应用编程接口(API)来获取POI的第二特征数据。可以将与POI有关的数据或信息(例如,POI的第二特征数据)保存为特定格式,例如Json、XML等。在进一步处理之后,POI可以保存在数据库(例如,MySQL、MongoDB、Oracle等)中。
在530中,处理引擎112(或确定模块420)可以确定至少一组索引标签。所述至少一组索引标签中的每组索引标签可以包括至少两个级别。所述至少两个级别中的每个级别可包括至少一个索引标签。索引标签可以用于表示POI的特性,例如POI的类型、POI的标签等。例如,索引标签可以包括美食“美食”、“运动”、“购物”、“电影”、“酒店”、“旅游”、“美容”等。每个组中较高级别的索引标签可以比较低级别的索引标签具有更高的搜索优先级。例如,一组索引标签中的第一索引标签可以是“美食”,第二索引标签可以是“快餐”、或“中餐美食”、或“咖啡”、或“烧烤”或类似的。第一索引标签“美食”比第二索引标签“快餐”、或“中餐美食”、或“咖啡”、或“烧烤”等具有更高的级别。又例如,另一组索引标签中的第一索引标签可以是“旅游”,第二索引可以是“展览”、“景点”、“动物园”等,第一索引标签“旅游”比第二索引标签“展览”、“景点”、“动物园”具有更高的级别。具有相同索引标签的一个以上POI可具有相似或相同的特征。例如,“麦当劳”和“肯德基(KFC)”可以具有相同的索引标签“快餐”。“星巴克”可以具有与“麦当劳”不同的索引标签“咖啡”。
在一些实施例中,用户可以经由客户端终端(例如,客户端140)设置具有不同级别的一组索引标签。在一些实施例中,处理引擎112(或确定模块420)可以从第一线上至线下服务平台,第二线上至线下服务平台或任何其他在线服务平台获取所述至少一组索引标签。在一些实施例中,处理引擎112(或确定模块420)可以基于POI的特征数据(例如,第一特征数据)确定一组索引标签。例如,POI的第一特征数据可以包括POI的至少一个类型或标签。处理引擎112可以将POI的类型或标签指定为索引标签的一个或以上级别。作为另一示例,从第一线上至线下服务平台获取的POI“重庆火锅”的类型或标签可以是美食“美食”和“火锅”。处理引擎112可以指定“美食”作为最高级别的索引标签(例如,如图8中所示的第一级别),并且将“火锅”指定为最高级别的索引标签“美食”的二级索引标签(例如,如图8中所示的第二级别)。
在540中,处理引擎112(例如,匹配模块430)可以基于所述POI的第一特征数据,将所述POI与来自至少一组索引标签的至少一个目标索引标签相匹配。在一些实施例中,处理引擎112可以通过将所述POI与所述至少两组索引标签中具有相同级别的索引标签进行比较来确定所述POI属于的目标组。例如,所述至少两组索引标签中的具有相同级别的索引标签可以具有最高级别(例如,如图8所示的第一级别)。然后,处理引擎112可以基于比较来确定目标组。例如,处理引擎112可以确定所述POI的第一特征数据与至少两组索引标签中具有相同级别的索引标签之间的相似性。处理引擎112可以确定与所述POI的第一特征数据具有最大相似性的索引标签所在的组为目标组。如本文所使用的,所述POI的第一特征数据与索引标签之间的相似性可以由POI的第一特征数据与索引标签之间的距离来定义。用于表示相似性的示例性距离可以包括Minkowski距离、欧几里德距离、曼哈顿距离、切比雪夫距离等。
在一些实施例中,处理引擎112可以进一步将所述POI与目标组中不同级别的至少一个索引标签进行比较。例如,处理引擎112可以将所述POI与目标组中的每个索引标签按照最高级别到最低级别进行比较。如果所述POI与当前级别中的目标索引标签的相似度满足条件,则处理引擎112可以确定所述POI和当前级别中的目标索引标签匹配。然后,处理引擎112可以将POI与目标索引标签的下一级别中的其他索引标签进行比较,直到POI与最低级别中的目标索引标签匹配。如果当前级别中所述POI与目标索引标签之间的相似度超过阈值,则处理引擎112可以确定所述POI与当前级别中的目标索引标签之间的相似性满足条件。在一些实施方案中,所述条件可以针对不同级别而不同。例如,级别越高,阈值可以越小。在一些实施例中,处理引擎112可以直接确定所述POI与目标组中的每个最低级别的索引标签之间的相似性。处理引擎112可以确定与所述POI具有最大相似性的索引标签为目标索引标签。
以POI“Peter's West Restaurant”为例。“Peter's West Restaurant”的标签可以是“美食”或“西餐”。如图8所示,处理引擎112可以基于POI名称、POI的标签等确定POI的目标组是“美食”。然后,如图8所示,处理引擎112可以将POI与目标组“美食”中的第二级别的索引标签“西餐”匹配,“西餐”为第二级别中的目标索引标签。目标索引标签“西餐”没有下一级索引标签。换句话说,目标索引标签“西餐”是目标组“美食”中的一个最低级别索引标签。然后,处理引擎112可以将POI与对应于最低索引标签“西餐”的“西餐数据库”进行匹配。
以POI“重庆火锅”为又一示例。“重庆火锅”的标签可以是“美食”或“火锅”。如图8所示,处理引擎112可以基于POI的名称、POI的标签等确定POI的目标组是“美食”。然后,处理引擎112可以将POI与目标组“美食”中第二级别的索引标签“中餐”匹配,“中餐”为所述第二级别中的目标索引标签。目标索引标签“中餐”可以具有下一级(即,第三级)的索引标签。处理引擎112可以将POI与第三级别的索引标签“火锅”进行匹配,“火锅”为第三级别的目标索引标签。目标索引标签“火锅”没有下一级别的索引标签。换句话说,目标索引标签“火锅”是目标组“美食”中的一个最低级别索引标签。然后,处理引擎112可以将POI与对应于最低索引标签“火锅”的“火锅数据库”进行匹配。关于POI与至少一组的目标索引标签匹配的更多描述标签可以在本申请的其他地方找到。参见例如图7及其相关描述。
在550中,处理引擎112(例如,存储模块440)可以存储所述POI的第一特征数据、第二特征数据和匹配的目标索引标签以形成数据库。处理引擎112(例如,存储模块440)可以使用存储模型来存储所述POI的第一特征数据、第二特征数据和匹配的目标索引标签。示例性数据存储模型可以包括邻接表模型、路径枚举模型、闭包表模型、嵌套集模型等。例如,如果处理引擎112利用MySQL存储所述POI的第一特征数据、第二特征数据和匹配目标索引标签,则处理引擎112可以使用闭包表模型来存储数据。在一些实施例中,处理引擎112可以根据操作510至540将至少两个POI与对应的目标索引标签相匹配,以形成对应于目标索引标签的多个数据库。例如,如果最低级别中的目标索引标签是“咖啡”,则处理引擎112可以形成包括至少两个咖啡馆的咖啡数据库以及与所述至少两个咖啡馆中的每个咖啡馆相关的数据和/或信息(例如,第一特征数据、第二特征数据等)。例如图9所示,最低级别的目标索引标签是“足部按摩”,处理引擎112可以形成“足部按摩数据库”,其可以包括至少两个足部按摩店以及与至少两个足部按摩店中的每个店相关的数据和/或信息(例如,第一特征数据、第二特征数据等)。
在一些实施例中,用户界面(例如,在线服务平台)可以接收用户通过,例如用户界面屏幕输入的POI查询。例如,目标POI的查询可以是“具有最近距离的咖啡馆”。客户终端可以经由用户界面向服务器110发送包括关于POI查询的信号。响应于用户界面接收来自客户终端(例如,线上至线下服务平台)的信号,处理引擎112可以从如本申请中的其他地方所述的服务器110构建的数据库中检索和/或确定至少一个候选POI。服务器110还可以经由用户界面向客户端140推荐至少一个候选POI。
应当注意的是,流程图是出于说明的目的而提供的,并非旨在限制本申请的范围。对于具有本领域普通技能的人,可以根据本申请减少多变化与修改。然而,变形和修改不会背离本申请的范围。例如,处理引擎112可以在操作510和/或520之前执行操作530。
图6是根据本申请的一些实施例所示的用于向客户终端推荐POI的示例性过程的流程图。过程600可以通过线上至线下在线上至线下系统100来执行。例如,过程600可以实现为存储在ROM230或RAM 240中的一组指令(例如,应用程序)。处理器220可以执行指令,且当执行指令时,处理器220可以用于为执行处理600。以下呈现的所示过程的操作旨在是说明性的。在一些实施例中,过程600可以通过未描述的一个或多个以上附加操作和/或没有一个或以上所讨论的操作来完成。另外,如图6所示和下面描述的过程的操作的顺序不旨在是限制性的。
在过程610中,处理引擎112(例如,匹配模块430)可以获取用户通过客户端终端指定的POI查询。在一些实施例中,用户可以经由在客户端(例如,客户端140)上实现的用户界面(例如,在线服务平台)输入POI查询。用户经由客户端指定的查询可以是文本、语音、图像等形式。例如,POI查询可以是一系列数字、单词、短语、句子等或其任何组合。在一些实施例中,POI查询可以是显性的(也称为显性需求)。如本文所使用的,显性需求可以表示指定目标POI的查询。例如,“汉堡王”查询可以显性需求,指定目标POI是“汉堡王”。在一些实施例中,POI查询可以是模糊的(也被称为泛性需求)。如本文所使用的,泛性需求可以指未指定目标POI的查询。例如,“美味餐厅”的查询可以是泛性需求,未指定具体的POI。
在过程620中,处理引擎112(例如,匹配模块430)可以从数据库中检索与至少一个候选POI相关的数据,所述至少一个候选POI与所述查询匹配。在一些实施例中,处理引擎112可以处理所述POI查询以从所述查询中提取至少一个关键字。例如,如果所述查询是语音形式,则处理引擎112可以将所述查询转换为文本形式。又例如,处理引擎112可以对所述查询执行分词操作,以提取至少一个关键字。分词操作可以由处理引擎112使用分词算法来执行。示例性分词算法可以包括TF-IDF(术语频率-逆文档频率)算法、KEA算法、RAKE算法、TextRank算法等。所述关键字可以用于表示所述POI查询的语义。例如,如果所述POI查询是“人均消费约100元人民币且5公里以内的湖南餐厅,”。处理引擎112可以确定查询“人均消费约100元人民币且5公里以内的湖南餐厅,”的关键字是“湖南餐厅”、“人均消费100元人民币”及“5公里”。
在一些实施例中,处理引擎112(例如,匹配模块430)可以搜索数据库以使一个或以上候选POI与所获取的查询相关联的关键字匹配。所述数据库可以包括至少两组的索引标签。每组索引标签可以包括至少两个级别的索引标签。每组索引标签中的最低级别可以对应于至少一个POI。所述数据库可以存储一个或以上POI的数据和/或信息(例如,如图5中所描述的第一特征数据和第二特征数据)。处理引擎112可以基于从查询中提取的关键字的一部分来确定目标索引标签。然后,处理引擎112可以获取与目标索引标签相对应的至少一个候选POI的数据和/或信息。至少一个候选POI相关联的数据和/或信息可包括第一特征数据(例如,POI的名称、POI的坐标、POI的地址、POI的电话号码等)和第二特征数据(例如,POI的评价分数、POI的消费总次数、或POI的评价总次数等)等或其任何组合。此外,处理引擎112可以基于与所述POI查询相关联的关键字的一部分以及与目标索引标签相对应的至少一个POI的数据和/或信息来确定至少一个候选POI。例如,POI查询可以是“人均消费约100元人民币且在5公里内的湖南餐馆”。“人均消费约100元人民币且在5公里内的湖南餐馆”的关键字为“湖南餐厅”、“人均消费100元人民币”及“5公里”。处理引擎112可以确定目标索引标签可以是“湘菜”。引擎112可以确定与目标索引标签“湘菜”相关联的至少两个POI。处理引擎112还可以基于关键词“人均消费100元人民币”和“5公里”来确定所述至少两个POI的至少一个候选POI。
在一些实施例中,处理引擎112可以通过将关键字与至少两组索引标签中具有相同级别的索引标签进行比较来确定目标组。例如,在至少两组的索引标签中的具有相同级别的索引标签可以具有最高级别。然后,处理引擎112可以基于比较来确定目标组。例如,处理引擎112可以确定至少两组索引标签中的具有相同级别的索引标签与关键字之间的相似性。处理引擎112可以确定与关键字具有最大相似性的索引标签所在的组为目标组。
在一些实施例中,处理引擎112可以进一步将关键字与目标组中的至少一个索引标签进行比较。例如,处理引擎112可以将关键字与目标组中的每个索引标签从最高级别到最低级别进行比较。如果POI与当前级别中的索引标签的相似度满足条件,则处理引擎112可以确定当前级别中索引标签和的关键字(即,查询)是匹配的。在一些实施例中,如果关键字和索引标签之间的相似性超过阈值,则处理引擎112可以确定关键字和索引标签之间的相似性满足条件。然后,处理引擎112可以将关键字与当前级别的下一级别中的其他索引标签进行比较,直到POI与最低级别中的索引标签匹配。
又例如,处理引擎112可以直接确定关键字与目标组中的每个索引标签之间的相似性。处理引擎112可以确定与关键字具有最大相似性的索引标签为目标标签。例如,如果关键字是“西餐厅”,则处理引擎112可以基于关键字“西餐厅”确定目标组是“美食”。然后处理引擎112可以将查询与如图8所示的目标组“美食”中的索引标签,例如,“西餐”、“咖啡”、“中餐”、“川菜”、“上海菜”、“火锅”等进行比较。。处理引擎112可以将POI“西餐厅”与“西餐”相匹配。
在过程630中,处理引擎112(例如,匹配模块430)可以基于检索到的与所述至少一个候选POI相关联的数据向用户推荐所述至少一个候选POI中的至少一个。在一些实施例中,处理引擎112(例如,匹配模块430)可以将所有的至少一个候选POI推荐给客户端。在一些实施例中,处理引擎112(例如,匹配模块430)可以根据线上至线下系统100的默认设置来推荐至少一个候选POI的一部分。例如,处理引擎112可以根据,例如至少一个候选POI中的每个候选POI的第二特征数据(例如,人均消费、评价分数等)、第一特征数据(例如,位置)等或其组合对所述至少一个候选POI进行排序。在一些实施例中,处理引擎112可以将排序中的前几名(例如,前三个、前四个、前五个等)或后几名(例如,后三个、后两个、后一个等)推荐给客户终端。
在一些实施例中,处理引擎112(例如,匹配模块430)可以基于与用户相关联的历史数据向用户推荐至少一个候选POI中的至少一个。处理引擎112(例如,匹配模块430)可以从客户终端获取与用户相关联的历史数据。与用户相关联的历史数据可以包括一段时间内的至少两个历史搜索记录、在线服务的历史订单等。所述时间段可以是过去一周、过去一个月、过去三个月、过去六个月等。与用户相关联的历史数据可以用于确定用户的偏好,例如,品味、位置、爱好等。
在一些实施例中,处理引擎112(例如,匹配模块430)可以以不同形式向用户推荐所述至少一个候选POI。所述候选POI可以以诸如文本、数字、符号、图像、图表等或其任何组合的形式呈现。例如,可以使用文本和数字来描述候选POI。符号可以表示客户满意度,例如心形符号或笑脸符号。图像可以可视化候选POI及周围其他POI。图表可用于提供候选POI的评价分数、候选POI的评价总次数、候选POI的消费总次数等或其任何组合的比较。
在一些实施例中,处理引擎112(例如,匹配模块430)可以向客户端发送信号。信号可以包括至少一个候选POI以及候选POI的数据和/或信息。该信号可以进一步用于使客户终端向用户显示候选POI。例如,该信号可以用于使得客户终端在由在线服务平台(例如,地图平台)提供的地图上显示候选POI。
应当注意的是,上述流程图仅出于说明性目的而提供,并不旨在限制本申请的保护范围。对于本领域的普通技术人员来说,可以在本申请的指导下进行多种变化和修改。然而,这些变化和修改并不背离本申请的保护范围。例如,过程600还可以包括存储用户指定的查询。
图7是根据本申请的一些实施例所示的用于确定目标索引标签的示例性过程的流程图。过程700可以由线上至线下在线上至线下系统100来执行。例如,过程700可以实现为存储在存储ROM230或RAM 240中的一组指令(例如,应用程序)。处理器220可以执行该组指令,且当执行指令时,处理器220可以用于为执行过程700。以下呈现的所示过程的操作旨在是说明性的。在一些实施例中,过程700可以通过未描述的一个或多个以上附加操作和/或没有所讨论的操作的一个或以上来完成。另外,如图7中所示和下面描述的过程的操作的顺序不旨在是限制性的。可以根据如图7所示的过程700来执行操作540和/或620。
在702中,处理引擎112(例如,匹配模块430)可以从第一组索引标签获取第一索引标签。在一些实施例中,第一索引标签可以对应于第一组索引标签中的最高级别索引标签。如图8所示,最高级别索引标签可以是“娱乐”、“美食”、“运动”、“购物”、“电影”、“酒店”、“旅游”、“美容”等。
在704中,处理引擎112(例如,匹配模块430)可以确定所述POI或POI查询与第一索引标签之间的相似性。在一些实施例中,可以参考图5描述的POI的第一特征数据来确定所述POI与第一索引标签之间的相似性。所述POI和第一索引标签之间的相似性可以由所述第一特征数据与第一索引标签之间的距离来定义。所述第一特征数据和第一索引标签之间的距离越大,所述POI和第一索引标签之间的相似性越高。在一些实施例中,可以参考图6所描述的基于所述POI查询来确定所述POI查询和第一索引标签之间的相似性。例如,处理引擎112可以从客户端140接收POI的查询。处理引擎112可以从查询中提取至少一个关键字,并确定所述至少一个关键字与第一索引标签之间的相似性。所述至少一个关键字和第一索引标签之间的相似性可以由所述至少一个关键字与第一索引标签之间的距离来定义。所述至少一个关键字和第一索引标签之间的距离越大,所述查询和第一索引标签之间的相似性可能越高。在一些实施例中,相似性可以由系数表示。系数可以是百分比,例如90%、80%、70%、50%、40%等。在一些实施例中,可以基于POI和第一索引标签之间的距离,通过程度副词来描述相似性。例如,副词可以包括相当、比较、十分、非常、太多、太、很、几乎、差不多、一半地、高度地、非常地、部分地、大约地、完全地等等。
在706中,处理引擎112(例如,匹配模块430)可以确定所述POI或POI查询与第一索引标签之间的相似性是否满足第一条件。所述第一条件可以用于确定所述POI(或POI查询)是否与目标组匹配。在一些实施例中,如果所述POI(或POI查询)与第一索引标签之间的相似性满足第一条件,则处理引擎112可以进行到操作710。如果所述POI(或POI查询)与第一索引标签之间的相似性不满足所述第一条件,则处理引擎112可以进行到操作708。
在一些实施例中,所述第一条件可以是第一阈值、第一范围等。如果所述POI(或POI查询)与第一索引标签之间的相似度超过第一阈值,则处理引擎112可以确定所述POI(或POI查询)与第一索引标签之间的相似性不满足第一条件。换句话说,第一索引标签与所述POI(或POI查询)不匹配。如果所述POI(或POI查询)与第一索引标签之间的相似度超过第一阈值,则处理引擎112可以确定所述POI(或POI查询)与第一索引标签之间的相似性满足第一条件。换句话说,第一索引标签与所述POI(或POI查询)匹配。在一些实施例中,第一条件与所述POI(或POI查询)与第一索引标签之间的最大相似性有关。如果所述POI(或POI查询)与第一索引标签之间的相似性最大,则处理引擎112可以确定具有最大相似性的第一索引标签与所述POI(或POI查询)之间的相似性满足第一条件。如果第一索引标签与所述POI(或POI查询)之间的相似性不是最大的,则处理引擎112可以确定第一索引标签的POI之间的相似性不满足第一条件。所述第一条件可以由处理引擎112或用户预先确定。例如,处理引擎112可以根据索引标签的不同级别设置所述第一条件。例如,一组中的索引标签的级别越高,第一阈值可以越低。一组中的索引标签的级别越低,第一阈值可以越大。在一些实施例中,可以调整所述第一条件。例如,如果处理引擎112确定不存在第一索引标签与所述POI(或POI查询)匹配,则处理引擎112可以减小第一阈值。如果处理引擎112确定存在多于两个的第一索引标签与所述POI(或POI查询)匹配,则处理引擎112可以增大第一阈值。
在708中,处理引擎112(例如,匹配模块430)可以使用第二组索引标签来更新所述第一组索引标签。在一些实施例中,如果所述POI(或POI查询)与第一索引标签之间的相似性不满足所述第一条件,则所述POI(或POI查询)与第一组索引标签中的第一索引标签不匹配(例如,如在图8中所示的“娱乐”)。换句话说,所述POI(或POI查询)不属于第一组索引标签。然后,处理引擎112(例如,匹配模块430)可以继续确定所述POI(或POI查询)是否与第二组索引标签(例如,如图8中所示的“美食”)、第三组索引标签(例如,如图8所示的“运动”)等匹配。当第一条件被满足时,处理引擎112(例如,匹配模块430)可以确定当前组索引标签为目标组索引标签。
在710中,处理引擎112(例如,匹配模块430)可以用所述第一组索引标签的第二索引标签更新所述第一索引标签。所述第二索引标签可以是所述第一索引标签的下级标签。例如,如果所述第一索引标签对应于最高级别(即,如图8所示的第一级别),则所述第二索引标签可以对应于第二级别。作为另一示例,如果所述第一索引标签是“美食”,则所述第二索引标签可以是“西餐”、“咖啡”、“中餐”、“烧烤”等其中一个。在一些实施例中,第二索引标签也可以被称为第一索引标签的子索引标签。
在712中,处理引擎112(例如,匹配模块430)可以确定所述POI(或POI查询)与第二索引标签之间的相似性是否满足第二条件。在一些实施例中,如果所述POI(或POI查询)与第二索引标签之间的相似性满足第二条件,则处理引擎112可以执行操作714。如果所述POI(或POI查询)与第二级索引标签之间的相似性不满足第二条件,则处理引擎112可以继续执行710。
在一些实施例中,第二条件可以是第二阈值、第二范围等。如果所述POI(或POI查询)与第二索引标签之间的相似度超过第二阈值,则处理引擎112可以确定所述POI(或POI查询)与第二索引标签之间的相似性不满足第二条件。换句话说,第二索引标签与所述POI(或POI查询)不匹配。如果所述POI(或POI查询)与第二索引标签之间的相似度超过第二阈值,则处理引擎112可以确定所述POI(或POI查询)与第二索引标签之间的相似性满足第二条件。换句话说,所述POI(或POI查询)与第二索引标签匹配。
在一些实施例中,第二阈值可以高于第一阈值。例如,如果相似度表示为百分比,则50%相似度及以上可以满足第一条件,80%及以上相似度可以满足第二条件。在一些实施例中,可以通过线上至线下系统100来调整第二条件。例如,如果处理引擎112确定不存在第二索引标签与所述POI(或POI查询)匹配,则处理引擎112可以减小第二阈值。如果处理引擎112确定存在多于两个第二索引标签与所述POI(或POI查询)匹配,则处理引擎112可以增大第二阈值。
在714中,处理引擎112(例如,匹配模块430)可以将第二索引标签与所述POI(或POI查询)匹配。在一些实施例中,如果所述POI(或POI查询)与第二索引标签之间的相似性满足第二条件,则所述POI(或POI查询)可以属于第二索引标签或与第二索引标签匹配。例如,如果所述POI(或POI查询)关于“咖啡馆”,则所述POI可以与第二索引标签“咖啡”匹配。
上述应当注意流程图是出于说明的目的而提供的,并非旨在限制本申请的范围。对于具有本领域普通技能的人,可以根据本申请减少多变化与修改。然而,变形和修改不会背离本申请的范围。过程700还可以包括获取与关于POI的查询匹配的至少一个候选POI。
实例1
图8是根据本申请的一些实施例所示的数据库系统的示例性结构的示意图。如图8所示,数据库系统可以具有金字塔分层结构。金字塔分层结构可包括至少两组索引标签,例如“娱乐”、“美食”、“运动”、“购物”、“电影”、“酒店”、“旅游”、“美容”等。所述至少两组索引标签中每组索引标签可以被分类为至少一个级别,诸如第一级别、第二级别、第三级别等。第一级别也可以被称为最高级别。每组索引标签可具有最低级别的索引标签。例如,“美食”组中索引标签的最低级别可以包括“咖啡”、“烧烤”、“西餐”、“上海菜”、“川菜”、“粤菜”等。“旅游”组中的最低级别索引标签为“动物园”、“展览”、“景点”等。最低级别的索引标签中的每个索引标签可以对应于数据库,该数据库可以存储与每个最低级别的索引标签匹配的至少一个POI的数据和/或信息(例如,第一特征、第二特征数据等)。
实例2
图9是根据本申请的一些实施例所示的示例性数据库的示意图。如图9所示,与“足底按摩”有关的数据库可包括至少两个POI,例如汤泉良子(金源店)、VICI LAN SPA&LANMASSAGE SALON、菊SPA等。与“足底按摩”有关的数据库可以包括与至少两个POI中的每个POI有关的数据和/或信息,例如每个POI的名称、地址、标签、分数、消费总次数、评价总次数等。
上文已对基本概念做了描述,显然,对于已阅读此详细揭露的本领域的普通技术人员来讲,上述详细揭露仅作为示例,而并不构成对本申请的限制。虽然此处并没有明确说明,本领域技术人员可以对本申请进行各种修改、改进和修正。这类修改、改进和修正在本申请中被建议,所以所述修改、改进、修正仍属本申请示范实施例的精神和范围。
同时,本申请使用了特定术语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关之某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提到的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域的普通技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改良。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可以被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可以表现为位于一个或多个计算机可读介质中的计算机产品,所述产品包括计算机可读程序编码。
计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等等、或合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质、或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动装置上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
本文引用的每个专利、专利申请、专利申请的出版物和其他材料,例如文章、书籍、说明书、出版物、文献、物品和/或类似物,在此通过引用并入本文。其全部用于所有目的,除了与其相关的任何起诉文件历史,与本文件不一致或相冲突的任何相同或任何可能对现在的权利要求的最广泛范围具有限制性影响的任何相同的起诉文件历史。作为示例,如果与任何所结合的材料相关联的术语的描述、定义和/或使用与本文档相关联的术语、描述、定义和描述之间存在任何不一致或冲突。和/或以本文件中的术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不限于明确介绍和描述的实施例。
Claims (16)
1.一种数据库构建方法,包括:
从第一在线平台获取兴趣点POI的第一特征数据;
从第二在线平台获取所述兴趣点POI的第二特征数据;
确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括至少两个级别,所述至少两个级别中的每个级别包括至少一个索引标签;
基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配;以及
存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。
2.根据权利要求1所述的方法,其特征在于,所述POI的所述第一特征数据包括所述兴趣点POI的地址、所述兴趣点POI的名称、所述兴趣点POI的坐标、所述兴趣点POI的标签,或所述兴趣点POI的类型中的至少一个。
3.根据权利要求1或2所述的方法,其特征在于,所述兴趣点POI的所述第二特征数据包括所述兴趣点POI的评价分数、所述兴趣点POI的消费总次数,或所述兴趣点POI的评价总次数中的至少一个。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述第一在线平台用于提供地图服务。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述第二在线平台用于提供评价服务。
6.根据权利要求1至5中任意一项所述的方法,其特征在于:
使用Python技术从所述第二在线平台获取所述兴趣点POI的所述第二特征数据。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,基于所述兴趣点POI的所述第一特征数据将所述兴趣点POI与所述至少一组索引标签中的目标索引标签进行匹配包括:
将所述兴趣点POI与所述至少一组索引标签中的其中一组索引标签的至少部分索引标签从最高级别到最低级别进行比较;以及
基于所述比较确定所述目标索引标签。
8.根据权利要求7所述的方法,其特征在于,将所述兴趣点POI与至少一组索引标签中的其中一组的至少部分索引标签进行比较包括:
确定所述兴趣点POI与所述至少一组索引标签的其中一组中的至少部分索引标签之间的相似度;以及
确定所述目标索引标签,所述目标索引标签与所述兴趣点POI的相似度满足条件。
9.根据权利要求1至8中任意一项所述的方法,其特征在于,所述方法还包括:
获取用户通过客户端指定的兴趣点POI的查询;
从所述数据库中检索与所述查询匹配的至少一个候选兴趣点POI相关联的数据;以及
基于与所述至少一个候选兴趣点POI相关联的所述检索数据,向所述用户推荐所述至少一个候选兴趣点POI中的至少一个。
10.根据权利要求9所述的方法,其特征在于,基于与所述至少一个候选兴趣点POI相关联的所述检索数据向所述用户推荐所述至少一个候选兴趣点POI中的至少一个包括:
从所述客户端获取与所述用户相关联的历史数据;以及
基于与所述至少一个候选兴趣点POI相关联的所述检索数据和与所述用户相关联的所述历史数据,向所述用户推荐所述至少一个候选POI中的至少一个。
11.一种POI查询方法,包括:
获取用户通过客户端指定的兴趣点POI的查询;
从包括至少两个兴趣点POI的数据库中检索与所述查询匹配的至少一个候选POI相关联的数据,其特征在于,所述数据库由以下步骤构建:
确定至少一组索引标签,所述至少一组索引标签中的每组索引标签被包括至少两个级别,所述至少两个级别中的每个级别包括至少一个索引标签;
从第一在线平台获取兴趣点POI的第一特征数据,所述第一特征数据与用于识别所述POI的所述POI的至少一个特征相关联;
从第二在线平台获取所述POI的第二特征数据,所述第二特征数据与所述POI的评估相关联;
基于所述POI的所述第一特征数据,将所述POI与所述至少一组索引标签的目标索引标签相匹配;以及
存储所述POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签;以及
基于与所述至少一个候选POI相关联的所述检索数据,向所述用户推荐所述至少一个候选POI中的至少一个。
12.根据权利要求11所述的方法,其特征在于,所述POI的所述第一特征数据包括所述兴趣点POI的地址、所述兴趣点POI的名称、所述兴趣点POI的坐标、所述兴趣点POI的标签,或所述兴趣点POI的类型中的至少一个。
13.根据权利要求11或12所述的方法,其特征在于,所述兴趣点POI的所述第二特征数据包括所述兴趣点POI的评价分数、所述兴趣点POI的消费总次数,或所述兴趣点POI的评价总次数中的至少一个。
14.一种用于处理数据的装置,其特征在于,包括:
至少一个处理器以及存储介质,
所述存储介质用于存储计算机指令;
所述至少一个处理器用于执行所述计算机指令以实现如权利要求1-13中任意一项所述的方法。
15.一种计算机可读存储介质,其特征在于所述存储介质存储计算机指令,当所述计算机指令被计算机执行时,计算机运行如权利要求1-13中任意一项所述的方法。
16.一种数据库构建系统,其特征在于,包括:
获取模块用于从第一在线平台获取兴趣点POI的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据;
确定模块用于确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括至少两个级别,所述至少两个级别中的每个级别包括至少一个索引标签;
匹配模块用于基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配;以及
存储模块用于存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811399017.3A CN111209491A (zh) | 2018-11-22 | 2018-11-22 | 用于数据库构建的系统和方法 |
PCT/CN2018/118617 WO2020103183A1 (en) | 2018-11-22 | 2018-11-30 | System and method for constructing database |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811399017.3A CN111209491A (zh) | 2018-11-22 | 2018-11-22 | 用于数据库构建的系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111209491A true CN111209491A (zh) | 2020-05-29 |
Family
ID=70774323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811399017.3A Pending CN111209491A (zh) | 2018-11-22 | 2018-11-22 | 用于数据库构建的系统和方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111209491A (zh) |
WO (1) | WO2020103183A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392086A (zh) * | 2021-05-26 | 2021-09-14 | 上海德衡数据科技有限公司 | 基于物联网的医疗数据库构建方法、装置及设备 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112100496A (zh) * | 2020-09-14 | 2020-12-18 | 北京嘀嘀无限科技发展有限公司 | 一种车型数据标准化匹配方法和系统 |
CN112381603A (zh) * | 2020-11-05 | 2021-02-19 | 深圳创维-Rgb电子有限公司 | 一种电视购物比价处理方法、装置、智能终端及存储介质 |
CN113361920A (zh) * | 2021-06-04 | 2021-09-07 | 上海华客信息科技有限公司 | 酒店服务优化指标推荐方法、系统、设备及存储介质 |
CN113656697B (zh) * | 2021-08-24 | 2023-12-12 | 北京字跳网络技术有限公司 | 对象推荐方法、装置、电子设备、存储介质 |
CN114722787B (zh) * | 2022-04-08 | 2024-02-06 | 平安科技(深圳)有限公司 | 一种基于Excel级联的标签匹配方法、及其相关设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101504290A (zh) * | 2009-03-11 | 2009-08-12 | 凯立德欣技术(深圳)有限公司 | 一种导航系统及其使用的兴趣点周边检索方法 |
US20110113040A1 (en) * | 2009-11-06 | 2011-05-12 | Nokia Corporation | Method and apparatus for preparation of indexing structures for determining similar points-of-interests |
CN102147795A (zh) * | 2010-02-05 | 2011-08-10 | 北京四维图新科技股份有限公司 | 兴趣点检索方法、兴趣点检索装置和导航系统 |
CN102591984A (zh) * | 2012-01-10 | 2012-07-18 | 武汉光庭科技有限公司 | 导航数据中兴趣点数据查询速度的优化方法 |
TW201419231A (zh) * | 2012-11-01 | 2014-05-16 | Univ Nat Cheng Kung | 基於行動定位服務之適地性地標推薦系統 |
CN108763293A (zh) * | 2018-04-17 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于语义理解的兴趣点查询方法、装置和计算机设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009126231A1 (en) * | 2008-04-07 | 2009-10-15 | Telecommunication Systems, Inc | Proximity search for point-of-interest names combining inexact string match with an expanding radius search |
CN103457975B (zh) * | 2012-06-01 | 2016-08-31 | 腾讯科技(深圳)有限公司 | 获取地图兴趣点评价数据的方法和装置 |
KR20160133304A (ko) * | 2015-05-12 | 2016-11-22 | 네이버 주식회사 | 사용자 리뷰 제공 방법, 장치 및 컴퓨터 프로그램 |
-
2018
- 2018-11-22 CN CN201811399017.3A patent/CN111209491A/zh active Pending
- 2018-11-30 WO PCT/CN2018/118617 patent/WO2020103183A1/en active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101504290A (zh) * | 2009-03-11 | 2009-08-12 | 凯立德欣技术(深圳)有限公司 | 一种导航系统及其使用的兴趣点周边检索方法 |
US20110113040A1 (en) * | 2009-11-06 | 2011-05-12 | Nokia Corporation | Method and apparatus for preparation of indexing structures for determining similar points-of-interests |
CN102147795A (zh) * | 2010-02-05 | 2011-08-10 | 北京四维图新科技股份有限公司 | 兴趣点检索方法、兴趣点检索装置和导航系统 |
CN102591984A (zh) * | 2012-01-10 | 2012-07-18 | 武汉光庭科技有限公司 | 导航数据中兴趣点数据查询速度的优化方法 |
TW201419231A (zh) * | 2012-11-01 | 2014-05-16 | Univ Nat Cheng Kung | 基於行動定位服務之適地性地標推薦系統 |
CN108763293A (zh) * | 2018-04-17 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于语义理解的兴趣点查询方法、装置和计算机设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392086A (zh) * | 2021-05-26 | 2021-09-14 | 上海德衡数据科技有限公司 | 基于物联网的医疗数据库构建方法、装置及设备 |
CN113392086B (zh) * | 2021-05-26 | 2022-08-16 | 上海德衡数据科技有限公司 | 基于物联网的医疗数据库构建方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2020103183A1 (en) | 2020-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111209491A (zh) | 用于数据库构建的系统和方法 | |
US11468475B2 (en) | Apparatuses, computer program products, and methods for generation of augmented reality interfaces | |
US20180174205A1 (en) | Systems and methods for recommending merchants to a consumer | |
CN110765368B (zh) | 用于语义检索的人工智能系统和方法 | |
US9110894B2 (en) | Systems and methods for determining related places | |
US10275403B2 (en) | Efficient database searching | |
US20090216563A1 (en) | Electronic profile development, storage, use and systems for taking action based thereon | |
CN108780562B (zh) | 更新服务序列的系统和方法 | |
KR20170066529A (ko) | 자동완성 검색 결과에 대한 시간적 요구를 식별하는 기법 | |
KR20170052667A (ko) | 향상된 검색 질의어 제안 | |
JP2013512501A (ja) | コンテクスト情報を利用するシステム、装置及び方法 | |
US20140108070A1 (en) | Using multi-destination searches to facilitate the purchase of travel itineraries | |
US11315165B2 (en) | Routine item recommendations | |
CN106471499A (zh) | 确定物理位置的方面且/或基于和物理位置有关的计算交互生成关于物理位置的文本概要 | |
US20190019233A1 (en) | Real time recommendation engine | |
CN106030627B (zh) | 真实世界位置的基于位置的评级 | |
US20220101460A1 (en) | Methods and systems for graph-based cross-domain restaurant recommendation | |
JP6906667B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Leung et al. | Do customers share the same perspective? A study on online OTAs ratings versus user ratings of Hong Kong hotels | |
JP2019160320A (ja) | 位置基盤情報探索方法およびシステム | |
CN110785755B (zh) | 用于内容生成的上下文识别 | |
US20140188866A1 (en) | Recommendation engine based on conditioned profiles | |
US11487835B2 (en) | Information processing system, information processing method, and program | |
JP2022009078A (ja) | 情報処理方法、情報処理装置及び情報処理プログラム | |
JP6767465B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200529 |
|
WD01 | Invention patent application deemed withdrawn after publication |