CN107924404A - 消除搜索查询的歧义 - Google Patents

消除搜索查询的歧义 Download PDF

Info

Publication number
CN107924404A
CN107924404A CN201680043993.8A CN201680043993A CN107924404A CN 107924404 A CN107924404 A CN 107924404A CN 201680043993 A CN201680043993 A CN 201680043993A CN 107924404 A CN107924404 A CN 107924404A
Authority
CN
China
Prior art keywords
ride
cluster
inquiry
computing device
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680043993.8A
Other languages
English (en)
Other versions
CN107924404B (zh
Inventor
翁德雷·琳达
K·M·陈
普拉沙恩斯·科特·普拉卡萨姆
阿南斯·林加姆内尼
沙恩·威廉·迈里克
桑瓦·西姆弗卡威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Expedia Group Inc
Original Assignee
Expedia Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Expedia Inc filed Critical Expedia Inc
Publication of CN107924404A publication Critical patent/CN107924404A/zh
Application granted granted Critical
Publication of CN107924404B publication Critical patent/CN107924404B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Abstract

公开了一种基于网络的服务,用于基于对与查询相对应的搜索结果的基于位置的聚类来消除搜索查询的歧义。在一个实施例中,用户可以提交针对诸如酒店住宿的旅行项目的查询。该服务可以基于该查询来确定提供这种住宿的酒店的初始集合。然后该服务可以根据酒店的地理位置对酒店进行聚类。如果服务识别多个群集,则可以提示用户选择特定群集以接收关于该群集的附加信息。说明性地,如果用户提交针对“斯普林菲尔德”中的酒店的查询,则该服务可以要求用户在多个结果群集中进行选择,每个结果群集与结果所位于的名称为“斯普林菲尔德”的不同的城市对应。

Description

消除搜索查询的歧义
背景技术
计算装置和计算网络经常被用户用来获取关于各种主题的信息。许多基于网络的系统由于所提供的信息广泛而使用户能够搜索这些系统上的信息。通常,用户能够将结构化或非结构化查询提交给基于网络的系统,然后系统尝试将其匹配到潜在的搜索结果集合。由于易于使用,非结构化查询(如自由格式的文本字符串)通常受用户欢迎。然而,在某种程度上,由于其非结构化性质,这些查询通常是有歧义的,因此导致向用户提供至少部分不相关的搜索结果。
例如,有兴趣在密苏里州(Missouri)斯普林菲尔德市(Springfield)定位关于酒店住宿信息的用户可以使用查询字符串“斯普林菲尔德的酒店”来搜索基于网络的服务。然而,基于网络的服务可能无法从查询的文本中确定用户感兴趣的“斯普林菲尔德”具体是哪个城市(例如,密苏里州的斯普林菲尔德、马萨诸塞州(Massachusetts)的斯普林菲尔德、俄勒冈州(Oregon)的斯普林菲尔德等),或者“斯普林菲尔德”究竟是否完全表示美国的城市。因此,仅仅执行查询并提供结果的集合很可能向用户呈现不相关的信息,导致用户对系统满意度的降低以及服务用户所需的计算资源的使用增加。
附图说明
图1是说明性网络环境的示意框图,其中,旅行服务可以用于使得用户能够提交旅行项目的查询并基于结果的地理聚类来消除用户查询的歧义;
图2是图1的旅行服务中包括的查询处理系统的说明性框图,其可以处理用户查询以基于结果的地理聚类来检测潜在的歧义;
图3是说明性用户界面,其可以显示在用户计算装置上以向用户通知潜在地有歧义的查询并且基于检测的歧义而提供查询的结果;
图4是搜索结果的地理聚类的说明性可视化,其可以指示相应查询中的歧义;以及
图5A和图5B是用于处理可能包括歧义的用户提交的查询的、用于基于结果的地理聚类来检测这种歧义、并且用于向用户提供查询的结果的流程图。
具体实施方式
一般来说,本公开的各方面针对处理用户提交的、可以包括有歧义的词条或搜索条件的查询,并且用于解决歧义以向用户提供有意义且精确的搜索结果。更具体地,本公开的各方面利用基于商品或服务(诸如酒店住宿)的位置的搜索结果的地理聚类来确定有效结果可能位于其中的潜在区域或地区的集合,并且通知消费者各个区域或地区。说明性地,基于美国的网络旅行服务的用户可以提交针对“斯普林菲尔德的酒店”的查询。旅行服务可以确定查询的有效结果可能包括密苏里州的斯普林菲尔德、马萨诸塞州的斯普林菲尔德或俄勒冈州的斯普林菲尔德。因此,可以提示用户选择期望酒店住宿的正确位置。如下将要描述地,旅行服务可以确定包括潜在有效结果的地区的集合,而不需要将查询的词条字面映射成特定区域(例如,不需要检测“斯普林菲尔德”是指城市以及该名称的城市存在于多个州中)。这样,旅行服务可以能够消除任何自由形式查询的歧义。例如,针对“海滩酒店”的查询可能导致在具有海滩的各个位置(例如,夏威夷州(Hawaii)、加利福尼亚州(California)、佛罗里达州(Florida)等)中检测到潜在的结果。类似地,针对“Edgewater酒店”的查询可能会导致在华盛顿州的西雅图(Seattle,WA)(名称为“Edgewater酒店”的酒店所在地)和新泽西州(NJ)的城市Edgewater中检测到潜在的酒店住宿。如下详述,旅行服务因此可以能够更快速且准确地处理用户查询,从而提高了用户体验,减少了利用网络旅行服务所需的计算资源。
为了确定查询的潜在有效结果所在的区域或地区的集合,旅行服务可以利用结果聚类。具体地,旅行服务可以首先执行查询以确定结果的集合(例如,根据下面描述的算法、本领域已知的传统搜索算法或任何其他搜索算法)。之后,旅行服务可以确定每个搜索结果的地理位置。例如,旅行服务可以利用已知的针对结果集合的每一个的地址数据或纬度数据和经度数据来将位置分配给所述结果。旅行服务然后可以根据它们被分配的位置来使所述结果聚类。在一个实施例中,可以基于简单的距离计算来聚类结果,使得在彼此的阈值距离(其可以由旅行服务预定义)内的两个结果被放置在同一“群集”内,而距离任何现有群集的距离超过阈值距离的结果被放置在新的群集中。例如“k均值”聚类的其他聚类算法在本领域内已知并且可以用于确定结果的群集。
在确定完结果群集的集合之后,旅行服务可以向群集分配标识符。在一个实施例中,标识符可以基于关于群集中每个结果的现有元数据。例如,旅行服务可以为每个结果保留多个地理标识符,所述标识符指定每个结果的市、县、地区、州、国家等。因此,每个群集可以基于由群集中所有结果共享的最特定的地理标识符来识别。由此,华盛顿州西雅图市中心的结果的群集可以被识别为“华盛顿州西雅图市中心的酒店”,而遍布在罗得岛(RhodeIsland)州的结果的群集可以被识别为“罗得岛州的酒店”。
因此,关于确定的群集的集合的信息可以响应于用户的查询而呈现给用户。例如,针对“斯普林菲尔德中的酒店”的查询可以使旅行服务返回潜在结果位于密苏里州的斯普林菲尔德、俄勒冈州的斯普林菲尔德或马萨诸塞州的斯普林菲尔德的指示,并且使旅行服务请求用户选择那些地区中的一个,以便显示所选地区中的酒店住宿。因此,最初打算搜索俄勒冈州的斯普林菲尔德的酒店住宿的用户将不会被呈现有针对密苏里州的斯普林菲尔德的酒店住宿(其否则可能会在搜索结果的集合中更显著地显示)。另外,因为基于结果的聚类已经消除了查询的歧义,所以在进行搜索之前旅行服务没有必要尝试实现单独的系统来检测搜索条件中的歧义。基于聚类的消除歧义因此呈现对其他消歧技术(例如扫描每个查询以检测潜在有歧义的词条或短语的预定列表)的明显改进。
在一些实施例中,旅行服务可以配置为对可能表示用户感兴趣的区域的群集以及可能包括用户感兴趣的特定项目的群集之间进行区分。例如,针对“Edgewater酒店”的查询可以导致两个群集:第一个包括华盛顿州西雅图的Edgewater酒店以及西雅图的其他附近酒店,第二个包括新泽西州Edgewater市的各种酒店。尽管第一群集中的每个酒店都可以准确地描述为“华盛顿州西雅图的酒店”,但是这样的描述可能被认为对搜索特定的“Edgewater酒店”的用户是没有用的(因为这样的结果看起来可能比初始搜索更模糊)。因此,旅行服务可以检测到包括在该群集中的Edgewater酒店是用户感兴趣的特定项目,而不是向用户呈现与第一群集对应的地区。因此,旅行服务可以向用户呈现对应于西雅图Edgewater酒店的第一群集,并且允许用户选择该第一群集以便查看在Edgewater酒店的酒店住宿。
在一些情况下,除了明确地使用户选择群集之外或者可替代地,用户的用户历史或其他用户资料数据可以用于区分群集。例如,在旅行服务具有用户在特定日期在特定地理地区中先前购买的记录的情况下,旅行服务可以通过选择与该地理地区相对应的群集来自动消除用户在该特定日期的附加查询的歧义。作为另一示例,在旅行服务具有用户针对特定地区的偏好记录(例如,如重复的过去购买所指示的、对该地区偏好的明确指示等)的情况下,旅行服务可以通过选择与特定地区相对应的群集来自动地消除用户的查询的歧义。在一些情况下,旅行服务可以利用用户对地区的偏好来对群集区分优先次序(例如,使得与优选地区对应的群集被显示在备选群集上方)而不是自动选择与优选地区对应的群集。
本领域的技术人员之一将理解,使用地理聚类来消除搜索查询的歧义与以前的实现相比体现了显著的优势。具体地,地理聚类的使用使得能够减少呈现给用户的不相关结果的数量,从而使得用户能够更快速和更有效地搜索和定位感兴趣的项目。因此,使用地理聚类来消除查询的歧义可以使得旅行服务更高效地运行,使旅行服务能够更快速地返回相关的查询结果并利用更少的计算资源。此外,使用地理聚类消除搜索查询的歧义并不要求对查询本身进行独立分析(例如,通过尝试将查询词条与潜在的有歧义的词条的已知列表相匹配),而是为了检测歧义而利用与查询相匹配的各种搜索结果。因此,本文描述的实施例与存在的系统相比体现了显著的进展。
虽然本文提供了关于诸如酒店住宿的特定类型的旅行服务的示例,但是本公开的实施例可以应用于任何基于地理的项目或服务,包括但不限于飞行、住宿、其他交通、活动、游览、旅行保险、一日游、目的地服务或其组合。
图1是描绘说明性操作环境的框图,其中基于网络的旅行服务150使顾客能够浏览、搜索并获取由第三方供应商或旅行服务150的经营者提供的旅行项目。如图1所示,操作环境包括经由网络130与基于网络的旅行服务150进行通信的一个或多个预订系统120以及一个或多个用户计算装置110。使用预订系统120的第三方供应商可以经由网络130使旅行项目或关于旅行项目的信息可用于旅行服务150。旅行服务150然后可以使旅行项目以及其他旅行项目可用于旅行者计算装置110。因此,使用用户计算装置110的未来的旅行者可以浏览旅行服务150中可用的旅行项目、搜索旅行项目以及获取、预订或预约一个或多个期望的旅行项目。
用户计算装置110可以是任何计算装置,例如笔记本电脑或平板电脑、个人计算机、服务器、个人数字助理(PDA)、混合PDA/移动电话、移动电话、电子书阅读器、机顶盒、照相机、数字媒体播放器等。预订系统120和用户计算装置110可以经由网络130与旅行服务150进行通信。本领域的技术人员将理解,网络130可以是任何有线网络、无线网络或其组合。此外,网络130可以是个域网、局域网、广域网、有线网络、卫星网络、蜂窝电话网络或其组合。在示出的实施例中,网络130是互联网。用于经由互联网或任何其他上述类型的通信网络进行通信的协议和组件是计算机通信领域的技术人员已知的,因此在此不需要更详细地描述。
预订系统120可以相当于配置成或能够允许预约、预订或获取旅行项目的任何系统或装置。例如,预订系统120可以相当于中央预订系统(CRS)、全球分销系统(GDS)或任何其他系统,其中多个旅行项目供应商(例如航空公司、酒店、汽车租赁机构、邮轮公司、巴士服务等)使旅行项目可用于预约、预订和/或购买。在其它实施例中,预订系统120可以相当于由个人旅行项目供应商(例如,特定的航空公司、酒店或酒店连锁、汽车租赁公司、游轮、巴士服务等)提供的系统。通常,每个预订系统可以使其他基于网络的装置(例如,旅行服务150的装置)查询关于旅行项目的信息(例如,可用性、价格、旅行计划等)、搜索旅行项目、以及预约、获取或预订旅行项目。预订系统的操作是本领域已知的,因此本文将不再详细描述。
在示出的实施例中,旅行服务150示出为计算机环境,其包括使用一个或多个网络互相连接的个人计算机系统。更具体地,旅行服务150可以包括用户界面系统156、预订系统界面152、查询处理系统154、旅行者资料数据存储器158和旅行项目数据存储器160。虽然在图1中示出为不同的系统,但是在一些实施例中,用户界面系统156、预订系统界面152、查询处理系统154、旅行者资料数据存储器158和旅行项目数据存储器160中的一个或多个可以组合成一个或多个聚合系统。此外,本领域的技术人员将理解,旅行服务150可以具有比图1所示的组件更少或更多的组件,其包括各种Web服务和/或对等网络配置。在一些实施例中,旅行服务150的一个或多个组件可以由在托管计算环境中实现的虚拟机来实现。托管计算环境可以包括一个或多个快速供应和释放的计算资源,该计算资源可以包括计算、联网和/或存储装置。托管计算环境也可以被称为云计算环境。因此,对图1的旅行服务150的描绘可以被认为是示例性的并且不限于本公开。
用户界面系统156、预订系统界面152、查询处理系统154、旅行者资料数据存储器158和旅行项目数据存储器160中的任何一个或多个可以以多个组件来体现,每个组件执行相应的用户界面系统156、预订系统界面152、查询处理系统154、旅行者资料数据存储器158和旅行项目数据存储器160中的一个实例。实现用户界面系统156、预订系统界面152、查询处理系统154、旅行者资料数据存储器158和旅行项目数据存储器160中的任何一个的服务器或其他计算组件可以包括网络接口、存储器、处理单元和计算机可读介质驱动器,所有这些组件可以借助通信总线彼此进行通信。网络接口可以提供对网络130和/或其他网络或计算机系统的连接。处理单元可以与包含程序指令的存储器进行通信,处理单元执行该程序指令以便操作相应的用户界面系统156、预订系统界面152、查询处理系统154、旅行者资料数据存储器158和旅行项目数据存储器160。存储器通常可以包括RAM、ROM、其他持久性和辅助存储器、和/或任何非暂时性计算机可读介质。
根据本公开的实施例,查询处理系统154可以配置为处理查询并确定查询结果的集合(例如,经由用户界面系统156呈现给用户计算装置110)。更具体地,查询处理系统154可以利用基于地理的聚类来检测有歧义的查询,并且向用户计算装置110呈现每个结果群集的指示符(例如,作为群集所在的地理区域的标识符或用户可能感兴趣的群集中的特定项目的标识符)。如下所述,查询处理系统可以对查询进行附加的前处理或后处理,以增加结果的准确性。
在一些实施例中,查询处理系统154可以利用从预订系统120获得的关于旅行项目的信息。与预订系统120的交互可以通过预订系统界面152来易化,预订系统界面152可以实现对预订系统120上的关于相关旅行项目的信息进行查询、从预订系统120检索关于旅行项目的信息并且为了用户的利益预订旅行项目。在一些实施例中,可以提供多个预订系统界面152,每一个配置为与一个或多个特定的预订系统120进行交互。例如,第一预订系统界面152可以与基于航空公司的预订系统120进行交互,而第二预订系统界面152可以与基于酒店的预订系统120进行交互。在2009年5月21日提交的并且标题为“用于寻找最佳票价的优化的系统以及方法(OPTIMIZED SYSTEM AND METHOD FOR FINDING BEST FARE)”的美国专利申请No.12/470,442中描述了用于与预订系统120进行交互的系统和方法的实施例,其全部内容通过引用合并于此。
查询处理系统154还可以利用来自旅行项目数据存储器160的信息,所述信息可以包括关于相关旅行项目的各种数据。旅行项目数据存储器可以相当于任何物理数据存储器、物理数据存储器的集合或由一个或多个物理数据存储器实现的虚拟数据存储器,例如硬盘驱动器(HDD)、固态驱动器(SSD)、磁带驱动器、网络附加存储器(NAS)或任何其他持久或基本上持久的存储组件。在一些情况下,旅行项目数据存储器160中的数据(例如,名称、地址、可用的预约类型等)可以经由预订系统界面152从预订系统120中获得。旅行项目数据存储器160还可以包括由旅行服务150本身生成的信息或由用户计算装置110提交给旅行服务150的信息,例如对各种旅行项目的评价、评级、图片或意见。旅行项目数据存储器160还可以包括由第三方服务检索或提交的信息,例如独立的旅行项目评级服务或旅行社(图1中未示出)。在一些情况下,由于与预订系统120的通信延迟,与直接从预订系统120检索的信息相比,查询处理系统154可以唯一地或优先地利用来自旅行项目数据存储器160的信息。如此,在一些情况下,旅行项目数据存储器160可用于缓存来自预订系统120或其他不同系统(图1中未示出)的信息以供查询处理系统154使用。
向查询处理系统154的提交可以由用户计算装置110经由用户界面系统156来提交,用户界面系统156还可以将查询结果发送给用户计算装置110。因此,用户界面系统156可以帮助用户经由用户计算装置110搜索、浏览和获取(例如,通过预订、预约等)旅行项目。在一些实施例中,用户界面系统156可以包括网络服务器(例如web服务器),以用于生成用于由辅助这种搜索、浏览和获取的网络页面(例如,web网页)的接收方装置呈现的指令。用户界面系统156可以为其生成指令的用户界面的一个示例将在下图3更详细地描述。
用户界面系统156还可以配置为存储、保留并获取来自旅行者资料数据存储器166的信息。用户信息数据存储器166可以对应于任何持久或基本上持久的数据存储器,例如一个或多个硬盘驱动器(HDD)、固态驱动器(SSD)或网络附加存储装置(NAS)。旅行者资料数据存储器166可以存储关于用户的信息(例如用户姓名、年龄、地址、出生日期、信用卡信息、购买历史和旅行预订、飞行常客或奖励计划信息等)以供旅行服务150使用。如以下所讨论的,来自旅行者资料数据存储器166的信息可被用来确定提交查询的用户的一个或多个优选地区,这可有助于消除查询的歧义。
关于查询处理系统154的更详细的内容在图2中示出,图2是描绘查询处理系统154的示例性组件的框图。组件202-210中的每一个可以表示查询处理系统154内的不同计算装置(包括配置为执行计算机可执行指令的至少一个物理处理器),或者可以表示程序、功能、代码模块或由包括在查询处理系统154内的一个或多个计算装置中的至少一个处理器执行的其他代码。为了说明的目的,将关于(例如,由用户计算装置110)输入到查询处理系统154的示例查询的处理来讨论这些组件202-210。
查询处理系统154接收的请求可以最初被传送到查询注释器202,其中查询的各个项目可以被检查和注释以便在查询处理系统内稍后使用。在一些实施例中,查询注释器202可以利用自然语言处理技术(例如本领域已知的技术)来确定任何词条或一系列词条(有时被称为“n元语(n-gram)”)是否可以被分类为预定义的词条类型。作为说明,词条类型可以包括(但不限于):所寻求的旅行项目的类型(例如,酒店、汽车、航班、活动等)、所寻求的特定项目的名称(例如,特定酒店名称、酒店品牌等)、所寻求的项目的地理位置(例如,城市、县等)、地理位置的地理描述符(例如海滩、山脉等)、期望的旅行项目所提供的便利设施(例如,游泳池、热水浴缸、餐饮、健身中心、水疗中心等)、服务级别描述符(例如奢侈、商业、经济等)或特定词类(例如,名词、动词、分词、代词、介词、副词、连词等)。如下所述,查询处理系统154可以使用词条注释来确定在查询处理系统154内的给定阶段处应查询哪些词条。例如,查询处理系统154可以在试图定位可能包括搜索的旅行项目的地理地区时忽略期望的便利设施(例如,游泳池、水疗中心、所供应的餐饮),因为这些词条不太可能在地理上有意义。作为另一示例,查询处理系统154可以忽略在处理查询期间不太可能有意义的某些词类,例如介词。
之后,查询处理系统154可将经注释的查询传送到搜索引擎204,该搜索引擎204用于定位与查询潜在相关的旅行项目。在一个实施例中,搜索引擎204可以响应于查询而利用简单的词条匹配来对潜在的旅行项目进行排名和分类,使得响应于查询而返回其描述更接近地匹配查询的词条的旅行项目,并且基于他们的相关描述和词条之间的对应的等级来进行排名。在另一实施例中,搜索引擎204可以使用历史用户活动数据(例如,“点击流”数据)来确定响应于给定查询的旅行项目。例如,对于给定的酒店查询,搜索引擎204可以确定先前用户在利用同一查询或者同一查询内的词条时选择的酒店集合。搜索引擎204还可以基于先前用户选择的频率来对酒店集合进行排名。在一个实施例中,搜索引擎204可以通过使用朴素贝叶斯分类器(naive Bayesian classifier)来将搜索词条与特定旅行项目相关联。使用点击流数据来确定相关查询结果可以使得即使搜索查询与作为结果的旅行项目不共享术语时搜索引擎204也能够识别相关结果。例如,尽管词条“Big Apple(纽约城)”实际上没有出现在对特定酒店的描述中,但是点击流数据可以指示在搜索了“Big Apple中的酒店”之后用户选择了New York(纽约市)的特定酒店。在一些实施例中,可以通过用户计算装置110和旅行服务150之间的交互来生成点击流数据(例如,作为用户对旅行服务150做出的搜索结果)。在另一实施例中,在第三方搜索引擎(未示出)推荐旅行服务150期间,可以推断或收集点击流数据,第三方搜索引擎可以向旅行服务通知第三方搜索引擎利用的特定用户查询,以引导用户到旅行服务150。另外地或可替代地,搜索引擎204可以利用本领域中已知的任何数量的搜索算法来定位与用户的查询潜在相关的旅行项目。
在一些情况下,搜索引擎204可以仅利用来自查询的词条的子集,其预期与潜在结果的地理聚类相关。例如,为了识别初始结果,搜索引擎204可以忽略指定期望的便利设施的查询内的词条。如下所述,在将旅行项目呈现给用户之前,这些词条稍后可以由查询处理系统154来使用以将单个旅行项目进行排名。在一些实施例中,搜索引擎204还可以处理搜索结果或修改搜索结果。例如,搜索引擎204可以精简搜索结果,使得结果仅包括与用户查询潜在相关的前n个旅行项目。
在确定初始搜索结果的集合之后,查询处理系统154可以将初始搜索结果传送至地区识别器206,其可以将结果聚类成地区的集合。在一个实施例中,可基于单通道(single-pass)算法发生聚类,使得如果与旅行项目相关联的位置在先前识别的群集的阈值距离(例如,50英里)内,则确定所述旅行项目落入先前识别的群集中,否则确定为构成新的群集。在旅行项目与单个地理位置(例如,提供住宿的酒店的位置、提供目的地服务的位置、汽车租赁公司的位置)相关联的情况下,地区识别器206可以使用单个地理位置作为旅行服务的位置。在旅行项目与多个地理位置(例如,具有起飞位置和返回位置两者的航班)相关联的情况下,如果多个地理位置中的任何一个处于距离群集的阈值距离内,则可以将旅行项目视为群集的阈值距离内。可以基于群集中的任何位置来确定与群集的距离。在一些实施例中,如果旅行项目的位置处于距离群集中已经存在的任一其他旅行项目的位置的阈值距离内,则可以将旅行项目视为在先前存在的群集的阈值距离内。在其他实施例中,如果旅行项目的位置处于距离群集的图心(例如根据已经在群集内的每个旅行项目的平均位置而确定的)的阈值距离内,则可以将旅行项目视为在先前存在的群集的阈值距离内。这样的单通道聚类算法可以是有益的,因为它可以被查询处理系统154快速利用来确定与地理上分散的项目有关的群集。然而,更复杂的聚类算法(例如,本领域内已知的k均值聚类)也可以被地区识别器206用来确定旅行项目的群集。
在识别多个群集之后,地区识别器206还可以将地理标识符分配给每个群集。在一个实施例中,地区识别器206可以使用查询处理系统154可用的地理元数据(例如,来自图1的旅行项目数据存储器160)来识别适用于群集中所有(或阈值百分比)酒店的最特定的地理标识符。这样的元数据可以包括区域集合的识别,每个元数据识别与特定地区标识符相关联的地理地区。在一个实施例中,可以基于现有的地理政治边界(诸如街区、城市、县或州边界线)来生成元数据。在另外的实施例中,可以通过旅行服务150手动生成元数据。在又一些实施例中,旅行服务150可以从本领域已知的诸如地理信息服务(GIS)之类的第三方服务获得识别地理标识符和相应的地理区域或位置的元数据。使用这样的地理元数据,地区识别器206可比较任何给定群集中的旅行项目的位置,以确定包括群集中的所有或阈值百分比的旅行项目的位置的一个或多个地理地区的标识符。因此,位于华盛顿州西雅图的弗里蒙特(Fremont)街区内的酒店的住宿的群集可被识别为“华盛顿州西雅图的弗里蒙特”群集,而位于华盛顿州斯波坎(Spokane)的酒店的住宿的群集可被识别为“华盛顿州斯波坎”群集。在一些实施例中,旅行服务150也可以包括旅行项目的元数据中的相关地理标识符。例如,一个或多个旅行项目可以被分类为“太空针塔(Space Needle)附近”(华盛顿州西雅图的瞭望塔)。在群集的旅行项目被包括在多个地区内的情况下(例如,相关标识符、街区和城市),旅行服务150可以基于每个地区的优先等级来从多个地区中选择。说明性地,基于地区内包括的总面积、基于地区在旅行服务150上的受欢迎度(例如,基于用户搜索与该地区相对应的旅行项目的频率)或者基于所述两者,可以对旅行服务150的各地区进行优先级排序。例如,在群集的旅行项目位于“华盛顿州西雅图的市中心”地区和“华盛顿州西雅图”地区两者的情况下,旅行服务150可以使用“华盛顿州西雅图的市中心”作为该群集的标识符,因为该地区对于旅行服务150的用户来说具有较小的规模和较大的受欢迎度。另外地或可替代地,旅行服务150可以基于用户查询中使用的词条与每个地区的标识符之间的对应关系从多个地区中进行选择。例如,搜索“太空针塔附近的酒店”可以得到识别为“太空针塔附近”,而不是“华盛顿州西雅图”的群集,至少部分原因是因为搜索查询和地区标识符之间词条的重叠。
另外,地区识别器206可以将确定的群集分类,以建立每个群集到搜索查询的预测相关性。在一个实施例中,可以基于确定为落入群集的旅行项目来对群集进行分类。例如,可以利用每个旅行项目(例如,如由搜索引擎204确定的)的初始排名来确定每个群集中的旅行项目的总排名或平均排名(使得包括通过搜索引擎204而排名高的旅行项目的群集被排列在包括通过搜索引擎204而排名不高的旅行项目的群集之上)。在另一个实施例中,可以至少部分地基于分配给群集的地理标识符与查询之间的对应关系来对群集进行分类,使得被识别为地理上“靠近太空针塔”的酒店的群集对于包括词条“太空针塔”的查询排名很高。在又一些实施例中,可以基于群集本身的地理标识符对群集进行分类(例如,使得更受旅行服务150的用户欢迎的地理标识符比不太受欢迎的地理标识符排名更高,或者使得更具体的地理标识符比不太具体的地理标识符评级更高),或者基于用户对与至少一个群集相对应的地理标识符的偏好(例如,如由用户的资料数据确定)对群集进行分类。
此后,查询处理系统154可以将所识别的群集传送至地区分类器208,该地区分类器208可以尝试将由于其地理位置而相关的群集与基于包括在群集中的旅行项目而相关的群集进行区分。例如,针对“Edgewater酒店”的查询可以导致两个群集:第一群集包括华盛顿州西雅图的Edgewater酒店和其他附近酒店,第二群集包括新泽西州Edgewater区内和周围的各酒店。其中,第一群集预计是基于群集中包括的特定旅行项目(Edgewater酒店)而相关的。因此,不向用户呈现地理标识符(例如,“华盛顿州西雅图的酒店”),该群集可以被表示为用户期望感兴趣的群集中的特定旅行项目(例如,“华盛顿州西雅图的Edgewater酒店”)。然后,用户对群集的选择将产生关于特定旅行项目的详细信息。相反地,第二群集(新泽西州Edgewater区内和周围的各酒店)可以表示为用户可选择的选择地区(例如“新泽西州的Edgewater”),可选择以查看该地区内的酒店住宿列表。
为了将凭借特定旅行项目而相关的地区与本身彼此相关的地区进行区分,地区分类器208可利用由搜索引擎204分配的、群集中的单个旅行项目的相关排名(例如,基于点击流数据、词条分析或任何其他搜索和排名标准)。在给定群集中排名最高的旅行项目似乎比排名第二高的旅行项目相关得多的情况下,由于排名最高的旅行项目,该群集可能是相关的。这样,对于用户来说,可以将该群集仅表示为旅行项目本身(例如,作为查看关于特定旅行项目的附加信息的链接)。相反,在群集中的所有旅行项目被类似地排名的情况下,可以将该群集作为地理标识符(例如,特定城市)呈现给用户,可选择该群集以查看该城市内的旅行项目。地区分类器208可利用给定群集的项目之间的任何数量的比较,以便区分群集的单个旅行项目是否表示消费者感兴趣的特定项目。在群集中的单个旅行项目已经被分配了分数(例如,由搜索引擎204)的情况下,群集的项目之间的比较的示例包括但不限于:群集中排名第一和排名最后的旅行项目之间的分数差异(例如,以绝对差异、对数域差异等作为测量);群集中排名第一和排名第二的旅行项目之间的分数差异;群集中排名第一和排名第二的项目之间的分数差异与群集中排名第二和排名第三的项目之间分数差异相比较的比率;群集中排名第一和排名第二的项目之间的分数差异与群集中排名第二和排名最后的项目之间的分数差异相比较的比率。地区分类器208可以用于区分群集类型(例如,地区相关群集或凭借特定旅行项目而相关的群集)的其他因素包括基于查询的前n个搜索结果产生的群集的数量、提取的群集之间的平均距离(例如,基于群集的中心、群集的边缘等确定的)、所有提取的群集之间的最大距离、所有提取的群集之间的最小距离。
另外地或可替代地,可以基于用户输入的查询词条和与群集中排名最高的旅行项目相关联的词条的比较来区分群集的类型(例如,地区相关群集或凭借特定旅行项目而相关的群集)。例如,在搜索查询和排名高的旅行项目共享相似词条的情况下(例如,针对“Edgewater酒店”的查询和名称为“Edgewater酒店”的旅行项目),群集相关性很可能与排名高的旅行项目高度相关。相反地,在搜索查询与排名高的旅行项目不共享类似词条的情况下(例如,针对“华盛顿州西雅图的酒店”的查询和排名高的旅行项目“Edgewater酒店”),该群集通常可能是相关的,并且用户可以通过查看与该群集相关联的地理标识符内的酒店而受益。在一些情况下,查询和旅行项目之间的词条的相似性可以被量化为查询和旅行项目标识符(例如,名称)之间的匹配词条(或“n元语”)与查询中的总词条(或“n元语”)之间的比值。因此,在一个实施例中,地区分类器208可以凭借特定的旅行项目来确定群集是相关的,其中该旅行项目和用户的查询具有的匹配词条的比例超过阈值量。在一些实施例中,还可以基于查询词条与针对群集的地区标识符之间的比较来区分群集类型。例如,当地区的名称与查询中的一个或多个词条紧密匹配时,可以凭借其对应地区来确定该群集是相关的。另外地,可以基于查询中使用的特定词条或的词条类型来区分群集类型。说明性地,针对群集的地区标识符与特定旅行项目标识符相比可能更有可能与包含复数词条(例如,“多个酒店”而不是“一个酒店”)的查询相关。在一些实施例中,上述度量的每一个可以被量化,并且可以从这样量化的比较中来推导附加度量。例如,查询处理系统154可以对群集的地区标识符与查询中使用的词条的相似度分配分数,以及对群集中高搜索结果与那些词条的相似度分配分数。然后,通过比较这两个分数可以创建附加的度量。在本公开的范围内,附加度量是可以的并且是预期的。用于区分群集类型的特定度量(或其组合)可以在一些情况下基于使用处理训练数据集合的机器学习算法来确定,所述训练数据集合包括具有已知相关类型(例如,基于地理标识符而相关或基于群集中高排名的旅行项目而相关)的查询和对应的结果群集。
之后,查询处理系统154可以将识别并分类的群集传送至结果协调器210。如果已经识别了多个群集,则结果协调器210可以向用户发送(例如,经由用户界面系统156)请求以选择由群集中地理标识符或者排名高的旅行项目所识别的群集中的一个。如果用户选择了由排名高的旅行项目识别的群集(例如,酒店),则用户可以立即被引导到允许对该酒店进行预订的详细页面。如果用户选择了由地理标识符识别的群集,则结果协调器210可以呈现群集中可用的旅行项目的列表。在一些情况下,结果协调器210可以对群集中的旅行项目进行重新分类或重新排名。例如,在标记为便利设施(例如,水疗中心、健身中心等)的查询词条预先被搜索引擎204忽略的情况下,结果协调器可以基于每个旅行项目的那些便利设施的可用性来重新评估群集中的旅行项目。在一些情况下,结果协调器可以进行限于由该群集所识别的地理区域的新的搜索,以确定向消费者呈现的旅行项目的集合。
在查询处理系统154预先识别了仅单个群集的情况下,结果协调器210可以继续下去,就像用户已经选择了该单个群集那样。因此,如果单个群集被确定为基于排名高的旅行项目与查询相关,则用户可以直接被引导到该旅行项目的详细页面。如果单个群集被确定为基于地理地区相关,则结果协调器210可以呈现群集中的旅行项目的列表(如潜在地基于初始查询被重新分类或重新排名),或者可以呈现对地理地区内的旅行项目进行新的搜索的结果。
按照上述方式,查询处理系统154可以处理非结构化查询,以确定查询内的潜在的地理歧义,并且允许用户选择期望的旅行项目或地理地区。因此,与传统搜索算法相比,查询处理系统154能够提高搜索关于旅行项目的信息的速度、效率和准确性。
参考图3,显示了使利用地理群集的搜索查询能够消除歧义的用户界面300的说明性示例。在该示例中,基于从旅行服务150接收的指令(例如,超文本标记语言[HTML]文件)、通过在用户计算装置110上执行的浏览器应用程序(例如,“web浏览器”)来生成用户界面300。用户界面300可以使用户计算装置110能够进行以下操作:提交对旅行服务的查询、在这种查询确定为有歧义的情况下选择产生的合适的群集、响应于所提交的旅行查询来查看并获取可用的旅行项目、以及查看至少部分地基于所提交的旅行查询而生成的旅行套餐推荐。在图3示出的示例中。识别为“旅行者汤姆(Tom Traveler)”的用户已经访问了旅行服务150。为了使用户能够在旅行服务150的各种界面之间导航,用户界面包括导航面板302,其引导旅行者到由旅行服务150提供的各种其他特征。说明性地,导航面板302内的文本单元可对应于交互式链接,其在被选择时修改或改变用户界面。在当前示例中,旅行者汤姆已经选择了链接304“酒店”。基于该选择,用户界面系统156已经返回到用户界面300的内容。用户可以通过选择导航面板302内的可替代的连接来查看可替代的用户界面。例如,用户可以通过选择标题为“套餐”、“汽车”、“航班”的导航面板的部分来查看与其他类型的旅行项目相关的可替代的界面。
通过使用用户界面300,旅行者计算装置110可以通过使用搜索框306来提交对旅行服务150的查询。在当前示例中,用户已经提交了非结构化查询文本“华盛顿的酒店”。接收该查询时,旅行服务150可以将查询文本(连同任何其他的附加信息,例如用户的资料信息)传送至查询处理系统154。如上所述,查询处理系统154可以定位查询的结果的集合(例如,使用词条匹配、点击流分类或其他搜索算法),并对结果进行处理以将结果中包括的旅行项目在地理上进行聚类。
图4中示出了针对查询“华盛顿中的酒店”的潜在的地理群集的一个示例。如图4所示,与查询“华盛顿中的酒店”相关的潜在旅行项目可以遍布华盛顿州地区400。应当注意,实际上仅示出了图4所示的特定的群集,并且与查询“华盛顿中的酒店”相关的潜在旅行项目也可以包括位于华盛顿州地区400以外(例如,在华盛顿特区)的旅行项目。为了消除查询的歧义,查询处理系统154可以使用聚类算法(例如如上所述的那些)以将结果聚类成三个群集402A、402B和402C。虽然仅在图4中示出了三个群集,但是通过查询处理系统154可以标识任何数量的群集。在一些情况下,查询处理系统154可以“精简”群集,使得具有低潜在相关性的群集(例如由群集中的旅行项目的总分数或平均分数确定的)不被选择用于进一步处理,因此减小了向用户表示的群集的数量。在图4的示例中,每个群集与华盛顿州的预定的地理地区相关联,使得群集中的每个旅行项目与该地理地区相关联。具体地,群集402A内的旅行项目被示出为与“大西雅图区域”地区相关联;群集402B内的旅行项目被示出为与“斯波坎(Spokane)”地区相关联;群集403C内的旅行项目被示出为与“雅基马谷(YakimaValley)”地区相关联。
由于大多数旅行者在心里有相对特定的旅行位置,所以用户不太可能从同时呈现的来自群集402A至402C中每一个的酒店中受益。另外,如果用户实际上对不太受欢迎或排名不那么高的地区的旅行感兴趣,则可能从群集402A至402C中的每一个选择的结果的初始集合将不包括来自用户期望地区的任何旅行项目,因此,需要用户请求附加的搜索结果(例如,通过移动到后续的“网络页面”结果)、“缩小”他们的搜索词条(例如,通过手动指定他们感兴趣的地区)、或者重新提交不同的搜索查询。这些替代选择中的每一个对于用户体验都是不利的,并且减小了旅行服务150可以操作的速度、准确性和效率。
为了解决这些问题,本公开的各方面使三个群集402A至402C中的每一个作为一组而不是作为群集中的单个的旅行项目向用户表示。如上所述,查询处理系统154可以配置为将群集402A至402C中的每一个的预期相关性识别为借助其地理位置而相关或者借助群集402A至402C内的排名高的旅行项目而相关。在图4的示例中,假设查询处理系统154将群集402A至402C的每一个确定为借助其地理位置而相关。因此,为了消除查询“华盛顿的酒店”的歧义,旅行服务150可以请求用户选择由群集402A至402C表示的地理地区中的一个。
图3中示出了从一些识别的群集中进行选择的请求的示例。具体地,图3包括旅行服务150生成的提示308,以请求用户从三个地理标识符310至314中选择,所述地理标识符310至314识别从查询“华盛顿的酒店”得到的旅行项目所在的地区。地理标识符310至314中的每一个对应于图4所示的群集402A至402C中的一个(其中,标识符310“华盛顿西雅图的酒店”对应于群集402A;标识符312“华盛顿斯波坎的酒店”对应于群集402B;以及标识符314“华盛顿亚基马(Yakima)”的酒店对应于群集402C)。通过用户界面300,用户可以选择地理标识符310至314中的一个以接收关于所选标识符的附加信息。在一个实施例中,标识符的选择可以导致显示由标识符表示的群集中包括的旅行项目的集合。在另外的实施例中,标识符的选择可以导致为了用户的利益而生成的新的查询(例如,共享先前提交的非结构化查询词条,但是限于由所选地理标识符识别的地区)。本领域中已知用于显示旅行项目查询结果的各种系统和方法,并且在本文中将不详细地描述。
虽然在图3中群集402A至402C中的每一个由地理标识符表示,但是在一些实施例中,群集可以替代地由位于群集中的排名高的旅行项目表示(例如,表示为该旅行项目的名称)。而且,在相同的提示中,可以将所识别的群集的不同类型的标识符互相混合。例如,对“Edgewater酒店”的查询可能导致请求在“华盛顿西雅图的Edgewater酒店”(表示基于该群集中排名高的旅行项目而相关的群集)和“新泽西州Edgewater区的酒店“(表示基于地理地区而相关的群集,该群集中的旅行项目位于所述地理地区内)。在消费者选择了与特定旅行项目对应的标识符的情况下(例如,华盛顿西雅图的Edgewater酒店),用户可以自动地被引导到与所述特定旅行项目相关的信息页面(其可以使用户预订、预约、或者获取旅行项目)。
参考图5A和图5B,将描述用于基于潜在结果的地理聚类来消除搜索查询的歧义的一个说明性例程500。例如,通过查询处理系统154连同旅行服务150的附加组件可以执行说明性例程500。在框502处开始例程500,其中查询处理系统接收旅行项目查询。说明性地,可以通过使用图1的用户计算装置110的用户经过向图3的用户界面300的提交来接收所述查询。例程500在框504处继续,其中查询处理系统154可以预处理、过滤和/或标准化所述查询以便于进一步处理。说明性地,框504可以包括通过去除大写、多余空格或其他被忽略的格式或字符来标准化所述查询、对所述查询执行预定义的规则表达式、将所述多个字分组成单个词条(例如,将字“纽”和“约”分组成单个词条“纽约”),或者以其他方式对所述查询执行已知处理来准备查询,以供查询处理系统154进一步使用。
之后,例程500在框506处继续,其中查询的词条可以被注释以识别词条的“类型”,例如,所寻求的旅行项目的类型(例如,酒店、汽车、航班、活动等)、所寻求的特定项目的名称或描述符(例如,特定酒店名称、酒店品牌等)、所寻求的项目的地理位置(例如,城市、县等)、地理位置的地理描述符(例如海滩、山脉等)、期望的旅行项目所提供的便利设施(例如,游泳池、热水浴缸、餐饮、健身中心、水疗中心等)、服务级别描述符(例如奢侈、商业、经济等)或特定词类(例如,名词、动词、分词、代词、介词、副词、连词等)。在一个实施例中,框506可以包括通过查询处理系统154执行自然语言处理算法,其处理查询以利用确定的词条类型来注释查询中的单个的词条。在一些实施例中,在例程500继续之前,可以从查询中去除用一个或多个预定义类型(诸如介词)注释的查询的词条。在其他实施例中,用一个或多个预定义类型注释的查询的词条可以保持在查询内,但在例程500的特定部分中被忽略。例如,查询处理系统154可以在确定潜在结果的初始集合(从该初始集合导出基于地理的群集)时忽略注释为“便利设施”的词条。
在框508处,查询处理系统154实现对查询的潜在结果的集合的搜索。在一个实施例中,查询处理系统154可以使用词条匹配来确定旅行项目,其描述符包括的词条同时在所述查询中。在另一实施例中,查询处理系统154可以使用旅行服务150的使用者的历史使用数据(例如,由旅行服务150获得的“点击流数据”所表示的)。在一个实施例中,查询处理系统154可以使用朴素贝叶斯分类来根据查询对旅行项目排名或打分。例如,查询处理系统154可以尝试为任何给定的旅行项目确定用户响应于查询而选择该旅行项目的概率。该概率可以以P(T|Q)的形式表示,其中,“T”表示旅行项目,“Q”表示查询。该概率可以由以下公式表示:
P(T|Q)=P(Q|T)*P(T)
其中P(T)表示给定的旅行项目被选择的概率,并且可以被计算为相关数据内旅行项目的用户选择出现的总次数除以相关数据内查询的总次数。相应地,根据以下等式可以计算函数P(Q|T):
P(Q|T)=P(W1|T)*P(W2|T)…*P(Wn|T)
其中,W1…n表示查询中的一系列词条(或“n元语”),并且P(Wn|T)表示给定单词Wn出现在单个查询中的次数在导致选择旅行项目T的所有查询中的百分比。因此,通过分析点击流数据以确定过去查询与单个旅行项目之间的对应关系,查询处理系统154可以响应于新提交的查询来对单个旅行项目进行打分或排名。
用于响应于查询而定位旅行项目的各种附加的机制和算法在本领域中是已知的,并且可以另外地或可选择地用于上述那些。在一些情况下,为了确定查询的搜索结果,查询处理系统154可以与不同的系统进行通信。例如,查询处理系统154可以与第三方搜索系统(例如,预订系统120提供的系统或附图中未示出的其他系统)进行通信以确定与例程500一起使用的搜索结果。因此,上述的搜索机制和算法事实上意图是说明性的而不是穷尽的。
之后,在框512处,图5B继续例程500。具体地,在框512处,查询处理系统154使用先前建立的搜索结果的集合、基于每个旅行项目的地理位置来确定响应于查询的旅行项目的一个或多个群集。说明性地,可以基于旅行项目的纬度坐标和经度坐标、旅行项目的地址或旅行项目地理定位的其他指示符来建立地理位置。旅行项目的地理位置可以通过旅行服务150预先确定,或者可以在实现例程500期间通过查询处理系统154确定(例如,从旅行项目数据存储器160、预订系统120或其他系统提取的使用信息)。查询处理系统154可以基于各种类型的聚类算法来聚类旅行项目。在一个实施例中,请求处理系统154利用单通聚类算法,使得如果旅行项目定位在距离现有的群集(例如,以群集的中心点、群集的边界、群集中的一个或多个旅行项目所表示)的预定距离内(例如100千米),则给定的旅行项目被识别为与现有的群集相关联,否则给定的旅行项目被确定为构成新的群集。在另一实施例中,查询处理系统154利用k均值聚类算法。本领域中已知各种另外的聚类算法,因此在本文中将不进行详细描述。
在一些实施例中,查询处理系统154通过移除不太可能与用户搜索相关的群集来进一步精简群集。在一个实施例中,基于如通过群集中包括的旅行项目的平均分数或总分数中的至少一个而确定的群集的分数来精简群集。说明性地,在如上所述关于框508的初始搜索期间,可以确定单个旅行项目的分数。例如,查询处理系统154可以精简(例如,忽略)其分数表示小于所有确定的群集的总分数的阈值百分比的群集。作为另一示例,查询处理系统154可以通过打分并且精简预先确定的排名以下的任何群集来对群集进行排名。
之后,例程在框514处继续,其中查询处理系统154将群集分类以确定他们期望的相关性。在一个实施例中,查询处理系统154可尝试确定给定群集是基于归因于查询的地理标识符(例如,特定街区、城市等)而可能相关,或者群集是由于群集中包括的特定旅行项目而可能相关。如上所述,查询处理系统154可以基于多个标准来区分群集的类型,所述标准包括但不限于:查询的词条和群集中排名高的旅行项目的词条之间的相似性;在查询中包括的前n个整体搜索结果中的旅行项目的数目;群集中排名第一和排名最后的旅行项目之间的分数差异;群集中排名第一和排名第二的旅行项目之间的分数差异;群集中排名第一和排名第二的项目之间的分数差异与群集中排名第二和排名第三的项目之间分数差异相比较的比率;群集中排名第一和排名第二的项目之间的分数差异与群集中排名第二和排名最后的项目之间的分数差异相比较的比率。在一个实施例中,机器学习技术可以用于确定用于区分群集的类型的特定标准。
之后,例程500在框516处继续,其中查询处理系统154可以向用户呈现每个识别的群集的表示。以上关于图3公开了呈现群集的表示的用户界面的一个示例。说明性地,在群集基于与所述群集对应的地理地区而被确定为相关的情况下,可以通过与所述群集相关联的地理标识符(例如,群集中全部或阈值百分比的旅行项目所位于的街区、城市或地区)来向消费者呈现所述群集。在群集基于所述群集中排名高的旅行项目而被确定为相关的情况下,所述群集可以作为该排名高的旅行项目的名称或其他标识符来呈现给用户。
在框518处,查询处理系统154接收所呈现的群集的用户选择(例如,作为通过在用户计算装置110上执行的浏览器应用程序的输入)。说明性地,选择呈现的群集可以包括选择与呈现的群集对应的超链接(例如,HTML文件中的链接)。之后,在框520处,查询处理系统154显示选择的群集的结果(例如通过返回与所选链接对应的HTML文件或HTML文件的一部分)。说明性地,选择由地理标识符(例如,街区、城市或地区标识符)表示的群集可以导致显示与用户提交的查询匹配并位于地理标识符内的旅行项目。类似地,选择由单个的旅行项目的标识符(例如,群集中排名高的旅行项目的名称)表示的群集可以导致显示关于单个旅行项目的信息和使用户能够预约或预订旅行项目的界面。因此,通过选择由查询处理系统154识别的群集,可以向用户呈现关于响应于其潜在的有歧义的查询而最初识别的结果的特定的、消除歧义的部分的信息。然后例程500可以在框522处结束。
结合本文公开的实施例描述的各种说明性逻辑块、例程和算法可以被实现为电子硬件或者在电子硬件上执行的计算机软件。为了说明这一点,上面已经根据其功能一般地描述了各种说明性的组件、框、模块和步骤。这样的功能是作为硬件还是通过硬件执行的软件来实现,取决于施加在整个系统上的特定应用和设计约束。所描述的功能可以针对每个特定应用以不同的方式来实现,但是这样的实现决定不应该被解释为导致背离本公开的范围。
结合本文公开的实施例描述的方法、处理、例程或算法的步骤可直接体现为硬件、由处理器执行的软件模块或两者的组合。软件模块通常可以与使得计算装置能够实现期望的功能的计算机可执行指令的集合对应。软件模块可以驻留在RAM存储器、闪速存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或任何其他形式的非暂时性计算机可读存储介质中。示例存储介质可以耦接到处理器,使得处理器可以从存储介质读取信息并将信息写入到存储介质。替代地,存储介质可以集成到处理器中。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。替代地,处理器和存储介质可以作为分离组件驻留在用户终端中。
除非另有明确说明,或者在所使用的上下文中以其它方式理解,否则这里使用的条件语言,诸如“可以”、“可能”、“例如”等是通常旨在传达某些实施例包括(而其他实施例不包括)某些特征、元件和/或步骤。因此,这样的条件语言通常并不意味着一个或多个实施例无论如何需要特征、元件和/或步骤,或者一个或多个实施例必然包括用于在有或者没有作者输入或提示的情况下决定是否包括或将在任何特定实施例中执行这些特征、元件和/或步骤的逻辑。术语“包括”,“包含”,“具有”等是同义词,并且以开放式的方式包含性地使用,并且不排除附加的元件、特征、动作、操作等。此外,术语“或”以其包含的含义(而不是排他的含义)使用,因此当用于例如连接元素列表时,术语“或”意指列表中的一个、一些或全部元素。
除非另有特别说明,否则诸如短语“X、Y或Z中的至少一个”之类的析取语言在通常使用的上下文中理解为表示项目、术语等可以是X、Y或Z或其任何组合(例如,X、Y和/或Z)。因此,这样的析取语言通常并不意味着并且不应该暗示某些实施例要求至少一个X、至少一个Y或者至少一个Z存在。
虽然以上详细描述已经示出、描述并指出了应用于各种实施例的新的特征,但是可以理解,在不背离本公开的精神的情况下可以做出所示装置或算法的形式和细节的各种省略、替换和改变。可以认识到,本文描述的本发明的某些实施例可以以不提供在此阐述的所有特征和优点的形式来体现,因为一些特征可以与其他特征分开使用或实施。本文所公开的某些发明的范围由所附权利要求而不是由前面的描述来指示。在权利要求的等同含义和范围内的所有改变将被包括在其范围内。

Claims (23)

1.一种用于消除旅行查询的歧义的计算机实现方法,所述计算机实现方法包括:
如由配置有特定可执行指令的一个或多个计算装置所实现的,
从与用户关联的用户计算装置接收旅行项目查询;
响应于所述旅行项目查询来识别多个旅行项目;
确定针对所述多个旅行项目中的每一个旅行项目的地理位置;
根据所述多个旅行项目的相应的地理位置来聚类所述多个旅行项目以识别至少两个旅行项目群集,所述至少两个旅行项目群集中的每个旅行项目群集包括来自所述多个旅行项目中的旅行项目的集合;
至少部分地基于每个旅行项目群集对应的地理地区来确定所述至少两个旅行项目群集的每个旅行项目群集的预期相关性;
将针对所述至少两个旅行项目群集中的每个旅行项目群集的地理标识符发送至所述用户计算装置以呈现给所述用户;
从所述用户计算装置接收对所述至少两个旅行项目群集中的一个旅行项目群集的选择;以及
向所述用户计算装置发送与所述选择的旅行项目群集中包括的旅行项目集合有关的信息以呈现给所述用户。
2.根据权利要求1所述的计算机实现方法,其中,旅行项目包括住宿、地面交通、活动、游览、一日游或目的地服务中的至少一个。
3.根据权利要求1所述的计算机实现方法,其中,所述旅行项目查询是自由形式的文本查询。
4.根据权利要求1所述的计算机实现方法,还包括:
识别与预先确定的词类对应的所述旅行项目查询中的一个或多个词条;以及
从所述旅行项目查询中移除所述一个或多个词条。
5.一种系统,包括:
数据存储器,其包括针对多个旅行项目的位置信息;
计算装置,其与所述数据存储器进行通信,所述计算装置配置有计算机可执行指令,当被执行时,其使所述计算装置至少执行以下步骤:
接收来自另一计算装置的查询;
响应于所述查询来识别所述数据存储器中的所述多个旅行项目;
根据针对所述多个旅行项目中的每个旅行项目的相应的地理位置来聚类所述多个旅行项目以识别至少两个旅行项目群集,所述至少两个旅行项目群集中的每个旅行项目群集包括来自所述多个旅行项目中的旅行项目的集合;
将针对所述至少两个旅行项目群集中的每个旅行项目群集的标识符发送至所述另一计算装置;
从所述另一计算装置接收对所述至少两个旅行项目群集中的一个旅行项目群集的选择;以及
向所述另一计算装置发送与所述选择的旅行项目群集中包括的旅行项目集合有关的信息。
6.根据权利要求5所述的系统,其中,所述计算机可执行指令还使所述计算装置至少部分地基于与所述至少两个旅行项目群集中的第一旅行项目群集对应的地理地区来至少确定针对所述第一旅行项目群集的预期相关性,并且其中针对所述第一旅行项目群集的标识符是所述地理地区的标识符。
7.根据权利要求6所述的系统,其中,所述计算机可执行指令还使所述计算装置至少部分地基于所述第一旅行项目群集中每个旅行项目的位置信息来至少识别所述第一旅行项目群集对应的所述地理地区。
8.根据权利要求6所述的系统,其中,所述计算机可执行指令还使所述计算装置从所述数据存储器中识别的多个预定的地理地区中至少识别所述第一旅行项目群集对应的所述地理地区。
9.根据权利要求6所述的系统,其中,所述计算机可执行指令使所述计算装置至少部分地基于根据朴素贝叶斯分类器对所述查询的一个或多个词条的处理来至少识别响应于所述查询的、所述数据存储器中的所述多个旅行项目。
10.根据权利要求9所述的系统,其中,所述朴素贝叶斯分类器至少部分地基于点击流数据,所述点击流数据将所述查询的一个或多个词条关联至所述多个旅行项目。
11.一种非暂时性计算机可读介质,包括计算机可读指令,当由包括处理器的计算系统执行时,所述计算机可读指令使所述计算系统至少执行以下处理:
接收来自计算装置的查询;
响应于所述查询识别多个旅行项目,其中,所述多个旅行项目中的每一个旅行项目与位置信息相关联;
根据所述多个旅行项目的相应的位置信息来聚类所述多个旅行项目以识别至少两个旅行项目,所述至少两个旅行项目群集中的每一个旅行项目群集包括来自所述多个旅行项目中的旅行项目的集合;
将针对所述至少两个旅行项目群集中的每一个旅行项目群集的标识符发送至所述计算装置;
从所述用户计算装置接收对所述至少两个旅行项目群集中的一个旅行项目群集的选择;以及
向所述计算装置发送与所述旅行项目群集中包括的旅行项目集合有关的信息。
12.根据权利要求11所述的非暂时性计算机可读介质,其中,所述位置信息包括与旅行项目对应的地理坐标或旅行项目的地址信息中的至少一个。
13.根据权利要求11所述的非暂时性计算机可读介质,其中,所述计算机可执行指令还使所述计算装置至少部分地基于所述至少两个旅行项目群集中的第一旅行项目群集中的单个旅行项目来确定针对所述第一旅行项目群集的预期相关性,并且其中针对所述第一旅行项目群集的标识符是所述单个旅行项目的标识符。
14.根据权利要求11所述的非暂时性计算机可读介质,其中,所述计算机可执行指令使所述计算装置根据所述多个旅行项目的位置信息来聚类所述多个旅行项目,以至少部分地通过以下方式识别所述至少两个旅行项目群集:
对于所述多个旅行项目中的每个旅行项目:
确定所述旅行项目的位置是否在距离任何先前建立的群集的阈值距离内;
如果所述旅行项目被确定为在距离先前建立的群集的阈值距离内,则将所述旅行项目包括在所述先前建立的群集中;以及
如果所述旅行项目被确定为不在距离任何先前建立的群集的阈值距离内,则建立包括所述旅行项目的新的群集。
15.根据权利要求11所述的非暂时性计算机可读介质,其中,所述计算机可执行指令还使所述计算装置至少对所述选择的旅行项目群集中包括的旅行项目集合进行排名,并且其中,包括在所述选择的旅行项目群集中的旅行项目的集合的表示法表示了根据他们的相应排名的旅行项目的集合。
16.根据权利要求15所述的非暂时性计算机可读介质,其中,所述计算机可执行指令还使所述计算装置至少:
识别所述旅行项目中与期望的便利设施对应的一个或多个词条;以及
至少部分地基于所述期望的便利设施而将所述选择的旅行项目群集中包括的所述旅行项目的集合进行排名。
17.一种计算机实现方法,包括:
在执行特定计算机可执行指令的处理器的控制下,
接收来自计算装置的查询;
响应于所述查询识别多个旅行项目,其中,所述多个旅行项目的每一个旅行项目与位置信息相关联;
根据所述多个旅行项目的相应的位置信息来聚类所述多个旅行项目以识别至少两个旅行项目,所述至少两个旅行项目群集中的每一个旅行项目群集包括来自所述多个旅行项目中的旅行项目的集合;
确定针对所述至少两个旅行项目群集中的每一个旅行项目群集的标识符;
至少部分地基于针对所述至少两个旅行项目群集中的每一个旅行项目群集的所述确定的标识符来识别所述至少两个旅行项目群集中的旅行项目群集;以及
向所述用户计算装置发送与所述选择的旅行项目群集中包括的旅行项目集合有关的信息。
18.根据权利要求17所述的计算机实现方法,还包括:
识别所述旅行项目查询中与所述地理位置对应的一个或多个词条;
其中,响应于所述旅行项目查询而识别多个旅行项目包括识别与所述地理位置对应的多个旅行项目。
19.根据权利要求17所述的计算机实现方法,还包括:
识别所述旅行项目查询中与期望的便利设施对应的一个或多个词条;以及
其中响应于所述旅行项目查询而识别多个旅行项目包括忽略所述旅行项目查询中与期望的便利设施对应的一个或多个词条。
20.根据权利要求19所述的计算机实现方法,其中,识别所述旅行项目查询中与所述期望的便利设施对应的一个或多个词条包括将自然语言处理应用到所述旅行项目查询。
21.根据权利要求17所述的计算机实现方法,还包括至少部分地基于所述至少两个旅行项目群集中的第一旅行项目群集中的单个旅行项目来确定针对所述第一旅行项目群集的预期相关性,并且其中针对所述第一旅行项目群集的标识符是所述单个旅行项目的标识符。
22.根据权利要求17所述的计算机实现方法,其中,至少部分地基于所述至少两个旅行项目群集中每一个旅行项目群集的所述确定的标识符来识别所述至少两个旅行项目群集中的旅行项目群集包括:
向所述计算装置发送所述至少两个旅行项目群集中的每一个旅行项目群集的标识符;并且
从所述计算装置接收对所述旅行项目群集的选择。
23.根据权利要求17所述的计算机实现方法,其中至少部分地基于所述至少两个旅行项目群集中每一个旅行项目群集的所述确定的标识符来识别所述至少两个旅行项目群集中的旅行项目群集包括:
至少部分地基于所述用户获取的旅行项目的历史来确定与所述计算装置关联的用户的至少一个优选地理地区;并且
确定与所述优选地理地区相对应的旅行项目群集的位置。
CN201680043993.8A 2015-07-28 2016-07-13 用于消除旅行查询的歧义的计算机实现方法和系统 Active CN107924404B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/811,446 US10360276B2 (en) 2015-07-28 2015-07-28 Disambiguating search queries
US14/811,446 2015-07-28
PCT/US2016/042145 WO2017019304A1 (en) 2015-07-28 2016-07-13 Disambiguating search queries

Publications (2)

Publication Number Publication Date
CN107924404A true CN107924404A (zh) 2018-04-17
CN107924404B CN107924404B (zh) 2022-10-21

Family

ID=57882785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680043993.8A Active CN107924404B (zh) 2015-07-28 2016-07-13 用于消除旅行查询的歧义的计算机实现方法和系统

Country Status (7)

Country Link
US (2) US10360276B2 (zh)
EP (1) EP3329400A4 (zh)
JP (1) JP6790067B2 (zh)
CN (1) CN107924404B (zh)
CA (1) CA2992997C (zh)
HK (1) HK1248329A1 (zh)
WO (1) WO2017019304A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113574549A (zh) * 2019-03-13 2021-10-29 艾克斯佩迪亚公司 机器学习应用中的分类字段值的处理

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6190041B2 (ja) * 2014-03-31 2017-08-30 株式会社日立国際電気 安否確認システム及び秘匿化データの類似検索方法
US10360276B2 (en) 2015-07-28 2019-07-23 Expedia, Inc. Disambiguating search queries
US10169470B2 (en) * 2016-04-11 2019-01-01 Rovi Guides, Inc. Systems and methods for identifying a meaning of an ambiguous term in a natural language query
US11036800B1 (en) * 2016-04-29 2021-06-15 Veritas Technologies Llc Systems and methods for clustering data to improve data analytics
US11232136B2 (en) * 2016-06-27 2022-01-25 Google Llc Contextual voice search suggestions
US10311057B2 (en) 2016-08-08 2019-06-04 International Business Machines Corporation Attribute value information for a data extent
US10360240B2 (en) 2016-08-08 2019-07-23 International Business Machines Corporation Providing multidimensional attribute value information
US11227237B2 (en) * 2018-02-22 2022-01-18 Amadeus S.A.S. Exchanges with automatic consideration of factors associated with the exchanges
US11232115B2 (en) * 2018-04-11 2022-01-25 Nokia Technologies Oy Identifying functional zones within a geographic region
JP7259854B2 (ja) * 2018-06-14 2023-04-18 日本電気株式会社 質問応答装置、質問応答方法およびプログラム
US11443005B2 (en) * 2019-05-31 2022-09-13 Microsoft Technology Licensing, Llc Unsupervised clustering of browser history using web navigational activities
US11922338B2 (en) * 2019-12-10 2024-03-05 Amadeus S.A.S. Devices, systems and methods for providing ancillary objects from a cache and categorized provider objects
US11281736B1 (en) * 2019-12-12 2022-03-22 Amazon Technologies, Inc. Search query mapping disambiguation based on user behavior
US11762856B2 (en) * 2020-04-07 2023-09-19 Servicenow, Inc. Query response module and content links user interface
US11720240B1 (en) * 2021-06-20 2023-08-08 Tableau Software, LLC Visual autocompletion for geospatial queries

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101636935A (zh) * 2007-01-17 2010-01-27 谷歌公司 搜索查询中的位置
US20100088314A1 (en) * 2008-10-07 2010-04-08 Shaobo Kuang Method and system for searching on internet
CN102308184A (zh) * 2009-02-13 2012-01-04 雅虎公司 地图上的基于实体的搜索结果和集群
CN103294712A (zh) * 2012-02-29 2013-09-11 三星电子(中国)研发中心 实时热点区域推荐系统和方法
US20140289006A1 (en) * 2013-03-20 2014-09-25 Kaptivating Hospitality LLC Method and System For Social Media Sales
US20150073941A1 (en) * 2011-12-13 2015-03-12 Emma Burrows Hotel finder interface
US20150161271A1 (en) * 2013-12-06 2015-06-11 Here Global B.V. User Retrieval Enhancement

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140214461A1 (en) * 2003-07-03 2014-07-31 Priceline.Com Llc Indexing travel accommodations in a network environment
ATE537893T1 (de) * 2005-10-10 2012-01-15 Korea Mach & Materials Inst Vorrichtung zur nox-reduktion mittels speicherkatalysatoren unter verwendung eines plasmareaktors
US20080097873A1 (en) 2006-06-05 2008-04-24 Elliot Cohen System for online travel planning and hotel selection
US20090024597A1 (en) * 2007-04-13 2009-01-22 Iac Search & Media, Inc. Forming web search queries from browsing annotated images
US8914366B1 (en) * 2007-06-29 2014-12-16 Google Inc. Evaluating clustering based on metrics
US20090228339A1 (en) 2008-03-05 2009-09-10 David Wolf Method and system for revenue per reverse redirect
US7987195B1 (en) 2008-04-08 2011-07-26 Google Inc. Dynamic determination of location-identifying search phrases
US20090287546A1 (en) 2008-05-16 2009-11-19 Trx, Inc. System and method for organizing hotel-related data
US20110022423A1 (en) * 2009-07-27 2011-01-27 Dealbase, Inc. Methods and systems for transmitting alerts on hotel deals
US8781898B1 (en) * 2011-03-01 2014-07-15 Google Inc. Location query targeting
US20120254186A1 (en) * 2011-03-31 2012-10-04 Nokia Corporation Method and apparatus for rendering categorized location-based search results
JP5708278B2 (ja) 2011-06-08 2015-04-30 ソニー株式会社 情報処理装置および情報処理方法
JP2012256268A (ja) * 2011-06-10 2012-12-27 Ad Space Co Ltd 広告配信装置及び広告配信プログラム
JP5516525B2 (ja) * 2011-07-20 2014-06-11 トヨタ自動車株式会社 運転支援装置
US20130031506A1 (en) * 2011-07-25 2013-01-31 Google Inc. Hotel results interface
WO2013070977A1 (en) * 2011-11-10 2013-05-16 Room 77, Inc. Metasearch infrastructure with incremental updates
US20130218687A1 (en) * 2012-02-17 2013-08-22 Graphdive, Inc. Methods, systems and devices for determining a user interest and/or characteristic by employing a personalization engine
JP5912667B2 (ja) * 2012-02-29 2016-04-27 綜合警備保障株式会社 クラスタリング装置およびクラスタリング方法
US20140358910A1 (en) * 2013-05-29 2014-12-04 Microsoft Corporation Integrated search results
CA2924191C (en) * 2013-09-13 2023-10-17 Keith FISHBERG Amenity, special service and food/beverage search and purchase booking system
JP2015102805A (ja) * 2013-11-27 2015-06-04 アルパイン株式会社 音声認識システム、電子装置、サーバー、音声認識方法および音声認識プログラム
US9618343B2 (en) 2013-12-12 2017-04-11 Microsoft Technology Licensing, Llc Predicted travel intent
US20160125320A1 (en) * 2014-10-31 2016-05-05 Google Inc. Grouping flight search results
US10360276B2 (en) 2015-07-28 2019-07-23 Expedia, Inc. Disambiguating search queries

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101636935A (zh) * 2007-01-17 2010-01-27 谷歌公司 搜索查询中的位置
US20100088314A1 (en) * 2008-10-07 2010-04-08 Shaobo Kuang Method and system for searching on internet
CN102308184A (zh) * 2009-02-13 2012-01-04 雅虎公司 地图上的基于实体的搜索结果和集群
US20150073941A1 (en) * 2011-12-13 2015-03-12 Emma Burrows Hotel finder interface
CN103294712A (zh) * 2012-02-29 2013-09-11 三星电子(中国)研发中心 实时热点区域推荐系统和方法
US20140289006A1 (en) * 2013-03-20 2014-09-25 Kaptivating Hospitality LLC Method and System For Social Media Sales
US20150161271A1 (en) * 2013-12-06 2015-06-11 Here Global B.V. User Retrieval Enhancement

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113574549A (zh) * 2019-03-13 2021-10-29 艾克斯佩迪亚公司 机器学习应用中的分类字段值的处理

Also Published As

Publication number Publication date
US20190340211A1 (en) 2019-11-07
EP3329400A1 (en) 2018-06-06
EP3329400A4 (en) 2019-04-10
US10360276B2 (en) 2019-07-23
US20170031931A1 (en) 2017-02-02
WO2017019304A1 (en) 2017-02-02
JP2018526731A (ja) 2018-09-13
CA2992997C (en) 2023-11-21
CA2992997A1 (en) 2017-02-02
CN107924404B (zh) 2022-10-21
US11436294B2 (en) 2022-09-06
HK1248329A1 (zh) 2018-10-12
JP6790067B2 (ja) 2020-11-25

Similar Documents

Publication Publication Date Title
CN107924404A (zh) 消除搜索查询的歧义
US10510129B2 (en) Selecting photographs for a destination or point of interest
US10656776B2 (en) Related tasks and tasklets for search
CN105912669B (zh) 用于补全搜索词及建立个体兴趣模型的方法及装置
KR101514588B1 (ko) 검색 결과 페이지 상에 문맥 액션들을 제공하기 위한 시스템 및 방법
US10235470B2 (en) User retrieval enhancement
US8682882B2 (en) System and method for automatically identifying classified websites
CN103514299B (zh) 信息搜索方法和装置
CN103038769B (zh) 用于将内容导引到社交网络引擎用户的系统和方法
CN108090111B (zh) 用于搜索结果的动画摘录
KR20140016247A (ko) 광고주에게 추상 오브젝트에 대한 입찰 기회 제공
Popescu et al. Mining social media to create personalized recommendations for tourist visits
CN110096645A (zh) 信息推荐方法、装置、设备和介质
TW201007488A (en) System and method for trail identification with search results
CN101151607A (zh) 用于提供产品评论的方法、系统和图形用户界面
KR20170030379A (ko) 사용자 선호에 맞춘 여행 큐레이션 서비스 방법 및 시스템
AU2012359698A1 (en) Search device, search method, search program, and recording medium
CN106462596A (zh) 生成上下文搜索呈现
KR101981136B1 (ko) 추천 컨텐츠 제공 시스템, 방법 및 프로그램
KR101747532B1 (ko) 여행성 질의에 대응하는 검색 결과로 코스를 추천하는 방법 및 시스템
CN110096609A (zh) 房源搜索方法、装置、设备及计算机可读存储介质
WO2013067444A2 (en) Triggering social pages
CN111523962A (zh) 搜索方法、装置、电子设备及存储介质
KR102151598B1 (ko) 키워드 속성을 기준으로 관련 있는 키워드를 제공하는 방법 및 시스템
JP7455913B2 (ja) レビュー分析によって下位アイテムのカテゴリを自動分類して検索に活用する方法、システム、およびコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1248329

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant