CN111143659A - 用于执行智能跨域搜索的系统和方法 - Google Patents

用于执行智能跨域搜索的系统和方法 Download PDF

Info

Publication number
CN111143659A
CN111143659A CN201911024261.6A CN201911024261A CN111143659A CN 111143659 A CN111143659 A CN 111143659A CN 201911024261 A CN201911024261 A CN 201911024261A CN 111143659 A CN111143659 A CN 111143659A
Authority
CN
China
Prior art keywords
language
query
results
result
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911024261.6A
Other languages
English (en)
Inventor
张沁迪
宋巧至
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoundHound Inc
Original Assignee
SoundHound Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/179,843 external-priority patent/US20200142890A1/en
Application filed by SoundHound Inc filed Critical SoundHound Inc
Publication of CN111143659A publication Critical patent/CN111143659A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本公开提供了用于执行智能跨域搜索的系统和方法。公开的技术涉及执行跨语言搜索。跨语言搜索可以包括:接收第一语言的第一查询;将第一查询从第一语言翻译成第二语言以获得第二语言的第二查询;基于第一查询执行第一搜索以获得第一语言结果;基于第二查询执行第二搜索以获得第二语言结果;将第二语言结果翻译成第一语言以获得经翻译的第二结果;并且输出总体结果,该总体结果包括第一语言结果中的至少一些以及经翻译的第二结果中的一些。

Description

用于执行智能跨域搜索的系统和方法
技术领域
该技术涉及在互联网上执行的音频和书面搜索查询。特别地,公开的技术基于针对单一语言或互联网域的单个查询来实施跨语言和/或跨域的互联网搜索,以提供通过以多种语言和/或在多个互联网域中执行查询所得到的整合的总体搜索结果。
背景技术
互联网上针对特定搜索可用的最佳信息常常可能在与用户正在搜索的语言和/或域不同的语言和/或域中。许多互联网用户不知道查询的搜索结果会根据启动搜索的语言和/或域的不同而不同。通常,互联网用户以他们自己的母语和/或在与他们当前地理位置相对应的互联网域中启动搜索(例如,提交查询)。遗憾的是,最佳结果可能通常是隐藏在与初始搜索语言不同的语言中和/或位于与用户具有能力或知识以能够搜索的域不同的域中。
例如,用户可以在互联网上搜索有关“cherry blossoms(樱花)”的信息,其中搜索是使用英语进行的,并且搜索是在英语(美国)域中进行的(例如,在“google.com”上搜索英语单词“cherry blossoms”)。搜索结果将取决于英语域中英语的可用内容。日语和/或日语域中可用的有关“cherry blossoms”的信息不会被提供给用户,尽管日语和/或日语域中可能存在有关“cherry blossoms”的更多信息,因为樱花是日语文化的著名组成部分。
作为另一个示例,典型的互联网用户不知道当用户搜索“wikipedia.org”(英语域)时,“Wikipedia”提供的结果与“jp.wikipedia.org”(日语域)相比大为不同。具体而言,从英语维基百科域中用英语搜索“cherry blossoms”的结果与从日语维基百科域中用日语搜索“cherry blossoms”的结果大为不同。来自两个不同的维基百科域的不同结果不只是彼此的翻译。相反,它们包含有关樱花的不同信息。换句话说,英语域的结果不仅仅是日语域的结果的翻译,反之亦然。来自日语域的结果更有可能提供更多细节,而且是从日语文化的角度来看的。结果根据语言和域将有很大的不同,并且以特定语言或来自特定域的一个特定结果可能比来自其他语言和/或域的其他结果更好。问题是典型的互联网用户不具备确定如何从搜索中获得最佳结果的知识或能力,因为他们不知道如何使用不同的语言和从不同的域来启动搜索。通常,用户受限于以其母语和/或在他们的默认域中进行搜索。
因此,出现了开发可以从单个直观界面实现跨语言和跨域搜索的技术的机会,该单个直观界面以一种语言提供从以多种语言和多个域进行的搜索翻译而来的结果。公开的技术提供了这样的特征,从用户的角度来看,这些特征允许更高效、准确和有用的搜索结果。
发明内容
公开的技术通过提供执行跨语言和/或跨域搜索的方法来解决上述问题。所述方法可以包括:接收第一语言的第一查询;将所述第一查询从所述第一语言翻译成第二语言以获得所述第二语言的第二查询;基于所述第一查询执行第一搜索以获得第一语言结果;基于所述第二查询执行第二搜索以获得第二语言结果;将所述第二语言结果翻译成所述第一语言以获得经翻译的第二结果;并且呈现整合的总体结果,所述总体结果包括所述第一语言结果中的至少一些以及所述经翻译的第二结果中的一些。
此外,公开的技术包括非暂时性计算机可读记录介质,所述非暂时性计算机可读记录介质上记录有用于执行跨语言搜索的计算机程序。当在包括处理器和存储器的计算机上执行所述计算机程序时,所述计算机执行一种方法。所述方法可以包括:接收第一语言的第一查询;将所述第一查询从所述第一语言翻译成第二语言以获得所述第二语言的第二查询;基于所述第一查询执行第一搜索以获得第一语言结果;基于所述第二查询执行第二搜索以获得第二语言结果;将所述第二语言结果翻译成所述第一语言以获得经翻译的第二结果;并且呈现整合的总体结果,所述总体结果包括所述第一语言结果中的至少一些以及所述经翻译的第二结果中的一些。
公开的技术还包括一种系统,所述系统包括与存储器耦接的一个或多个处理器,其中所述存储器加载有用于执行跨语言搜索的计算机指令。当在处理器上执行计算机指令时,处理器执行包括以下各项的动作:接收第一语言的第一查询;将所述第一查询从所述第一语言翻译成第二语言以获得所述第二语言的第二查询;基于所述第一查询执行第一搜索以获得第一语言结果;基于所述第二查询执行第二搜索以获得第二语言结果;将所述第二语言结果翻译成所述第一语言以获得经翻译的第二结果;并且呈现整合的总体结果,所述总体结果包括所述第一语言结果中的至少一些以及所述经翻译的第二结果中的一些。
公开的技术还包括用于执行跨语言和/或跨域搜索的设备。所述设备可以包括:用于接收第一语言的第一查询的装置;用于将所述第一查询从所述第一语言翻译成第二语言以获得所述第二语言的第二查询的装置;用于基于所述第一查询执行第一搜索以获得第一语言结果的装置;用于基于所述第二查询执行第二搜索以获得第二语言结果的装置;用于将所述第二语言结果翻译成所述第一语言以获得经翻译的第二结果的装置;以及用于呈现整合的总体结果的装置,所述总体结果包括所述第一语言结果中的至少一些以及所述经翻译的第二结果中的一些。
在权利要求书、说明书和附图中描述了公开的技术的特定方面。
附图说明
图1示出了执行互联网搜索的传统方法。
图2示出了公开的技术的示例性实施方式。
图3是由公开的技术执行以实施跨语言和/或跨域搜索的过程的示例说明。
图4示出了示例性环境,其中可以通过公开的技术来实施跨语言和/或跨域搜索。
图5是可以实施图4的环境的各种部件的示例性计算机系统的框图。
具体实施方式
参考附图进行以下详细描述。描述了示例性实施方式以说明公开的技术,而不是限制其范围,该范围由权利要求书限定。本领域普通技术人员将认识到对以下描述的各种等效变化。
图1示出了执行互联网搜索的传统方法100。
具体地,图1示出了传统方法100包括从来自麦克风或一些其他类型的输入设备的语音输入102、来自键盘或一些其他类型的文本输入设备的文本输入104或一个或多个电子文件106等中的一个接收搜索或查询请求,电子文件可以包括从其他来源汇编的文本。然后,处理从语音输入102、文本输入104或一个或多个电子文件106收集的信息以生成例如英语的查询108。在此示例中,查询108以英语进行,因为用户在语音输入102中说的语言是英语,由此可以获得英语转录(transcription),或因为输入文本104和/或一个或多个电子文件106包含英语单词。
然后将查询108(它是从文本输入104或一个或多个电子文件106接收的直接文本或源自语音输入102的转录)发送到用户的(默认)域。换句话说,将英语文本110作为一个或多个关键词提供到用户的所选的域或默认域。
对于用英语进行的一般搜索,用户的域可能是诸如Google、Bing或Yahoo之类的知名搜索引擎之一。在所示出的该传统方法100中,英语文本110作为用户的搜索或查询被发送到英语域的google.com 112和/或同样是英语域的wikidpedia.org 114。通常,互联网搜索者会使用一般的“包罗万象(catch-all)”搜索引擎(诸如google.com 112)进行首次搜索。如果用户未找到所需结果,则用户可转移到更专业的域,诸如wikipedia.org 114。本申请领域的普通技术人员熟知许多可用的更加专业的域。
出于说明目的,此示例示出了用户对google.com 112域和wikipedia.org 114域两者的搜索或查询。用户一般不会同时搜索两个域。然而,如下所述,一个域可与另一域共享信息。google.com 112将提交的搜索词用于查询google.com数据库116。类似地,wikipedia.org 114可以使用搜索词来查询wikipedia.org数据库118。google.com数据库116通常共享或访问wikipedia.org数据库118的内容。例如,在google.com 112域上的搜索可以根据从google.com数据库116和wikipedia.org数据库118两者得到的信息来提供详细的结果。该信息被wikipedia.org数据库118共享,使得互联网搜索者可以从google.com112域提供的搜索结果中获取wikipedia.org数据库118的一些或全部匹配内容。结果被整合并以总结的形式呈现给用户120,其中用户随后可以点击或选择搜索结果所源自的其他域。
如背景技术部分中提到的,这种传统方法100的问题在于,并不总是在英语和/或英语域中找到最佳结果。
相应地,公开的技术能够基于以单一语言和/或在单一域中启动的搜索来执行跨语言和/或跨域搜索。
图2示出了公开的技术的示例性实施方式200。
类似于图1,图2示出了从来自麦克风或一些其他类型的输入设备的语音输入202、来自键盘或一些其他类型的文本输入设备的文本输入204或一个或多个电子文件206等中的一个接收搜索或查询请求,电子文件可以包括从其他来源汇编的文本。然后,处理从语音输入202、文本输入204和一个或多个电子文件206收集的信息以生成例如英语的查询208。在此示例中,查询208以英语进行,因为用户在语音输入202中说的语言是英语,由此可以获得英语转录,或因为输入文本204和/或一个或多个电子文件206包含英语单词。
然后将查询208(它是从文本输入204或一个或多个电子文件206接收的直接文本或源自语音输入202的转录)作为英语文本210发送或者可替代地作为音频发送以供翻译212。这是图2与图1的单一语言/域实施方式不同的地方。公开的技术与传统方法100的不同之处在于英语的查询208被翻译成至少一种其他语言并且被发送到至少一个其他域。
由于初始查询208是以英语进行,因此不需要执行翻译212来将英语文本210发送到一个或多个英语域,诸如google.com 214和wikipedia.org 218。这些英语域仅是一些较流行的英语域的示例。公开的技术可以使用单个英语域,或者可以搜索多个英语域。公开的技术可以被配置为使用可以由用户预先选择的一个或多个默认域。另外,可以根据搜索的主题自动选择域,并且可以为用户提供添加或删除域的选项。该示例性实施方式200包括两个英语域。然而,可以只使用一个英语域,也可以使用两个以上英语域。与图1相似,图2示出了使用google.com 214域执行的搜索利用google.com数据库216,而使用wikipedia.org218执行的搜索利用wikipedia.org数据库220。
翻译212可以将英语文本210翻译成另一种语言,例如日语。以英语进行查询208只是为了举例。查询208可以以日语进行,然后公开的技术将文本翻译成其他语言并搜索其他域。用户可以在查询时选择翻译212的语言,并且用户可以预先指定翻译语言,和/或可以基于查询的内容智能地选择翻译语言。例如,可以基于搜索的主题、基于用户过去的浏览器历史、或其他应用或程序的历史使用来识别要翻译成的一种或多种语言。
在此示例中,由于查询被翻译成日语,因此经翻译的查询用于对日语域(诸如google.co.jp 222和/或jp.wikipedia.org 226)执行搜索。使用google.co.jp 222执行的搜索可以使用google.co.jp数据库224,并且使用jp.wikipedia.org 226执行的搜索可以使用jp.wikipedia.org数据库228。就像英语域一样,jp.wikipedia.org数据库228可以与google.co.jp数据库224共享信息。公开的技术不仅限于原始查询语言(即英语)、英语域、经翻译的查询语言(即日语)和日语域。原始查询可以是与任何一个或多个域组合的任何语言,并且经翻译的语言可以包括与原始语言不同的一种或多种语言。公开的技术可以实施除与原始语言一起使用的原始域之外的一个或多个其他域。语言/域的数量可以由用户预先选择,或者可以基于对原始语言的原始查询的分析来智能地确定。例如,原始语言中的原始查询可以包括关键词,这些关键词触发3种不同语言(例如,日语、汉语和韩语)和相应域中可用的高度可能性相关结果。用户可以限制公开的技术能够实施的替代语言和/或域的数量。
一旦从使用google.com数据库216、wikipedia.org数据库220、google.co.jp数据库224和jp.wikipedia.org数据库228执行的相应搜索中获得结果,可以对结果执行评分和排名230。评分和排名230可以以许多不同的方式执行,其中一些在下面进一步详细描述。可以基于结果的相关性或其他因素(诸如,所搜索产品(例如,餐厅菜肴等)的等级)进行评分。可以对结果分别进行评分和排名,使得来自一个或多个英语域的结果与来自一个或多个日语域的结果分开进行评分和排名。这样,用户能够区分每个域的最佳结果。可以基于结果与特定话题的相关性对结果进行评分,可以在执行搜索之前识别和/或可以基于结果本身识别该特定话题。可替代地,所有结果可以一起被收集、评分、排名、排序,然后以无缝的整合方式呈现给用户,使得用户不需要担心自己搜索了哪种语言或域。还可以基于其他搜索的趋势、流行度信息、个人配置资料信息、用户位置和/或相关主题以及查询时间对结果进行评分。也可以实施加权,以对例如来自更可能相关的语言或域的结果分配更高的权重(例如,如果樱花的搜索结果是采用日语和/或来自日语域,则该搜索结果会具有较高权重,这与来自西班牙语域的西班牙语结果相反)。
流行度信息的示例可以是查询针对词语“president(总统)”。在Wikipedia域上进行搜索时,对于有关美国总统的文章,搜索词“president”的点击率最高。此示例性流行度信息表明对于搜索词“president”美国总统具有最高的流行度。通过给包括现任美国总统在内的结果较高分数,可以将“高流行度”结果并入到评分中。
一个或多个日语域的结果最可能是采用日语的。因此,对于除原始查询语言之外的语言的所有结果执行翻译232。如果出于某种原因,用户倾向于不同的语言,则用户还能够选择将所有结果翻译成不同的语言(例如德语)。在翻译232之后,将结果呈现给用户236。可替代地,可以在评分/排名230之前执行翻译232。
可以以许多不同形式将结果呈现给用户236。例如,如果用户在车辆中使用语音界面系统,则可以将预先配置的相对少量的结果口述给用户或呈现在车辆的屏幕上。关键是,当使用语音界面系统时,用户可能无法容易或安全地读取所有结果。如果用户不喜欢结果的初始列表,则用户可以请求下一组预先配置数量的结果。相对地,如果用户正在使用计算机、平板电脑或智能手机,则将在其屏幕上向用户提供预先配置数量的结果。该预先配置的数量将可能比语音界面系统的预先配置的数量大得多。例如,如上所述,可以基于结果的原始语言和/或域使结果彼此分开(例如,可以将英语/域结果与日语/域结果分开,然后根据其评分和排名进行呈现)。
图3是由公开的技术执行以实施跨语言和/或跨域搜索的过程300的示例说明。
具体地,图3所示的过程300包括在操作302中接收查询。上面参考图2更详细地描述了查询的接收。过程300还可以包括操作304,该操作包括执行可选的话题分析和关键词扩展。作为示例,图3所示的实施方式将使用英语“golden week(黄金周)”的原始查询。在操作302中接收查询,并且在操作304中执行“golden week”的话题分析。话题分析可以实施话题模型306以帮助确定与短语“golden week”最一致的一个或多个话题。可以实施诸如深度学习和神经网络之类的人工智能以利用话题模型306来识别与查询有关的一个或多个话题。可替代地,单词或短语列表可以用于识别话题。用于执行话题分析的其他方法对于本领域技术人员将是清楚的。
继续“golden week”的示例,话题分析可能会发现“golden week”指的是日本和中国的假期或一周的假期。基于该话题分析,公开的技术可以在操作304中将关键词“holiday”添加到“golden week”的原始查询。可能会询问用户其是指在假期方面还是在一些其他话题方面的“golden week”。无论用户是否确认,都可以扩展搜索的关键词,以向用户提供更好的结果。以相同的方式,可以询问用户特定域是否是适当的域。
可选地,可以实施操作308以进一步消除原始搜索词“golden week”或与扩展关键词组合的原始搜索词“golden week holiday”的歧义,以进一步缩小将要执行的搜索。歧义消除是指使用例如可以从其他来源获得的外部数据310使搜索词更具体。例如,公开的技术可以:(i)识别用户或先前搜索过“golden week”和/或“golden week holiday”的其他用户查看(点击)的先前搜索和结果(例如,流行度结果);(ii)从用户的个人配置资料中获取信息,这些信息可能有助于对原始搜索添加含义,(iii)获取有关用户可能有的即将到来的旅行计划的信息,这些信息可能有助于对原始搜索添加含义;和/或(iv)考虑进行初始搜索的日期和/或时间以有助于对原始搜索添加含义。
关于流行度结果,流行度的示例可以是查询词语“golden week”。在Wikipedia域上进行搜索时,对于有关日本黄金周的文章,搜索词“golden week”的点击率最高。该示例性流行度信息表明,对于搜索词“golden week”,关于日本黄金周的文章具有最高流行度。此“高流行度”结果可用于更新搜索词或关键词以包括“golden week Japan”或“goldenweek holiday Japan”。
例如,公开的技术可能能够根据个人配置资料信息和/或社交媒体信息确定用户下周要去日本旅行,而下周恰好是日本的“golden week”周。这样的歧义消除可以帮助公开的技术进一步将搜索限制为“golden week holiday Japan”。可以获得的任何歧义消除信息也可以用于选择将使用哪一种或哪几种语言翻译原始搜索。
在操作312中,搜索词被翻译成一种或多种语言。如参考图2所描述的,用于翻译的一种或多种语言可以由用户预先选择或者基于原始查询的内容以及从可选操作304和/或308获得的任何进一步的信息来智能地选择。
在操作314和操作318中,经翻译的搜索词用于在相应域中执行搜索。同样,公开的技术可以翻译成多种语言,并且在许多不同的域中实施搜索。例如,在没有消歧操作308的情况下,公开的技术可以将搜索“golden week holiday”翻译成日语和汉语,然后在相应的域中执行搜索。另外,可以使用英语、汉语和日语在日语域中执行搜索。日语域不必仅限于日语。
在操作316中,可以对操作314中的搜索结果执行可选的话题分析。这可以用于识别结果的话题主题,并最终导致结果的更准确评分。例如,与话题“holiday”无关的结果的评分可以低于关注“holiday”的结果。类似地,在操作320中,可以对操作318中的搜索结果执行可选的话题分析。在操作314、318中获得搜索结果并在操作316、320中进行可选话题分析之后,公开的技术将在操作322中对结果进行评分和排名。如果执行了话题分析,则评分和排名可以使用话题分析的发现为与话题分析更一致的结果分配较高评分。如果未执行话题分析,则可以基于用于开始搜索的搜索词对结果进行评分。附加关键词324可以用于帮助对结果进行评分。例如,同义词和反义词的数据库可用于评估搜索结果的相关性。评分和排名还可以使用流行度数据、个人配置资料信息和/或时间、位置、日期信息来对结果进行评估、评分和排名。
在操作326中将结果翻译回原始语言,然后在操作328中最终将其呈现给用户。如以上参考图2所讨论的,用户可以选择将结果翻译成与原始语言不同的语言,并且可以以多种不同方式(包括视觉上或口头上)将结果呈现给用户。
图4示出了示例性环境400,其中可以通过公开的技术来实施跨语言和/或跨域搜索。环境400包括至少一个用户设备402、406。用户设备402可以是移动电话、平板电脑、工作站、台式计算机、膝上型计算机或运行应用404的任何其他类型的用户设备。用户设备402可以是汽车406或运行应用404的硬件和软件的任何其他组合。
用户设备402、406连接到一个或多个通信网络408,该通信网络允许环境400的各个部件之间的通信并且允许在互联网或其他网络上执行搜索。在一种实施方式中,通信网络408包括互联网。通信网络408也可以利用未必是公共互联网的一部分的专用或私人通信链路。在一种实施方式中,通信网络408使用标准通信技术、协议和/或进程间通信技术。用户设备402、406能够以第一语言接收例如第一查询,其中查询的目的是在互联网或私人网络上执行搜索。在用户设备402、406上实施应用404以捕获第一查询,无论第一查询是语音输入还是文本输入。
环境400还包括可以预安装在用户设备402、406上或通过通信网络408更新/安装在用户设备402、406上的应用410。此外,环境400包括应用编程接口(API)411,这些API也可以预安装在用户设备402、406上,或者通过通信网络408更新/安装在用户设备402、406上。可以实施API 411以允许用户设备402、406和应用410容易地获得对环境400以及某些私人网络上的其他部件的访问。
环境400还包括翻译器412,该翻译器可以在作为语音识别系统的一部分的一个或多个平台/服务器上运行。翻译器412可以是单个计算设备(例如,服务器)、云计算设备,或者翻译器可以是能够相互通信以执行实现有意义的翻译以及语音识别(如果需要)所需的各种任务的计算设备、云计算设备等的任意组合。翻译器412可以包括深度学习系统414,该深度学习系统能够使用人工智能、神经网络和/或机器学习以将一种语言翻译成另一种语言。深度学习414可以实施语言嵌入(诸如一个或多个模型)416以及自然语言域418以提供用于自然语言处理(NLP)的特定域的翻译和解析。
由于翻译器412可以分布在多个服务器和/或云计算设备上,因此深度学习414、语言嵌入416和自然语言域418的操作也可以分布在多个服务器和/或云计算设备上。应用程序410可以由翻译器412使用和/或与翻译器结合使用以翻译语音输入以及文本输入和文本文件输入。再者,为了安全性和效率,环境400的各种部件可以使用定制的API 411彼此通信(交换数据)。
翻译器412能够将从用户设备402、406或任何其他类型的用户设备获得的第一查询从第一语言翻译成第二语言以获得第二语言的第二查询。输入第一查询的用户可以预先选择第二语言,或者可以基于第一查询的内容选择第二语言。环境400还可以经由用户设备402、406要求用户选择第二语言。翻译器412不限于仅实施第二语言。可以将第一查询翻译成多种语言(例如,第二、第三、第四种语言等)。实际上,对第一查询可以翻译成的语言没有数量限制。
用户设备402、406和翻译器412可以各自包括:用于存储数据和软件应用的存储器;用于在执行应用中访问数据的处理器;以及便于通过通信网络408进行通信的部件。用户设备402、406执行应用404,诸如Web浏览器(例如,在用户设备402上执行的Web浏览器应用404),以允许开发人员准备并提交应用410,并且允许用户提交包括自然语言发音的语音音频查询(例如,图2的语音输入202)以及文本查询(例如,图2的文本输入204和/或电子文本文件206),以由翻译器412翻译。
如上所述,翻译器412可以根据使用本领域普通技术人员已知的技术创建并训练的嵌入(模型)库(未示出)实施一个或多个语言嵌入(模型)416。翻译器412的语言嵌入(模型)416可以创建所接收的语音输入和/或所接收的文本的一个或多个翻译(转录)。
同样如上所述,可以由翻译器412实施自然语言域416以便为所接收的语音输入和/或文本输入的翻译(例如,转录)添加上下文或真实含义。
环境400可以进一步包括话题分析器420,该话题分析器可以实施一个或多个话题模型422以分析例如第一查询来确定第一查询的第一语言的话题。上面参考图3和使用话题模型306执行话题分析的操作304讨论了话题分析器420的一些操作。
此外,环境400可以包括歧义消除器424,该歧义消除器能够利用任何类型的外部数据426(例如歧义消除信息),以便向获得的查询添加进一步的含义。上面参考图3和消除接收到的查询的歧义的操作308讨论了歧义消除器424的一些操作。本质上,歧义消除器424能够通过分析用户的先前搜索、用户的配置文件数据、用户的社交数据、用户最近搜索以及其他互联网搜索的流行度数据、位置信息、日历信息、日期和时间信息等向查询添加进一步的含义。例如,歧义消除器424可以用于向初始搜索添加附加关键词,附加关键词可以有助于将搜索缩小到用户真正想要查找的内容。歧义消除器424还可以向搜索添加附加限制,诸如某些日期和/或时间框(例如,基于用户的旅行计划,可以向原始查询添加附加限制以识别当用户旅行到某个区域时发生的事件)。
环境400还可以包括关键词扩展器428,该关键词扩展器本质上根据话题分析器420和/或歧义消除器424所识别的任何话题向用户的查询添加关键词或短语。例如,如果由用户设备402、406中的一个获得的第一语言的第一查询是“golden week”,则话题分析器420可以分析第一查询并确定话题是“holiday”。如前所述,黄金周至少是日本的假期和中国的假期。歧义消除器424可以使用外部数据426来确定用户在日本安排了假期,并且该用户在上个月对日本京都的搜索次数增加。因此,关键词扩展器428可以将第一查询的词语从“golden week”扩展到“golden week holiday Japan”。换句话说,关键词扩展器428可以使用话题分析器420和歧义消除器424获得的结果的组合以通过添加附加关键词(例如,过滤器)来实质上缩小第一查询的范围。话题分析器420、歧义消除器424和关键词扩展器428可以对第二语言的第二查询以及被翻译成其他语言的其他查询执行相同的操作。关键词扩展器428还可以使用其他机制来扩展接收到的查询的关键词。这可以通过向用户询问有关其初始查询的宽泛或特定问题来完成,或者可以简单地使用人工智能或能够进一步缩小初始查询的其他手段来完成。
无论话题分析器420、歧义消除器424和/或关键词扩展器428是否被实施以改变任何查询的范围,环境400的搜索器432被实施为基于第一查询来执行第一搜索以获得第一语言结果,基于第二查询执行第二搜索以获得第二语言结果,并且基于N个查询执行N次搜索以获得N个语言结果(N为整数)。搜索器432可以实施语言和域数据434以确定应该使用哪些语言来搜索哪些域。
搜索器432可以例如根据话题分析器420所确定的第一语言和第一查询的话题中的至少一个来识别用于第一查询的第一域。搜索器432可以例如根据第二语言和第一和/或第二查询的话题中的至少一个进一步标识用于第二查询的第二域。转到“golden week”的示例,搜索器432可以在域“wikipedia.org”中以英语实施第一搜索“golden week holidayJapan”,并且在域“jp.wikipedia.org”中以日语实施第二搜索“golden week holidayJapan”。搜索器432不限于仅以第一语言搜索单个域和以第二语言搜索单个域。搜索器432可以并行或串行地以每种语言搜索多个域。例如,如果以第一语言在第一域中搜索之后发现结果数量不足,则可以以第一语言搜索第二域。以其他语言搜索其他域也是如此。
在一种实施方式中,可以实施话题分析器420、歧义消除器424和关键词扩展器428以在翻译器212将第一语言的第一查询翻译为第二语言的第二查询之前更新接收到的第一查询的内容。可替代地,可以实施话题分析器420、歧义消除器424和关键词扩展器428以在翻译器212将第一查询翻译成其他语言之后更新第二查询、第三查询等的内容。
在另一实施方式中,公开的技术可以根据话题分析器420、歧义消除器424和/或关键词扩展器428收集的信息来自动确定要翻译成的第二语言以及其他语言。
在从搜索器432获得搜索结果之后,可以实施评分器/排名器430以对结果进行评分和排名。可以再次实施话题分析器420以对结果执行话题分析。然后可以过滤结果以抛弃与查询的话题无关的结果。例如,话题分析器420可以识别与中国黄金周有关的一定数量的结果。由于结果的话题与日本黄金周无关,因此可能会抛弃这些结果或者由评分器/排名器430给这些结果分配低分。可替代地,可以对评分器/排名器430进行编程或建模以允许对与原始识别出的话题不同的话题进行一定量的探索,同时也投资(开发)被识别为具有与原始识别出的话题匹配的话题的结果。本领域技术人员将理解并认识到各种探索开发模型(exploration-exploitation model),可以实施这些模型以开发可能具有匹配话题的结果以及开发其他可能性。
就像歧义消除器424一样,评分器/排名器430可以使用流行度数据或信息、个人配置资料信息、社交网络信息、位置信息、时间和日期信息等来对结果进行评分。如先前参考图2和图3所提及的,评分器/排名器430可以基于域和/或语言按类别分配评分,或者可以对所有结果相对于彼此进行评分。可以实施本领域普通技术人员将理解的各种评分技术。此外,用户可以有选择权来选择要实施的各种评分和排名技术。例如,用户可以选择对每种语言/域独立实施(和呈现)评分和排名。这将导致用户接收英语域中所有英语结果的评分/排名,并且接收日语域中所有日语结果的单独评分/排名。评分器/排名器430可以仅呈现前X个结果或前百分之Y的结果以免使用户不知所措。X和Y的值可以取决于用户是提交了语音输入查询还是文本输入查询。
在对结果进行评分和排名之后,翻译器412可以将除第一语言之外的其他语言的结果翻译回第一语言。在翻译之后,结果可以以各种不同的形式被呈现给用户,诸如语音输出和/或文本输出。无论结果是以语音还是文本形式呈现,公开的技术还可以提供每个结果的简短视觉或听觉总结,从而使用户更容易确定他们想要首先查看的结果。
翻译器412、话题分析器420、歧义消除器424、关键词扩展器428、评分器/排名器430和/或搜索器432可以使用至少一个硬件部件来实施,并且还可以包括固件或在硬件上运行的软件。与硬件组合以执行翻译器412、话题分析器420、歧义消除器424、关键词扩展器428、评分器/排名器430和/或搜索器432的动作的软件可以被存储在计算机可读介质(诸如旋转或非旋转存储器)上。非旋转存储器可以是易失性的或非易失性的。在本申请中,计算机可读介质不包括未存储在存储器中的瞬时电磁信号;计算机可读介质存储用于执行的程序指令。翻译器412、话题分析器420、歧义消除器424、关键词扩展器428、评分器/排名器430和/或搜索器432以及应用程序410、话题模型422、外部数据426、语言和域数据434和API411可以在云端或由通过通信网络408连接的其他实体全部或部分托管或执行。
图5是可以实施图4的环境400的各种部件的示例性计算机系统的框图。计算机系统510通常包括经由总线子系统512与多个外围设备通信的至少一个处理器514。这些外围设备可以包括存储子系统524(包括例如存储器设备和文件存储子系统)、用户界面输入设备522、用户界面输出设备520和网络接口515。输入和输出设备允许用户与计算机系统510交互。网络接口515提供到外部网络的接口(包括到通信网络408的接口),并且经由通信网络408耦接到其他计算机系统中的相应接口设备。
用户界面输入设备522可以包括键盘、指向设备(诸如鼠标)、轨迹球、触摸板或图形输入板、扫描仪、并入显示器中的触摸屏、音频输入设备(诸如语音识别系统)、麦克风和其他类型的输入设备。通常,术语“输入设备”的使用旨在包括将信息输入到计算机系统510中或输入到通信网络408上的所有可能类型的设备和方式。
用户界面输出设备520可以包括显示子系统、打印机、传真机或非视觉显示器(诸如音频输出设备)。显示子系统可以包括阴极射线管(CRT)、平板设备(诸如液晶显示器(LCD))、投影设备或用于创建可见图像的一些其他机制。显示子系统还可以诸如经由音频输出设备来提供非视觉显示。通常,术语“输出设备”的使用旨在包括用于将信息从计算机系统510输出到用户或另一机器或计算机系统的所有可能类型的设备和方式。
存储子系统524存储提供本文所述的一些或全部模块的功能的编程和数据构造。这些软件模块通常由处理器514单独或与其他处理器结合地执行。
存储子系统中使用的存储器子系统525可以包括多个存储器,包括用于在程序执行期间存储指令和数据的主随机存取存储器(RAM)530和在其中存储固定指令的只读存储器(ROM)532。文件存储子系统528可以提供用于程序和数据文件的永久性存储,并且可以包括硬盘驱动器、软盘驱动器以及相关联的可移除介质、CD-ROM驱动器、光盘驱动器或可移除介质盒。实现某些实施方式的功能的模块可以由文件存储子系统528存储在存储子系统524中,或者存储在处理器可访问的其他机器中。
总线子系统512提供了一种用于使计算机系统510的各个部件和子系统按预期彼此通信的机制。尽管总线子系统512被示意性地示出为单个总线,但是总线子系统的替代实施例可以使用多个总线。
计算机系统510可以具有各种类型,包括工作站、服务器、计算集群、刀片服务器、服务器场或任何其他数据处理系统或计算设备。由于计算机和网络的不断变化的性质,图5中描绘的计算机系统510的描述仅旨在作为特定示例用于说明各种实施方式的目的。与图5所示的计算机系统相比,计算机系统510的许多其他配置可能具有更多或更少的部件。
如本文中所使用的,如果先前事件或值影响了给定的事件或值,则给定的事件或值是“响应于”先前事件或值的。如果存在居间的处理元素、步骤或时间段,则给定的事件或值仍然可以“响应于”先前事件或值。如果居间的处理元件或步骤组合了多于一个事件或值,则处理元件或步骤的信号输出被认为是“响应于”事件或值输入中的每一个。如果给定的事件或值与先前事件或值相同,则这仅仅是退化情况,在这种情况下,给定的事件或值仍然被视为“响应于”先前事件或值。类似地定义给定的事件或值对另一事件或值的“依赖性”。
一些示例性用例
在示例性用例中,公开的技术将允许用户使用搜索引擎和翻译过滤器。作为输入,用户将用英语说(或键入)“cherry blossom event in Kyoto”。公开的技术将使用英语的用户关键词(例如,“cherry blossom event in Kyoto”)执行互联网搜索。英语搜索还将被翻译成日语,并且将使用经翻译的搜索执行日语内容的搜索。然后,公开的技术将整合来自英语来源和日语来源的搜索结果,并以用户的母语(例如英语)向用户呈现结果。注意,可以用不同的语言向用户呈现结果(如果用户希望这样做)。
在另一个示例性用例中,公开的技术将构建用于经翻译的语言(理解为自然语言输入)的定制的自然语言模块。例如,作为输入,用户将提供英语的语音输入或文本输入(虽然用户在西班牙语国家)“I want to eat lamb or beef(我想吃羊肉或牛肉)”。该技术公开了翻译器或个人助理将词语“I want to eat lamb or beef”翻译成当地国家的语言(例如西班牙语)的实施方式。然后,公开的技术将搜索提供羊肉或牛肉菜肴的当地餐馆。然后,公开的技术将仅对这些菜肴的评分/评级彼此进行比较,而不是对餐厅的总体评分/评级进行比较。然后,公开的技术可以将有图像(如果有)的英语菜肴名称以及餐厅位置和整体评论作为输出提供给用户以供选择。然后,用户可以使用公开的技术来挑选有这道菜肴的餐馆,进行预订,提供指示和/或以母语订购食物。
在进一步的用例中,用户可以输入汉语“什么是手倒立?”(“handstand”)。但是,没有关于“handstand”的汉语维基百科文章。结果,公开的技术将接收汉语输入,将字符翻译成英语单词“handstand”,然后在英语“wikipedia.org”中搜索“handstand”。然后,公开的技术将提取排名靠前的结果的第一句:“A handstand is the act of supporting thebody in a stable,inverted vertical position by balancing on the hands”。然后,公开的技术可以将提取的第一句话翻译成汉语“手倒立是通过在手上平衡来将身体支撑在稳定的倒置垂直位置的动作”,然后向用户提供解释手倒立的汉语输出。
一些特定实施方式
这里描述了执行跨语言和跨域搜索的各种实施方式。
公开的技术可以实践为系统、方法或制造品。实施方式的一个或多个特征可以与基本实施方式组合。不互斥的实施方式被教导为是可组合的。实施方式的一个或多个特征可以与其他实施方式组合。本公开偶尔提醒用户这些选项。省略重复这些选项的叙述的一些实施方式不应被视为限制了前面各节中所教导的组合–这些叙述通过引用由此向前并入到以下每个实施方式中。
公开的技术的方法通过以下方式执行跨语言搜索:接收第一语言的第一查询;将所述第一查询从所述第一语言翻译成第二语言以获得所述第二语言的第二查询;基于所述第一查询执行第一搜索以获得第一语言结果;基于所述第二查询执行第二搜索以获得第二语言结果;将所述第二语言结果翻译成所述第一语言以获得经翻译的第二结果;并且向所述用户呈现整合的总体结果,所述总体结果包括所述第一语言结果中的至少一些以及所述经翻译的第二结果中的一些。
在实施方式中,所述方法可以对所述第一查询执行话题分析以确定所述第一查询的话题。另外,所述方法可以包括:根据以下项中的至少一个来识别用于所述第一查询的第一域:所述第一语言和所确定的话题;并且根据以下项中的至少一个来识别用于所述第二查询的第二域:所述第二语言和所确定的话题。
在实施方式中,用户可以根据第一域和第二域过滤所述总体结果。
在另外的实施方式中,执行所述话题分析可以进一步包括:根据所确定的话题确定扩展的关键词以添加到所述第一查询中;并且在翻译所述第一查询之前,通过向所述第一查询添加扩展的关键词来更新所述第一查询。另外,在实施方式中,执行所述话题分析可以还包括:根据以下项中的至少一个确定要添加到所述第一查询的附加限制:所确定的话题和所述扩展的关键词;并且在翻译所述第一查询之前,通过向所述第一查询添加所述附加限制来进一步更新所述第一查询。
在另一实施方式中,所述方法可以还包括:使用歧义消除信息对所述第一查询进行歧义消除以获得以下项中的至少一个:附加关键词和附加限制;并且在翻译所述第一查询之前,通过向所述第一查询添加所述附加关键词和所述附加限制中的至少一个来进一步更新所述第一查询。
此外,在实施方式中,可以根据以下项中的至少一个来自动确定所述第二语言:所确定的话题和对所述第一查询的分析。
另外,在实施方式中,所述方法可以包括:在执行对所述第二语言结果的翻译之前,对所述第一语言结果和所述第二语言结果进行评分;并且基于所述评分对所述第一语言结果和所述第二语言结果进行排名。
在另一实施方式中,向所述用户呈现所述总体结果包括仅提供所述第一语言结果和所述第二语言结果中的排名靠前的部分。
此外,在实施方式中,所述方法可以还包括:对所述第一语言结果和所述第二语言结果执行话题分析;并且基于所述话题分析对所述第一语言结果和所述第二语言结果进行评分。
公开的技术还可以被实施为包括与存储器耦接的一个或多个处理器的系统。存储器中装载有计算机指令,这些计算机指令在被执行时使系统执行某些动作。这些动作可以包括:接收第一语言的第一查询;将所述第一查询从所述第一语言翻译成第二语言以获得所述第二语言的第二查询;基于所述第一查询执行第一搜索以获得第一语言结果;基于所述第二查询执行第二搜索以获得第二语言结果;将所述第二语言结果翻译成所述第一语言以获得经翻译的第二结果;并且向所述用户呈现整合的总体结果,所述总体结果包括所述第一语言结果中的至少一些以及所述经翻译的第二结果中的一些。
所公开的该系统实施方式和其他系统可选地包括一个或多个以下特征。该系统还可以包括结合所公开的方法描述的特征。为了简洁起见,未单独列举系统特征的替代组合。对于基本特征的每个法定类别组,都不重复可适用于系统、方法和制造品的特征。读者将理解如何将本部分中标识的功能轻松地与其他法定类别中的基本特征组合在一起。
其他实施方式可以包括非暂时性计算机可读存储介质,该非暂时性计算机可读存储介质存储可由处理器执行以执行上述系统的功能的指令。
公开的技术的计算机可读介质(CRM)实施方式包括刻印有计算机程序指令的非暂时性计算机可读存储介质,该计算机程序指令当在处理器上执行时实施上述方法。
在特定实施方式部分中针对第一系统实施方式所讨论的每个特征同样适用于CRM实施方式。如上所述,所有系统功能在这里不重复并且应当通过参考将其视为重复的。

Claims (24)

1.一种执行跨语言搜索的方法,所述方法包括:
接收第一语言的第一查询;
将所述第一查询从所述第一语言翻译成第二语言,以获得所述第二语言的第二查询;
基于所述第一查询执行第一搜索以获得第一语言结果;
基于所述第二查询执行第二搜索以获得第二语言结果;
将所述第二语言结果翻译成所述第一语言,以获得经翻译的第二结果;并且
向用户呈现整合的总体结果,所述整合的总体结果包括所述第一语言结果中的一个或多个以及所述经翻译的第二结果中的一个或多个。
2.根据权利要求1所述的方法,还包括:对所述第一查询执行话题分析以确定所述第一查询的话题。
3.根据权利要求2所述的方法,还包括:
根据以下项中的至少一个来识别用于所述第一查询的第一域:所述第一语言和所确定的话题;并且
根据以下项中的至少一个来识别用于所述第二查询的第二域:所述第二语言和所确定的话题。
4.根据权利要求3所述的方法,还包括:
根据所述第一域和所述第二域来过滤所述总体结果,并将经过滤的总体结果呈现给用户。
5.根据权利要求2至4中任一项所述的方法,其中执行所述话题分析还包括:
根据所确定的话题确定扩展的关键词以添加到所述第一查询中;并且
在翻译所述第一查询之前,通过向所述第一查询添加所述扩展的关键词来更新所述第一查询。
6.根据权利要求5所述的方法,其中执行所述话题分析还包括:
根据以下项中的至少一个确定要添加到所述第一查询的附加限制:所确定的话题和所述扩展的关键词;并且
在翻译所述第一查询之前,通过向所述第一查询添加所述附加限制来进一步更新所述第一查询。
7.根据权利要求5所述的方法,还包括:
使用歧义消除信息对所述第一查询进行歧义消除,以获得以下项中的至少一个:附加关键词和附加限制;并且
在翻译所述第一查询之前,通过向所述第一查询添加所述附加关键词和所述附加限制中的所述至少一个来进一步更新所述第一查询。
8.根据权利要求2所述的方法,其中根据以下项中的至少一个来自动确定所述第二语言:所确定的话题和对所述第一查询的分析。
9.根据权利要求1所述的方法,还包括:
在执行对所述第二语言结果的翻译之前,对所述第一语言结果和所述第二语言结果进行评分;并且
基于所述评分对所述第一语言结果和所述第二语言结果进行排名。
10.根据权利要求9所述的方法,其中呈现所述总体结果包括:仅提供所述第一语言结果和所述第二语言结果中的排名靠前的部分。
11.根据权利要求9或10所述的方法,其中:
所述方法还包括对所述第一语言结果和所述第二语言结果执行话题分析;并且
基于所述话题分析对所述第一语言结果和所述第二语言结果进行所述评分。
12.一种包括与存储器耦接的一个或多个处理器的系统,所述存储器加载有用于执行跨语言搜索的计算机指令,所述计算机指令当在所述一个或多个处理器上运行时实施根据权利要求1至11中任一项所述的方法。
13.一种包括程序指令的计算机可读介质,所述程序指令在被计算机执行时使得所述计算机执行根据权利要求1至11中任一项所述的方法。
14.一种用于执行跨语言搜索的设备,所述设备包括:
用于接收第一语言的第一查询的装置;
用于将所述第一查询从所述第一语言翻译成第二语言以获得所述第二语言的第二查询的装置;
用于基于所述第一查询执行第一搜索以获得第一语言结果的装置;
用于基于所述第二查询执行第二搜索以获得第二语言结果的装置;
用于将所述第二语言结果翻译成所述第一语言以获得经翻译的第二结果的装置;以及
用于向用户呈现整合的总体结果的装置,所述整合的总体结果包括所述第一语言结果中的一个或多个以及所述经翻译的第二结果中的一个或多个。
15.根据权利要求14所述的设备,还包括:用于对所述第一查询执行话题分析以确定所述第一查询的话题的装置。
16.根据权利要求15所述的设备,还包括:
用于根据所述第一语言和所确定的话题中的至少一个来识别用于所述第一查询的第一域的装置;以及
用于根据所述第二语言和所确定的话题中的至少一个来识别用于所述第二查询的第二域的装置。
17.根据权利要求16所述的设备,还包括:
用于根据所述第一域和所述第二域来过滤所述总体结果并将经过滤的总体结果呈现给用户的装置。
18.根据权利要求15至17中任一项所述的设备,其中用于执行所述话题分析的装置还包括:
用于根据所确定的话题确定扩展的关键词以添加到所述第一查询中的装置;以及
用于在翻译所述第一查询之前通过向所述第一查询添加所述扩展的关键词来更新所述第一查询的装置。
19.根据权利要求18所述的设备,其中用于执行所述话题分析的装置还包括:
用于根据所确定的话题和所述扩展的关键词中的至少一个确定要添加到所述第一查询的附加限制的装置;以及
用于在翻译所述第一查询之前通过向所述第一查询添加所述附加限制来进一步更新所述第一查询的装置。
20.根据权利要求18所述的设备,还包括:
用于使用歧义消除信息对所述第一查询进行歧义消除以获得附加关键词和附加限制中的至少一个的装置;以及
用于在翻译所述第一查询之前通过向所述第一查询添加所述附加关键词和所述附加限制中的至少一个来进一步更新所述第一查询的装置。
21.根据权利要求15所述的设备,其中根据所确定的话题和对所述第一查询的分析中的至少一个来自动确定所述第二语言。
22.根据权利要求14所述的设备,还包括:
用于在执行对所述第二语言结果的翻译之前对所述第一语言结果和所述第二语言结果进行评分的装置;以及
用于基于所述评分对所述第一语言结果和所述第二语言结果进行排名的装置。
23.根据权利要求22所述的设备,其中用于呈现所述总体结果的装置包括:用于仅提供所述第一语言结果和所述第二语言结果中的排名靠前的部分的装置。
24.根据权利要求22或23所述的设备,其中:
所述设备还包括用于对所述第一语言结果和所述第二语言结果执行话题分析的装置;并且
对所述第一语言结果和所述第二语言结果的评分基于所述话题分析而执行。
CN201911024261.6A 2018-11-02 2019-10-25 用于执行智能跨域搜索的系统和方法 Withdrawn CN111143659A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US16/179,843 2018-11-02
US16/179,843 US20200142890A1 (en) 2018-11-02 2018-11-02 System and method for performing an intelligent cross-domain search
JP2019-108870 2019-06-11
JP2019108870A JP2020071865A (ja) 2018-11-02 2019-06-11 インテリジェントクロスドメイン検索を行うためのシステムおよび方法

Publications (1)

Publication Number Publication Date
CN111143659A true CN111143659A (zh) 2020-05-12

Family

ID=70516894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911024261.6A Withdrawn CN111143659A (zh) 2018-11-02 2019-10-25 用于执行智能跨域搜索的系统和方法

Country Status (1)

Country Link
CN (1) CN111143659A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111708911A (zh) * 2020-06-17 2020-09-25 北京字节跳动网络技术有限公司 搜索方法、装置、电子设备及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111708911A (zh) * 2020-06-17 2020-09-25 北京字节跳动网络技术有限公司 搜索方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
US10521463B2 (en) Answering questions via a persona-based natural language processing (NLP) system
JP6714024B2 (ja) 言語入力データからnグラムおよび概念関係の自動生成
EP3647968A1 (en) System and method for performing an intelligent cross-domain search
KR102364400B1 (ko) 다수의 코퍼스들로부터 응답 정보 획득
US6850934B2 (en) Adaptive search engine query
US9336277B2 (en) Query suggestions based on search data
JP2018077858A (ja) 会話式情報検索システムおよび方法
US7742922B2 (en) Speech interface for search engines
RU2680757C2 (ru) Выявление навигационных результатов поиска
JP2015511746A5 (zh)
CN115879445A (zh) 未知词预测器和内容整合的翻译器
US9805120B2 (en) Query selection and results merging
US20180032607A1 (en) Platform support clusters from computer application metadata
WO2018022334A1 (en) Computer application query suggestions
KR20160067202A (ko) 맥락적 통찰 및 탐구 기법
JP2017068845A (ja) 情報ソースの情報ソース用言語を選択するためのコンピュータ実装方法、コンピュータ・システム、コンピュータ・プログラム製品
US10242033B2 (en) Extrapolative search techniques
US20200234698A1 (en) Storing and retrieving personal voice memos
US10635730B2 (en) Modification of search subject in predictive search sentences
US20180365318A1 (en) Semantic analysis of search results to generate snippets responsive to receipt of a query
US10515076B1 (en) Generating query answers from a user's history
CN111143659A (zh) 用于执行智能跨域搜索的系统和方法
US20210089719A1 (en) Transparent Iterative Multi-concept Semantic Search
WO2015121309A1 (en) Translating search engine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200512

WW01 Invention patent application withdrawn after publication