CN107797725B - 使用用户输入以适应用于呈现给用户而提供的搜索结果 - Google Patents

使用用户输入以适应用于呈现给用户而提供的搜索结果 Download PDF

Info

Publication number
CN107797725B
CN107797725B CN201710763373.8A CN201710763373A CN107797725B CN 107797725 B CN107797725 B CN 107797725B CN 201710763373 A CN201710763373 A CN 201710763373A CN 107797725 B CN107797725 B CN 107797725B
Authority
CN
China
Prior art keywords
search results
user
user interface
input
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710763373.8A
Other languages
English (en)
Other versions
CN107797725A (zh
Inventor
戴维·科根
布赖恩·赫林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Priority to CN202011637525.8A priority Critical patent/CN112698765A/zh
Publication of CN107797725A publication Critical patent/CN107797725A/zh
Application granted granted Critical
Publication of CN107797725B publication Critical patent/CN107797725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02BCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
    • Y02B20/00Energy efficient lighting technologies, e.g. halogen lamps or gas discharge lamps
    • Y02B20/40Control techniques providing energy savings, e.g. smart controller or presence detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及使用用户输入以适应用于呈现给用户而提供的搜索结果。方法、装置和计算机可读介质涉及在用户和自动助理之间的对话期间,用户和自动助理之间的交互。一些实施方式涉及适配由自动助理提供的搜索结果的图形和/或可听呈现。适配响应于搜索结果中在对话期间由用户提供的输入中引用的属性。那些实施方式中的一些使得用户提供文本输入以在对话内和资源和/或与对话相关联的接口约束内导航搜索结果,和/或使得基于由用户提供给自动助理的文本输入,适配自动助理何时和/或是否提供具有某些属性的搜索结果。示例实施方式将改进的交互协议用于自动助理来减少在自动助理与其用户之间的交互期间使用的计算资源。

Description

使用用户输入以适应用于呈现给用户而提供的搜索结果
背景技术
自动助理(也称为“个人助理模块”、“移动助理”或“聊天机器人”)经由各种计算设备(诸如,智能电话、平板计算机、汽车系统、独立个人助理设备等)与用户交互。自动助理从用户接收文本输入(例如键入和/或说出)并且利用响应输出(例如,可视和/或可听)做出响应。
与自动助理的一些用户交互可以仅从自动助理请求单个响应。例如,文本输入“what time is it in London(伦敦现在是几点)”、“what is the Capital of Delaware(特拉华的首府是什么)”和“how many ounces are in a cup(一杯有多少盎司)”可以从自动助理请求单个响应。
相反,与自动助理的其他用户交互会更常见并且请求由自动助理提供响应组。例如,“news headlines(新闻标题)”、“nearby restaurants(附近饭店)”和“search resultsfor mustang(野马的搜索结果)”会请求自动助理发出对一个或多个语料库的搜索并且返回响应于该搜索的搜索结果组。
然而,与现有自动助理相关联的资源和/或接口约束在通过自动助理提供用于呈现给用户的搜索结果组的方面出现一个或多个缺点。例如,可以经由“聊天”型图形用户界面实现一些自动助理。在这种接口中同时显示大量搜索结果会使接口杂乱,更难以跟随对话,和/或会使用相当大量的计算资源。例如,由于同时呈现大量结果和/或由于查看大量结果所需的“滚动”和/或其他动作,计算资源会被使用。此外,使得搜索结果在独立于自动助理接口和/或应用的接口和/或应用中可查看会消耗更多的用户和/或计算资源。例如,切换到其他接口和/或应用会使用户不能集中于与自动助理的正在进行的对话和/或要求计算设备执行单独的应用和/或呈现单独的接口。
如另一示例,一些自动助理可以包括(或限定到)提供可听用户接口输出和接受口语用户接口输入。当由这样的自动助理提供搜索结果组时,经由口语用户接口输入的用户的结果组的定向导航是不可能的和/或受限的。此外,许多自动助理缺少基于由用户提供给自动助理的文本输入来适配(adapt)何时和/或是否由自动助理将具有某些属性的搜索结果提供给用户的能力。这些和/或其他技术的附加和/或替代缺点可能出现。
发明内容
本说明书针对在至少该用户和自动助理之间的对话期间,与用户和自动助理之间的交互有关的方法、装置和计算机可读介质。一些实施方式针对适配由自动助理提供以呈现给用户的搜索结果的图形和/或可听呈现。可以响应于由用户在对话期间提供的口语和/或键入文本输入中引用的一个或多个搜索结果的属性,适配搜索结果。那些实施方式中的一些可以使用户提供文本输入以在对话内和与对话相关联的资源和/或接口约束内导航搜索结果。这些实施方式中的一些可以附加或替选地实现基于由用户提供给自动助理的文本输入,适配何时和/或是否将具有某些属性的搜索结果由自动助理提供给用户。
说明书的这些和其他实施方式中的一些可以实现各种技术优点。一些示例实施方式将改进的交互协议用于自动助理以减少在自动助理及其用户之间交互期间使用的计算资源。例如,适配何时和/或是否将搜索结果提供给用户的一些实施方式使得在一些情况下,将更少搜索结果提供给用户,但仍然满足用户的信息需要。这可以减少对各种计算资源的使用,诸如可视和/可听地向用户呈现搜索结果所需的计算设备的资源。同时,例如,在对话内导航搜索结果的一些实施方式可以使得用户(可选地,非顺序地)自由地向前和/或向后导航搜索结果,而不必同时呈现所有搜索结果和/或呈现一个或多个搜索结果的全部。这可以使得提供搜索结果以呈现给用户,并且由用户导航,同时还使得满足所需和/或必要资源和/或接口约束,和/或在呈现搜索结果期间,提供少于待提供的一个或多个搜索结果的全部。
如一个示例,在用户和自动助理之间的对话期间,用户可以使文本输入被提供给自动助理。文本输入可以启动对话或可以是在前启动的对话的继续。文本输入可以是自然语言自由格式输入,诸如基于经由一个或多个用户接口输入设备(例如,基于经由物理或虚拟键盘提供的键入输入或基于经由麦克风提供的口语输入),由用户生成的用户接口输入的文本输入。如本文所述的,自由格式输入是由用户制定的并且不限于为用户选择而呈现的选项组(例如,不限于在下拉菜单中呈现的选项组)的输入。
响应于提供给自动助理,作为对话的一部分的一些文本输入,自动助理可以获得多个响应搜索结果。例如,自动助理可以基于文本输入,使得发出对一个或多个数据库的搜索(或可以自己搜索数据库),并且可以响应于该搜索,获得多个搜索结果。例如,响应于“news headlines(新闻标题)”的文本输入,可以搜索新闻报道文档的数据库,并且获得的多个搜索结果分别基于响应于该搜索识别的多个最新新闻报道文档中相应的文档。可以基于各种信号,诸如搜索结果的流行度、搜索参数和搜索结果之间的匹配度、用户的属性等,选择和/或排名获得的搜索结果。
同时,在一些实施方式中,可以基于在与自动助理的对话期间,由用户提供的过去文本输入,附加和替选地选择和/或排名获得的搜索结果。例如,如果:在与自动助理的对话期间,先前为用户呈现来自源1的搜索结果,则从搜索结果排除来自“Source 1(源1)”的搜索结果(例如,发布者和/或作者的URL或其他指示符的特定资源名称),并且为用户提供响应文本输入“no more from this source(不再有来自该源的搜索结果)”。如另一示例,如果:在与自动助理的对话期间,先前为用户呈现来自源2的搜索结果,则在搜索结果的排名中,提前来自“Source 2(源2)”的搜索结果,并且为用户提供响应文本输入“I like thissource(我喜欢该源)”。
与获得和/或排名搜索结果的技术无关,自动助理可以顺序地提供搜索结果组,以(可视和/或可听)呈现给用户作为对话的一部分。提供搜索结果以呈现的次序可以基于该排名。例如,可以提供仅包括最高排名的搜索结果的第一组以呈现,然后可以提供仅包括第二最高排名的搜索结果的第二组以呈现等。在一些实施方式中,在第一组后(例如,紧接之后或在时间延迟后)可以自动地提供第二组。在一些实施方式中,在提供第二组前,要求用户接口输入。例如,在提供第一组期间或之后,在用户提供特定口语用户接口输入,诸如“next(下一个)”、“another(另一个)”、“continue(继续)”等,可以仅提供第二组。
在一些实施方式中,在提供搜索结果期间,用户可以提供“破坏”顺序提供的次序并且使得提供一个或多个“无序”搜索结果的进一步文本输入。例如,用户可以说出或键入“previous(向前)”以回到紧接在前的搜索结果;“second result(第二结果)”以回到第二个呈现的搜索结果,“back to the one from Source A(回到来自源A的那个)”以回到来自“Source A(源A)”的搜索结果;“back to the one about Topic A(回到有关主题A的那个)”以回到有关“Topic A(主题A)”的搜索结果;“more from Source A(更多来自源A的)”以向前到来自“Source A”的另一搜索结果(即使它不是顺序次序中的下一个);“moreabout Topic A(更多有关主题A的)”以向前到有关“Topic A”的另一搜索结果(即使它不是顺序次序中的下一个);和/或“more like this(更多像这个的)”以向前到与至少部分最近呈现的搜索结果相似的附加搜索结果(即使该附加搜索结果不是顺序次序中的下一个搜索结果)。在本文的附加细节中描述这些和其他实施方式。
在一些实施方式中,提供一种由一个或多个处理器实现的方法,包括:接收输入并且获得响应于输入的多个搜索结果。该输入基于由用户经由用户接口输入设备生成的用户接口输入,以及由用户生成用户接口输入,作为用户与至少部分由一个或多个处理器实现的自动助理之间的对话的一部分。该方法进一步包括经由用户接口输出设备顺序地提供搜索结果组以呈现给用户。每个搜索结果组包括至少一个搜索结果,以及顺序地提供搜索结果组包括根据这些组的次序提供每一组。该方法进一步包括在提供期间,接收进一步输入。该进一步输入基于由用户经由用户接口输入设备或另一用户接口输入设备生成的进一步用户接口输入。该方法进一步包括基于该进一步输入的一个或多个词项和基于先前呈现的搜索结果的至少一个属性,确定该进一步输入与该先前呈现的搜索结果相对应。该先前呈现的搜索结果为在顺序提供期间,先前提供的一个搜索结果。该方法进一步包括响应于确定该进一步输入与该先前呈现的搜索结果相对应,提供与该先前呈现的搜索结果有关的输出。该输出的提供与这些组的次序相反。
本文公开的技术的这些和其他实施方式可选地包括下述特征中的一个或多个。
在一些实施方式中,顺序地提供搜索结果组以呈现给用户包括响应于输入而提供这些组中的初始组;以及提供在初始组后的第二组。第二组根据次序顺序跟在初始组后,提供第二组是响应于接收附加用户接口输入,并且该附加用户接口输入在进一步用户接口输入前。在那些实施方式中的一些中,附加用户接口输入是口头用户接口输入。
在一些实施方式中,用户接口输入设备是麦克风,用户接口输出设备是扬声器,以及由用户经由麦克风生成进一步用户接口输入。在那些实施方式的一些中,经由扬声器,在可听呈现一个搜索结果中期间,接收进一步用户接口输入的至少一部分。
在一些实施方式中,进一步用户接口输入是口头用户接口输入,以及该方法进一步包括在提供期间,主动监视进一步输入。在那些实施方式中的一些中,接收进一步输入在主动监视期间发生。
在一些实施方式中,用户接口输出设备为显示器,该输出包括该先前呈现的搜索结果,以及提供该输出包括:使得在显示器上呈现的图形用户界面中,与来自该先前呈现的搜索结果的先前呈现的任何持续输出分开地呈现输出。
在一些实施方式中,该输出是与该先前呈现的搜索结果有关、但与该先前呈现的搜索结果不同的基本内容项相关联的附加搜索结果。
在一些实施方式中,用户接口输出设备是显示器,以及顺序地提供这些组以经由显示器呈现给用户包括:使得每一组在显示器上呈现的图形用户界面中,取代这些组中的对应的紧接在前的组。在那些实施方式的一些中,提供与搜索结果有关的输出包括使得输出在图形用户界面中,取代在顺序提供期间提供的组中的最近提供的组。
在一些实施方式中,基于该进一步输入的一个或多个词项以及基于该先前呈现的搜索结果的属性,确定该进一步输入与该先前呈现的搜索结果相对应包括:识别该先前呈现的搜索结果的属性;以及确定该一个或多个词项与该属性相匹配。在那些实施方式的一些中,该属性为下述中的一个:该先前呈现的搜索结果的源的名称、包括在该先前呈现的搜索结果中的实体的名称、以及对在这些组的顺序提供中该先前呈现的搜索结果的呈现次序的引用。
在一些实施方式中,该方法进一步包括基于该进一步输入的一个或多个词项,确定该进一步输入还与搜索结果中在顺序提供期间先前提供的附加的先前呈现的搜索结果相对应。在那些实施方式的一些中,确定该进一步输入与该先前呈现的搜索结果相对应进一步包括基于一个或多个附加标准选择该先前呈现的搜索结果,代替该附加的先前呈现的搜索结果。在那些实施方式的一些中,确定该进一步输入与该先前呈现的搜索结果相对应包括:基于该附加的先前呈现的搜索结果的附加属性生成提示,提供该提示以经由用户接口输出设备呈现给用户;响应于该提示,接收附加用户接口输入,以及基于该附加用户接口输入选择该先前呈现的搜索结果,代替附加的先前呈现的搜索结果。
在一些实施方式中,该输入和该进一步文本输入分别包括文本输入。诸如,基于口头用户接口输入生成的文本输入。
在一些实施方式中,提供一种由一个或多个处理器实现的方法,包括:作为用户与至少部分由一个或多个处理器实现的自动助理之间的对话的一部分:提供搜索结果以呈现给用户,以及响应于提供该搜索结果,接收引用该搜索结果的属性和用户对该属性的情绪的文本输入;基于该搜索结果的属性和用户对该属性的情绪,确定响应于用户与自动助理之间的进一步对话,影响是否或何时由自动助理提供具有该属性的一个或多个属性搜索结果的参数;以及作为用户与自动助理之间的进一步对话的一部分:由自动助理使用该参数来影响是否或何时提供所述属性搜索结果中的至少一个以呈现给用户。
本文公开的技术的这些和其他实施方式可以可选地包括一个或多个下述特征。在一些实施方式中,该参数:通过影响所述属性搜索结果的排名来影响何时将所述属性搜索结果提供为进一步对话的一部分,或通过阻止提供所述属性搜索结果来影响是否将所述属性搜索结果提供为进一步对话的一部分。在那些实施方式的一些版本中,该参数在基于用户对所述属性搜索结果的属性的情绪的程度上,影响所述属性搜索结果的排名。在那些实施方式的一些其他版本中,该参数基于由一个或多个预定词项在文本输入中表达的、用户对该属性的情绪,来阻止提供所述属性搜索结果。
在一些实施方式中,该搜索结果的属性是该搜索结果的源,该文本输入包括引用该源的词项和引用该情绪的附加词项,以及该参数影响来自该源的所述属性搜索结果的排名,或阻止提供来自该源的所述属性搜索结果以呈现给用户。
在一些实施方式中,在该文本输入中对该属性的引用是对该搜索结果的引用,而不是对该属性的明确引用。在那些实施方式中的一些中,该方法进一步包括基于一个或多个计算机可读介质中被指派到该搜索结果的该属性来识别该属性。在那些实施方式的一些版本中,该属性为下述中的一个:该搜索结果的源、在该搜索结果中引用的实体,以及该搜索结果的文档类型。
在一些实施方式中,该搜索结果是响应于用户的第一文本输入而被提供以呈现给用户,该进一步对话是该对话的延续,并且是响应于第一文本输入而对搜索结果的顺序呈现的延续,以及所述属性搜索结果的所述至少一个是响应于第一文本输入。
在一些实施方式中,该搜索结果是响应于用户的第一文本输入而被提供以呈现给用户,该进一步对话包括响应于为用户的附加文本输入发出的新搜索而将附加搜索结果提供给用户,以及所述属性搜索结果的所述至少一个是响应于该附加文本输入。
此外,一些实施方式包括一个或多个计算设备的一个或多个处理器,其中,一个或多个处理器是可执行的以执行在相关联的存储器中存储的指令,以及其中,指令被配置成使得执行上述方法中的任何一个。一些实施方式还包括一个或多个非暂时性计算机可读存储介质,其存储可由一个或多个处理器执行的计算机指令以执行上述方法中的任何一个。
应认识到上述概念和本文更详细所述的附加概念的所有组合预期为本文公开的主题的一部分。例如,出现在本公开的结尾处的要求保护的主题的所有组合预期为本文公开的主题的一部分。
附图说明
图1是可以实现本文公开的实施方式的示例环境的框图。
图2图示出在对话期间适配由用户提供给自动助理的搜索结果的示例,其中,响应于所述搜索结果中的一个或多个中由用户在对话期间提供的口语和/或键入文本输入中引用的属性,来适配搜索结果。
图3图示出根据本文公开的实施方式具有显示在客户端计算设备的用户与自动助理之间发生的对话的示例的显示屏的示例客户端计算设备
图4A、4B、4C和4D图示出根据本文公开的实施方式的具有显示在客户端计算设备的用户与自动助理之间发生的对话的另一示例的显示屏的一部分的图3的示例客户端计算设备。
图4E图示出根据本文公开的实施方式的具有显示在客户端计算设备的用户与自动助理之间发生的对话的又一示例的显示屏的图3的示例客户端计算设备。
图5图示出根据本文公开的实施方式的另一示例客户端计算设备,以及在客户端计算设备的用户和自动助理之间发生的可听对话的示例。
图6和7图示出根据本文公开的实施方式的具有显示在客户端计算设备的用户和自动助理之间发生的对话的又一示例的显示屏的图3的示例客户端计算设备。
图8是根据本文公开的实施方式图示出的示例方法的流程图。
图9是根据本文公开的实施方式图示出的另一示例方法的流程图。
图10图示出计算设备的示例架构。
具体实施方式
在图1中,图示出可以实现本文公开的技术的示例环境。示例环境包括一个或多个用户接口输入设备102、一个或多个用户接口输出设备104和自动助理120。用户接口输入设备102可以包括例如物理键盘、触摸屏(例如,实现虚拟键盘或其他文本输入机构)和/或麦克风。用户接口输出设备104可以包括例如显示屏和/或扬声器。用户接口输入和输出设备102,104可以集成在用户的一个或多个计算设备上。例如,用户的移动电话可以包括用户接口输入和输出设备102,104,或独立的个人助理硬件设备可以包括用户接口输入和输出设备102,104,或第一计算设备可以包括用户接口输入设备102和单独的计算设备可以包括用户接口输出设备104等。
尽管自动助理120在图1中图示为独立于用户接口输入和输出设备102,104,在一些实施方式中,可以在也包含用户接口输入设备102和/或用户接口输出设备104的计算设备上实现自动助理120的所有或方面。例如,可以在计算设备上实现自动助理120的输出生成引擎130和/或输出适配引擎124的全部或方面。在一些实施方式中,可以在与包含用户接口输入设备102和/或用户接口输出设备104的计算设备分开且远离的计算设备上实现自动助理120的全部或方面(例如,“在云中”实现全部或方面)。在这些实施方式中的一些中,自动助理120的那些方面可以经由一个或多个网络,诸如局域网(LAN)和/或广域网(WAN)(例如互联网),与计算设备通信。
可以包括用户接口输入设备102和用户接口输出设备104的客户端计算设备的一些非限定示例包括下述的一个或多个:台式计算设备、膝上型计算设备、至少部分专用于自动助理的独立硬件设备、平板计算设备、移动电话计算设备、用户的车辆的计算设备(例如,车载通信系统、车载娱乐系统、车载导航系统)或包括计算设备的用户的可穿戴装置(例如,具有计算设备的用户的手表、具有计算设备的用户的眼镜、虚拟或增强现实计算设备)。可以提供附加和/或替选客户端计算设备。在一些实施方式中,给定用户可以利用共同形成计算设备的协同“生态系统”的多个客户端计算设备,与自动助理120的全部或方面通信。然而,为了简洁,本公开中所述的一些示例将集中在操作单一客户端计算设备的用户上。
客户端计算设备和自动助理120可以分别(当它们为独立的设备时)包括用于存储数据和软件应用的一个或多个存储器、用于访问数据和执行应用的一个或多个处理器,以及促进通过网络通信的其他组件。由一个或多个客户端计算设备和/或由自动助理120执行的操作可以分布在多个计算设备上。自动助理120可以被实现为例如在通过网络,彼此耦合的一个或多个位置中的一个或多个计算机上运行的计算机程序。
如图1所示,用户经由用户接口输入设备102,向自动助理120提供输入。自动助理120经由用户接口输出设备104,提供用于呈现给用户的响应于输出(可选地,在由一个或多个组件进一步处理后)。为了简化,该输入在图1中示为通过用户接口输入设备102,直接提供给自动助理120,并且输出被图示为由自动助理120直接提供给用户接口输出设备104。然而,应注意到在各种实施方式中,一个或多个中间硬件组件功能上插入自动助理120与用户接口输入和/或输出设备102,104之间,并且可以可选地处理输入和/或输出。例如,一个或多个组件可以处理由自动助理120提供的输出并且基于输出的处理,生成用于经由用户接口输出设备104,呈现搜索结果和/或其他内容的一个或多个信号。例如,在用户接口输出设备104在与自动助理120的全部或方面分开的客户端计算设备上的情况下,硬件处理器和/或其他组件可以处理输出并且基于该输出,生成用于驱动用户接口输出设备104的信号。
在一些实施方式中,由自动助理120接收的输入已经是文本格式。例如,用户接口输入设备102可以包括响应于针对键盘的用户接口输入,生成文本输入的键盘,并且该文本输入被提供给自动助理120。同时,例如,用户接口输入设备102可以包括麦克风、与自动助理120分离的语音到文本处理器可以将在麦克风接收的语音输入转换成文本输入,并且将该文本输入提供给自动助理120。在一些其他实施方式中,初始由自动助理120接收的输入不是以文本格式,但由自动助理120转换成文本格式并且以文本格式提供给自动助理120的一个或多个其他组件。例如,用户接口输入设备102可以包括麦克风,可以在麦克风处接收语音输入并且提供给自动助理120,以及自动助理120的语音到文本处理器可以将语音输入转换成文本输入。
客户端计算设备可选地操作实现与自动助理120的对话的一个或多个应用。这些应用可以以各种形式出现,诸如短消息服务(“SMS”)和/或多媒体消息服务(“MMS”)客户端、在线聊天客户端(例如即时消息器、互联网延迟聊天或“IRC”等)、与社交网络相关联的消息应用、专用于与自动助理120会话的自动助理消息服务等。在一些实施方式中,一个或多个应用可以经由客户端计算设备的Web浏览器或其他应用呈现的网页或其他资源实现。
在各种实施方式中,响应于在与自动助理120对话期间,提供给自动助理120的某些文本输入,自动助理120可以使用至少部分基于文本输入的搜索参数,获得多个响应搜索结果。可以基于各种信号,诸如搜索结果的流行度、搜索参数和搜索结果之间的匹配度、用户的属性等,选择和/或排名所获得的搜索结果。在一些实施方式中,基于在与自动助理的对话期间,由用户提供的过去文本输入,附加或替选地选择和/或排名所获得的搜索结果。例如,如果:在与自动助理120对话期间,先前为用户呈现来自源1的搜索结果,从将被提供以呈现给用户的搜索结果排除来自“source 1(源1)”的搜索结果,并且为用户提供响应于文本输入“no more from this source(不再要来自这个源的)”。
自动助理120可以将用于呈现(可视和/或可听)给用户,作为对话的一部分的搜索结果组顺序地提供为用于经由用户接口输出设备104,提供给用户的输出。自动助理120可以按基于搜索结果的排名的顺序,顺序地提供该搜索结果组。在一些实施方式中,提供的组的每一个可以仅包括单个搜索结果。在一些其他实施方式中,一个或多个所提供的组可以包括多个搜索结果(例如每一组可以包括两个搜索结果)。
在一些实施方式中,在由自动助理120提供搜索结果期间,用户可以提供“破坏”由自动助理120提供的序列的次序并且导致将由自动助理120提供一个或多个“无序”搜索结果的进一步文本输入。例如,用户可以说出或键入:“previous(向前)”以回到正好在前搜索结果;“second result(第二结果)”以回到前二个呈现的搜索结果;“back to the onefrom Source A(回到源A的搜索结果)”以回到来自“Source A”的搜索结果;“back to theone about Topic A(回到有关主题A的搜索结果)”以回到有关“Topic A”的搜索结果;“more from Source A”以从“Source A”向前移动到另一搜索结果(即使它不是顺序次序中的下一个搜索结果),和/或“more about Topic A(更多有关主题A)”以向前移动到有关“topic A(主题A)”的另一搜索结果(即使它不是先后顺序中的下一个搜索结果)。
在各种实施方式中,自动助理120可以包括消息处理引擎122、输出适配引擎124、搜索引擎126、排名引擎128和输出生成引擎130。在一些实施方式中,可以省略、组合和/或在与自动助理120分开的组件中实现引擎122、124、126、128和/或130中的一个或多个。例如,可以在由包括用户接口输入和/或输出设备102和104的客户端计算设备执行并且与自动助理120分离的实现引擎122、124、126、128和/或130中的一个或多个或其任意可操作部分。同时,例如,可以由与自动助理120分离的系统(例如与自动助理120通信的单独的搜索系统),全部或部分实现搜索引擎126和/或排名引擎128。
消息处理引擎122处理提交给自动助理120并且生成用于由自动助理120的一个或多个其他组件使用的注释输出的文本输入。例如,消息处理引擎122可以处理基于经由用户接口输入设备102,由用户生成的用户接口输入生成的自然语言自由格式文本输入。生成的注释输出包括文本输入的一个或多个注释并且可选地,包括文本输入的一个或多个(例如全部)词项。
在一些实施方式中,消息处理引擎122被配置成识别和注释文本输入中的各种类型的语法信息。例如,消息处理引擎122可以包括被配置成通过它们的语法角色注释词项的词性标注器的一部分。例如,词性标注器可以通过其词性,诸如“名词”、“动词”、“形容词”、“代词”等,标注每一词项。同时,例如,在一些实施方式中,消息处理引擎122可以附加和/或替选地包括被配置成确定文本输入中的词项之间的句法关系的依存关系分析器。例如,依存句法分析器可以确定哪些词项修改句子的其他词项、主题和动词等(例如解析树)-并且做出这种依存关系的注释。
在一些实施方式中,消息处理引擎122可以附加和/或替选地包括被配置成注释一个或多个片段中的实体引用,诸如对人物、组织、位置等的引用的实体标注器。实体标注器可以以高粒度水平(例如,实现识别对诸如人的实体类的所有引用)和/或较低粒度水平(例如,实现识别对诸如特定人的特定实体的所有引用)注释实体的引用。实体标注器依赖于解析特定实体的自然语言输入的内容和/或可选地,与知识图或其他实体数据库通信以解析特定实体。
在一些实施方式中,消息处理引擎122可以附加和/或替选地包括被配置成基于一个或多个场境线索,聚组或“聚类”对相同实体的引用的同指消解器(coreferenceresolver)。例如,可以利用同指消解器来将自然语言输入“I hate Source 1.No moreresults from it.(我讨厌源1。不再需要来自它的结果)”中的词项“it”解析成“Source1”。
在一些实施方式中,消息处理引擎122可以附加和/或替选地确定文本输入的一个或多个片段的情绪,以及可选地,情绪量级。可以基于片段的词项、文本输入的其他词项和/或除文本输入本身外的数据(例如,包括在文本输入所基于的语音输入中的语音特性、在前文本输入和/或其他数据),确定片段的情绪。在一些实施方式中,消息处理引擎122包括被训练以基于文本输入的片段和/或其他数据,预测片段的情绪的分类/方向以及可选地,情绪量级的经训练的情绪分类器。例如,情绪分类器可以基于片段的词项以及可选地,基于其他数据,预测片段为积极还是消极,以及可选地,积极/消极的量级。在一些实施方式中,消息处理引擎122附加和/或替选地利用词项和情绪(以及可选地,情绪量级)之间的映射来确定片段的情绪。例如,映射可以定义:包括“never”的片段具有强量级的负面情绪;“I amnot a fan of(我不是…的粉丝)”具有较小量级的负面情绪,“always(总是)”具有强量级的正面情绪,“I like(我喜欢)”具有较小量级的正面情绪等。
在一些实施方式中,消息处理引擎122中的一个或多个组件依赖于来自消息处理引擎122的一个或多个组件的注释。例如,在一些实施方式中,指定的实体标注器在注释对特定实体的所有记载中,取决于来自同指消解器和/或依存关系分析器的注释。同时,例如,在一些实施方式中,同指消解器在聚类对相同实体的引用中,取决于来自依存关系分析器的注释。在一些实施方式中,在处理特定文本输入时,消息处理引擎122的一个或多个组件可以使用相关的在前输入和/或除特定文本输入外的其他相关的数据来确定一个或多个注释。例如,在与自动助理120的对话中的用户的第一文本输入可以是“Is that result fromsource 1?(结果来自源1吗?)”以及用户的后续文本输入可能是“never provide resultsfrom them(决不要提供来自它们的结果)”。在处理“never provide results from them(决不提供来自它们的结果)”中,利用“Is that result from source 1(结果来自源1吗)”的在前输入,同指消解器可以将“them(它们)”解析成“Source 1(源1)”。
搜索引擎126响应于由用户提交的,作为自动助理120和用户之间的对话的一部分的至少一些文本输入,搜索一个或多个搜索数据库154。搜索引擎126搜索搜索数据库154来识别响应于该文本输入的内容。在一些实施方式中,搜索数据库154包括索引公众可获得内容的数据库和/或索引专用于用户的内容的数据库。搜索引擎126可以利用数据库154来识别响应内容以及基于所识别的响应内容,生成搜索结果。在一些实施方式中,一个或多个搜索数据库154可以远离自动助理120和/或任何单独的客户端计算设备,和/或一个或多个搜索数据库154可以对自动助理120和/或任何单独的客户端计算设备而言是本地的。在本说明书中,术语“数据库”被用来指在一个或多个计算机可读介质中存储的结构化或非结构化的任何集合。
搜索引擎126在响应于文本输入搜索搜索数据库154时利用各种技术,诸如常规和/或其他信息检索技术。在一些实施方式中,搜索引擎126可以基于严格符合文本输入的搜索参数,搜索一个或多个数据库154。例如,对文本输入“mustangs(野马)”,唯一搜索参数为词项“mustangs”。在一些实施方式中,搜索引擎126可以基于一个或多个搜索参数,搜索一个或多个数据库154,该一个或多个搜索参数基于但不一定严格符合文本输入。例如,对文本输入“local news(本地新闻)”,搜索引擎126可以基于将数据库154限定到“news(新闻)”数据库和/或内容限定到“news”内容的搜索参数,以及基于将内容限定到用户本地的内容的搜索参数,搜索一个或多个数据库154。如另一示例,对文本输入“restaurantsnearby(附近饭店)”,搜索引擎126可以基于将数据库154限定到“points of interests(兴趣点)”数据库和将内容限定到“restaurant(饭店)”内容的搜索参数,以及基于将内容限定到在用户的当前位置的阈值距离内的内容的搜索参数,搜索一个或多个数据库154。如又一示例,对文本输入“my photos(我的照片)”,搜索引擎126可以基于将数据库154限定到用户个人的数据库和/或将内容限定到“image(图像)”内容的搜索参数,搜索一个或多个数据库154。
排名引擎128使用一个或多个排名信号,诸如内容的流行度、搜索参数和内容之间的匹配度、用户的属性(例如,用户的位置、用户的母语等),计算用于由搜索引擎126识别的内容的得分。然后,排名引擎128使用得分,对响应内容进行排名。
搜索引擎126使用由排名引擎128排名的所识别的响应内容以生成搜索结果。搜索结果包括与响应于基于文本输入发出的搜索的内容相对应的搜索结果。例如,每一搜索结果能包括响应于内容项的标题或其他提要、内容项的概述、到响应内容项的链接、有关响应内容项的其他信息和/或甚至整个内容项。如一个示例,新闻报道内容项的概述可以包括特定“片段”或新闻报道章节。同时,例如,对与图像相关联的搜索结果,搜索结果可以包括图像的缩减尺寸的显示、与图像相关联的标题和/或到图像的链接。同时,例如,对与视频相关联的搜索结果,搜索结果可以包括来自视频的图像、视频的片段、视频的标题和/或到视频的链接。
如本文所述,在一些实施方式中,在与自动助理120的对话期间,基于由用户提供的过去文本输入,识别和/或排名内容。例如,搜索引擎126可以基于过去文本输入确定的参数搜索该搜索数据库154,和/或排名引擎128可以基于过去文本输入确定的参数来对内容进行排名。例如,在对由搜索引擎126所识别的内容进行排名时,如果先前为用户呈现过与主题A有关的搜索结果,排名引擎128可以过滤与“Topic A(主题A)”有关的所有内容项,以及为用户提供响应文本输入“never provide results about this topic(决不提供有关该主题的结果)”。如另一示例,在对内容进行排名时,如果先前为用户呈现给来自源2的搜索结果,排名引擎128可以提升来自“Source 2(源2)”的内容项,以及为用户提供响应文本输入“I like this source(我喜欢该源)”。
由输出生成引擎130提供由搜索引擎126和排名引擎128生成的排名的搜索结果以经由用户接口输出设备104呈现给用户。例如,输出生成引擎130可以提供经由用户接口输出设备104的可听和/或可视呈现的搜索结果,以及可以将该搜索结果提供为用户和自动助理120之间的对话的一部分。
在一些实施方式中,输出生成引擎130顺序地提供搜索结果组以呈现给用户,作为对话的一部分,以及提供搜索结果的顺序可以基于搜索结果的排名。例如,输出生成引擎130可以提供仅包括最高排名的搜索结果的第一组,然后,提供仅包括第二最高排名搜索结果的第二组,接着提供包括第三最高排名搜索结果的第三组等。在一些实施方式中,输出生成引擎130在第一组后,自动地提供第二搜索结果组(例如,紧接在前或在时间延迟后),在第二组后,自动提供第三组等。在一些实施方式中,在提供第二组前,输出生成引擎130等待进一步用户接口输入,然后,在提供第三组前,等待进一步用户接口输入等。例如,在这些实施方式的一些中,如果在提供第一组期间或之后,用户提供口语用户接口输入,诸如“next(下一个)”、“another(另一个)”等,输出生成引擎130仅提供第二组。可以利用一个用户接口输入来使输出生成引擎130顺序地前进通过搜索结果组。
输出适配引擎124响应于用户的某些进一步文本输入,适配由输出生成引擎130提供的搜索结果。在一些实施方式中,输出适配引擎124响应于某些进一步文本输入,破坏由输出生成引擎130顺序提供的搜索结果的次序。例如,输出适配引擎124可以基于该次序,确定进一步文本输入的至少一个词项包括未包括在待提供的下一个组中的一个或多个搜索结果的属性。至少部分基于该确定,输出适配引擎124可以提供具有属性的一个或多个搜索结果,并且基于该次序提供该搜索结果来代替将提供的下一个组。
为图示出一些示例,假定提供搜索结果A,然后,提供搜索结果B的输出生成引擎130正在提供搜索结果C,并且指定在搜索结果C后,提供搜索结果D。响应于在提供搜索结果D前提供的文本输入“back to the first result(回到第一结果)”,输出适配引擎124使输出生成引擎130再次提供搜索结果A来代替搜索结果D。这可以基于确定词项“back to(回到)”引用在前呈现的搜索结果并且基于确定词项“first result(第一结果)”与在前呈现的搜索结果A的属性(由输出生成引擎130首先提供的搜索结果的属性)相匹配。响应于在提供搜索结果D之前提供的文本输入“back to the search result about Topic A(回到有关主题A的搜索结果)”,输出适配引擎124可以使输出生成引擎130再次提供搜索结果B来代替搜索结果D。这是基于确定词项“back to(回到)”引用在前呈现的搜索结果并且基于确定在前呈现的搜索结果B与“Topic A(主题A)”有关(以及搜索结果A和C不与主题A有关和/或与主题A不太相关)。确定搜索结果与主题有关、与实体有关、来自特定源,和/或具有其他属性可以基于被指派到该搜索结果的那些属性和/或搜索数据库154和/或其他数据库中的基本内容。
响应于在提供搜索结果D之前提供的文本输入“more results like this one(像这个的更多结果)”,输出适配引擎124可以使输出生成引擎130提供尚未呈现的搜索结果X来代替搜索结果D。这可以基于确定“more(更多)”具有积极情绪(例如,基于消息处理引擎122的注释),“like this one(像这个)”引用(至少部分)先前呈现的搜索结果C的属性,以及搜索结果C的一个或多个属性与搜索结果X的属性比搜索结果D的属性更相似。响应于在提供搜索结果D之前提供的文本输入“I don’t like this source(我不喜欢这个源)”,输出适配引擎124可以使输出生成引擎130提供尚未呈现的搜索结果Y来代替搜索结果D。这可以基于确定“don’t like(不喜欢)”具有消极情绪(例如,基于消息处理引擎122的注释)、“this source(这个源)”引用(至少部分)先前呈现的搜索结果C的源属性,以及搜索结果D具有与搜索结果C相同的源属性,而该次序中的下一个搜索结果Y不具有与搜索结果C相同的源属性。在提供的各种示例的实施方式中,输出适配引擎124依赖于由消息处理引擎122提供的一个或多个注释以及将各种技术用于对文本片段的语义理解,诸如基于规则的技术、基于模板的技术、机器学习模型(例如深度神经网络)和/或其他技术。
在一些实施方式中,输出适配引擎124附加和/或替选地将对属性表达的情绪用来基于用户和自动助理120之间的对话中的下游文本输入,修改用于下游搜索的搜索结果的识别和/或排名。例如,上述“我不喜欢该源”的文本输入可以被用来降低具有与搜索结果C相同源属性的下游搜索结果的排名。
现在回到图2,提供自动助理120的各种组件的附加描述。在图2中,消息处理引擎122接收文本输入201,生成包括文本输入的注释和/或文本输入201本身的词项的注释输入203。搜索引擎126利用注释输入203来确定搜索参数、基于搜索参数发出对一个或多个搜索数据库154的搜索、并且识别响应于该检索的内容。排名引擎128利用一个或多个信号,对响应内容进行排名。例如,排名引擎128基于响应内容的流行度(例如如由搜索数据库154中的内容的条目所指示的)和/或基于参数数据库156的一个或多个参数,对响应内容进行排名。如本文所述,可以基于与用户的对话中的过去文本输入,确定参数数据库156的一个或多个参数。给定参数可以定义属性和如何影响具有该属性的搜索结果。例如,参数可以定义属性并且定义在对搜索结果的排名中,应当如何提升或降低具有该属性的搜索结果,或应当阻止具有该属性的搜索结果被包括在提供以呈现给用户的搜索结果中。
排名引擎128将搜索结果和搜索结果的次序205提供给输出生成引擎130。搜索结果是基于由搜索引擎126识别的内容以及搜索结果的次序可以基于由排名引擎128确定的排名。
输出生成引擎130基于该次序,开始顺序地提供搜索结果。例如,如图2所示,输出生成引擎130提供搜索结果组1 207并且可选地,提供如由省略号指示的进一步搜索结果组。
在输出生成引擎130顺序地提供搜索结果期间的某些时间点,消息处理引擎122接收进一步文本输入211。消息处理引擎122可以确定进一步文本输入211与搜索结果的呈现的适配有关,因此,将进一步注释输入213提供给输出适配引擎124。该进一步注释输入213可以包括进一步文本输入211的注释和/或进一步文本输入211的一个或多个词项。
在一些实施方式中,基于进一步注释输入213,输出适配引擎124确定适配215以使得顺序地提供搜索结果并且将适配215通信到输出生成引擎130。输出生成引擎130可以基于适配215,适配搜索结果的当前顺序提供。例如,代替在当前顺序提供中提供下一个搜索结果,输出生成引擎130反而可以基于适配215,提供无序搜索结果。
在一些实施方式中,基于进一步注释输入213,输出适配引擎124附加或替选地确定用于存储在参数数据库156中的参数217。这些存储的参数217可以被用来基于新的文本输入,响应于新的搜索,由引擎126和/或128修改附加下游搜索和/或排名。应注意到在一些实施方式中,输出适配引擎124可以同时提供适配215和参数217两者。例如,对进一步文本输入211“I never want results from Source A(我决不想要来自源A的结果)”:可以提供适配215以及使得不再提供来自源A并且由输出生成引擎130指定提供的搜索结果,以及可以存储参数217,并且可以响应于基于新的文本输入的新搜索,阻止提供来自源A的附加搜索结果。
现在参考图3-7,描述自动助理120的实施方式的各种示例。图3、4A-4E、6和7分别图示出根据本文公开的实施方式的具有显示在计算设备110的用户与自动助理120之间发生的对话的示例的显示屏140的计算设备110。可以在计算设备110和/或与计算设备110网络通信的一个或多个计算设备上实现自动助理120的一个或多个方面。
图3、4A-4E、6和7的显示屏140进一步包括用户可以选择以经由虚拟键盘生成用户接口输入的文本回复接口元素188和用户可以选择以经由麦克风生成用户接口输入的语音回复接口元素189。在一些实施方式中,用户可以在无需选择语音回复接口元素189的情况下经由麦克风生成用户接口输入。例如,在对话期间,主动监视经由麦克风的可听用户接口输入会发生以消除用户选择语音回复接口元素189的需要。在那些实施方式的一些中和/或其他实施方式中,可以省略语音回复接口元素189。此外,在一些实施方式中,可以附加和/或替选地省略文本回复接口元素188(例如用户仅提供可听用户接口输入)。图3、4A-4E、6和7的显示屏140还包括系统接口元素181、182、183,可以与用户交互来使得计算设备110执行一个或多个动作。
图5图示出根据本文所述的实施方式的包括一个或多个麦克风和一个或多个扬声器的计算设备110并且图示出在计算设备510的用户101和自动助理120之间,经由麦克风和扬声器发生的对话的示例。可以在计算设备510上和/或与计算设备510网络通信的一个或多个计算设备上,实现自动助理120的一个或多个方面。
在图3中,用户将初始文本输入380A提供为用户和自动助理120之间的对话的一部分。响应于文本输入380A,自动助理120获得响应于文本输入380A的搜索结果,并且提供搜索结果382A以呈现在显示屏140上,作为对话的副本。自动助理120首先提供搜索结果382A以呈现,这是基于其处于搜索结果的呈现次序中的第一个(例如基于搜索结果的排名)。然后,用户提供文本输入380B“next(下一个)”以使得自动助理120提供搜索结果382B以呈现。根据该次序,搜索结果382B是下一个搜索结果。
然后,用户提供文本输入380C“more like this(更多像这个的)”。自动助理120确定“like this”引用最近呈现的搜索结果382B。自动助理120进一步确定最近呈现的搜索结果382B的一个或多个属性,诸如以下的属性:该搜索结果与和虚构的厨师Jon Doe相对应的第一实体相关联,以及搜索结果与和虚构的饭店Hypothetical Café相对应的第二实体相关联。自动助理120进一步确定像搜索结果382B,搜索结果382C也具有与和虚构的厨师JonDoe相对应的第一实体相关联的属性。基于该确定,自动助理120响应于文本输入380C,提供搜索结果382C以呈现。在一些实施方式中,根据原始次序,搜索结果382C不是顺序的下一个搜索结果。然而,基于文本输入380C,自动助理120可以提供搜索结果382C,代替根据原始次序,被指定以提供的下一个搜索结果。换句话说,文本输入380C可以使得自动助理120适配搜索结果的呈现的原始次序,使得在该次序中,提升与搜索结果382B类似的一个或多个搜索结果。
然后,用户提供文本输入380D“No,about Hypothetical Café(不,有关Hypothetical Café)”。自动助理120基于文本输入380C和380D,确定“No,aboutHypothetical Café”引用用户想要更多有关虚构的饭店Hypothetical Café而不是有关虚构的厨师Jon Doe的搜索结果。自动助理120进一步确定搜索结果382D具有与和虚构的饭店Hypothetical Café相对应的实体相关联的属性,并且基于该确定,提供搜索结果382D以接着呈现。在一些实施方式中,根据如由文本输入380C修改的次序,搜索结果382D可能不是下一个搜索结果。然而,基于文本输入380D,自动助理120可以提供搜索结果382,代替根据修改的次序,被指定以提供的下一个搜索结果。换句话说,文本输入380D可以使自动助理120进一步适配搜索结果的呈现的修改次序,以便在该次序中提升与“Hypothetical Café”有关的一个或多个搜索结果。
应注意到,在一些实施方式中,响应于文本输入380C,自动助理120识别与搜索结果382B共享一个或多个属性的多个搜索结果,并且基于一个或多个因素,选择搜索结果382C,代替那些其他的搜索结果。例如,自动助理120可以确定与对应于虚构的饭店Hypothetical Café的实体相比,与虚构的厨师Jon Doe相对应的实体对搜索结果382B具有更大权重(例如更相关)。基于与和虚构的厨师Jon Doe相对应的实体更相关的搜索结果382C,可以初始地选择搜索结果382C,代替搜索结果382D和/或其他搜索结果。
在一些实施方式中,响应于请求消歧“like this”的输入的文本输入380C,自动助理120可以可选地生成提示。例如,自动助理120可以识别搜索结果382B的一个或多个属性并且制定要求用户指定用户“like this”是指哪些属性的提示。例如,自动助理120可以确定搜索结果382B与“Source 2(源2)”的源属性相关联并且与“Jon Doe(Chef)”和“Hypothetical Café”的实体属性相关联。基于该确定,提示可以是“do you want morefrom Source 2,more about the chef,or more about Hypothetical Café?(你想要更多来自源2、更多有关厨师还是更多有关Hypothetical Café?)”。响应于该提示提供的进一步文本输入可以由自动助理使用来选择适当的进一步搜索结果以提供。例如,“aboutHypothetical Café(关于Hypothetical Café)”的进一步文本输入会导致初始提供搜索结果382D,代替搜索结果382C。
在图4A中,用户提供初始文本输入480A,作为用户和自动助理120之间的对话的一部分。响应于文本输入480A,自动助理120获得响应于文本输入480A的搜索结果并且提供搜索结果482A用于呈现在显示屏上作为对话的一部分。自动助理120首先提供搜索结果482A,这是基于其处于搜索结果的呈现次序中的第一个(例如基于搜索结果的排名)。
在将搜索结果482A显示给用户后,然后,用户提供文本输入488B“next(下一个)”,如图4B所示。作为响应,自动助理120提供使得由搜索结果482B取代搜索结果482A的输出,如图4B所示。根据该次序,搜索结果482B是下一个搜索结果。通过键入(例如通过选择接口区184)或通过语音(例如通过选择麦克风接口元素185-或仅通过发声,而不一必选择元素185(即,自动助理可以在提供期间监视语音输入)),提供图4的文本输入488B。
应注意到文本输入480A与文本输入380A相同,搜索结果482A与搜索结果382A相同,文本输入488B与文本输入380B相同,以及搜索结果482B与搜索结果382B相同。然而,在图3中,文本输入380B被添加到在图形界面中呈现的对话的副本中,并且持续在该副本中。相反,图4B的文本输入488B是对话的一部分,但不添加到由图形界面呈现的对话的副本。同时,在图3中,在提供搜索结果382B后,搜索结果382A持续在副本中。而在图4B中,搜索结果482B取代搜索结果482A,由此将其从副本移除。换句话说,搜索结果482B取代搜索结果482A,由此阻止同时显示搜索结果482A和搜索结果482B。在一些实施方式中,参考图4A-4E所述的技术例如有利于有限尺寸的显示屏和/或界面,其中,不会分散注意力和/或保持对话的整个副本的计算上负担。
在将搜索结果482B显示给用户后,然后,用户提供文本输入488C“next(下一个)”,如图4C所示。作为响应,自动助理120提供使得由搜索结果482C替代搜索结果482B的输出,如图4C所示。根据该次序,搜索结果482C是下一个搜索结果。
在将搜索结果482C显示给用户后,然后,用户提供文本输入488D“back to theone from source 1(回到来自源1的一个搜索结果)”。自动助理120可以确定“back to(回到)”引用先前呈现的搜索结果并且“source 1(源1)”是先前呈现的搜索结果482A的属性。作为响应,自动助理120使得由扩展的搜索结果482D替代搜索结果482C。扩展的搜索结果482D包括与搜索结果482A相同的内容,但还包括来自基本内容项的一些附加文本。通过图4D,用户可以可选地进一步导航搜索结果(例如,“Ok,now to search result 5(好,现在到搜索结果5)”)或可以选择(例如,可听选择或“触摸选择”)与扩展的搜索结果482D相关联的链接来查看与扩展的搜索结果482D相关联的全部基本内容项。查看全部基本内容项能够可选地发生在单独的界面和/或单独的应用中。
图4E图示出与图4A-4D类似的示例,但其中,各种对话项持续在对话中。特别地,在图4E中,文本输入480B、480C和480D与图4B-4D的文本输入488B、488C和488D。然而,在图4E中,文本输入480B、480C和480D仍然在对话的副本中,而它们的对应部分不在图4B-4D中。同时,在图4E中,搜索结果482A、482B和482C仍然在对话的副本中,而它们不在图4B-4D中。
在图5中,用户提供初始文本输入580A,作为用户和自动助理120之间的一部分。响应于文本输入580A,自动助理120获得响应于文本输入580A的搜索结果并且经由计算设备510的扬声器,提供用于可听呈现的搜索结果582A。自动助理120首先提供搜索结果582A,这基于它处于搜索结果的呈现次序中的第一个。
在搜索结果582A的可听提供期间,用户提供文本输入580B,同时停止提供搜索结果582A。文本输入580B“I never want news from Source 1(我决不想要来自源1的新闻)”可以被用来阻止来自源1的进一步搜索结果被自动助理120提供给用户。例如,自动助理120可以基于由“never(决不)”指示的情绪,抑制具有源1的属性的搜索结果。在一些实施方式中,仅对响应于文本输入580A的那些搜索结果,抑制来自源1的进一步搜索结果。在一些其他实施方式中,对响应于进一步文本输入的搜索结果,抑制来自源1的进一步搜索结果。例如,来自源1的搜索结果可以继续受自动助理120抑制,直到用户经由进一步文本输入和/或其他的接口输入,明确表示用户希望再次接收来自源1的搜索结果为止。在一些实施方式中,较小量级的消极情绪会导致较少持续时间和/或来自源1的搜索结果的抑制程度。例如,“I’m not a big fan of Source 1(我不是源1的狂热粉丝)”会导致基于与比与“never”相关联的情绪更低量级的“not a big fan of”相关联的情绪,降级来自源1的搜索结果,但不排除。在一些实施方式中,基于情绪分类器、一个或多个规则和/或基于其他技术,确定与搜索结果的属性相关联的词项的情绪的方向(例如积极、消极)和/或量级。
响应于文本输入580B,停止提供搜索结果582A并且提供搜索结果582B。在一些实施方式中,搜索结果582B是在搜索结果582B后的该次序中的下一个。在一些其他实施方式中,基于与“Source 1(源1)”的源属性相关联的搜索结果,在搜索结果582A和搜索结果582B之间,以该次序提供一个或多个中间搜索结果,但由自动助理120略过搜索结果。
在可听提供搜索结果582B期间,用户提供停止提供搜索结果582B的文本输入580C。响应于文本输入580C“next(下一个)”,自动助理可以提供该次序中的下一个搜索结果582C。在可听提供搜索结果582C期间,用户提供停止提供搜索结果582C的文本输入580D。响应于“next(下一个)”文本输入580D,自动助理可以提供该次序中的下一个搜索结果582D。
在可听提供搜索结果582D期间,用户提供停止提供搜索结果582D的文本输入580E。自动助理120可以确定文本输入580E“back(回到)”引用先前呈现的搜索结果并且“Local Business(当地企业)”是先前呈现的搜索结果582B的属性。作为响应,自动助理120再次呈现搜索结果582B,并且由于用户未经由进一步文本输入停止可听呈现,搜索结果582B的大部分被可听呈现。
图6和7图示出经由与自动助理120的进一步对话,用户如何探究与给定搜索结果相关联,然后向前和/或向后导航到其他搜索结果的附加细节的示例。
在图6中,用户提供初始文本输入680A,作为用户和自动助理120之间的对话的一部分。响应于文本输入680A,自动助理120获得响应文本输入680A的搜索结果并且提供搜索结果682A以呈现,作为对话的副本的一部分。自动助理120首先提供搜索结果682A,这是基于它在搜索结果的呈现的次序中为第一个。
然后,用户提供文本输入680B“What time does it open?(什么时候营业?)”来使得自动助理120呈现与搜索结果682A有关并且响应于文本输入680B的附加细节682B。然后,用户提供文本输入680C“next”。自动助理120可以确定“next”引用次序中的下一搜索结果并且响应于文本输入680C,提供下一个搜索结果682C。在一些实施方式中,基于附加细节682B为单项,而不是项列表,自动助理120可以确定“next”引用下一个搜索结果,而不是引用与搜索结果682A有关的进一步细节。换句话说,仅有一个“time that it opens(营业时间)”和“next(下一个)”不能引用营业的附加时间。
在图7中,文本输入780A与图6的文本输入680A相同,以及搜索结果782A与图6的搜索结果682A相同。然而,在图7中,文本输入780B不同于图6的文本输入680B。文本输入780B“Reviews?(评论?)”使得自动助理120呈现与搜索结果782A有关并且响应于文本输入780B的附加细节782B。附加细节782B是用于“Restaurant A.(饭店A)”的多个可用评论中的一个。
然后,用户提供文本输入780C“next review(下一个评论)”。基于存在“review(评论)”,自动助理120可以确定“next”引用下一个评论,而不是该次序中的下一个搜索结果。因此,响应于文本输入780C,自动助理120提供作为“Restaurant A(饭店A)”的下一个评论的附加细节782C。
然后,用户提供文本输入780D“next restaurant(下一个饭店)”。基于存在“restaurant”,自动助理120可以确定“next”引用下一个饭店搜索结果。因此,响应于文本输入780D,自动助理120提供作为响应于文本输入780A的另一饭店搜索结果的附加搜索结果782D。
图8是图示出根据本文公开的实施方式的示例方法800的流程图。为了方便,参考执行操作的系统,描述流程图的操作。该系统可以包括各种计算机系统的各种组件,诸如自动助理120。此外,尽管以特定次序示出方法800的操作,但这不意味着限定。可以重新排序、省略或添加一个或多个操作。
在块850,系统接收文本输入。文本输入可以被生成为用户和系统的对话的一部分,并且可以基于由用户接口输入设备(诸如麦克风或虚拟键盘)生成的用户接口输入。
在块852,系统获得响应于文本输入的搜索结果并且获得对搜索结果的呈现次序。呈现次序可以基于搜索结果的排名。在一些实施方式中,系统本身执行搜索以获得搜索结果和/或对搜索结果进行排名。在一些实施方式中,该系统将搜索参数提供给一个或多个单独的系统并且作为响应,获得搜索结果和搜索结果的排名。
在块854,系统提供初始搜索结果组。例如,根据呈现次序,系统可以仅提供第一搜索结果。提供初始搜索结果组,以可听和/或可视呈现给用户,作为对话的一部分。
在块856,系统接收进一步文本输入。然后,系统在块856A、856B、856C和856D中的一个或多个处,确定进一步文本输入为何种类型的输入。
如果在块856A确定进一步文本输入为继续输入,该系统进行到块858。在块858,根据呈现次序,系统提供下一个搜索结果组。作为块856A的一个示例,如果仅包括预定“continuing(继续)”词项集中的一个或多个词项,诸如“next(下一个)”、“continue(继续)”、“go on(接下来)”等,系统可以确定进一步文本输入为继续输入。作为块858的一个示例,根据呈现次序,该系统可以仅提供下一个搜索结果。
相反,如果在块856B,确定进一步文本输入是适配输入,该系统进行到块860。在块860,系统基于进一步文本输入,修改呈现次序。然后,该系统进行到块858并且根据(如在块860修改的)呈现次序,提供下一个搜索结果组。该系统附加或可替选地进行到块862,其中,该系统基于进一步文本输入,确定和存储参数。如本文所述,在块852的下游迭代中,参数可以修改识别和/或搜索结果排名。
作为块856B的一个示例,如果随着其他词项,包括预定“adaptation(适配)”词项集中的一个或多个(例如“back to(回到)”、“forward to(前进到)”、“more like(更喜欢)”、“less like(不太喜欢)”、“less about(不太有关)”、“never(决不)”、“remove(移除)”),符合一个或多个适配模板(例如“back to result[#]”,“forward to result[#]”)和/或基于其他技术,该系统确定进一步文本输入为适配输入。作为块860的一个示例,该系统可以修改呈现次序以提升、降级或移除具有在进一步文本输入中明确或隐含引用的属性的一个或多个搜索结果。
相反,如果在856C确定进一步文本输入为结果细节输入,该系统进行到块864。在块864,系统基于该输入,提供进一步搜索结果细节。作为块856C的一个示例,如果请求与在块854提供的搜索结果有关的进一步内容,该系统可以确定进一步文本输入为结果细节输入。例如,如果在块854提供“restaurant”搜索结果,可以将“reviews for thisrestaurant(对该饭店的评论)”的进一步文本输入确定为结果细节输入。
相反,如果在块856D确定进一步文本输入为其他输入,该系统进行到块866并且执行其他动作。例如,文本输入可以是旨在启动新搜索的输入,以及块866的其他动作可以回到块852并且获得响应于进一步文本输入的搜索结果。同时,例如,文本输入可以是请求单一响应,诸如“what time is it(现在几点)”的输入并且块866的进一步动作可以是提供指示当前时间的输出,然后返回到块856。
在与用户对话期间,块856,856A/B/C/D,858,860,862,864和/或866的多个迭代会发生,使得用户根据本文公开的技术,导航和探测多个搜索结果。尽管以特定顺序示出块856A,856B,856C,和856D,应理解到可以变更该次序,可以并行地执行一个或多个块,和/或可以仅有选择地执行一个或多个块。
图9是图示出根据本文公开的实施方式的示例方法900的流程图。为了方便,参考执行操作的系统,描述流程图的操作。该系统可以包括各种计算机系统的各种组件,诸如自动助理120。此外,尽管以特定顺序示出方法900的操作,但这不是限定。可以重新排序、省略或添加一个或多个操作。
在块950,系统接收文本输入。文本输入可以被生成为用户和系统的对话的一部分,并且可以基于由用户接口输入设备(诸如麦克风或虚拟键盘)生成的用户接口输入。
在块952,系统获得响应于文本输入的搜索结果。在一些实施方式中,在块952,该系统还获得对搜索结果的呈现次序。
在块954,该系统提供一个或多个搜索结果组。例如,该系统提供第一搜索结果,然后第二搜索结果,接着第三搜索结果等。
在块956,该系统在块954的提供期间,接收文本输入。
在块958,该系统基于文本输入,确定在块954提供的一个或多个搜索结果的一个或多个属性。例如,文本输入可以是“never show results from this source(决不显示来自该源的结果)”。基于“this source(该源)”,该系统可以确定被指派到最近提供的搜索结果的源属性。如另一示例,文本输入可以是“more like this(更多像这个的)”。基于“likethis”,该系统可以确定被指派到最近提供的搜索结果的属性,诸如源属性、主题属性、文档类型属性(例如图像、视频或网页)等。如又一示例,文本输入可以是“no more from Source1(不再要来自源1的)”并且该系统可以确定“Source 1”的源属性,该源属性也是在块954提供的一个或多个搜索结果的源属性。
在块960,该系统基于所确定的属性和在块956的进一步文本输入中,对该属性表达的情绪,确定参数。给定的参数可以定义属性以及如何影响具有该属性的搜索结果。该系统可以基于在进一步文本输入中,对该属性表达的情绪,确定如何影响具有该属性的搜索结果。在一些实施方式中,该系统可以访问某些情绪词项与某些影响的映射以确定影响。例如,“never(决不)”可以被映射以抑制具有该属性的搜索结果。“don’t like(不喜欢)”可以被映射以降级至具有该属性的第一级搜索结果。“really don’t like(真的不喜欢)”可以被映射以降级到具有该属性的更大的第二级搜索结果。“more like(更喜欢)”可以被映射到以提升至具有该属性的第一级搜索结果等。在一些实施方式中,该系统可以附加或可替选地利用情绪分类器来确定情绪的方向和/或量级,以及可以基于方向和/量级,确定如何影响具有该属性的搜索结果。
在块962,该系统使用参数来影响是否或何时提供具有该属性的一个或多个属性搜索结果以呈现给用户。在一些实施方式中,该系统使用参数来影响在块952获得的一个或多个搜索结果,并且最终影响响应于在块950接收的文本输入而对搜索结果的进一步提供。在一些实施方式中,该系统附加或可替选地使用参数来基于用户和系统之间的对话中,基于下游文本输入,影响用于下游搜索的一个或多个搜索结果。
参考经由图形用户界面,可视呈现搜索结果和/或经由扬声器,可听呈现搜索结果,描述本文所述的各种示例。然而,在一些实施方式中,使用附加和/或替代技术,可以提供搜索结果以呈现给用户。例如,在一些实施方式中,可以提供搜索结果,以触觉呈现给用户。如另一示例,在一些实施方式中,搜索结果可以包括将由照明系统实现的多个照明命令和/或照明场景,以及可以将搜索结果的每一个呈现为来自照明系统的照明输出。例如,提供照明场景搜索结果以呈现给用户可以包括将命令或其他输出提供给照明系统控制器和/或照明系统的独立组件(例如独立灯泡或其他照明单元),产生与将由照明系统生成的照明场景搜索结果相对应的照明场景。如一个具体的示例,可以将第一照明场景搜索结果呈现给用户,作为来自照明系统的照明输出,响应于“next(下一个)”用户接口输入,可以呈现按照搜索结果的次序的下一个照明场景;响应于另一“next”用户接口输入,可以呈现该次序中的下一个照明场景,并且响应于识别先前呈现的搜索结果的进一步用户接口输入,可以呈现与搜索结果的次序相反的另一搜索结果。例如,进一步文本输入“back to the firstlighting scene(回到第一照明场景)”可以使得再次呈现初始呈现的照明场景,进一步文本输入“back to the one with a lot of red(回到具有大量红灯的场景)”可以使得再次呈现具有属性“red(红)”的先前提供的照明场景,进一步文本输入“more like this(更多像此)”可以使得呈现另外将被呈现的场景,其中,该场景与该次序相反并且基于与当前呈现的场景共享属性识别。作为另一特定示例,给定照明场景搜索结果可以被呈现给用户,作为来自照明系统的照明输出,并且当呈现给定照明场景搜索结果时,用户可以提供进一步用户接口输入“never any lighting scenes like this(决无像此的任何照明场景)”。该进一步用户接口输入可以被用来响应于进一步对话,确定是否或何时呈现与给定照明场景搜索结果一样,具有一个或多个属性的进一步照明场景搜索结果。
图10是示例计算设备1010的框图,计算设备1010可选地被用来执行本文所述的技术的一个或多个方面。在一些实施方式中,客户端计算设备、自动助理120和/或其他组件中的一个或多个可以包括示例计算设备1010的一个或多个组件。
计算设备1010通常包括至少一个处理器1014,其经由总线子系统1012与数个外围设备通信。这些外围设备可以包括存储子系统1024,例如包括存储器子系统1025和文件存储子系统1026、用户接口输出设备1020、用户接口输入设备1022以及网络接口子系统1016。输入和输出设备允许用户与计算设备1010交互。网络接口子系统1016提供到外部网络的接口并且被耦合至其他计算设备中的对应接口设备。
用户接口输入设备1022可以包括键盘、指针设备(诸如鼠标、跟踪球、触控板或绘图板)、扫描仪、并入显示器中的触摸屏、音频输入设备(诸如语音识别系统、麦克风)和/或其他类型的输入设备。一般而言,术语“输入设备”的使用意在包括用于将信息输入到计算设备1010中或者通信网络上的所有可能类型的设备和方式。
用户接口输出设备1020可以包括显示子系统、打印机、传真机或者诸如音频输出设备的非视觉显示器。显示子系统可以包括阴极射线管(CRT)、诸如液晶显示器(LCD)的平板设备、投影设备或者用于创建可见图像的一些其他机制。显示子系统还可以提供诸如经由音频输出设备的非视觉显示。一般而言,术语“输出设备”的使用意在包括用于将信息从计算设备1010输出到用户或者另一机器或计算设备的所有可能类型的设备和方式。
存储子系统1024存储提供本文所述的一些或全部模块的功能的编程和数据结构。例如,存储子系统1024可以包括执行图8的方法和/或图9的方法的所选方面的逻辑。
这些软件模块通常由处理器1014独立地或者结合其他处理器来执行。存储子系统1024中使用的存储器1025能够包括数个存储器,这数个存储器包括用于在程序执行期间存储指令和数据的主随机存取存储器(RAM)630以及在其中存储固定指令的只读存储器(ROM)632。文件存储子系统1026能够提供对于程序和数据文件的永久存储,并且可以包括硬盘驱动器、软盘驱动器连同相关联的可移动介质、CD-ROM驱动器、光盘驱动器或者可移动介质盒。实现某些实施方式的功能的模块可以由存储子系统1024中的文件存储子系统1026来存储,或者被存储在可由处理器1014访问的其他机器中。
总线子系统1012提供用于令计算设备1010的各种组件和子系统按预期彼此通信的机制。虽然总线子系统1012被示意性示为单总线,但总线子系统的替选实施方式可以使用多条总线。
计算设备1010能够是不同的类型,包括工作站、服务器、计算集群、刀片服务器、服务器机群或者任何其他的数据处理系统或计算设备。由于计算机和网络的不断变化的性质,在图10中描绘的对计算设备1010的描述仅旨在作为用于图示一些实施方式的具体示例。计算设备1010的许多其他配置可能具有比在图10中所描绘的计算机系统更多或更少的组件。
在本文所述的系统采集关于用户的个人信息或者可以使用个人信息的情况下,可以向用户提供机会控制程序或者功能是否收集用户信息(例如关于用户的社交网络、社交行动或活动、职业、用户偏好或者用户的当前地理位置的信息),或者控制是否和/或如何从内容服务器接收可能与用户更相关的内容。此外,在存储或者使用某些数据之前,可以通过一个或多个方式对其进行处理,以致删除个人可识别信息。例如,用户的身份可以被处理,以致不会针对用户来确定个人可识别信息,或者用户的地理位置可以被泛化到获得地理位置信息的位置(诸如城市、邮政编码或者州级别),以致用户的特定地理位置不会被确定。因此,用户可以控制如何关于用户收集信息和/或如何使用信息。

Claims (20)

1.一种由一个或多个处理器实现的方法,包括:
接收可听输入,所述可听输入基于由用户经由用户接口输入设备生成的第一用户接口输入,
其中,所述第一用户接口输入由所述用户生成作为所述用户与至少部分由所述一个或多个处理器实现的自动助理之间的对话的一部分;
获得响应于所述可听输入的多个搜索结果;以及
经由用户接口输出设备,顺序地提供所述多个搜索结果的多个组以呈现给所述用户,其中,所述多个搜索结果的所述多个组中的每个组包括所述多个搜索结果中的至少一个搜索结果,以及其中,顺序地提供所述多个搜索结果的所述多个组包括根据所述多个组的次序来提供所述多个组中的每个组;
在所述顺序提供期间并且在所述顺序提供期间所述多个搜索结果的所述多个组中的至少一个组的所述呈现期间,接收进一步可听输入,所述进一步输入基于由所述用户经由所述用户接口输入设备或另一用户接口输入设备生成的第二用户接口输入;
基于所述第二用户接口输入的一个或多个词项和基于先前呈现的搜索结果的至少一个属性,确定所述第二用户接口输入与所述先前呈现的搜索结果相对应,所述先前呈现的搜索结果为在所述顺序提供期间先前提供的所述多个搜索结果中的一个搜索结果,
其中,基于所述第二用户接口输入的所述一个或多个词项并且基于所述先前呈现的搜索结果的所述至少一个属性,确定所述第二用户接口输入与所述先前呈现的搜索结果相对应包括:确定所述第二用户接口输入的词项中的所述一个或多个词项与所述先前呈现的搜索结果的所述至少一个属性相匹配;以及
响应于确定所述第二用户接口输入与所述先前呈现的搜索结果相对应,提供与所述先前呈现的搜索结果有关的输出,所述输出的所述提供与所述多个搜索结果的所述多个组被顺序地提供的的所述次序相反。
2.如权利要求1所述的方法,其中,顺序地提供所述多个搜索结果的所述多个组以呈现给所述用户包括:
响应于所述可听输入,提供所述多个组中的初始组;以及
提供在所述初始组后的第二组,其中,所述第二组根据所述次序顺序跟在所述初始组后,其中,提供所述第二组是响应于接收第三用户接口输入,以及其中,所述第三用户接口输入在所述第二用户接口输入前。
3.如权利要求1所述的方法,其中,所述用户接口输入设备是麦克风,所述用户接口输出设备是扬声器,以及其中,所述第二用户接口输入是由所述用户经由所述麦克风生成的。
4.如权利要求3所述的方法,其中,所述第二用户接口输入的至少一部分是经由所述扬声器在所述多个搜索结果中的一个的可听呈现期间接收的。
5.如权利要求1所述的方法,进一步包括:
在所述顺序提供期间,主动监视所述第二用户接口输入,
其中,接收所述第二用户接口输入发生在所述主动监视期间。
6.如权利要求1所述的方法,其中,所述用户接口输出设备为显示器,其中,所述输出包括所述先前呈现的搜索结果,以及其中,提供所述输出包括:
使得在所述显示器上呈现的图形用户界面中,与来自所述先前呈现的搜索结果的所述先前呈现的任何持续输出分离地呈现所述输出。
7.如权利要求1所述的方法,其中,所述输出是与所述先前呈现的搜索结果有关、但与所述先前呈现的搜索结果不同的基本内容项相关联的附加搜索结果。
8.如权利要求1所述的方法,其中,所述用户接口输出设备是显示器,以及其中,顺序地提供所述多个组以经由所述显示器呈现给所述用户包括:
使得所述多个组中的每个组在所述显示器上呈现的图形用户界面中,取代所述多个组中的对应的紧接在前的组。
9.如权利要求8所述的方法,其中,提供与所述先前呈现的搜索结果有关的所述输出包括:
使得所述输出在所述图形用户界面中,取代在所述顺序提供期间提供的所述多个组中的最近提供的组。
10.如权利要求1所述的方法,其中,所述至少一个属性为下述中的一个:所述先前呈现的搜索结果的源的名称、包括在所述先前呈现的搜索结果中的实体的名称,以及对在所述多个组的顺序提供中所述先前呈现的搜索结果的呈现次序的引用。
11.如权利要求1所述的方法,进一步包括:
基于所述第二用户接口输入的所述一个或多个词项,确定所述第二用户接口输入还与所述多个搜索结果中在所述顺序提供期间先前提供的附加的先前呈现的搜索结果相对应;
其中,确定所述第二用户接口输入与所述先前呈现的搜索结果相对应进一步包括:
基于一个或多个附加标准,选择所述先前呈现的搜索结果,代替所述附加的先前呈现的搜索结果。
12.如权利要求1所述的方法,进一步包括:
基于所述第二用户接口输入的所述一个或多个词项,确定所述第二用户接口输入还与所述多个搜索结果中在所述顺序提供期间先前提供的附加的先前呈现的搜索结果相对应;
其中,确定所述第二用户接口输入与所述先前呈现的搜索结果相对应包括:
基于所述附加的先前呈现的搜索结果的附加属性,生成提示,
提供所述提示以经由所述用户接口输出设备呈现给所述用户,
接收响应于所述提示的第四用户接口输入,以及
基于所述第四用户接口输入,选择所述先前呈现的搜索结果,代替所述附加的先前呈现的搜索结果。
13.一种由一个或多个处理器实现的方法,包括:
作为用户与至少部分由所述一个或多个处理器实现的自动助理之间的对话的一部分:
提供搜索结果以呈现给所述用户,以及
响应于提供所述搜索结果,接收引用所述搜索结果的属性和引用所述用户针对所述属性表达的情绪的文本输入,所述文本输入基于由所述用户经由用户接口输入设备生成的用户接口输入;
响应于所述用户与所述自动助理之间的进一步对话,基于所述搜索结果的所述属性和所述用户针对所述属性表达的的所述情绪,确定影响是否或何时由所述自动助理提供具有所述属性的一个或多个属性搜索结果的参数;以及
作为所述用户与所述自动助理之间的所述进一步对话的一部分:
由所述自动助理使用所述参数来影响是否或何时提供所述一个或多个属性搜索结果的至少一个以呈现给所述用户,其中所述参数:
通过在基于所述用户针对所述一个或多个属性搜索结果的所述属性表达的所述情绪的程度上影响所述一个或多个属性搜索结果的排名,影响何时将所述一个或多个属性搜索结果提供为所述进一步对话的一部分,或
通过阻止提供所述一个或多个属性搜索结果,影响是否将所述一个或多个属性搜索结果提供为所述进一步对话的一部分,
其中,所述参数基于由一个或多个预定词项在所述文本输入中表达的所述用户针对所述属性表达的所述情绪,来阻止提供所述一个或多个属性搜索结果。
14.如权利要求13所述的方法,其中,所述搜索结果的所述属性是所述搜索结果的源,以及其中,所述文本输入包括引用所述源的词项和引用所述情绪的附加词项。
15.如权利要求13所述的方法,其中,所述文本输入中对所述属性的所述引用是在没有对所述属性的明确引用的情况下对所述搜索结果的引用,所述方法进一步包括:
基于一个或多个计算机可读介质中被指派到所述搜索结果的所述属性,识别所述属性。
16.如权利要求15所述的方法,其中,所述属性为下述中的一个:所述搜索结果的源、在所述搜索结果中引用的实体,以及所述搜索结果的文档类型。
17.如权利要求13所述的方法,其中,响应于所述用户的第一文本输入,提供所述搜索结果以呈现给所述用户,其中,所述进一步对话是所述对话的延续,并且是响应于所述第一文本输入而对所述搜索结果的顺序呈现的延续,以及其中,所述一个或多个属性搜索结果的至少一个响应于所述第一文本输入。
18.如权利要求13所述的方法,其中,所述搜索结果是响应于所述用户的第一文本输入而被提供以呈现给所述用户,其中,所述进一步对话包括响应于为所述用户的附加文本输入发出的新搜索,将附加搜索结果提供给所述用户,以及其中,所述一个或多个属性搜索结果的所述至少一个响应于所述附加文本输入。
19.一种装置,所述装置被配置成执行权利要求1-18中任何一项所述的方法。
20.一种其上存储有指令的非暂时性计算机可读存储介质,所述指令当由一个或多个处理器执行时,使得执行权利要求1-18中任何一项所述的方法。
CN201710763373.8A 2016-08-30 2017-08-30 使用用户输入以适应用于呈现给用户而提供的搜索结果 Active CN107797725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011637525.8A CN112698765A (zh) 2016-08-30 2017-08-30 使用用户输入以适应用于呈现给用户而提供的搜索结果

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/252,031 US10481861B2 (en) 2016-08-30 2016-08-30 Using user input to adapt search results provided for presentation to the user
US15/252,031 2016-08-30

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202011637525.8A Division CN112698765A (zh) 2016-08-30 2017-08-30 使用用户输入以适应用于呈现给用户而提供的搜索结果

Publications (2)

Publication Number Publication Date
CN107797725A CN107797725A (zh) 2018-03-13
CN107797725B true CN107797725B (zh) 2021-01-15

Family

ID=59684104

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202011637525.8A Pending CN112698765A (zh) 2016-08-30 2017-08-30 使用用户输入以适应用于呈现给用户而提供的搜索结果
CN201710763373.8A Active CN107797725B (zh) 2016-08-30 2017-08-30 使用用户输入以适应用于呈现给用户而提供的搜索结果

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202011637525.8A Pending CN112698765A (zh) 2016-08-30 2017-08-30 使用用户输入以适应用于呈现给用户而提供的搜索结果

Country Status (5)

Country Link
US (4) US10481861B2 (zh)
EP (1) EP3500953A1 (zh)
CN (2) CN112698765A (zh)
DE (2) DE102017119601A1 (zh)
WO (1) WO2018044528A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10481861B2 (en) 2016-08-30 2019-11-19 Google Llc Using user input to adapt search results provided for presentation to the user
US10430042B2 (en) * 2016-09-30 2019-10-01 Sony Interactive Entertainment Inc. Interaction context-based virtual reality
CN108279839A (zh) * 2017-01-05 2018-07-13 阿里巴巴集团控股有限公司 基于语音的交互方法、装置、电子设备及操作系统
US10374993B2 (en) * 2017-02-20 2019-08-06 Snap Inc. Media item attachment system
US11233756B2 (en) * 2017-04-07 2022-01-25 Microsoft Technology Licensing, Llc Voice forwarding in automated chatting
KR102515023B1 (ko) * 2018-02-23 2023-03-29 삼성전자주식회사 전자 장치 및 그 제어 방법
US10977303B2 (en) 2018-03-21 2021-04-13 International Business Machines Corporation Image retrieval using interactive natural language dialog
US11010179B2 (en) 2018-04-20 2021-05-18 Facebook, Inc. Aggregating semantic information for improved understanding of users
US11886473B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Intent identification for agent matching by assistant systems
US11676220B2 (en) 2018-04-20 2023-06-13 Meta Platforms, Inc. Processing multimodal user input for assistant systems
US11715042B1 (en) 2018-04-20 2023-08-01 Meta Platforms Technologies, Llc Interpretability of deep reinforcement learning models in assistant systems
CN108765011A (zh) * 2018-05-30 2018-11-06 平安科技(深圳)有限公司 建立用户画像和建立状态信息分析模型的方法和装置
WO2020081082A1 (en) * 2018-10-18 2020-04-23 Google Llc Contextual estimation of link information gain
CN112313657B (zh) * 2018-10-26 2024-05-03 谷歌有限责任公司 用于检测自动会话的方法、系统和计算机程序产品
CN109684443B (zh) * 2018-11-01 2020-11-24 百度在线网络技术(北京)有限公司 智能交互方法和装置
US11100145B2 (en) * 2019-09-11 2021-08-24 International Business Machines Corporation Dialog-based image retrieval with contextual information
US11762937B2 (en) * 2019-11-29 2023-09-19 Ricoh Company, Ltd. Information processing apparatus, information processing system, and method of processing information
CN112101042A (zh) * 2020-09-14 2020-12-18 平安科技(深圳)有限公司 文本情绪识别方法、装置、终端设备和存储介质
CN112256952A (zh) * 2020-10-22 2021-01-22 上海适享文化传播有限公司 基于图数据库技术满足电商场景化搜索的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216829A (zh) * 2007-12-28 2008-07-09 丁景涛 内容搜索系统、设备及其方法
CN101847146A (zh) * 2009-03-27 2010-09-29 华为技术有限公司 一种搜索方法、系统及搜索服务器
CN102867060A (zh) * 2012-09-19 2013-01-09 广东欧珀移动通信有限公司 一种数据快速搜索方法、装置及系统
CN105247511A (zh) * 2013-06-07 2016-01-13 苹果公司 智能自动化助理
US9305064B1 (en) * 2013-05-24 2016-04-05 Google Inc. Keyword-based conversational searching using voice commands

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8676937B2 (en) * 2011-05-12 2014-03-18 Jeffrey Alan Rapaport Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging
TWI493897B (zh) * 2011-07-05 2015-07-21 Hon Hai Prec Ind Co Ltd 光通訊裝置及光通訊方法
ES2640926T5 (es) * 2012-10-24 2021-07-26 Signify Holding Bv Asistencia a un usuario para seleccionar un diseño de dispositivo de iluminación
US9699870B2 (en) * 2013-12-27 2017-07-04 Lutron Electronics Co., Inc. Wall-mountable wireless remote control device
US10484827B2 (en) * 2015-01-30 2019-11-19 Lutron Technology Company Llc Gesture-based load control via wearable devices
EP3279751A4 (en) * 2015-04-03 2018-05-02 Lucis Technologies Holdings Limited Environmental control system
US10546027B1 (en) * 2015-06-09 2020-01-28 Amazon Technologies, Inc. Data search queries for descriptive semantics extracted from item reviews
CN105183848A (zh) * 2015-09-07 2015-12-23 百度在线网络技术(北京)有限公司 基于人工智能的人机聊天方法和装置
US10331312B2 (en) * 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10461953B2 (en) * 2016-08-29 2019-10-29 Lutron Technology Company Llc Load control system having audio control devices
US10481861B2 (en) 2016-08-30 2019-11-19 Google Llc Using user input to adapt search results provided for presentation to the user

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216829A (zh) * 2007-12-28 2008-07-09 丁景涛 内容搜索系统、设备及其方法
CN101847146A (zh) * 2009-03-27 2010-09-29 华为技术有限公司 一种搜索方法、系统及搜索服务器
CN102867060A (zh) * 2012-09-19 2013-01-09 广东欧珀移动通信有限公司 一种数据快速搜索方法、装置及系统
US9305064B1 (en) * 2013-05-24 2016-04-05 Google Inc. Keyword-based conversational searching using voice commands
CN105247511A (zh) * 2013-06-07 2016-01-13 苹果公司 智能自动化助理

Also Published As

Publication number Publication date
US11074038B2 (en) 2021-07-27
EP3500953A1 (en) 2019-06-26
US10481861B2 (en) 2019-11-19
US20240168708A1 (en) 2024-05-23
US20180060029A1 (en) 2018-03-01
US20210326105A1 (en) 2021-10-21
US11875086B2 (en) 2024-01-16
US20200034116A1 (en) 2020-01-30
CN112698765A (zh) 2021-04-23
CN107797725A (zh) 2018-03-13
DE102017119601A1 (de) 2018-03-01
DE202017105142U1 (de) 2017-12-06
WO2018044528A1 (en) 2018-03-08

Similar Documents

Publication Publication Date Title
CN107797725B (zh) 使用用户输入以适应用于呈现给用户而提供的搜索结果
US11960543B2 (en) Providing suggestions for interaction with an automated assistant in a multi-user message exchange thread
US11238851B2 (en) Providing suggested voice-based action queries
JP6942821B2 (ja) 複数のコーパスからの応答情報取得
KR20200003871A (ko) 인간-대-컴퓨터 대화들에 요청되지 않은 콘텐츠의 선행적 통합
EP3440561B1 (en) Augmenting message exchange threads
US20170337284A1 (en) Determining and using attributes of message exchange thread participants
EP3942744A1 (en) Generating content endorsements using machine learning nominator(s)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant