CN110770714A - 使用自然语言对话的信息取回 - Google Patents

使用自然语言对话的信息取回 Download PDF

Info

Publication number
CN110770714A
CN110770714A CN201880039707.XA CN201880039707A CN110770714A CN 110770714 A CN110770714 A CN 110770714A CN 201880039707 A CN201880039707 A CN 201880039707A CN 110770714 A CN110770714 A CN 110770714A
Authority
CN
China
Prior art keywords
user
user input
items
query
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880039707.XA
Other languages
English (en)
Inventor
A·鲍尔泽
D·莫厄特
A·N·马尔霍尔
M·沃尔夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN110770714A publication Critical patent/CN110770714A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0603Catalogue ordering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

描述了使用自然语言对话执行信息取回以用于对项目的库存导航的方法和系统。一个示例使用自然语言对话向用户提供一种信息取回系统。该系统包括用户输入接收设备、输出设备、包括项目的库存的数据库以及处理器。处理器被配置为通过以下使用迭代过程从项目的库存取回一个或多个项目:响应于从用户输入接收设备接收到用户输入,基于用户输入标识库存的子集。处理器被配置为自动地处理项目的子集以确定用于在子集的项目之间区分的分类,使用该分类生成针对用户的询问,以及向输出设备传输该询问。用户输入和/或询问可以使用自然语言。

Description

使用自然语言对话的信息取回
背景技术
当今的语音和聊天服务允许用户在选项菜单中导航以执行诸如询问航空公司航班状态等任务。也存在用于各种产品和服务的自动电话商店和支持热线,它们使用菜单结构将客户引导到他们所需要的信息、产品和服务。但是,菜单系统通常具有固定的结构,并且要求用户知道他们要寻找的项目的名称,或者以其他方式导航大型项目列表以找到他们想要的项目。菜单的静态设计对所有用户而言都是相同的,并且很多用户可能不得不坐下来聆听大量无关的选项,然后才能找到他们感兴趣的选项。如果他们在做出选择之后改变了主意,他们可能还会发现无法回头。在购物体验中,在找到感兴趣的产品之前,通常需要浏览无数产品,因为系统本质上并不聪明,无法标识出客户在寻找什么。
这样,这些菜单仅适用于小型产品或服务库存或小型信息库。此外,这些菜单的构造需要手动输入以列举用户可能请求的很多内容,以便在菜单中选择特定选项或以自由口语的自然语言标识。
以下描述的实施例不限于解决这些已知技术的任何或所有缺点的实现。
发明内容
下面呈现了本公开的简化概述以便向读者提供基本理解。本概述既不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。其唯一目的是以简化的形式呈现本文中公开的概念的选择,作为稍后呈现的更详细描述的序言。
该描述涉及使用自然语言对话来导航项目的库存的信息取回。一个示例使用自然语言对话来向用户提供一种信息取回系统。该系统包括用户输入接收设备、输出设备、包括项目的库存的数据库(其在各种示例中可以是动态项目库存)以及处理器。处理器被配置为通过以下使用迭代过程从项目的库存取回一个或多个项目:响应于从用户输入接收设备接收到用户输入,基于用户输入来标识项目的子集。处理器被配置为自动地处理项目的子集以确定用于在子集的项目之间区分的分类,使用该分类生成针对用户的询问,并且向输出设备传输询问。用户输入和询问中的一者或两者可以使用自然语言。
将能够更好地理解很多附带特征,因为通过参考以下结合附图考虑的详细描述,它们将变得更好理解。
附图说明
根据以下结合附图阅读的详细描述,将能够更好地理解本描述,在附图中:
图1是用于实现本公开的系统的框图。
图2是具有针对用户的自然语言询问和用于指示感兴趣项目的自然语言用户输入的语音对话的示意图;
图3-4是具有针对用户的自然语言询问和用于指示感兴趣项目的自然语言用户输入的文本对话的一系列示意图。
图5-8是具有针对用户的自然语言询问和用于指示感兴趣项目的鼠标点击用户输入的对话的一系列示意图;
图9是用于解释自然语言用户输入的示例语音语法的示意图;
图10是用于解释自然语言用户输入的关系运算符的表;
图11是使用自然语言对话的信息取回方法的流程图;以及
图12是其中可以实现图11的方法的示例性计算设备的示意图。在附图中,相同的附图标记用于表示相同的部分。
具体实施方式
以下结合附图提供的详细描述旨在作为对本示例的描述,而并非旨在表示构建或利用本示例的唯一形式。该描述阐述了示例的功能以及用于构造和操作示例的操作顺序。然而,相同或等同的功能和序列可以通过不同的示例来实现。
本公开提出了一种使用自然语言对话来执行信息取回的计算设备、方法和设备。所描述的方法使得能够导航项目的库存,并且特别地,能够导航随时间改变的大型项目的库存(即,非静态库存)。如以下更详细描述的,本文中描述的方法使用迭代过程来从项目的库存取回一个或多个项目。响应于从用户输入接收设备接收到包括一个或多个单词的用户输入,基于所接收的用户输入来自动地标识库存的子集(即,无需另外的用户输入)。该方法自动地处理项目的子集以确定用于在子集的项目之间区分的分类,使用该分类生成针对用户的询问,并且向输出设备传输询问。询问可以引用分类的多个不同的值、类别或范围值,并且询问和用户输入中的一者或两者可以使用自然语言。
本文中描述的方法提供了导航项目的集合(在本文中称为库存)并且尤其是随时间改变的大量项目的有效且准确的方法。使用本文中描述的方法,可以快速地标识库存中的特定项目。在各种示例中,随着系统学会适应用户需求,信息取回的效率可以随着时间而增加。从下面描述的示例中可以清楚地看出,本文中描述的信息取回方法以比现有系统更用户友好的方式构造。
在一系列场景中导航大型项目的库存可能很有用。例如,待售项目的大型目录可能受益于标识感兴趣项目的有效方法。这可以节省客户时间,并且更有可能促成销售。本公开不限于待售项目,而是还可以用于出于信息目的而显示的项目,例如在博物馆或图书馆中用于交互式对象描述。该技术还可以用于通过询问关于节目信息的问题来使得用户能够浏览电视列表,例如询问喜剧节目表明用户可能喜欢其中用户不能预先明确表达选择标准是什么的类似问题。本文中描述的技术还适用于出售或免费下载的虚拟对象,诸如移动或其他计算机设备的应用,并且本文中描述的技术也适用于企业搜索(即,企业或组织内的搜索系统),例如涉及专有数据库中的药物试验记录的数据取回。
图11示出了信息取回的方法1100,其可以用于使用自然语言对话来确定用户感兴趣的项目。参考图11,方法1100包括从用户输入接收设备接收包括一个或多个单词的用户输入(框1102);基于用户输入来标识项目的库存的子集(框1104);处理项目的子集以确定用于在子集的项目之间区分的分类(框1106);以及使用分类来生成并且向输出设备传输针对用户的询问(框1108)。该询问可以例如向用户提供两个或更多个选项(例如,四个选项),其中每个选项表示分类的不同的值、值范围或类别。如下所述,用户输入和/或输出询问可以包括自然语言。
虽然图11示出了子集的处理(在框1106中)在子集的标识(在框1104中)之后并且响应于用户输入的接收(在框1102中)而发生,但是在各种示例中,可以对库存中的项目的一些子集预处理(即,预先处理)以确定用于在子集的项目之间区分的合适的分类,以便在响应于用户输入的接收(在框1102中)而选择特定子集(在框1104中)时使用。
下面参考各种示例场景描述图11的方法。该方法不限于所描述的任何场景,并且可以与任何项目的库存一起使用。在各种示例中,库存可能很大(例如,它可能包含数百个项目),并且在各种示例中,库存的内容可能会随时间改变。下面参考特定场景描述的任何方面也可以更普遍地应用(例如,应用于任何项目的库存)。
在示例实现中,用户可能有兴趣在待售的大量硬件项目中寻找相机。为了开始该过程,用户提供包括至少一个单词(诸如“相机”)的输入以向系统指示其意图。用户输入可以采用例如以语音或文本的形式传递的自然语言的短语或句子的形式,诸如“我想购买相机”。这样,用户输入可以被系统的用户输入接收设备接收(框1102)。用户输入接收设备可以例如包括麦克风和语音识别计算机程序,或者可以包括用于输入文本的键盘和聊天机器人界面计算机程序(例如,其可以使用聊天机器人框架)。使用从用户输入中提取(或以其他方式标识)的单词(例如,在该示例场景中的单词“相机”),系统参考项目的库存以建立哪些项目可能与用户的搜索有关。例如,这可以通过使用以所提取的单词(例如,“相机”)作为输入的库存的单词搜索来执行。备选地,系统可以使用存储库存的查找表来标识被标记为相机的项目。该步骤导致库存的子集被标识为是用户潜在地感兴趣的(框1104)。在该示例场景中,可以标识库存中作为相机的所有项目以及与相机相关的所有产品(可选),并且这些项目和产品(可选)将属于该子集。
在这一点上,系统分析该子集以找到智能的前进方法以帮助用户有效地浏览库存以找到他们喜欢的相机。为了实现这一点,系统处理项目的子集以标识适合于在属于该子集的项目之间区分的分类(框1106)。例如,如果子集包含一百个相机,其中2个是防水的,而98个是不防水的,则防水不会帮助很好地拆分子集,因为这可能只会帮助用户将子集的范围缩小到98个项目。但是,如果子集包含25个单镜反光(SLR)相机、25个袖珍相机、30个相机手机和20个儿童相机,则相机类型可以帮助用户将子集的范围缩小到25、30或20个项目,因此它是拆分子集的良好分类器。此外,用户可能会容易地决定他们喜欢哪种相机类型(即,SLR相机、袖珍相机、相机手机或儿童相机),但可能不在乎相机是什么颜色。因此,与颜色相比,相机类型是用于使得用户能够选择偏好分类值的更好分类。考虑到分类拆分子集的能力和分类使得用户能够选择子集的值或值范围的能力,与相机是否防水和相机的颜色相比,相机类型可能是性能更好的分类。
一旦确定了分类,则基于子集,系统向用户呈现询问以更详细地找出用户想要哪种相机。这是通过向系统的输出设备传输询问以呈现给用户来实现的(框1108)。输出可以包括自然语言输出作为屏幕上的文本或作为音频,或者可以不使用自然语言。输出可以寻求所确定的分类的优选值或值范围。例如,询问可以询问用户他们想要什么类型的相机,或者他们是否会对SLR相机、紧凑型相机、相机手机或儿童相机感兴趣。这个问题寻求相机类型的分类的优选值(即,SLR相机、袖珍相机、手机相机或儿童相机)。询问的自然语言可以按照合成语音的形式而被输出,例如使用电话系统,或者以文本的形式输出,例如在在线聊天机器人中。
因此,并且参考图1,本公开提出一种用于使用自然语言对话来确定用户感兴趣的项目的系统。该系统包括用户输入接收设备102、输出设备104、包括项目的库存的数据库106以及处理器108。处理器108被配置为从用户输入接收设备接收用户输入(框1102)。在自然语言用户输入的情况下,用户输入可以包括一个或多个单词,或者在用户输入是通过按钮而不是自然语言用户输入的情况下,用户输入可以包括一个或多个ID。处理器108还被配置为基于用户输入来标识库存的子集(框1104),处理项目的子集以确定用于在子集的项目之间区分的分类(框1106),并且生成并且向输出设备传输针对用户的询问(框1108)。用户输入和/或询问可以包括自然语言,并且询问使用分类,例如,它引用分类的多个不同值、值范围或类别,并且这些可以作为多个不同选项呈现给用户。
本文中描述的信息取回方法是一种迭代方法(如图11中从框1108到框1102的虚线所示),使得在一次迭代中被标识(在框1104中)的子集所包括的项目少于从先前迭代中标识出的子集。
在系统内,特别是在数据库106内,可以使用类似图形的数据结构在数据点(即,系统中的项目)、其属性和其他项目之间映射。这样的数据结构可以用于使得相似或相关项目能够被链接(例如,项目的附件可以被链接到数据结构中的项目)。
用户可以响应于询问。例如,这可以涉及选择分类的值,诸如分类相机类型的值SLR相机。在另一示例中,用户可以在相机品牌的分类中选择特定值。这进一步缩小了子集的范围,以产生项目的另外的子集,例如所有SLR相机或所选择的品牌的所有相机。此时,系统可以在较小的子集上重复迭代,以继续缩小用户感兴趣的内容的范围,其中最终目的是标识用户正在搜索的特定项目。为了重复该迭代,处理另外的子集以确定可以用于在另外的子集的项目之间有效地区分的分类。例如,价格可能是在SLR相机之间区分的有用分类。在这种情况下,系统可以基于价格的另外的分类来向用户输出另外的询问。颜色也可以是拆分SLR相机的另外的子集的良好分类,但是用户可能会发现很难在颜色之间选择,因为这种分类对用户而言并不那么重要。如果是这种情况,则该系统更有可能使用价格分类而不是颜色分类向用户呈现询问。询问可以按照自然语言(例如,作为问题)而被呈现,并且可以按照例如合成语音或文本的形式而被传递。
因此,系统的处理器可以被配置为从用户输入设备接收对询问的用户响应(框1102),基于用户响应来标识库存的另外的子集(框1104),处理项目的另外的子集以确定用于在另外的子集的项目之间区分的另外的分类(框1106),并且使用该另外的分类来生成并且向用户设备传输针对用户的另外的询问(框1108)。另外的询问可以引用另外的分类的多个不同的值、值范围或类别,并且这些可以作为不同的选项在另外的询问中呈现以供用户选择。
为了确定分类(在框1106中),处理器可以被配置为基于候选分类拆分项目的子集的能力或基于另外的分类使得用户能够选择另外的分类的优选值或值范围的能力或两者来分析多个候选分类。下面描述评估候选分类的各种方法,并且在各个示例中,可以针对每个候选分类计算基于候选分类拆分项目的子集的能力的得分(例如,较高得分表明该分类将自己拆分成更均匀大小的部分)。
例如,参考图2,系统与用户202之间的对话可以利用包括语音的用户输入和来自包括合成语音的系统的询问来进行。系统的输出设备104可以包括语音合成器204,并且该过程可以由语音合成器204输出的初始问题206来发起。在该示例中,初始问题206询问用户202“您想购买什么?”。用户202通过说出包括一个或多个单词的用户输入208来答复。在该示例中,用户输入208是“相机”。这提供了系统可以用来开始查找用户感兴趣的项目的第一条信息。系统基于用户输入208(在该示例中为所有相机)来标识项目的子集。系统确定相机品牌的分类适合于在相机之间区分,并且使用品牌分类输出询问210。在该示例中,询问210是“您对哪种品牌的相机感兴趣?”。用户使用对询问210的用户响应212答复。在这种情况下,用户响应212通过说出“我想要品牌X的相机”来选择相机品牌的分类的值。对话然后可以继续进行,系统寻找用于在品牌X的相机的另外的子集的项目之间区分的另外的分类。
在另一示例中,对话可以在聊天机器人中用文本而不是语音进行。如图3所示,系统以询问用户“您想购买什么?”的初始问题302开始该过程。作为响应,用户提供用户输入304“相机”。如图4所示,系统在库存中搜索所有相机,并且分析库存的该子集以找到适合于在相机之间区分的分类。品牌的分类被标识为是合适的,并且系统向用户呈现询问402“您对哪种相机品牌感兴趣?”。用户使用标识他们喜欢的品牌的用户响应404答复:“我想要品牌X的相机”。
在另一示例中,对话可以在聊天机器人或其他交互式图形用户界面中进行,其中提供给用户的按钮用于选择分类值。参考图5,系统通过向用户呈现初始问题502来开始,该初始问题502包括用于使得用户能够选择优选选项的按钮。在该示例中,初始问题502是“您想购买什么?”,并且可以通过例如鼠标单击输入或其他用户输入(诸如语音命令)选择的选项按钮是“相机”和“键盘”。
如图6所示,在该示例中,用户已经通过鼠标点击选择“相机”按钮以指示对相机的偏好。如图6所示,所选择的按钮602可以例如通过改变其颜色来突出显示。
参考图7,系统向用户呈现询问702“您对什么品牌的相机感兴趣?”,包括用于一个或多个不同品牌的选项按钮。用户可以选择这些按钮以指示用户对所选择的品牌的偏好。用户可以例如通过鼠标点击输入来选择品牌之一,如图8所示。所选择的按钮802可以被突出显示以示出其已经被选择。
来自用户的自然语言输入(在框1102中接收)(诸如用户输入208和304以及用户响应212和404)可以由系统使用语音语法或语音对话规范来解释,和/或用户输入和用户响应可以通过使用占位符和库存数据来完全或部分替换。语音语法或语音对话规范的示例包括但不限于语音识别语法规范、VoiceXML和Microsoft语言理解智能服务对话框。语音语法包括诸如图9所示的结构902等结构,该结构包括可以与库存数据组合的短语或句子的预定义部分。例如,如果系统正在与用户关于待售的硬件或程序的库存交互,则可以将诸如分类、分类值、属性和项目的其他标签等库存数据904插入结构902的某些部分中以生成自然语言短语或句子,系统将该自然语言短语或句子配置为识别用户说出或输入的内容。然后,该系统将不仅能够识别短语或句子,而且还将能够标识用户所参考的库存的项目。例如,使用库存数据中的“键盘”和“Microsoft”一词,可以识别出“向我介绍Microsoft的键盘”这句话。使用相同的结构902,可以识别出句子“告诉我有关品牌X”和“告诉我有关品牌Y的鼠标”。
在使用占位符和库存数据来完全或部分替换用户输入和用户响应的示例中,每个占位符允许数据库中的属性的名称或值、或者数据库中的属性递归地引用的属性名称或属性值。例如,“在Adam的日历上创建会议”可以表示为“在{具有名称的人->日历参考}上创建{item.Type-value}”。然后,系统理解为在日历上查找指定人Adam并且创建会议类型的对象。在另一递归示例中:“向我示出Adam姐妹的狗Max的珠宝”可以用“向我示出{人==Adam->只有兄弟姐妹->Dog.Name==Max}的{object.type==jewellery}”来表示。系统将了解到用户询问Adam的姐妹。如果有多个,则可以可选地跟进以询问指定了哪个。
其他语音语法结构可以用于识别其他短语或句子,包括具有诸如多于、少于、大于和小于等关系术语的短语或句子。为了使得系统能够解释关系术语,可以例如基于与特定库存或库存的子集相关的关系术语来构造关系运算符的表1002。例如,用户可以询问较大或较小的相机,但是对于计算机而言,这些术语涉及什么分类或属性并不一定很清楚。因此,将术语“较大”和“较小”包括在表1002中并且将每个术语与大小的分类以及哪个术语与较大的大小相关联以及哪个术语与较小的大小相关联的指示相关联可能会很有用,如图10所示。还包括其他关系运算符,以使得系统能够转换说出或以其他方式输入的短语或术语,诸如含义是更细、更安静、更便宜。可以定义特定于某些项目类型的关系运算符。例如,在相机上下文中的更好可能被解释为表示更多的百万像素,而在键盘方面的更好可能被不同地解释。
应当理解,例如可以在标识出新的子集时动态地生成语音语法的元素,使得可以将与诸如特定品牌的小型相机等特定子集有关的库存数据904输入到一个或多个语音语法结构中。语音语法可以被构造为包括使得能够识别大量可能句子的结构。例如,这些内容可能包括“告诉我更多轻巧的相机”;“还有更贵的吗?”;“除了灰色还有其他颜色吗?”。
用户偏好也可以被并入确定哪个分类可以用来向用户询问的确定中。例如,如果从与用户的先前交互(诸如先前的对话)中得知美感对用户很重要,则颜色的分类可能适合于在相机之间区分。与用户的偏好或先前行为有关的信息可以存储在系统可访问或构成系统的一部分的数据库中的用户简档中。
VoiceXML和SRGS中的以下两个示例文件示出了如何编写用于指定项目的语法以及如何将其与本文中描述的方法结合使用。VoiceXML文件指定系统将在其中询问“您对哪种产品感兴趣?”并且然后侦听SRGS文件中定义的用户说出的单词的对话框。下面的示例表明,相对于VoiceXML文件的位置,SRGS在文件夹“grammars”中被保存为被称为“product.gram”的文件。在指示的情况下,可以使用本文中描述的方法(例如,使用图11的方法)自动地生成可能的选项(以及在各种示例中,整个语法)。在其中库存为图形形式的示例中,系统可以遍历图形并且为所有可能组合的子集添加语法和对话。当从库存生成语法时,可以可选地使用一组动词和/或填充词。
VoiceXML示例文件:
Figure BDA0002317142700000101
Figure BDA0002317142700000111
SRGS示例文件:
Figure BDA0002317142700000121
Figure BDA0002317142700000131
应当理解,在询问中使用分类来确定用户感兴趣的内容的顺序可能会影响可以确定用户感兴趣的项目的效率,即信息取回方法的效率。例如,在以上相机分类的示例中,可以使用以下顺序的以下分类。
颜色,价格,相机类型
然而,可以发现,对于大多数用户而言,相机类型对寻找合适相机的影响大于颜色或价格。例如,可能即使向用户呈现了具有合适颜色和价格的相机,但如果它们都是错误类型的相机,则用户将不会购买。在这种情况下,如果在该过程的早期使用相机类型来过滤商品,则更有可能产生成功的销售结果。在这种情况下,按以下顺序使用分类进行的一系列询问可能会产生更多的销售,并且能更有效地确定用户感兴趣的相机。
相机类型,颜色,价格
通常,对于用户来说更重要的分类可以在过程的较早阶段被呈现。在一些示例中,这可以表示为可以首先使用对用户具有更好的促成销售能力的分类来询问。在其他示例中,可以基于其他优先级来对结果重新排序,例如,以示出有助于用户找到副作用最小的药物试验报告的分类(即,按表示药物副作用的数字量表的属性排序)。
如上所述,评估分类的适用性以及可以使用多久的其他方法包括分类拆分一组项目的能力。例如,如果有一百台相机,而只有两台是防水的,则防水是稀疏属性,并且相机是否防水的分类不能很好地拆分这组相机。在这种情况下,防水不是用于确定用户感兴趣的相机的高性能分类。最好使用多样且合理分布的分类,这种分类将项目分为合理生命的大小相对应的组。
要考虑的另一因素是某些分类可能不支持用户在分类值之间进行简单的决策。例如,对于用户来说,在相机颜色之间选择比在相机价格之间选择可能更加困难。在这种情况下,价格是更有效的分类,可以在颜色之前使用。对于相机来说,价格的分类可以说比颜色的分类使得用户能够更容易进行搜索。
在本文中描述的方法中,可以如以下示例中所述标识分类(在框1106中)。
可以基于一组性能标准来对每个分类评分,诸如:
·拆分一组产品的能力
·使得用户能够直接搜索的能力
·促成销售的能力
可以将这些组合以给出每个分类的总得分,并且可以首先使用具有指示最佳性能的总得分的分类。然后,在确定感兴趣的项目的过程中,可以按它们的总得分的顺序使用这些分类。
也将为用户提供诸如按钮、下拉菜单或语音命令等输入设备以用于手动选择要搜索的分类。在这种情况下,可能合适的是,确定用户喜欢的分类和/或分类顺序,并且自动地偏向于在将来的搜索中使用这些分类和分类顺序。
在各种示例中,当选择了分类(诸如颜色或价格)以向用户呈现选项时,还必须确定可以在输出询问内向用户呈现该分类的哪些值、值范围或类别。例如,如果要在搜索相机时首先使用颜色分类,则问题将变成在输出询问中向用户呈现哪些颜色选项。如果要在输出询问中显示四个颜色值,这些颜色值是黑色、奶油色、蓝色和灰色,还是黑色、银色、灰色和白色,或其他组合?为了选择颜色的值或任何分类的值、值范围或类别,可以考虑以下性能标准中的一项或多项。
·在用户中的流行度
·在库存或库存子集中最常见
·包括通配符(例如,以示出不同分类的值)
·偏向用户的已知偏好
·使得用户能够直接搜索的能力
·促成销售的能力
本领域技术人员应当理解,存在多种方式来定义或测量一些性能标准。例如,可以通过跟踪用户的困惑或用户选择的延迟来测量分类、值或值范围使得用户能够进行搜索的能力,例如基于语音指示符,诸如“ummmm”或长时间停顿或在重复问题之后仍然未回答或其他输入(诸如眼动追踪)。如果用户难以做出选择(例如,如上所述由语音指示器确定)或指示对四个选项中的三个感兴趣,则表明分类或值不能使用户很好地选择。如果用户无法选择,则可以通过手势(诸如语音命令“我无法选择”)触发来提供后退功能以指示系统放弃一组值或值范围或分类,并且尝试提供为用户提供不同的一组选项。或者,可以响应于检测到用户无法选择而自动地触发后退功能。在各种示例中,可以触发后退功能,其中代替选择新的分类值之一,用户选择完全不同的分类(例如,如果向用户呈现一系列颜色选项并且通过说出“我想要电池寿命长的相机”响应)。在各种示例中,在触发后退功能之前,系统可以向用户提供其他选择或信息(例如,通过列出可用选项或询问用户是否希望通过替代分类选择)。
此外,可以基于所有用户之间的全球趋势或这两者来将分类、类别、值或值范围导致销售或使得用户能够指导搜索的能力个性化给用户。例如,可以从社交媒体网络中的信息推断用户之间的流行度。
值可以是离散的或连续的。例如,用于尺寸分类的离散值可以包括小、中和大,并且这些可以备选地可以被认为是类别。衣服尺寸分类的连续值可以包括以厘米或英寸为单位的腰围尺寸的范围。可以将颜色视为文本标签,诸如蓝色和红色,或者视为连续的红绿蓝(RGB)值。备选地,可以按照其他方式对颜色选项分组,诸如黑色、白色和彩色三类。还可以存在其他文本分类(诸如夹克类型这些分类可以采用诸如冬季夹克、夏季夹克、运动夹克等值)。
在一些示例中,分类、值或值范围可以随机选择,或者可以由用户通过语音或其他命令或手势来指示。由于用户在先前的搜索中经常选择它们,因此它们也可以基于受欢迎程度而被选择。其他选择标准也可以适用,诸如产生最佳利润率的能力。例如,如果已知竞争对手正在出售大量特定项目,则偏向于选择相似的项目的值、值范围或实例可能是合适的。可以用来帮助选择标准的其他影响因素可以包括季节性、库存过多、销售价格以及商品交易的存在和性质。
当分类值呈现给用户时其定位也可能受到这些值的特性的影响。例如,如果分类是品牌,则取决于实现,更流行的品牌可以通过语音合成器更早地列出,或者首先显示,或者显示在一组可选择的按钮中的高级位置。供应链中的实体(诸如制造商或品牌)也可以为将其产品放置在某些位置付费。在某些情况下,随机选择选项的顺序可能是合适的。
除了检测用户对某些项目或分类值的兴趣,还可以检测指示不喜欢或不感兴趣的否定用户输入。例如,可以检测没有兴趣或说出“我不喜欢蓝色”的语音命令并且将其用作否定输入。基于这些,可以将不喜欢或不感兴趣的特征排除在呈现给用户之外。这有助于进一步缩小用户可能感兴趣的内容的范围。
还可以支持多选,例如以确定用户可能感兴趣的多种颜色或特征的多种组合。例如,可以基于用户输入来确定用户喜欢蓝色或白色夹克,该夹克理想地便宜但否则相当昂贵但不是非常昂贵。其他组合也是可以检测到的,诸如对白色昂贵夹克或蓝色廉价夹克表现出兴趣的用户。
可以可选地支持固定,其中用户可以将对象固定到可以响应于用户的请求而被调用的一组对象(例如,随时说出“告诉我有关我固定的项目”)或一旦检测到用户犹豫不决(例如,根据上述语音之一确定),就会自动地重新调用。用户可以通过指示系统将对象添加到集合中直到其被取消固定来固定对象,而不管将来是否选择了其他对象(即,感兴趣的表情)。用户可以指示显示系统使用各种输入设备来固定对象。例如,用户可以在系统向用户详细说明对象期间或之后使用语音命令,诸如“固定这个”或“以后保留这个”。在其他示例中,用户可以使用语音命令,诸如“用黑色表带固定手表”或“用数字标记松开手表”。在聊天机器人的上下文中,可以存在允许固定和取消固定的按钮。
可以通过观察和记录用户行为和/或通过建立用户特性的简档(诸如性别、年龄和位置)来建立用户简档。可以从社交媒体和用户的其他帐户中挖掘用户信息,前提是已获取用户的许可。例如,可以使用加入/退出语音命令来获取用户许可。
诸如浏览行为和购买行为等用户行为可以用于建立用户表达了兴趣的商品和产品特性的简档。可以分配表示用户兴趣水平的得分或权重并且获取存储在用户简档中,如下。在下面的示例中,0.1表示低兴趣水平,而1.0表示最大兴趣水平。
示例:
夹克-0.9-颜色-蓝色-0.8-slevelength-长-0.8得分之积为0.576夹克-0.9-颜色-蓝色-0.8-slevelength-中等-0.4得分之积为0.288夹克-0.9-颜色-灰色-0.6-slevelength-长-0.8得分之积为0.432
该示例表示对夹克、特别是优选地具有长袖的蓝色夹克非常感兴趣的用户。每个项目及其得分(例如,蓝色长袖夹克及其得分)表示用户简档中的数据点。可以例如通过找到各个得分的乘积来计算每个数据点的总得分。
系统可以可选地存储用户对数据点表现出兴趣的时间序列。例如,上述对夹克的兴趣可以记录为发生在六月,而在七月,同一用户表示对裤子感兴趣。
六月-夹克-0.9-颜色-蓝色-0.8-slevelength-长-0.8
六月-夹克-0.9-颜色-蓝色-0.8-slevelength-中等-0.4
六月-夹克-0.9-颜色-灰色-0.6-slevelength-长-0.8
七月-裤子-0.8
这使得系统能够识别出在尝试其他颜色之前,可能会在七月份向用户呈现蓝色或灰色或与蓝色或灰色匹配或协调的裤子。以这种方式,系统假定偏爱蓝色、灰色或与蓝色或灰色相协调的颜色,同时仍允许用户选择其他颜色。在上述聊天机器人实现中,每个项目的图像可以可选地在聊天机器人中呈现给用户。
更一般的用户偏好也可以存储在用户简档中。例如,如果用户偏好特定价格范围内的衣服,则可以偏向向用户呈现该价格范围内的衣服。
该系统不仅可以用于确定用户感兴趣的特定类型的项目,诸如夹克,而且可以用于确定适合与夹克一起销售的不同类型的产品。例如,如果确定用户对蓝色夹克感兴趣,则可能合适的是,另外呈现协调运动装备和配件或协调裤子。
界面可以被配置为供商品购买者使用。如果商品购买者对特定夹克感兴趣,则可以在商品购买者的简档中给夹克增加0.2的得分,例如最高得分为1.0。
在其他示例中,可以对界面配置,以使得销售人员可以在系统中注册自己的销售偏好,从而可以通过卖方最有能力卖出的东西来影响对象的选择以及在其他类别之前先探索哪些类别的选择。例如,如果销售人员是特定产品系列的专家,则这可能是合适的。以这种方式,显示系统不仅可以考虑顾客的行为和顾客的简档,而且可以考虑销售人员的偏好和专业知识。
可以使用来自用户先前或最近的浏览历史的cookie和/或使用声纹标识(例如,对于基于语音的场景)和/或使用基于电话号码的数据库或基于聊天用户名的数据库来从搜索的上下文来确定搜索的起点,诸如搜索T恤、夹克或裤子。例如,如果用户最近在百货公司的网站或电话服务上完成了裤子的搜索,则聊天机器人或其他实现方式的起点可以是从一系列颜色不同的裤子中选择。
该起点可以附加地或备选地受到基于用户简档、用户的平均简档(即,全球趋势)或一组静态定义的数据点的一组建议的影响。其他影响因素可以包括例如卖得好的东西和用户位置(例如,仅在附近仓库的内容中搜索)。
在另外的示例中,该方法可以使得用户能够询问与当前所讨论的项目相关的项目,例如“以相同颜色告诉我该项目的配件”。在这样的示例中,语音语法可以具有以下形式:
“为我示出该商品的{属性名称,如配件}”,“为我示出具有相同{属性名称,例如颜色、尺寸、……}的{属性名称}的{可选的:对于该项目}。
在各种示例中,系统可以自动地将数据点/项目、它们的属性和语音语法翻译成不同的语言以支持多个区域中的用户,例如使用诸如Microsoft Bing Translator等第三方翻译服务。
在各个示例中,系统可以提供全文搜索并且提供其属性与搜索询问相匹配的所有项目/数据点。
在各种示例中,系统可以允许用户说出“按{属性名称}分类”,返回分类器的列表。例如,响应于“按颜色分类”,对当前子集按颜色划分。
在各种示例中,系统可以允许用户说出“列出所有项目”,并且作为响应,可以返回当前子集中的项目列表(即,如在框1104的最新迭代中标识的)。
在各种示例中,系统可以允许用户在返回系统时说出“告诉我我最后一次感兴趣的项目”。为了实现这一点,系统可以存储(例如,在数据库106中)最近标识的子集(即,如在框1104的最新迭代中标识的)。
在图12中示出了适于实现方法1100的计算设备1200。计算设备1200包括处理器1202、通信接口1204、输入/输出控制器1206、计算机存储器1208和显示器1210。
备选地或附加地,本文中描述的功能至少部分由一个或多个硬件逻辑组件执行。例如而非限制,可选地使用的说明性类型的硬件逻辑组件包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、系统级芯片系统(SOC)、复杂可编程逻辑设备(CPLD)、图形处理单元(GPU)。
计算机可执行指令使用由基于计算的设备(诸如计算设备1100)可访问的任何计算机可读介质而被提供。计算机可读介质包括例如计算机存储介质,诸如存储器和通信介质。诸如存储器等计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块等信息的任何方法或技术实现的易失性和非易失性的可移动和不可移动介质。计算机存储介质包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、电子可擦除可编程只读存储器(EEPROM)、闪存或其他存储器技术、光盘只读存储器(CD-ROM)、数字通用光盘(DVD)或其他光学存储器、磁带盒、磁带、磁盘存储器或其他磁存储设备、或者用于存储用于计算设备访问的信息的任何其他非传输介质。相反,通信介质在诸如载波或其他传输机制等调制数据信号中实施计算机可读指令、数据结构、程序模块等。如本文中定义的,计算机存储介质不包括通信介质。因此,计算机存储介质不应当被解释为传播信号本身。尽管计算机存储介质(存储器)被示出为在基于计算的设备内,但是应当理解,在一些示例中,存储是远程分布或定位的,并且经由网络或其他通信链路来访问(例如,使用通信接口)。
基于计算的设备还包括被布置为向可以与基于计算的设备分离或成一体的显示设备输出显示信息的输入/输出控制器。显示信息可以提供图形用户界面。输入/输出控制器还被布置为接收和处理来自诸如用户输入设备(例如,鼠标、键盘、相机、麦克风或其他传感器)等一个或多个设备的输入。在一些示例中,用户输入设备检测语音输入、用户手势或其他用户动作,并且提供自然用户界面(NUI)。在一个实施例中,如果显示设备是触敏显示设备,则显示设备还用作用户输入设备。在一些示例中,输入/输出控制器向除了显示设备之外的其他设备(例如,本地连接的打印设备)输出数据。
输入/输出控制器、显示设备和用户输入设备中的任何一个可以包括NUI技术,NUI技术使得用户能够以自然的方式与基于计算的设备交互,而没有由诸如鼠标、键盘、遥控器等输入设备施加的人为约束。在一些示例中提供的NUI技术的示例包括但不限于依赖于声音和/或语音识别、触摸和/或触笔识别(触敏显示器)、屏幕上和屏幕附近的手势识别、空气手势、头部和眼睛跟踪、声音和语音、视觉、触摸、手势和机器智能的那些NUI技术。在一些示例中使用的NUI技术的其他示例包括意图和目标理解系统、使用深度相机的运动手势检测系统(诸如立体相机系统、红外相机系统、红绿蓝(rgb)相机系统及其组合)、使用加速度计/陀螺仪的运动手势检测、面部识别、三维(3D)显示、头部、眼睛和注视跟踪、沉浸式增强现实和虚拟现实系统以及用于使用电场感测电极来感测大脑活动的技术(脑电图(EEG)和相关方法)。
第一另外的示例提供了一种使用自然语言对话的信息取回系统,该系统包括:用户输入接收设备;输出设备;包括项目的库存的数据库;以及处理器,该处理器被配置为通过以下方式从项目的库存取回一个或多个项目:响应于从用户输入接收设备接收到用户输入;基于用户输入来标识库存的子集;自动地处理项目的子集以确定用于在子集的项目之间区分的分类;生成针对用户的询问,其中该询问包括分类的多个不同的值、值范围或类别;以及向输出设备传输询问,其中用户输入和询问中的至少一项包括自然语言。
第一另外的示例可以另外包括以下方面中的一个或多个方面的任何组合:
·用户输入和针对用户的询问均可以包括自然语言。
·用户输入可以包括自然语言,并且处理器可以被配置为使用语音语法和/或框架来解释用户输入。
·处理器可以被配置为使用库存或库存的子集生成语音语法。
·用户输入可以包括自然语言,并且处理器可以被配置为使用关系运算符的表来解释用户输入。
·用户输入可以包括语音。
·用户输入可以包括文本,并且处理器可以被配置为使用聊天机器人框架来解释用户输入。
·询问可以包括合成语音。
·询问可以包括文本。
·询问可以被构造为提示用户从用户指示分类的优选值或值范围。
·处理器可以被配置为基于分类拆分项目的子集的能力来确定分类。
·处理器可以被配置为基于分类使得用户能够选择分类的优选值或值范围的能力来确定分类。
·处理器还可以被配置为:从用户输入设备接收对询问的用户响应;基于用户响应来标识库存的另外的子集;处理项目的另外的子集以确定用于在另外的子集的项目之间区分的另外的分类;生成针对用户的另外的询问,其中另外的询问包括另外的分类的多个不同的值、值范围或类别;以及向输出设备传输另外的询问。
·用户响应可以包括自然语言,并且处理器可以被配置为使用语音语法来解释用户响应。
·处理器可以被配置为使用库存或库存的子集生成语音语法。
·处理器可以被配置为使用关系运算符的表来解释用户输入/响应。
·处理器可以被配置为基于另外的分类拆分项目的另外的子集的能力来确定另外的分类。
·处理器可以被配置为基于另外的分类使得用户能够选择另外的分类的优选值或值范围的能力来确定另外的分类。
第二另外的示例提供了一种使用自然语言对话的信息取回的方法,该方法包括:从用户输入接收设备接收用户输入;基于用户输入来标识项目的库存的子集;自动地处理项目的子集以确定用于在子集的项目之间区分的分类;生成针对用户的询问,其中该询问包括分类的多个不同的值、值范围或类别;以及向输出设备传输询问,其中用户输入和询问中的至少一项包括自然语言。
第三另外的示例提供了一种使用自然语言对话的信息取回设备,该设备提供:用户输入接收设备;输出设备;包括项目的库存的数据库;以及处理器,该处理器被配置为从用户输入接收设备接收用户输入;基于用户输入来标识库存的子集;处理项目的子集以确定用于在子集的项目之间区分的分类;生成针对用户的询问,其中该询问包括分类的多个不同的值、值范围或类别;以及向输出设备传输询问,其中用户输入和询问中的至少一项包括自然语言。
第四另外的示例提供了一种用于使用自然语言对话来确定用户感兴趣的项目的设备,该设备提供:用户输入接收设备;输出设备;包括项目的库存的数据库;用户处理器,该处理器被配置为从用户输入接收设备接收用户输入;基于用户输入来标识库存的子集;处理项目的子集以确定用于在子集的项目之间区分的分类;生成针对用户的询问,其中该询问包括分类的多个不同的值、值范围或类别;以及向输出设备传输询问,其中用户输入和询问中的至少一项包括自然语言。处理器还可以被配置为基于响应于所生成的询问而接收的附加用户输入来重复对子集的标识,标识另外的较小子集,并且然后确定该较小子集的分类。如果另外的较小子集包括多于一个项目,则可以基于较小子集的分类的类别来生成另外的询问(例如,其中询问包括分类的多个不同的值、值范围或类别)。可以重复该方法,直到标识出用户感兴趣的单个项目或一组项目。
术语“计算机”或“基于计算的设备”在本文中用于指代具有处理能力使得其可以执行指令的任何设备。本领域技术人员将认识到,这种处理能力被结合到很多不同的设备中,因此术语“计算机”和“基于计算的设备”每个包括个人计算机(PC)、服务器、移动电话(包括智能电话)、平板电脑、机顶盒、媒体播放器、游戏机、个人数字助理、可穿戴计算机和很多其他设备。
在一些示例中,本文中描述的方法通过有形存储介质上的机器可读形式的软件来执行,例如,以包括计算机程序代码装置的计算机程序的形式,计算机程序代码装置适于在程序在计算机上运行时执行本文所述的一种或多种方法的所有操作,并且计算机程序可以在计算机可读介质上实现。该软件适合于在并行处理器或串行处理器上执行,使得方法操作可以按照任何合适的顺序或同时被执行。
这承认软件是有价值的可单独交易的商品。它旨在包括运行或控制“虚拟”或标准硬件执行期望功能的软件。它还旨在包括“描述”或定义硬件配置的软件,诸如HDL(硬件描述语言)软件,如用于设计硅芯片或用于配置通用可编程芯片,以执行期望功能。
本领域技术人员将认识到,用于存储程序指令的存储设备可选地分布在网络上。例如,远程计算机能够存储被描述为软件的过程的示例。本地或终端计算机能够访问远程计算机并且下载部分或全部软件以运行程序。或者,本地计算机可以根据需要下载软件的片段,或者在本地终端处执行一些软件指令,而在远程计算机(或计算机网络)处执行一些软件指令。本领域技术人员还将认识到,通过利用本领域技术人员已知的传统技术,软件指令的全部或一部分可以由诸如数字信号处理器(DSP)可编程逻辑阵列等专用电路来执行。
如本领域技术人员很清楚的,可以延长或改变本文中给出的任何范围或装置值而不丧失所寻求的效果。
尽管用结构特征和/或方法动作专用的语言描述了本主题,但应当理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。而是,上述具体特征和动作被公开作为实现权利要求的示例形式。
应当理解,上述益处和优点可以涉及一个实施例,或者可以涉及多个实施例。实施例不限于解决任何或所有所述问题的那些实施例或者具有任何或所有所述益处和优点的那些实施例。将进一步理解,对“一个(an)”项目的引用是指这些项目中的一个或多个。
本文中描述的方法的操作可以按照任何合适的顺序而被进行,或者在适当的情况下被同时进行。另外,在不脱离本文中描述的主题的范围的情况下,可以从任何方法中删除各个块。上述任何示例的各方面可以与所描述的任何其他示例的各方面组合以形成另外的示例而不会丧失所寻求的效果。
术语“包括(comprising)”在本文中用于表示包括所标识的方法框或元件,但是这些框或元件不包括排他列表,并且方法或装置可以包含附加的框或元件。
应当理解,以上描述仅作为示例给出,并且本领域技术人员可以进行各种修改。以上说明书、示例和数据提供了示例性实施例的结构和使用的完整描述。尽管上面已经以一定程度的特殊性或者参考一个或多个单独的实施例描述了各种实施例,但是本领域技术人员可以在不脱离本说明书的范围的情况下对所公开的实施例进行多种改变。

Claims (15)

1.一种使用自然语言对话的信息取回系统,所述系统包括:
用户输入接收设备;
输出设备;
数据库,包括项目的库存;以及
处理器,被配置为通过以下从项目的所述库存取回一个或多个项目:
响应于从所述用户输入接收设备接收到用户输入;
基于所述用户输入来标识所述库存的子集;
自动地处理项目的所述子集以确定用于在所述子集的项目之间区分的分类;
生成针对用户的询问,其中所述询问包括所述分类的多个不同的值、值范围或类别;以及
向所述输出设备传输所述询问,
其中所述用户输入和所述询问中的至少一项包括自然语言。
2.根据权利要求1所述的系统,其中所述用户输入和针对所述用户的所述询问均包括自然语言。
3.根据权利要求1所述的系统,其中所述用户输入包括自然语言,并且其中所述处理器被配置为使用语音语法和/或框架来解释所述用户输入。
4.根据权利要求3所述的系统,其中所述处理器被配置为使用所述库存或所述库存的所述子集来生成所述语音语法。
5.根据权利要求1所述的系统,其中所述用户输入包括自然语言,并且其中所述处理器被配置为使用关系运算符的表来解释所述用户输入。
6.根据权利要求1所述的系统,其中所述用户输入包括语音,或者其中所述用户输入包括文本,并且其中所述处理器被配置为使用聊天机器人框架来解释所述用户输入。
7.根据权利要求1所述的系统,其中所述询问包括合成语音或文本。
8.根据权利要求1所述的系统,其中所述询问被构造为提示所述用户从所述用户指示所述分类的优选值或值范围。
9.根据权利要求1所述的系统,其中所述处理器被配置为基于以下来确定所述分类:
所述分类拆分项目的所述子集的能力;和/或
所述分类使得所述用户能够选择所述分类的优选值或值范围的能力。
10.根据权利要求1所述的系统,其中所述处理器被配置为:
从所述用户输入设备接收对所述询问的用户响应;
基于所述用户响应来标识所述库存的另外的子集;
处理项目的所述另外的子集以确定用于在所述另外的子集的项目之间区分的另外的分类;
生成针对所述用户的另外的询问,其中所述另外的询问包括所述另外的分类的多个不同的值、值范围或类别;以及
向所述输出设备传输所述另外的询问。
11.根据权利要求10所述的系统,其中:
所述用户响应包括自然语言;以及
所述处理器被配置为使用语音语法来解释所述用户响应。
12.根据权利要求11所述的系统,其中所述处理器被配置为:
使用所述库存或所述库存的所述子集来生成所述语音语法;和/或
使用关系运算符的表来解释所述用户输入/响应。
13.根据权利要求10所述的系统,其中所述处理器被配置为基于以下来确定所述另外的分类:
所述另外的分类拆分项目的所述另外的子集的能力;和/或
所述另外的分类使得所述用户能够选择所述另外的分类的优选值或值范围的能力。
14.一种使用自然语言对话的信息取回的方法,所述方法包括:
从用户输入接收设备接收用户输入;
基于所述用户输入来标识项目的库存的子集;
自动地处理项目的所述子集以确定用于在所述子集的项目之间区分的分类;
生成针对用户的询问,其中所述询问包括所述分类的多个不同的值、值范围或类别;以及
向输出设备传输所述询问,
其中所述用户输入和所述询问中的至少一项包括自然语言。
15.一种使用自然语言对话的信息取回设备,所述设备提供:
用户输入接收设备;
输出设备;
数据库,包括项目的库存;以及
处理器,被配置为:
从所述用户输入接收设备接收用户输入;
基于所述用户输入来标识所述库存的子集;
处理项目的所述子集以确定用于在所述子集的项目之间区分的分类;
生成针对用户的询问,其中所述询问包括所述分类的多个不同的值、值范围或类别;以及
向所述输出设备传输所述询问,
其中所述用户输入和所述询问中的至少一项包括自然语言。
CN201880039707.XA 2017-06-15 2018-05-21 使用自然语言对话的信息取回 Pending CN110770714A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/624,698 2017-06-15
US15/624,698 US10455087B2 (en) 2017-06-15 2017-06-15 Information retrieval using natural language dialogue
PCT/US2018/033575 WO2018231429A1 (en) 2017-06-15 2018-05-21 Information retrieval using natural language dialogue

Publications (1)

Publication Number Publication Date
CN110770714A true CN110770714A (zh) 2020-02-07

Family

ID=62778981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880039707.XA Pending CN110770714A (zh) 2017-06-15 2018-05-21 使用自然语言对话的信息取回

Country Status (4)

Country Link
US (2) US10455087B2 (zh)
EP (1) EP3639162A1 (zh)
CN (1) CN110770714A (zh)
WO (1) WO2018231429A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073668A1 (ja) * 2017-10-11 2019-04-18 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US11157488B2 (en) * 2017-12-13 2021-10-26 Google Llc Reinforcement learning techniques to improve searching and/or to conserve computational and network resources
FR3076023A1 (fr) * 2017-12-26 2019-06-28 Orange Interface d'utilisateur a interaction perfectionnee par presentation de contenu informatif approprie
CN108509593A (zh) * 2018-03-30 2018-09-07 联想(北京)有限公司 一种显示方法及电子设备、存储介质
US11238508B2 (en) * 2018-08-22 2022-02-01 Ebay Inc. Conversational assistant using extracted guidance knowledge
CN110704735B (zh) * 2019-09-24 2022-01-28 贝壳技术有限公司 一种列表页的前端实现方法和装置
US11977813B2 (en) * 2021-01-12 2024-05-07 International Business Machines Corporation Dynamically managing sounds in a chatbot environment

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1823334A (zh) * 2003-05-14 2006-08-23 塞利布罗斯有限公司 搜索引擎方法及装置
US20110144999A1 (en) * 2009-12-11 2011-06-16 Samsung Electronics Co., Ltd. Dialogue system and dialogue method thereof
CN105719156A (zh) * 2015-10-15 2016-06-29 深圳市麻省图创科技有限公司 用于识别和推广已添加标签的商品的系统及方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430531B1 (en) 1999-02-04 2002-08-06 Soliloquy, Inc. Bilateral speech system
EP1049030A1 (en) * 1999-04-28 2000-11-02 SER Systeme AG Produkte und Anwendungen der Datenverarbeitung Classification method and apparatus
US6415257B1 (en) * 1999-08-26 2002-07-02 Matsushita Electric Industrial Co., Ltd. System for identifying and adapting a TV-user profile by means of speech technology
US20060143007A1 (en) * 2000-07-24 2006-06-29 Koh V E User interaction with voice information services
US7636657B2 (en) * 2004-12-09 2009-12-22 Microsoft Corporation Method and apparatus for automatic grammar generation from data entries
US8799263B2 (en) * 2011-09-04 2014-08-05 Leigh M Rothschild Systems, devices, and methods for providing multidimensional search results
US10528907B2 (en) * 2012-12-19 2020-01-07 Oath Inc. Automated categorization of products in a merchant catalog
US9244894B1 (en) 2013-09-16 2016-01-26 Arria Data2Text Limited Method and apparatus for interactive reports
US9235638B2 (en) * 2013-11-12 2016-01-12 International Business Machines Corporation Document retrieval using internal dictionary-hierarchies to adjust per-subject match results
US9639854B2 (en) 2014-06-26 2017-05-02 Nuance Communications, Inc. Voice-controlled information exchange platform, such as for providing information to supplement advertising
US10095807B2 (en) * 2015-04-28 2018-10-09 Microsoft Technology Licensing, Llc Linked data processor for database storage
US10083237B2 (en) * 2015-08-31 2018-09-25 Google Llc Protecting users from inappropriate sensitive or offensive search results
US10713317B2 (en) * 2017-01-30 2020-07-14 Adobe Inc. Conversational agent for search

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1823334A (zh) * 2003-05-14 2006-08-23 塞利布罗斯有限公司 搜索引擎方法及装置
US20110144999A1 (en) * 2009-12-11 2011-06-16 Samsung Electronics Co., Ltd. Dialogue system and dialogue method thereof
CN105719156A (zh) * 2015-10-15 2016-06-29 深圳市麻省图创科技有限公司 用于识别和推广已添加标签的商品的系统及方法

Also Published As

Publication number Publication date
EP3639162A1 (en) 2020-04-22
US20180367668A1 (en) 2018-12-20
US11272055B2 (en) 2022-03-08
US10455087B2 (en) 2019-10-22
US20200007681A1 (en) 2020-01-02
WO2018231429A1 (en) 2018-12-20

Similar Documents

Publication Publication Date Title
US11995698B2 (en) System for virtual agents to help customers and businesses
US11272055B2 (en) Information retrieval using natural language dialogue
US20200320604A1 (en) Information Provision System, Information Provision Method, and Storage Medium
US20220165272A1 (en) Recommendation engine for upselling in restaurant orders
US9898487B2 (en) Determining color names from keyword searches of color palettes
US9792303B2 (en) Identifying data from keyword searches of color palettes and keyword trends
US9922050B2 (en) Identifying data from keyword searches of color palettes and color palette trends
US9430794B2 (en) System and method for providing a buy option in search results when user input is classified as having a purchase intent
EP3752973A1 (en) System and method for generating aspect-enhanced explainable description-based recommendations
US20150378999A1 (en) Determining affiliated colors from keyword searches of color palettes
US20150379005A1 (en) Identifying data from keyword searches of color palettes
US20150379000A1 (en) Generating visualizations from keyword searches of color palettes
CN109716334A (zh) 选择下一用户提示类型
US20180276727A1 (en) System and Method for Automated Retrieval of Apparel Items and the Like
US20200265048A1 (en) Intuitive voice search
CN112189229A (zh) 针对计算机化个人助手的技能发现
US11238515B1 (en) Systems and method for visual search with attribute manipulation
US20200051559A1 (en) Electronic device and method for providing one or more items in response to user speech
CN114564666A (zh) 百科信息展示方法、装置、设备和介质
US9928466B1 (en) Approaches for annotating phrases in search queries
US20200265233A1 (en) Method for recognizing object and electronic device supporting the same
US11488223B1 (en) Modification of user interface based on dynamically-ranked product attributes
US20170293938A1 (en) Interactive competitive advertising commentary
TWI507902B (zh) A retrieval system, a retrieval condition setting device, a control method of a search condition setting device, a computer program product, and an information memory medium
US10838575B2 (en) Adaptive tile-based user interface for inferring user interest

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination