CN102282609A

CN102282609A - 用于识别对话系统中的专有名称的系统和方法

Info

Publication number: CN102282609A
Application number: CN2009801547412A
Authority: CN
Inventors: 翁富良; 沈中南; Z·冯
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2008-11-19
Filing date: 2009-11-13
Publication date: 2011-12-14
Anticipated expiration: 2029-11-13
Also published as: US20100125456A1; WO2010059525A1; US20120101823A1; CN102282609B; EP2359364B1; EP2359364A1; US8108214B2

Abstract

描述了利用语境信息来执行专有名称的识别的对话系统的实施例。不同于针对大的名称列表的现有名称识别方法(其通常严格地聚焦于这些名称的静态方面)，本发明的实施例考虑了名称使用时的时态效应、近因效应以及语境效应，并且形成新的问题以对过去和当前话语的识别进一步限制搜索空间或者语法。

Description

用于识别对话系统中的专有名称的系统和方法

技术领域

本发明的实施例总体上涉及对话系统，尤其涉及识别对话系统中的专有名称。

背景技术

口语是人们最自然和最常规的通信工具。随着数据存储能力的快速增加，人们趋向于在数据库中存储更大数量的信息。采用口语界面来访问该数据向人们提供了便利性和高效性，但是仅在口语界面是可靠的情况下才是如此。这在眼忙和手忙的情况中尤其重要，例如在驾车的情况中。利用口语命令和语音识别的人机界面通常都基于对话系统。对话系统是被设计成在输入和输出通道上通过使用一致的结构和文本、语音、图形或者其他通信模式来与人类进行交谈的计算机系统。采用语音的对话系统被称为口语对话系统，并且通常代表着最自然的人机界面类型。随着对电子设备的依赖性日益增加，口语对话系统被日益增加地实施在许多不同的机器中。

在许多口语界面应用程序中都非常广泛地使用专有名称(propername)，诸如人名、场所名、公司名、地名以及类似事物的名称。实际上，在这些应用程序中使用的专有名称的数量是相当大的，并且会涉及到外来名称，诸如导航领域中的街道名称或者餐馆选择领域中的餐馆名称。当处于高应力环境(诸如驾车、开飞机或者操作机器)中时，人们趋向于使用简短的术语，诸如部分专有名称以及它们的微小变异。在传统的口语界面应用程序中，专有名称识别的现有问题包括：在语音识别器部件中针对这些名称的语音识别精度不够高；以及关于系统数据库中出现的这些名称，对这些名称的识别精度不够高。

对大的名称列表的现有名称识别方法通常严格地聚焦于名称的静态方面。这种系统没有对能够明显有助于专有名称的识别过程的特定语境元素加以利用。这种语境元素可以包括名称被使用时的时态效应、近因效应以及语境效应。

现有的识别系统还可以被配置为通过直接确认的方式来确认专有名称。在该方法中，该系统通过重新叙述用户的话语并直接提及该系统理解的名称来对问题进行响应。一种类型的直接确认系统明确地向用户询问他或她是否提到了特定的名称。例如，如果用户正在预定机票，他或许会说“I want to fly from Boston to New York”。之后，该系统可以通过说“You saidBoston to New York，is that correct？”来进行响应。之后，该用户必须回答这是正确还是错误的，并提供必要的纠正。为了使该系统看起来更像是在进行对话，可以以不太直接的方式来复述该确认。例如，如果用户说“I wantto fly from Boston to New York”，则该系统可以通过说“OK，when would youlike to fly from Boston to New York？”来进行响应。这种类型的确认(称为隐含确认)是基于这样的事实，即如果该系统理解不正确并错误地陈述了一个或多个名称，则该用户将提供纠正；但是如果该系统正确地重复了这些名称，则该用户将不必说与这些名称相关的任何事情。通过在响应中包括专有名称，该系统已经直接地确认了该系统理解的名称。直接确认系统通常是比较笨的，因为它们涉及对用户说出的专有名称进行复述，因此是过度重复的，从而增加了时间并有可能降低用户体验。这些系统的缺点还在于，它们会趋向于重复或者传播在语音识别过程期间犯的错误。

因此，需要一种利用语境信息并致力于为口语界面应用程序解决专有名称识别任务中的问题的对话系统，即改善针对这些名称的语音识别精度以及这些名称的识别精度。

附图说明

通过示例的方式示出了本发明的实施例，并且不受附图中的图形的限制，其中，类似的标号指代类似的元件，其中：

图1是根据实施例的包括改善的专有名称识别单元的口语对话系统的框图；

图2是根据实施例的示出了用于生成间接确认语句的部件的框图；

图3是根据实施例的示出了用于生成间接确认语句的方法的流程图；

图4是根据实施例的对话策略部件的功能部件的框图。

具体实施方式

描述了利用语境信息来执行专有名称的识别的对话系统的实施例。不同于针对大的名称列表的现有名称识别方法(其通常严格地聚焦于这些名称的静态方面)，本发明的实施例考虑了名称使用时的时态效应、近因效应以及语境效应，并且形成新的问题以针对过去和当前话语的识别进一步限制搜索空间或者语法。

在下面的描述中，引入了大量的具体细节来提供对一对话系统响应生成系统和方法的透彻理解，以及提供对一对话系统响应生成系统和方法的描述及其实施例。然而，本领域技术人员将意识到，可以在没有一个或多个具体细节或者没有其他部件、系统等的情况下来实践这些实施例。在其他实例中，没有示出或者没有详细描述公知的结构或者操作，以避免模糊所公开实施例的各个方面。

在典型的对话交互会话中，专有名称识别的可信度通常不是非常高，至少对于某些名称而言是如此。为了改善专有名称识别，已经开发了使用特定语境信息(诸如，使用特定领域的知识或者用户模型)的系统。该专有名称识别系统的实施例通过间接确认的形成来构建并利用语境信息，其中可以以从之前的对话改变中用户输入推得的问题的形式来提供该间接确以。

图1是根据实施例的包括了利用语境信息的专有名称识别单元的口语对话系统的框图。出于本发明描述的目的，在处理设备上执行的任何过程都可以称为模块或者部件，并且可以是在各自的设备计算机上本地执行的独立的程序，或者它们可以是运行于一个或者多个设备上的分布式客户端应用程序的部分。系统100的核心部件包括：口语理解(SLU)模块104，其具有针对不完美输入的多个理解策略；信息状态更新或者其他类型的对话管理器(DM)106，其对多个对话线程以及混合主动性(mixed initiative)进行处理；知识管理器(KM)110，其控制对基于实体领域的知识的访问；以及内容优化器112，其将对话管理器与知识管理器相连接，并用于解决来自用户请求的歧义，管理呈现给用户的信息量，以及向用户提供建议。在一个实施例中，口语用户输入101产生由语音识别单元102接收的声波。语音识别单元102可以包括用于提供诸如动态语法以及基于分类的n-gram之类的功能的部件。在用户输入101是基于文本而非基于语音的情况中，语音识别单元102被绕开，并且模拟的用户输入被直接提供给口语理解单元104。响应生成器108提供该系统100的输出。响应生成器108基于用户输入来生成音频和/或文本输出。这种输出可以是对查询的回答、请求澄清或请求其它信息、用户输入的重复或者任何其他适当的响应。响应生成器108在生成响应时利用领域信息。因此，向用户说同一事情的不同措辞通常将产生非常不同的结果。

图1所示的系统100包括存储大量名称的大数据存储器118。在整个说明书中，术语“名称”用于表示任意类型的实体标记(诸如人名、地名或者事情的名称)或者针对对象或者实体的任何其他描述符或者标记。通常，取决于领域或者对话系统应用程序，数据存储器118中的名称的数量可以非常大，例如几十、几百或几千个名称的量级。为了改善对用户话语中的名称的识别精度，可以基于近来会话的输入语音中使用的名称的语境，采用所附权重值将大的名称列表减小成更小的名称列表。向更小列表外部的名称分配0权重值。

数据存储器118能够保存被组织到一个或多个数据库的名称。一个数据库可以是静态数据库，其包括所有可能的名称，即常用名称(诸如常用商标或者引用)或者由用户频繁使用的名称(诸如从用户简档或者模型中导出的名称)。在静态数据库中，在开始会话之前预先计算权重值，并且该权重值通常基于使用频率。第二数据库可以是动态数据库，其持续地从DM单元106中获取话语语境中的名称(诸如刚提到的名称)。可以构建包括附加有适当权重值的全部以及部分名称的名称列表，所述适当权重值取决于名称使用的语境以及名称的其他特性。例如，可以将高权重给予近来已经提到的名称，将较低的权重给予常用名称，以及将最低的权重给予尚未被使用的名称。通常，取决于从其获取名称的数据库来向名称列表中的每个名称分配权重。通常，来自动态数据库的名称的权重高于来自静态数据库的名称的权重。可以基于任何适当的标度(诸如0到100％，或者任何类似的标度)来分配权重，并且权重能够用于帮助识别系统改善识别精度。

系统100的实施例还包括对话策略部件114。当对话管理器106检测：识别了相对低可信度的名称时，调用该对话策略部件。对于对话管理器检测到足够高的识别级别的名称而言，通过该系统定义的标准响应过程来处理对话。

对话策略部件114实现了包括间接确认方法的名称识别系统。不同于用户说出的名称被系统直接复述的直接确认(例如，“You said Boston to NewYork，correct？”)，间接确认系统为用户生成基于名称的新的问题，但是不是对名称进行复述。这种类型的系统降低了直接确认的重复性，因此更像是进行会话，并且向用户模型中添加了潜在的相关数据。例如，如果用户说“I want to fly from Boston to New York”，则该系统可以通过说“OK，whenwould you like to leave Massachusetts？”来进行响应。这种类型的间接确认要求基于用户话语中的被适当识别的专有名称形成相关问题。如果例如该系统将“Boston”误解成“Austin”，则间接确认可以被陈述为“OK，when wouldyou like to leave Texas？”。在这种情况中，用户将需要通过复述问题或者通过澄清被陈述的名称来对该系统进行纠正。通过使用不同的名称而不是尝试重复用户所说的名称，该间接确认系统消除了与直接确认系统相关联的、用户没有识别出被重复的名称是不正确的的潜在问题。即，如果该系统陈述了“Austin”而非“Boston”，则用户或许会如他初始期望的那样听到“Boston”而非“Austin”，并且没有意识到系统犯了错误。通过形成不同的语句，该系统更完全地吸引了用户并且提供了不同的理解和澄清基础。

也可以基于该系统可用的不同类型的信息(例如，用户位置、设备类型)以及该系统可用的任何其他的客观信息形成相关问题。例如，如果用户处于正在通过北加利福尼亚的车中，并且请求该系统发现“MountainView”中的餐馆，则该系统或许会将该地名与“Monterey”相混淆。在这种情况中，该系统可以向用户回话“As you drive through Silicon Valley…”。由该系统生成的该间接确认利用了这样的事实，即用户的位置位于“SiliconValley”附近而非“Monterey”半岛附近，并且该用户在请求时正位于车辆内。如果该系统的理解正确，则用户可以继续与该系统的对话，否则他或她可以提供纠正信息。可以基于对系统输出的用户响应来提供附加的间接确认问题或语句。对语音识别阶段要生成的系统可信度进行响应，直到达到足够的识别精度。

图2是根据实施例的示出了用于生成间接确认语句的部件的框图。如系统200所示，对话策略部件从用户输入202以及对象数据源204中获取数据，以生成间接确认语句或问题210。可以从各种源(诸如用户简档数据库、位置传感器、设备描述符等)来提供对象数据204。

在一个实施例中，对话策略部件114对用户话语、从过去的用户话语中获得的语义内容和数据进行跟踪，以在交互期间识别当前的话语。利用可信度来度量识别精度。可以定义用于实现该过程的一个或多个阈值可信度。具体地，如果当前被识别的话语的可信分数高，则使用被识别的话语、从该话语中恢复的语义内容和数据来继续与该用户进行交互。如果被识别的话语或者语义内容的可信分数低于某个定义阈值，则生成相关的间接确认问题或语句并由该系统将其作为对话过程的一部分提供给用户。

图3是根据实施例的示出了用于生成间接确认语句的方法的流程图。在框302中，语音识别器部件接收用户话语，并且该系统对话语中的专有名称进行分析。该系统试图识别专有名称并确定针对该识别的初始可信分数。设置阈值可信度。在一个实施例中，基于语音识别器来根据经验设置阈值可信度。可以由识别器单元102自动地提供可信度(诸如在商用单元的情况中)，或者可以由系统管理员或者设计者来定义可信度。通常规定可信度位于0到100％的百分比范围内，并且典型的阈值可以大约为75-85％。在这种情况中，如果识别器返回了可信度高于阈值的假设，则该系统将系统响应接受作为被精确识别的名称。低于阈值的任何值都将导致该假设被拒绝。取决于应用程序要求以及系统约束，不同的识别器可以具有不同的阈值水平。

语音识别器单元102可以生成被识别名称的一个或多个假设。例如，对于上面的机票预订问题，语音识别器可以产生下面三种识别假设：“Boston”、“Austin”以及“Houston”。在这三种或者任意数量的假设中，根据可信分数或其他数据，一种假设或许比其他假设好。例如，该系统或许知道在会话时该用户正位于美国的东海岸上。在这种情况中，相比于“Austin”或者“Houston”，“Boston”是更好的选择，即使“Austin”和“Houston”这些城市名称中的其中一个名称具有更高的可信分数。在框305，该系统从可用假设中选择最佳假设。可以基于可信分数和/或该系统可用的任何外部信息来做出该选择，并且可以由该系统和/或用户定义的规则来指定该选择。

之后，在框306，将被选择的假设的可信分数与定义的可信阈值进行比较。如果被识别的话语或者语义内容的可信分数低，则在框308，由该系统将基于语境信息形成的相关问题提示给用户。之后，在框310，接收并处理针对该相关问题的用户响应。之后，在框312，该响应用于对在过去的交互中获得的之前不确信的用户话语以及信息的识别或者重新评分进行约束。该过程从执行阈值比较的框306开始重复，直到从用户获得足够高可信度的结果或者高可信度的组合结果。一旦从回答话语中获得的被识别的结果和信息具有足够高的可信度，即高于定义阈值的可信度，则将专有名称接受为被识别的专有名称，并且该对话系统继续常规的系统响应。

如图3中的框308所示，如果被选择的假设的可信度低于定义的可信度阈值，则形成相关问题。可以以各种方式形成该相关问题。在一个实施例中，可以基于系统为当前用户话语产生的n-最佳列表或格状物(lattice)、知识库或该应用程序的数据库中的关系，形成问题。n-最佳列表可以从语音识别器(其采用输入声音信号来产生一个或多个识别假设)来生成，而格状物是n-最佳列表的压缩表示。当用户对问题进行回答时，被识别的结果可以用于约束之前用户话语的识别或者重新评分，如果其具有高的可信度的话。在识别期间，基于从用户的回答中收集到的信息来修改名称候选。如果可供选择的假设不止一个，则提出相关间接确认问题并修改可信度评分的迭代过程将帮助该系统从各种可能的假设中进行选择。例如，如果所述假设包括以下各项：Boston、Austin和Houston，则对相关问题“So，youplan to fly out of Massachusetts”的肯定的用户响应将导致该系统选择“Boston”作为被识别的名称。然而，如果用户通过说“No，I plan to fly outof Texas”进行响应，则该系统必须之后询问另一随后的问题，因为虽然“Boston”已经被排除了，但是“Austin”或者“Houston”仍然是可能的候选者。在这种情况中，该系统可以接着提出另一问题，诸如“So，you will beflying out of the state capital…”。针对该附加相关问题的用户响应之后将允许该系统在两个剩余的选项中进行选择。

在一个实施例中，高可信度的回答还可以用于对通过用户话语取得的之前识别结果以及数据进行重新评分。例如，如果在用户话语之间或者从这些用户话语中获得的数据之间存在着重叠，则由预定义的模型或者函数(例如，特定权重的聚合函数)来组合重叠部分的可信度。可以执行多个步骤，直到从用户获得高可信度的结果或者高可信度的组合结果为止。在这种情况中，重叠可以包括系统响应与用户话语之间的重复单词。

图4是根据实施例的对话策略部件的功能部件的框图。如图4所示，对话策略部件包括形成相关问题的问题形成模块404、判决形成部件406以及重新评分/识别部件408。通常，相关问题影响着语音识别器的语言模型部分。语言模块对搜索进行约束。该模型的改变将对随后问题产生不同结果。这引入了该系统的动态自适应度。

对话策略部件使用在对语音识别的名称候选进行约束和修改中包括的语境信息。用澄清对话来锚定话语的可信部分能够使用数据内部中的语义关系来缩小识别的名称类型。

在一个实施例中，对话系统中的计算机实现的方法包括：接收包括专有名称的用户话语；识别用户话语中的专有名称；确定针对所识别的专有名称的第一可信分数；如果第一可信分数低于定义的阈值，则生成包括与专有名称相关的间接确认问题的第一机器响应用户话语，其中，该第一机器响应不对专有名称进行重复；接收针对间接确认问题的用户响应；以及基于用户响应来修改第一可信分数以生成第二可信分数。在该方法中，专有名称可以包括描述人、场所或者事情的任意词性(part of speech)。用户话语可以包括输入到对话系统的语音识别阶段的查询，其中该方法还包括：从用户话语分析专有名称；生成一个或多个假设以识别多个候选名称，其中，每个候选名称潜在地对应于说出的专有名称；以及从所述多个候选名称中选择最佳专有名称。在一个实施例中，最佳候选名称是具有最接近于所述定义的阈值的第一可信分数的名称。

该实施例的方法还可以包括：定义与说出的专有名称相关联的一个或多个特征；以及通过在第一机器响应中包括一个或多个特征中的至少一个特征，形成间接确认问题。间接确认问题可以基于n-最佳列表形成。该方法还可以包括：如果第二可信分数低于定义的阈值，则生成包括与专有名称相关的附加间接确认问题的第二机器响应用户话语，其中，第二机器响应不对专有名称进行重复。该方法还可以包括：通过在第二机器响应中包括来自所述第一机器响应的所述一个或多个特征中的至少一个附加特征，形成附加间接确认问题。

在一个实施例中，该方法还可以包括：如果第一可信分数高于定义的阈值，则继续常规的对话响应过程。可替换地，该方法还可以包括：如果第二可信分数高于定义的阈值，则继续常规的对话响应过程。

本文的实施例包括对话系统，该对话系统包括：语音识别单元，用于接收包括专有名称的用户话语；识别器单元，用于识别用户话语中的专有名称；评分单元，用于确定针对所识别的专有名称的第一可信分数；以及问题形成单元，用于如果第一可信分数低于定义的阈值，则生成包括与专有名称相关的间接确认问题的第一机器响应用户话语，其中，该第一机器响应并不对专有名称进行重复，其中，语音识别器单元接收对间接确认问题的用户响应；以及评分单元，用于基于用户响应来修改第一可信分数以生成第二可信分数。在该系统中，专有名称可以包括描述人、场所或者事情的任意词性。该系统还可以包括：分析器，用于从用户话语分析专有名称；以及判决形成单元，用于生成一个或多个假设以识别多个候选名称，其中，每个候选名称潜在地对应于说出的专有名称，并用于从所述多个候选名称中选择最佳专有名称。最佳候选名称可以是具有最接近于所述定义的阈值的第一可信分数的名称。在该系统中，问题形成单元定义与说出的专有名称相关联的一个或多个特征；以及通过在第一机器响应中包括所述一个或多个特征中的至少一个特征，形成间接确认问题。间接确认问题可以基于n-最佳列表形成。

在一个实施例中，如果第二可信分数低于定义的阈值，则该系统生成包括与专有名称相关的附加间接确认问题的第二机器响应用户话语，其中，第二机器响应不对专有名称进行重复。问题形成单元还可以通过在第二机器响应中包括来自第一机器响应的所述一个或多个特征中的至少一个附加特征，形成附加间接确认问题。

本文描述的名称识别过程的各个方面可以被实施为被编程到各种电路中的任何电路中的功能，其中，各种电路包括可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、可编程逻辑阵列(PAL)器件、电可编程逻辑和存储器器件和基于标准单元的器件以及专用集成电路。用于实施各个方面的一些其他可能的设备包括：具有存储器(诸如EEPROM)的微控制器、嵌入式微处理器、固件、软件等。此外，用于服务所述方法的内容的各个方面可以在微处理器中得到体现，该微处理器具有基于软件的电路仿真、离散逻辑(时序和组合逻辑)、定制器件、模糊(神经)逻辑、量子器件以及上述器件类型的任意混合。底层器件技术可以以各种部件类型来提供，例如，金属-氧化物-半导体场效应晶体管(MOSFET)技术(类似于互补金属-氧化物半导体(CMOS))、双极技术(类似于射极耦合逻辑(ECL))、聚合物技术(例如，硅共轭聚合物以及金属共轭聚合物-金属结构)、模数混合等。

应当指出的是，就其行为、寄存器传送、逻辑部件和/或其他特征而言，本文公开的各种功能可以使用任意数量硬件、固件的组合来被描述、和/或被描述为各种机器可读或计算机可读介质中实现的数据和/或指令。其中这种格式化的数据和/或指令可以被体现的计算机可读介质可以包括但不局限于：各种形式的非易失性存储器介质(例如，光、磁或者半导体存储器介质)以及可以用于通过无线、光或者有线信号介质或其组合来传送这种格式化的数据和/或指令的载波。通过载波来传送这种格式化的数据和/或指令的示例包括但不局限于：经由一个或多个数据传输协议(例如，HTTP、FTP、SMTP等)通过因特网和/或其他计算机网络来进行传送(上传、下载、电邮等)。

除非上下文中明确要求，否则在整个说明书和权利要求书中，措辞“包括(comprise)”、“包括(comprising)”等被解释为包括的意思，其与排它的意思和穷举的意思不同；也就是说，“包括但不局限于”的意思。使用单数或者复数的措辞也分别包括复数或者单数。另外，措辞“这里”、“在下文”、“上述”、“下面”以及类似意义的措辞指的是作为整体的本申请，而非指代本申请的任何特定部分。当措辞“或”用于引用两个或多个项目的列表时，那个措辞覆盖该措辞的下述所有解释：该列表中的任意项目、该列表中的所有项目以及该列表中的项目的任意组合。

上面对所示的响应生成过程的实施例的描述并不意欲是穷举的或者意欲实施例受到公开的精确形式或者指令的限制。虽然本文出于说明的目的描述了针对计算设备中的过程的具体实施例以及示例，但是如本领域技术人员将意识到的，各种等价修改能够位于所公开方法和结构的范围内。可以将上面描述的各种实施例的元素和动作进行组合来提供进一步的实施例。根据上面的详细描述，能够做出针对响应生成过程的这些以及其他改变。

通常，在下面的权利要求书中，使用的术语不应当被解释为公开的方法受到该说明书中公开的具体实施例的限制，而是应当被解释为包括根据所述权利要求进行操作的所有操作或者过程。因此，公开的结构和方法不受本公开的限制，相反地，所引用方法的范围完全由权利要求书来确定。

虽然以下文某种权利要求形式呈现了所公开系统和方法的特定方面，但是发明人设想其能涵盖以任意数量的权利要求形式的方法的各个方面。例如，虽然仅引用了一个方面来说明其可以体现在机器可读介质中，但是其他方面也可以体现在机器可读介质中。因此，发明人保留以下权利：在提交本申请之后添加其他权利要求，以为其他方面实现这种附加权利要求的形式。

Claims

1.一种对话系统中的计算机实现的方法，包括：

接收包括专有名称的用户话语；

识别所述用户话语中的所述专有名称；

确定针对所识别的专有名称的第一可信分数；

如果所述第一可信分数低于定义的阈值，则生成第一机器响应用户话语，其包括与所述专有名称相关的间接确认问题，其中，所述第一机器响应不对所述专有名称进行重复；

接收对所述间接确认问题的用户响应；以及

基于所述用户响应来修改所述第一可信分数以生成第二可信分数。

2.根据权利要求1所述的方法，其中，所述专有名称包括描述人、场所或者事情的任意词性。

3.根据权利要求1所述的方法，其中，所述用户话语包括输入到所述对话系统的语音识别阶段的查询，该方法还包括：

从所述用户话语分析所述专有名称；

生成一个或多个假设以识别多个候选名称，其中，每个候选名称潜在地对应于说出的专有名称；以及

从所述多个候选名称中选择最佳专有名称。

4.根据权利要求2所述的方法，其中，最佳候选名称是具有最接近于所述定义的阈值的所述第一可信分数的名称。

5.根据权利要求1所述的方法，该方法还包括：

定义与说出的专有名称相关联的一个或多个特征；以及

通过在所述第一机器响应中包括所述一个或多个特征中的至少一个特征，形成所述间接确认问题。

6.根据权利要求5所述的方法，其中，所述间接确认问题基于n-最佳列表形成。

7.根据权利要求5所述的方法，还包括：如果所述第二可信分数低于所述定义的阈值，则生成第二机器响应用户话语，其包括与所述专有名称相关的附加间接确认问题，其中，所述第二机器响应不对所述专有名称进行重复。

8.根据权利要求7所述的方法，还包括：通过在所述第二机器响应中包括来自所述第一机器响应的所述一个或多个特征中的至少一个附加特征，形成所述附加间接确认问题。

9.根据权利要求1所述的方法，还包括：如果所述第一可信分数高于所述定义的阈值，则继续常规的对话响应过程。

10.根据权利要求1所述的方法，还包括：如果所述第二可信分数高于所述定义的阈值，则继续常规的对话响应过程。

11.一种对话系统，包括：

语音识别单元，用于接收包括专有名称的用户话语；

识别器单元，用于识别所述用户话语中的所述专有名称；

评分单元，用于确定针对所识别的专有名称的第一可信分数；以及

问题形成单元，用于如果所述第一可信分数低于定义的阈值，则生成包括与所述专有名称相关的间接确认问题的第一机器响应用户话语，其中，所述第一机器响应不对所述专有名称进行重复，其中，所述语音识别器单元接收对所述间接确认问题的用户响应，并且所述评分单元基于所述用户响应来修改所述第一可信分数以生成第二可信分数。

12.根据权利要求11所述的系统，其中，所述专有名称包括描述人、场所或者事情的任意词性。

13.根据权利要求11所述的系统，还包括：

分析器，用于从所述用户话语分析所述专有名称；以及

判决形成单元，用于生成一个或多个假设以识别多个候选名称，其中，每个候选名称潜在地对应于说出的专有名称，并且从所述多个候选名称中选择最佳专有名称。

14.根据权利要求12所述的系统，其中，最佳候选名称是具有最接近于所述定义的阈值的所述第一可信分数的名称。

15.根据权利要求11所述的系统，其中，所述问题形成单元定义与说出的专有名称相关联的一个或多个特征；以及，通过在所述第一机器响应中包括所述一个或多个特征中的至少一个特征，形成所述间接确认问题。

16.根据权利要求15所述的系统，其中，所述间接确认问题基于n-最佳列表形成。

17.根据权利要求15所述的系统，其中，如果所述第二可信分数低于所述定义的阈值，则该系统生成包括与所述专有名称相关的附加间接确认问题的第二机器响应用户话语，其中，所述第二机器响应不对所述专有名称进行重复。

18.根据权利要求17所述的系统，其中，所述问题形成单元还通过在所述第二机器响应中包括来自所述第一机器响应的所述一个或多个特征中的至少一个附加特征，形成所述附加间接确认问题。