CN102282609A - 用于识别对话系统中的专有名称的系统和方法 - Google Patents

用于识别对话系统中的专有名称的系统和方法 Download PDF

Info

Publication number
CN102282609A
CN102282609A CN2009801547412A CN200980154741A CN102282609A CN 102282609 A CN102282609 A CN 102282609A CN 2009801547412 A CN2009801547412 A CN 2009801547412A CN 200980154741 A CN200980154741 A CN 200980154741A CN 102282609 A CN102282609 A CN 102282609A
Authority
CN
China
Prior art keywords
proprietary name
user
title
definition
spoken utterances
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801547412A
Other languages
English (en)
Other versions
CN102282609B (zh
Inventor
翁富良
沈中南
Z·冯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of CN102282609A publication Critical patent/CN102282609A/zh
Application granted granted Critical
Publication of CN102282609B publication Critical patent/CN102282609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

描述了利用语境信息来执行专有名称的识别的对话系统的实施例。不同于针对大的名称列表的现有名称识别方法(其通常严格地聚焦于这些名称的静态方面),本发明的实施例考虑了名称使用时的时态效应、近因效应以及语境效应,并且形成新的问题以对过去和当前话语的识别进一步限制搜索空间或者语法。

Description

用于识别对话系统中的专有名称的系统和方法
技术领域
本发明的实施例总体上涉及对话系统,尤其涉及识别对话系统中的专有名称。
背景技术
口语是人们最自然和最常规的通信工具。随着数据存储能力的快速增加,人们趋向于在数据库中存储更大数量的信息。采用口语界面来访问该数据向人们提供了便利性和高效性,但是仅在口语界面是可靠的情况下才是如此。这在眼忙和手忙的情况中尤其重要,例如在驾车的情况中。利用口语命令和语音识别的人机界面通常都基于对话系统。对话系统是被设计成在输入和输出通道上通过使用一致的结构和文本、语音、图形或者其他通信模式来与人类进行交谈的计算机系统。采用语音的对话系统被称为口语对话系统,并且通常代表着最自然的人机界面类型。随着对电子设备的依赖性日益增加,口语对话系统被日益增加地实施在许多不同的机器中。
在许多口语界面应用程序中都非常广泛地使用专有名称(propername),诸如人名、场所名、公司名、地名以及类似事物的名称。实际上,在这些应用程序中使用的专有名称的数量是相当大的,并且会涉及到外来名称,诸如导航领域中的街道名称或者餐馆选择领域中的餐馆名称。当处于高应力环境(诸如驾车、开飞机或者操作机器)中时,人们趋向于使用简短的术语,诸如部分专有名称以及它们的微小变异。在传统的口语界面应用程序中,专有名称识别的现有问题包括:在语音识别器部件中针对这些名称的语音识别精度不够高;以及关于系统数据库中出现的这些名称,对这些名称的识别精度不够高。
对大的名称列表的现有名称识别方法通常严格地聚焦于名称的静态方面。这种系统没有对能够明显有助于专有名称的识别过程的特定语境元素加以利用。这种语境元素可以包括名称被使用时的时态效应、近因效应以及语境效应。
现有的识别系统还可以被配置为通过直接确认的方式来确认专有名称。在该方法中,该系统通过重新叙述用户的话语并直接提及该系统理解的名称来对问题进行响应。一种类型的直接确认系统明确地向用户询问他或她是否提到了特定的名称。例如,如果用户正在预定机票,他或许会说“I want to fly from Boston to New York”。之后,该系统可以通过说“You saidBoston to New York,is that correct?”来进行响应。之后,该用户必须回答这是正确还是错误的,并提供必要的纠正。为了使该系统看起来更像是在进行对话,可以以不太直接的方式来复述该确认。例如,如果用户说“I wantto fly from Boston to New York”,则该系统可以通过说“OK,when would youlike to fly from Boston to New York?”来进行响应。这种类型的确认(称为隐含确认)是基于这样的事实,即如果该系统理解不正确并错误地陈述了一个或多个名称,则该用户将提供纠正;但是如果该系统正确地重复了这些名称,则该用户将不必说与这些名称相关的任何事情。通过在响应中包括专有名称,该系统已经直接地确认了该系统理解的名称。直接确认系统通常是比较笨的,因为它们涉及对用户说出的专有名称进行复述,因此是过度重复的,从而增加了时间并有可能降低用户体验。这些系统的缺点还在于,它们会趋向于重复或者传播在语音识别过程期间犯的错误。
因此,需要一种利用语境信息并致力于为口语界面应用程序解决专有名称识别任务中的问题的对话系统,即改善针对这些名称的语音识别精度以及这些名称的识别精度。
附图说明
通过示例的方式示出了本发明的实施例,并且不受附图中的图形的限制,其中,类似的标号指代类似的元件,其中:
图1是根据实施例的包括改善的专有名称识别单元的口语对话系统的框图;
图2是根据实施例的示出了用于生成间接确认语句的部件的框图;
图3是根据实施例的示出了用于生成间接确认语句的方法的流程图;
图4是根据实施例的对话策略部件的功能部件的框图。
具体实施方式
描述了利用语境信息来执行专有名称的识别的对话系统的实施例。不同于针对大的名称列表的现有名称识别方法(其通常严格地聚焦于这些名称的静态方面),本发明的实施例考虑了名称使用时的时态效应、近因效应以及语境效应,并且形成新的问题以针对过去和当前话语的识别进一步限制搜索空间或者语法。
在下面的描述中,引入了大量的具体细节来提供对一对话系统响应生成系统和方法的透彻理解,以及提供对一对话系统响应生成系统和方法的描述及其实施例。然而,本领域技术人员将意识到,可以在没有一个或多个具体细节或者没有其他部件、系统等的情况下来实践这些实施例。在其他实例中,没有示出或者没有详细描述公知的结构或者操作,以避免模糊所公开实施例的各个方面。
在典型的对话交互会话中,专有名称识别的可信度通常不是非常高,至少对于某些名称而言是如此。为了改善专有名称识别,已经开发了使用特定语境信息(诸如,使用特定领域的知识或者用户模型)的系统。该专有名称识别系统的实施例通过间接确认的形成来构建并利用语境信息,其中可以以从之前的对话改变中用户输入推得的问题的形式来提供该间接确以。
图1是根据实施例的包括了利用语境信息的专有名称识别单元的口语对话系统的框图。出于本发明描述的目的,在处理设备上执行的任何过程都可以称为模块或者部件,并且可以是在各自的设备计算机上本地执行的独立的程序,或者它们可以是运行于一个或者多个设备上的分布式客户端应用程序的部分。系统100的核心部件包括:口语理解(SLU)模块104,其具有针对不完美输入的多个理解策略;信息状态更新或者其他类型的对话管理器(DM)106,其对多个对话线程以及混合主动性(mixed initiative)进行处理;知识管理器(KM)110,其控制对基于实体领域的知识的访问;以及内容优化器112,其将对话管理器与知识管理器相连接,并用于解决来自用户请求的歧义,管理呈现给用户的信息量,以及向用户提供建议。在一个实施例中,口语用户输入101产生由语音识别单元102接收的声波。语音识别单元102可以包括用于提供诸如动态语法以及基于分类的n-gram之类的功能的部件。在用户输入101是基于文本而非基于语音的情况中,语音识别单元102被绕开,并且模拟的用户输入被直接提供给口语理解单元104。响应生成器108提供该系统100的输出。响应生成器108基于用户输入来生成音频和/或文本输出。这种输出可以是对查询的回答、请求澄清或请求其它信息、用户输入的重复或者任何其他适当的响应。响应生成器108在生成响应时利用领域信息。因此,向用户说同一事情的不同措辞通常将产生非常不同的结果。
图1所示的系统100包括存储大量名称的大数据存储器118。在整个说明书中,术语“名称”用于表示任意类型的实体标记(诸如人名、地名或者事情的名称)或者针对对象或者实体的任何其他描述符或者标记。通常,取决于领域或者对话系统应用程序,数据存储器118中的名称的数量可以非常大,例如几十、几百或几千个名称的量级。为了改善对用户话语中的名称的识别精度,可以基于近来会话的输入语音中使用的名称的语境,采用所附权重值将大的名称列表减小成更小的名称列表。向更小列表外部的名称分配0权重值。
数据存储器118能够保存被组织到一个或多个数据库的名称。一个数据库可以是静态数据库,其包括所有可能的名称,即常用名称(诸如常用商标或者引用)或者由用户频繁使用的名称(诸如从用户简档或者模型中导出的名称)。在静态数据库中,在开始会话之前预先计算权重值,并且该权重值通常基于使用频率。第二数据库可以是动态数据库,其持续地从DM单元106中获取话语语境中的名称(诸如刚提到的名称)。可以构建包括附加有适当权重值的全部以及部分名称的名称列表,所述适当权重值取决于名称使用的语境以及名称的其他特性。例如,可以将高权重给予近来已经提到的名称,将较低的权重给予常用名称,以及将最低的权重给予尚未被使用的名称。通常,取决于从其获取名称的数据库来向名称列表中的每个名称分配权重。通常,来自动态数据库的名称的权重高于来自静态数据库的名称的权重。可以基于任何适当的标度(诸如0到100%,或者任何类似的标度)来分配权重,并且权重能够用于帮助识别系统改善识别精度。
系统100的实施例还包括对话策略部件114。当对话管理器106检测:识别了相对低可信度的名称时,调用该对话策略部件。对于对话管理器检测到足够高的识别级别的名称而言,通过该系统定义的标准响应过程来处理对话。
对话策略部件114实现了包括间接确认方法的名称识别系统。不同于用户说出的名称被系统直接复述的直接确认(例如,“You said Boston to NewYork,correct?”),间接确认系统为用户生成基于名称的新的问题,但是不是对名称进行复述。这种类型的系统降低了直接确认的重复性,因此更像是进行会话,并且向用户模型中添加了潜在的相关数据。例如,如果用户说“I want to fly from Boston to New York”,则该系统可以通过说“OK,whenwould you like to leave Massachusetts?”来进行响应。这种类型的间接确认要求基于用户话语中的被适当识别的专有名称形成相关问题。如果例如该系统将“Boston”误解成“Austin”,则间接确认可以被陈述为“OK,when wouldyou like to leave Texas?”。在这种情况中,用户将需要通过复述问题或者通过澄清被陈述的名称来对该系统进行纠正。通过使用不同的名称而不是尝试重复用户所说的名称,该间接确认系统消除了与直接确认系统相关联的、用户没有识别出被重复的名称是不正确的的潜在问题。即,如果该系统陈述了“Austin”而非“Boston”,则用户或许会如他初始期望的那样听到“Boston”而非“Austin”,并且没有意识到系统犯了错误。通过形成不同的语句,该系统更完全地吸引了用户并且提供了不同的理解和澄清基础。
也可以基于该系统可用的不同类型的信息(例如,用户位置、设备类型)以及该系统可用的任何其他的客观信息形成相关问题。例如,如果用户处于正在通过北加利福尼亚的车中,并且请求该系统发现“MountainView”中的餐馆,则该系统或许会将该地名与“Monterey”相混淆。在这种情况中,该系统可以向用户回话“As you drive through Silicon Valley…”。由该系统生成的该间接确认利用了这样的事实,即用户的位置位于“SiliconValley”附近而非“Monterey”半岛附近,并且该用户在请求时正位于车辆内。如果该系统的理解正确,则用户可以继续与该系统的对话,否则他或她可以提供纠正信息。可以基于对系统输出的用户响应来提供附加的间接确认问题或语句。对语音识别阶段要生成的系统可信度进行响应,直到达到足够的识别精度。
图2是根据实施例的示出了用于生成间接确认语句的部件的框图。如系统200所示,对话策略部件从用户输入202以及对象数据源204中获取数据,以生成间接确认语句或问题210。可以从各种源(诸如用户简档数据库、位置传感器、设备描述符等)来提供对象数据204。
在一个实施例中,对话策略部件114对用户话语、从过去的用户话语中获得的语义内容和数据进行跟踪,以在交互期间识别当前的话语。利用可信度来度量识别精度。可以定义用于实现该过程的一个或多个阈值可信度。具体地,如果当前被识别的话语的可信分数高,则使用被识别的话语、从该话语中恢复的语义内容和数据来继续与该用户进行交互。如果被识别的话语或者语义内容的可信分数低于某个定义阈值,则生成相关的间接确认问题或语句并由该系统将其作为对话过程的一部分提供给用户。
图3是根据实施例的示出了用于生成间接确认语句的方法的流程图。在框302中,语音识别器部件接收用户话语,并且该系统对话语中的专有名称进行分析。该系统试图识别专有名称并确定针对该识别的初始可信分数。设置阈值可信度。在一个实施例中,基于语音识别器来根据经验设置阈值可信度。可以由识别器单元102自动地提供可信度(诸如在商用单元的情况中),或者可以由系统管理员或者设计者来定义可信度。通常规定可信度位于0到100%的百分比范围内,并且典型的阈值可以大约为75-85%。在这种情况中,如果识别器返回了可信度高于阈值的假设,则该系统将系统响应接受作为被精确识别的名称。低于阈值的任何值都将导致该假设被拒绝。取决于应用程序要求以及系统约束,不同的识别器可以具有不同的阈值水平。
语音识别器单元102可以生成被识别名称的一个或多个假设。例如,对于上面的机票预订问题,语音识别器可以产生下面三种识别假设:“Boston”、“Austin”以及“Houston”。在这三种或者任意数量的假设中,根据可信分数或其他数据,一种假设或许比其他假设好。例如,该系统或许知道在会话时该用户正位于美国的东海岸上。在这种情况中,相比于“Austin”或者“Houston”,“Boston”是更好的选择,即使“Austin”和“Houston”这些城市名称中的其中一个名称具有更高的可信分数。在框305,该系统从可用假设中选择最佳假设。可以基于可信分数和/或该系统可用的任何外部信息来做出该选择,并且可以由该系统和/或用户定义的规则来指定该选择。
之后,在框306,将被选择的假设的可信分数与定义的可信阈值进行比较。如果被识别的话语或者语义内容的可信分数低,则在框308,由该系统将基于语境信息形成的相关问题提示给用户。之后,在框310,接收并处理针对该相关问题的用户响应。之后,在框312,该响应用于对在过去的交互中获得的之前不确信的用户话语以及信息的识别或者重新评分进行约束。该过程从执行阈值比较的框306开始重复,直到从用户获得足够高可信度的结果或者高可信度的组合结果。一旦从回答话语中获得的被识别的结果和信息具有足够高的可信度,即高于定义阈值的可信度,则将专有名称接受为被识别的专有名称,并且该对话系统继续常规的系统响应。
如图3中的框308所示,如果被选择的假设的可信度低于定义的可信度阈值,则形成相关问题。可以以各种方式形成该相关问题。在一个实施例中,可以基于系统为当前用户话语产生的n-最佳列表或格状物(lattice)、知识库或该应用程序的数据库中的关系,形成问题。n-最佳列表可以从语音识别器(其采用输入声音信号来产生一个或多个识别假设)来生成,而格状物是n-最佳列表的压缩表示。当用户对问题进行回答时,被识别的结果可以用于约束之前用户话语的识别或者重新评分,如果其具有高的可信度的话。在识别期间,基于从用户的回答中收集到的信息来修改名称候选。如果可供选择的假设不止一个,则提出相关间接确认问题并修改可信度评分的迭代过程将帮助该系统从各种可能的假设中进行选择。例如,如果所述假设包括以下各项:Boston、Austin和Houston,则对相关问题“So,youplan to fly out of Massachusetts”的肯定的用户响应将导致该系统选择“Boston”作为被识别的名称。然而,如果用户通过说“No,I plan to fly outof Texas”进行响应,则该系统必须之后询问另一随后的问题,因为虽然“Boston”已经被排除了,但是“Austin”或者“Houston”仍然是可能的候选者。在这种情况中,该系统可以接着提出另一问题,诸如“So,you will beflying out of the state capital…”。针对该附加相关问题的用户响应之后将允许该系统在两个剩余的选项中进行选择。
在一个实施例中,高可信度的回答还可以用于对通过用户话语取得的之前识别结果以及数据进行重新评分。例如,如果在用户话语之间或者从这些用户话语中获得的数据之间存在着重叠,则由预定义的模型或者函数(例如,特定权重的聚合函数)来组合重叠部分的可信度。可以执行多个步骤,直到从用户获得高可信度的结果或者高可信度的组合结果为止。在这种情况中,重叠可以包括系统响应与用户话语之间的重复单词。
图4是根据实施例的对话策略部件的功能部件的框图。如图4所示,对话策略部件包括形成相关问题的问题形成模块404、判决形成部件406以及重新评分/识别部件408。通常,相关问题影响着语音识别器的语言模型部分。语言模块对搜索进行约束。该模型的改变将对随后问题产生不同结果。这引入了该系统的动态自适应度。
对话策略部件使用在对语音识别的名称候选进行约束和修改中包括的语境信息。用澄清对话来锚定话语的可信部分能够使用数据内部中的语义关系来缩小识别的名称类型。
在一个实施例中,对话系统中的计算机实现的方法包括:接收包括专有名称的用户话语;识别用户话语中的专有名称;确定针对所识别的专有名称的第一可信分数;如果第一可信分数低于定义的阈值,则生成包括与专有名称相关的间接确认问题的第一机器响应用户话语,其中,该第一机器响应不对专有名称进行重复;接收针对间接确认问题的用户响应;以及基于用户响应来修改第一可信分数以生成第二可信分数。在该方法中,专有名称可以包括描述人、场所或者事情的任意词性(part of speech)。用户话语可以包括输入到对话系统的语音识别阶段的查询,其中该方法还包括:从用户话语分析专有名称;生成一个或多个假设以识别多个候选名称,其中,每个候选名称潜在地对应于说出的专有名称;以及从所述多个候选名称中选择最佳专有名称。在一个实施例中,最佳候选名称是具有最接近于所述定义的阈值的第一可信分数的名称。
该实施例的方法还可以包括:定义与说出的专有名称相关联的一个或多个特征;以及通过在第一机器响应中包括一个或多个特征中的至少一个特征,形成间接确认问题。间接确认问题可以基于n-最佳列表形成。该方法还可以包括:如果第二可信分数低于定义的阈值,则生成包括与专有名称相关的附加间接确认问题的第二机器响应用户话语,其中,第二机器响应不对专有名称进行重复。该方法还可以包括:通过在第二机器响应中包括来自所述第一机器响应的所述一个或多个特征中的至少一个附加特征,形成附加间接确认问题。
在一个实施例中,该方法还可以包括:如果第一可信分数高于定义的阈值,则继续常规的对话响应过程。可替换地,该方法还可以包括:如果第二可信分数高于定义的阈值,则继续常规的对话响应过程。
本文的实施例包括对话系统,该对话系统包括:语音识别单元,用于接收包括专有名称的用户话语;识别器单元,用于识别用户话语中的专有名称;评分单元,用于确定针对所识别的专有名称的第一可信分数;以及问题形成单元,用于如果第一可信分数低于定义的阈值,则生成包括与专有名称相关的间接确认问题的第一机器响应用户话语,其中,该第一机器响应并不对专有名称进行重复,其中,语音识别器单元接收对间接确认问题的用户响应;以及评分单元,用于基于用户响应来修改第一可信分数以生成第二可信分数。在该系统中,专有名称可以包括描述人、场所或者事情的任意词性。该系统还可以包括:分析器,用于从用户话语分析专有名称;以及判决形成单元,用于生成一个或多个假设以识别多个候选名称,其中,每个候选名称潜在地对应于说出的专有名称,并用于从所述多个候选名称中选择最佳专有名称。最佳候选名称可以是具有最接近于所述定义的阈值的第一可信分数的名称。在该系统中,问题形成单元定义与说出的专有名称相关联的一个或多个特征;以及通过在第一机器响应中包括所述一个或多个特征中的至少一个特征,形成间接确认问题。间接确认问题可以基于n-最佳列表形成。
在一个实施例中,如果第二可信分数低于定义的阈值,则该系统生成包括与专有名称相关的附加间接确认问题的第二机器响应用户话语,其中,第二机器响应不对专有名称进行重复。问题形成单元还可以通过在第二机器响应中包括来自第一机器响应的所述一个或多个特征中的至少一个附加特征,形成附加间接确认问题。
本文描述的名称识别过程的各个方面可以被实施为被编程到各种电路中的任何电路中的功能,其中,各种电路包括可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、可编程逻辑阵列(PAL)器件、电可编程逻辑和存储器器件和基于标准单元的器件以及专用集成电路。用于实施各个方面的一些其他可能的设备包括:具有存储器(诸如EEPROM)的微控制器、嵌入式微处理器、固件、软件等。此外,用于服务所述方法的内容的各个方面可以在微处理器中得到体现,该微处理器具有基于软件的电路仿真、离散逻辑(时序和组合逻辑)、定制器件、模糊(神经)逻辑、量子器件以及上述器件类型的任意混合。底层器件技术可以以各种部件类型来提供,例如,金属-氧化物-半导体场效应晶体管(MOSFET)技术(类似于互补金属-氧化物半导体(CMOS))、双极技术(类似于射极耦合逻辑(ECL))、聚合物技术(例如,硅共轭聚合物以及金属共轭聚合物-金属结构)、模数混合等。
应当指出的是,就其行为、寄存器传送、逻辑部件和/或其他特征而言,本文公开的各种功能可以使用任意数量硬件、固件的组合来被描述、和/或被描述为各种机器可读或计算机可读介质中实现的数据和/或指令。其中这种格式化的数据和/或指令可以被体现的计算机可读介质可以包括但不局限于:各种形式的非易失性存储器介质(例如,光、磁或者半导体存储器介质)以及可以用于通过无线、光或者有线信号介质或其组合来传送这种格式化的数据和/或指令的载波。通过载波来传送这种格式化的数据和/或指令的示例包括但不局限于:经由一个或多个数据传输协议(例如,HTTP、FTP、SMTP等)通过因特网和/或其他计算机网络来进行传送(上传、下载、电邮等)。
除非上下文中明确要求,否则在整个说明书和权利要求书中,措辞“包括(comprise)”、“包括(comprising)”等被解释为包括的意思,其与排它的意思和穷举的意思不同;也就是说,“包括但不局限于”的意思。使用单数或者复数的措辞也分别包括复数或者单数。另外,措辞“这里”、“在下文”、“上述”、“下面”以及类似意义的措辞指的是作为整体的本申请,而非指代本申请的任何特定部分。当措辞“或”用于引用两个或多个项目的列表时,那个措辞覆盖该措辞的下述所有解释:该列表中的任意项目、该列表中的所有项目以及该列表中的项目的任意组合。
上面对所示的响应生成过程的实施例的描述并不意欲是穷举的或者意欲实施例受到公开的精确形式或者指令的限制。虽然本文出于说明的目的描述了针对计算设备中的过程的具体实施例以及示例,但是如本领域技术人员将意识到的,各种等价修改能够位于所公开方法和结构的范围内。可以将上面描述的各种实施例的元素和动作进行组合来提供进一步的实施例。根据上面的详细描述,能够做出针对响应生成过程的这些以及其他改变。
通常,在下面的权利要求书中,使用的术语不应当被解释为公开的方法受到该说明书中公开的具体实施例的限制,而是应当被解释为包括根据所述权利要求进行操作的所有操作或者过程。因此,公开的结构和方法不受本公开的限制,相反地,所引用方法的范围完全由权利要求书来确定。
虽然以下文某种权利要求形式呈现了所公开系统和方法的特定方面,但是发明人设想其能涵盖以任意数量的权利要求形式的方法的各个方面。例如,虽然仅引用了一个方面来说明其可以体现在机器可读介质中,但是其他方面也可以体现在机器可读介质中。因此,发明人保留以下权利:在提交本申请之后添加其他权利要求,以为其他方面实现这种附加权利要求的形式。

Claims (18)

1.一种对话系统中的计算机实现的方法,包括:
接收包括专有名称的用户话语;
识别所述用户话语中的所述专有名称;
确定针对所识别的专有名称的第一可信分数;
如果所述第一可信分数低于定义的阈值,则生成第一机器响应用户话语,其包括与所述专有名称相关的间接确认问题,其中,所述第一机器响应不对所述专有名称进行重复;
接收对所述间接确认问题的用户响应;以及
基于所述用户响应来修改所述第一可信分数以生成第二可信分数。
2.根据权利要求1所述的方法,其中,所述专有名称包括描述人、场所或者事情的任意词性。
3.根据权利要求1所述的方法,其中,所述用户话语包括输入到所述对话系统的语音识别阶段的查询,该方法还包括:
从所述用户话语分析所述专有名称;
生成一个或多个假设以识别多个候选名称,其中,每个候选名称潜在地对应于说出的专有名称;以及
从所述多个候选名称中选择最佳专有名称。
4.根据权利要求2所述的方法,其中,最佳候选名称是具有最接近于所述定义的阈值的所述第一可信分数的名称。
5.根据权利要求1所述的方法,该方法还包括:
定义与说出的专有名称相关联的一个或多个特征;以及
通过在所述第一机器响应中包括所述一个或多个特征中的至少一个特征,形成所述间接确认问题。
6.根据权利要求5所述的方法,其中,所述间接确认问题基于n-最佳列表形成。
7.根据权利要求5所述的方法,还包括:如果所述第二可信分数低于所述定义的阈值,则生成第二机器响应用户话语,其包括与所述专有名称相关的附加间接确认问题,其中,所述第二机器响应不对所述专有名称进行重复。
8.根据权利要求7所述的方法,还包括:通过在所述第二机器响应中包括来自所述第一机器响应的所述一个或多个特征中的至少一个附加特征,形成所述附加间接确认问题。
9.根据权利要求1所述的方法,还包括:如果所述第一可信分数高于所述定义的阈值,则继续常规的对话响应过程。
10.根据权利要求1所述的方法,还包括:如果所述第二可信分数高于所述定义的阈值,则继续常规的对话响应过程。
11.一种对话系统,包括:
语音识别单元,用于接收包括专有名称的用户话语;
识别器单元,用于识别所述用户话语中的所述专有名称;
评分单元,用于确定针对所识别的专有名称的第一可信分数;以及
问题形成单元,用于如果所述第一可信分数低于定义的阈值,则生成包括与所述专有名称相关的间接确认问题的第一机器响应用户话语,其中,所述第一机器响应不对所述专有名称进行重复,其中,所述语音识别器单元接收对所述间接确认问题的用户响应,并且所述评分单元基于所述用户响应来修改所述第一可信分数以生成第二可信分数。
12.根据权利要求11所述的系统,其中,所述专有名称包括描述人、场所或者事情的任意词性。
13.根据权利要求11所述的系统,还包括:
分析器,用于从所述用户话语分析所述专有名称;以及
判决形成单元,用于生成一个或多个假设以识别多个候选名称,其中,每个候选名称潜在地对应于说出的专有名称,并且从所述多个候选名称中选择最佳专有名称。
14.根据权利要求12所述的系统,其中,最佳候选名称是具有最接近于所述定义的阈值的所述第一可信分数的名称。
15.根据权利要求11所述的系统,其中,所述问题形成单元定义与说出的专有名称相关联的一个或多个特征;以及,通过在所述第一机器响应中包括所述一个或多个特征中的至少一个特征,形成所述间接确认问题。
16.根据权利要求15所述的系统,其中,所述间接确认问题基于n-最佳列表形成。
17.根据权利要求15所述的系统,其中,如果所述第二可信分数低于所述定义的阈值,则该系统生成包括与所述专有名称相关的附加间接确认问题的第二机器响应用户话语,其中,所述第二机器响应不对所述专有名称进行重复。
18.根据权利要求17所述的系统,其中,所述问题形成单元还通过在所述第二机器响应中包括来自所述第一机器响应的所述一个或多个特征中的至少一个附加特征,形成所述附加间接确认问题。
CN200980154741.2A 2008-11-19 2009-11-13 用于识别对话系统中的专有名称的系统和方法 Active CN102282609B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/274,267 US8108214B2 (en) 2008-11-19 2008-11-19 System and method for recognizing proper names in dialog systems
US12/274,267 2008-11-19
PCT/US2009/064414 WO2010059525A1 (en) 2008-11-19 2009-11-13 System and method for recognizing proper names in dialog systems

Publications (2)

Publication Number Publication Date
CN102282609A true CN102282609A (zh) 2011-12-14
CN102282609B CN102282609B (zh) 2015-05-20

Family

ID=41557545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980154741.2A Active CN102282609B (zh) 2008-11-19 2009-11-13 用于识别对话系统中的专有名称的系统和方法

Country Status (4)

Country Link
US (2) US8108214B2 (zh)
EP (1) EP2359364B1 (zh)
CN (1) CN102282609B (zh)
WO (1) WO2010059525A1 (zh)

Cited By (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103677729A (zh) * 2013-12-18 2014-03-26 北京搜狗科技发展有限公司 一种语音输入方法和系统
CN104871240A (zh) * 2012-12-28 2015-08-26 索尼公司 信息处理设备、信息处理方法、以及程序
CN105027197A (zh) * 2013-03-15 2015-11-04 苹果公司 训练至少部分语音命令系统
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
CN109901810A (zh) * 2019-02-01 2019-06-18 广州三星通信技术研究有限公司 一种用于智能终端设备的人机交互方法及装置
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10681212B2 (en) 2015-06-05 2020-06-09 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
CN115402887A (zh) * 2021-05-28 2022-11-29 奥的斯电梯公司 乘客接口中的声音识别置信水平的使用
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
WO2011126715A2 (en) * 2010-03-30 2011-10-13 Nvoq Incorporated Hierarchical quick note to allow dictated code phrases to be transcribed to standard clauses
JP2011253374A (ja) * 2010-06-02 2011-12-15 Sony Corp 情報処理装置、および情報処理方法、並びにプログラム
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US20130317805A1 (en) * 2012-05-24 2013-11-28 Google Inc. Systems and methods for detecting real names in different languages
US9123338B1 (en) 2012-06-01 2015-09-01 Google Inc. Background audio identification for speech disambiguation
US9679568B1 (en) * 2012-06-01 2017-06-13 Google Inc. Training a dialog system using user feedback
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
CN103514165A (zh) * 2012-06-15 2014-01-15 佳能株式会社 用于识别对话中所提及的人的方法和装置
KR102081925B1 (ko) * 2012-08-29 2020-02-26 엘지전자 주식회사 디스플레이 디바이스 및 스피치 검색 방법
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US20170293610A1 (en) * 2013-03-15 2017-10-12 Bao Tran Voice assistant
US9449599B2 (en) 2013-05-30 2016-09-20 Promptu Systems Corporation Systems and methods for adaptive proper name entity recognition and understanding
US9818401B2 (en) 2013-05-30 2017-11-14 Promptu Systems Corporation Systems and methods for adaptive proper name entity recognition and understanding
US10170114B2 (en) 2013-05-30 2019-01-01 Promptu Systems Corporation Systems and methods for adaptive proper name entity recognition and understanding
EP3005152B1 (en) * 2013-05-30 2024-03-27 Promptu Systems Corporation Systems and methods for adaptive proper name entity recognition and understanding
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US10043185B2 (en) 2014-05-29 2018-08-07 Apple Inc. User interface for payments
US9786276B2 (en) * 2014-08-25 2017-10-10 Honeywell International Inc. Speech enabled management system
WO2016036552A1 (en) 2014-09-02 2016-03-10 Apple Inc. User interactions for a mapping application
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9574896B2 (en) 2015-02-13 2017-02-21 Apple Inc. Navigation user interface
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US20160358133A1 (en) 2015-06-05 2016-12-08 Apple Inc. User interface for loyalty accounts and private label accounts for a wearable device
US9940637B2 (en) 2015-06-05 2018-04-10 Apple Inc. User interface for loyalty accounts and private label accounts
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
CN105161097A (zh) * 2015-07-23 2015-12-16 百度在线网络技术(北京)有限公司 语音交互方法及装置
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
KR102450853B1 (ko) 2015-11-30 2022-10-04 삼성전자주식회사 음성 인식 장치 및 방법
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP6696803B2 (ja) * 2016-03-15 2020-05-20 本田技研工業株式会社 音声処理装置および音声処理方法
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10621581B2 (en) 2016-06-11 2020-04-14 Apple Inc. User interface for transactions
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US11068519B2 (en) 2016-07-29 2021-07-20 Microsoft Technology Licensing, Llc Conversation oriented machine-user interaction
WO2018053502A1 (en) * 2016-09-19 2018-03-22 Promptu Systems Corporation Systems and methods for adaptive proper name entity recognition and understanding
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US11715042B1 (en) 2018-04-20 2023-08-01 Meta Platforms Technologies, Llc Interpretability of deep reinforcement learning models in assistant systems
US11010436B1 (en) 2018-04-20 2021-05-18 Facebook, Inc. Engaging users by personalized composing-content recommendation
US11307880B2 (en) 2018-04-20 2022-04-19 Meta Platforms, Inc. Assisting users with personalized and contextual communication content
US11676220B2 (en) 2018-04-20 2023-06-13 Meta Platforms, Inc. Processing multimodal user input for assistant systems
US11886473B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Intent identification for agent matching by assistant systems
US11170170B2 (en) 2019-05-28 2021-11-09 Fresh Consulting, Inc System and method for phonetic hashing and named entity linking from output of speech recognition
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1842842A (zh) * 2003-08-29 2006-10-04 松下电器产业株式会社 一种根据辅助信息提高语音识别的方法和设备
CN101046957A (zh) * 2006-03-30 2007-10-03 富士通株式会社 语音识别装置、语音识别方法及存储语音识别程序的记录介质
US20080010058A1 (en) * 2006-07-07 2008-01-10 Robert Bosch Corporation Method and apparatus for recognizing large list of proper names in spoken dialog systems

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421672B1 (en) 1999-07-27 2002-07-16 Verizon Services Corp. Apparatus for and method of disambiguation of directory listing searches utilizing multiple selectable secondary search keys
US20030233230A1 (en) * 2002-06-12 2003-12-18 Lucent Technologies Inc. System and method for representing and resolving ambiguity in spoken dialogue systems
US7574356B2 (en) * 2004-07-19 2009-08-11 At&T Intellectual Property Ii, L.P. System and method for spelling recognition using speech and non-speech input
DE102005018174A1 (de) 2005-04-19 2006-11-02 Daimlerchrysler Ag Verfahren zur gezielten Ermittlung eines vollständigen Eingabedatensatzes in einem Sprachdialog 11
US7720684B2 (en) * 2005-04-29 2010-05-18 Nuance Communications, Inc. Method, apparatus, and computer program product for one-step correction of voice interaction
US7991615B2 (en) * 2007-12-07 2011-08-02 Microsoft Corporation Grapheme-to-phoneme conversion using acoustic data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1842842A (zh) * 2003-08-29 2006-10-04 松下电器产业株式会社 一种根据辅助信息提高语音识别的方法和设备
CN101046957A (zh) * 2006-03-30 2007-10-03 富士通株式会社 语音识别装置、语音识别方法及存储语音识别程序的记录介质
US20080010058A1 (en) * 2006-07-07 2008-01-10 Robert Bosch Corporation Method and apparatus for recognizing large list of proper names in spoken dialog systems

Cited By (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11100919B2 (en) 2012-12-28 2021-08-24 Saturn Licensing Llc Information processing device, information processing method, and program
US11676578B2 (en) 2012-12-28 2023-06-13 Saturn Licensing Llc Information processing device, information processing method, and program
CN104871240A (zh) * 2012-12-28 2015-08-26 索尼公司 信息处理设备、信息处理方法、以及程序
US10424291B2 (en) 2012-12-28 2019-09-24 Saturn Licensing Llc Information processing device, information processing method, and program
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
CN105027197B (zh) * 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
CN105027197A (zh) * 2013-03-15 2015-11-04 苹果公司 训练至少部分语音命令系统
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
CN103677729A (zh) * 2013-12-18 2014-03-26 北京搜狗科技发展有限公司 一种语音输入方法和系统
CN103677729B (zh) * 2013-12-18 2017-02-08 北京搜狗科技发展有限公司 一种语音输入方法和系统
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US10714095B2 (en) 2014-05-30 2020-07-14 Apple Inc. Intelligent assistant for home automation
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US10681212B2 (en) 2015-06-05 2020-06-09 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10847142B2 (en) 2017-05-11 2020-11-24 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN109901810A (zh) * 2019-02-01 2019-06-18 广州三星通信技术研究有限公司 一种用于智能终端设备的人机交互方法及装置
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
CN115402887A (zh) * 2021-05-28 2022-11-29 奥的斯电梯公司 乘客接口中的声音识别置信水平的使用

Also Published As

Publication number Publication date
CN102282609B (zh) 2015-05-20
US8108214B2 (en) 2012-01-31
WO2010059525A1 (en) 2010-05-27
US20100125456A1 (en) 2010-05-20
EP2359364B1 (en) 2018-01-10
US20120101823A1 (en) 2012-04-26
EP2359364A1 (en) 2011-08-24

Similar Documents

Publication Publication Date Title
CN102282609A (zh) 用于识别对话系统中的专有名称的系统和方法
US10319381B2 (en) Iteratively updating parameters for dialog states
US11270074B2 (en) Information processing apparatus, information processing system, and information processing method, and program
JP6448723B2 (ja) 対話システム、対話方法、および対話システムを適合させる方法
US10446148B2 (en) Dialogue system, a dialogue method and a method of adapting a dialogue system
EP3510484B1 (en) Ambiguity resolving conversational understanding system
CN111460111B (zh) 评估自动对话服务的重新训练推荐
US9583102B2 (en) Method of controlling interactive system, method of controlling server, server, and interactive device
US8868409B1 (en) Evaluating transcriptions with a semantic parser
CN1984190B (zh) 用于组织和优化对话系统中内容的方法和装置
TWI321313B (en) Apparatus and method to reduce recognization errors through context relations among dialogue turns
CN112632961B (zh) 基于上下文推理的自然语言理解处理方法、装置以及设备
US7228275B1 (en) Speech recognition system having multiple speech recognizers
US20080010058A1 (en) Method and apparatus for recognizing large list of proper names in spoken dialog systems
US20060271364A1 (en) Dialogue management using scripts and combined confidence scores
US20040260543A1 (en) Pattern cross-matching
CN105575386A (zh) 语音识别方法和装置
WO2021000403A1 (zh) 智能对话系统的语音匹配方法、电子装置、计算机设备
CN105529030A (zh) 语音识别处理方法和装置
US20230047811A1 (en) Spoken language understanding system
CN109741734A (zh) 一种语音评测方法、装置和可读介质
van den Bosch et al. Detecting problematic turns in human-machine interactions: Rule-induction versus memory-based learning approaches
CN113407699A (zh) 对话方法、装置、设备和存储介质
CN110928991A (zh) 一种问答知识库的更新方法及其装置
Filisko Developing attribute acquisition strategies in spoken dialogue systems via user simulation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant