CN109313667A - 构建特定于状态的多轮上下文语言理解系统的系统和方法 - Google Patents
构建特定于状态的多轮上下文语言理解系统的系统和方法 Download PDFInfo
- Publication number
- CN109313667A CN109313667A CN201780037738.7A CN201780037738A CN109313667A CN 109313667 A CN109313667 A CN 109313667A CN 201780037738 A CN201780037738 A CN 201780037738A CN 109313667 A CN109313667 A CN 109313667A
- Authority
- CN
- China
- Prior art keywords
- dialogue state
- dialogue
- single slot
- specific
- language understanding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title abstract description 65
- 230000001419 dependent effect Effects 0.000 claims description 85
- 238000010801 machine learning Methods 0.000 claims description 46
- 230000004044 response Effects 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 abstract description 10
- 238000010276 construction Methods 0.000 description 80
- 238000003860 storage Methods 0.000 description 34
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stored Programmes (AREA)
- Machine Translation (AREA)
- Facsimiles In General (AREA)
Abstract
提供了用于构建特定于对话状态的多轮上下文语言理解系统的系统和方法。更具体地,这样的系统和方法从形成的单槽语言理解模型和/或单槽规则集推断或被配置为从形成的单槽语言理解模型和/或单槽规则集推断特定于状态的模式和/或特定于状态的规则。由此,系统和方法仅需要来自构建方的、对形成单槽语言理解模型和/或单槽规则集必要的信息,来形成或构建特定于对话状态的多轮上下文语言理解系统。相应地,与需要来自构建方的、比构建单槽语言理解系统所必要的进一步输入的系统和方法相比,用于构建特定于对话状态的多轮上下文语言理解系统的系统和方法减少了构建针对应用的特定于对话状态的多轮上下文语言理解系统必要的专家知识、时间和资源。
Description
背景技术
语言理解系统、个人数字助理、代理和人工智能、以及人工智能正改变用户与计算机交互的方式。计算机、网页服务和/或应用的开发者一直在尝试改进人与计算机之间的交互。然而,构建这种系统需要大量的专家知识、时间、金钱和其他资源。
针对上述以及其他一般考虑,实现了本文公开的各方面。此外,尽管可能讨论了相对具体的问题,但应理解,这些方面不应被限制为解决在背景技术中或本公开的其他位置处标识的具体问题。
发明内容
在发明内容中,本公开总体涉及用于构建特定于状态的多轮上下文语言理解系统的系统和方法。更具体地,本文公开的系统和方法从单槽语言理解系统推断或被配置为从单槽语言理解系统推断特定于状态的解码配置,诸如依赖于对话状态的语义模式和/或依赖于对话状态的规则。由此,本文公开的系统和方法仅需要来自构建方或要构建特定于对话状态的多轮上下文语言理解系统的作者的、对形成单槽语言理解模型或单槽规则所必要的信息。相应地,与不推断或者不提供能力来推断特定于状态的模式和/或特定于状态的规则的系统和方法相比,本文公开的用于构建特定于状态的多轮上下文语言理解系统的系统和方法可以减少构建针对应用的特定于状态的多轮上下文语言理解系统所必要的专家知识、时间和资源。
本公开的一个方面涉及一种具有平台的系统,该平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统。该系统包括至少一个处理器和存储器。存储器编码计算机可执行指令,计算机可执行指令在由至少一个处理器执行时,可操作为:
从构建方接收信息以用于构建单槽语言理解模型;
基于信息来配置单槽语言理解模型;
基于依赖于对话状态的语义模式,约束单槽语言理解模型的解码,以仅输出针对所确定的每个对话状态的、特定于对话状态的槽和特定于对话状态的实体;以及
实现受约束的单槽语言理解模型,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的另一方面涉及一种具有平台的系统,该平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统。该系统包括至少一个处理器和存储器。存储器编码计算机可执行指令,计算机可执行指令在由至少一个处理器执行时,可操作为:
从构建方接收信息,以用于创建单槽规则;
基于信息来形成单槽规则;
基于单槽规则,推断针对不同对话状态的依赖于对话状态的语义模式;
基于单槽规则和依赖于对话状态的语义模式,导出针对不同对话状态的依赖于对话状态的规则;以及
实现依赖于对话状态的规则,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的另一方面涉及一种具有平台的系统,平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统。该系统包括至少一个处理器和存储器。存储器编码计算机可执行指令,计算机可执行指令在由至少一个处理器执行时,可操作为:
从构建方接收信息,以用于创建单槽规则;
基于信息来形成单槽规则;
提供推断针对不同对话状态的依赖于对话状态的语义模式的能力,以形成第一提供能力,该能力基于单槽规则并且基于在解码期间来自与用户的对话的用户输入;
提供导出依赖于对话状态的规则的能力,以形成第二提供能力,该能力基于依赖于对话状态的语义模式、单槽规则以及在解码期间来自与用户的对话的用户输入;以及
实现单槽规则、第一提供能力和第二提供能力,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的另一方面涉及一种具有平台的系统,该平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统。该系统包括至少一个处理器和存储器。存储器编码计算机可执行指令,计算机可执行指令在由至少一个处理器执行时,可操作为:
从构建方接收信息,以用于基于单槽规则与机器学习到的单槽模型的组合来创建组合单槽语言理解系统;
基于信息来形成组合单槽语言理解系统,其中组合单槽语言理解系统包括单槽规则和机器学习到的单槽语言理解模型;
针对依赖于对话状态的解码,调整组合单槽语言理解系统,以形成经调整的组合单槽语言理解模型;以及
实现经调整的组合单槽语言理解模型,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的又一方面包括一种用于针对应用的特定于对话状态的多轮上下文语言理解系统的方法。该方法包括:
从构建方接收信息以用于构建单槽语言理解模型;
基于信息来配置单槽语言理解模型;
基于依赖于对话状态的语义模式,约束单槽语言理解模型的解码,以仅输出针对所确定的每个对话状态的、特定于对话状态的槽和特定于对话状态的实体;以及
实现受约束的单槽语言理解模型,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的又一方面包括一种用于针对应用的特定于对话状态的多轮上下文语言理解系统的方法。该方法包括:
从构建方接收信息以用于创建单槽规则;
基于信息来形成单槽规则;
基于单槽规则来推断针对不同对话状态的依赖于对话状态的语义模式;
基于单槽规则和依赖于对话状态的语义模式,导出针对不同对话状态的依赖于对话状态的规则;以及
实现依赖于对话状态的规则,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的进一步的方面包括一种用于针对应用的特定于对话状态的多轮上下文语言理解系统的方法。该方法包括:
从构建方接收信息以用于创建单槽规则;
基于信息来形成单槽规则;
提供推断针对不同对话状态的依赖于对话状态的语义模式的能力,以形成第一提供能力,该能力基于单槽规则并且基于在解码期间来自与用户的对话的用户输入;
提供导出依赖于对话状态的规则的能力,以形成第二提供能力,该能力基于依赖于对话状态的语义模式、单槽规则以及在解码期间来自与用户的对话的用户输入;以及
实现单槽规则、第一提供能力和第二提供能力,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的附加的方面包括一种用于针对应用的特定于对话状态的多轮上下文语言理解系统的方法。该方法包括:
从构建方接收信息,以用于基于单槽规则与机器学习到的单槽模型的组合来创建组合单槽语言理解系统;
基于信息来形成组合单槽语言理解系统,其中组合单槽语言理解系统包括单槽规则和机器学习到的单槽语言理解模型;
针对依赖于对话状态的解码,调整组合单槽语言理解系统,以形成经调整的组合单槽语言理解模型;以及
实现经调整的组合单槽语言理解模型,以形成特定于对话状态的多轮上下文语言理解系统。
提供本发明内容,以简化形式引入一系列概念,这些概念在下文的具体实施方式中进一步被描述。本发明内容无意标识所要求保护主题的关键特征或必要特征,也无意用于限制所要求保护主题的范围。
附图说明
参考以下附图来描述非限制和非穷举的实施例。
图1A是图示了根据本公开的多个方面的经由客户端计算设备、由构建方利用的对话构建平台的示意图。
图1B是图示了根据本公开的多个方面的经由客户端计算设备、由构建方使用的对话构建平台的示意图。
图2A是图示了根据本公开的多个方面的经由对话构建平台而被构建的机器学习到的特定于状态的上下文语言理解系统的简化框图。
图2B是图示了根据本公开的多个方面的经由对话构建平台而被构建的基于规则的、特定于状态的上下文语言理解系统的简化框图。
图2C是图示了根据本公开的多个方面的经由对话构建平台而被构建的组合的、特定于状态的上下文语言理解系统的简化框图。
图3是图示了根据本公开的多个方面的用于构建特定于状态的上下文语言理解系统的方法的流程图。
图4A是图示了根据本公开的多个方面的由对话构建平台提供的用户界面的示意图。
图4B是图示了根据本公开的多个方面的由对话构建平台提供的用户界面的示意图。
图5是图示了本公开的各种方面可以利用其来实践的计算设备的示例物理组件的框图。
图6A是本公开的各种方面可以利用其来实践的移动计算设备的简化框图。
图6B是本公开的各种方面可以利用其来实践的在图10A中示出的移动计算设备的简化框图。
图7是本公开的各种方面可以被实践在其中的分布式计算系统的简化框图。
图8图示了本公开的各种方面可以利用其来实践的平板计算设备。
具体实施方式
在以下具体实施方式中参考了附图,这些附图形成具体实施方式的一部分并且在其中以图示具体方面或示例的方式被示出。可以组合这些方面、可以利用其他方面、并且可以做出结构改变而不脱离本公开的精神或范围。因此,以下具体实施方式不应被视为具有限制性意义,并且本公开的范围由权利要求和其等同物定义。
机器学习、语言理解和人工智能的进步正在改变用户与计算机交互的方式。数字助理应用,诸如Siri、Google Now以及微软小娜(Cortana)是人机交互转变的示例。
普遍预计下一波计算将围绕会话即平台(conversation as a platform,CaaP)。作为CaaP的实例,用于构建针对应用和服务的会话代理的机器人平台已出现。机器人主要针对消息工作流,诸如messenger、webchat和skype,其主要形式的交互是通过文本(打字),即使触摸和语音也可以被用作附加的模态,诸如语音识别。用户可以通过多轮对话与机器人进行交互。然而,仅当第三方应用和服务可以容易地构建机器人来服务客户时,CaaP才会成为现实。这将扩展到成千上万的应用和服务。
然而,由于多轮对话的复杂性,构建多轮对话系统已经成为一项困难的任务。近期部署了实现针对单轮体验的自然语言体验的第三方创建(例如,利用人工智能、语言理解智能服务、以及api.ia)的各种平台。然而,由于构建多轮对话平台需要大量的时间和资源来考虑针对任何给定任务的指数级的不同场景,先前部署的这些平台受限于单轮体验。
例如,考虑提供西雅图与各种目的地(例如,布雷默顿、班布里奇群岛等)之间的渡轮时刻表的一个简单代理或机器人。在该示例中,在以下列出了期望代理/机器人处理的一些样本对话:
场景#1
[用户轮1]:我想知道渡轮时刻表。
[机器人轮1]:好的,我可以为您提供西雅图与各种目的地之间的时刻表,您想去哪里?
[用户轮2]:我想从西雅图去布雷默顿。
[机器人轮2]:您想要哪个日期的?
[用户轮3]:明天。
[机器人轮3]:这是从8:00am开始的渡轮……
场景#2
[用户轮1]:我想知道渡轮时刻表;
[机器人轮1]:好的,我可以为您提供西雅图与各种目的地之间的时刻表,您想去哪里?
[用户轮2]:西雅图。
[机器人轮2]:您想从哪里出发?
[用户轮3]:布雷默顿。
存在可以被添加的更多场景。这里的挑战是如何构建将标记“前往位置”和“来自位置”的语言理解模型(或规则)。在场景#1中,用户话语(用户轮1、用户轮2和用户轮3)向多轮对话系统提供了足够的消息,以供模型提取“去往位置”(布雷默顿)以及提取“来自位置”(西雅图),但在场景#2中,用户话语(用户轮1、用户轮2和用户轮3)未向多轮对话系统提供足够信息供模型提取“去往位置”和“来自位置”。在场景#2中,对话系统不得不同样使用系统或机器人响应(机器人轮1和机器人轮2),以正确地在“去往位置”标记西雅图,并且将布雷默顿标记为“来自位置”。然而,即使多轮对话系统利用了机器人响应,多轮对话系统的开发者或构建方也必须构建潜在的n!个语言理解模型或规则集(其中n是应用所需的槽/实体的数目)。另外,多轮对话系统的开发者或构建方必须构建针对每个不同且可能的对话状态的潜在的n!个语言理解模型或规则集。由此,构建多轮对话系统所必要的复杂性和资源对于更广泛采用会话界面而言是一个瓶颈。相应地,绝大多数开发者受限于单轮对话系统。在不存在精确的多轮对话系统的情况下,应用与客户端之间的对话可能会失败,因为系统无法正确解释用户查询。因而,对话系统的构建方仍然必须具有大量领域专家知识、知识、时间和资源,以利用这些先前的系统和方法来建立功能性多轮对话系统。当前没有简单或可缩放的方式来创建或构建多轮对话系统。
本文公开的系统和方法涉及对话构建平台,用于构建特定于对话状态的多轮上下文语言理解(LU)系统,同时仅需要构建方输入用于建立单槽语言理解(LU)系统所必要的信息。该系统可以是基于规则的或者机器学习到的系统。更具体地,本文公开的系统和方法推断/导出、或者被配置为推断/导出特定于状态的解码配置,诸如依赖于对话状态的语义模式和/或依赖于对话状态的规则。相应地,本文公开的系统和方法允许第三方开发者构建用于数字代理、机器人、消息应用、话音代理或者任何其他应用类型的、特定于对话状态的多轮上下文LU系统,而不需要大量的领域专家知识、时间以及其他资源。
本文描述的系统和方法的能力将提供对话构建平台,用于建立特定于对话状态的多轮上下文LU系统,除形成单槽LU模型和/或单槽规则所必要的输入之外,不需要来自构建方的任何进一步输入,为构建多轮对话系统提供了易于使用和高效的服务。
图1A和图1B图示了根据本公开的多个方面的经由客户端计算设备104、由构建方102(或对话构建平台100的用户102)使用的对话构建平台100的不同示例。对话构建平台100是允许构建方102(或对话构建平台100的用户102)开发、构建、或者创建特定于对话状态的多轮上下文LU系统108,同时仅必须提供构建单槽语言理解LU系统所必要的信息106。单槽LU系统利用单槽LU模型和/或单槽规则集。单槽LU系统要求用户提供用于在与单槽LU系统的对话或会话的一个轮中执行期望任务所必要的所有参数、槽和/或实体。相反,特定于对话状态的多轮上下文LU系统108可以通过与用户的会话中的任何数目的轮,来收集用于执行期望任务所必要的参数、槽和/或实体。
在一些方面中,如图1A所图示的,对话构建平台100被实现在客户端计算设备104上。在基本配置中,客户端计算设备104是具有输入元件和输出元件两者的计算机。客户端计算设备104可以是用于实现对话构建平台100的任何合适的计算设备。例如,客户端计算设备104可以是移动电话、智能电话、平板电脑、平板手机、智能手表、可穿戴计算机、个人计算机、游戏系统、台式计算机、膝上型计算机等。该列表仅是示例性的,并且不应被视为限制性的。可以利用用于实现对话构建平台100的任何合适的客户端计算设备104。
在其他方面中,如图1B所图示的,对话构建平台100被实现在服务器计算设备105上。服务器计算设备105可以通过网络113向客户端计算设备104提供数据,和/或从客户端计算设备104接收数据。在一些方面中,网络113是分布式计算网络,诸如互联网。在进一步方面中,上述对话构建平台100被实现在多于一个的服务器计算设备105上,诸如多个服务器计算设备105或者服务器计算设备105的网络。在一些方面中,对话构建平台100是混合系统,该混合系统具有客户端计算设备104上的对话构建平台100的部分,以及具有在服务器计算设备105上的对话构建平台100的部分。.
对话构建平台100包括用户界面,该用户界面用于构建特定于对话状态的多轮上下文LU系统108。用户界面由对话构建平台100生成,并且经由客户端计算设备104被呈现给构建方102。对话构建平台100的用户界面允许构建方102选择、或者向对话构建平台100提供任务定义202和/或用于构建单槽LU模型的必要信息106。客户端计算设备104可以具有一个或多个输入设备,诸如键盘、鼠标、笔、麦克风或其他声音或话音输入设备、触摸或滑动输入设备等,以用于允许构建方102经由用户界面提供任务定义202和/或信息106。前述设备是示例,并且其他设备可以被使用。
图4A和图4B示出了在构建基于规则的、特定于对话状态的多轮上下文LU系统的构建过程中的不同阶段期间,用于对话构建平台100的示例用户界面400。相同或不同的界面400可以被提供用于由对话构建平台100构建机器学习到的、特定于对话状态的多轮上下文LU系统,或者构建组合的、特定于对话状态的多轮上下文LU系统。对话构建平台100可以提供用于构建特定于对话状态的多轮上下文LU系统108的任何合适的界面400。
图4A示出了在用于任务或对话创建的构建阶段的开始处,由对话构建平台100生成的用户界面400A。在该任务或对话创建界面400A中,构建方102已经选择了“对话”选项或按钮402,并且被请求对构建方102正在建立的对话进行命名404。在该示例中,构建方102输入名称404“足球时刻表”406。在该示例中,构建方102正在构建或创建用于取回MLS队时刻表的对话。在一些方面中,用户界面400A在“上次修改”标题405下提供已命名对话被修改的最后时间。在该示例中,“足球时刻表”406在“今天”407最后被修改。一旦新对话已经被命名,构建方102可以选择“建立对话”按钮或选项408来开始构建新对话。在进一步的方面中,用户界面400A提供仿真选项或按钮409(被示出为“运行测试”409),仿真选项或按钮409用于仿真如下特定于对话状态的多轮上下文LU系统108的性能,该特定于对话状态的多轮上下文LU系统108是基于利用对话构建平台100建立的当前约束和/或经调整的单槽LU模型而形成的。
图4B示出了用于规则创建的由对话构建平台100生成的用户界面400B。规则创建界面400B和/或模型创建界面在“建立对话”按钮408已经由构建方102选择之后被提供给构建方102。在该界面400B中,构建方102可以输入标记语句412。在该示例中,构建方102输入标记语句“获得时刻表”414。构建方102可以通过选择“添加新语句”按钮或选项428,来根据需要添加附加的标记语句。此外,在这个规则创建界面400B上,构建方102可以经由“添加规则”按钮或选项426来添加用于标记语句412的规则416,可以经由“编辑”按钮或选项422来编辑规则416,或者可以经由“删除”按钮或选项424来删除规则416。在该示例中,构建方102已经创建两个不同的规则,诸如“给我(MLS队)时刻表”418,以及“给我显示这个(微软.日期)的比赛”420。规则创建界面400B还可以在选择“规则格式示例”按钮或选项430时,提供一些规则格式化示例。
在一些方面中,构建方102经由计算设备104和被提供的用户界面400,向对话构建平台100提供任务定义202或者对话定义202。任务定义202可以包括执行期望任务所必要的任何数据、模块或系统。例如,任务定义202可以包括任务触发模块、验证模块、语言生成模块、以及最终动作模块。如本文所用的模块可以运行程序的一个或多个软件应用。换句话说,模块可以是程序的单独、可互换的组件,该程序包含一个或多个程序功能并且包含完成这些功能所必要的一切。在一些方面中,模块包括存储器和一个或多个处理器。
构建方102提供经由客户端计算设备104所呈现的用户界面400,向对话构建平台100提供构建单槽LU系统所必要的信息106。在一些方面中,信息106是基于所选择任务定义的任务。单槽LU系统可以是基于规则的单槽LU系统、机器学习到的单槽LU系统、或者组合单槽LU系统。信息106可以是构建机器学习到的单槽LU系统所必要的数据,和/或是构建基于规则的单槽LU系统所必要的数据。在备选方面中,构建方102提供必要的信息106,用以构建组合单槽LU系统。组合单槽LU系统利用基于规则的LU系统和机器学习到的LU系统两者来解码来自用户的对话。例如,信息106可以包括用于创建单槽LU系统所必要的任何参数、槽、实体、绑定或者映射等。尽管构建方102仅必须提供形成单槽LU系统所必要的信息,但构建方可以根据需要提供附加的信息。
对话构建平台100接收信息106。利用该信息,对话构建平台100形成或配置单槽LU系统。一旦单槽LU系统已经被形成或配置,对话构建平台100向单槽LU系统提供特定于状态的解码配置。特定于状态的解码配置根据单槽LU系统的类型而变化。单槽LU系统可以是机器学习到的LU系统、基于规则的LU系统、或者组合的机器学习和基于规则的LU系统。在一些方面中,对依赖于对话状态解码所必要的组件由对话构建平台100推断和/或导出。在备选方面中,由对话构建平台100提供推断和/或导出组件的能力。该能力可以被提供作为适于运行软件应用的程序模块。组件可以是依赖于对话状态的语义模式和/或依赖于对话状态的规则。
对话构建平台100利用具有特定于状态的解码配置的LU系统来形成特定于对话状态的多轮上下文LU系统108。对话构建平台100向构建方102提供特定于对话状态的多轮上下文LU系统108。然后,构建方102可以将特定于对话状态的多轮上下文LU系统108添加到任何期望的数字代理、机器人、消息应用、话音代理或者任何其他的应用类型。
在一些方面中,对话构建平台100被利用以形成如图2A中所图示的、机器学习到的特定于对话状态的多轮上下文LU系统200A。在这些方面中,构建方102可以向对话构建平台100提供任务定义202(或对话定义202)。在这些方面中,构建方102向对话构建平台100提供用于构建单槽的、机器学习到的模型所必要的信息106。对话构建平台100基于来自构建方102的信息106来形成或配置机器学习到的单槽LU模型204A。在这些方面中,对话构建平台100通过以下来配置用于依赖于对话状态解码的模型204A:基于依赖于对话状态的语义模式,约束机器学习到的单槽LU模型的解码206,以仅输出针对所确定的每个对话状态的、特定于对话状态的槽和特定于对话状态的实体,从而形成受约束的机器学习到的单槽模型。受约束的机器学习到的单槽模型被实现,以形成机器学习到的、特定于对话状态的多轮上下文LU系统200A。换句话说,当机器学习到的、特定于对话状态的多轮上下文LU系统200A被用户使用或者接收来自用户的用户输入时(诸如,话语),系统200A从单槽LU模型移除所提供的任何参数、槽和/或实体,并且然后利用受约束的单槽LU模型来响应。这个过程继续,直至用于执行任务或对话的所有必要数据被用户提供给机器学习到的、特定于对话状态的多轮上下文LU系统200A。
在一些方面中,对话构建平台100基于机器学习到的单槽LU模型204A来推断针对不同对话状态的依赖于对话状态的语义模式。对话构建平台100在机器学习到的、特定于对话状态的多轮上下文LU系统200A的形成之前,推断依赖于对话状态的语义模式。
在备选方面中,对话构建平台100提供推断针对不同对话状态的依赖于对话状态的语义模式的能力,该能力基于机器学习到的单槽LU模型204A并且基于由系统200A在解码期间从与用户的对话接收到的用户输入。该能力可以被提供为适于运行软件应用的程序模块。换句话说,机器学习到的、特定于对话状态的多轮上下文LU系统200A被配置为在用户对话的解码期间动态推断依赖于对话状态的语义模式。
在一些方面中,对话构建平台100被利用来形成如图2B中所图示的基于规则的、特定于对话状态的多轮上下文LU系统200B。在这些方面中,构建方102可以向对话构建平台100提供任务定义202(或者对话定义202)。在这些方面中,构建方102向对话构建平台100提供用于构建单槽的、基于规则的系统204B所必要的信息106。对话构建平台100基于来自构建方的信息106来形成单槽规则集。在这些方面中,对话构建平台100通过以下来向系统204B提供特定于状态的解码配置:利用导出的依赖于对话状态的规则208和推断的依赖于对话状态的语义模式来标记针对所确定的对话状态的、特定于对话状态的槽和特定于对话状态的实体。解码配置系统由对话构建平台100实现,以形成基于规则的、特定于对话状态的多轮上下文LU系统200B。换句话说,当基于规则的、特定于对话状态的多轮上下文LU系统200B从用户接收用户输入时,系统200B仅标记针对所确定的对话状态的、特定于对话状态的槽和特定于对话状态的实体。这个过程继续,直至用于执行任务的所有必要数据被用户提供给基于规则的、特定于对话状态的多轮上下文LU系统200B。
在一些方面中,对话构建平台100根据基于规则的单槽LU系统204B的单槽规则,推断针对不同对话状态的依赖于对话状态的语义模式。在这些方面中,对话构建平台100在基于规则的、特定于对话状态的多轮上下文LU系统200B的形成之前,推断依赖于对话状态的语义模式。
在备选方面中,对话构建平台100提供推断针对不同对话状态的、依赖于对话状态的语义模式的能力,该能力根据基于规则的单槽LU系统204的单槽规则,并且基于由系统200B在解码期间从与用户的对话接收到的用户输入。该能力可以被提供作为适于运行软件应用的程序模块。换句话说,在这些方面中,基于规则的、特定于对话状态的多轮上下文LU系统200B在用户对话的解码期间动态推断依赖于对话状态的语义模式。
在一些方面中,对话构建平台100基于单槽规则和依赖于对话状态的语义模式,导出针对不同对话状态的依赖于对话状态的规则208。在这些方面中,对话构建平台100在基于规则的、特定于对话状态的多轮上下文LU系统200B的形成之前,推断依赖于对话状态的规则208。
在备选方面中,对话构建平台100提供推断或导出针对不同对话状态的依赖于对话状态的规则208的能力,该能力基于单槽规则、依赖于对话状态的语义模式、并且基于由系统200B在解码期间从与用户的对话接收到的用户输入。换句话说,基于规则的特定于对话状态的多轮上下文LU系统200B在用户对话的解码期间动态导出依赖于对话状态的规则208。该能力可以被提供作为适于运行软件应用的程序模块。
在一些方面中,对话构建平台100被利用来形成如图2C中所图示的组合的、特定于对话状态的多轮上下文LU系统200C。在这些方面中,构建方102可以向对话构建平台100提供任务定义202(或者对话定义202)。在这些方面中,构建方102向对话构建平台100提供用于构建机器学习到的单槽LU系统204A和基于规则的单槽LU系统204B所必要的信息106。对话构建平台100基于来自构建方102的信息106,形成基于规则的单槽LU系统204B和机器学习到的单槽LU系统204A。在这些方面中,对话构建平台100通过以下来针对依赖于对话状态的解码210调整系统204A&204B:
·基于所推断的依赖于对话状态的语义模式,约束机器学习到的单槽语言理解模型的解码206,以仅输出针对所确定的至少一个对话状态的、特定于对话状态的槽和特定于对话状态的实体,从而形成受约束的、机器学习到的单槽语言理解模型;以及
·通过利用导出的依赖于对话状态的规则208和推断的依赖于对话状态的语义模式来标记针对所确定的一个或多个对话状态的特定于对话状态的槽和特定于对话状态的实体,向系统204B提供特定于状态的解码配置,
从而形成经调整的组合单槽系统。对话构建平台100实现经调整的组合单槽系统来形成组合的、特定于对话状态的多轮上下文LU系统200C。
在一些方面中,对话构建平台100基于单槽语言理解模型和/或单槽规则来推断针对不同对话状态的、依赖于对话状态的语义模式。在一些方面中,对话构建平台100在组合的、特定于对话状态的多轮上下文LU系统200C的形成之前,推断依赖于对话状态的语义模式。
在备选方面中,对话构建平台100提供推断针对一个或多个对话状态的、依赖于对话状态的语义模式的能力,该能力基于单槽语言理解模型和/或单槽规则、并且基于由系统200C在解码期间从与用户的对话接收到的用户输入。换句话说,组合特定于对话状态的多轮上下文LU系统200C响应于来自用户的解码对话,动态推断依赖于对话状态的语义模式。该能力可以被提供作为适于运行软件应用的程序模块。
在一些方面中,对话构建平台100基于单槽规则和所推断的依赖于对话状态的语义模式,导出针对一个或多个对话状态的依赖于对话状态的规则208。在一些方面中,对话构建平台100在组合的、特定于对话状态的多轮上下文LU系统200C的形成之前,导出依赖于对话状态的规则208。
在备选方面中,对话构建平台100提供导出针对至少一个对话状态的、依赖于对话状态的规则208的能力,该能力基于单槽规则、依赖于对话状态的语义模式、并且基于由系统200C在解码期间从与用户的对话接收到的用户输入。换句话说,组合特定于对话状态的多轮上下文LU系统200C在用户对话的解码期间动态导出依赖于对话状态的规则208。该能力可以被提供作为适于运行软件应用的程序模块。
图3图示了流程图,该流程图从概念上图示了用于构建特定于对话状态的多轮上下文LU系统的方法300的示例。在一些方面中,方法300由如上文所述的构建平台100来执行。方法300提供一种用于构建特定于对话状态的多轮上下文LU系统的方法,该方法不需要构建方提供除用于构建单槽LU系统所必要的之外的任何进一步输入。更具体地,方法300推断特定于状态的模式或提供推断特定于状态的模式的能力,和/或从形成的单槽语言理解系统导出特定于状态的规则或提供导出特定于状态的规则的能力。由此,方法300提供一种用于构建特定于对话状态的多轮上下文LU系统的方法,该方法更易于使用并且需要比用于构建特定于对话状态的多轮上下文LU系统的先前使用的方法所需要的更少的专家知识、更少的时间和更少的资源。特定于对话状态的多轮上下文LU系统可以是机器学习到的特定于对话状态的多轮上下文LU系统、基于规则的特定于对话状态的多轮上下文LU系统、或者组合的特定于对话状态的多轮上下文LU系统。
在一些方面中,方法300包括操作302。在操作302,从构建方接收针对应用的任务定义或对话定义。如上文讨论的,任务定义可以包括执行期望任务所必要的任何数据、模块或系统。例如,任务定义可以包括任务触发模块、验证模块、语言生成模块和/或最终动作模块。
在操作304,接收用于构建单槽LU系统的信息。该信息可以是用于构建单槽LU模型和/或单槽规则集所必要的信息。信息由构建方102提供。在一些方面中,信息包括参数、实体、槽、标记、绑定或者映射等等。在一些方面中,所接收的信息基于所提供任务定义的任务。
在一些方面中(在基于规则的特定于对话状态的多轮上下文LU系统或者组合的特定于对话状态的多轮上下文LU系统的构建期间),方法300包括操作305。在操作305,基于在操作304接收的信息来形成单槽规则集。
在一些方面中(在机器学习到的特定于对话状态的多轮上下文LU系统或者组合特定于对话状态的多轮上下文LU系统的构建期间),方法300包括操作306。在操作306,基于在操作304处接收到的信息来配置单槽LU模型。
在操作307,推断依赖于对话状态的语义模式,或者提供推断依赖于对话状态的语义模式的能力。在一些方面中,操作307,基于在操作306期间配置的单槽LU模型和/或在操作305处形成的单槽规则集,推断针对不同对话状态的、依赖于对话状态的语义模式。可以在操作316处的依赖于对话状态的多轮上下文LU系统的形成之前,并且在由所形成的系统进行解码之前,在操作307处推断依赖于对话状态的语义模式。
在备选方面中,在操作307处提供推断针对不同对话状态的、依赖于对话状态的语义模式的能力。该能力可以被提供作为适于运行软件应用的程序模块。在这些方面中,推断针对不同对话状态的、依赖于对话状态的语义模式的能力基于在操作306期间配置的单槽语言理解模型和/或在操作305处形成的单槽规则集,并且基于由依赖于对话状态的多轮上下文LU系统在与用户的对话中接收到的用户输入。由此,在这些方面中,在操作316期间形成的依赖于对话状态的多轮上下文LU系统能够响应于在解码期间从与用户的对话接收到的用户输入而动态推断依赖于对话状态的语义模式。
在操作308处,为单槽LU模块和/或单槽规则集提供特定于状态的解码配置。特定于状态的解码配置根据正在构建的、特定于对话状态的多轮上下文LU系统方法300的类型而变化。在一些方面中(在机器学习到的特定于对话状态的多轮上下文LU系统或者组合的特定于对话状态的多轮上下文LU系统的构建期间),在操作308处约束单槽LU模型。在其他方面中(在基于规则的特定于对话状态的多轮上下文LU系统或者组合的特定于对话状态的多轮上下文LU系统的构建期间),在操作308处导出依赖于对话状态的规则集或者提供导出依赖于对话状态的规则集的能力。
在一些方面中,在操作308处,基于在操作305期间形成的单槽规则并且基于在操作307处推断的依赖于对话状态的语义模式,导出针对不同对话状态的、依赖于对话状态的规则。在这些方面中,依赖于对话状态的规则在操作316处的特定于对话状态的多轮上下文LU系统的形成之前被导出。
在备选方面中,在操作308处提供导出针对不同对话状态的依赖于对话状态的规则的能力。该能力可以被提供作为适于运行软件应用的程序模块。在这些方面中,导出针对一个或多个不同对话状态的依赖于对话状态的规则的能力基于在操作304期间接收到的单槽规则、在操作307处推断的依赖于对话状态的语义模式、并且基于由特定于对话状态的多轮上下文LU系统在对与用户的对话解码期间接收到的用户输入。换句话说,在操作316期间形成特定于对话状态的多轮上下文LU系统可以响应于在用户对话的解码期间接收到的用户输入而动态导出依赖于对话状态的规则。
所导出的依赖于对话状态的规则集,在解码期间标记针对一个或多个确定的对话状态的特定于对话状态的槽和特定于对话状态的实体。在这些方面中,在对话的解码期间该过程继续,直至所有必要的参数被提供给在操作316期间形成的特定于对话状态的多轮上下文LU系统。
在进一步的方面中,在操作308处,约束基于依赖于对话状态的语义模式、机器学习到的单槽语言理解模型,以仅输出针对所确定的一个或多个对话状态的\特定于对话状态的槽和特定于对话状态的实体,从而形成受约束的机器学习到的单槽语言理解模型。在这些方面中,当通过方法300形成的机器学习到的、特定于对话状态的多轮上下文LU系统被利用来解码接收到的用户输入(诸如,话语)时,系统从单槽LU模型移除在用户输入中提供的任何参数、槽和/或实体,并且然后通过利用经修改或约束的单槽LU模型来对用户进行响应。该过程继续,直至用于执行任务或对话的所有必要数据被用户提供给机器学习到的、特定于对话状态的多轮上下文LU系统。
在一个示例中,组合单槽LU模型通过以下来调整:
·基于所推断的依赖于对话状态的语义模式,约束机器学习到的单槽对话理解模型的解码,以仅输出针对所确定的至少一个对话状态的、特定于对话状态的槽和特定于对话状态的实体;以及
·通过利用导出的依赖于对话状态的规则和推断的依赖于对话状态的语义模式来标记针对所确定的一个或多个对话状态的、特定于对话状态的槽和特定于对话状态的实体,向基于规则的系统提供特定于状态的解码配置,
从而在操作308处形成经调整的组合单槽LU系统。
在一些方面中,方法300包括操作310和操作312。在操作310处,接收仿真请求。仿真请求可以经由用户界面从构建方被接收。用户界面可以向构建方提供和/或显示仿真选项。在操作312处,响应于在操作310处接收的仿真请求,运行受约束的单槽LU模型和/或依赖于对话状态的规则集的仿真。该仿真允许构建方仿真或测试:在被实现到特定于对话状态的多轮上下文LU系统中的情况下,当前构建的受约束的单槽LU模型和/或当前导出的依赖于对话状态的规则集将表现如何。例如,在操作312处的仿真可以由使用构建方提供的话语集合组成,或者可以由自动生成的模拟用户的话语和系统响应组成,以测试所实现的受约束的单槽LU模型和/或当前导出的依赖于对话状态的规则集。
在进一步的方面中,方法300包括操作314。在操作314,接收实现请求。实现请求可以经由用户界面从构建方被接收。用户界面可以向构建方提供和/或显示实现仿真选项。
在操作316,形成特定于对话状态的多轮上下文LU系统。在一些方面中,特定于对话状态的多轮上下文LU系统通过在操作316处实现受约束的单槽LU模型而被形成。在其他方面中,特定于对话状态的多轮上下文LU系统通过在操作316处实现依赖于对话状态的规则集而被形成。在进一步的方面中,特定于对话状态的多轮上下文LU系统通过以下而被形成:实现导出依赖于对话状态的规则集和/或状态依赖的语义模式的能力。
在一些方面中,操作316响应于操作314处接收到的实现请求而被执行。在其他方面中,操作316在操作308之后被自动执行。所建立的特定于对话状态的多轮上下文LU系统被提供给构建方。然后,构建方可以将所建立的特定于对话状态的多轮上下文LU系统添加到任何期望的数字代理、机器人、消息应用、话音代理、和/或任何其他应用类型。
尽管通过方法300形成的特定于对话状态的多轮上下文LU系统能够在操作304处不需要除形成单槽LU系统所必要的信息之外的、来自构建方的任何进一步输入,但构建方可以根据需要提供附加的信息。
图5-图8以及相关联的描述提供了本公开的多个方面可以被实践在其中的各种操作环境的讨论。然而,关于图5-图8讨论和图示的设备和系统是为了示例和图示的目的,并且不限制可以被用于实践本文所述的本公开的多个方面的大量计算设备配置。
图5是图示了本公开的多个方面可以利用其来实践的计算设备500的物理组件(例如,硬件)的框图。例如,对话构建平台100可以由计算设备500实现。在一些方面中,计算设备500是移动电话、智能电话、平板电脑、平板手机、智能手表、可穿戴计算机、个人计算机、台式计算机、游戏系统、膝上型计算机等。以下所述的计算设备组件可以包括用于对话构建平台100的计算机可执行指令,该计算机可执行指令可以被执行以采用方法300来建立如本文公开的特定于对话状态的多轮上下文LU系统108。在基本配置中,计算设备500可以包括至少一个处理单元502和系统存储器504。取决于计算设备的配置和类型,系统存储器504可以包括但不限于:易失性存储装置(例如,随机存取存储器)、非易失性存储装置(例如,只读存储器)、闪存、或者这样的存储器的任何组合。系统存储器504可以包括操作系统505以及适于运行软件应用520的一个或多个程序模块506。例如,操作系统505可以适用于控制计算设备500的操作。此外,本公开的多个方面可以结合图形库、其他操作系统或者任何其他应用程序并且不限于任何特定应用或系统而被实践。该基本配置在图5中通过在虚线508内的这些组件被图示。计算设备500可以具有附加的特征或功能。例如,计算设备500还可以包括附加的数据存储设备(可移除和/或非可移除的),诸如举例而言,磁盘、光盘或磁带。这些附加的存储装置在图5中通过可移除存储设备509和非可移除存储设备510被图示。例如,推断对话构建平台100的任何推断的依赖于对话状态的规则、用于推断依赖于对话状态的规则的配置、任何推断的依赖于对话状态的语义模式、和/或用于依赖于对话状态的语义模式的配置,可以被存储在图示的存储设备中的任何一个存储设备上。
如上所述,多个程序模块和数据文件可以被存储在系统存储器504中。当在处理单元502上执行时,程序模块506(例如,对话构建平台100)可以执行过程,该过程包括但不限于执行本文所述的方法300。例如,处理单元502可以实现对话构建平台100。可以根据本公开的多个方面被使用的其他程序模块,特别是生成屏幕内容的程序模块,可以包括:数字助理应用、话音识别应用、电子邮件应用、社交网络应用、协作应用、企业管理应用、消息应用、文字处理应用、电子表格应用、数据库应用、演示应用、联系人应用、游戏应用、电子商业应用、电子商务应用、交易应用、交换应用(exchange application)、设备控制应用、网站界面应用、日历应用等。在一些方面中,对话构建平台100允许构建方构建针对上文提到的应用中的一个或多个应用的、特定于对话状态的多轮上下文LU系统108。
此外,本公开的多个方面可以在电气电路中被实践,电气电路包括离散的电子元件、包含逻辑门的封装或集成电子芯片、利用微处理器的电路、包含电子元件或微处理器的单个芯片。例如,本公开的多个方面可以经由片上系统(SOC)被实践,其中图5中图示的组件中的每个组件或很多组件可以被集成到单个集成电路上。这种SOC设备可以包括一个或多个处理单元、图形单元、通信单元、系统虚拟化单元和各种应用功能,所有这些作为单个集成电路而被集成(或“烧制”)到芯片基板上。当经由SOC操作时,本文描述的、关于客户端切换协议的能力的功能,可以经由与单个集成电路(芯片)上计算设备500的其他组件集成的专用逻辑而被操作。
本公开的多个方面还可以使用能够执行逻辑操作(诸如举例而言,与、或、以及非)的其他技术被实践,包括但不限于机械、光学、流体、以及量子技术。另外,本公开的多个方面可以在通用计算机内或者在任何其他电路或系统中被实践。
计算设备500还可以具有一个或多个输入设备512,诸如键盘、鼠标、笔、麦克风或者其他声音或话音输入设备、触摸或滑动输入设备等。还可以包括(多个)输出设备514,诸如显示器、扬声器、打印机等。前述设备是示例,并且其他设备也可以被使用。计算设备500可以包括允许与其他计算设备550通信的一个或多个通信连接516。合适通信连接516的示例包括但不限于,RF发射器、接收器、和/或收发器电路、通用串行总线(USB)、并行和/或串行端口。
本文使用的术语“计算机可读介质”或“存储介质”可以包括计算机存储介质。计算机存储介质可以包括以任何方法或技术实现信息(诸如,计算机可读指令,数据结构,或者程序模块)的存储的、易失性和非易失性的、可移除和非可移除介质。系统存储器504、可移除存储设备509、以及非可移除存储设备510都是计算机存储介质示例(例如,存储器存储装置)。计算机存储介质可以包括RAM、ROM、电可擦除只读存储器(EEPROM)、闪存或者其他存储技术,CD-ROM、数字通用盘(DVD)或其他光学存储器、磁带盒,磁带、磁盘存储装置或其他磁存储设备、或者可以用于存储信息并且可以由计算设备500访问的任何其他制造物品。任何这种计算机存储介质可以是计算设备500的一部分。计算机存储介质不包括载波或者其他传播或调制的数据信号。
通信介质可以由计算机可读指令、数据结构、程序模块或经调制数据信号(诸如载波或者其他传输机制)中的其他数据来体现,并且包括任何信息传送介质。术语“经调制的数据信号”可以描述如下的信号:该信号的一个或多个特性以这样的方式被设置或修改,以编码该信号中的信息。以示例并且非限制的方式,通信介质可以包括有线介质和无线介质,有线介质诸如有线网络或直接有线连接,无线介质诸如声学、射频(RF)、红外、以及其他无线介质。
图6A和图6B图示了移动计算设备600,例如本公开的多个方面可以利用其来实践的移动电话、智能电话、平板电脑、平板手机、智能手表、可穿戴计算机、个人计算机、台式计算机、游戏系统、膝上型计算机等。参考图6A,图示了适用于实现方面的移动计算设备600的一个方面。在基本配置中,移动计算设备600是具有输入元件和输出元件两者的手持计算机。移动计算设备600通常包括显示器605以及一个或多个输入按钮610,输入按钮610允许用户将信息输入到移动计算设备600中。移动计算设备600的显示器605也可以充当输入设备(例如,触摸屏幕显示器)。
在被包括的情况下,可选的侧面输入元件615允许进一步的用户输入。侧面输入元件615可以是旋转开关、按钮或者任何其他类型的手动输入元件。在备选方面中,移动计算设备600可以包含更多或更少的输入元件。例如,在一些方面中,显示器605可以不是触摸屏幕。在又一备选方面中,移动计算设备600是便携式电话系统,诸如蜂窝电话。移动计算设备600还可以包括可选的小键盘635。可选的小键盘635可以是物理小键盘或在触摸屏幕显示器上生成的“软”小键盘。
除了与显示器605和/或小键盘635相关联的触摸屏幕输入设备之外或者作为替代,自然用户界面(NUI)可以被包含在移动计算设备600中。如本文使用的,NUI包括任何界面技术,这些界面技术使得用户能以“自然”方式与设备交互,不受输入设备(诸如鼠标、键盘、遥控器等)施加的人为约束。NUI方法的示例包括依赖于以下的那些方法:在屏幕上和临近屏幕两者的语音识别、触摸和手写笔识别、手势识别,空中手势,头部和眼睛跟踪,话音和语音,视觉,触摸,手势以及机器智能。
在各种方面中,输出元件包括用于示出图形用户界面(GUI)的显示器605。在本文公开的方面中,各种用户信息收集可以被显示在显示器605上。进一步的输出元件可以包括视觉指示器620(例如,发光二极管),和/或音频换能器625(例如,扬声器)。在一些方面中,移动计算设备600包含用于向用户提供触觉反馈的振动换能器。在又一方面中,移动计算设备600包含用于发送信号到外部设备或从外部设备接收信号的输入和/或输出端口,诸如音频输入(例如,麦克风插孔),音频输出(例如,耳机插孔)、以及视频输出(例如,HDMI端口)。
图6B是图示了移动计算设备的一个方面的架构的框图。也就是说,移动计算设备600可以包含系统(例如,架构)602以实现一些方面。在一个方面中,系统602被实现为能够运行一个或多个应用(例如,浏览器、电子邮件、日历、联系人管理器、消息客户端、游戏和媒体客户/播放器)的“智能电话”。在一些方面中,系统602被集成为计算设备,诸如集成的个人数字助理(PDA)和无线电话。
一个或多个应用程序666和/或对话构建平台100在操作系统664上运行或与操作系统664相关联。应用程序的示例包括:电话拨号程序、电子邮件程序、个人信息管理(PIM)程序、文字处理程序、电子表格程序、互联网浏览器程序、消息程序等。系统602还包括在存储器662内的非易失性存储区域668。非易失性存储区域668可以被用于存储在系统602断电的情况下不会丢失的持久信息。应用程序666可以使用和存储非易失性存储区域668中的信息,诸如由电子邮件应用使用的电子邮件或其他消息等等。同步应用(未示出)也驻留在系统602上,并且被编程为与驻留在托管计算机上对应的同步应用交互,以保持被存储在非易失性存储区域668中的信息与被存储在托管计算机处的对应信息同步。如应当理解的,其他应用可以被加载到存储器662中,以及在移动计算设备600上运行。
系统602具有电源670,电源670可以被实现为一个或多个电池。电源670可以进一步包括外部功率源,诸如对电池进行补充或重新充电的AC适配器或者电对接支架。
系统602还可以包括执行传输和接收射频通信功能的无线电672。无线电672促进经由通信载波或服务提供商的、在系统602与“外部世界”之间的无线连接。到无线电672以及来自无线电672的传输在操作系统664的控制下进行。换句话说,由无线电672接收到的通信可以经由操作系统664被传播到应用程序666,反之亦然。
视觉指示器620可以被用于提供视觉通知,和/或音频接口674可以被用于经由音频换能器625产生音频通知。在图示的方面中,视觉指示器620是发光二极管(LED),并且音频换能器625是扬声器。这些设备可以被直接耦合到电源670,使得这些设备在被激活时,在通知机制指示的持续时间内保持开启,即使处理器660和其他组件可能关机以节省电池电量。LED可以被编程为无限期地保持开启,直至用户采取动作来指示该设备的通电状态。音频接口674被用于将听觉信号提供给用户,并且接收来自用户的听觉信号。例如,除被耦合到音频换能器625之外,音频接口674还可以被耦合到麦克风以接收音频输入。系统602可以进一步包括视频接口676,视频接口676使车载相机630的操作能记录静止图像、视频流等。
移动计算设备600实现的系统602可以具有附加的特征或功能。例如,移动计算设备600还可以包括附加的数据存储设备(可移除和/或非可移除),诸如磁盘、光盘或磁带。这样的附加存储装置在图6B中由非易失性存储区域668图示。
由移动计算设备600生成或捕获的、并且经由系统602存储的数据/信息可以如上文所述被本地存储在移动计算设备600上,或者数据可以被存储在任何数目的存储介质上,这些存储介质可以由设备经由无线电672、或者经由移动计算设备600与关联于移动计算设备600的单独计算设备(例如,分布式计算网络(诸如互联网)中的服务器计算机)之间的有线连接来进行访问。应理解,这样的数据/信息可以经由移动计算设备600并经由无线电672、或者经由分布式计算网络而被访问。类似地,根据已知的数据/信息转移和存储部件,包括电子邮件和协同数据/信息共享系统,这样的数据/信息可以容易地在计算设备之间被转移,以用于存储和使用。
图7图示了用于处理在计算系统处从远程源(诸如上文所述的通用计算设备704、平板电脑706、或者移动设备708)接收到的数据的系统的架构的一个方面。在服务器设备702处显示和/或利用的内容可以以不同的通信信道或其他存储类型中进行存储。例如,各种文件可以使用目录服务722、网络门户724、邮箱服务726、即时消息存储728、和/或社交网络站点730而被存储。以示例的方式,对话构建平台100可以被实现在通用计算设备704、平板计算设备706和/或移动计算设备708(例如,智能电话)中。在一些方面中,如图7中图示的,服务器702被配置为经由网络715实现对话构建平台100。
图8图示了可以执行本文公开的一个或多个方面的示例性平板计算设备800。另外,本文所述的方面和功能可以在分布式系统(例如,基于云的计算系统)上操作,其中应用功能、存储器、数据存储和取回以及各种处理功能可以在分布式计算网络(诸如互联网或内部网)上彼此远程地被操作。用户界面和各种类型的信息可以经由车载计算设备显示器或经由与一个或多个计算设备相关联的远程显示器单元显示。例如,各种类型的用户界面和信息被投影到墙面上,各种类型的用户界面和信息可以在墙面上显示并且在墙面上进行交互。与利用其本发明的方面可以被实践的多个计算系统的交互,包括键击输入、触摸屏幕输入、话音或其他音频输入、手势输入,其中相关联的计算设备被配备有检测(例如,相机)功能,检测功能用于捕获和解释用于控制计算设备的功能等的用户手势。
在一些方面中,提供了一种具有平台的系统,该平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统。该系统包括至少一个处理器和存储器。存储器编码计算机可执行指令,计算机可执行指令在由至少一个处理器执行时,可操作为:
从构建方接收信息以用于构建单槽语言理解模型;
基于信息来配置单槽语言理解模型;
基于依赖于对话状态的语义模式,约束单槽语言理解模型的解码,以仅输出针对所确定的每个对话状态的、特定于对话状态的槽和特定于对话状态的实体;以及
实现受约束的单槽语言理解模型,以形成特定于对话状态的多轮上下文语言理解系统。
至少一个处理器可以进一步操作为:基于单槽语言理解模型和针对单槽语言理解模型的模式,推断针对不同对话状态的依赖于对话状态的语义模式。至少一个处理器可以进一步可操作为:提供推断针对不同对话状态的依赖于对话状态的语义模式的能力,该能力基于单槽语言理解模型,并且基于由特定于对话状态的多轮上下文语言理解系统从与用户的对话接收到的用户输入以及针对对话或任务给出的系统提示。至少一个处理器可以进一步可操作为从构建方接收针对应用的任务定义。单槽语言理解模型可以被构建用于该任务定义的任务。信息可以包括用于定义任务必要的参数、槽和实体。在这些方面中,单槽语言理解模型是机器学习到的模型。该系统可以是服务器。
在其他方面中,提供了一种具有平台的系统,该平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统。该系统包括至少一个处理器和存储器。存储器编码计算机可执行指令,计算机可执行指令在由至少一个处理器执行时,可操作为:
从构建方接收信息以用于创建单槽规则;
基于信息来形成单槽规则;
基于单槽规则来推断针对不同对话状态的依赖于对话状态的语义模式;
基于单槽规则和依赖于对话状态的语义模式,导出针对不同对话状态的依赖于对话状态的规则;以及
实现依赖于对话状态的规则,以形成特定于对话状态的多轮上下文语言理解系统。
至少一个处理器可以进一步可操作为:从构建方接收针对应用的任务定义。单槽规则可以针对任务定义的任务。信息可以包括用于定义任务必要的参数、槽和/或实体。至少一个处理器可以进一步可操作为:响应于接收到来自构建方的实现请求,实现依赖于对话状态的规则,以形成特定于对话状态的多轮上下文语言理解系统。该应用可以是:
数字助理应用;
话音识别应用;
电子邮件应用;
社交网络应用;
协同应用;
企业管理应用;
消息应用;
文字处理应用;
电子表格应用;
数据库应用;
演示应用;
联系人应用;
游戏应用;
电子商业应用;
电子商务应用;
交易应用;
设备控制应用;
网站界面应用;
交换应用;和/或
日历应用。
至少一个处理器可以进一步可操作为:响应于接收到来自构建方的仿真请求,运行依赖于对话状态的规则的仿真。
在其他方面中,提供了一种具有平台的系统,该平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统。该系统包括至少一个处理器和存储器。存储器编码计算机可执行指令,计算机可执行指令在由至少一个处理器执行时,可操作为:
从构建方接收信息以用于创建单槽规则;
基于信息来形成单槽规则;
提供推断针对不同对话状态的依赖于对话状态的语义模式的能力,以形成第一提供能力,该能力基于单槽规则并且基于在解码期间来自与用户的对话的用户输入;
提供导出依赖于对话状态的规则的能力,以形成第二提供能力,该能力基于依赖于对话状态的语义模式、单槽规则以及在解码期间来自与用户的对话的用户输入;以及
实现单槽规则、第一提供能力和第二提供能力,以形成特定于对话状态的多轮上下文语言理解系统。
至少一个处理器可以进一步可操作为:接收来自构建方的针对应用的任务定义。单槽规则可以针对任务定义的任务。信息可以包括参数、槽和/或实体。
在其他方面中,提供了一种具有平台的系统,该平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统。该系统包括至少一个处理器和存储器。存储器编码计算机可执行指令,计算机可执行指令在由至少一个处理器执行时,可操作为:
从构建方接收信息,以用于基于单槽规则与机器学习到的单槽模型的组合来创建组合单槽语言理解系统;
基于信息来形成组合单槽语言理解系统,其中组合单槽语言理解系统包括单槽规则和机器学习到的单槽语言理解模型;
针对依赖于对话状态的解码,调整组合单槽语言理解系统,以形成经调整的组合单槽语言理解模型;以及
实现经调整的组合单槽语言理解模型,以形成特定于对话状态的多轮上下文语言理解系统。
用于依赖于对话状态的解码的组合单槽语言理解系统可以通过以下来调整:
基于依赖于对话状态的语义模式,约束机器学习到的单槽语言理解模型的解码,以仅输出针对所确定的至少一个对话状态的、特定于对话状态的槽和特定于对话状态的实体;以及
处理单槽规则和依赖于对话状态的语义模式,以导出依赖于对话状态的规则或提供导出依赖于对话状态的规则的能力,用于标记针对所确定的至少一个对话状态或所确定的另一对话状态的、特定于对话状态的槽和特定于对话状态的实体。
至少一个处理器可以进一步可操作为:基于信息来推断针对不同对话状态的依赖于对话状态的语义模式,以及导出依赖于对话状态的规则。至少一个处理器可以进一步可操作为:提供推断针对不同对话状态的依赖于对话状态的语义模式的能力,该能力基于单槽规则或者机器学习到的单槽语言理解模型,并且基于由特定于对话状态的多轮上下文语言理解系统在解码期间从与用户的对话接收到的用户输入。至少一个处理器可以进一步可操作为:提供该能力以导出依赖于对话状态的规则。
本公开的又一方面包括一种用于针对应用的特定于对话状态的多轮上下文语言理解系统的方法。该方法包括:
从构建方接收信息以用于构建单槽语言理解模型;
基于信息来配置单槽语言理解模型;
基于依赖于对话状态的语义模式,约束单槽语言理解模型的解码,以仅输出针对所确定的每个对话状态的、特定于对话状态的槽和特定于对话状态的实体;以及
实现受约束的单槽语言理解模型,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的又一方面包括一种用于针对应用的特定于对话状态的多轮上下文语言理解系统的方法。该方法包括:
从构建方接收信息以用于创建单槽规则;
基于信息来形成单槽规则;
基于单槽规则来推断针对不同对话状态的依赖于对话状态的语义模式;
基于单槽规则和依赖于对话状态的语义模式,导出针对不同对话状态的依赖于对话状态的规则;以及
实现依赖于对话状态的规则,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的进一步的方面包括一种用于针对应用的特定于对话状态的多轮上下文语言理解系统的方法。该方法包括:
从构建方接收信息以用于创建单槽规则;
基于信息来形成单槽规则;
提供推断针对不同对话状态的依赖于对话状态的语义模式的能力,以形成第一提供能力,该能力基于单槽规则并且基于在解码期间来自与用户的对话的用户输入;
提供导出依赖于对话状态的规则的能力,以形成第二提供能力,该能力基于依赖于对话状态的语义模式、单槽规则以及在解码期间来自与用户的对话的用户输入;以及
实现单槽规则、第一提供能力和第二提供能力,以形成特定于对话状态的多轮上下文语言理解系统。
本公开的附加的方面包括一种用于针对应用的特定于对话状态的多轮上下文语言理解系统的方法。该方法包括:
从构建方接收信息,以用于基于单槽规则与机器学习到的单槽模型的组合来创建组合单槽语言理解系统;
基于信息来形成组合单槽语言理解系统,其中组合单槽语言理解系统包括单槽规则和机器学习到的单槽语言理解模型;
针对依赖于对话状态的解码,调整组合单槽语言理解系统,以形成经调整的组合单槽语言理解模型;以及
实现经调整的组合单槽语言理解模型,以形成特定于对话状态的多轮上下文语言理解系统。
例如,在上文参考框图和/或根据本公开的多个方面的方法、系统和计算机程序产品的操作图示来描述本公开的实施例。在框中描述的功能/动作可以不按任何流程图中所示的顺序发生。例如,取决于涉及的功能/动作,接连示出的两个框实际上可能基本上被同时执行,或者这些框可以有时以相反顺序被执行。
本公开参考附图描述了本技术的一些实施例,其中描述了可能的方面中的仅仅一些方面。然而,其他方面可以以很多不同形式来体现,并且本文公开的特定实施方式不应被解释为限制本文阐述的公开的各种方面。相反,这些示例性方面被提供为使得本公开彻底和完整,并且向本领域技术人员充分传达其他可能方面的范围。例如,本文公开的各种实施例的方面可以被修改和/或组合,而不脱离本公开的范围。
尽管特定方面在本文中被描述,但本技术的范围不限于这些特定方面。本领域技术人员将认识到在本技术的范围和精神内的其他方面或改进。因此,特定结构、动作、或者介质仅作为说明性方面而被公开。本技术的范围由权利要求和任何其等同物定义。
Claims (10)
1.一种具有平台的系统,所述平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统,所述系统包括:
至少一个处理器;以及
存储器,所述存储器用于存储和编码计算机可执行指令,所述计算机可执行指令在由所述至少一个处理器执行时,可操作为:
从构建方接收信息以用于构建单槽语言理解模型;
基于所述信息来配置所述单槽语言理解模型;
基于依赖于对话状态的语义模式,约束所述单槽语言理解模型的解码,以仅输出针对所确定的每个对话状态的、特定于对话状态的槽和特定于对话状态的实体;以及
实现受约束的单槽语言理解模型,以形成所述特定于对话状态的多轮上下文语言理解系统。
2.根据权利要求1所述的系统,其中所述至少一个处理器进一步可操作为:基于所述单槽语言理解模型和针对所述单槽语言理解模型的语义模式,推断针对不同对话状态的所述依赖于对话状态的语义模式。
3.根据权利要求1所述的系统,其中所述至少一个处理器进一步可操作为:提供推断针对不同对话状态的所述依赖于对话状态的语义模式的能力,所述能力基于所述单槽语言理解模型,并且基于由所述特定于对话状态的多轮上下文语言理解系统从与用户的对话接收到的用户输入以及针对所述对话或任务给出的系统提示。
4.根据权利要求1所述的系统,其中所述信息包括用于定义任务必要的参数、槽和实体。
5.根据权利要求1所述的系统,其中所述系统是至少一个服务器。
6.根据权利要求1所述的系统,其中所述至少一个处理器进一步可操作为:响应于接收到来自所述构建方的实现请求,实现所述受约束的单槽语言理解模型,以形成所述特定于对话状态的多轮上下文语言理解系统。
7.一种具有平台的系统,所述平台用于构建针对应用的特定于对话状态的多轮上下文语言理解系统,所述系统包括:
至少一个处理器;以及
存储器,所述存储器用于存储和编码计算机可执行指令,所述计算机可执行指令在由所述至少一个处理器执行时,可操作为:
从构建方接收信息,以用于基于单槽规则与机器学习到的单槽模型的组合来创建组合单槽语言理解系统;
基于所述信息来形成所述组合单槽语言理解系统,其中所述组合单槽语言理解系统包括所述单槽规则和机器学习到的单槽语言理解模型;
针对依赖于对话状态的解码来调整所述组合单槽语言理解系统,以形成经调整的组合单槽语言理解模型;以及
实现所述经调整的组合单槽语言理解模型,以形成所述特定于对话状态的多轮上下文语言理解系统。
8.根据权利要求7所述的系统,其中针对依赖于对话状态的解码来调整所述组合单槽语言理解系统包括:
基于依赖于对话状态的语义模式,约束所述机器学习到的单槽语言理解模型的解码,以仅输出针对所确定的至少一个对话状态的、特定于对话状态的槽和特定于对话状态的实体;以及
处理所述单槽规则和所述依赖于对话状态的语义模式,以导出依赖于对话状态的规则或提供导出依赖于对话状态的规则的能力,用于标记针对所述所确定的至少一个对话状态或所确定的另一对话状态的、所述特定于对话状态的槽和所述特定于对话状态的实体。
9.根据权利要求8所述的系统,其中所述至少一个处理器可操作为:
基于所述信息来推断针对不同对话状态的所述依赖于对话状态的语义模式;以及
导出所述依赖于对话状态的规则。
10.根据权利要求8所述的系统,其中所述至少一个处理器可操作为:
提供推断针对不同对话状态的所述依赖于对话状态的语义模式的能力,所述能力基于所述单槽规则或者所述机器学习到的单槽语言理解模型,并且基于由所述特定于对话状态的多轮上下文语言理解系统在所述解码期间从与用户的对话接收到的用户输入;以及
提供所述能力以导出所述依赖于对话状态的规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310606709.5A CN116663569A (zh) | 2016-06-17 | 2017-06-12 | 构建特定于状态的多轮上下文语言理解系统的系统和方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/185,488 | 2016-06-17 | ||
US15/185,488 US9996532B2 (en) | 2016-06-17 | 2016-06-17 | Systems and methods for building state specific multi-turn contextual language understanding systems |
PCT/US2017/036926 WO2017218370A1 (en) | 2016-06-17 | 2017-06-12 | Systems and methods for building state specific multi-turn contextual language understanding systems |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310606709.5A Division CN116663569A (zh) | 2016-06-17 | 2017-06-12 | 构建特定于状态的多轮上下文语言理解系统的系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109313667A true CN109313667A (zh) | 2019-02-05 |
CN109313667B CN109313667B (zh) | 2023-06-06 |
Family
ID=59216002
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780037738.7A Active CN109313667B (zh) | 2016-06-17 | 2017-06-12 | 构建特定于状态的多轮上下文语言理解系统的系统和方法 |
CN202310606709.5A Pending CN116663569A (zh) | 2016-06-17 | 2017-06-12 | 构建特定于状态的多轮上下文语言理解系统的系统和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310606709.5A Pending CN116663569A (zh) | 2016-06-17 | 2017-06-12 | 构建特定于状态的多轮上下文语言理解系统的系统和方法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US9996532B2 (zh) |
EP (1) | EP3472722A1 (zh) |
CN (2) | CN109313667B (zh) |
WO (1) | WO2017218370A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977209A (zh) * | 2019-03-22 | 2019-07-05 | 深圳狗尾草智能科技有限公司 | 多轮人机交互方法、系统、计算机及介质 |
CN111831795A (zh) * | 2019-04-11 | 2020-10-27 | 北京猎户星空科技有限公司 | 多轮对话处理方法、装置、电子设备及存储介质 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
US9690776B2 (en) * | 2014-12-01 | 2017-06-27 | Microsoft Technology Licensing, Llc | Contextual language understanding for multi-turn language tasks |
US9996532B2 (en) | 2016-06-17 | 2018-06-12 | Microsoft Technology Licensing, Llc | Systems and methods for building state specific multi-turn contextual language understanding systems |
JPWO2019026716A1 (ja) * | 2017-08-04 | 2020-08-20 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
EP3451175A1 (en) * | 2017-08-31 | 2019-03-06 | Entit Software LLC | Chatbot version comparision |
US11211055B2 (en) | 2019-01-14 | 2021-12-28 | Microsoft Technology Licensing, Llc | Utilizing rule specificity in conversational AI |
US11188548B2 (en) | 2019-01-14 | 2021-11-30 | Microsoft Technology Licensing, Llc | Profile data store automation via bots |
CN111488436B (zh) * | 2019-01-29 | 2023-05-05 | 阿里巴巴集团控股有限公司 | 多轮对话模型的生成方法、测试方法、装置及电子设备 |
CN110046238B (zh) * | 2019-03-29 | 2024-03-26 | 华为技术有限公司 | 对话交互方法、图形用户界面、终端设备以及网络设备 |
US10818293B1 (en) | 2020-07-14 | 2020-10-27 | Drift.com, Inc. | Selecting a response in a multi-turn interaction between a user and a conversational bot |
CN113689851B (zh) * | 2021-07-27 | 2024-02-02 | 国家电网有限公司 | 调度专业语言理解系统及方法 |
US11875793B2 (en) | 2021-09-07 | 2024-01-16 | International Business Machines Corporation | Cognitive natural language processing software framework optimization |
US11546323B1 (en) | 2022-08-17 | 2023-01-03 | strongDM, Inc. | Credential management for distributed services |
US11736531B1 (en) | 2022-08-31 | 2023-08-22 | strongDM, Inc. | Managing and monitoring endpoint activity in secured networks |
US11765159B1 (en) | 2022-09-28 | 2023-09-19 | strongDM, Inc. | Connection revocation in overlay networks |
US11916885B1 (en) | 2023-01-09 | 2024-02-27 | strongDM, Inc. | Tunnelling with support for dynamic naming resolution |
US11765207B1 (en) * | 2023-03-17 | 2023-09-19 | strongDM, Inc. | Declaring network policies using natural language |
US12039431B1 (en) | 2023-09-27 | 2024-07-16 | OpenAI Opco, LLC | Systems and methods for interacting with a multimodal machine learning model |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1455357A (zh) * | 2003-05-23 | 2003-11-12 | 郑方 | 一种实现多路对话的人-机汉语口语对话系统的方法 |
CN101233559A (zh) * | 2005-06-27 | 2008-07-30 | 微软公司 | 用于不同语言的说话者之间的增强的交互和理解的上下文敏感通信和翻译方法 |
CN102693725A (zh) * | 2011-03-25 | 2012-09-26 | 通用汽车有限责任公司 | 依赖于文本信息语境的语音识别 |
US20150179170A1 (en) * | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Discriminative Policy Training for Dialog Systems |
CN105229575A (zh) * | 2013-03-14 | 2016-01-06 | 微软技术许可有限责任公司 | 基于多个语言模型的文本预测 |
CN105427121A (zh) * | 2007-02-06 | 2016-03-23 | 沃伊斯博克斯科技公司 | 基于语音输入的自然语言处理选择演示广告的系统和方法 |
CN105474170A (zh) * | 2013-06-21 | 2016-04-06 | 微软技术许可有限责任公司 | 构建会话理解系统 |
CN105580004A (zh) * | 2013-08-09 | 2016-05-11 | 微软技术许可有限责任公司 | 提供语言帮助的输入方法编辑器 |
US20160154792A1 (en) * | 2014-12-01 | 2016-06-02 | Microsoft Technology Licensing, Llc | Contextual language understanding for multi-turn language tasks |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6219643B1 (en) | 1998-06-26 | 2001-04-17 | Nuance Communications, Inc. | Method of analyzing dialogs in a natural language speech recognition system |
US6418440B1 (en) | 1999-06-15 | 2002-07-09 | Lucent Technologies, Inc. | System and method for performing automated dynamic dialogue generation |
US7080004B2 (en) * | 2001-12-05 | 2006-07-18 | Microsoft Corporation | Grammar authoring system |
US7117158B2 (en) * | 2002-04-25 | 2006-10-03 | Bilcare, Inc. | Systems, methods and computer program products for designing, deploying and managing interactive voice response (IVR) systems |
US7546382B2 (en) | 2002-05-28 | 2009-06-09 | International Business Machines Corporation | Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms |
US7430510B1 (en) * | 2004-03-01 | 2008-09-30 | At&T Corp. | System and method of using modular spoken-dialog components |
US7529657B2 (en) | 2004-09-24 | 2009-05-05 | Microsoft Corporation | Configurable parameters for grammar authoring for speech recognition and natural language understanding |
US20080010069A1 (en) | 2006-07-10 | 2008-01-10 | Microsoft Corporation | Authoring and running speech related applications |
US20090055163A1 (en) * | 2007-08-20 | 2009-02-26 | Sandeep Jindal | Dynamic Mixed-Initiative Dialog Generation in Speech Recognition |
WO2012030838A1 (en) | 2010-08-30 | 2012-03-08 | Honda Motor Co., Ltd. | Belief tracking and action selection in spoken dialog systems |
US20140122083A1 (en) | 2012-10-26 | 2014-05-01 | Duan Xiaojiang | Chatbot system and method with contextual input and output messages |
US9189742B2 (en) | 2013-11-20 | 2015-11-17 | Justin London | Adaptive virtual intelligent agent |
WO2015100362A1 (en) | 2013-12-23 | 2015-07-02 | 24/7 Customer, Inc. | Systems and methods for facilitating dialogue mining |
US10726831B2 (en) | 2014-05-20 | 2020-07-28 | Amazon Technologies, Inc. | Context interpretation in natural language processing using previous dialog acts |
US9996532B2 (en) | 2016-06-17 | 2018-06-12 | Microsoft Technology Licensing, Llc | Systems and methods for building state specific multi-turn contextual language understanding systems |
-
2016
- 2016-06-17 US US15/185,488 patent/US9996532B2/en active Active
- 2016-06-20 US US15/187,263 patent/US9978361B2/en active Active
-
2017
- 2017-06-12 CN CN201780037738.7A patent/CN109313667B/zh active Active
- 2017-06-12 EP EP17733229.3A patent/EP3472722A1/en not_active Withdrawn
- 2017-06-12 CN CN202310606709.5A patent/CN116663569A/zh active Pending
- 2017-06-12 WO PCT/US2017/036926 patent/WO2017218370A1/en unknown
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1455357A (zh) * | 2003-05-23 | 2003-11-12 | 郑方 | 一种实现多路对话的人-机汉语口语对话系统的方法 |
CN101233559A (zh) * | 2005-06-27 | 2008-07-30 | 微软公司 | 用于不同语言的说话者之间的增强的交互和理解的上下文敏感通信和翻译方法 |
CN105427121A (zh) * | 2007-02-06 | 2016-03-23 | 沃伊斯博克斯科技公司 | 基于语音输入的自然语言处理选择演示广告的系统和方法 |
CN102693725A (zh) * | 2011-03-25 | 2012-09-26 | 通用汽车有限责任公司 | 依赖于文本信息语境的语音识别 |
CN105229575A (zh) * | 2013-03-14 | 2016-01-06 | 微软技术许可有限责任公司 | 基于多个语言模型的文本预测 |
CN105474170A (zh) * | 2013-06-21 | 2016-04-06 | 微软技术许可有限责任公司 | 构建会话理解系统 |
CN105580004A (zh) * | 2013-08-09 | 2016-05-11 | 微软技术许可有限责任公司 | 提供语言帮助的输入方法编辑器 |
US20150179170A1 (en) * | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Discriminative Policy Training for Dialog Systems |
US20160154792A1 (en) * | 2014-12-01 | 2016-06-02 | Microsoft Technology Licensing, Llc | Contextual language understanding for multi-turn language tasks |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977209A (zh) * | 2019-03-22 | 2019-07-05 | 深圳狗尾草智能科技有限公司 | 多轮人机交互方法、系统、计算机及介质 |
CN111831795A (zh) * | 2019-04-11 | 2020-10-27 | 北京猎户星空科技有限公司 | 多轮对话处理方法、装置、电子设备及存储介质 |
CN111831795B (zh) * | 2019-04-11 | 2023-10-27 | 北京猎户星空科技有限公司 | 多轮对话处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20170365250A1 (en) | 2017-12-21 |
CN109313667B (zh) | 2023-06-06 |
CN116663569A (zh) | 2023-08-29 |
EP3472722A1 (en) | 2019-04-24 |
US20170364505A1 (en) | 2017-12-21 |
WO2017218370A1 (en) | 2017-12-21 |
US9996532B2 (en) | 2018-06-12 |
US9978361B2 (en) | 2018-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109313667A (zh) | 构建特定于状态的多轮上下文语言理解系统的系统和方法 | |
US10360300B2 (en) | Multi-turn cross-domain natural language understanding systems, building platforms, and methods | |
US10733384B2 (en) | Emotion detection and expression integration in dialog systems | |
US10182156B2 (en) | Insight based routing for help desk service | |
JP6492069B2 (ja) | 環境を認識した対話ポリシーおよび応答生成 | |
RU2689203C2 (ru) | Гибкая схема для настройки языковой модели | |
CN109478196A (zh) | 用于对在线用户查询进行响应的系统和方法 | |
US20240256788A1 (en) | Systems and methods for dialog management | |
CN107924393A (zh) | 用于语言理解的分布式服务器系统 | |
CN108369596A (zh) | 个性化自然语言理解系统 | |
CN111602160A (zh) | 数字助理任务管理 | |
CN107294837A (zh) | 采用虚拟机器人进行对话交互的方法和系统 | |
CN109643540A (zh) | 用于人工智能语音演进的系统和方法 | |
CN105378624A (zh) | 在交互出现于白板上时显示交互 | |
CN109923834A (zh) | 用于协作工作空间环境的上下文对话 | |
CN108475190A (zh) | 为第三方体验创作的自然语言任务完成平台 | |
WO2018107580A1 (zh) | 一种信息提示的方法及装置 | |
US10474439B2 (en) | Systems and methods for building conversational understanding systems | |
CN108369607A (zh) | 用于个人数字助理的动态反应性上下文策略 | |
CN107592926A (zh) | 使用任务帧建立多模式协同对话 | |
CN108885739A (zh) | 智能个人助理作为联系人 | |
US20200168205A1 (en) | Cognitive enhancement of communication with tactile stimulation | |
CN109448727A (zh) | 语音交互方法以及装置 | |
CN109891828A (zh) | 用于协作工作空间环境的上下文画布 | |
KR20190131355A (ko) | 대화용 애플리케이션의 운영 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |