CN102737096A - 基于位置的会话理解 - Google Patents
基于位置的会话理解 Download PDFInfo
- Publication number
- CN102737096A CN102737096A CN2012100874209A CN201210087420A CN102737096A CN 102737096 A CN102737096 A CN 102737096A CN 2012100874209 A CN2012100874209 A CN 2012100874209A CN 201210087420 A CN201210087420 A CN 201210087420A CN 102737096 A CN102737096 A CN 102737096A
- Authority
- CN
- China
- Prior art keywords
- inquiry
- environmental context
- user
- voice
- context
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007613 environmental effect Effects 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 27
- 238000003860 storage Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 22
- 238000012937 correction Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 abstract 2
- 230000008569 process Effects 0.000 description 10
- 238000010977 unit operation Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 206010038743 Restlessness Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005654 stationary process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
- Stored Programmes (AREA)
- Telephonic Communication Services (AREA)
Abstract
可以提供基于位置的会话理解。当从用户接收到查询时,可以生成与该查询相关联的环境上下文。可以根据该环境上下文来解释该查询。可以执行经解释的查询,并且将与所述查询相关联的至少一个结果提供给用户。
Description
技术领域
本申请涉及环境上下文,特别是基于位置的会话理解。
背景技术
基于位置的会话理解可以提供一种利用环境上下文来改进查询执行和结果的机制。传统的语音识别程序不具有利用从一个用户到另一个用户的信息(例如语音发言、地理数据、某些位置的声学环境、从特定位置做出的典型查询)来改进来自新的和/或现有用户的新的查询的质量和准确度的技术。在一些情况中,必须在没有采用类似的、潜在相关的查询来帮助理解的这样的益处的情况下来做出语音到文本的转换。
语音到文本转换(即语音识别)可包括将讲出的短语转换成可由计算系统处理的文本短语。可在现代的基于统计数据的语音识别算法中使用声学建模和/或语言建模。在很多常规的系统中广泛地使用隐马尔可夫模型(HMM)。HMM可包括可输出符号或数量的序列的统计数据模型。HMM可用于语音识别,因为语音信号可被视为分段平稳信号或短时平稳信号。在短时间(例如10毫秒)中,语音可被近似为平稳过程。因此出于很多随机的目的,语音可被认为是马尔可夫模型。
发明内容
提供本发明内容以便以简化形式介绍将在以下具体实施方式中进一步描述的一些概念。此发明内容不旨在标识所要求保护的主题的关键特征或必要特征。本发明内容也不旨在用于限制所要求保护的主题的范围。
可以提供基于位置的会话理解。当从用户接收到查询时,可以生成与该查询相关联的环境上下文。可以根据该环境上下文来解释该查询。可以执行经解释的查询,并且将与所述查询相关联的至少一个结果提供给用户。
以上概括描述和以下详细描述两者都提供了示例,并且只是说明性的。因此,以上概括描述和以下详细描述不应当被认为是限制性的。此外,除了本文中所阐述的那些特征或变体以外,还可以提供其他特征或变体。例如,实施例可涉及具体实施方式中所描述的各种特征组合和子组合。
附图说明
合并在本公开中并构成其一部分的附图示出本发明的实施例。在附图中:
图1是操作环境的框图;
图2是用于提供基于位置的会话理解的方法的流程图;以及
图3是包括计算设备的系统的框图。
具体实施方式
以下详细描述参考各个附图。只要可能,就在附图和以下描述中使用相同的附图标记来指示相同或相似的元件。尽管可能描述了本发明的实施例,但修改、改编、以及其他实现是可能的。例如,可对附图中所示的元件进行置换、添加、或修改,并且可通过对所公开的方法置换、重新排序、或添加阶段来修改本文中所描述的方法。因此,以下详细描述并不限制本发明。相反,本发明的正确范围由所附权利要求书定义。
可以提供基于位置的会话理解。例如,可以提供一种语音到文本的系统,该系统将来自多个用户的信息相互关联以便改进会话的准确度以及经转换的语句中所包括的查询的结果。根据本发明的实施例,个人助理程序可以从多个位置处的用户接收基于语音的查询。可以对每个查询分析声学和/或环境特性,并且可以将这样的特性存储起来并与从其接收该查询的位置相关联。例如,从地铁站处的用户接收到的查询可以检测离开瓷砖墙的声学回声和/或人群或地铁列车的背景环境声音的存在。随后,可知道这些特性在将来被用于过滤出来自该位置的查询,以允许这些查询的转换更加准确。根据本发明的实施例,可以例如通过用户的全球定位系统(GPS)的位置、与用户相关联的区域代码、与用户相关联的邮政编码和/或用户在地标(例如火车站、体育场、博物馆、办公楼等)的接近度来定义位置。
处理该查询可以包括根据声学模型来改写查询。例如,该声学模型可以包括在特定位置处公知存在的背景声音。应用声学模型可以允许通过忽略不相关的声音来更加准确地转换查询。声学模型还允许对与该查询相关联的任何结果的显示进行改变。例如,在特定的嘈杂环境中,可以在屏幕上而不是通过音频来显示结果。环境上下文还可以与理解模型相关联以帮助语音到文本的转换。例如,理解模型可以包括隐马尔可夫模型(HMM)。环境上下文还可以与语义模型相关联以帮助执行查询。例如,语义模型可以包括本体论(ontology)。本体论在相关的申请S/N___/___,___,在2011年_____日申请,并且名为“查询、会话和搜索的个性化”,通过引用整体结合于此。
而且,所述查询的主题可以被用于改进将来的查询的结果。例如,如果在地铁站的用户查询“何时有下一班?”,个人助理程序可以通过几个查询的过程来确定该用户想要知道何时下一班列车将到达。这可以通过要求对来自第一用户的查询进行分类并存储该分类以在将来使用来完成。在另一个示例,如果一个用户查询“何时有下一班?”,而另一个用户查询“何时有下一班列车?”,则程序可以将这些查询相关联,并做出这两个用户都在请求相同的信息的假设。
图1是用于提供基于位置的会话理解的操作环境100的框图。操作环境100可以包括口述对话系统(SDS)110,该系统包括个人助理程序112、语音到文本转换器114以及上下文数据库116。个人助理程序112可以通过网络120从位于第一位置140处的第一多个用户130(A)-(C)以及位于第二位置160处的第二多个用户150(A)-(C)接收查询。上下文数据库116可以操作用于存储与从例如第一多个用户130(A)-(C)和/或第二多个用户150(A)-(C)之类的用户处所接收的查询相关联的上下文数据。上下文数据可以包括声学和/或环境特性以及查询上下文信息,例如查询主题、查询的时间/日期、用户细节和/或从其做出查询的位置。根据本发明的实施例,网络120可包括,例如,私人数据网络(例如以太网)、蜂窝数据网络和/或诸如因特网的公共网络。
代理可以与口述对话系统(SDS)相关联。这样的系统允许人们通过他们的声音与计算机交互。驱动该SDS的主组件可以包括对话管理器:该组件管理与用户的基于对话的会话。对话管理器可通过多个输入源的组合来确定用户的意图,诸如语音识别和自然语言理解组件输出、来自先前对话轮次的上下文、用户上下文、和/或从知识库(例如搜索引擎)返回的结果。在确定意图后,对话管理器可采取动作,诸如向用户显示最终结果和/或继续与用户的对话以满足他们的意图。口述对话系统可以包括多个会话理解模型,例如与位置相关联的声学模型和/或用于处理基于语音的输入的语音语言理解模型。
图2是阐明与本发明用于提供基于位置的会话理解的实施例相一致的方法200中涉及的各一般阶段的流程图。方法200可使用计算设备300来实现,这将在下面参考图3予以更详细描述。在下文中将更详细地描述实现方法200的各阶段的方式。方法200可开始于起始框205并继续至阶段210,在那里计算设备300可接收来自一位置处的用户的基于语音的查询。例如,用户130(A)可以通过诸如蜂窝电话之类的设备向SDS 110发送查询。
方法200可从阶段210前进至阶段215,其中计算设备300可确定与该位置相关联的环境上下文是否存在于存储器存储中。例如,SDS 110可以标识从其处接收到查询的位置(例如第一位置140)并确定与该位置相关联的环境上下文是否存在于上下文数据库116中。
如果不存在与该位置相关联的上下文,则方法200前进到阶段220,在那,计算设备300可以标识基于语音的查询中的至少一个声学干扰。例如,SDS 110可以分析该查询的音频,并标识诸如与用户130(A)周围的大量人群和/或经过的列车相关联的背景噪声。
随后,方法200前进到阶段225,在那,计算设备300可以标识与基于语音的查询相关联的至少一个主题。例如,如果该查询包括“何时下一班到达?”,则当该用户处于火车站时,SDS 110可以标识列车时刻表作为该查询的主题。
随后,方法200可以前进到阶段230,在那,计算设备300可以创建与该位置相关联的新的环境上下文以存储在存储器存储中。例如,SDS 110可以将所标识的声学干扰以及查询主题以与用户位置相关联的形式存储在上下文数据库116中。
如果与该位置相关联的上下文存在,方法200可以前进到阶段235,在那计算设备300可以加载与该位置相关联的环境上下文。例如,SDS 110可以如上所述从上下文数据库116加载环境上下文。
在阶段240处创建了上下文或在阶段235处加载了上下文之后,方法200随后可以前进到阶段240,在那,计算设备300可以根据环境上下文将基于语音的查询转换为基于文本的查询。例如,SDS 110可以通过应用过滤器以移除与环境上下文相关联的至少一个声学干扰来将基于语音的查询转换为基于文本的查询。
方法200随后可以前进到阶段245,在那,计算设备300可以根据环境上下文执行基于文本的查询。例如,SDS 110可以在搜索域(例如列车时刻表)内执行与至少一个主题相关联的查询(例如“何时下一班到达?”),该主题与环境上下文相关联。
随后,方法200前进到阶段250,在那,计算设备300可以将所执行的基于文本的查询的至少一个结果提供给用户。例如,SDS 110可以将结果传送给与用户130(A)相关联的设备(例如蜂窝电话)以供显示。方法200然后可在阶段255结束。
根据本发明的实施例可包括用于提供基于位置的会话理解的系统。该系统可包括存储器存储、以及耦合到该存储器存储的处理单元。处理单元操作上可用于接收来自用户的查询,生成与查询相关联的环境上下文,根据环境上下文解释该查询,执行所解释的查询以及将查询的至少一个结果提供给用户。查询可以包括,例如,处理单元操作上可以转换成计算机可读的文本的语音查询。根据本发明的实施例,语音到文本的转换可以利用隐马尔可夫模型算法,该算法包括用于各种与理解模型相关联的最可能的词语的统计权重和/或与语义模型相关联的语义概念。处理单元操作上可用于例如根据从该位置接收的至少一个先前的查询来增加至少一个预期的词语的统计权重,并将该统计权重存储作为环境上下文的一部分。
环境上下文可以包括与从其处接收查询的位置相关联的声学模型。处理单元操作上可根据至少一个背景声音来改写查询,所述背景声音基于声学模型得自基于语音的查询。例如,可以知道背景声音(例如列车汽笛)存在于从给定位置(例如火车站)接收的语音查询中。可以对背景声音进行检测和测量以查找音调、振幅以及其它声学特性。可以将查询改写为忽略这样的声音,并且,可以计算并存储所述声音以应用于来自该位置的将来的查询。处理单元在操作上还可以从第二用户接收第二基于语音的查询,并且根据经更新的声学模型来改写该查询以得到相同的背景声音。处理单元在操作上还可以聚集与来自多个用户的多个查询相关联的环境上下文并存储与该位置相关联的所聚集的环境上下文。
根据本发明的实施例可包括用于提供基于位置的会话理解的系统。该系统可包括存储器存储、以及耦合到该存储器存储的处理单元。处理单元操作上可从一个位置处的用户接收基于语音的查询,加载与该位置相关联的环境上下文,根据环境上下文将基于语音的查询转换为文本,根据环境上下文执行经转换的查询并将与所执行的查询相关联的至少一个结果提供给用户。环境上下文可以包括,例如,至少一个先前查询的时间、至少一个先前查询的日期、至少一个先前查询的主题、包括本体论的语义模型、理解模型以及该位置的声学模型。处理单元操作上可以根据与该位置相关联的已知声学干扰来改写查询。处理单元在操作上还可以存储多个环境上下文,所述环境上下文与根据从多个用户接收的多个查询所聚集的多个位置相关联。处理单元还可用于从用户接收对经转换的文本的校正并根据所述校正更新环境上下文。处理单元操作上还可从第二位置处的用户接收第二基于语音的查询,加载与该第二位置相关联的第二环境上下文,根据第二环境上下文将第二基于语音的查询转换为文本,根据第二环境上下文执行经转换的查询并将与所执行的查询相关联的至少一个第二结果提供给用户。
根据本发明的又一实施例可包括用于提供知晓上下文的环境的系统。该系统可包括存储器存储、以及耦合到该存储器存储的处理单元。处理单元操作上可以从一位置处的用户接收基于语音的查询并确定与该位置相关联的环境上下文是否存在于存储器存储中。响应于确定不存在环境上下文,处理单元操作上可以标识基于语音的查询中的至少一个声学干扰,标识与基于语音的查询相关联的至少一个主题并创建与该位置相关联的新的环境上下文以供存储在存储器存储中。响应于确定存在环境上下文,处理器单元操作上可以加载该环境上下文。处理单元随后在操作上可以根据环境上下文将基于语音的查询转换为基于文本的查询,其中,在操作上根据环境上下文将基于语音的查询转换为基于文本的查询包括在操作上应用过滤器以移除与环境上下文相关联的至少一个声学干扰,根据环境上下文执行基于文本的查询,其中在操作上根据环境上下文执行基于文本的查询包括在操作上执行查询,其中至少一个声学干扰与声学模型相关联,并且其中至少一个所标识的主题与语义模型相关联,所述语义模型与环境上下文相关联,并且将所执行的基于文本的查询的至少一个结果提供给用户。
图3是包括计算设备300的系统的框图。按照本发明的一实施例,上述存储器存储和处理单元可在诸如图3的计算设备300之类的计算设备中实现。可使用硬件、软件或固件的任何合适的组合来实现存储器存储和处理单元。例如,存储器存储和处理单元可用计算设备300或结合计算设备300的其他计算设备318中的任一个来实现。根据本发明的实施例,上述系统、设备和处理器是示例,而其他系统、设备和处理器可包括上述存储器存储和处理单元。此外,计算设备300可包括用于如上所述的系统100的操作环境。系统100可在其他环境中操作,并且不限于计算设备300。
参考图3,根据本发明的一实施例的系统可包括计算设备,诸如计算设备300。在基本配置中,计算设备300可包括至少一个处理单元302和系统存储器304。取决于计算设备的配置和类型,系统存储器304可包括,但不限于,易失性存储器(例如,随机存取存储器(RAM))、非易失性存储器(例如,只读存储器(ROM))、闪存、或任何组合。系统存储器304可以包括操作系统305、一个或多个编程模块306,且可以包括个人助理程序112。例如,操作系统305可适用于控制计算设备300的操作。此外,本发明的实施例可结合图形库、其他操作系统、或任何其他应用程序来实践,并且不限于任何特定应用或系统。该基本配置在图3中由虚线308内的那些组件示出。
计算设备300可具有附加特征或功能。例如,计算设备300还可包括附加数据存储设备(可移动和/或不可移动),诸如例如,磁盘、光盘、或磁带。这些附加存储在图3中由可移动存储309和不可移动存储310示出。计算机存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块、或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。系统存储器304、可移动存储309和不可移动存储310都是计算机存储介质(即,存储器存储)的示例。计算机存储介质可包括,但不限于,RAM、ROM、电可擦除只读存储器(EEPROM)、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光存储、磁带盒、磁带、磁盘存储或其他磁性存储设备、或者可用于存储信息且可由计算设备300访问的任何其他介质。任何此类计算机存储介质可以是设备300的一部分。计算设备300还可以具有输入设备312,如键盘、鼠标、笔、声音输入设备、触摸输入设备等。还可包括诸如显示器、扬声器、打印机等输出设备314。上述设备是示例,并且可使用其他设备。
计算设备300还可包含可允许设备300诸如通过分布式计算环境中的网络(例如,内联网或因特网)来与其他计算设备318进行通信的通信连接316。通信连接316是通信介质的一个示例。通信介质通常由诸如载波或其他传输机制之类的已调制数据信号中的计算机可读指令、数据结构、程序模块、或其他数据来体现,并且包括任何信息传送介质。术语“已调制数据信号”可以描述以对该信号中的信息进行编码的方式设定或者改变其一个或多个特征的信号。作为示例而非限制,通信介质包括诸如有线网络或直接线连接等有线介质,以及诸如声学、射频(RF)、红外线和其他无线介质等无线介质。如此处所使用的术语“计算机可读介质”可包括存储介质和通信介质两者。
如上所述,可在系统存储器304中存储包括操作系统305在内的多个程序模块和数据文件。当在处理单元302上执行时,编程模块306(例如,个人助理程序112)可执行各过程,包括例如,如上所述的方法200的各阶段中的一个或多个。上述过程是一个示例,且处理单元302可执行其他过程。根据本发明的实施例可使用的其他编程模块可包括电子邮件和联系人应用、文字处理应用、电子表格应用、数据库应用、幻灯片演示应用、绘图或计算机辅助应用程序等。
一般而言,根据本发明的实施例,程序模块可包括可执行特定任务或可实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。此外,本发明的实施例可用其他计算机系统配置来实践,包括手持式设备、多处理器系统、基于微处理器的系统或可编程消费电子产品、小型机、大型计算机等。本发明的实施例还可在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实践。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备两者中。
此外,本发明的实施例可在包括分立电子元件的电路、包含逻辑门的封装或集成电子芯片、利用微处理器的电路、或在包含电子元件或微处理器的单个芯片上实践。本发明的实施例还可使用能够执行诸如例如,AND(与)、OR(或)和NOT(非)的逻辑运算的其他技术来实践,包括但不限于,机械、光学、流体和量子技术。另外,本发明的实施例可在通用计算机或任何其他电路或系统中实践。
例如,本发明的实施例可被实现为计算机过程(方法)、计算系统、或诸如计算机程序产品或计算机可读介质之类的制品。计算机程序产品可以是计算机系统可读并对用于执行计算机过程的指令的计算机程序编码的计算机存储介质。计算机程序产品还可以是计算系统可读并对用于执行计算机过程的指令的计算机程序编码的载体上的传播信号。因此,本发明可以硬件和/或软件(包括固件、常驻软件、微码等)来体现。换言之,本发明的实施例可采用其上包含有供指令执行系统使用或结合其使用的计算机可使用或计算机可读程序代码的计算机可使用或计算机可读存储介质上的计算机程序产品的形式。计算机可使用或计算机可读介质可以是可包含、存储、通信、传播、或传输程序以供指令执行系统、装置或设备使用或结合其使用的任何介质。
计算机可使用或计算机可读介质例如可以是、但不限于电、磁、光、电磁、红外、或半导体系统、装置、设备或传播介质。更具体的计算机可读介质示例(非穷尽列表),计算机可读介质可包括以下:具有一条或多条导线的电连接、便携式计算机盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤、以及便携式压缩盘只读存储器(CD-ROM)。注意,计算机可使用或计算机可读介质甚至可以是其上打印有程序的纸张或另一合适的介质,因为程序可经由例如对纸张或其他介质的光学扫描而电子地捕获,随后如有必要被编译、解释、或以其他合适的方式处理,并且随后存储在计算机存储器中。
以上参考例如根据本发明的实施例的方法、系统和计算机程序产品的框图和/或操作示图描述了本发明的实施例。框中所注明的各功能/动作可按不同于任何流程图所示的次序出现。例如,取决于所涉及的功能/动作,连续示出的两个框实际上可基本同时执行,或者这些框有时可按相反的次序执行。
尽管已描述了本发明的特定实施例,但也可能存在其他实施例。此外,虽然本发明的实施例被描述为与存储在存储器和其他存储介质中的数据相关联,但是数据还可被存储在其他类型的计算机可读介质上或从其读取,诸如辅助存储设备(像硬盘、软盘、或CD-ROM)、来自因特网的载波、或其他形式的RAM或ROM。此外,所公开的方法的各步骤可以任何方式修改,包括通过对各步骤重新排序和/或插入或删除步骤,而不背离本发明。
包括此处所包括的代码中的版权在内的所有权利都归属于申请人并且是本申请人的财产。本申请人保持并保留此处所包括的代码中的所有权利,并且授予仅关于所授权专利的再现且未出于其他目的再现该材料的许可。
尽管本说明书包括示例,但本发明的范围由所附权利要求书来指示。此外,尽管用对结构特征和/或方法动作专用的语言描述了本说明书,但权利要求书并不限于以上所描述的特征或动作。相反,以上所描述的特定特征和动作是作为本发明的实施例的示例来公开的。
Claims (10)
1.一种用于提供基于位置的会话理解的方法(200),所述方法(200)包括:
从用户(130(A)-(C)、150(A)-(C))接收(210)查询;
生成(220,225,230)与所述查询相关联的环境上下文;
根据所述环境上下文来解释(240)所述查询;
执行(245)经解释的查询;以及
将所述查询的至少一个结果提供(250)给所述用户(130(A)-(C)、150(A)-(C))。
2.如权利要求1所述的方法(200),其特征在于,解释(240)所述查询包括:根据从所述位置(140、160)处接收的至少一个先前的查询来改写至少一个会话理解模型,并且其中所述至少一个会话理解模型包括与从其处接收所述查询的位置(140、160)相关联的声学模型。
3.如权利要求2所述的方法(200),其特征在于,解释(240)所述查询还包括:根据至少一个背景声音来改写所述查询,根据所述声学模型将所述背景声音与所述查询相关联,并且其中,在所述查询中测量所述背景声音。
4.如权利要求3所述的方法(200),其特征在于,还包括将所述背景声音作为与所述位置相关联的声学特性来存储。
5.如权利要求1所述的方法(200),其特征在于,还包括:
聚集与来自多个用户(130(A)-(C)、150(A)-(C))的多个查询相关联的环境上下文;
存储与所述位置相关联的经聚集的环境上下文;
从第二用户(130(A)-(C),150(A)-(C))接收(210)第二基于语音的查询;以及
根据经聚集的环境上下文来解释(240)所述第二基于语音的查询。
6.如权利要求5所述的方法(200),其特征在于,其中,解释(240)所述查询包括:根据与从所述位置接收的查询相关联的经聚集的环境上下文来增加至少一个预期语义概念的统计权重。
7.一种存储一组指令的计算机可读介质,所述一组指令在被执行时执行一种用于提供基于位置的会话理解的方法(200),由所述一组指令执行的方法(200)包括:
从一位置处的用户(130(A)-(C)、150(A)-(C))接收(210)基于语音的查询;
加载(235)与所述位置相关联的环境上下文;
根据所述环境上下文将所述基于语音的查询转换(240)为文本;
根据所述环境上下文来执行(245)经转换的查询;
将与所执行的查询相关联的至少一个结果提供(250)给所述用户(130(A)-(C)、150(A)-(C))。
8.如权利要求7所述的计算机可读介质,其特征在于,还包括:
从所述用户(130(A)-(C)、150(A)-(C))接收对经转换的文本的校正;以及
根据所述校正来更新所述环境上下文,其中更新所述环境上下文包括修改与所述校正的至少一个词语相关联的概率以应用于将来的查询。
9.如权利要求7所述的计算机可读介质,其特征在于,还包括:
从第二位置处的用户(130(A)-(C)、150(A)-(C))接收(210)第二基于语音的查询;
加载(235)与所述第二位置相关联的第二环境上下文;
根据所述第二环境上下文将所述第二基于语音的查询转换(240)为文本;
根据所述第二环境上下文来执行(245)经转换的查询;
将与所执行的查询相关联的至少一个第二结果提供(250)给所述用户(130(A)-(C)、150(A)-(C))。
10.一种用于提供基于位置的会话理解的系统,所述系统包括:
存储器存储(304);以及
耦合到所述存储器存储(304)的处理单元(302),其中所述处理单元(302)可用于:
从一位置处的用户(130(A)-(C)、150(A)-(C))接收(210)基于语音的查询,
确定(215)与所述位置(140、160)相关联的环境上下文是否存在于所述存储器存储中,
响应于确定(215)不存在所述环境上下文:
标识(220)所述基于语音的查询中的至少一个声学干扰;
标识(225)与所述基于语音的查询相关联的至少一个主题;以及
创建(230)与所述位置(140、160)相关联的新的环境上下文以存储在所述存储器存储中,其中,所述至少一个声学干扰与声学模型相关联,并且其中,所述至少一个所标识的主题与语义模型相关联,
响应于确定(215)存在所述环境上下文,加载(235)所述环境上下文,
根据所述环境上下文将所述基于语音的查询转换(240)为基于文本的查询,其中,在操作上根据所述环境上下文将所述基于语音的查询转换为基于文本的查询包括在操作上根据与所述环境上下文相关联的至少一个声学干扰来改写所述查询,
根据所述环境上下文执行(245)基于文本的查询,其中,在操作上根据所述环境上下文执行基于文本的查询包括在操作上根据与所述环境上下文相关联的所述语义模型来执行所述查询,以及
将所执行的基于文本的查询的至少一个结果提供(250)给所述用户(130(A)-(C)、150(A)-(C))。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610801496.1A CN106383866B (zh) | 2011-03-31 | 2012-03-29 | 基于位置的会话理解 |
Applications Claiming Priority (14)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/077,431 US10642934B2 (en) | 2011-03-31 | 2011-03-31 | Augmented conversational understanding architecture |
US13/077,303 US9858343B2 (en) | 2011-03-31 | 2011-03-31 | Personalization of queries, conversations, and searches |
US13/077,233 | 2011-03-31 | ||
US13/076,862 | 2011-03-31 | ||
US13/077,303 | 2011-03-31 | ||
US13/077,396 US9842168B2 (en) | 2011-03-31 | 2011-03-31 | Task driven user intents |
US13/077,455 | 2011-03-31 | ||
US13/077,368 US9298287B2 (en) | 2011-03-31 | 2011-03-31 | Combined activation for natural user interface systems |
US13/077,233 US20120253789A1 (en) | 2011-03-31 | 2011-03-31 | Conversational Dialog Learning and Correction |
US13/076,862 US9760566B2 (en) | 2011-03-31 | 2011-03-31 | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US13/077,396 | 2011-03-31 | ||
US13/077,431 | 2011-03-31 | ||
US13/077,368 | 2011-03-31 | ||
US13/077,455 US9244984B2 (en) | 2011-03-31 | 2011-03-31 | Location based conversational understanding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610801496.1A Division CN106383866B (zh) | 2011-03-31 | 2012-03-29 | 基于位置的会话理解 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102737096A true CN102737096A (zh) | 2012-10-17 |
CN102737096B CN102737096B (zh) | 2017-08-25 |
Family
ID=46931884
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610801496.1A Active CN106383866B (zh) | 2011-03-31 | 2012-03-29 | 基于位置的会话理解 |
CN201210087420.9A Active CN102737096B (zh) | 2011-03-31 | 2012-03-29 | 基于位置的会话理解 |
CN201210090634.1A Active CN102750311B (zh) | 2011-03-31 | 2012-03-30 | 扩充的对话理解体系结构 |
CN201210091176.3A Active CN102737101B (zh) | 2011-03-31 | 2012-03-30 | 用于自然用户界面系统的组合式激活 |
CN201210090349.XA Active CN102737099B (zh) | 2011-03-31 | 2012-03-30 | 对查询、会话和搜索的个性化 |
CN201210092263.0A Active CN102750270B (zh) | 2011-03-31 | 2012-03-31 | 扩充的对话理解代理 |
CN201210101485.4A Expired - Fee Related CN102750271B (zh) | 2011-03-31 | 2012-03-31 | 谈话式对话学习和纠正 |
CN201210093414.4A Active CN102737104B (zh) | 2011-03-31 | 2012-03-31 | 任务驱动的用户意图 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610801496.1A Active CN106383866B (zh) | 2011-03-31 | 2012-03-29 | 基于位置的会话理解 |
Family Applications After (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210090634.1A Active CN102750311B (zh) | 2011-03-31 | 2012-03-30 | 扩充的对话理解体系结构 |
CN201210091176.3A Active CN102737101B (zh) | 2011-03-31 | 2012-03-30 | 用于自然用户界面系统的组合式激活 |
CN201210090349.XA Active CN102737099B (zh) | 2011-03-31 | 2012-03-30 | 对查询、会话和搜索的个性化 |
CN201210092263.0A Active CN102750270B (zh) | 2011-03-31 | 2012-03-31 | 扩充的对话理解代理 |
CN201210101485.4A Expired - Fee Related CN102750271B (zh) | 2011-03-31 | 2012-03-31 | 谈话式对话学习和纠正 |
CN201210093414.4A Active CN102737104B (zh) | 2011-03-31 | 2012-03-31 | 任务驱动的用户意图 |
Country Status (5)
Country | Link |
---|---|
EP (6) | EP2691870A4 (zh) |
JP (4) | JP2014512046A (zh) |
KR (3) | KR101963915B1 (zh) |
CN (8) | CN106383866B (zh) |
WO (7) | WO2012135210A2 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108028043A (zh) * | 2015-09-24 | 2018-05-11 | 微软技术许可有限责任公司 | 在参与者之间的对话中检测可行动项 |
CN109076083A (zh) * | 2016-04-29 | 2018-12-21 | 微软技术许可有限责任公司 | 促进数字个人助理之间的交互 |
CN109716325A (zh) * | 2016-09-13 | 2019-05-03 | 微软技术许可有限责任公司 | 计算机化的自然语言查询意图分派 |
CN111428721A (zh) * | 2019-01-10 | 2020-07-17 | 北京字节跳动网络技术有限公司 | 词语释义的确定方法、装置、设备及存储介质 |
Families Citing this family (205)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10032127B2 (en) | 2011-02-18 | 2018-07-24 | Nuance Communications, Inc. | Methods and apparatus for determining a clinician's intent to order an item |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
WO2014025990A1 (en) | 2012-08-10 | 2014-02-13 | Nuance Communications, Inc. | Virtual agent communication for electronic devices |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
CN113470641B (zh) | 2013-02-07 | 2023-12-15 | 苹果公司 | 数字助理的语音触发器 |
CN105190628B (zh) * | 2013-03-01 | 2019-10-11 | 纽昂斯通讯公司 | 确定临床医生的预订项目的意图的方法和设备 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9436287B2 (en) * | 2013-03-15 | 2016-09-06 | Qualcomm Incorporated | Systems and methods for switching processing modes using gestures |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
US9728184B2 (en) | 2013-06-18 | 2017-08-08 | Microsoft Technology Licensing, Llc | Restructuring deep neural network acoustic models |
US9589565B2 (en) * | 2013-06-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
CN104714954A (zh) * | 2013-12-13 | 2015-06-17 | 中国电信股份有限公司 | 基于上下文理解的信息搜索方法和系统 |
US20150170053A1 (en) * | 2013-12-13 | 2015-06-18 | Microsoft Corporation | Personalized machine learning models |
US20170017501A1 (en) | 2013-12-16 | 2017-01-19 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US10015770B2 (en) | 2014-03-24 | 2018-07-03 | International Business Machines Corporation | Social proximity networks for mobile phones |
US9529794B2 (en) | 2014-03-27 | 2016-12-27 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
US20150278370A1 (en) * | 2014-04-01 | 2015-10-01 | Microsoft Corporation | Task completion for natural language input |
US10111099B2 (en) | 2014-05-12 | 2018-10-23 | Microsoft Technology Licensing, Llc | Distributing content in managed wireless distribution networks |
US9874914B2 (en) | 2014-05-19 | 2018-01-23 | Microsoft Technology Licensing, Llc | Power management contracts for accessory devices |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9355640B2 (en) * | 2014-06-04 | 2016-05-31 | Google Inc. | Invoking action responsive to co-presence determination |
US9717006B2 (en) | 2014-06-23 | 2017-07-25 | Microsoft Technology Licensing, Llc | Device quarantine in a wireless network |
JP6275569B2 (ja) * | 2014-06-27 | 2018-02-07 | 株式会社東芝 | 対話装置、方法およびプログラム |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9886461B1 (en) | 2014-07-11 | 2018-02-06 | Google Llc | Indexing mobile onscreen content |
US10146409B2 (en) * | 2014-08-29 | 2018-12-04 | Microsoft Technology Licensing, Llc | Computerized dynamic splitting of interaction across multiple content |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
KR102188268B1 (ko) * | 2014-10-08 | 2020-12-08 | 엘지전자 주식회사 | 이동단말기 및 그 제어방법 |
WO2016065020A2 (en) | 2014-10-21 | 2016-04-28 | Robert Bosch Gmbh | Method and system for automation of response selection and composition in dialog systems |
KR102329333B1 (ko) | 2014-11-12 | 2021-11-23 | 삼성전자주식회사 | 질의를 처리하는 장치 및 방법 |
US9836452B2 (en) * | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
CN107112016B (zh) | 2015-01-05 | 2020-12-29 | 谷歌有限责任公司 | 多模态状态循环 |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
WO2016129767A1 (ko) * | 2015-02-13 | 2016-08-18 | 주식회사 팔락성 | 온라인 사이트 링크방법 |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) * | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US9792281B2 (en) * | 2015-06-15 | 2017-10-17 | Microsoft Technology Licensing, Llc | Contextual language generation by leveraging language understanding |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10249297B2 (en) | 2015-07-13 | 2019-04-02 | Microsoft Technology Licensing, Llc | Propagating conversational alternatives using delayed hypothesis binding |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
KR20170033722A (ko) * | 2015-09-17 | 2017-03-27 | 삼성전자주식회사 | 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치 |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10970646B2 (en) * | 2015-10-01 | 2021-04-06 | Google Llc | Action suggestions for user-selected content |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
KR102393928B1 (ko) * | 2015-11-10 | 2022-05-04 | 삼성전자주식회사 | 응답 메시지를 추천하는 사용자 단말 장치 및 그 방법 |
WO2017090954A1 (en) * | 2015-11-24 | 2017-06-01 | Samsung Electronics Co., Ltd. | Electronic device and operating method thereof |
KR102502569B1 (ko) | 2015-12-02 | 2023-02-23 | 삼성전자주식회사 | 시스템 리소스 관리를 위한 방법 및 장치 |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9905248B2 (en) | 2016-02-29 | 2018-02-27 | International Business Machines Corporation | Inferring user intentions based on user conversation data and spatio-temporal data |
US9978396B2 (en) | 2016-03-16 | 2018-05-22 | International Business Machines Corporation | Graphical display of phone conversations |
US10587708B2 (en) * | 2016-03-28 | 2020-03-10 | Microsoft Technology Licensing, Llc | Multi-modal conversational intercom |
US11487512B2 (en) | 2016-03-29 | 2022-11-01 | Microsoft Technology Licensing, Llc | Generating a services application |
US10158593B2 (en) * | 2016-04-08 | 2018-12-18 | Microsoft Technology Licensing, Llc | Proactive intelligent personal assistant |
US10409876B2 (en) * | 2016-05-26 | 2019-09-10 | Microsoft Technology Licensing, Llc. | Intelligent capture, storage, and retrieval of information for task completion |
WO2017210613A1 (en) * | 2016-06-03 | 2017-12-07 | Maluuba Inc. | Natural language generation in a spoken dialogue system |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10282218B2 (en) * | 2016-06-07 | 2019-05-07 | Google Llc | Nondeterministic task initiation by a personal assistant module |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10216269B2 (en) * | 2016-06-21 | 2019-02-26 | GM Global Technology Operations LLC | Apparatus and method for determining intent of user based on gaze information |
US10509795B2 (en) * | 2016-08-23 | 2019-12-17 | Illumina, Inc. | Semantic distance systems and methods for determining related ontological data |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10446137B2 (en) * | 2016-09-07 | 2019-10-15 | Microsoft Technology Licensing, Llc | Ambiguity resolving conversational understanding system |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US9940390B1 (en) * | 2016-09-27 | 2018-04-10 | Microsoft Technology Licensing, Llc | Control system using scoped search and conversational interface |
CN107885744B (zh) * | 2016-09-29 | 2023-01-03 | 微软技术许可有限责任公司 | 对话式的数据分析 |
US10535005B1 (en) | 2016-10-26 | 2020-01-14 | Google Llc | Providing contextual actions for mobile onscreen content |
JP6697373B2 (ja) | 2016-12-06 | 2020-05-20 | カシオ計算機株式会社 | 文生成装置、文生成方法及びプログラム |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
CN110249326B (zh) * | 2017-02-08 | 2023-07-14 | 微软技术许可有限责任公司 | 自然语言内容生成器 |
US10643601B2 (en) * | 2017-02-09 | 2020-05-05 | Semantic Machines, Inc. | Detection mechanism for automated dialog systems |
WO2018156978A1 (en) | 2017-02-23 | 2018-08-30 | Semantic Machines, Inc. | Expandable dialogue system |
EP3563375B1 (en) * | 2017-02-23 | 2022-03-02 | Microsoft Technology Licensing, LLC | Expandable dialogue system |
US10798027B2 (en) * | 2017-03-05 | 2020-10-06 | Microsoft Technology Licensing, Llc | Personalized communications using semantic memory |
US10237209B2 (en) * | 2017-05-08 | 2019-03-19 | Google Llc | Initializing a conversation with an automated agent via selectable graphical element |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10664533B2 (en) * | 2017-05-24 | 2020-05-26 | Lenovo (Singapore) Pte. Ltd. | Systems and methods to determine response cue for digital assistant based on context |
US10679192B2 (en) * | 2017-05-25 | 2020-06-09 | Microsoft Technology Licensing, Llc | Assigning tasks and monitoring task performance based on context extracted from a shared contextual graph |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10742435B2 (en) * | 2017-06-29 | 2020-08-11 | Google Llc | Proactive provision of new content to group chat participants |
US11132499B2 (en) | 2017-08-28 | 2021-09-28 | Microsoft Technology Licensing, Llc | Robust expandable dialogue system |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10546023B2 (en) * | 2017-10-03 | 2020-01-28 | Google Llc | Providing command bundle suggestions for an automated assistant |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
CN110019718B (zh) * | 2017-12-15 | 2021-04-09 | 上海智臻智能网络科技股份有限公司 | 修改多轮问答系统的方法、终端设备以及存储介质 |
US11341422B2 (en) | 2017-12-15 | 2022-05-24 | SHANGHAI XIAOl ROBOT TECHNOLOGY CO., LTD. | Multi-round questioning and answering methods, methods for generating a multi-round questioning and answering system, and methods for modifying the system |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10839160B2 (en) * | 2018-01-19 | 2020-11-17 | International Business Machines Corporation | Ontology-based automatic bootstrapping of state-based dialog systems |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
KR102635811B1 (ko) * | 2018-03-19 | 2024-02-13 | 삼성전자 주식회사 | 사운드 데이터를 처리하는 시스템 및 시스템의 제어 방법 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10685075B2 (en) | 2018-04-11 | 2020-06-16 | Motorola Solutions, Inc. | System and method for tailoring an electronic digital assistant query as a function of captured multi-party voice dialog and an electronically stored multi-party voice-interaction template |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
WO2020044990A1 (ja) | 2018-08-29 | 2020-03-05 | パナソニックIpマネジメント株式会社 | 電力変換システム及び蓄電システム |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
CN115151936A (zh) * | 2020-02-25 | 2022-10-04 | 利维帕尔森有限公司 | 用于呼叫中心响应生成的意图分析 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11783827B2 (en) | 2020-11-06 | 2023-10-10 | Apple Inc. | Determining suggested subsequent user actions during digital assistant interaction |
EP4174848A1 (en) * | 2021-10-29 | 2023-05-03 | Televic Rail NV | Improved speech to text method and system |
CN116644810B (zh) * | 2023-05-06 | 2024-04-05 | 国网冀北电力有限公司信息通信分公司 | 一种基于知识图谱实现的电网故障风险处置方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5970446A (en) * | 1997-11-25 | 1999-10-19 | At&T Corp | Selective noise/channel/coding models and recognizers for automatic speech recognition |
CN1692407A (zh) * | 2002-06-20 | 2005-11-02 | 英特尔公司 | 改善移动设备的语音识别 |
US20070038436A1 (en) * | 2005-08-10 | 2007-02-15 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US20080005068A1 (en) * | 2006-06-28 | 2008-01-03 | Microsoft Corporation | Context-based search, retrieval, and awareness |
CN101120341A (zh) * | 2005-02-06 | 2008-02-06 | 凌圭特股份有限公司 | 以自然语言进行移动式信息访问的方法和设备 |
US20080300871A1 (en) * | 2007-05-29 | 2008-12-04 | At&T Corp. | Method and apparatus for identifying acoustic background environments to enhance automatic speech recognition |
Family Cites Families (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265014A (en) * | 1990-04-10 | 1993-11-23 | Hewlett-Packard Company | Multi-modal user interface |
US5748974A (en) * | 1994-12-13 | 1998-05-05 | International Business Machines Corporation | Multimodal natural language interface for cross-application tasks |
CN1313972A (zh) * | 1998-08-24 | 2001-09-19 | Bcl计算机有限公司 | 自适应的自然语言接口 |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
US6332120B1 (en) * | 1999-04-20 | 2001-12-18 | Solana Technology Development Corporation | Broadcast speech recognition system for keyword monitoring |
JP3530109B2 (ja) * | 1999-05-31 | 2004-05-24 | 日本電信電話株式会社 | 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体 |
EP1236096A1 (en) * | 1999-06-01 | 2002-09-04 | Geoffrey M. Jacquez | Help system for a computer related application |
US6598039B1 (en) * | 1999-06-08 | 2003-07-22 | Albert-Inc. S.A. | Natural language interface for searching database |
JP3765202B2 (ja) * | 1999-07-09 | 2006-04-12 | 日産自動車株式会社 | 対話型情報検索装置、コンピュータを用いた対話型情報検索方法及び対話型情報検索処理を行うプログラムを記録したコンピュータ読取り可能な媒体 |
JP2001125896A (ja) * | 1999-10-26 | 2001-05-11 | Victor Co Of Japan Ltd | 自然言語対話システム |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
JP2002024285A (ja) * | 2000-06-30 | 2002-01-25 | Sanyo Electric Co Ltd | ユーザ支援方法およびユーザ支援装置 |
JP2002082748A (ja) * | 2000-09-06 | 2002-03-22 | Sanyo Electric Co Ltd | ユーザ支援装置 |
US7197120B2 (en) * | 2000-12-22 | 2007-03-27 | Openwave Systems Inc. | Method and system for facilitating mediated communication |
GB2372864B (en) * | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
JP2003115951A (ja) * | 2001-10-09 | 2003-04-18 | Casio Comput Co Ltd | 話題情報提供システムおよび話題情報提供方法 |
US7693720B2 (en) * | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
EP1411443A1 (en) * | 2002-10-18 | 2004-04-21 | Hewlett Packard Company, a Delaware Corporation | Context filter |
JP2004212641A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 音声入力システム及び音声入力システムを備えた端末装置 |
JP2004328181A (ja) * | 2003-04-23 | 2004-11-18 | Sharp Corp | 電話機及び電話網システム |
JP4441782B2 (ja) * | 2003-05-14 | 2010-03-31 | 日本電信電話株式会社 | 情報提示方法及び情報提示装置 |
JP2005043461A (ja) * | 2003-07-23 | 2005-02-17 | Canon Inc | 音声認識方法及び音声認識装置 |
KR20050032649A (ko) * | 2003-10-02 | 2005-04-08 | (주)이즈메이커 | 인공생명을 학습시키는 방법 및 시스템 |
US7747601B2 (en) * | 2006-08-14 | 2010-06-29 | Inquira, Inc. | Method and apparatus for identifying and classifying query intent |
US7720674B2 (en) * | 2004-06-29 | 2010-05-18 | Sap Ag | Systems and methods for processing natural language queries |
JP4434972B2 (ja) * | 2005-01-21 | 2010-03-17 | 日本電気株式会社 | 情報提供システム、情報提供方法及びそのプログラム |
EP1686495B1 (en) * | 2005-01-31 | 2011-05-18 | Ontoprise GmbH | Mapping web services to ontologies |
GB0502259D0 (en) * | 2005-02-03 | 2005-03-09 | British Telecomm | Document searching tool and method |
US7409344B2 (en) * | 2005-03-08 | 2008-08-05 | Sap Aktiengesellschaft | XML based architecture for controlling user interfaces with contextual voice commands |
US20060206333A1 (en) * | 2005-03-08 | 2006-09-14 | Microsoft Corporation | Speaker-dependent dialog adaptation |
US7734557B2 (en) * | 2005-04-05 | 2010-06-08 | The Board Of Trustees Of Leland Stanford Junior University | Methods, software, and systems for knowledge base coordination |
US7991607B2 (en) * | 2005-06-27 | 2011-08-02 | Microsoft Corporation | Translation and capture architecture for output of conversational utterances |
US7640160B2 (en) * | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7627466B2 (en) * | 2005-11-09 | 2009-12-01 | Microsoft Corporation | Natural language interface for driving adaptive scenarios |
US7822699B2 (en) * | 2005-11-30 | 2010-10-26 | Microsoft Corporation | Adaptive semantic reasoning engine |
US20070136222A1 (en) | 2005-12-09 | 2007-06-14 | Microsoft Corporation | Question and answer architecture for reasoning and clarifying intentions, goals, and needs from contextual clues and content |
US20070143410A1 (en) * | 2005-12-16 | 2007-06-21 | International Business Machines Corporation | System and method for defining and translating chat abbreviations |
CN100373313C (zh) * | 2006-01-12 | 2008-03-05 | 广东威创视讯科技股份有限公司 | 一种用于交互式输入设备的智能识别编码方法 |
US8209407B2 (en) * | 2006-02-10 | 2012-06-26 | The United States Of America, As Represented By The Secretary Of The Navy | System and method for web service discovery and access |
EP2035915A4 (en) * | 2006-06-13 | 2012-04-25 | Microsoft Corp | DASHBOARD FOR SEARCH ENGINE |
US8204739B2 (en) * | 2008-04-15 | 2012-06-19 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
CN1963752A (zh) * | 2006-11-28 | 2007-05-16 | 李博航 | 基于自然语言的电子设备人机交互操作界面技术 |
WO2008067676A1 (en) * | 2006-12-08 | 2008-06-12 | Medhat Moussa | Architecture, system and method for artificial neural network implementation |
US20080172359A1 (en) * | 2007-01-11 | 2008-07-17 | Motorola, Inc. | Method and apparatus for providing contextual support to a monitored communication |
US20080172659A1 (en) | 2007-01-17 | 2008-07-17 | Microsoft Corporation | Harmonizing a test file and test configuration in a revision control system |
US20080201434A1 (en) * | 2007-02-16 | 2008-08-21 | Microsoft Corporation | Context-Sensitive Searches and Functionality for Instant Messaging Applications |
US20090076917A1 (en) * | 2007-08-22 | 2009-03-19 | Victor Roditis Jablokov | Facilitating presentation of ads relating to words of a message |
US7720856B2 (en) * | 2007-04-09 | 2010-05-18 | Sap Ag | Cross-language searching |
US7788276B2 (en) * | 2007-08-22 | 2010-08-31 | Yahoo! Inc. | Predictive stemming for web search with statistical machine translation models |
CA2698105C (en) * | 2007-08-31 | 2016-07-05 | Microsoft Corporation | Identification of semantic relationships within reported speech |
US8165886B1 (en) * | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8504621B2 (en) * | 2007-10-26 | 2013-08-06 | Microsoft Corporation | Facilitating a decision-making process |
JP2009116733A (ja) * | 2007-11-08 | 2009-05-28 | Nec Corp | アプリケーション検索システム、アプリケーション検索方法、モニタ端末、検索サーバおよびプログラム |
JP5158635B2 (ja) * | 2008-02-28 | 2013-03-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | パーソナル・サービス支援のための方法、システム、および装置 |
US20090234655A1 (en) * | 2008-03-13 | 2009-09-17 | Jason Kwon | Mobile electronic device with active speech recognition |
CN101499277B (zh) * | 2008-07-25 | 2011-05-04 | 中国科学院计算技术研究所 | 一种服务智能导航方法和系统 |
US8874443B2 (en) * | 2008-08-27 | 2014-10-28 | Robert Bosch Gmbh | System and method for generating natural language phrases from user utterances in dialog systems |
JP2010128665A (ja) * | 2008-11-26 | 2010-06-10 | Kyocera Corp | 情報端末及び会話補助プログラム |
JP2010145262A (ja) * | 2008-12-19 | 2010-07-01 | Pioneer Electronic Corp | ナビゲーション装置 |
US8326637B2 (en) * | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
JP2010230918A (ja) * | 2009-03-26 | 2010-10-14 | Fujitsu Ten Ltd | 検索装置 |
US8700665B2 (en) * | 2009-04-27 | 2014-04-15 | Avaya Inc. | Intelligent conference call information agents |
US20100281435A1 (en) * | 2009-04-30 | 2010-11-04 | At&T Intellectual Property I, L.P. | System and method for multimodal interaction using robust gesture processing |
KR101622111B1 (ko) * | 2009-12-11 | 2016-05-18 | 삼성전자 주식회사 | 대화 시스템 및 그의 대화 방법 |
KR101007336B1 (ko) * | 2010-06-25 | 2011-01-13 | 한국과학기술정보연구원 | 온톨로지 기반 개인화 서비스 시스템 및 방법 |
US20120253789A1 (en) | 2011-03-31 | 2012-10-04 | Microsoft Corporation | Conversational Dialog Learning and Correction |
-
2012
- 2012-03-27 EP EP12764494.6A patent/EP2691870A4/en not_active Ceased
- 2012-03-27 EP EP12763866.6A patent/EP2691949A4/en not_active Ceased
- 2012-03-27 WO PCT/US2012/030730 patent/WO2012135210A2/en unknown
- 2012-03-27 JP JP2014502721A patent/JP2014512046A/ja active Pending
- 2012-03-27 WO PCT/US2012/030757 patent/WO2012135229A2/en active Application Filing
- 2012-03-27 KR KR1020137025586A patent/KR101963915B1/ko active IP Right Grant
- 2012-03-27 EP EP12763913.6A patent/EP2691885A4/en not_active Ceased
- 2012-03-27 WO PCT/US2012/030751 patent/WO2012135226A1/en unknown
- 2012-03-27 KR KR20137025578A patent/KR20140014200A/ko not_active Application Discontinuation
- 2012-03-27 JP JP2014502718A patent/JP6105552B2/ja active Active
- 2012-03-27 WO PCT/US2012/030636 patent/WO2012135157A2/en unknown
- 2012-03-27 KR KR1020137025540A patent/KR101922744B1/ko active IP Right Grant
- 2012-03-27 WO PCT/US2012/030740 patent/WO2012135218A2/en active Application Filing
- 2012-03-27 JP JP2014502723A patent/JP6087899B2/ja not_active Expired - Fee Related
- 2012-03-27 EP EP12765896.1A patent/EP2691877A4/en not_active Withdrawn
- 2012-03-29 CN CN201610801496.1A patent/CN106383866B/zh active Active
- 2012-03-29 CN CN201210087420.9A patent/CN102737096B/zh active Active
- 2012-03-30 WO PCT/US2012/031736 patent/WO2012135791A2/en unknown
- 2012-03-30 CN CN201210090634.1A patent/CN102750311B/zh active Active
- 2012-03-30 EP EP12764853.3A patent/EP2691875A4/en not_active Ceased
- 2012-03-30 CN CN201210091176.3A patent/CN102737101B/zh active Active
- 2012-03-30 WO PCT/US2012/031722 patent/WO2012135783A2/en unknown
- 2012-03-30 EP EP12765100.8A patent/EP2691876A4/en not_active Ceased
- 2012-03-30 CN CN201210090349.XA patent/CN102737099B/zh active Active
- 2012-03-31 CN CN201210092263.0A patent/CN102750270B/zh active Active
- 2012-03-31 CN CN201210101485.4A patent/CN102750271B/zh not_active Expired - Fee Related
- 2012-03-31 CN CN201210093414.4A patent/CN102737104B/zh active Active
-
2017
- 2017-03-01 JP JP2017038097A patent/JP6305588B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5970446A (en) * | 1997-11-25 | 1999-10-19 | At&T Corp | Selective noise/channel/coding models and recognizers for automatic speech recognition |
CN1692407A (zh) * | 2002-06-20 | 2005-11-02 | 英特尔公司 | 改善移动设备的语音识别 |
CN101120341A (zh) * | 2005-02-06 | 2008-02-06 | 凌圭特股份有限公司 | 以自然语言进行移动式信息访问的方法和设备 |
US20070038436A1 (en) * | 2005-08-10 | 2007-02-15 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US20080005068A1 (en) * | 2006-06-28 | 2008-01-03 | Microsoft Corporation | Context-based search, retrieval, and awareness |
US20080300871A1 (en) * | 2007-05-29 | 2008-12-04 | At&T Corp. | Method and apparatus for identifying acoustic background environments to enhance automatic speech recognition |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108028043A (zh) * | 2015-09-24 | 2018-05-11 | 微软技术许可有限责任公司 | 在参与者之间的对话中检测可行动项 |
CN109076083A (zh) * | 2016-04-29 | 2018-12-21 | 微软技术许可有限责任公司 | 促进数字个人助理之间的交互 |
CN109076083B (zh) * | 2016-04-29 | 2021-08-24 | 微软技术许可有限责任公司 | 促进数字个人助理之间的交互 |
CN109716325A (zh) * | 2016-09-13 | 2019-05-03 | 微软技术许可有限责任公司 | 计算机化的自然语言查询意图分派 |
CN109716325B (zh) * | 2016-09-13 | 2023-09-12 | 微软技术许可有限责任公司 | 计算机化的自然语言查询意图分派 |
CN111428721A (zh) * | 2019-01-10 | 2020-07-17 | 北京字节跳动网络技术有限公司 | 词语释义的确定方法、装置、设备及存储介质 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102737096A (zh) | 基于位置的会话理解 | |
US10755713B2 (en) | Generic virtual personal assistant platform | |
TWI540449B (zh) | 用於基於位置的會話理解的方法、電腦可讀取儲存裝置、及系統 | |
US7716056B2 (en) | Method and system for interactive conversational dialogue for cognitively overloaded device users | |
JP2020161153A (ja) | ダイアログ・システムにおけるパラメータ収集および自動ダイアログ生成 | |
US8321226B2 (en) | Generating speech-enabled user interfaces | |
KR101130351B1 (ko) | 영숫자 개념용 음성 인식 문법 생성 | |
CN116235245A (zh) | 改进语音识别转录 | |
US7072838B1 (en) | Method and apparatus for improving human-machine dialogs using language models learned automatically from personalized data | |
US11711469B2 (en) | Contextualized speech to text conversion | |
US8315874B2 (en) | Voice user interface authoring tool | |
JP2018072560A (ja) | 情報処理システム、情報処理装置及び情報処理方法 | |
KR20200011198A (ko) | 대화형 메시지 구현 방법, 장치 및 프로그램 | |
CN115731921A (zh) | 用无序实体训练端到端口语理解系统 | |
US20040034532A1 (en) | Filter architecture for rapid enablement of voice access to data repositories | |
US11756550B1 (en) | Integration of speech processing functionality with organization systems | |
KR20160101302A (ko) | 고객센터 상담 자동 요약 및 분류 시스템 및 그 방법 | |
KR102263973B1 (ko) | 인공지능 기반 일정관리 시스템 | |
CN114283810A (zh) | 改进语音识别转录 | |
Griol et al. | Combining Several User Models to Improve and Adapt the Dialog Management Process in Spoken Dialog Systems | |
Celestino | Development and implementation of an automotive virtual assistant | |
KR20220053182A (ko) | 음성 기록을 위한 음성 인식률을 향상시키는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 | |
KR101483945B1 (ko) | 의미 분석이 가능한 음성 인식 방법 및 이를 위한 음성 인식 장치 | |
Putois et al. | D5. 1.2: Final Communication Architecture and Module Interface Definitions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150729 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20150729 Address after: Washington State Applicant after: Micro soft technique license Co., Ltd Address before: Washington State Applicant before: Microsoft Corp. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |