CN105814535B - 呼叫中的虚拟助理 - Google Patents
呼叫中的虚拟助理 Download PDFInfo
- Publication number
- CN105814535B CN105814535B CN201480052266.9A CN201480052266A CN105814535B CN 105814535 B CN105814535 B CN 105814535B CN 201480052266 A CN201480052266 A CN 201480052266A CN 105814535 B CN105814535 B CN 105814535B
- Authority
- CN
- China
- Prior art keywords
- user
- virtual assistant
- voice communication
- voice
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 claims abstract description 114
- 230000006854 communication Effects 0.000 claims abstract description 114
- 230000004044 response Effects 0.000 claims abstract description 27
- 230000005236 sound signal Effects 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 30
- 230000008521 reorganization Effects 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 230000002401 inhibitory effect Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000001413 cellular effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/35—Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
- H04M2203/355—Interactive dialogue design tools, features or methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/35—Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
- H04M2203/357—Autocues for dialog assistance
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
Abstract
用于在用户之间的语音通信期间提供虚拟助理以便辅助所述用户的技术。例如,操作装置的第一用户可以与一个或多个另外用户的相应装置,诸如与第二用户的装置,建立语音通信。例如,所述第一用户可以利用她的装置以向所述第二用户的所述装置发出电话呼叫。虚拟助理还可以接入所述呼叫,并且一旦由呼叫中的用户调用,其可以识别来自所述呼叫的语音命令并可以为所述用户执行对应任务作为响应。
Description
相关申请
本申请要求2013年9月25日提交的标题为“In-Call Virtual Assistants”的美国专利申请号14/037,077的优先权,所述申请以引用的方式整体并入本文。
技术领域
本发明涉及用于在用户之间的语音通信期间提供虚拟助理以便辅助用户的技术。
背景技术
语音通信系统允许彼此远离的用户通过一系列不同装置通信。一些装置(诸如移动电话)通过网络将语音数据发送到最终用户装置。配置具有网络摄像机的其他装置(诸如膝上计算机或平板)将语音数据和视频数据两者发送到最终用户装置。不管用户单独使用音频或使用音频和视频两者进行通信,这些语音通信系统在大量的用户中增加了连通性。
发明内容
本公开部分地描述用于在用户之间的语音通信期间提供虚拟助理以便辅助用户的技术。例如,操作装置的第一用户可以与一个或多个另外用户的相应装置诸如与第二用户的装置建立语音通信。例如,第一用户可以利用她的装置以向第二用户的装置发出电话呼叫或其他语音通信。此通信可以通过公共交换电话网络(PSTN)、蜂窝网络、互联网语音协议(VOIP)网络等等开始。
在建立语音通信后,或作为建立此通信的一部分,所述技术可以将另一个计算装置接入到语音通信,即托管虚拟助理用于为一个或两个用户执行任务的计算装置。例如,用户可以在语音通信期间询问特定区域的温度预报,可以要求虚拟助理安排会议或购买电影票等等。在从表示语音通信的音频的音频信号识别语音命令后,虚拟助理可以获得关于语音命令的信息,并且可以通过语音通信或通过频带外通信将所述信息输出到用户。例如,如果用户询问虚拟助理当前温度,那么托管虚拟助理的计算装置可以使用自动语音辨识以便识别语音命令,并且此后可以获得所述信息(即,在用户的位置处的当前温度)并且可以使用文本到语音来向将当前温度输出至参加电话呼叫的用户。另外地或另选地,托管虚拟助理的计算装置可以通过另一个信道提供此信息,诸如通过文本消息、电子邮件或任何其他类型的推送通知服务或协议。
在将虚拟助理接入到语音通信后,当相应用户需要虚拟助理的辅助时,语音通信上的用户中的一个或两个可以调用虚拟助理。用户可以用一些方式调用助理。例如,用户可以说出预定义的话语(例如,词、短语、声音或其组合),当由托管虚拟助理的计算装置识别时,使得计算装置为了识别语音命令的目的开始对表示语音通信的音频的音频信号执行语音辨识。例如,当虚拟助理在语音通信上但是没有被调用时,虚拟助理可以仅针对预定义的话语监控表示语音通信的音频的音频信号,但是不可以对表示音频的音频信号执行进一步的语音辨识。一旦识别关键字匹配(或大于阈值的所陈述词或短语与预定义话语之间的相似度),虚拟助理可以开始对表示语音通信的音频的音频信号执行语音辨识以便识别后续语音命令。
同时在其他实例中,电话呼叫上的用户可以用一些一个或多个其他方式调用虚拟助理。例如,用户可以通过选择用户的装置上的预定义的软按钮或物理按钮(例如,装置的小键盘上的磅(#)符号)、通过以预定义的方式移动装置(如由装置的加速度计或陀螺仪确定)等等来调用助理。在另外的其他实例中,可以响应一个或多个其他触发,诸如向特定用户的电话呼叫的发出、基于一个或多个两个用户的当前地理位置等等,调用虚拟助理。
在任何事件中,在调用虚拟助理后,虚拟助理可以开始执行语音辨识以便识别语音命令并且可以尝试识别提供命令的用户。虚拟助理可以用任何数量的方式识别此用户。例如,虚拟助理可以利用由通信网络(例如,PSTN、蜂窝网络等等)提供的信息。此信息可以包括指示与开始语音通信的装置相关联的电话号码的自动号码识别(ANI)、或指示与接收电话呼叫的装置相关联的电话号码的被叫方号码(CPN)。虚拟助理可以查询这些电话号码中的一者或两者并且可以将这些号码映射到用户。此后,虚拟助理可以在执行由用户请求的任务中使用此识别。例如,如果用户询问“外面的温度是多少”,那么虚拟助理可以为了确定用户的当前位置和在那个位置处的当前温度的目的参考与用户相关联的用户简介。在另一个示例中,如果用户要求“请在我们(呼叫中的人)之间安排会议”,那么虚拟助理可以参考与电话呼叫中的人相关联的日程表以便确定对于这种会议充分的时间和地点。
除了或替代使用由通信网络提供的信息,虚拟助理可以使用语音辨识技术来识别调用用户。例如,用户可以初始地利用虚拟助理“登记”他们的声纹或语音签名,以使得此声纹可以随后用来基于他们的语音特征识别用户。例如,虚拟助理可以比较调用用户的语音特征与一个或多个所存储语音签名的对应特征以便识别调用用户。定义用户的“语音签名”的这些语音特征可以包括音高、音调、频率、振幅、语法或任何其他音频特征。
在又一个示例中,虚拟助理可以通过参与和用户的对话来确定用户的身份。例如,虚拟助理可以请求用户陈述他的或她的姓名连同口令、对秘密问题的答案等等。在一些实例中,虚拟助理可以驻留在电话服务上,或可以与电话服务交互,以使得虚拟助理可以在调用用户陈述他的或她的口令时,将与非调用用户的呼叫分支放置到双向静音上。当然,虚拟助理还可以在频带外信道中与调用用户一起工作以便识别并认证用户。例如,一旦调用用户陈述他的或她的姓名,虚拟助理可以识别与用户相关联的电话号码、电子邮件地址等等,并且可以向那个号码或地址发送通信,从而要求用户确认他的或她的身份。一旦利用虚拟助理认证,虚拟助理可以执行由用户请求的动作。
在识别语音命令和请求用户的身份(和/或在呼叫的另一端上的用户的身份)后,虚拟助理可以确定用于作为响应执行的动作,所述动作可以包括在电话呼叫期间向用户提供对于输出一些可听内容有效的输出音频信号。例如,输出可以包括通知用户当前温度、指示会议已经安排、确认虚拟助理已经使用用户的支付信息在所请求时间为调用用户购买所请求的电影票等等。此外,在执行动作后,虚拟助理可以从“活动”模式转换回到“备用”模式中,在所述“备用”模式中虚拟助理保持在呼叫中但是等待调用。也就是,虚拟助理可以监控表示用于预定义话语的音频的音频信号,所述音频信号当被辨识时调用助理,但是助理以其他方式不对表示语音通信的音频的音频信号执行语音辨识。
如本文所使用,虚拟助理包括被配置成在用户之间的电话通信期间与一个或多个用户交互的软件、硬件或固件中的任何一个或组合。在一些实例中,虚拟助理包括用于对在语音通信的用户之间的音频执行语音辨识的功能性或用于执行动作作为响应的功能性。另外地或另选地,虚拟助理可以将信息输出至用户中的一个或两个(或如果多于两个参加语音通信的话,更多用户)。此信息可以作为语音通信的一部分输出和/或可以在频带外信道(例如,通过电子邮件、文本消息等等)中输出。在一些实例中,虚拟助理可听地(例如,在语音通信期间模仿人类语音)、文本地(例如,通过电子邮件或文本消息)或以任何其他方式输出此信息。
附图说明
详细说明参照附图来描述。在图中,参考数字中最左侧的数字标识首次出现该参考数字的图。在不同的图中使用的相同参考数字指示类似或相同的部件或特征。
图1示出包括第一用户使用装置以与第二用户的装置建立语音通信的说明性计算架构。所述架构还包括虚拟助理模块,所述虚拟助理模块实现被配置成由第一用户或第二用户调用并且作为响应识别来自调用用户的语音命令并且作为响应执行对应任务的虚拟助理。
图2A示出图1的第一用户拨号第二用户,以及第一用户的装置上的应用自动拨号与实现虚拟助理的一个或多个计算装置相关联的电话号码的示例性序列。
图2B示出图1的第一用户拨号第二用户此后在虚拟助理中开会的示例性序列。
图3示出图1的第一用户调用虚拟助理的示例序列以及识别和认证用户的虚拟助理的一个示例。
图4描写了虚拟助理模块可以实现的示例性过程的流程图。
具体实施方式
上文介绍的装置和技术可以在各种不同的架构和情境中实现。下文描述一个非限制性和说明性实现方式。
图1示出包括第一用户102(1)使用装置104(1)以通过网络106与第二用户102(2)的装置104(2)建立语音通信的说明性计算架构100。装置104(1)和104(2)可以包括能够维持彼此之间的语音通信的任何种类的计算装置,诸如蜂窝电话、智能电话、平板计算装置、台式计算装置、游戏主机或执行使这些装置能够建立这种通信的应用的任何其他类型的装置。如本文所使用,“语音通信”包括任何类型的通信,其中音频在用户装置之间传递,所述通信包括仅语音通信、音频/视频通信等等。同时网络106可以包括用于在用户装置之间提供语音数据的有线网络或无线网络中的任何一个或组合。例如,网络106可以包括PSTN、VoIP网络等等。
如图所示,架构100还可以包括一个或多个远程计算资源108,所述远程计算资源108可以托管虚拟助理模块110,所述虚拟助理模块110实现配置用于由第一用户102(1)或第二用户102(2)调用的虚拟助理。在语音通信期间响应于调用虚拟助理的这些用户中的一个,虚拟助理模块110可以识别来自调用用户的语音命令并且作为响应执行对应任务。
如图所示,远程计算资源108可以被实现为一个或多个服务器112(1)、112(2)、…、112(P),并且在一些实例中,可以形成网络可访问计算平台的一部分,所述计算平台被实现为通过诸如互联网的网络维持和可访问的处理器、存储装置、软件、数据访问等等的计算基础设施。远程计算资源108不要求最终用户知道递送服务的系统的物理位置和配置。用于这些远程计算资源108的相关联公共表达包括“按需式计算”、“软件即服务(SaaS)”、“平台计算”、“网络可访问平台”、“云服务”、“数据中心”等等。在一些实现方式中,远程计算资源108可以形成电话服务的全部或一部分,所述电话服务作用于在用户装置之间建立语音通信(例如,电话呼叫)并且托管用于辅助语音通信的虚拟助理。
服务器112(1)-(P)可以包括处理器114和存储虚拟助理模块110的存储器116。如图所示,虚拟助理模块110存储或以其他方式具有对接入模块118、调用模块120、语音辨识引擎122、说话者识别(ID)模块124和响应模块126的访问。接入模块118作用于将虚拟助理功能性(即,模块110的部件)接入到在示例用户装置104(1)与104(2)之间的语音通信。如图1所示,用户装置104(1)和104(2)两者可以与特定电话号码或装置可以可达的其他端点标识符相关联。此外,图1示出托管虚拟助理模块110的计算资源108也可以与电话号码(在此,“800-234-7894”)相关联。如此,一旦装置拨号此号码并在托管虚拟助理模块110的计算资源中开会,接入模块118可以允许虚拟助理模块110接入语音通信。当然,尽管图1示出计算资源108和相应客户端装置104与电话号码相关联,但是这些装置可以与一系列的其他端点标识符诸如统一资源标识符(URI)、VoIP端点标识符、会话启动协议(SIP)标识符等等相关联并且在所述系列的其他端点标识符处可达。
在所示示例中,一旦用户102(1)使用装置104(1)以拨号与装置104(2)相关联的号码,在装置104(1)上运行的应用可以自动地拨号与虚拟助理模块110相关联的号码用于接入模块110。例如,图1示出装置104(1)可以包括用于自动地拨号此号码的虚拟助理模块110。同时在另一个示例中,用户102(1)和/或用户102(2)可以通过将一方增加到语音通信并且拨号与计算资源108相关联的号码来手动地在计算资源108中开会。在任一实例中,虚拟助理模块110可以接收进入的电话呼叫的指示并且可以“应答”进入的呼叫以便接入呼叫。
在虚拟助理模块110接入呼叫后,调用模块120可以监控触发以便调用模块110的其他部件,诸如语音辨识引擎122。例如,调用模块120可以寻求识别由用户中的一个或两个说出的预定义话语,并且一旦识别此预定义话语,可以调用语音辨识引擎122。在其他示例中,调用模块120可以等待文本消息或来自用户的其他通信以便调用虚拟助理模块110的部件。
在接收对调用这些部件的请求后,调用模块可以调用语音辨识引擎122。语音辨识引擎122对基于由用户装置104(1)和104(2)的麦克风捕获的声音,诸如由用户102(1)和102(2)说出的话语,而生成的音频信号执行语音辨识。同时说话者ID模块124可以通过由语音网络(例如,ANI、CPN等等)、语音辨识、与用户的对话、与用户的频带外通信等等提供的信息来识别说出语音命令的用户的身份。
同时响应模块126可以响应于辨识来自表示语音通信的音频的音频信号的不同语音命令来执行某些动作。这可以包括将音频输出至装置104(1)和104(2)中的一个或两个。
尽管图1示出驻留在远离装置104(1)和104(2)的计算装置(例如,计算资源108)上的虚拟助理模块110,但是在其他实例中,虚拟助理模块110的部件可以使用户装置104(1)和104(2)中的一个或两个驻留在一个或多个其他实体上,或遍及多个其他位置。
不管语音辨识发生在何处,虚拟助理模块110可以从用户102(1)和102(2)接收声音输入,并且语音辨识引擎122可以执行语音辨识以便解释用户的操作请求或命令。请求可以基本上是对于任何类型的操作,诸如数据库查询、请求和消费娱乐(例如,游戏、查找和播放音乐、电影或其他内容等等)、人事管理(例如,日程指定、做笔记等等)、在线购物、金融交易等等。
为了提供一个示例,图1示出参与虚拟助理模块110接入的语音通信的用户102(1)和102(2)。在128(1)处,用户102(2)陈述以下内容:“我很兴奋明天飞往那里。温度将会怎么样?”作为响应,用户102(1)在128(2)处陈述以下内容:“我不知道。虚拟助理,明天的温度会怎么样?”在此示例中,响应于识别预定义短语“虚拟助理”,调用模块120调用识别来自128(2)的语音命令的语音辨识引擎122。说话者ID模块124使用上文所述的技术中的任何一个来识别用户102(1)。响应模块126然后使用此识别以便确定检查温度所在的地理位置(即,用户102(1)的位置),检查那个位置处下一天的预报,并且在128(3)处将以下内容输出到两个装置:“明天西雅图的高温是72度。”
图2A示出用户102(1)拨号用户102(2)和用户102(1)的装置104(1)上的应用自动拨号与实现虚拟助理的计算资源108相关联的电话号码或其他端点标识符的示例序列。在“1”处,用户拨号与用户102(2)的装置104(2)相关联的电话号码。在“2”处,应用(例如,虚拟助理模块110)自动拨号与装置104(2)相关联的电话号码(444-555-1245)和与虚拟助理模块110相关联的电话号码(800-234-7894)两者。在“3”处,用户102(2)应答电话呼叫,并且用户102(2)和虚拟助理两者现在在电话呼叫中。虚拟助理保持在呼叫中等待调用,如上文所描述以及下文参考图3所示。
图2B示出用户102(1)将虚拟助理模块接入至语音通信的另一个示例序列。在“1”处,用户102(1)拨号与装置104(2)相关联的电话号码。在“2”处,用户102(2)应答呼叫,从而在装置104(1)与装置104(2)之间建立语音通信。在“3”处,用户102(1)(或用户102(2))通过拨号相关联的号码在虚拟助理模块110中开会。在“4”处,虚拟助理应答呼叫并且进入语音通信开会,从而制造多路会议呼叫。在一些实例中,可以响应于被接入呼叫自动地调用虚拟助理(不管接入使用图2A还是图2B的实施方案发生),而在其他实例中,可以接入但不调用虚拟助理。此外,尽管所示示例描述两个移动装置连同虚拟助理的描述,但是在一些实例中,可以将任何数量的用户装置接入到语音通信中。
图3示出用户102(1)调用虚拟助理的示例序列以及识别和认证用户102(1)的虚拟助理的一个示例。在“1”处,用户102(1)调用已经接入语音通信的虚拟助理。此调用可以包括用户102(1)说出预定义的话语、选择装置104(1)上的预定义的软按钮或物理按钮等等。在后一实例中,虚拟助理接收由用户中的一个做出的按钮的选择的指示。在“2”处,虚拟助理指示用户102(1)提供用户的口令,并且还可以通知用户102(1)呼叫中的另一个用户(102(2))将听不到口令交换。在“3”处,虚拟助理执行对应于用户102(2)的呼叫分支的双向静音,以使得用户102(2)不能够听到虚拟助理与用户102(1)之间的交换。在“4”处,用户102(2)事实上被静音并且不能够听到交换。最后,在“5”处,用户102(1)提供口令(例如,可听地),所述口令如果正确可以调用虚拟助理,从而使助理对对应于用户102(2)的呼叫分支解除静音,并且使助理开始对表示来自语音通信的音频的音频信号执行语音辨识以为了识别和响应于其中的语音命令的目的。
图4描写虚拟助理模块110可以实现的示例过程400的流程图。本文所描述的每个过程作为逻辑流程图示出,其每个操作代表可在硬件、软件或其组合中实现的一系列操作。在软件情境内,操作代表存储于一个或多个计算机可读介质上的计算机可执行指令,当由一个或多个处理器来执行时,执行所列举的操作。总体上,计算机可执行指令包括例行程序、程序、对象、部件、数据结构等,其执行特定功能或实施特定抽象数据类型。
计算机可读介质可以包括非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质可以包括硬盘驱动器、软盘、光盘、CD-ROM、DVD、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、闪速存储器、磁卡或光卡、固态存储器装置或适用于存储电子指令的其他类型的存储介质。另外,在一些实施方案中,计算机可读介质可包括暂时性计算机可读信号(呈压缩或未压缩的形式)。计算机可读信号(无论是否使用载波调制)的实例包括但不限于托管或运行计算机程序的计算机系统可被配置来访问的信号,包括通过因特网或其他网络下载的信号。最后,不希望将描述操作的次序理解为限制性,并且任何数量所描述的操作可以任何次序和/或并行组合来实施此过程。
过程400包括在402处,将虚拟助理接入到在第一用户的装置与第二用户的装置之间建立的语音通信。在404处,虚拟助理可以从语音通信的音频内识别预定义的话语,并且作为响应,可以在406处调用其本身,从而使其本身准备好识别在语音通信的音频内的后续语音命令。
在408处,假设已经调用虚拟助理,虚拟助理可以开始对表示语音通信的音频的音频信号执行语音辨识。在410处,助理可以识别来自表示音频的音频信号的语音命令。作为响应,虚拟助理在412处可以执行与语音命令相关联的任务,并且可以在414处提供对于向两个用户装置输出可听内容有效的音频信号。例如,虚拟助理可以识别温度并输出温度,购买物品并输出购买的指示,安排约会并输出会面的时间、日期和位置等等。
尽管已用特定于结构特征的语言描述了主题,但是将理解,所附权利要求中定义的主题不必限于所述的具体特征。相反,具体特征作为实施权利要求的说明性形式来公开。
条款
1.一种系统,其包括:
一个或多个处理器;以及
一个或多个计算机可读介质,其存储计算机可执行指令,所述计算机可执行指令当被所述一个或多个处理器执行时,使得所述一个或多个处理器执行包括以下项的动作:
在所述第一用户的装置与第二用户的装置之间建立的语音通信期间从第一用户接收在所述语音通信期间调用虚拟助理的请求,一旦调用,所述虚拟助理对表示所述第一用户与第二用户之间的所述语音通信的音频的音频信号执行语音辨识,所述语音辨识的所述执行用于识别来自所述第一用户或所述第二用户中的至少一个的语音命令;
至少部分响应于接收所述请求,对表示所述第一用户与第二用户之间的所述语音通信的所述音频信号执行语音辨识用于识别语音命令;
响应于所述语音辨识的所述执行,识别来自所述第一用户与第二用户之间的所述语音通信的所述音频的语音命令;
至少部分响应于所述语音命令的所述识别,执行对应于所述语音命令的任务;以及
在所述语音通信期间将输出音频信号提供到所述第一用户的所述装置或所述第二用户的所述装置中的至少一个,所述输出音频信号被配置成使得可听输出与在所述用户的所述装置或所述第二用户的所述装置中的至少一个上的所述任务的所述执行相关联。
2.如条款1所述的系统,其中所述请求包括所述第一用户陈述预定义的话语,并且所述动作还包括在识别所述预定义的话语前,在不对表示所述第一用户与第二用户之间的所述语音通信的所述音频的所述音频信号执行语音辨识的情况下,监控表示用于所述预定义话语的所述音频的所述音频信号。
3.如条款1所述的系统,其中:
所述语音命令包括对于信息的请求;
所述任务的所述执行包括定位所述请求的信息;以及
所述输出音频信号的所述提供包括提供被配置成使得所述虚拟助理向所述第一用户和所述第二用户陈述所述请求的信息的输出音频信号。
4.如条款1所述的系统,其中所述语音通信包括将所述第一用户的所述装置与所述第二用户的所述装置以及与所述虚拟助理相关联的系统连接的会议呼叫。
5.如条款1所述的系统,其中与所述虚拟助理相关联的所述系统包括电话服务,所述电话服务在所述第一用户与所述第二用户之间建立所述语音通信。
6.一种方法,其包括:
在第一用户的装置与第二用户的装置之间的语音通信期间接收调用虚拟助理的请求;
至少部分响应于所述接收对表示所述语音通信的音频的音频信号执行语音辨识;
响应于所述语音辨识的所述执行,识别来自所述第一用户或所述第二用户中的至少一个的语音命令;以及
由所述虚拟助理向所述第一用户的所述装置或所述第二用户的所述装置中的至少一个提供输出音频信号,所述输出音频信号用于在所述语音通信期间输出可听内容。
7.如条款6所述的方法,其中所述请求包括所述第一用户或所述第二用户陈述预定义的话语,并且还包括识别来自表示所述语音通信的所述音频的所述音频信号内的所述预定义的话语,所述语音辨识的所述执行至少部分响应于所述预定义话语的所述识别发生。
8.如条款6所述的方法,其中对调用所述虚拟助理的所述请求的所述接收包括以下至少一项:
从所述第一用户的所述装置或所述第二用户的所述装置接收进入的电话呼叫的指示;或
接收所述第一用户或所述第二用户已经激活相应装置的物理按钮或软按钮的指示。
9.如条款6所述的方法,所述动作还包括将托管所述虚拟助理的装置接入到所述第一用户的所述装置与所述第二用户的所述装置之间的所述语音通信,作为在所述第一用户的所述装置与所述第二用户的所述装置之间建立所述语音通信的一部分。
10.如条款6所述的方法,所述动作还包括将托管所述虚拟助理的装置接入到所述第一用户的所述装置与所述第二用户的所述装置之间的所述语音通信,作为在所述第一用户的所述装置与所述第二用户的所述装置之间建立所述语音通信的一部分,并且其中不调用所述虚拟助理直到所述请求的所述接收。
11.如条款6所述的方法,所述动作还包括:
在所述第一用户的所述装置与所述第二用户的所述装置之间建立语音通信后,从所述第一用户或所述第二用户接收所述虚拟助理接入所述语音通信的请求;以及
并且至少部分响应于来自所述第一用户或所述第二用户的所述虚拟助理接入所述语音通信的所述请求的所述接收,接入所述虚拟助理。
12.如条款11所述的方法,其中所述虚拟助理接入所述语音通信的所述请求包括所述第一用户或所述第二用户拨号与所述虚拟助理相关联的电话号码。
13.如条款6所述的方法,所述动作还包括识别提供所述语音命令的用户,并且其中输出的所述可听内容至少部分基于所述用户的所述识别。
14.如条款13所述的方法,其中所述用户的所述识别包括:
参考指示与开始所述语音通信的装置相关联的电话号码的自动号码识别(ANI)或指示与接收对建立所述语音通信的请求的装置相关联的电话号码的被叫方号码(CPN)中的至少一个;以及
将所述ANI或所述CPN中的至少一个映射到相关联的用户。
15.如条款13所述的方法,其中所述用户的所述识别包括比较所述第一用户或所述第二用户的语音的频率、振幅、音高或另一个音频特征中的至少一个与一个或多个预存储的语音签名。
16.如条款13所述的方法,其还包括请求利用所述虚拟助理认证提供所述语音命令的所述用户。
17.如条款16所述的方法,其中所述用户利用所述虚拟助理认证的所述请求包括以下至少一项:
通过除了所述语音通信之外的通信信道与所述用户通信;或
通过所述语音通信与所述用户通信,所述虚拟助理在未提供所述语音命令的所述用户的所述装置处使所述语音通信静音,同时所述虚拟助理通过所述语音通信与提供所述语音命令的所述用户通信。
18.如条款6所述的方法,其中所述虚拟助理至少部分驻留在所述第一用户的所述装置、所述第二用户的所述装置、或远离所述第一用户的所述装置和所述第二用户的所述装置两者的计算装置上。
19.一种或多种计算机可读介质,其存储计算机可执行指令,所述计算机可执行指令当被所述一个或多个处理器执行时,使得所述一个或多个处理器执行包括以下项的动作:
将计算装置接入到在两个用户装置之间的语音通信,所述计算装置远离所述两个用户装置;
一旦所述两个用户装置中的一个的用户调用所述计算装置,由所述计算装置对表示所述语音通信的音频的音频信号执行语音辨识;以及
响应于对表示所述音频的所述音频信号执行所述语音辨识来识别来自所述两个装置中的一个的用户的语音命令。
20.如条款19所述的一种或多种计算机可读介质,所述动作还包括至少部分响应于所述语音命令的所述识别执行对应于所述语音命令的任务。
21.如条款19所述的一种或多种计算机可读介质,所述动作还包括至少部分响应于所述语音命令的识别或至少部分响应于执行对应于所述语音命令的任务,在所述语音通信上提供对于输出可听内容有效的输出音频信号并将其提供到所述两个用户装置中的至少一个。
22.如条款19所述的一种或多种计算机可读介质,其中一旦所述两个用户装置中的一个将所述语音通信发出到所述两个用户装置中的另一个,所述接入自动地发生。
23.如条款19所述的一种或多种计算机可读介质,其中一旦所述两个用户装置中的一个在所述两个用户装置建立所述语音通信后使用与所述计算装置相关联的电话号码开始会议呼叫,所述接入发生。
24.如条款19所述的一种或多种计算机可读介质,其中所述语音通信包括通过公共交换电话网络(PSTN)、蜂窝网络或互联网语音协议(VoIP)网络的通信。
Claims (15)
1.一种实现虚拟助理的语音通信系统,所述语音通信系统包括:
一个或多个处理器;以及
一个或多个计算机可读介质,其存储计算机可执行指令,所述计算机可执行指令当被所述一个或多个处理器执行时,使得所述一个或多个处理器执行包括以下项的动作:
将由计算装置托管的所述虚拟助理接入到第一用户的第一装置和第二用户的第二装置之间的语音通信数据的交换,所述计算装置远离所述第一装置和所述第二装置;
由托管所述虚拟助理的所述计算装置接收所述第一装置和所述第二装置之间所交换的所述语音通信;
对表示所述第一装置与所述第二装置之间所交换的所述语音通信数据的音频的音频信号的第一部分执行语音辨识;
识别所述音频信号的所述第一部分中的预定义的话语;
至少部分基于识别所述预定义的话语,调用所述虚拟助理;
对表示所述第一装置与所述第二装置之间所交换的所述语音通信数据的所述音频信号的第二部分执行语音辨识;
从所述音频信号的所述第二部分识别语音命令,所述语音命令独立于所述预定义的话语,并且在所述预定义的话语之后发生;
至少部分基于对所述语音命令的所述识别,执行对应于所述语音命令的任务;以及
将输出音频信号提供到所述第一装置或所述第二装置中的至少一个,所述输出音频信号被配置成使得可听输出与在所述第一装置或所述第二装置中的至少一个上的所述任务的所述执行相关联。
2.如权利要求1所述的语音通信系统,其中:
所述语音命令包括对于信息的请求;
所述任务的所述执行包括定位所述信息;以及
所述输出音频信号的所述提供包括提供被配置成使得所述虚拟助理向所述第一用户和所述第二用户陈述所述信息的输出音频信号。
3.如权利要求1所述的语音通信系统,其中所述第一装置,所述第二装置以及托管所述虚拟助理的所述计算装置被可通信地耦合。
4.如权利要求1所述的语音通信系统,其中托管所述虚拟助理的所述计算装置与电话服务相关联,所述电话服务在所述第一装置与所述第二装置之间交换所述语音通信数据。
5.如权利要求1所述的语音通信系统,所述动作还包括抑制对所述音频信号的第三部分执行语音辨识,所述第三部分在所述第二部分之后。
6.一种实现虚拟助理的方法,所述方法包括:
将由计算装置托管的所述虚拟助理接入到第一用户的第一装置与第二用户的第二装置之间的语音通信数据的交换,所述计算装置远离所述第一装置和所述第二装置;
由托管所述虚拟助理的所述计算装置接收所述第一装置和所述第二装置之间所交换的所述语音通信数据;
对表示所述第一装置与所述第二装置之间所交换的所述语音通信数据的音频的音频信号的第一部分执行语音辨识;
识别所述音频信号的所述第一部分中的预定义的话语;
至少部分基于识别所述预定义的话语,调用所述虚拟助理;
对表示所述第一装置与所述第二装置之间所交换的所述语音通信数据的所述音频信号的第二部分执行语音辨识;
从所述音频信号的所述第二部分识别语音命令,所述语音命令独立于所述预定义的话语,并且在所述预定义的话语之后发生;
至少部分基于对所述语音命令的所述识别,执行对应于所述语音命令的任务;以及
由所述虚拟助理向所述第一装置或所述第二装置中的至少一个提供输出音频信号,所述输出音频信号用于在所述语音通信期间输出可听内容。
7.如权利要求6所述的方法,还包括响应于所述预定义话语的所述识别,执行对所述音频信号的所述第二部分的所述语音辨识。
8.如权利要求6所述的方法,还包括接收所述第一装置和所述第二装置正在交换语音通信数据的指示,包括以下中的至少一项:
从所述第一装置或所述第二装置接收进入的电话呼叫的指示;或
接收所述第一用户或所述第二用户已经激活相应装置的物理按钮或软按钮的指示。
9.如权利要求6所述的方法,还包括将托管所述虚拟助理的所述计算装置接入到所述第一装置与所述第二装置之间的通信。
10.如权利要求6所述的方法,还包括识别提供所述语音命令的用户,并且其中所述可听内容至少部分基于所述用户的所述识别。
11.如权利要求10所述的方法,其中所述用户的所述识别包括:
参考指示与发起所述语音通信数据的所述交换的装置相关联的电话号码的自动号码识别,或指示与接收对建立语音通信的请求的装置相关联的电话号码的被叫方号码中的至少一个;以及
将所述自动号码识别或所述被叫方号码中的所述至少一个映射到相关联的用户。
12.如权利要求10所述的方法,其中所述用户的所述识别包括比较所述第一用户或所述第二用户的语音的频率、振幅、音高或另一个音频特征中的至少一个与一个或多个预存储的语音签名。
13.如权利要求10所述的方法,其还包括请求利用所述虚拟助理认证提供所述语音命令的所述用户。
14.如权利要求6所述的方法,还包括抑制对所述音频信号的第三部分执行语音辨识,所述第三部分在所述第二部分之后。
15.如权利要求6所述的方法,还包括确定与所述第一用户或所述第二用户相关联的用户简介。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/037,077 | 2013-09-25 | ||
US14/037,077 US10134395B2 (en) | 2013-09-25 | 2013-09-25 | In-call virtual assistants |
PCT/US2014/056739 WO2015047932A1 (en) | 2013-09-25 | 2014-09-22 | In-call virtual assistants |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105814535A CN105814535A (zh) | 2016-07-27 |
CN105814535B true CN105814535B (zh) | 2019-12-03 |
Family
ID=52691718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480052266.9A Active CN105814535B (zh) | 2013-09-25 | 2014-09-22 | 呼叫中的虚拟助理 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10134395B2 (zh) |
EP (1) | EP3050051B1 (zh) |
JP (1) | JP6318255B2 (zh) |
CN (1) | CN105814535B (zh) |
WO (1) | WO2015047932A1 (zh) |
Families Citing this family (239)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7303474B2 (en) * | 2003-06-24 | 2007-12-04 | At&T Bls Intellectual Property, Inc. | Methods and systems for establishing games with automation using verbal communication |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
KR20150046100A (ko) | 2012-08-10 | 2015-04-29 | 뉘앙스 커뮤니케이션즈, 인코포레이티드 | 전자 디바이스에 대한 가상 에이전트 통신 |
US9659298B2 (en) * | 2012-12-11 | 2017-05-23 | Nuance Communications, Inc. | Systems and methods for informing virtual agent recommendation |
DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3937002A1 (en) | 2013-06-09 | 2022-01-12 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US10534623B2 (en) | 2013-12-16 | 2020-01-14 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US10147441B1 (en) * | 2013-12-19 | 2018-12-04 | Amazon Technologies, Inc. | Voice controlled system |
FR3016458B1 (fr) * | 2014-01-16 | 2017-06-16 | Cie Ind Et Financiere D'ingenierie Ingenico | Procede de securisation d'une transaction realisee par carte bancaire |
US10553098B2 (en) | 2014-05-20 | 2020-02-04 | Ooma, Inc. | Appliance device integration with alarm systems |
US10769931B2 (en) | 2014-05-20 | 2020-09-08 | Ooma, Inc. | Network jamming detection and remediation |
US9633547B2 (en) | 2014-05-20 | 2017-04-25 | Ooma, Inc. | Security monitoring and control |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9509799B1 (en) | 2014-06-04 | 2016-11-29 | Grandios Technologies, Llc | Providing status updates via a personal assistant |
US8995972B1 (en) | 2014-06-05 | 2015-03-31 | Grandios Technologies, Llc | Automatic personal assistance between users devices |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11330100B2 (en) * | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
CN106463112B (zh) | 2015-04-10 | 2020-12-08 | 华为技术有限公司 | 语音识别方法、语音唤醒装置、语音识别装置及终端 |
US10009286B2 (en) | 2015-05-08 | 2018-06-26 | Ooma, Inc. | Communications hub |
US11171875B2 (en) | 2015-05-08 | 2021-11-09 | Ooma, Inc. | Systems and methods of communications network failure detection and remediation utilizing link probes |
US10911368B2 (en) | 2015-05-08 | 2021-02-02 | Ooma, Inc. | Gateway address spoofing for alternate network utilization |
US10460227B2 (en) * | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
CN105204743A (zh) * | 2015-09-28 | 2015-12-30 | 百度在线网络技术(北京)有限公司 | 用于语音和视频通讯的交互控制方法及装置 |
US20170092278A1 (en) * | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10567579B2 (en) * | 2016-08-24 | 2020-02-18 | Vonage Business Inc. | Systems and methods for providing integrated computerized personal assistant services in telephony communications |
US10313779B2 (en) * | 2016-08-26 | 2019-06-04 | Bragi GmbH | Voice assistant system for wireless earpieces |
US10832684B2 (en) | 2016-08-31 | 2020-11-10 | Microsoft Technology Licensing, Llc | Personalization of experiences with digital assistants in communal settings through voice and query processing |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
JP7028179B2 (ja) * | 2016-09-29 | 2022-03-02 | 日本電気株式会社 | 情報処理装置、情報処理方法およびコンピュータ・プログラム |
US10951720B2 (en) | 2016-10-24 | 2021-03-16 | Bank Of America Corporation | Multi-channel cognitive resource platform |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10074371B1 (en) * | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
CN108874460B (zh) * | 2017-05-11 | 2022-12-02 | 达发科技股份有限公司 | 语音传输装置及其执行语音助理程序的方法 |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US11048995B2 (en) * | 2017-05-16 | 2021-06-29 | Google Llc | Delayed responses by computational assistant |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
KR102396729B1 (ko) | 2017-05-16 | 2022-05-12 | 구글 엘엘씨 | 공유된 음성 작동 디바이스상의 호출 핸들링 |
US11074280B2 (en) * | 2017-05-18 | 2021-07-27 | Aiqudo, Inc | Cluster based search and recommendation method to rapidly on-board commands in personal assistants |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10931724B2 (en) * | 2017-07-18 | 2021-02-23 | NewVoiceMedia Ltd. | System and method for integrated virtual assistant-enhanced customer service |
US10791078B2 (en) | 2017-07-30 | 2020-09-29 | Google Llc | Assistance during audio and video calls |
US20190051376A1 (en) | 2017-08-10 | 2019-02-14 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US11316865B2 (en) | 2017-08-10 | 2022-04-26 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
CN109428968B (zh) * | 2017-08-24 | 2021-03-09 | 中兴通讯股份有限公司 | 控制终端的方法、装置及存储介质 |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10531247B2 (en) * | 2017-10-19 | 2020-01-07 | Libre Wireless Technologies Inc. | Internet-of-things devices and related methods for performing in-call interactions |
US10154145B1 (en) * | 2017-11-03 | 2018-12-11 | Republic Wireless, Inc. | Virtual telephony assistant |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US11558467B2 (en) | 2017-12-07 | 2023-01-17 | International Business Machines Corporation | Virtual personal agent leveraging natural language processing and machine learning |
KR102447381B1 (ko) * | 2017-12-08 | 2022-09-27 | 삼성전자주식회사 | 통화 중 인공지능 서비스를 제공하기 위한 방법 및 그 전자 장치 |
US20190196779A1 (en) * | 2017-12-21 | 2019-06-27 | Harman International Industries, Incorporated | Intelligent personal assistant interface system |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10848392B2 (en) * | 2018-02-15 | 2020-11-24 | Lenovo (Singapore) Pte. Ltd. | Systems and methods to use digital assistant to join network |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
WO2019173333A1 (en) | 2018-03-05 | 2019-09-12 | Nuance Communications, Inc. | Automated clinical documentation system and method |
WO2019173340A1 (en) | 2018-03-05 | 2019-09-12 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
US11250382B2 (en) | 2018-03-05 | 2022-02-15 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
JP7186375B2 (ja) * | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10978056B1 (en) | 2018-04-20 | 2021-04-13 | Facebook, Inc. | Grammaticality classification for natural language generation in assistant systems |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
US11115410B1 (en) | 2018-04-20 | 2021-09-07 | Facebook, Inc. | Secure authentication for assistant systems |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US11010436B1 (en) | 2018-04-20 | 2021-05-18 | Facebook, Inc. | Engaging users by personalized composing-content recommendation |
JP7133969B2 (ja) * | 2018-04-27 | 2022-09-09 | シャープ株式会社 | 音声入力装置、及び遠隔対話システム |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11237796B2 (en) * | 2018-05-07 | 2022-02-01 | Google Llc | Methods, systems, and apparatus for providing composite graphical assistant interfaces for controlling connected devices |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
US10847153B2 (en) * | 2018-06-06 | 2020-11-24 | Amazon Technologies, Inc. | Temporary account association with voice-enabled devices |
US11132681B2 (en) | 2018-07-06 | 2021-09-28 | At&T Intellectual Property I, L.P. | Services for entity trust conveyances |
US10949616B1 (en) | 2018-08-21 | 2021-03-16 | Facebook, Inc. | Automatically detecting and storing entity information for assistant systems |
US10896295B1 (en) | 2018-08-21 | 2021-01-19 | Facebook, Inc. | Providing additional information for identified named-entities for assistant systems |
US10802872B2 (en) | 2018-09-12 | 2020-10-13 | At&T Intellectual Property I, L.P. | Task delegation and cooperation for automated assistants |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11119726B2 (en) * | 2018-10-08 | 2021-09-14 | Google Llc | Operating modes that designate an interface modality for interacting with an automated assistant |
US11481186B2 (en) * | 2018-10-25 | 2022-10-25 | At&T Intellectual Property I, L.P. | Automated assistant context and protocol |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US10657968B1 (en) * | 2018-11-19 | 2020-05-19 | Google Llc | Controlling device output according to a determined condition of a user |
FR3089084A1 (fr) * | 2018-11-28 | 2020-05-29 | Orange | Procédé d’accès à distance à un assistant personnel vocal |
KR102701868B1 (ko) | 2018-12-03 | 2024-09-03 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
KR20210091352A (ko) * | 2018-12-12 | 2021-07-21 | 삼성전자주식회사 | 명령 기반형 대화식 시스템 및 그 방법 |
KR102590914B1 (ko) * | 2018-12-14 | 2023-10-19 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US12080284B2 (en) * | 2018-12-28 | 2024-09-03 | Harman International Industries, Incorporated | Two-way in-vehicle virtual personal assistant |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US10490191B1 (en) * | 2019-01-31 | 2019-11-26 | Capital One Services, Llc | Interacting with a user device to provide automated testing of a customer service representative |
GB2582129B (en) * | 2019-02-05 | 2022-08-17 | Meizhou Guo Wei Electronics Co Ltd | DECT portable device base station |
JP2020144209A (ja) * | 2019-03-06 | 2020-09-10 | シャープ株式会社 | 音声処理装置、会議システム、及び音声処理方法 |
US10848619B2 (en) | 2019-03-07 | 2020-11-24 | At&T Intellectual Property I, L.P. | Communications network security for handling proxy voice calls |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11227679B2 (en) | 2019-06-14 | 2022-01-18 | Nuance Communications, Inc. | Ambient clinical intelligence system and method |
US11216480B2 (en) | 2019-06-14 | 2022-01-04 | Nuance Communications, Inc. | System and method for querying data points from graph data structures |
US11043207B2 (en) | 2019-06-14 | 2021-06-22 | Nuance Communications, Inc. | System and method for array data simulation and customized acoustic modeling for ambient ASR |
US11442992B1 (en) | 2019-06-28 | 2022-09-13 | Meta Platforms Technologies, Llc | Conversational reasoning with knowledge graph paths for assistant systems |
US11657094B2 (en) | 2019-06-28 | 2023-05-23 | Meta Platforms Technologies, Llc | Memory grounded conversational reasoning and question answering for assistant systems |
US11531807B2 (en) | 2019-06-28 | 2022-12-20 | Nuance Communications, Inc. | System and method for customized text macros |
US11233831B2 (en) * | 2019-07-31 | 2022-01-25 | Centurylink Intellectual Property Llc | In-line, in-call AI virtual assistant for teleconferencing |
US20230254411A1 (en) * | 2019-08-05 | 2023-08-10 | Bonx Inc. | Group calling system, group calling method, and program |
US11710480B2 (en) * | 2019-08-07 | 2023-07-25 | International Business Machines Corporation | Phonetic comparison for virtual assistants |
US11176940B1 (en) * | 2019-09-17 | 2021-11-16 | Amazon Technologies, Inc. | Relaying availability using a virtual assistant |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11670408B2 (en) | 2019-09-30 | 2023-06-06 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
US11934741B2 (en) * | 2019-10-10 | 2024-03-19 | T-Mobile Usa, Inc. | Enhanced voice user interface experience via preview services on an external assistance channel |
US11567788B1 (en) | 2019-10-18 | 2023-01-31 | Meta Platforms, Inc. | Generating proactive reminders for assistant systems |
US11861674B1 (en) | 2019-10-18 | 2024-01-02 | Meta Platforms Technologies, Llc | Method, one or more computer-readable non-transitory storage media, and a system for generating comprehensive information for products of interest by assistant systems |
US11218565B2 (en) * | 2019-10-23 | 2022-01-04 | Microsoft Technology Licensing, Llc | Personalized updates upon invocation of a service |
US11489794B2 (en) | 2019-11-04 | 2022-11-01 | Bank Of America Corporation | System for configuration and intelligent transmission of electronic communications and integrated resource processing |
TWI722715B (zh) * | 2019-12-13 | 2021-03-21 | 中華電信股份有限公司 | 智能語音助理之模組化系統及其運作方法 |
US11769509B2 (en) * | 2019-12-31 | 2023-09-26 | Microstrategy Incorporated | Speech-based contextual delivery of content |
US11423893B2 (en) * | 2020-01-06 | 2022-08-23 | Lenovo (Singapore) Pte. Ltd. | Response to secondary inputs at a digital personal assistant |
US11240366B2 (en) | 2020-02-03 | 2022-02-01 | Microsoft Technology Licensing, Llc | Digital assistant for emergency calling |
CN111312240A (zh) * | 2020-02-10 | 2020-06-19 | 北京达佳互联信息技术有限公司 | 数据控制方法、装置、电子设备及存储介质 |
US11769497B2 (en) | 2020-02-12 | 2023-09-26 | Apple Inc. | Digital assistant interaction in a video communication session environment |
US11562744B1 (en) | 2020-02-13 | 2023-01-24 | Meta Platforms Technologies, Llc | Stylizing text-to-speech (TTS) voice response for assistant systems |
JP7001241B2 (ja) * | 2020-02-18 | 2022-01-19 | Necプラットフォームズ株式会社 | パケット監視装置、構内交換機、バーチャルアシスタント呼び出し方法、及びプログラム |
US11297186B2 (en) * | 2020-03-11 | 2022-04-05 | Sorenson Ip Holdings, Llc | System, apparatus and method for media communication between parties |
US11551685B2 (en) * | 2020-03-18 | 2023-01-10 | Amazon Technologies, Inc. | Device-directed utterance detection |
WO2021188126A1 (en) * | 2020-03-20 | 2021-09-23 | Google Llc | Semi-delegated calling by an automated assistant on behalf of human participant |
US11159767B1 (en) | 2020-04-07 | 2021-10-26 | Facebook Technologies, Llc | Proactive in-call content recommendations for assistant systems |
US11411950B2 (en) | 2020-04-28 | 2022-08-09 | Bank Of America Corporation | Electronic system for integration of communication channels and active cross-channel communication transmission |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11658835B2 (en) | 2020-06-29 | 2023-05-23 | Meta Platforms, Inc. | Using a single request for multi-person calling in assistant systems |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11665153B2 (en) | 2020-07-24 | 2023-05-30 | Bank Of America Corporation | Voice biometric authentication in a virtual assistant |
CN112291429B (zh) * | 2020-10-23 | 2021-04-30 | 北京蓦然认知科技有限公司 | 一种语音助手的自动学习方法、装置 |
CN112153223B (zh) * | 2020-10-23 | 2021-12-14 | 北京蓦然认知科技有限公司 | 一种语音助手识别并执行被叫用户指令的方法及语音助手 |
US11222103B1 (en) * | 2020-10-29 | 2022-01-11 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
JP7258007B2 (ja) * | 2020-12-24 | 2023-04-14 | オナー デバイス カンパニー リミテッド | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
US11563706B2 (en) | 2020-12-29 | 2023-01-24 | Meta Platforms, Inc. | Generating context-aware rendering of media contents for assistant systems |
US11809480B1 (en) | 2020-12-31 | 2023-11-07 | Meta Platforms, Inc. | Generating dynamic knowledge graph of media contents for assistant systems |
EP4037349B1 (en) * | 2021-02-02 | 2024-04-03 | Deutsche Telekom AG | A method for providing a voice assistance functionality to end user by using a voice connection established over an ip-based telecommunications system |
US20220294903A1 (en) * | 2021-03-12 | 2022-09-15 | Avaya Management L.P. | Virtual private agent for machine-based interactions with a contact center |
US11861315B2 (en) | 2021-04-21 | 2024-01-02 | Meta Platforms, Inc. | Continuous learning for natural-language understanding models for assistant systems |
US12118790B2 (en) | 2021-04-21 | 2024-10-15 | Meta Platforms, Inc. | Auto-capture of interesting moments by assistant systems |
US12045568B1 (en) | 2021-11-12 | 2024-07-23 | Meta Platforms, Inc. | Span pointer networks for non-autoregressive task-oriented semantic parsing for assistant systems |
US20230196305A1 (en) * | 2021-12-20 | 2023-06-22 | Hewlett-Packard Development Company, L.P. | Devices to service physical conditions of rooms |
US20240129432A1 (en) * | 2022-10-13 | 2024-04-18 | Rovi Guides, Inc. | Systems and methods for enabling a smart search and the sharing of results during a conference |
US11983329B1 (en) | 2022-12-05 | 2024-05-14 | Meta Platforms, Inc. | Detecting head gestures using inertial measurement unit signals |
US12112001B1 (en) | 2023-03-14 | 2024-10-08 | Meta Platforms, Inc. | Preventing false activations based on don/doff detection for assistant systems |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1351459A (zh) * | 2000-10-26 | 2002-05-29 | 安捷伦科技有限公司 | 手持式通信和处理装置及其操作方法 |
JP2003032388A (ja) * | 2001-07-12 | 2003-01-31 | Denso Corp | 通信端末装置及び処理システム |
CN100433840C (zh) * | 1999-10-05 | 2008-11-12 | 约莫拜尔公司 | 基于本地中断探测的语音识别技术 |
JP2010109618A (ja) * | 2008-10-29 | 2010-05-13 | Ntt Communications Kk | 認証装置、認証方法、及びプログラム |
CN102177541A (zh) * | 2008-11-14 | 2011-09-07 | 沃科莱特保健系统公司 | 用于能够使用语音的工作环境的训练/指导系统 |
US8457960B2 (en) * | 2005-12-19 | 2013-06-04 | Rockstar Consortium Us Lp | Method and apparatus for detecting unsolicited multimedia communications |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07327081A (ja) | 1994-05-31 | 1995-12-12 | Sharp Corp | 構内交換機における付加サービス提供方法及び構内交換機 |
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US6757362B1 (en) * | 2000-03-06 | 2004-06-29 | Avaya Technology Corp. | Personal virtual assistant |
US20040062373A1 (en) * | 2002-09-30 | 2004-04-01 | Baker Nathan Bryant | Technique for invoking information assistance and services during a call |
US7257537B2 (en) * | 2001-01-12 | 2007-08-14 | International Business Machines Corporation | Method and apparatus for performing dialog management in a computer conversational interface |
US7124300B1 (en) * | 2001-01-24 | 2006-10-17 | Palm, Inc. | Handheld computer system configured to authenticate a user and power-up in response to a single action by the user |
US20030068027A1 (en) * | 2001-10-09 | 2003-04-10 | Dodla Uday Reddy | Methods, systems and computer program products for controlling access to communications systems using quotas |
US6891932B2 (en) * | 2001-12-11 | 2005-05-10 | Cisco Technology, Inc. | System and methodology for voice activated access to multiple data sources and voice repositories in a single session |
US7496357B2 (en) * | 2002-03-04 | 2009-02-24 | At&T Intellectual Property I, L.P. | Automated telephone assistant device and associated methods |
US7720683B1 (en) | 2003-06-13 | 2010-05-18 | Sensory, Inc. | Method and apparatus of specifying and performing speech recognition operations |
US7418392B1 (en) | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
US7573988B2 (en) | 2004-06-02 | 2009-08-11 | Dynalab Inc. | System and method for providing customized voice connection services via gatekeeper |
US7107220B2 (en) * | 2004-07-30 | 2006-09-12 | Sbc Knowledge Ventures, L.P. | Centralized biometric authentication |
US20070249406A1 (en) | 2006-04-20 | 2007-10-25 | Sony Ericsson Mobile Communications Ab | Method and system for retrieving information |
US9318108B2 (en) * | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8983051B2 (en) * | 2007-04-03 | 2015-03-17 | William F. Barton | Outgoing call classification and disposition |
US20080275701A1 (en) | 2007-04-25 | 2008-11-06 | Xiaotao Wu | System and method for retrieving data based on topics of conversation |
WO2008144638A2 (en) * | 2007-05-17 | 2008-11-27 | Redstart Systems Inc. | Systems and methods of a structured grammar for a speech recognition command system |
GB0808448D0 (en) * | 2008-05-09 | 2008-06-18 | Elync Ltd | Secure communication system and method of operating the same |
US8548812B2 (en) * | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
US9858925B2 (en) * | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
EP3610918B1 (en) * | 2009-07-17 | 2023-09-27 | Implantica Patent Ltd. | Voice control of a medical implant |
US8760269B2 (en) | 2010-09-14 | 2014-06-24 | Crestron Electronics Inc. | Control system for augmenting a portable touch screen device |
WO2012063260A2 (en) | 2010-11-09 | 2012-05-18 | Mango Technologies Pvt Ltd. | Virtual secretary on a smart device |
US20120223885A1 (en) | 2011-03-02 | 2012-09-06 | Microsoft Corporation | Immersive display experience |
US8553065B2 (en) | 2011-04-18 | 2013-10-08 | Cisco Technology, Inc. | System and method for providing augmented data in a network environment |
CN103703719B (zh) * | 2011-05-31 | 2018-06-05 | 谷歌有限责任公司 | 使通信会话中的参与者静音的方法及设备 |
EP2737476A4 (en) | 2011-07-28 | 2014-12-10 | Blackberry Ltd | METHOD AND DEVICES FOR COMMUNICATION RELIEF |
US9386147B2 (en) * | 2011-08-25 | 2016-07-05 | Verizon Patent And Licensing Inc. | Muting and un-muting user devices |
US8743743B1 (en) * | 2012-12-18 | 2014-06-03 | Cisco Technology, Inc. | Management of mute and unmute requests during an electronic-conference session |
-
2013
- 2013-09-25 US US14/037,077 patent/US10134395B2/en active Active
-
2014
- 2014-09-22 CN CN201480052266.9A patent/CN105814535B/zh active Active
- 2014-09-22 JP JP2016544045A patent/JP6318255B2/ja active Active
- 2014-09-22 WO PCT/US2014/056739 patent/WO2015047932A1/en active Application Filing
- 2014-09-22 EP EP14850015.0A patent/EP3050051B1/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100433840C (zh) * | 1999-10-05 | 2008-11-12 | 约莫拜尔公司 | 基于本地中断探测的语音识别技术 |
CN1351459A (zh) * | 2000-10-26 | 2002-05-29 | 安捷伦科技有限公司 | 手持式通信和处理装置及其操作方法 |
JP2003032388A (ja) * | 2001-07-12 | 2003-01-31 | Denso Corp | 通信端末装置及び処理システム |
US8457960B2 (en) * | 2005-12-19 | 2013-06-04 | Rockstar Consortium Us Lp | Method and apparatus for detecting unsolicited multimedia communications |
JP2010109618A (ja) * | 2008-10-29 | 2010-05-13 | Ntt Communications Kk | 認証装置、認証方法、及びプログラム |
CN102177541A (zh) * | 2008-11-14 | 2011-09-07 | 沃科莱特保健系统公司 | 用于能够使用语音的工作环境的训练/指导系统 |
Also Published As
Publication number | Publication date |
---|---|
JP6318255B2 (ja) | 2018-04-25 |
EP3050051B1 (en) | 2022-05-25 |
WO2015047932A1 (en) | 2015-04-02 |
JP2016533690A (ja) | 2016-10-27 |
US10134395B2 (en) | 2018-11-20 |
EP3050051A4 (en) | 2017-05-24 |
EP3050051A1 (en) | 2016-08-03 |
CN105814535A (zh) | 2016-07-27 |
US20150088514A1 (en) | 2015-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105814535B (zh) | 呼叫中的虚拟助理 | |
US11979518B2 (en) | Handling calls on a shared speech-enabled device | |
US10423958B2 (en) | Method, apparatus and system for voice verification | |
CN111052230A (zh) | 用于语音捕获设备的语音激活的选择性存储器 | |
WO2015172435A1 (zh) | 远程会议中实现有序发言的方法及服务器 | |
KR20130112885A (ko) | 음성-가능 응용프로그램에 입력을 제공하는 방법 및 장치 | |
US20090110156A1 (en) | Method and apparatus for the storage of recorded audio and retrieval from an associated URL | |
US20140211929A1 (en) | Method and apparatus for identifying and managing participants in a conference room | |
US9621722B2 (en) | Caller authentication | |
US20120307985A1 (en) | Method and Apparatus for Connecting a Caller Previously Diverted to Voicemail | |
CN112887194B (zh) | 实现听障人士通话的交互方法、装置、终端及存储介质 | |
US8301452B2 (en) | Voice activated application service architecture and delivery | |
CA3064797A1 (en) | Identity verification method and apparatus, and electronic device | |
US20110077947A1 (en) | Conference bridge software agents | |
JP2016149636A (ja) | 認証装置、電話端末、認証方法および認証プログラム | |
US9584560B2 (en) | Providing external application services with an existing private branch exchange media server | |
CN111884886B (zh) | 一种基于话机的智能家居的通信方法和通信系统 | |
CN101422003B (zh) | VoIP客户信息 | |
KR20180077720A (ko) | Id 기반의 통화와 전화번호 기반의 통화를 연동하기 위한 장치 및 방법 | |
CN111246021A (zh) | 用于实现对个人语音助理的远程访问的方法 | |
CN104135579B (zh) | 一种基于ivr的手机语音留言功能的实现方法 | |
CN111435981A (zh) | 通话处理方法及装置 | |
JP2002262350A (ja) | 移動体通信よるサービス配信方法、移動体通信によるサービス配信システム、サービス配信装置及び携帯端末 | |
CN110765255A (zh) | 分布式语音服务系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |