CN109313897A - 利用多个虚拟助理服务的通信 - Google Patents
利用多个虚拟助理服务的通信 Download PDFInfo
- Publication number
- CN109313897A CN109313897A CN201680085256.4A CN201680085256A CN109313897A CN 109313897 A CN109313897 A CN 109313897A CN 201680085256 A CN201680085256 A CN 201680085256A CN 109313897 A CN109313897 A CN 109313897A
- Authority
- CN
- China
- Prior art keywords
- response
- statement
- preference
- loudspeaker
- virtual assistant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 108
- 230000004044 response Effects 0.000 claims abstract description 201
- 238000000034 method Methods 0.000 claims description 49
- 230000008569 process Effects 0.000 claims description 40
- 230000005540 biological transmission Effects 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 description 22
- 238000012546 transfer Methods 0.000 description 4
- 238000000429 assembly Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000004020 conductor Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000011800 void material Substances 0.000 description 2
- 241001600609 Equus ferus Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
- Telephonic Communication Services (AREA)
Abstract
在本公开内容的一个示例中,利用在通信装置处的扩音器捕获指示用户说出的表述的扩音器数据。将扩音器数据的至少一部分发送给计算设备的集合。从所述计算设备中的每一个计算设备接收在虚拟助理服务处确定的响应表述。根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述。使得优选的响应表述经由在通信装置处的扬声器来输出。
Description
背景技术
在当今世界,用户越来越多地利用包括智能电话、平板电脑和个人计算机的基于技术的设备来访问语音可访问的虚拟助理功能。流行的虚拟助理功能包括通过访问搜索引擎、电子邮件、SMS、电子日历、电子联系人目录、以及其它应用来向用户提供对语音给出的问题的回答。
附图说明
图1是描绘实现利用多个虚拟助理服务的通信的装置的示例的方块图。
图2是描绘实现用于利用多个虚拟助理服务的通信的装置的示例的存储器资源和处理资源的方块图。
图3示出了利用多个虚拟助理服务的通信的示例。
图4示出了利用多个虚拟助理服务的通信的另一个示例。
图5是描绘利用多个虚拟助理服务的通信方法的示例的实现方式的流程图,方法包括将扩音器数据发送给计算机设备的集合,其中,计算设备中的每一个计算设备与托管虚拟助理服务的服务器系统通信。
图6是描绘利用多个虚拟助理服务的通信方法的示例的实现方式的流程图,方法包括将扩音器数据发送给服务器系统的集合,其中,每一个服务器系统托管虚拟助理服务。
图7是描绘利用多个虚拟助理服务的通信方法的示例的实现方式的流程图。
具体实施方式
在许多情况下,用户可能期望经由应用或经由因特网对虚拟助理服务的访问以快速地获得对关于用户的日历、本地天气预报、交通状况、体育得分、新闻和其它信息的问题的回答。在一些情况下,用户可以携带诸如智能电话或笔记本电脑的手持计算设备随他或她一起到多个位置(例如,在住所中的房间)以便具有对由手持计算设备的制造商提供的虚拟助理服务的可访问性。
然而,该常见场景具有若干缺点。首先,由于用户忘记或者不能够携带设备达一时段、将设备用于其它目的的需要、电池寿命以及其它因素,用户随着持久的时间段过去将计算设备从在住所中的一个房间携带到另一个房间在一些情况下可能是不太实际的。其次,用户可能发现根据手持计算设备的制造商默认地提供的虚拟助理服务(有时在本文中被称作“默认虚拟助理”)不是针对用户请求的所有类别是最佳的。例如,用户可能发现利用不是针对用户的移动设备的默认虚拟助理的第二虚拟助理可以找到更精确的天气预报,或者可以发现不是针对用户的移动设备的默认虚拟助理的第三虚拟助理服务提供与默认虚拟助理相比要新颖的新闻报道。当前地,期望利用多个数字助理的用户可能面临着跟踪以及保持记录哪些数字助理服务针对特定的话题/请求类别将是最佳的,以及购买并且携带多个移动计算设备以便访问多个默认虚拟助理。
为了解决这些问题,下文更详细地描述的各种示例提供了实现利用多个虚拟助理服务的有效且高效的通信的装置和方法。在一个示例中,通信装置利用扩音器来捕获指示用户说出的表述的扩音器数据。通信装置将扩音器数据的至少一部分发送给经由网络连接到通信装置的计算设备的集合,其中,计算设备中的每一个计算设备与托管不同的虚拟助理服务的服务器系统通信。通信装置从计算设备中的每一个计算设备接收在虚拟助理服务处确定的响应表述。通信装置根据偏好规则来在接收到的响应表述的集合之中识别优选的响应表述。在识别优选的响应表述之后,通信装置引起经由包括在通信装置内的扬声器对优选的响应表述的输出。
在一示例中,通信装置可以通过根据偏好规则来向接收到的响应表述分配分数来识别优选的响应表述。在一示例中,根据利用的偏好规则,被确定为成功提供与用户说出的表述相关的信息的接收到的响应表述被分配与已经被确定为未能提供与用户说出的表述相关的信息的接收到的响应表述相比较高的偏好。在特定的示例中,接收到的响应表述的成功或失败可以是经由对显著性响应算法的利用来确定的成功或失败。在一示例中,根据偏好规则指示错误消息的接收到的响应表述要被分配与将被分配给不指示错误消息的接收到的响应表述的分数相比较低的偏好。在另一示例中,要应用的偏好规则可以包括对关于特定的主题类别的虚拟助理服务的过往预测成功作为因素。在某些示例中,通信装置可以捕获指示针对第一虚拟助理服务的用户偏好的偏好数据,以及可以在考虑所述用户偏好的情况下来识别优选的响应表述。在特定的示例中,偏好数据可以是针对特定的主题类别的特定的虚拟助理服务的用户偏好,以及通信装置可以在考虑所述用户偏好的情况下来识别优选的响应表述。
在上文示例中,通信装置将扩音器数据的至少一部分发送给经由网络连接到通信装置的计算设备的集合,以及计算设备中的每一个计算设备将转而与托管不同的虚拟助理服务的服务器系统通信,以及通信装置将从计算设备中的每一个计算设备接收在虚拟助理服务处确定的响应表述。然而,在其它示例中,通信装置可以将所捕获的扩音器数据的至少一部分直接地发送给服务器系统的集合,其中,每一个服务器系统托管不同的虚拟助理服务,以及可以直接地从服务器系统接收响应表述。在这些示例中,通信装置因此不被要求与任何智能电话、平板型计算机、膝上型计算机、台式计算机或用于将扩音器数据的至少一部分中继给服务器系统和/或用于将响应表述从服务器系统中继返回给通信装置的其它中间计算设备进行连接。
以这种方式,继而,所公开的示例提供将使得用户能够将语音询问提交给通信装置以及继而接收在考虑了多个数字助理服务的情况下确定为可获得的最佳响应的高质量响应表述的通信方法和装置。用户将享受与访问多个数字助理服务而不需要购买、维持以及携带多个移动计算设备相关联的高效、使用便捷以及成本节约。
图1和图2描绘了用于实现各种示例的物理和逻辑组件的示例。在图1中,各种组件被识别为引擎102、引擎104、引擎106、引擎108、引擎110和引擎112。在描述引擎102-引擎112中焦点在每一个引擎的指定的功能上。然而,如本文中所使用的,术语引擎通常指代以执行指定的功能的硬件和程序编制的组合。如随后参考图2说明的,例如,每一个引擎的硬件可以包括处理器和存储器中的一者或两者,而程序编制可以是存储在该存储器上以及由处理器可执行的以执行指定的功能的代码。
图1是描绘以实现利用多个虚拟助理服务的通信的通信装置100的组件的方块图。在该示例中,通信装置100包括扩音器114和扬声器116。如本文中所使用的,“扩音器”通常指代将声波转换成电能变化的任意设备,所述电能变化继而可以被记录或以其它方式被捕获、放大或发送。如本文中所使用的,“扬声器”通常指代将接收的电音频信号转换成相应的声音的任意设备。在示例中,通信装置100可以包括接口。如本文中所使用的,在通信装置处的“接口”通常指代促进经由网络与另一计算设备的连接的硬件和软件的任何组合。在其中网络是无线网络的示例中,接口可以是连接到基于无线的计算机网络的网络接口控制器。针对无线网络的接口选项包括但不限于,利用无线网络接口设备的USB电子狗、蓝牙TM接口卡或红外接口模块。替代地,在其中网络是有线网络的一示例中,接口可以是令牌环或以太网。
在该示例中,通信装置100包括表述捕获引擎102、扩音器数据发送引擎104、响应接收引擎106、响应比较引擎108、响应输出引擎110和用户偏好引擎112。在执行它们各自的功能时,引擎102-引擎112可以访问数据储存库,例如,对通信装置100可访问的可以用于存储以及检索数据的存储器。
在一示例中,表述捕获引擎102通常表示利用在通信装置处的扩音器114来捕获对在扩音器处检测到的指示用户说出的表述的数据(扩音器数据)的硬件和程序编制的组合。如本文中所使用的,“捕获”数据通常指代收集或接收信息以及将所收集的信息改变成可以由计算机读取和使用的形式。“表述”通常指代充当传达想法或概念的单元或成分的词语(即一个或多个词语)的集合。如本文中所使用的,“词语”通常指代典型地传送想法或概念的语音或书写的有含义的元素。
扩音器数据发送引擎114通常表示将扩音器数据的至少一部分间接地或直接地发送给服务器系统的集合的硬件和程序编制的组合,其中,每一个服务器系统托管不同的虚拟助理服务。如本文中所使用的,“虚拟助理”或“虚拟助理服务”通常指代使用人工智能以经由智能电话、笔记本电脑、台式计算机、或与托管服务的服务器系统电子地连接的其它计算设备来执行针对用户的任务或服务的应用或其它计算机程序。在示例中,任务或服务是基于用户输入、位置感知以及从各种在线来源访问信息(诸如天气或交通状况、新闻、股票价格、用户日程表、零售价格等)的能力来执行的。在服务器系统处托管的虚拟助理服务继而可以处理和/或分析扩音器数据的至少一部分,以确定对通信装置说出的用户问题或询问。虚拟助理服务继而可以例如通过访问应用(例如,搜索引擎、天气应用、体育得分应用等)和/或通过访问因特网来确定针对问题或询问的响应表述。服务器系统然后就可以经由网络将所确定的响应表述间接地或直接地发送给通信装置。
如本文中所使用的,与第二虚拟助理服务“不同”的第一虚拟助理服务通常指代可以由用户认识到不同的第一虚拟助理服务和第二虚拟助理服务。在某些示例中,虚拟助理可以凭借不同的产品名称或标志、服务名称或标志,或者与虚拟助理服务相关联的商标而与彼此不同的。在其它示例中,虚拟助理可以凭借已知提供这样的虚拟助理服务的不同公司或个体而与彼此不同的。在其它示例中,虚拟助理可以凭借当由用户说出时唤醒虚拟助理的不同的专有或默认触发词语而与彼此不同的。
响应接收引擎106通常表示间接地或直接地从服务器系统集合中的每一个服务器系统接收响应表述的硬件和程序编制的组合。从服务器系统接收的每一个响应表述是利用由服务器系统托管的虚拟助理服务来确定的表述。
在扩音器数据发送引擎104和响应接收引擎106的第一示例中,扩音器数据发送引擎104可以将扩音器数据的至少一部分发送给计算设备的集合,其中,计算设备中的每一个计算设备与托管不同的虚拟助理服务的服务器系统通信。在该第一示例中,由服务器系统托管的虚拟助理服务将基于扩音器数据来确定响应表述,以及将转而将响应表述发送给计算设备以用于计算设备发送给通信装置。继续关于该第一示例,响应接收引擎106从计算设备的集合中的每一个计算设备接收虚拟助理确定的响应表述。
在扩音器数据发送引擎104和响应接收引擎106的第二示例中,扩音器数据发送引擎104和响应接收引擎106可以被构造为实现在通信装置100与托管虚拟助理服务的服务器系统之间的直接通信,而不具有对中间计算设备的任何需要。在该第二示例中,扩音器数据发送引擎104可以将扩音器数据的至少一部分发送给服务器系统的集合,其中,每一个服务器系统托管不同的虚拟助理服务。在该第二示例中,由服务器系统托管的虚拟助理服务可以基于扩音器数据来确定响应表述,以及服务器系统将转而将响应表述发送给通信装置。继续关于该第二示例,响应接收引擎106从每一个服务器系统接收在由服务器系统托管的虚拟助理服务处确定的响应表述。
响应比较引擎108通常表示根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述的硬件和程序编制的组合。如本文中所使用的,“偏好规则”通常指代可以在考虑了第一响应表述和第二响应表述的属性的情况下,使第一响应表述优先于第二响应表述的规则或算法。在一些示例中,响应比较引擎108在识别优选的响应表述中可以根据偏好规则来将分数分配给接收到的响应表述。
在一个示例中,响应比较引擎108可以利用考虑接收到的响应表述是被确定为成功提供与用说出的表述相关的信息,还是被确定为未能提供与用户说出的表述相关的信息的偏好规则。例如,根据示例性偏好规则,被确定为成功提供与用户说出的表述相关的信息的接收到的响应表述被分配与已经被确定为未能提供与用户说出的表述相关的信息的接收到的响应表述相比较高的偏好。
在某些示例中,响应比较引擎108可以做出对接收到的响应表述在提供与用户说出的表述相关的信息中的成功或失败的确定。在其它示例中,对提供与用户说出的表述相关的信息的、接收到的响应表述的成功或失败的确定是由除了通信装置100之外的一个计算设备或多个计算设备做出的,以及确定可以作为响应表述成功数据被存储在介质上。在该后一示例中,响应比较引擎108可以在应用偏好规则中访问所存储的响应表述成功数据。
在一些示例中,第一响应表述和第二响应表述的成功或失败可以是利用显著性响应算法来确定的。如本文中所使用的,“显著性响应算法”通常指代可以被应用于字符串或表述以做出关于字符串或表述的在提供信息中的成功或失败的确定的规则或算法的集合。例如,示例性显著性响应算法可以将“这是本周的五条头条新闻故事”响应表述评价为未能提供与用户说出的表述“今天的大新闻是什么”相关的信息。在另一示例中,显著性响应算法可以将“这是今天具有最大因特网活动性的新闻标题”响应表述评价为在提供与用户说出的表述“今天的大新闻是什么”相关的信息中非常成功的。
在另一示例中,响应比较引擎108可以根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述,其中,根据偏好规则,指示错误消息的接收到的响应表述要被分配给不指示错误消息的接收到的响应表述的偏好相比较低的偏好。例如,在用户说出的表述是“谁赢得了野马队比赛?”的情况下,响应比较引擎108可以将来自第一虚拟助理的是“我不理解问题”的第一响应表述识别为与来自第二虚拟助理的是“在昨晚的比赛中野马队以28-7打败了突击者”的第二响应表述相比具有较低的偏好。在其它示例中,请求另外的信息的接收到的响应表述(例如,“你是指野马队?”或者“比赛日期是什么?”或者“比赛类型是什么?”)可以被认为是错误消息。
在另一示例中,响应比较引擎108可以根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述,其中,偏好规则包括对关于主题类别的虚拟助理服务的过往预测成功作为因素。例如,在用户说出的表述是“明天会有雨吗?”的情况下,比较引擎108可以将来自被确定为具有关于天气问题的55%准确度评分的第一虚拟助理的第一响应表述识别为与来自被确定为具有关于天气问题的35%准确度评分的第二虚拟助理的第二响应表述相比具有较高的偏好。
在某些示例中,通信装置100可以包括用户偏好引擎112。用户偏好引擎112通常表示捕获指示关于一个或多个其它虚拟助理服务针对第一虚拟助理服务的用户偏好的偏好数据。响应比较引擎108转而在考虑这样的用户偏好的情况下来识别优选的响应表述。在示例中,用户偏好数据可以指示针对虚拟助理服务的类别特定的用户偏好。在其它示例中,用户偏好数据可以指示针对虚拟助理服务的一般用户偏好,偏好应用于用户说出的表述和/或请求的所有类别。
在某些示例中,用户偏好数据可以是利用在通信装置100处的扩音器114来在用户在扩音器114附近说出偏好表述时捕获的数据。在其它示例中,用户偏好数据可以是指示用户的针对用户说出的表述的特定的类别的特定的虚拟助理服务的过往选择的数据。例如,示例性用户偏好引擎112可以捕获指示如下情况的偏好数据:特定的用户已经利用关于健康和保健问题的第一虚拟助理服务询问发起了三十次语音事务,同时该用户已经利用第二虚拟助理发起了这样的虚拟事务十次,以及利用第三虚拟助理服务仅发起了三次。在另一示例中,用户偏好引擎112可以捕获指示关于针对用户说出的表述的特定类别的特定虚拟助理服务的语音事务的新近的偏好数据。例如,示例性用户偏好引擎112可以指示特定用户已经在前三个月期间利用关于法律问题的第一虚拟助理服务询问发起了十五次语音事务,以及已经在当月期间利用第二虚拟助理服务发起了五次语音业务。
响应输出引擎110通常表示引起经由扬声器116对由响应比较引擎108识别的优选的响应表述的输出的硬件和程序编制的组合。
在示例中,扩音器数据发送引擎104可以经由网络协议通过链路来将扩音器数据的至少一部分发送给计算设备的集合。在其它示例中,响应接收引擎106可以经由网络协议通过链路来从计算设备接收虚拟助理确定的响应表述,其中,计算设备经由网络协议被连接到托管虚拟助理服务的服务器系统。在其它示例中,响应接收引擎106可以经由网络协议通过链路来直接地从托管虚拟助理服务的服务器系统接收响应表述。在示例中,网络协议可以包括但不限于,传输控制协议/互联网协议(“TCP/IP”)、超文本传输协议(“HTTP”),和/或会话发起协议(“SIP”)。
如本文中所使用的,“链路”通常指代实现电子连接、无线连接、其它连接或其组合的、以实现在组件和/或计算设备之间的数据通信的基础设施或基础设施的组合。这样的一个基础设施或多个基础设施可以包括但不限于,线缆、无线、光纤、或经由电信链路、红外链路、或射频链路的远程连接。例如,“链路”可以指代或者表示因特网、内联网和中间路由器、交换机和其它接口。如本文中所使用的,“计算设备”可以是服务器、计算机网络设备、芯片集、台式计算机、笔记本电脑、工作站、平板型计算机、智能电话或另一种处理设备或装置。如本文中所使用的,“电子连接”通常指代在组件之间,例如,在由电导体连接的两个计算设备之间的数据的传送。“无线连接”通常指代在组件之间,在未由电导体直接地连接的两个计算设备之间的数据的传送。无线连接可以是经由用于交换数据的无线通信协议或无线标准的。
在图1的前述论述中,引擎102-引擎112被描述为硬件和程序编制的组合。引擎102-引擎112可以是以许多方式来实施的。在图2中看到,程序编制可以是存储在有形存储器资源230上的处理器可执行指令,以及硬件可以包括用于执行那些指令的处理资源240。因此,存储器资源230可以被认为存储程序指令,当所述程序指令由处理资源240执行时来实现图1的通信装置100。
存储器资源230通常表示能够存储可以由处理资源240执行的指令的任意数量的存储器组件。存储器资源230在其不包含暂时的信号而是代替地包括存储相关指令的一个存储器组件或多个存储器组件的意义上是非暂时的。存储器资源230可以是在单个设备中或者跨越多个设备分布来实现的。同样地,处理资源240表示能够执行由存储器资源230存储的指令的任意数量的存储器。处理资源240可以被集成在单个设备中或者跨越多个设备分布。进一步地,存储器资源230可以被完全地或部分地集成在与处理资源240相同的设备中,或者其可以是分开的但是对该设备和处理资源240是可访问的。
在一个示例中,程序指令可以是安装包的部分,当安装时可以由处理资源240执行以实施通信装置100。在这种情况下,存储器资源230可以是便携式介质,诸如CD、DVD或者由服务器维持的、可以从其下载和安装安装包的闪速驱动器或存储器。在另一示例中,程序指令可以是应用或已经安装的应用的部分。这里,存储器资源230可以包括集成存储器,诸如硬盘驱动器、固态驱动器等。
在图2中,存储在存储器资源230中的可执行程序指令被描绘为表述捕获模块202、扩音器数据发送模块204、响应接收模块206、响应比较模块208、响应输出模块210以及用户偏好模块212。表述捕获模块202表示当由处理资源240执行时可以执行上文关于图1的表述捕获模块102描述的功能中的任意功能的程序指令。扩音器数据发送模块204表示当由处理资源240执行时可以执行上文关于图1的扩音器数据发送模块104描述的功能中的任意功能的程序指令。响应接收模块206表示当由处理资源240执行时可以执行上文关于图1的响应接收模块106描述的功能中的任意功能的程序指令。响应比较模块208表示当由处理资源240执行时可以执行上文关于图1的响应比较模块108描述的功能中的任意功能的程序指令。响应输出模块210表示当由处理资源240执行时可以执行上文关于图1的响应输出模块110描述的功能中的任意功能的程序指令。用户偏好模块212表示当由处理资源240执行时可以执行上文关于图1的用户偏好模块112描述的功能中的任意功能的程序指令。
图3,鉴于图1和图2示出了利用多个虚拟助理服务的通信的示例。在一示例中,通信装置100可以利用被包括在通信装置100中的扩音器捕获指示用户说出的表述304的扩音器数据302。例如,用户可以说出表述“明天在惠灵顿科罗拉多的天气预报是什么?”。在该示例中,通信装置100将在捕获与检测到的用户说出的表述304有关的扩音器数据302后,将扩音器数据302的至少一部分发送给包括计算设备1 306和计算设备N 308的计算设备的集合。计算设备1 306和计算设备N 308中的每一个计算设备经由链路被电子地连接到通信装置100,以及与托管不同的虚拟助理服务的服务器系统通信。在特定的示例中,计算设备1可以是移动计算设备(其为智能电话),以及计算设备2可以是膝上型计算机。在特定的示例中,在通信装置100与计算设备1和计算设备N中的每一个计算设备之间的电子连接可以是蓝牙连接、近场通信连接、红外连接或任何其它无线连接。在图3的该示例中,计算设备1与托管虚拟助理服务器1 312的服务器系统1 310通信,以及计算设备N与托管虚拟助理服务器N 316的服务器系统N 314通信。
在服务器系统1 310处托管的虚拟助理服务1 312可以处理和/或分析在服务器系统1处接收到的扩音器数据302的部分,以确定对通信装置100说出的用户问题或查询。然后,虚拟助理服务1例如可以通过访问应用(例如,搜索应用、特定于天气的应用等)和/或通过访问互联网来确定针对问题或查询的响应表述1 320。然后,服务器系统1可以经由链路来将确定的响应表述1 320发送给计算设备1 306。计算设备1继而经由链路来将响应表述1发送给通信装置100。
在图3处继续,被托管在服务器系统N 314处的虚拟助理服务N 316可以处理和/或分析在服务器系统N处接收到的扩音器数据302的部分,以确定向通信装置100说出的用户问题或查询。虚拟助理服务N继而可以例如通过访问应用(例如,搜索应用、特定于天气的应用等)和/或通过访问互联网,来确定针对问题或查询的响应表述N 322。服务器系统N继而可以经由链路来将确定的响应表述N 322发送给计算设备N 308。计算设备N继而经由链路来将响应表述1发送给通信装置100。
通信装置100可以从计算设备的集合中的每一个计算设备接收在虚拟助理服务处确定的响应表述。在该示例中,通信装置100将从计算设备1 306接收响应表述1 320,以及将从计算设备N 308接收响应表述N 322。
在图3处继续,通信装置100将根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述。在该示例中,通信装置100利用一个或多个偏好规则来将响应表述1识别作为优选的响应表述324(“在6月7日在惠灵顿科罗拉多州将有8华氏度的高温,0%的降水,27%的湿度,以及12mph的风”)。
在示例中,通信装置100可以通过根据偏好规则来向接收到的响应表述分配分数,来识别优选的响应表述。例如,被识别为优选的响应表述324的响应表述1 320可以已经被分配了高于响应表述N 322的分数。
在图3处继续,在示例中,根据所利用的偏好规则,接收到的被确定为成功提供与用户说出的表述相关的信息的响应表述被分配了比接收到的已经被确定为未能提供与用户说出的表述相关的信息的响应表述更高的偏好。例如,被识别为优选的响应表述324的响应表述1 320可能已经被确定为在提供信息方面比响应表述N 322更成功。在具体示例中,确定接收到的响应表述1 320和接收到的响应表述N 322在提供与用户说出的表述304相关的信息方面的成功或失败可以包括应用显著(salient)响应算法。
在示例中,根据所利用的偏好规则,接收到的指示错误消息的响应表述将被分配比会被分配给接收到的不指示错误消息的响应表述的偏好更低的偏好。例如,被识别为优选的响应表述324的响应表述1 320可能已经被确定为非错误消息,而响应表述N 322可能已经被确定为错误消息。
在示例中,用于识别优选的响应的偏好规则可以包括对关于主题类别的虚拟助理服务的过往预测成功作为因素。在该示例中,通信装置100可以利用偏好规则来识别优选的响应表述324,所述偏好规则考虑到由虚拟助理服务1 312和虚拟助理服务N 316确定的先前天气预测响应的成功(或失败)。
在图3处继续,通信装置100将引起经由扬声器组件对优选的响应表述324的听觉输出。
图4,鉴于图1和图2,示出了利用多个虚拟助理服务的通信的另一示例。在示例中,通信装置100可以利用通信装置100包括的扩音器114(图1)来捕获用于指示用户说出的表述404的扩音器数据402。在捕获到与检测到的用户说出的表述404有关的扩音器数据402之后,通信装置100将扩音器数据402的至少一部分发送给服务器系统集合,其中,每一个服务器系统托管分开的虚拟助理服务。在该示例中,服务器系统集合包括托管虚拟助理服务1408的服务器系统1 406以及托管虚拟助理服务N 412的服务器系统N 410。服务器系统1406和服务器系统N 410中的每一个服务器系统经由链路来电子地连接到通信装置100。在示例中,链路可以是网络,诸如互联网或内联网。
在服务器系统1 406处托管的虚拟助理服务1 408可以处理和/或分析在服务器系统1 406处接收到的扩音器数据402的部分,以确定在通信装置100附近说出的用户说出的表述404。虚拟助理服务1 408继而可以例如通过访问应用(例如,搜索应用、特定于天气的应用等)和/或通过访问互联网来确定针对问题或查询的响应表述1 420。服务器系统1继而可以经由链路来向通信装置100发送所确定的响应表述1 420。
在图4处继续,在服务器系统N 410处托管的虚拟助理服务N 412可以处理和/或分析在服务器系统N 410处接收到的扩音器数据402的部分,以确定由通信装置100检测到的用户说出的表述404。虚拟助理服务N 412继而可以例如通过访问应用(例如,搜索应用、特定于天气的应用等)和/或通过访问互联网来确定针对用户说出的表述404的响应表述N422。服务器系统N 410继而可以经由链路来将所确定的响应表述N 422发送给通信装置100。
通信装置100可以从服务器系统的集合中的每一个服务器系统接收在虚拟助理服务处确定的响应表述。在该示例中,通信装置100将从服务器系统1 406接收响应表述1420,以及将从服务器系统N 410接收响应表述N 422。
在图4处继续,通信装置100将根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述424。通信装置100继而经由在通信装置内包括的扬声器来使得优选的响应表述424被可听见地呈现或广播。
图5是利用多个虚拟助理服务的通信方法的实现方式的流程图。在讨论图5时,可以参考在图1和图2中所描绘的组件。进行这样的参考以提供上下文的示例,并且不是限制可以实现由图5所描绘的方法的方式。在通信装置处捕获用于指示用户说出的表述的扩音器数据(方块502)。返回参考图1和图2,表述捕获引擎102(图1)或表述捕获模块202(图2)当由处理资源240执行时可以负责实现方块502。
扩音器数据的至少一部分被发送给计算设备的集合。计算设备中的每一个计算设备将与托管不同虚拟助理服务的服务器系统通信(方块504)。返回参考图1和图2,扩音器数据发送引擎104(图1)或扩音器数据发送模块204(图2)当由处理资源240执行时可以负责实现方块504。
从计算设备中的每一个计算设备接收在虚拟助理服务处确定的响应表述(方块506)。返回参考图1和图2,响应接收引擎106(图1)或响应接收模块206(图2)当由处理资源240执行时可以负责实现方块506。
根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述(方块508)。返回参考图1和图2,响应比较引擎108(图1)或响应比较模块208(图2)当由处理资源240执行时可以负责实现方块508。
引起经由在通信装置处的扬声器对优选的响应表述的输出(方块510)。返回参考图1和图2,响应输出引擎110(图1)或响应输出模块210(图2)当由处理资源240执行时可以负责实现方块510。
图6是利用多个虚拟助理服务的通信方法的实现方式的流程图。在讨论图6时,可以参考在图1和图2中所描绘的组件。进行这样的参考以提供上下文示例,并且不是限制可以实现由图6所描绘的方法的方式。经由在通信装置处的扩音器来捕获用于指示用户说出的表述的扩音器数据(方块602)。返回参考图1和图2,表述捕获引擎102(图1)或表述捕获模块202(图2)当由处理资源240执行时可以负责实现方块602。
扩音器数据的至少一部分被发送给服务器系统集合。每一个服务器系统托管不同的虚拟助理服务(方块604)。返回参考图1和图2,扩音器数据发送引擎104(图1)或扩音器数据发送模块204(图2)当由处理资源240执行时可以负责实现方块604。
从服务器系统中的每一个服务器系统接收在虚拟助理服务处确定的响应表述(方块606)。返回参考图1和图2,响应接收引擎106(图1)或响应接收模块206(图2)当由处理资源240执行时可以负责实现方块606。
根据偏好规则来识别接收到的响应表述的集合之中的优选的响应表述(方块608)。返回参考图1和图2,响应比较引擎108(图1)或响应比较模块208(图2)当由处理资源240执行时可以负责实现方块608。
经由通信装置处的扬声器来使得优选的响应表述被输出(方块610)。返回参考图1和图2,响应输出引擎110(图1)或响应输出模块210(图2)当由处理资源240执行时可以负责实现方块610。
图7是利用多个虚拟助理服务的通信方法的实现方式的流程图。在讨论图7时,可以参考在图1和图2中所描绘的组件。进行这样的参考以提供上下文示例,并且不是限制可以实现由图7所描绘的方法的方式。在通信装置处捕获包括用户说出的表述的扩音器数据(方块702)。返回参考图1和图2,表述捕获引擎102(图1)或表述捕获模块202(图2)当由处理资源240执行时可以负责实现方块702。
扩音器数据的至少一部分被发送给计算设备的集合。计算设备中的每一个计算设备将与托管不同虚拟助理服务的服务器系统通信(方块704)。返回参考图1和图2,扩音器数据发送引擎104(图1)或扩音器数据发送模块204(图2)当由处理资源240执行时可以负责实现方块704。
从计算设备中的每一个计算设备接收在虚拟助理服务处确定的响应表述(方块706)。返回参考图1和图2,响应接收引擎106(图1)或响应接收模块206(图2)当由处理资源240执行时可以负责实现方块706。
通过根据偏好规则来向接收到的响应表述中的每一个响应表述分配偏好,来识别在接收到的响应表述的集合之中的优选的响应表述。偏好规则包括如下内容作为因素:基于显著响应算法的对接收到的响应表述的成功或失败的确定;在接收到的响应中的错误消息的存在;虚拟助理服务关于主题类别的过往预测成功;和/或针对主题类别的针对虚拟助理服务的用户偏好(方块708)。返回参考图1和图2,响应比较引擎108(图1)或响应比较模块208(图2)当由处理资源240执行时可以负责实现方块708。
经由通信装置处的扬声器来使得优选的响应表述被输出(方块710)。返回参考图1和图2,响应输出引擎110(图1)或响应输出模块210(图2)当由处理资源240执行时可以负责实现方块710。
图1-7辅助描绘各种示例的架构、功能和操作。具体地,图1和图2描绘了各种物理和逻辑组件。各种组件被至少部分地定义为程序或编程。每一个这样的组件、其部分或者其各种组合可以全部或部分地表示:包括用于实现任何指定的逻辑功能的可执行指令的代码的模块、片段或部分。每一个组件或者其各种组合可以表示:用于实现指定的逻辑功能的电路或数个互连的电路。示例能够在存储器资源中实现,用于被处理资源使用的或者与处理资源结合使用。“处理资源”是指令执行系统,诸如能够从计算机可读介质获取或获得指令和数据并且执行其中包含的指令的、基于计算机/处理器的系统或ASIC(专用集成电路)或其它系统。“存储器资源”是非临时性存储介质,其能够包含、存储或维护程序和数据用于被指令执行系统使用或者与指令执行系统结合使用。如在本文所使用的,术语“非临时性”仅用于阐明:术语介质不包含信号。因此,存储器资源能够包括物理介质,诸如,例如,电子、磁、光学、电磁或半导体介质。合适的计算机可读介质的更具体示例包括,但不限于:硬盘驱动器、固态驱动器、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、闪存驱动器和便携式压缩盘。
尽管图5-7的流程示出出了执行的特定顺序,但是执行的顺序可以与所描绘的顺序不同。例如,可以关于所示的顺序,可以扰乱对两个或更多个方块或箭头的执行顺序。此外,可以同时或部分同时地执行连续示出的两个或更多个方块。这样的变化在本公开内容的范围之内。
应当意识到,提供所公开的示例的先前描述以使得本领域技术人员能够做出或使用本公开内容。对这些示例的各种修改对于本领域技术人员而言将是显而易见的,以及在不脱离本公开内容的精神或范围的情况下,可以将在本文中定义的一般原理应用于其它示例。因此,本公开内容不旨在限于在本文中所示的示例,而是符合与在本文中所公开的原理和新颖特征相一致的最宽范围。在本说明书(包括任何所附的权利要求、摘要和附图)中所公开的所有特征,和/或如此公开的任何方法或过程的所有方块或阶段,除了这样的特征、方块和/或阶段是互相排斥的组合以外,可以在任何组合中进行组合。
Claims (15)
1.一种通信装置,包括:
扬声器;
扩音器;
表述捕获引擎,其利用所述扩音器来捕获指示用户说出的表述的扩音器数据;
扩音器数据发送引擎,其将所述扩音器数据的至少一部分发送给计算设备的集合,其中,所述计算设备中的每一个计算设备与托管不同的虚拟助理服务的服务器系统通信;
响应接收引擎,其从所述计算设备中的每一个计算设备接收在虚拟助理服务处确定的响应表述;
响应比较引擎,其根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述;以及
响应输出引擎,其引起经由所述扬声器对所述优选的响应表述的输出。
2.根据权利要求1所述的通信装置,其中,所述响应比较引擎通过根据所述偏好规则来向所述接收到的响应表述分配分数,来识别所述优选的响应表述。
3.根据权利要求1所述的通信装置,其中,根据所述偏好规则,被确定为成功提供与所述用户说出的表述相关的信息的接收到的响应表述被分配与已经被确定为未能提供与所述用户说出的表述相关的信息的接收到的响应表述相比较高的偏好。
4.根据权利要求3所述的通信装置,其中,接收到的响应表述提供与所述用户说出的表述相关的信息的成功或失败是基于显著性响应算法来确定的。
5.根据权利要求1所述的通信装置,其中,根据所述偏好规则,指示错误消息的接收到的响应表述要被分配与将被分配给不指示错误消息的接收到的响应表述的偏好相比较低的偏好。
6.根据权利要求1所述的通信装置,其中,所述偏好规则包括对关于主题类别的虚拟助理服务的过往预测成功作为因素。
7.根据权利要求1所述的通信装置,还包括:用户偏好引擎,其捕获指示针对第一虚拟助理服务的用户偏好的偏好数据,并且其中,所述响应比较引擎在考虑所述用户偏好的情况下来识别所述优选的响应表述。
8.根据权利要求7所述的通信装置,其中,所述偏好数据指示针对主题类别的、针对第一虚拟助理服务的用户偏好,并且其中,所述响应比较引擎在考虑所述用户偏好的情况下来识别所述优选的响应表述。
9.一种存储指令的存储器资源,当所述指令被执行时使得处理资源产生在通信装置与计算装置之间的通信,所述指令包括:
表述捕获模块,当其被执行时,使得所述处理资源在包括扬声器和扩音器的通信装置处捕获指示用户说出的表述的扩音器数据;
扩音器数据发送模块,当其被执行时使得所述处理资源将所述扩音器数据的至少一部分发送给服务器系统的集合,其中,每一个服务器系统托管不同的虚拟助理服务;
响应接收模块,当其被执行时使得所述处理资源从所述服务器系统中的每一个服务器系统接收在虚拟助理服务处确定的响应表述;
响应比较模块,当其被执行时使得所述处理资源根据偏好规则来识别在接收到的响应表述的集合之中的优选的响应表述;以及
响应输出模块,当其被执行时使得所述处理资源引起经由所述扬声器对所述优选的响应表述的输出。
10.根据权利要求9所述的计算机可读介质,其中,所述响应比较模块当被执行时,使得所述处理资源根据所述偏好规则,通过向所述接收到的响应表述分配分数来识别所述优选的响应表述。
11.根据权利要求9所述的计算机可读介质,其中,根据所述偏好规则,根据显著性响应算法具有较高显著性等级的接收到的响应表述要被分配与具有较低显著性等级的接收到的响应表述相比较高的分数。
12.根据权利要求9所述的计算机可读介质,其中,根据所述偏好规则,指示错误的、或者具有相关联的错误消息或错误代码的接收到的响应表述,要被分配与将被分配给不指示错误消息的接收到的响应表述的分数相比较低的分数。
13.根据权利要求9所述的计算机可读介质,还包括:用户偏好模块,当其被执行时使得所述处理资源捕获指示针对第一虚拟助理服务的用户偏好的偏好数据,并且其中,所述响应比较模块当被执行时,使得所述处理资源在考虑所述用户偏好的情况下来识别所述优选的响应表述。
14.根据权利要求13所述的计算机可读介质,其中,所述偏好数据指示针对主题类别的、针对第一虚拟助理服务的用户偏好,并且其中,所述响应比较模块当被执行时,使得所述处理资源在考虑所述用户偏好的情况下来识别所述优选的响应表述。
15.一种通信方法,包括:
在通信装置处捕获扩音器数据,所述扩音器数据包括用户说出的表述;
将所述扩音器数据的至少一部分发送给计算设备的集合,其中,所述计算设备中的每一个计算设备与托管不同的虚拟助理服务的服务器系统通信;
从所述计算设备中的每一个计算设备接收在虚拟助理服务处确定的响应表述;
通过根据偏好规则来为接收到的响应表述中的每一个响应表述分配偏好,来识别在接收到的响应表述的集合之中的优选的响应表述,其中,所述偏好规则包括来自如下集合中的至少一项作为因素:
基于显著性响应算法确定的、接收到的响应表述的成功或失败,
在接收到的响应中的错误消息的存在;
关于主题类别的虚拟助理服务的过往预测成功;以及
针对主题类别的、针对虚拟助理服务的用户偏好;以及
引起经由所述扬声器对所述优选的响应表述的输出。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2016/038488 WO2017222503A1 (en) | 2016-06-21 | 2016-06-21 | Communications utilizing multiple virtual assistant services |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109313897A true CN109313897A (zh) | 2019-02-05 |
CN109313897B CN109313897B (zh) | 2023-10-13 |
Family
ID=60784837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680085256.4A Active CN109313897B (zh) | 2016-06-21 | 2016-06-21 | 利用多个虚拟助理服务的通信 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11200891B2 (zh) |
EP (1) | EP3437215A4 (zh) |
CN (1) | CN109313897B (zh) |
WO (1) | WO2017222503A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110310636A (zh) * | 2019-06-24 | 2019-10-08 | 歌尔股份有限公司 | 交互控制方法、装置、设备及音频设备 |
CN110544475A (zh) * | 2019-07-08 | 2019-12-06 | 三星电子(中国)研发中心 | 一种多语音助手的实现方法 |
CN114303132A (zh) * | 2019-08-22 | 2022-04-08 | 三星电子株式会社 | 在虚拟个人助手中使用唤醒词进行上下文关联和个性化的方法和系统 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180285741A1 (en) * | 2017-03-31 | 2018-10-04 | Intel Corporation | Coordinator for digital assistants |
KR20200044175A (ko) | 2018-10-05 | 2020-04-29 | 삼성전자주식회사 | 전자 장치 및 그의 비서 서비스 제공 방법 |
CN112015852A (zh) * | 2019-05-31 | 2020-12-01 | 微软技术许可有限责任公司 | 在关于事件的会话中提供响应 |
US20210209441A1 (en) * | 2020-01-06 | 2021-07-08 | International Business Machines Corporation | Comparing performance of virtual assistants |
EP4055593A4 (en) * | 2020-02-10 | 2023-01-04 | Samsung Electronics Co., Ltd. | METHOD AND APPARATUS FOR PROVIDING A VOICE ASSISTANCE SERVICE |
WO2021183681A1 (en) | 2020-03-10 | 2021-09-16 | MeetKai, Inc. | Parallel hypothetical reasoning to power a multi-lingual, multi-turn, multi-domain virtual assistant |
US12045572B2 (en) | 2020-03-10 | 2024-07-23 | MeetKai, Inc. | System and method for handling out of scope or out of domain user inquiries |
CN115699036A (zh) * | 2020-03-17 | 2023-02-03 | 梅特凯股份有限公司 | 支持跨平台、边缘-云混合人工智能服务的智能层 |
US11995561B2 (en) | 2020-03-17 | 2024-05-28 | MeetKai, Inc. | Universal client API for AI services |
WO2022076471A1 (en) | 2020-10-05 | 2022-04-14 | MeetKai, Inc. | System and method for automatically generating question and query pairs |
US11557300B2 (en) * | 2020-10-16 | 2023-01-17 | Google Llc | Detecting and handling failures in other assistants |
US11700139B2 (en) | 2020-11-13 | 2023-07-11 | Haier Us Appliance Solutions, Inc. | Virtual microphone input for multiple voice assistants |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1321295A (zh) * | 1998-10-02 | 2001-11-07 | 国际商业机器公司 | 通过一般分层对象进行有效语音导航的系统 |
WO2006084228A1 (en) * | 2005-02-04 | 2006-08-10 | Vocollect, Inc. | Methods and systems for considering information about an expected response when pereorming speech recognition |
EP2881898A1 (en) * | 2013-12-09 | 2015-06-10 | Accenture Global Services Limited | Virtual assistant interactivity platform |
US20150348565A1 (en) * | 2014-05-30 | 2015-12-03 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US20160062604A1 (en) * | 2014-08-29 | 2016-03-03 | Nuance Communications, Inc. | Virtual assistant development system |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8213910B2 (en) * | 2001-02-09 | 2012-07-03 | Harris Technology, Llc | Telephone using a connection network for processing data remotely from the telephone |
US7689232B1 (en) * | 2004-09-21 | 2010-03-30 | Beyer Jr Malcolm K | Method of providing call forward of voice and messages and remote phone activation |
US10769215B2 (en) * | 2005-07-14 | 2020-09-08 | Conversant Wireless Licensing S.A R.L. | Method, apparatus and computer program product providing an application integrated mobile device search solution using context information |
US7949529B2 (en) * | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US9978365B2 (en) * | 2008-10-31 | 2018-05-22 | Nokia Technologies Oy | Method and system for providing a voice interface |
US9025737B2 (en) * | 2010-12-07 | 2015-05-05 | At&T Intellectual Property I, L.P. | Visual interactive voice response |
US20170017501A1 (en) * | 2013-12-16 | 2017-01-19 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US9804820B2 (en) * | 2013-12-16 | 2017-10-31 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US9462112B2 (en) * | 2014-06-19 | 2016-10-04 | Microsoft Technology Licensing, Llc | Use of a digital assistant in communications |
US9721566B2 (en) * | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9691378B1 (en) * | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US10133612B2 (en) * | 2016-03-17 | 2018-11-20 | Nuance Communications, Inc. | Session processing interaction between two or more virtual assistants |
-
2016
- 2016-06-21 US US16/097,727 patent/US11200891B2/en active Active
- 2016-06-21 CN CN201680085256.4A patent/CN109313897B/zh active Active
- 2016-06-21 WO PCT/US2016/038488 patent/WO2017222503A1/en active Application Filing
- 2016-06-21 EP EP16906430.0A patent/EP3437215A4/en not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1321295A (zh) * | 1998-10-02 | 2001-11-07 | 国际商业机器公司 | 通过一般分层对象进行有效语音导航的系统 |
WO2006084228A1 (en) * | 2005-02-04 | 2006-08-10 | Vocollect, Inc. | Methods and systems for considering information about an expected response when pereorming speech recognition |
EP2881898A1 (en) * | 2013-12-09 | 2015-06-10 | Accenture Global Services Limited | Virtual assistant interactivity platform |
US20150348565A1 (en) * | 2014-05-30 | 2015-12-03 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US20160062604A1 (en) * | 2014-08-29 | 2016-03-03 | Nuance Communications, Inc. | Virtual assistant development system |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110310636A (zh) * | 2019-06-24 | 2019-10-08 | 歌尔股份有限公司 | 交互控制方法、装置、设备及音频设备 |
CN110544475A (zh) * | 2019-07-08 | 2019-12-06 | 三星电子(中国)研发中心 | 一种多语音助手的实现方法 |
CN110544475B (zh) * | 2019-07-08 | 2022-03-11 | 三星电子(中国)研发中心 | 一种多语音助手的实现方法 |
CN114303132A (zh) * | 2019-08-22 | 2022-04-08 | 三星电子株式会社 | 在虚拟个人助手中使用唤醒词进行上下文关联和个性化的方法和系统 |
CN114303132B (zh) * | 2019-08-22 | 2024-03-01 | 三星电子株式会社 | 在虚拟个人助手中使用唤醒词进行上下文关联和个性化的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
EP3437215A1 (en) | 2019-02-06 |
EP3437215A4 (en) | 2019-11-27 |
US11200891B2 (en) | 2021-12-14 |
US20200402502A1 (en) | 2020-12-24 |
WO2017222503A1 (en) | 2017-12-28 |
CN109313897B (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109313897A (zh) | 利用多个虚拟助理服务的通信 | |
US10805470B2 (en) | Voice-controlled audio communication system | |
US20210090567A1 (en) | Method and apparatus for managing voice-based interaction in internet of things network system | |
US20230370827A1 (en) | Methods and systems for establishing and maintaining presence information of neighboring bluetooth devices | |
CN109147770B (zh) | 声音识别特征的优化、动态注册方法、客户端和服务器 | |
KR101818986B1 (ko) | 오디오 입력에 기초하여 정보를 획득하는 방법, 장치 및 시스템 | |
US11282519B2 (en) | Voice interaction method, device and computer readable storage medium | |
CN109844856A (zh) | 从单个设备访问多个虚拟个人助理(vpa) | |
JP7009839B2 (ja) | 認証システム、認証方法およびプログラム | |
US20190155566A1 (en) | Identification of preferred communication devices | |
JP2018190413A (ja) | ユーザ発話の表現法を把握して機器の動作やコンテンツ提供範囲を調整し提供するユーザ命令処理方法およびシステム | |
JP6440483B2 (ja) | 通信システム、サーバ装置、ロボット、情報処理方法、およびプログラム | |
US10147426B1 (en) | Method and device to select an audio output circuit based on priority attributes | |
US20160366528A1 (en) | Communication system, audio server, and method for operating a communication system | |
JP2022087815A (ja) | 相互接続された音声検証システムの使用を通して相互運用性を達成するためのシステム、方法、およびプログラム | |
JPWO2015155977A1 (ja) | 連携システム、装置、方法、および記録媒体 | |
KR102217301B1 (ko) | 개인 일정 및 라이프 스타일을 반영한 인공지능의 컨텍 제어 | |
JP2016057770A (ja) | 通知装置、出力装置、情報通知システム、通知装置の制御方法、および制御プログラム | |
CN116091136B (zh) | 基于代言人的电话营销方法、装置 | |
US12026207B2 (en) | Device for generating user profile and system comprising the device | |
CN109791476A (zh) | 通信装置 | |
US20210407490A1 (en) | Method and system for facilitating group communication over a wireless network | |
EP3998572B1 (en) | Information processing system, information processing method, and recording medium | |
US11574621B1 (en) | Stateless third party interactions | |
JP7082234B1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |