CN113504888A - 用于序列相关数据消息整合的系统和方法 - Google Patents
用于序列相关数据消息整合的系统和方法 Download PDFInfo
- Publication number
- CN113504888A CN113504888A CN202110625162.4A CN202110625162A CN113504888A CN 113504888 A CN113504888 A CN 113504888A CN 202110625162 A CN202110625162 A CN 202110625162A CN 113504888 A CN113504888 A CN 113504888A
- Authority
- CN
- China
- Prior art keywords
- action
- data
- computing device
- data structure
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000001419 dependent effect Effects 0.000 title abstract description 14
- 230000010354 integration Effects 0.000 title abstract description 7
- 230000009471 action Effects 0.000 claims abstract description 490
- 230000005236 sound signal Effects 0.000 claims abstract description 115
- 230000005540 biological transmission Effects 0.000 claims abstract description 81
- 238000012546 transfer Methods 0.000 claims abstract description 55
- 238000005457 optimization Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims description 233
- 238000004891 communication Methods 0.000 claims description 65
- 230000004044 response Effects 0.000 claims description 47
- 230000033001 locomotion Effects 0.000 claims description 7
- 230000000875 corresponding effect Effects 0.000 description 59
- 230000008569 process Effects 0.000 description 18
- 230000000694 effects Effects 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 11
- 238000013515 script Methods 0.000 description 10
- 238000012790 confirmation Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000009189 diving Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013439 planning Methods 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000002730 additional effect Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- IRLPACMLTUPBCL-KQYNXXCUSA-N 5'-adenylyl sulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OS(O)(=O)=O)[C@@H](O)[C@H]1O IRLPACMLTUPBCL-KQYNXXCUSA-N 0.000 description 1
- 241000287107 Passer Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000002910 structure generation Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
- H04L67/63—Routing a service request depending on the request content or context
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- Computer And Data Communications (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Communication Control (AREA)
Abstract
公开了用于序列相关数据消息整合的系统和方法。本发明提供组合指示序列相关操作的多个语音激活的音频输入数据分组的系统和方法。自然语言处理器组件能够从客户端计算设备接收第一和第二输入音频信号并且能够识别相应请求和对应触发关键词。直接动作应用编程接口(“API”)能够生成相应动作数据结构,并且能够构建包括相应动作数据结构的相应数据传输。线程优化组件能够获得第一数据传输的数据分组,并且能够获得第二数据传输的数据分组。线程优化组件能够基于应用于相应数据传输的数据分组的启发式技术来确定序列相关性参数。线程优化组件能够基于序列相关性参数与阈值的比较将第一和第二数据传输合并到单线程中。
Description
本申请是分案申请,原案的申请号是201780001636.X,申请日是2017年8月31日,发明名称是“用于序列相关数据消息整合的系统和方法”。
技术领域
本公开内容涉及用于序列相关数据消息整合的系统和方法。
背景技术
本申请请求于2016年12月30日提交并且标题为“在语音激活的计算机网络环境中的序列相关数据消息整合”的美国专利申请No.15/395,725的权益和优先权,其全部内容出于各种目的通过引用并入本文中。
计算设备间网络业务数据的基于分组或其他方式的过度网络传输会阻止计算设备正确处理网络业务数据、完成与网络业务数据相关的操作或者及时对网络业务数据作出响应。如果响应的计算设备处于或超过其处理能力,则网络业务数据的过度网络传输还会使数据路由复杂化或者降低响应质量,这可能导致低效的带宽占用。对应于内容项目对象的网络传输的控制会因能够启动计算设备之间网络业务数据的网络传输的大量内容项目对象而变得复杂。
发明内容
至少一个方面针对一种组合指示序列相关操作的多个语音激活的音频输入数据分组的系统。由数据处理系统执行的自然语言处理器组件能够经由数据处理系统的接口接收包括由客户端计算设备的传感器检测到的第一输入音频信号的数据分组。自然语言处理器组件能够解析第一输入音频信号以识别第一请求和对应于第一请求的第一触发关键词。数据处理系统的直接动作应用编程接口(“API”)能够基于第一触发关键词并且响应于第一请求而生成第一动作数据结构。直接动作API能够构建包括第一动作数据结构的第一数据传输,以在第一服务提供者计算设备与客户端计算设备之间建立第一通信会话,经由数据处理系统将第一通信会话的数据分组从客户端计算设备路由到第一服务提供者计算设备。自然语言处理器组件能够经由数据处理系统的接口接收包括由客户端计算设备的传感器检测到的第二输入音频信号的数据分组,并且能够解析第二输入音频信号,以识别第二请求和对应于第二请求的第二触发关键词。直接动作API能够基于第二触发关键词并且响应于第二请求而生成第二动作数据结构。直接动作API能够构建包括第二动作数据结构的第二数据传输,以在第二服务提供者计算设备与客户端计算设备之间建立第二通信会话,经由数据处理系统将第二通信会话的数据分组从客户端计算设备路由到第二服务提供者计算设备。由数据处理系统执行的线程优化组件能够获得第一数据传输的数据分组,并且能够获得第二数据传输的数据分组。线程优化组件能够基于应用于第一数据结构的数据分组和应用于第二数据结构的数据分组的启发式技术来确定序列相关性参数。线程优化组件能够基于序列相关性参数与阈值的比较将第一数据传输和第二动作数据传输合并到单线程中。
至少一个方面针对一种管理指示序列相关操作的多个语音激活的音频输入数据通信的方法。方法能够包括:通过由数据处理系统执行的自然语言处理器组件,经由数据处理系统的接口接收包括由客户端计算设备的传感器检测到的第一输入音频信号的数据分组。方法能够包括:通过自然语言处理器组件,从第一输入音频信号中识别第一请求和对应于第一请求的第一触发关键词。方法能够包括:通过数据处理系统的直接动作应用编程接口(“API”),基于第一触发关键词并且响应于第一请求生成第一动作数据结构。方法能够包括:构建包括第一动作数据结构的第一数据传输,用于第一服务提供者计算设备与客户端计算设备之间的第一通信会话,经由数据处理系统将第一通信会话的数据分组从客户端计算设备路由到第一服务提供者计算设备。方法能够包括:通过自然语言处理器组件,经由数据处理系统的接口,接收包括由客户端计算设备的传感器检测到的第二输入音频信号的数据分组,以及通过自然语言处理器组件,解析第二输入音频信号,以识别第二请求和对应于第二请求的第二触发关键词。方法能够包括:通过直接动作API,基于第二触发关键词并且响应于第二请求生成第二动作数据结构。方法能够包括:构建包括第二动作数据结构的第二数据传输,用于第二服务提供者计算设备与客户端计算设备之间的第二通信会话,经由数据处理系统将第二通信会话的数据分组从客户端计算设备路由到第二服务提供者计算设备。方法能够包括:通过由数据处理系统执行的线程优化组件,获得第一数据传输的数据和第二数据传输的数据。方法能够包括:基于应用于第一数据结构的数据和应用于第二数据结构的数据的启发式技术,确定序列相关性参数。方法能够包括:基于序列相关性参数与阈值的比较,将第一动作数据结构和第二动作数据结构与单线程相关联。
至少一个方面针对一种存储指令的计算机可读存储介质,指令当由一个或多个数据处理器执行时使得一个或多个数据处理器执行操作,以管理指示序列相关操作的多个语音激活的音频输入数据通信。操作能够包括:通过由数据处理系统执行的自然语言处理器组件,经由数据处理系统的接口接收包括由客户端计算设备的传感器检测到的第一输入音频信号的数据分组。操作能够包括:通过自然语言处理器组件,从第一输入音频信号中识别第一请求和对应于第一请求的第一触发关键词。操作能够包括:通过数据处理系统的直接动作应用编程接口(“API”),基于第一触发关键词并且响应于第一请求,生成第一动作数据结构。操作能够包括:构建包括第一动作数据结构的第一数据传输,用于第一服务提供者计算设备与客户端计算设备之间的第一通信会话,经由数据处理系统将第一通信会话的数据分组从客户端计算设备路由到第一服务提供者计算设备。操作能够包括:通过自然语言处理器组件,经由数据处理系统的接口,接收包括由客户端计算设备的传感器检测到的第二输入音频信号的数据分组,以及通过自然语言处理器组件解析第二输入音频信号,以识别第二请求和对应于第二请求的第二触发关键词。操作能够包括:通过直接动作API,基于第二触发关键词并且响应于第二请求生成第二动作数据结构。操作能够包括:构建包括第二动作数据结构的第二数据传输,用于第二服务提供者计算设备与客户端计算设备之间的第二通信会话,经由数据处理系统将第二通信会话的数据分组从客户端计算设备路由到第二服务提供者计算设备。操作能够包括:通过由数据处理系统执行的线程优化组件,获得第一数据传输的数据分组和第二数据传输的数据分组。操作能够包括:基于应用于第一数据结构的数据分组和应用于第二数据结构的数据分组的启发式技术,确定序列相关性参数。操作能够包括:基于序列相关性参数,将第一动作数据结构和第二动作数据结构与单线程相关联。
下面详细讨论这些和其他方面以及实施方式。上文的信息和下文的具体描述包括各个方面和各种实施方式的说明性示例,并且提供用于理解所要求保护的方面和实施方式的性质和特点的概述或构架。附图提供对各个方面和各种实施方式的说明和进一步理解,并且被并入本发明且构成本说明书的一部分。
附图说明
附图并不意图按比例绘制。在各图中相似的附图标号和标记指示相似的元素。为清楚起见,在每个图中可以并不标注每个组件。在图中:
图1描绘出组合在语音激活的计算机网络环境中指示序列相关操作的多个语音激活的音频输入数据分组的系统;
图2描绘出用于基于语音激活的数据分组的计算机网络环境的单线程结构的功能图;
图3描绘出基于语音激活的数据分组的计算机网络环境中的线程数据结构生成以及在远程数据处理系统与服务提供者计算设备之间通信的功能图;
图4描绘出管理指示序列相关操作的多个语音激活的音频输入数据通信的方法;以及
图5是图示出可以用来实现本文所述和所示的系统和方法的元素的计算机系统的总体架构的框图。
具体实施方式
下面更详细地描述有关在语音激活的计算机网络环境中优化对多个语音激活的音频输入数据分组的处理的方法、装置和系统的各种概念及其实施方式。上文介绍并且下文将更详细讨论的各种概念可以通过若干方式中的任何一种来实现。
本公开的系统和方法大体上涉及一种数据处理系统,其经由在语音激活的计算机网络环境中基于数据分组的传输来优化或动态地调整多个基于语音激活的分组(或者其他协议)的输入音频信号。数据处理系统能够例如通过从输入音频信号中提取信息以生成多个对应的动作数据结构,来提高通过一个或多个计算机网络的数据分组传输的效率和有效性。动作数据结构能够被构建用于在数据处理系统与多个不同的服务提供者计算设备之间的通信会话期间进行传输。例如,从不同动作数据结构的分组中,数据处理系统能够确定至少一个序列相关性参数。序列相关性参数能够指示由动作数据结构或者它们的对应数据传输指示的动作的操作顺序。基于序列相关性参数,数据处理系统能够将多个动作数据传输合并或组合到单线程中。
单线程能够包括多个动作数据结构的序列相关操作。数据处理系统能够将单线程或其部分(例如,至少一个基于分组的数据结构)提供给多个服务提供者计算设备,以完成由单线程指示的动作。数据处理系统还能够将单线程或其部分提供给至少一个内容提供者计算设备,以获得与单线程相关联的内容项目。服务提供者计算设备和内容提供者计算设备能够经由或绕过数据处理系统与至少一个客户端计算设备(例如,音频输入信号源)进行通信,以呈现音频输出来完成由线程指示的动作或者在客户端计算设备处呈现内容项目。
通过将多个动作数据结构合并或以其他方式整合到单线程中,以及通过识别由单线程指示的序列相关操作,相对于没有这种整合和序列相关性识别而个别处理多个动作数据结构,降低了数据处理系统的处理、功率和存储器利用率要求。例如,个体别动作数据结构的异步或失序处理操作能够导致经由数据处理系统与服务提供者计算设备或者内容提供者计算设备之间已建立的通信会话的不适时、过早或不必要的数据分组通信。这会浪费带宽,并且可能导致数据处理系统以及服务提供者计算设备或者内容提供者计算设备出现不必要的处理操作,这就浪费多个计算设备的计算资源。
基于单线程中所识别的序列相关操作,数据处理系统能够暂时性或者永久性跳过一组序列相关操作的初始操作,并且能够改为转到对应于稍后或最后操作的操作。通过绕过对应于多个序列相关操作中的前期操作的基于分组或者其他协议的数据传输,并且改为直接转到操作序列中的后期操作的基于分组的数据传输,数据处理系统能够减少、延迟或者消除与早期操作相关联的数据处理。这节省了处理功率和诸如存储器的其他计算资源,减少数据处理系统的电力消耗,并且降低的经由计算机网络的数据传输会减少数据处理系统的带宽要求和使用。
本文所述的系统和方法能够包括接收第一输入音频信号的数据处理系统。从第一输入音频信号中,数据处理系统能够识别第一请求和对应于该请求的第一触发关键词。基于第一触发关键词或者第一请求,数据处理系统能够生成第一动作数据结构,并且能够构建或准备包括该第一动作数据结构的第一数据传输。作为第一通信会话的一部分,第一数据传输能够作为基于数据分组或者其他协议的传输从客户端计算设备路由到至少一个第一服务提供者计算设备。
数据处理系统能够接收第二输入音频信号。从第二输入音频信号中,数据处理系统能够识别第二请求和对应于该请求的第二触发关键词。基于第二触发关键词或者第二请求,数据处理系统能够生成第二动作数据结构,并且能够构建或准备包括该第二动作数据结构的第二数据传输。作为第二通信会话的一部分,第二数据传输能够作为基于数据分组或者其他协议的传输从客户端计算设备路由到至少一个第二服务提供者计算设备。第一和第二服务提供者计算设备能够对应于不经由数据处理系统彼此通信的不同实体。
数据处理系统能够(例如,从第一和第二数据结构中)获得第一和第二传输的数据分组,并且能够从数据分组中提取信息以确定至少一个序列相关性参数。序列相关性参数能够指示用于第一和第二数据结构的动作的操作序列。数据处理系统能够将序列相关性参数与阈值(例如,规则、策略或者值)进行比较,并且基于该比较,数据处理系统能够将第一和第二数据传输(或者相关联的动作数据结构)合并到单线程中。单线程能够指示第一和第二(或者更多)动作数据结构的动作,并且能够指示这些动作的序列或者顺序以及序列相关性,其中例如第二动作不能(或者不被调度成)开始,直到第一动作完成。
例如,基于序列相关性或者基于从客户端计算设备接收的输入,数据处理系统能够重新排序、跳过或者至少暂时性绕过与单线程的一些动作相关的操作。这能够在执行基于绕过的动作的数据处理操作中的至少一些之前或者在不执行这些操作的情况下完成。绕过针对第一动作的处理操作,与没有绕过的情况相比,利用更少的数据处理和更少的电力使用便能够识别、发送和呈现与第二动作相关的数据。
图1描绘出在语音激活的基于数据分组(或者其他协议)的计算机网络环境中优化具有序列相关操作的多个动作数据结构的处理的示例系统100。系统100能够包括至少一个数据处理系统105,例如,作为语音激活的通信或者规划系统(planning system)的一部分。数据处理系统105能够包括具有至少一个处理器的至少一个服务器。例如,数据处理系统105能够包括位于至少一个数据中心或者服务器群(server farm)中的多个服务器。数据处理系统105能够从输入音频信号中确定请求以及与该请求相关联的触发关键词。基于请求和触发关键词,数据处理系统105能够生成动作数据结构。动作数据结构能够指示对应于输入音频信号的至少一个动作。数据处理系统105能够接收多个单独的输入音频信号,并且针对每个输入音频信号,能够创建相应的数据结构。数据处理系统105能够构建或以其他方式准备用于每个数据结构的数据传输,以在与相应的其他计算设备(例如,服务提供者计算设备或者内容提供者计算设备)的相应通信会话期间传送数据结构。数据处理系统105能够从动作数据结构或者对应的数据传输中确定一个或多个序列相关性参数。基于该序列相关性参数,数据处理系统105能够将多个数据传输(或者对应的动作数据结构)合并到单线程中。单线程能够指示来自至少两个动作数据结构的动作以及操作的顺序或者动作的序列相关性。
数据处理系统105能够包括多个逻辑分组的服务器并且有助于分布式计算技术。服务器的逻辑组可以被称为数据中心、服务器群或者机群(machine farm)。服务器能够在地理上分散。数据中心或者机群可以作为单个实体来管理,或者机群能够包括多个机群。每个机群内的服务器能够是异构的——服务器或机器中的一个或多个能够根据一种或多种类型的操作系统平台来操作。数据处理系统105能够包括存储在一个或多个高密度机架系统中的数据中心中的服务器以及例如位于企业数据中心中的相关联的存储系统。通过这种方式具有统一服务器的数据处理系统105能够通过在本地化高性能网络上定位服务器和高性能存储系统来提高系统易管理性、数据安全性、系统的物理安全性和系统性能。将包括服务器和存储系统的数据处理系统105的全部或一些组件集中化并且将它们与先进的系统管理工具相耦合能够更有效地使用服务器资源,这会节省功率和处理需求并且减少带宽占用。
数据处理系统105能够包括至少一个自然语言处理器(NLP)组件110、至少一个接口115、至少一个线程优化组件120、至少一个内容选择器组件125、至少一个音频信号发生器组件130、至少一个直接动作应用编程接口(API)135、至少一个会话处理程序组件140以及至少一个数据存储库145。NLP组件110、接口115、线程优化组件120、内容选择器组件125、音频信号发生器组件130、直接动作API 135和会话处理程序组件140能够各自包括至少一个处理单元、服务器、虚拟服务器、电路、引擎、代理、电器或者其他逻辑设备,诸如配置成经由至少一个计算机网络165与数据存储库145以及与其他计算设备(例如,客户端计算设备150、内容提供者计算设备155或服务提供者计算设备160)进行通信的可编程逻辑阵列。网络165能够包括诸如因特网、局域网、广域网、城域网或者其他域网、内联网、卫星网络的计算机网络、诸如语音或者数据移动电话通信网络的其他计算机网络及其组合。
网络165能够包括或者构成显示网络,例如,与内容放置或者搜索引擎结果系统相关联或者适合包括第三方内容项目作为内容项目放置活动的一部分的在因特网上的可用信息资源的子集。网络165能够供数据处理系统105用来访问能够由客户端计算设备150呈现、输出、再现或者显示的信息资源,诸如web页面、web站点、域名或者统一资源定位符。例如,经由网络165,客户端计算设备150的用户能够访问由内容提供者计算设备155或者服务提供者计算设备160提供的信息或者数据。
网络165能够例如包括点对点网络、广播网络、广域网络、局域网络、电信网络、数据通信网络、计算机网络、ATM(异步传输模式)网络、SONET(同步光学网络)网络、SDH(同步数字体系)网络、无线网络或者有线网络以及其组合。网络165能够包括无线链路,诸如红外信道或者卫星频带。网络165的拓扑结构可以包括总线、星形或者环形网络拓扑结构。网络165能够包括使用用于移动设备之间通信的任何一个或多个协议的移动电话网络,协议包括高级移动电话协议(“AMPS”)、时分多址(“TDMA”)、码分多址(“CDMA”)、全球移动通信系统(“GSM”)、通用分组无线电服务(“GPRS”)或者通用移动通信系统(“UMTS”)。可以经由不同的协议传输不同类型的数据,或者可以经由不同的协议传输相同类型的数据。
客户端计算设备150、内容提供者计算设备155和服务提供者计算设备160能够各自包括至少一个逻辑设备,诸如具有处理器的计算设备,以经由网络165彼此通信或者与数据处理系统105进行通信。客户端计算设备150、内容提供者计算设备155和服务提供者计算设备160能够各自包括至少一个服务器、处理器或存储器或者位于至少一个数据中心中的多个计算资源或服务器。客户端计算设备150、内容提供者计算设备155和服务提供者计算设备160能够各自包括至少一个计算设备,诸如桌面型计算机、膝上型计算机、平板型计算机、个人数字助理、智能电话、便携式计算机、服务器、瘦客户端计算机、虚拟服务器或者其他计算设备。
客户端计算设备150能够包括至少一个传感器151、至少一个换能器152、至少一个音频驱动器153以及至少一个扬声器154。传感器151能够包括麦克风或者音频输入传感器。换能器152能够将音频输入转换成电子信号。音频驱动器153能够包括由客户端计算设备150的一个或多个处理器执行的脚本或者程序,用以控制传感器151、换能器152或者音频驱动器153以及客户端计算设备150的其他组件处理音频输入或者提供音频输出。扬声器154能够发射音频输出信号。
客户端计算设备150能够与终端用户相关联,该终端用户将语音查询作为音频输入输入到客户端计算设备150(经由传感器151),并且接收从扬声器154输出的能够从数据处理系统105(或者内容提供者计算设备155或服务提供者计算设备160)向客户端计算设备150提供的计算机生成的语音形式的音频输出。计算机生成的语音能够包括来自真人的录音或者计算机生成的语言。
内容提供者计算设备155能够提供基于音频的内容项目,以供客户端计算设备150作为音频输出内容项目显示。内容项目能够包括对货物或者服务的报价,诸如基于语音的消息,该消息表述:“Would you like me to order you a taxi(需要我帮您订辆出租车吗)”?例如,内容提供者计算设备155能够包括存储器,用以存储能够响应于基于语音的查询而提供的一系列音频内容项目。内容提供者计算设备155还能够将基于音频的内容项目(或者其他内容项目)提供给数据处理系统105,其中能够将它们存储在数据存储库145中。数据处理系统105能够选择包括音频分量的内容项目并且将音频项目提供(或者指令内容提供者计算设备155提供)给客户端计算设备150。基于音频的内容项目能够仅为音频,或者能够与文本、图像或视频数据组合。内容项目能够包括当被渲染时提供音频输出或者声波的一个或多个音频文件。除音频内容之外或者替代音频内容,内容项目还能够包括其他内容(例如,文本、视频或者图像内容)。例如,内容项目能够包括文本或者图像文件或者其组合,其不包括音频文件并且不呈现音频输出。
服务提供者计算设备160能够包括至少一个服务提供者自然语言处理器(NLP)组件161以及至少一个服务提供者接口162。服务提供者NLP组件161(或者诸如服务提供者计算设备160的直接动作API的其他组件)能够与客户端计算设备150(经由数据处理系统105或者绕过数据处理系统105)接合,以创建客户端计算设备150与服务提供者计算设备160之间的来回实时基于语音或音频的对话(例如,会话)。例如,服务提供者接口162能够向数据处理系统105的直接动作API135接收或者提供数据消息。服务提供者计算设备160和内容提供者计算设备155能够与同一实体相关联。例如,内容提供者计算设备155能够为汽车共享服务创建、存储或者制作可用的内容项目,并且服务提供者计算设备160能够与客户端计算设备150建立会话,以安排交付汽车共享服务的汽车或者出租车来接走客户端计算设备150的终端用户。经由直接动作API 135、NLP组件110或者其他组件,数据处理系统105还能够与客户端计算设备150建立会话(包括或绕过服务提供者计算设备160)以例如安排交付汽车共享服务的汽车或者出租车。
数据存储库145能够包括一个或多个本地数据库或者分布式数据库并且能够包括数据库管理系统。数据存储库145能够包括计算机数据存储区或者存储器并且能够存储一个或多个参数146、一个或多个策略147、内容数据148或者模板149以及其他数据。参数146、策略147和模板149能够包括诸如有关客户端计算设备150(或者服务提供者设备160)与数据处理系统105之间的基于语音的会话的规则的信息。内容数据148能够包括用于音频输出或者相关联的元数据的内容项目以及能够作为与客户端计算设备150的一个或多个通信会话的一部分的输入音频消息。
数据处理系统105能够包括安装在客户端计算设备150处的应用、脚本或者程序,诸如app,用以将输入音频信号通信到数据处理系统105的接口115并且驱动客户端计算设备的组件呈现输出音频信号。数据处理系统105能够接收包括或者识别音频输入信号的数据分组或者其他信号。例如,数据处理系统105能够执行或者运行NLP组件110的至少一部分,以接收音频输入信号。
NLP组件110能够通过将输入信号与存储的代表性音频波形集合(例如,在数据存储库145中)进行比较并且选取最匹配的那些而将音频输入信号转换成辨别的文本。代表性波形是在大量用户之间生成并且能够用语音样本来增强。在音频信号被转换成辨识的文本之后,NLP组件110能够将文本与例如经由在用户之间训练或者通过手动设定与数据处理系统105能够服务的动作相关联的词语进行匹配。
音频输入信号能够由客户端计算设备的传感器151(例如,麦克风)来检测。经由换能器152、音频驱动器153或者其他组件,客户端计算设备150能够将音频输入信号提供给数据处理系统105(例如,经由网络165),其中该音频输入信号能够被接收(例如,通过接口115)并且被提供给NLP组件110或者被存储在数据存储库145中作为内容数据148。
系统100能够在语音激活的数据分组(或者其他协议)环境中优化包括序列相关操作的动作数据结构的处理。例如,数据处理系统105能够包括或者是语音激活辅助服务,语音命令设备,智能个人助理,知识导航器,事件规划或其他辅助程序的一部分。数据处理系统105能够提供用于从客户端计算设备150中显示的音频输出的一个或多个实例,以完成有关该输入音频信号的任务。这些任务能够例如包括与服务提供者计算设备160或者其他第三方计算设备进行通信以进行晚餐预订或者购买电影票。例如,终端用户能够向客户端计算设备150输入音频信号:“OK,I would like to go to go dinner tonight(好,我今晚想去吃晚餐)”。该输入音频信号能够由客户端计算设备150的传感器151(例如,麦克风)检测并且(例如,由换能器152)变换成基于数据分组或者其他协议的结构,以便传输到数据处理系统105。
NLP组件110能够接收或以其他方式获得至少一个第一输入音频信号。例如,经由接口115和计算机网络165,NLP组件110能够从客户端计算设备150获得第一输入音频信号。NLP组件110能够从第一输入音频信号中提取数据或以其他方式解析第一输入音频信号,以识别至少一个第一请求或者对应于该第一请求的至少一个第一触发关键词。第一请求能够指示第一输入音频信号的意图或者主题,例如,吃晚餐的意图。第一触发关键词能够指示可能采取的动作的类型。例如,NLP组件110能够解析第一输入音频信号以识别晚上离开家去吃晚餐的至少一个请求。第一触发关键词能够包括指示要采取的动作的至少一个词语、短语、词根或部分词或者派生词。例如,输入音频信号中的关键词“go(去)”或者“to go to(要去)”能够指示需要交通。在本示例中,输入音频信号(或者所识别的请求)并未直接表达对交通的意图,然而触发关键词指示交通是对由请求指示的至少一个其他动作的附属或子动作。
NLP组件110能够接收第二输入音频信号。例如,第一音频输入信号可能是“OK,Iwould like to go to go dinner tonight(好,我今晚想去吃晚餐)”,并且第二音频输入信号可能是“OK,I would like to catch a movie later(好,我想稍后去看电影)”。与获得第一输入音频信号类似的方式,例如经由网络165,NLP组件110能够通过从任何客户端计算设备150接收或以其他方式获得第二输入音频信号。NLP组件110能够从第二输入音频信号中提取数据或以其他方式解析第二输入音频信号,以识别至少一个第二请求或者对应于该第二请求的至少一个第二触发关键词。第二请求能够指示第二输入音频信号的意图或者主题,例如,在影院中观看电影的意图。第二触发关键词能够指示可能采取的动作的类型。例如,NLP组件110能够解析第二输入音频信号以识别晚上离开家去看电影的至少一个请求。第二触发关键词能够包括指示要采取的动作的至少一个词语、短语、词根或部分词或者派生词。例如,来自第二输入音频信号的触发关键词“to catch”能够指示对交通的需要,例如,作为由请求指示的至少一个其他动作的附属或子动作。
直接动作API 135能够执行例如来自NLP组件110、线程优化组件120或者内容选择器组件125的程序或者脚本,以执行任务或动作,或者识别响应于输入音频信号的内容项目。直接动作API 135能够执行由数据处理系统105确定的指定动作来满足终端用户的意图。根据在其输入中指定的动作,直接动作API 135能够执行代码或者对话脚本,其识别满足用户请求所需的参数。这样的代码能够例如在数据存储库145中查找附加信息,诸如家庭自动化服务的名称,或者其能够提供用于在客户端计算设备150处呈现的音频输出,以向终端用户询问问题,诸如所请求的出租车的预期目的地、要观看的电影的题材或者要去吃晚餐的餐馆的类型。直接动作API 135能够确定必要的参数并且能够将信息打包成动作数据结构,动作数据结构能够再被发送到诸如内容选择器组件125的另一个组件或者要实现的服务提供者计算设备160(或者内容提供者计算设备155)。
数据处理系统105的直接动作API 135能够基于请求或者触发关键词来生成线程的动作的数据结构。动作数据结构能够响应于请求而被生成。动作数据结构能够被包括在发送到服务提供者计算设备160或者由其接收的消息中。基于由NLP组件110解析的请求,直接动作API 135能够确定应向多个服务提供者计算设备160中的哪一个发送消息。
直接动作API 135能够基于第一触发关键词并且响应于第一请求来生成第一动作数据结构,并且能够基于第二触发关键词并且响应于第二请求来生成第二动作数据结构。例如,如果第一输入音频信号包括“go to dinner tonight(今晚去吃晚餐)”,则NLP组件110能够识别触发词“tonight(今晚)”和对晚餐建议或者预约的请求。直接动作API 135能够将请求打包成第一动作数据结构,以便作为消息发送到餐馆的服务提供者计算设备160(或者内容提供者计算设备155)。第一输入音频信号能够包括指示附属于晚餐动作的其他动作的其他请求或者触发关键词。这些动作能够被包括在第一动作数据结构中。例如,NLP组件110能够从第一输入音频信号“OK,I would like to go to go dinner tonight(好,我今晚想去吃晚餐)”中识别关于去往或者离开晚餐的交通(附加动作)的第一请求或者第一触发关键词。
例如,如果第二输入音频信号包括“catch a movie later(稍后去看电影)”,则NLP组件110能够利用触发关键词“catch”或者“later”识别对看电影的请求。直接动作API135能够将请求打包成第二动作数据结构,以便作为消息发送到电影公司或者电影院的服务提供者计算设备160(或者内容提供者计算设备155)。第二输入音频信号能够包括指示附属于电影动作的其他动作的其他第二请求或者第二触发关键词。这些动作能够被包括在第二动作数据结构中。例如,NLP组件110能够从第二输入音频信号“OK,I would like tocatch a movie later(好,我稍后想去看电影)”中识别关于去往或者离开电影院的交通(附加动作)的第一请求或者第一触发关键词。
第一和第二或者任何其他动作数据结构也能够被传递到内容选择器组件125。动作数据结构能够包括关于完成与请求相关联的一个或多个动作的信息。在本示例中,该信息能够包括餐馆或者电影兴趣指示符、位置信息、餐馆的标识或位置或者餐馆的类型、餐馆预约信息、影院的电影放映时间、影院位置信息或者接人位置以及目的地位置。直接动作API 135能够从存储库145中检索模板149,以确定将哪些字段包括在动作数据结构中。直接动作API 135能够从存储库145中检索内容,以获得关于数据结构的字段的信息。直接动作API 135能够用该信息来填充模板中的字段,以生成数据结构。直接动作API 135还能够用来自输入音频信号或者第三方来源的数据填充字段。模板149能够针对服务提供者的类别而被标准化,或者能够针对特定服务提供者而被标准化。例如,乘车共享服务提供者能够使用下列标准化模板149来创建数据结构:{client_device_identifier;authentication_credentials;pick_up_location;destination_location;no_passengers;service_level}。数据结构能够包括可变字段。可变字段能够例如指示由数据结构的至少一个动作指示或者与其相关的多个动作的序列或者操作顺序。直接动作API 135能够填充数据结构的字段,包括可变字段。基于动作之间的序列相关性,诸如第二动作在第一动作结束之后开始,直接动作API135能够将数据填充或者输入到数据结构的一个或多个可变字段中。
直接动作API 135能够构建包括对应于动作数据结构的数据分组的数据传输。例如,数据传输能够包括动作数据结构的分组化版本,例如,具有指示由数据结构表示的信息的报头和有效载荷区域的数据分组。数据传输能够被用于经由数据处理系统105建立(例如,参与)服务提供者计算设备160与客户端计算设备150之间的至少一个通信会话。会话处理程序组件140能够经由接口115建立或者识别通信会话。例如,在将第一动作和第二数据结构(或者它们对应的分组化数据传输)合并或者关联到单线程中之后,数据处理系统105能够将数据传输提供给服务提供者计算设备160。作为通信会话的通信的一部分,服务提供者计算设备160还能够经由数据处理系统105从客户端计算设备105接收数据分组(或者其他数据消息)。例如,作为通信会话的一部分,数据处理系统105能够接收入站数据消息并且能够将其从客户端计算设备150路由到服务提供者计算设备160。
线程优化组件120能够获得或者访问第一和第二(以及任何其他)数据传输的数据分组。例如,直接动作API 135能够将传输(例如,对应的数据分组)提供给数据存储库145以便存储,其中它们能够供线程优化组件120检索。线程优化组件120还能够绕过数据存储库145从直接动作API 135(或者其他数据处理系统105组件)接收数据传输的数据分组(或者基于其他协议的结构)。
线程优化组件120能够解析或以其他方式提取分别对应于多个动作数据结构的多个数据传输的数据分组中的信息。例如,线程优化组件120能够对第一数据传输的数据分组(或者对应的第一数据结构)以及第二数据传输的数据分组(或者对应的第二数据结构)应用启发式技术,以确定至少一个序列相关性参数。启发式技术或者其他统计技术能够以阈值程度确定或者识别在指示由数据传输指示的动作的序列相关性的第一和第二数据传输(或者对应的数据结构)之间的确定性模式(certainty patterns)。
序列相关性参数能够指示由具有操作顺序、时间或者彼此序列相关性的数据传输(或者对应的动作数据结构)表示的动作的存在或者可能性(例如,相对于阈值水平或者其他基准)。由序列相关性参数指示的序列相关操作或者动作能够包括按已知的、建议的、要求的或者特定的顺序发生的数个动作。例如,从家庭到电影院、然后回家能够包括三个序列相关操作或者动作。在本示例中,第一动作包括从家到电影院。第二动作包括在影院里看电影。第三动作包括从影院回家。
这三个(以及可能其他的)动作能够由直接动作API 135从对应于输入音频信号“OK,I would like to catch a movie later(好,我稍后想去看电影)”的请求或者触发关键词中确定。在本示例中,序列中的第二动作(看电影)是在第一动作(离开家去电影院)之后并且取决于该第一动作,并且第三动作(回家)是在第一动作和第二动作之后并且取决于这两个动作。第三动作能够被认为是在第二动作之后并且取决于该第二动作,因为已经表达出有意这样做,数据处理系统105确定或者预测终端用户在回家之前还会在影院中看电影。
基于序列相关性参数,线程优化组件120能够将两个或更多个分组化数据传输(或者它们的对应动作数据结构)合并到单线程中。单线程能够包括从多个数据动作结构中识别动作的数据以及其他数据(例如,元数据或者第三方数据)。单线程能够呈分组化(或者基于其他协议的)形式,例如,呈与第一和第二数据传输相同的格式。单线程也能够是例如由直接动作API 135生成的数据结构格式,或者遵循至少一个模板149、策略147或者参数146的格式。单线程能够包括或者指示来自一个或多个数据传输或者来自一个或多个动作数据结构的动作的关联或者链接。
数据传输或者动作数据结构能够由线程优化组件120合并或者彼此相关联,以在经由通信会话将由动作数据结构指示的数据传输到服务提供者计算设备160之前生成单线程。在本示例中,直接动作API 135或者其他数据处理系统105组件(例如,接口115)能够在合并或者创建单线程之后首次将由单线程指示的数据的至少一部分发送到服务提供者计算设备160。例如,在创建单线程之前,数据处理系统105可能具有与第一或第二(或者任何其他)数据结构相关联的延迟的、阻止的、截留的或者未发送的数据。在一些示例中,由各个数据结构指示的数据中的至少一些能够在创建单线程之前由/从数据处理系统105提供给服务提供者计算设备160。
基于序列相关性参数,线程优化组件120能够将数据传输(或者对应的动作数据结构)合并或以其他方式整合或关联到单线程中。例如,第一数据传输(以及第一数据结构)能够表示与第一输入音频信号“OK,I would like to go to go dinner tonight(好,我今晚想去吃晚餐)”相关联的动作,第二数据传输(以及第二数据结构)能够表示与第二输入音频信号“OK,I would like to catch a movie later(好,我稍后想去看电影)”相关联的动作。第一和第二(或者任何其他)输入音频信号能够是依序地(彼此相继不到一分钟),按时间彼此分开(例如,大于一分钟),并且能够源自相同或不同的客户端计算设备150。线程优化组件120能够获得表示该信息的数据分组(或者其他数据),并且能够确定至少一个序列相关性参数。例如,序列相关性参数能够指示从电影院回家的动作发生在观看电影的动作之后,或者观看电影的动作发生或者预计发生在吃晚餐的动作之后。
单线程(以任何数据结构或者格式)能够指示对应于一个或多个输入音频信号(或者对应的数据结构或者数据传输)的一组序列相关操作,诸如一系列动作。线程能够包括任何两个或者两个以上动作,诸如第一动作、第二动作和第三动作。例如,第一输入音频信号“OK,I would like to go to go dinner tonight(好,我今晚想去吃晚餐)”和第二输入音频信号“OK,I would like to catch a movie later(好,我稍后想去看电影)”的合并能够包括指示有兴趣参加晚餐和电影的至少一个请求以及指示需要交通工具的至少一个触发关键词,例如“go(去)”。线程优化组件120能够识别指示动作之间的操作相关性的至少一个序列、时间或者顺序的至少一个序列相关性参数,并且能够生成单线程以组合多个输入音频信号(或者对应的基于模板的数据结构或者基于分组/协议的数据传输)。线程优化组件120能够创建单线程,其指示至少三个动作,诸如晚餐动作(第一动作)、电影动作(第二动作)和交通工具回家动作(第三动作)。在本示例中,根据请求或者触发关键词,线程优化组件120从指示三个动作的多个单独的输入中生成单线程。单线程能够包括其他动作,诸如最初交通去晚餐动作。
数据处理系统105或其组件(诸如线程优化组件120)能够确定线程的动作是序列相关操作。例如,线程优化组件能够确定看电影的第二动作是在吃晚餐的第一动作之后,并且从电影院回家的第三动作是在看电影的第二动作之后。线程优化组件120能够访问数据存储库145中的参数146或者策略147,以确定或以其他方式估计序列相关动作的顺序。例如,参数146或者策略147能够指示交通动作(例如,乘出租车回家)会发生在事件动作(例如,看电影)之后。
内容选择器组件125能够获得单线程的动作中的任何一个的指示。例如,线程优化组件120能够直接或者间接(例如,经由数据存储库145)向内容选择器组件125提供指示第三(或者任何其他)动作的单线程的至少一部分。内容选择器组件125能够从数据存储库145获得该信息,其中该信息能够被存储为内容数据148的一部分。第三动作的指示能够向内容选择器组件125通知需要交通工具从电影院的位置到由客户端计算设备150确定或者指示的位置,诸如乘车到最终目的地。
内容选择器组件125能够在至少一个稍早动作发生之前获得线程中稍后动作的指示。例如,内容选择器组件125能够在影院中播放电影(第二动作)之前或者在将输入音频信号输入客户端计算设备150的人在餐馆吃晚餐(第一动作)之前接收第三动作的指示(例如,需要从电影院乘车)。内容选择器组件125能够在线程的至少一个动作完成之前获得线程的至少一个动作的指示。
从由内容选择器组件125接收的信息中,例如,在序列相关线程中的至少一个在前动作发生之前的第三动作的指示,内容选择器组件125能够识别至少一个内容项目。内容项目能够响应于或者相关于第三(或者任何其他)动作。例如,响应于指示交通工具需要的第三动作,内容项目能够包括提供汽车共享公司的服务的音频消息。内容选择器组件125能够例如从内容数据148中查询数据存储库145来选择或以其他方式识别内容项目。内容选择器组件125还能够从内容提供者计算设备155选择内容项目。例如,响应于从数据处理系统105接收的查询,内容提供者计算设备155能够向数据处理系统105(或其组件)提供内容项目,以供客户端计算设备150最终输出。
音频信号发生器组件130能够生成或以其他方式获得包括响应于第三(或者任何其他)动作的内容项目的输出信号。例如,数据处理系统105能够执行音频信号发生器组件以生成或者创建对应于内容项目的输出信号。例如,作为通信会话的一部分,数据处理系统105的接口115能够经由计算机网络165向客户端计算设备150提供或者发送包括输出信号的一个或多个数据分组。接口115能够被设计、配置、构建或者操作成例如使用数据分组来接收和发送信息。接口115能够使用诸如网络协议的一个或多个协议来接收和发送信息。接口115能够包括硬件接口、软件接口、有线接口或者无线接口。接口115能够有助于将数据从一种格式转换或者格式化成另一种格式。例如,接口115能够包括应用编程接口,其包括用于诸如系统100的软件组件的各种组件之间通信的定义。
例如,数据处理系统105能够从数据储存库145或者从音频信号发生器组件130向客户端计算设备150提供输出信号。数据处理系统105还能够经由数据分组传输指令内容提供者计算设备155或者服务提供者计算设备160向客户端计算设备150提供输出信号。作为从数据处理系统105(或者其他计算设备)到客户端计算设备150的一个或多个数据分组(或者其他通信协议),输出信号能够被获得、被生成、被转换、或者被发送。
内容选择器组件125能够跳到由单线程指示的一组序列相关操作中的稍后动作,以在对应于稍后动作的活动发生之前(并且在即时需要之前)选择稍后动作的内容项目。通过跳到稍后排序的动作,例如,在选择第一在先动作的内容项目之前选择第二后续动作的内容项目,数据处理系统105不需要首先处理与在先动作相关的信息来选择后续操作的内容项目。这样就能减少如果在选择第二动作的内容项目之前还选择(第一动作的)内容项目相关联的数据传输中所需的处理器利用率、功耗和带宽。
作为实时内容选择过程的一部分,内容选择器组件125能够选择(随后或稍后)动作的内容项目。例如,内容项目能够被提供给客户端计算设备,以便直接响应于输入音频信号以对话方式作为音频输出传输。用于识别内容项目并且将内容项目提供给客户端计算设备150的实时内容选择过程能够在输入音频信号时间的一分钟或更短时间内发生,并且被认为是实时。
对应于例如由经由接口115和计算机网络165发送到客户端计算设备150、由音频信号发生器组件130获得或者生成的对应于内容提供者计算设备155的内容项目(或者对应于服务提供者计算设备160的数据)的输出信号能够使得客户端计算设备150执行音频驱动器153以驱动扬声器154来生成对应于输出信号的声波。声波能够包括稍后(例如,第二或第三)动作的内容项目或者其他数据的词语或者与其相对应的词语。对应于内容项目的输出信号还能够包括在作为输入音频信号源的客户端计算设备150或者不同的客户端计算设备150(例如,可佩戴设备的计算设备)上作为在无音频元素的情况下能够呈现的文本或者图像消息呈现的非音频内容项目。
数据处理系统105能够提供输出信号,该输出信号包括响应于对输入音频信号做出直接或者实时响应的动作的内容项目或者其他数据,以便作为数据处理系统105与客户端计算设备150之间的通信会话的一部分的经由计算机网络165的基于分组的数据传输具有实时人与人对话的流畅和感觉。该基于分组的数据传输通信会话还能够包括内容提供者计算设备155或者服务提供者计算设备160。
内容选择器组件125能够在选择序列中的任何在先动作的任何内容项目之前,在序列相关动作集中选择响应于第二(或者任何非第一)动作而提供的内容项目。这避免了需要处理对应于在先动作的数据中的至少一些,这与如果按照与动作序列的顺序相匹配的顺序来选择内容项目相比,使得以减少处理操作数目选择第二内容项目。例如,在选择第二动作的内容项目之后,可以或可以不选择在先(例如,第一和第二)动作的内容项目。
内容选择器组件125能够基于指示与相同线程的一个或多个请求的主题不同的主题的线程的至少一个触发关键词来选择(例如,第二动作的)内容项目。例如,单线程的请求能够指示晚餐请求(第一动作)的主题以及电影请求(第二动作)的主题。该主题未指示任何交通工具要求。然而,NLP组件110或者线程优化组件120(或者作为直接动作API 135的一部分执行的其他数据处理系统105的组件)能够识别触发关键词“go(去)”、“go to(去往)”或者“to go to(要去)”,并且能够至少部分地基于触发关键词确定交通工具请求。因此,数据处理系统105能够从作为非主请求的次请求的输入音频信号或者输入音频信号的主题中推断动作。
数据处理系统105能够防止或者延迟传输包括内容项目的输出信号。例如,接口115或者经由直接动作API 135执行的脚本能够防止传输包括对应于内容项目或者单线程的动作的输出信号的数据分组,直到触发事件为止。触发事件能够包括预定时间段的期满,诸如两个小时,或者与线程中稍早动作的发生相符的时间,诸如电影的预定结束时间。触发事件还能够包括由数据处理系统105从客户端计算设备150接收的授权指示。授权指示能够起源于与线程相关联但由数据处理系统105在输入音频信号、基于文本的信号或者其他不可听信号之后接收的后续音频输入,或者能够包括授权通过内容项目的客户端计算设备150的接收的客户端计算设备150的设置的指示。
数据处理系统105还能够延迟传输与线程的第二动作相关联或者第二动作之后的内容项目,以优化处理利用率。例如,数据处理系统105能够延迟内容项目传输,直到数据中心使用的非高峰时间或者非高峰时段,从而通过降低峰值带宽使用率、热输出或者冷却要求而更有效地利用数据中心。基于数据中心利用率或者网络165或包括数据处理系统105的数据中心的带宽度量或需求,数据处理系统105还能够启动与内容项目相关联的转换或者其他活动,诸如预订汽车服务。
内容项目能够对应于线程的动作,并且内容选择器组件125能够选择线程的一个、一个以上或者全部动作的内容项目。线程优化组件120能够识别例如“晚餐”(第一动作)、“电影”(第二动作)和“从电影位置开始交通”(第三动作)的动作的序列相关线程。
例如,基于单线程,能够提供第三动作的内容项目,以便在客户端计算设备150处呈现响应于音频输入信号的音频响应,其表述“Would you like a ride home from themovie theater?(您想从电影院乘车回家吗?)”。在该呈现之后或之前,数据处理系统105能够选择或者提供内容项目,例如,用于第一动作(晚餐)的“the Italian restaurantdowntown has an opening for 7pm tonight-are you interested?(市中心的意大利餐馆晚上7点开门,您感兴趣吗?)”,并且能够选择或者提供另一个内容项目,例如,用于第二动作(电影)的“would you like tickets to the 9pm movie at the downtown theater?(您想要市中心影院晚上9点的电影票吗?)”。数据处理系统105能够响应于输入音频信号而提供(其包括指令内容提供者计算设备155提供)这些内容,以便由客户端计算设备150呈现为音频输出内容项目。数据处理系统105经由接口115能够按任何顺序选择这些内容项目或者将它们提供给客户端计算设备150。例如,在对应于线程的其他稍早动作的内容项目之前,能够首先选择或者提供第三(例如,最后)动作的内容项目。
数据处理系统105能够接收对内容项目“Would you like a ride home from themovie theater?(您想从电影院乘车回家吗?)”的响应。该响应能够包括输入音频信号,例如,“yes please(是的)”,其由终端用户输入到客户端计算设备150并且由数据处理系统105接收。数据处理系统105或其组件(例如,线程优化组件)能够包括作为单线程的一部分的响应。基于该响应,直接动作API 135能够与服务提供者计算设备160(其能够与内容项目相关联,诸如汽车共享公司)进行通信,以在电影结束时针对电影院的位置预订出租车或者乘车共享车辆。数据处理系统105能够从数据存储库145或者诸如服务提供者计算设备160或内容提供者计算设备155的其他来源获得该位置或者时间信息,作为与客户端计算设备150的基于数据分组(或其他协议)的数据消息通信的一部分。能够将该预订的确认(或者其他转换)以来自数据处理系统105的输出信号的形式作为音频通信从数据处理系统105提供给客户端计算设备150,该输出信号驱动客户端计算设备150呈现音频输出,诸如“great,you will have a car waiting for you at11pm outside the theater(好的,晚上11点会有汽车在影院外等您)”。数据处理系统105经由直接动作API 135能够与服务提供者计算设备160进行通信,以确认汽车的预订。
数据处理系统105能够获得对内容项目(“Would you like a ride home fromthe movie theater?(您想从电影院乘车回家吗?)”)的响应(例如,“yes please(是的)”),并且能够将基于分组的数据消息路由到服务提供者NPL组件161(或者服务提供者计算设备的其他组件)。该基于分组的数据消息能够使得服务提供者计算设备160产生转换,例如,做出汽车在电影院外接人预约。这种转换或者确认的顺序(或者线程的任何其他动作的任何其他转换)能够发生在完成线程的一个或多个动作之前,诸如在电影结束之前,以及发生在线程的一个或多个动作完成之后,诸如在晚餐之后。
基于对线程中的后续动作的内容项目的响应,诸如对序列相关线程中的最后第三动作的内容项目“Would you like a ride home from the movie theater?(您想从电影院乘车回家吗?)”的响应“yes please(是的)”,数据处理系统105能够启动转换或者动作。这能够发生在终端用户开始与线程相关联的任何活动之前,例如,在晚餐之前或者在电影结束之前。数据处理系统105的处理器能够调用直接动作API 135来执行生成从汽车共享服务预订汽车的脚本。直接动作API 135能够从数据存储库145获得内容数据148(或者参数146或策略147)以及从客户端计算设备150获得终端用户同意接收的数据,以确定位置、时间、用户账户、后勤或者其他信息,以便从汽车共享服务预约汽车。使用直接动作API 135,数据处理系统105还能够与服务提供者计算设备160进行通信,以完成转换,在本示例中是进行汽车共享接人预约。
直接动作API 135能够在由数据处理系统105接收到与线程相关联的第一输入音频信号(例如,“OK,I would like to go to go dinner and then a movie tonight(好,我今晚想去吃晚餐,然后看电影)”)的时间段内的任何时间启动对话或者活动来完成线程的动作,直到完成线程中的动作之一之后的阈值时间段为止(例如,直到观看电影的第二动作结束之后的15分钟为止)。数据处理系统110还能够基于其他因素来确定该时间段的结束,诸如终端用户已经完成线程的动作的指示,例如,终端用户已经回家或者不再位于电影院。数据处理系统105还能够从客户端计算设备150获得线程被取消或休眠或者终端用户已经取消或完成线程的动作的指示(经由网络165发送的数据消息)。
基于线程的其他动作的完成或者完成时间,直接动作API 135能够启动转换或者活动来完成线程的动作。例如,数据处理系统105能够在线程中的在先动作结尾的阈值时间段内直接地或者通过与服务提供者计算设备160通信来预订货物或者服务(汽车共享接人)。在电影(第二动作)的预定或者实际结尾之前或者之后的5分钟(或者其他时间段)内,数据处理系统105能够确认或者预订汽车共享服务来派车在电影院接终端用户(后续的第三动作)。在该时间段期间未从终端用户计算设备150接收到的输入的情况下,或者响应于在该时间段期间从终端用户计算设备150接收到的提示,会发生这一过程。
直接动作API 135能够以任何顺序启动与线程的序列相关操作相关联的转换或者其他活动。例如,直接动作API 135(或者其他数据处理系统105的组件)能够在启动对应于序列中的稍早动作的活动之前(例如,在进行晚餐预约之前或者在预订电影票之前),启动对应于最终动作的活动(例如,三个动作线程中的第三动作,诸如预订出租车)。在本示例中,数据处理系统105在启动稍后(例如,第三)动作的活动之后启动稍早(例如,第二)动作的活动。
内容选择器组件125能够识别、选择或者获得由多个内容选择过程产生的多个内容项目。内容选择过程能够是实时的,例如,作为涉及线程的数据处理系统105与客户端计算设备150之间的相同对话、通信会话或者一系列通信会话的一部分。对话能够包括彼此间隔例如几小时或者几天时段的异步通信。对话或者通信会话能够从接收到第一输入音频信号起持续一段时间,直到线程的最终动作的预计或者已知的结尾,由数据处理系统105接收线程终止的指示。这能够被称为线程的活跃时间段。例如,针对具有三个动作(例如,晚餐、电影和交通回家)的线程,内容选择器组件125能够针对每个动作选择至少一个内容项目。内容项目选择器组件125能够针对每个动作运行或者获得来自不同内容选择过程的结果。在内容选择过程中,内容提供者计算设备150能够设置供内容选择器部件125选择的内容项目。针对具有至少三个动作的线程,内容项目选择器组件能够经由第一内容选择过程来选择或以其他方式识别第一内容项目,经由第二内容选择过程来选择或以其他方式识别第二动作的第二内容项目,以及经由第三内容选择过程来选择或以其他方式识别第三动作的第三内容项目。提供这些内容项目以便由客户端计算设备150在活跃时间段期间呈现的数据处理系统105能够被认为是实时操作。在本示例中,内容选择过程与呈现内容项目实时发生。
数据处理系统105能够取消与内容项目相关联的动作。例如,在预订汽车服务之后,终端用户可以观看电影,但随后决定步行回家,或者在电影之后去吃甜品,而非坐汽车回家。作为数据处理系统105的一部分,在客户端计算设备150处执行的app或者其他程序能够接收“cancel my ride home(取消我的乘车回家)”的输入音频信号。NLP组件110能够接收该输入音频信号,例如,作为一个或多个基于分组的数据消息,并且能够确定该输入音频信号与预先存在的线程(例如,晚餐、电影、交通回家)相关并且是相同对话或者通信的一部分。例如,NLP组件110(或者其他数据处理系统105的组件)能够从数据存储库145的内容数据148评估时间数据、位置数据和预先存在的线程数据,诸如线程的过去、现在或者调度的动作,以确定输入音频信号与预先存在的线程相关。例如,基于请求“乘车”或者触发关键词“取消”,NLP组件110能够确定输入音频信号“cancel my ride home(取消我的乘车回家)”与对应于预先存在的线程的第三动作的内容项目“Would you like a ride home fromthe movie theater?(您想从电影院乘车回家吗?)”相关。直接动作API 135(或者其他组件)能够使得数据处理系统105经由接口115与服务提供者计算设备160进行通信,以取消出租车或者汽车共享服务派车在电影结束后在电影院外等待终端用户的预订。
NLP组件135能够接收基于数据分组或者其他协议的消息,以在线程的任何动作完成之前或之后取消线程的动作。NLP组件135能够从客户端计算设备150接收(或者从数据存储库145获得)数据消息(入站音频信号),以在由线程的稍早动作触发的时间间隔内取消线程的动作。例如,在具有晚餐、电影、交通三个动作的序列相关线程中,数据处理系统105能够在电影结束的5分钟(或者其他时间段)内接收交通取消数据消息。数据处理系统105能够提示确认与线程的动作有关的产品或者服务。例如,在第一动作与第二动作之间的时间段(例如,在晚餐之后和电影之前),数据处理系统105能够向客户端计算设备150发送数据消息,该数据消息当在客户端计算设备150处呈现时输出音频或者短信,表述“justconfirming that you still want acar waiting for you after the movie(请确认,您仍想要汽车在电影后等您吗)”。数据处理系统105能够接收响应,例如,“yes,confirmed(是,确认)”或者“no,cancel the car(否,取消汽车)”。该响应能够被包括作为线程的一部分。直接动作API 135能够执行脚本以处理该信息,并且能够与服务提供者计算设备160进行通信以指示确认或者取消。
参照图1和图2,其中,基于序列相关性参数,线程优化组件120能够创建至少一个单线程数据结构200。单线程数据结构200能够包括基于分组的架构(或者其他格式),并且能够包括至少一个报头205。报头205能够包括标识数据处理系统105的补充数据、源或目的地地址信息、管控协议信息、IP地址、帧同步数据、大小数据、分辨率数据或者与动作数据结构相关联的元数据。单线程数据结构200的有效载荷或者主体能够包括至少一个序列相关性参数210或者诸如至少一个第一数据传输215或至少一个第二数据传输220的其他信息。单线程数据结构200能够包括一个或一个以上的结构,例如,具有相应报头205和指示第一数据传输215或者第二数据传输220的至少一部分的有效载荷的多个分组。序列相关性参数215能够指示由第一数据传输215或者第二数据传输220指示的多个动作中的动作的序列相关性。
报头205、序列相关性参数210、第一数据传输215和第二数据传输220可以但不必被包括在单线程数据结构200中。例如,单线程数据结构200的主体能够仅包括第一数据传输215(或其部分)并且不包括序列相关性参数210或者第二数据传输220中的任何一个,或者单线程数据结构200的主体能够包括序列相关性参数210以及第一数据传输215和第二数据传输220中的一个或多个。单线程数据结构200能够包括以依序或者并行方式分开发送的一个或多个单独分组,作为数据处理系统105与服务提供者计算设备160或者内容提供者计算设备155之间的一个或多个数据传输的一部分。报头205或者序列相关性参数210能够指示分开的传输或者分开的数据分组与同批传输相关联,例如,与相同的整体单线程数据结构200相关联。直接动作API 135能够将多个不同的单线程数据结构合并或以其他方式链接到一个单线程数据结构200中。单线程数据结构200能够包括分开但彼此相关联的多个分组或者多个不同结构。
线程优化组件120能够使单线程数据结构200的一个动作优先于另一个动作。优先级能够由序列相关性参数210指示或以其他方式提供给直接动作API 135或者内容选择器组件125。例如,线程优化组件120能够优先化由单线程数据结构200指示的第一按时动作。响应于优先级,直接动作API 135或者诸如内容选择器组件125的其他组件能够向内容提供者计算设备155或者服务提供者计算设备160提供数据传输(例如,第一数据传输215或者第二数据传输220的至少一部分),以实现与第一按时动作相关的转换。
参照图3,其中,数据处理系统105能够从第一客户端计算设备150接收第一输入音频信号305(例如,“OK,I would like to go to go dinner tonight(好,我今晚想去吃晚餐)”)。数据处理系统105还能够从相同或不同的客户端计算设备150接收第二输入音频信号310(例如,“OK,I would like to catch a movie later(好,我稍后想去看电影)”)。数据处理系统105能够生成第一音频输入信号305和第二音频输入信号310的相应动作数据结构和对应数据传输。诸如线程优化组件120的数据处理系统105组件能够对第一输入音频信号305和第二输入音频信号310应用统计技术或者启发式技术,以从第一输入音频信号305和第二输入音频信号310的动作当中生成指示序列相关动作的至少一个序列相关性参数。数据处理系统105能够分批或者汇集对应于第一输入音频信号305和第二输入音频信号310的数据传输(例如,分组)或者动作数据结构,以创建分批或者汇集的单线程数据结构200。响应于第一输入音频信号305和第二输入音频信号310,数据处理系统105能够将单线程数据结构200发送或以其他方式提供给服务提供者计算设备160,以供服务提供者计算设备160处理,例如,以预约至少一辆汽车、购买电影票或者进行晚餐预约。
能够向不同的计算设备提供相同单线程数据结构的部分的不同实例。例如,能够向服务提供者计算设备160提供单线程200的全部或一些以实现转换,例如,从汽车共享服务预订汽车,并且能够向内容提供者计算设备155(同时地或者相继地)提供单线程200的相同或不同部分以实现另一个转换,例如,获得餐馆的内容项目。
响应于接收到单线程数据结构200,内容提供者计算设备155或者服务提供者计算设备160能够执行由单线程数据结构200定义或者指示的至少一个操作。操作能够对应于第一输入音频信号305或者第二输入音频信号310的动作数据结构(或者数据传输)的相应动作中的一个或多个。例如,这些操作能够包括来自服务提供者计算设备160的汽车共享服务中预约汽车,或者提供电影的内容项目。例如,内容提供者计算设备155能够向客户端计算设备150提供第一响应315(例如,电影的内容项目),并且服务提供者计算设备160能够向相同或不同的客户端计算设备150提供第二响应320(例如,预约汽车)。在从内容提供者计算设备155或者服务提供者计算设备160到客户端计算设备150的传输期间,第一响应315和第二响应320能够绕过数据处理系统105。响应315、320能够包括确认转换动作的文本、图像或者其他数据消息(包括音频),诸如从汽车服务中预约汽车或者呈现内容项目。数据处理系统105能够经由计算机网络165从服务提供者计算设备160、内容提供者计算设备155或者从客户端计算设备150接收转换(或者响应315、320)的指示。
由数据处理系统105(例如,由线程优化组件120或者直接动作API 135)创建的单线程200能够指示对应于线程的动作的实际的、已知的、调度的或者估计的时间。这些时间能够包括电影开始时间、交通接人时间、晚餐预约时间或者事件时间等。时间能够是离散时间,例如,晚上8:00晚餐预约,或者相对于其他动作的相对时间,例如,动作“B”被调度成在动作“A”的已知或者估计的结束时间的15分钟后开始。例如,线程200能够指示第一动作(例如,吃晚餐)被调度成发生在第二动作(例如,观看电影)之前。这些动作能够对应于从输入音频信号中识别的数据结构(或者数据传输)动作。直接动作API能够检测第一动作完成。例如,计算设备150能够执行脚本以在餐馆支付账单,或者直接动作API 135能够估计晚餐将持续90分钟,或者终端用户能够提供音频输入信号或者其他数据消息以指示第一动作完成或者被调度成在某一时间或者一个时间窗口内完成。响应于检测到第一动作完成(例如,已知或者估计的结束时间),直接动作API 135能够继续将单线程的数据分组发送到服务提供者计算设备160或者内容提供者计算设备155。该传输能够在已知或者估计的第一动作完成之后或者在已知或者估计的第一动作完成的时间窗期间(例如,一小时内)发生。例如,在晚餐完成后,直接动作API 135能够将单线程200的至少一部分提供给服务提供者计算设备160以购买电影票,或者提供给内容提供者计算设备155以获得电影的内容项目。能够从客户端计算设备150、内容提供者计算设备155或者服务提供者计算设备160向数据处理系统105提供转换的指示(例如,在客户端计算设备150处购票或者呈现内容项目)。序列相关性参数210能够指示单线程200的动作被调度发生的顺序,例如,能够指示第一动作被调度成发生在第二动作之前。
直接动作API 135能够识别单线程200的至少一个动作的至少一个死锁状况。死锁状况能够指示第二动作不能继续,直到第一在先动作完成之后。例如,当第一动作是电影动作(在影院中观看电影)并且第二动作是在电影结束之后通过汽车共享服务交通回家时,直接动作API 135能够识别死锁状况。直接动作API 135能够确定第二动作(例如,乘车回家)的死锁状况,其持续直到与第一动作相关联的时间,诸如电影的排定结束时间。响应于死锁状况,直接动作API 135或者诸如接口115的其他组件能够防止数据传输到服务提供者计算设备(例如,汽车共享服务)。例如,在死锁状况的时间段期间,数据处理系统105或其组件能够防止用于动作(例如,预约汽车)的数据传输(或者数据结构)的数据分组传输到服务提供者计算设备160(例如,汽车共享服务的)。这就防止服务提供者计算设备160过早接收到对汽车(或者其他服务)的请求。
直接动作API 135能够获得指示或以其他方式确定死锁状况已终止或者不再存在。例如,直接动作API 135能够查询服务提供者计算设备160或者其他第三方计算设备以确定电影或者其他动作的排定结束时间。在到达该时间后,或者在该时间之前的阈值时间段(例如,30分钟或者5分钟)内,直接动作API能够中断、解除或者终止死锁状况。在死锁状况期满之后,数据处理系统105能够向服务提供者计算设备160发送(例如,经由接口105)数据传输或者数据结构的数据,其对应于后续动作,诸如电影后乘车回家。
直接动作API 135能够从客户端计算设备150接收指示,以终止死锁状况。例如,终端用户可以决定在电影结束之前提前离场,并且能够将输入音频信号输入到客户端计算设备中,例如,“OK,this movie stinks,I’d like a ride home please(好吧,这个电影太糟糕,我想乘车回家)”。数据处理系统105(例如,NLP组件110或者直接动作API135)能够从该输入音频信号中确定死锁状况已期满,并且能够将后续动作的数据发送到服务提供者计算设备160。在解除死锁状况之后,直接动作API 135还能够向内容提供者计算设备155提供动作的数据(例如,单线程200的数据传输或者动作数据结构的数据),以获得与死锁后动作相关的内容项目。内容项目能够由数据处理系统105或者由内容提供者计算设备155提供给客户端计算设备150来进行呈现。内容项目能够例如指示“Sorry to hear about the movie,would you like to order a car from a car share company?(关于电影的问题很遗憾,您想从汽车共享公司预订汽车吗?)”。响应于死锁状况或者直到解除死锁状况,内容选择器组件125(或者诸如接口115或者直接动作API 135的其他组件)能够阻止内容项目的选择或者所选择的内容项目到客户端计算设备150的传输。
直接动作API 135能够修改由单线程200指示的动作的相继顺序。例如,直接动作API能够确定第一相继顺序的指示,例如,第一动作、第一动作之后的第二动作以及第二动作之后的第三动作(晚餐,然后电影,然后乘车回家)。直接动作API 135和诸如NLP组件110和接口115的其他组件能够接收修改相继顺序的请求。例如,数据处理系统105能够从客户端计算设备接收输入音频信号“OK I’d like to eat dinner after the movie(好,我想在电影之后吃晚餐)”。直接动作API135(或者NLP组件110)能够从该音频输入信号中获得将动作的相继顺序修改成例如电影、然后晚餐、然后乘车回家的请求。从该信息中,直接动作API 135能够生成修改的相继顺序,以便第二动作(观看电影)现在被调度成发生在第一动作(吃晚餐)之前。直接动作API 135或者内容选择器组件125(或者其他组件)能够相应地进行到在晚餐动作的数据传输之前将电影动作的数据传输发送到内容提供者计算设备155或者服务提供者计算设备160。基于第一电影动作的结束时间,直接动作API 135还能够识别或者修改死锁状况,以延迟与晚餐动作相关的操作。晚餐、电影和交通的动作仅作示例,并且任何数目的终端用户活动或者请求都能够构成动作。除输入音频信号以外,修改能够响应于输入而发生。例如,如果9pm电影(晚餐后)的电影票售空,则数据处理系统105能够提供用于在客户端计算设备150处呈现的音频输出,建议在晚餐前观看电影(例如,下午5点场次)。
数据处理系统105能够执行离线动作。这会节省处理和电力要求,并且减少网络业务或者将其转移到非高峰时间。例如,单线程200能够指示第一动作和取决于第一动作的解决的第二后续动作。这些行动能够彼此相距几天或者几周(或者更久),诸如购买未来六个月会发生的三周热带海滩度假的机票(第一动作,今日),以及预订度假最后一天的潜水课程(第二动作,超过六个多月后)。直接动作API 135能够响应于接收到以在线动作购买飞机票的输入音频信号而与对应于航空公司实体的服务提供者计算设备160实时通信,以实现转换——购买飞机票。本示例中的第二动作还有六个月。在这六个月期间或者其他时间窗口中,直接动作API 135或者诸如内容选择器组件125的其他组件能够响应于第二动作(潜水课程)而选择内容项目或者执行其他操作。例如,直接动作API能够通过从数据存储库145或者从有关潜水课程的第三方数据存储库获得该信息而获得离线。离线动作可以或者可以不是实时,并且离线动作不要求动作之间的时间间隔(例如,六个月)。例如,作为与客户端计算设备的通信会话或者同步或异步对话的一部分,数据处理系统105能够实时从数据存储库145或者从第三方数据库中获得响应于动作的信息。
图4描绘出管理在语音激活的基于数据分组的计算机网络环境中指示序列相关操作的语音激活的音频输入数据通信的方法400。方法400能够接收至少一个第一音频输入信号(ACT 405)。例如,经由接口115,NLP组件能够接收数据分组(ACT 405)。数据处理系统105能够执行、启动或者调用NLP组件110,以经由网络从至少一个客户端计算设备150接收基于分组或者其他协议的传输。数据分组能够包括或者对应于由第一客户端计算设备150的传感器151检测到的输入音频信号,诸如第一终端用户对客户端计算设备150(例如,智能手机)说出“OK,I would like to go to go dinner tonight(好,我今晚想去吃晚餐)”。方法400能够解析输入音频信号,以从输入音频信号中识别至少一个第一请求或者至少一个第一触发关键词(ACT 410)。例如,NLP组件110能够解析输入音频信号,以识别请求(对“dinner(晚餐)”的娱乐请求)以及对应于或者相关于该请求的触发关键词(“to go to(要去)”)。基于与接收到的第一音频输入信号相关联的所识别的请求或者关键词,方法400能够生成至少一个第一动作数据结构(ACT415)。例如,直接动作API 135能够生成指示第一动作的动作数据结构,诸如出租车接人的位置、所请求的服务提供者或者餐馆推荐。
方法400能够接收至少一个第二音频输入信号(ACT 420)。例如,NLP组件110能够经由网络165从发起第一输入音频信号的相同或不同的客户端计算设备150接收基于分组或者其他协议的传输。数据分组能够包括或者对应于由第二客户端计算设备150的传感器151检测到的输入音频信号,诸如终端用户对客户端计算设备150说出“OK,I would liketo catch a movie later(好,我稍后想去看电影)”。方法400能够从第二输入音频信号中识别至少一个第二请求或者至少一个第二触发关键词(ACT 425)。例如,NLP组件110能够解析输入音频信号,以识别请求(对“movie(电影)”的娱乐请求)以及对应于或者相关于该请求的触发关键词(“to catch(去看)”)。基于与接收到的第一音频输入信号相关联的所识别的请求或者关键词,方法400能够来生成至少一个第二动作数据结构(ACT 430)。例如,直接动作API 135能够生成指示第二动作的动作数据结构,诸如出租车接人的位置、所请求的服务提供者或者电影信息。
方法400能够从动作数据结构构建数据传输(ACT 435)。例如,直接动作API 135能够从对应于第一输入音频信号的第一动作数据结构创建第一数据传输,并且能够从对应于第二输入音频信号的第二动作数据结构创建第二数据传输。通过将从对应的动作数据结构获得的信息分组,或者以其他方式将动作数据结构转换成作为广义上定义的通信会话的一部分的传输形式,例如经由数据处理系统105在终端用户计算设备150与内容提供者计算设备155或者服务提供者计算设备160之间来回或者异步对话或者数据传输,能够构建或者生成第一和第二(或者其他数目)的数据传输(ACT 435)。与对应于不同实体的多个第三方设备(例如,内容提供者计算设备155或者服务提供者计算设备160)的通信会话能够被认为是公共通信会话的一部分。通信会话能够与在对话事件中往返于客户端计算设备150的来回数据传输同步,或者在数据传输之间存在例如至少一小时的休眠期的情况下异步。
方法400能够从数据传输中获得数据(ACT 440)。例如,从数据传输(或者从对应的动作数据结构),线程优化组件120能够(例如,从数据存储库145中)访问或者检索关于动作的信息。方法400能够确定至少一个序列相关性参数(ACT 445)。例如,基于从指示操作顺序或者动作的序列相关性的数据传输获得的数据(ACT 440),线程优化组件120能够确定指示至少两个动作存在序列相关性的序列相关性参数。方法400能够将一个或多个动作数据结构(直接地或者经由关联对应的数据传输)与单线程数据结构200相关联。例如,线程优化组件120(或者其他数据处理系统105组件)能够生成单线程数据结构200(ACT 450)。例如,基于至少两个序列或时间相关操作的指示,线程优化组件120能够生成指示第一和第二数据传输、第一和第二动作数据结构或者它们的相关联的动作的至少一个单线程数据结构(ACT440)。所生成的单线程数据结构200(ACT 450)能够包括由直接动作API 135用于检测动作完成的数据,以便数据处理系统105能够再向服务提供者计算设备160或者内容提供者计算设备155提供用于不同动作的数据分组。数据处理系统105还能够识别与所生成的单线程数据结构200的动作相关联的死锁状况(ACT 450)。单线程数据结构200能够指示多个动作的相继顺序,并且方法能够生成经修改的相继顺序,其更改动作的相继顺序。数据处理系统105能够将单线程数据结构200的全部或部分提供给一个或多个内容提供者计算设备155或者服务提供者计算设备160。
图5是示例计算机系统500的框图。计算机系统或者计算设备500能够包括或者被用于实现系统100或其组件,诸如数据处理系统105。计算系统500包括用于通信信息的总线505或者其他通信组件以及用于处理信息的耦合到总线505的处理器510或者处理电路。计算系统500还能够包括用于处理信息的耦合到总线的一个或多个处理器510或者处理电路。计算系统500还包括用于存储信息的耦合到总线505的主存储器515,诸如随机存取存储器(RAM)或者其他动态存储设备,以及由处理器510执行的指令。主存储器515能够是或者包括数据储存库145。主存储器515还能够被用于在由处理器510执行指令期间存储位置信息、临时变量或者其他中间信息。计算系统500可以进一步包括耦合到总线505的只读存储器(ROM)520或者其他静态存储设备,用于存储用于处理器510的静态信息和指令。诸如固态设备、磁盘或者光盘的存储设备525能够被耦合到总线505,以持久性存储信息和指令。存储设备525能够包括数据存储库145或者作为其一部分。
计算系统500可以经由总线505而被耦合到显示器535,诸如液晶显示器或者有源矩阵显示器,用于向用户显示信息。诸如包括字母数字和其他键的键盘的输入设备530可以被耦合到总线505,用于将信息和命令选择通信到处理器510。输入设备530能够包括触摸屏显示器535。输入设备530还能够包括诸如鼠标、轨迹球或者光标方向键的光标控制器,用于将方向信息和命令选择通信到处理器510以及控制显示器535上的光标移动。例如,显示器535能够作为数据处理系统105、客户端计算设备150或者图1的其他组件的一部分。
本文所述的过程、系统和方法能够由计算系统500响应于处理器510执行主存储器515中所包含的指令的布置来实现。这样的指令能够从诸如存储设备525的另一个计算机可读介质读入主存储器515。执行主存储器515中所包含的指令的布置促使计算系统500执行本文所述的说明性过程。也可以采用多处理布置中的一个或多个处理器来执行主存储器515中所包含的指令。硬连线电路能够以取代软件指令或者与软件指令组合的方式与本文所述的系统和方法连用。本文所述的系统和方法并不限于硬件电路和软件的任何特定组合。
虽然在图5中已描述示例计算系统,但本说明书中所述的主题,包括操作,能够以其他类型的数字电路,或者计算机软件、固件或硬件,包括本说明书中所公开的结构及其结构等价物,或者其中一个或多个的组合来实现。
在本文所讨论的系统采集关于用户的个人信息或者可以使用个人信息的情况下,用户可能有机会控制程序或者功能是否可以采集个人信息(例如,关于用户的社交网络、社交行动或活动、用户的偏好或者用户的位置的信息),或者控制是否或如何从内容服务器或其他数据处理系统接收可能与用户更相关的内容。此外,在存储或者使用某些数据之前,可以通过一种或多种方式将其匿名化,以便在生成参数时删除个人可识别信息。例如,用户的身份可以被匿名化,以便不会针对用户来确定个人可识别信息,或者用户的地理位置可以被泛化到获得位置信息的位置(诸如城市、邮政编码或者州级),以便用户的特定位置不会被确定。因此,用户可以控制如何采集关于他或她的信息并且供内容服务器使用。
本说明书中所述的主题和操作能够以数字电路,或者计算机软件、固件或硬件,包括本说明书中所公开的结构及其结构等价物,或者其中一个或多个的组合来实现。本说明书中所述的主题能够被实现为一个或多个计算机程序,例如,在一个或多个计算机存储介质上编码的计算机程序指令的一个或多个电路,用于由数据处理装置执行或者控制其操作。替选地或附加地,程序指令能够被编码在人工生成的传播信号上,例如,机器生成的电子、光学或者电磁信号,该信号被生成以编码用于传输至适当的接收器装置的信息,以便由数据处理装置执行。计算机存储介质能够是计算机可读的存储设备、计算机可读的存储衬底、随机或串行存取存储器阵列或设备或者其中一个或多个的组合,或者包括在其中。虽然计算机存储介质并非传播信号,但计算机存储介质能够是编码在人工生成的传播信号中的计算机程序指令的源或目的地。计算机存储介质也能够是一个或多个单独的组件或介质(例如,多个CD、磁盘或者其他存储设备),或者包括在其中。在本说明书中所述的操作能够被实现为由数据处理装置对存储在一个或多个计算机可读存储设备上或者从其他来源接收的数据执行的操作。
术语“数据处理系统”、“计算设备”、“组件”或者“数据处理装置”包含各种用于处理数据的装置、设备和机器,例如,包括可编程处理器、计算机、系统单芯片或者以上的多个或组合。装置能够包括专用逻辑电路,例如FPGA(现场可编程门阵列)或者ASIC(专用集成电路)。装置除硬件之外还能够包括为考虑中的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或者其中一个或多个的组合的代码。装置和执行环境能够实现各种不同计算模型的基础设施,诸如web服务、分布式计算以及网格计算基础设施。直接动作API 135、内容选择器组件125、线程优化组件120或者NLP组件110以及其他数据处理系统105组件能够包括或者共享一个或多个数据处理装置、系统、计算设备或者处理器。
计算机程序(也称为程序、软件、软件应用、app、脚本或者代码)能够以任何形式的编程语言来编写,包括编译或解释语言、声明性或过程式语言,并且能够以任何形式来部署,包括部署为独立程序或者模块、组件、子例程、对象或者适于在计算环境中使用的其他单元。
计算机程序能够对应于文件系统中的文件。计算机程序能够被存储于保存其他程序或者数据(例如存储成标记语言文档的一个或多个脚本)的文件的一部分中、专用于考虑中的程序的单个文件中或者多个协作文件(例如存储一个或多个模块、子程序或者代码的多个部分)中。
计算机程序能够被部署成在一个计算机上或者在位于一个地点或者分布于多个地点并且通过通信网络而互联的多个计算机上来执行。
本说明书中所述的过程和逻辑流程能够由执行一个或多个计算机程序的可编程处理器(例如,数据处理系统105的组件)来执行,以通过对输入数据进行操作并且生成输出来执行动作。过程和逻辑流程也能够通过专用逻辑电路来执行,并且装置也能够被实现为专用逻辑电路,例如,FPGA(现场可编程门阵列)或者ASIC(专用集成电路)。适于存储计算机程序指令和数据的设备包括所有形式的非易失存储器、介质和存储设备,例如包括EPROM、EEPROM和闪存设备的半导体存储设备、例如内置硬盘或可移动磁盘的磁盘、磁光盘以及CDROM和DVD-ROM磁盘。处理器和存储器能够增加或结合专用逻辑电路。
本文所述的主题能够在包括例如作为数据服务器的后端组件、包括例如应用服务器的中间件组件、包括例如具有用户能够借以与本说明书中所述主题的实施方式相交互的图形用户界面或者web浏览器的客户端计算机的前端组件或者一个或多个这样的后端、中间件或前端组件的组合的计算系统中实现。系统的组件能够通过数字数据通信的任何形式或者媒介来互联,例如,通信网络。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、互联网(例如,因特网)以及点对点网络(例如,ad-hoc点对点网络)。
诸如系统100或者系统500的计算系统能够包括客户端和服务器。客户端与服务器一般彼此远离,并且通常通过通信网络(例如,网络165)进行交互。客户端与服务器的关系借助在相应计算上运行并且彼此具有客户端-服务器关系的计算机程序来实现。在一些实施方式中,服务器将数据(例如,表示内容项目的数据分组)发送至客户端计算设备(例如,目的是向与客户端计算设备进行交互的用户显示数据并且从该用户接收用户输入)。在客户端计算设备处生成的数据(例如,用户交互的结果)能够在服务器处从客户端计算设备接收(例如,由数据处理系统105从计算设备150或者内容提供者计算设备155或服务提供者计算设备160接收)。
虽然在图中以特定顺序来描绘操作,但无需以所示的特定顺序或者依序执行这样的操作,并且无需执行全部操作。本文所述的动作能够以不同的顺序来执行。
各种系统组件的分离并非在所有实施方式中都需要分离,并且程序组件能够被包括在单个硬件或者软件产品中。例如,NLP组件110、内容选择器组件125或者线程优化组件120能够是单个组件、app或程序,或者具有一个或多个处理电路的逻辑设备,或者数据处理系统105的一个或多个服务器的一部分。
现已描述一些说明性实施方式,但显然以上仅通过示例方式呈现说明性,而非旨在限制性。具体地,虽然本文提出的许多示例涉及方法动作或者系统元素的具体组合,但那些动作和那些元素可以通过其他方式组合来实现相同的目标。结合一种实施方式所讨论的动作、元素和特征并非旨在排除在其他实施方式中起类似作用。
本文所用的用语和术语是出于描述目的,而不应被视为限制目的。本文使用“包含”、“包括”、“具有”、“含有”、“涉及”、“特征是”、“特征在于”及其变型意在涵盖其后列举的项目、其等价物和附加项目以及仅由其后列举的项目组成的替选实施方式。在一种实施方式中,本文所述的系统和方法由所述元素、动作或者组件中的一个、一个以上的每种组合或者全部组成。
对本文以单数形式提及的系统和方法的实施方式或者元素或动作的任何引用也可以涵盖包括多个这些元素的实施方式,并且对本文任何实施方式或者元素或动作的以复数形式的任何引用也可以涵盖仅包括单个元素的实施方式。以单数形式或者复数形式引用并非旨在将目前公开的系统或方法、其组件、动作或元素限制为单个或多个配置。引用基于任何信息、动作或元素的任何动作或元素可以包括动作或元素至少部分基于任何信息、动作或元素的实施方式。
本文所公开的任何实施方式可以与任何其他实施方式或实施例组合,并且引用“一种实施方式”、“一些实施方式”、“一个实施方式”等并非必然相互排斥,而旨在表示结合实施方式所述的特定特征、结构或特性可以被包括在至少一个实施方式或实施例中。本文使用的这些术语并非必然全部涉及相同的实施方式。任何实施方式均可以通过与本文所公开的方面和实施方式一致的任何方式,包含性或排他性地与任何其他实施方式组合。
引用“或者”可以被解释为包含性,这样使用“或者”所述的任何术语可以指示单个、一个以上和全部所述术语中的任何一个。例如,引用“A”和“B”中的至少一个能够仅包含“A”、仅包含“B”以及包含“A”和“B”。结合“包括”或其他开放性术语使用的这类引用能够包括附加项目。
在附图、具体描述或任何权利要求中的技术特征后面带附图标记的情况下,已包括附图标记来提高对附图、具体描述和权利要求的理解性。因此,是否存在附图标记对于任何权利要求元素的范围没有任何限制性影响。
在不脱离本发明的特征情况下,本文所述的系统和方法可以体现成其他具体形式。例如,数据处理系统105的组件不必是分开的组件,并且一个组件能够包括其他组件。一个或多个计算设备(例如,服务器)的处理器能够包括或者执行数据处理系统105的组件。前述实施方式仅为说明性,而非旨在限制所述的系统和方法。因此,本文所述的系统和方法的范围由所附权利要求而非前文描述来指示,并且在权利要求的等价含义和范围内的变化包含于其中。
Claims (20)
1.一种用于在基于语音的计算环境中执行序列相关操作的系统,包括:
由数据处理系统执行的自然语言处理器组件,用以经由所述数据处理系统的接口接收数据分组,所述数据分组包括由客户端计算设备的传感器检测到的一个或多个输入音频信号;
所述自然语言处理器组件,用以解析所述一个或多个输入音频信号,以识别一个或多个请求以及与所述一个或多个请求相对应的一个或多个触发关键词;
所述数据处理系统的直接动作应用程序编程接口(API),用以基于所述一个或多个触发关键词并响应于所述一个或多个请求,生成第一动作数据结构和第二动作数据结构;和
由所述数据处理系统执行的线程优化组件,用以:
获得所述第一动作数据结构的数据分组,以及获得所述第二动作数据结构的数据分组;
基于应用于所述第一动作数据结构的数据分组和所述第二动作数据结构的数据分组的启发式技术,确定序列相关性参数;
基于所述序列相关性参数与阈值的比较,将所述第一动作数据结构的数据分组和所述第二动作数据结构的数据分组组合到单线程中;和
识别用于所述单线程的一系列序列相关动作;
内容选择器组件,用以针对所述一系列序列相关动作中的至少一个来选择内容项目;和
所述数据处理系统,用以向所述客户端计算设备提供所述内容项目。
2.根据权利要求1所述的系统,包括所述数据处理系统,用以:
基于所述一个或多个触发关键词中的第一触发关键词来生成所述第一动作数据结构;和
构建包括所述第一动作数据结构的第一数据传输,以在第一服务提供者计算设备与所述客户端计算设备之间建立第一通信会话,其中经由所述数据处理系统将所述第一通信会话的数据分组从所述客户端计算设备路由到所述第一服务提供者计算设备;和
将所述第一数据传输包括在所述单线程中。
3.根据权利要求1所述的系统,包括所述数据处理系统,用以:
基于所述一个或多个触发关键词中的第一触发关键词来生成所述第一动作数据结构,并且基于所述一个或多个触发关键词中的第二触发关键词来生成所述第二动作数据结构。
4.根据权利要求1所述的系统,包括所述数据处理系统,用以:
构建包括所述第一动作数据结构的第一数据传输,以在第一服务提供者计算设备与所述客户端计算设备之间建立第一通信会话;
构建包括所述第二动作数据结构的第二数据传输,以在第二服务提供者计算设备与所述客户端计算设备之间建立第二通信会话;和
基于所述序列相关性参数与所述阈值的比较,将所述第一数据传输和所述第二数据传输合并到所述单线程中。
5.根据权利要求1所述的系统,包括所述数据处理系统,用以:
检测所述第一动作数据结构的第一动作的完成;和
在所述第一动作完成之后,将所述单线程的数据分组发送到服务提供者计算设备,其中所述单线程指示所述第一动作被调度成在所述第二动作数据结构的第二动作之前发生。
6.根据权利要求1所述的系统,其中,所述序列相关性参数指示与所述第一动作数据结构相对应的动作被调度成在与所述第二动作数据结构的动作之前发生。
7.根据权利要求1所述的系统,包括所述数据处理系统,用以:
基于与对应于所述第一动作数据结构的动作相关联的时间,识别与对应于所述第二动作数据结构的动作相关联的状况;和
响应于所述状况,阻止将所述第二动作数据结构的数据分组传输到服务提供者计算设备。
8.根据权利要求1所述的系统,包括:
基于与对应于所述第一动作数据结构的动作相关联的时间,识别与对应于所述第二动作数据结构的动作相关联的状况;
接收所述状况的终止的指示;和
在所述状况终止之后,将所述第二动作数据结构的数据分组发送到服务提供者计算设备。
9.根据权利要求1所述的系统,其中,所述单线程指示用于所述单个线程的一系列序列相关动作,所述一系列序列相关动作包括第一动作、在所述第一动作之后的第二动作和在所述第二动作之后的第三动作。
10.根据权利要求1所述的系统,包括:
所述数据处理系统,用以在执行所述第一动作数据结构之前识别用于所述第二动作数据结构的内容项目。
11.一种用于在基于语音的计算环境中执行序列相关操作的方法,包括:
由数据处理系统经由接口接收数据分组,所述数据分组包括由客户端计算设备的传感器检测到的一个或多个输入音频信号;
由所述数据处理系统解析所述一个或多个输入音频信号,以识别一个或多个请求以及与所述一个或多个请求相对应的一个或多个触发关键词;
由所述数据处理系统基于所述一个或多个触发关键词并响应于所述一个或多个请求,生成第一动作数据结构和第二动作数据结构;
由所述数据处理系统获得所述第一动作数据结构的数据分组,以及获得所述第二动作数据结构的数据分组;
由所述数据处理系统基于应用于所述第一动作数据结构的数据分组和所述第二动作数据结构的数据分组的启发式技术,确定序列相关性参数;
由数据处理系统基于所述序列相关性参数与阈值的比较,将所述第一动作数据结构的数据分组和所述第二动作数据结构的数据分组组着到单线程中;
由所述数据处理系统识别用于所述单线程的一系列序列相关动作;
由所述数据处理系统针对所述一系列序列相关动作中的至少一个来选择内容项目;和
由所述数据处理系统向所述客户端计算设备提供所述内容项目。
12.根据权利要求11所述的方法,包括:
基于所述一个或多个触发关键词中的第一触发关键词来生成所述第一动作数据结构;和
构建包括所述第一动作数据结构的第一数据传输,以在第一服务提供者计算设备与所述客户端计算设备之间建立第一通信会话,其中经由所述数据处理系统将所述第一通信会话的数据分组从所述客户端计算设备路由到所述第一服务提供者计算设备;和
将所述第一数据传输包括在所述单线程中。
13.根据权利要求11所述的方法,包括:
基于所述一个或多个触发关键词中的第一触发关键词来生成所述第一动作数据结构,并且基于所述一个或多个触发关键词中的第二触发关键词来生成所述第二动作数据结构。
14.根据权利要求11所述的方法,包括:
构建包括所述第一动作数据结构的第一数据传输,以在第一服务提供者计算设备与所述客户端计算设备之间建立第一通信会话;
构建包括所述第二动作数据结构的第二数据传输,以在第二服务提供者计算设备与所述客户端计算设备之间建立第二通信会话;和
基于所述序列相关性参数与所述阈值的比较,将所述第一数据传输和所述第二数据传输组合到所述单线程中。
15.根据权利要求11所述的方法,包括:
检测所述第一动作数据结构的第一动作的完成;和
在所述第一动作完成之后,将所述单线程的数据分组发送到服务提供者计算设备,其中所述单线程指示所述第一动作被调度为在所述第二动作之前发生。
16.根据权利要求11所述的方法,其中,所述序列相关性参数指示与所述第一动作数据结构相对应的动作被调度成在与所述第二动作数据结构的动作之前发生。
17.根据权利要求11所述的方法,包括:
基于与对应于所述第一动作数据结构的动作相关联的时间,识别与对应于所述第二动作数据结构的动作相关联的状况;和
响应于所述状况,阻止将所述第二动作数据结构的数据分组传输到服务提供者计算设备。
18.根据权利要求11所述的方法,包括:
基于与对应于所述第一动作数据结构的动作相关联的时间,识别与对应于所述第二动作数据结构的动作相关联的状况;
接收所述状况的终止的指示;和
在所述状况终止之后,将所述第二动作数据结构的数据分组发送到服务提供者计算设备。
19.根据权利要求11所述的方法,其中,所述单线程指示用于所述单个线程的一系列序列相关动作,所述一系列序列相关动作包括第一动作、在所述第一动作之后的第二动作和在所述第二动作之后的第三动作。
20.根据权利要求11所述的方法,包括:
在执行所述第一动作数据结构之前识别用于所述第二动作数据结构的内容项目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110625162.4A CN113504888B (zh) | 2016-12-30 | 2017-08-31 | 用于序列相关数据消息整合的系统和方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/395,725 US10630751B2 (en) | 2016-12-30 | 2016-12-30 | Sequence dependent data message consolidation in a voice activated computer network environment |
US15/395,725 | 2016-12-30 | ||
CN201780001636.XA CN108604177B (zh) | 2016-12-30 | 2017-08-31 | 用于序列相关数据消息整合的系统和方法 |
CN202110625162.4A CN113504888B (zh) | 2016-12-30 | 2017-08-31 | 用于序列相关数据消息整合的系统和方法 |
PCT/US2017/049780 WO2018125306A1 (en) | 2016-12-30 | 2017-08-31 | Sequence dependent data message consolidation in a voice activated computer network environment |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780001636.XA Division CN108604177B (zh) | 2016-12-30 | 2017-08-31 | 用于序列相关数据消息整合的系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113504888A true CN113504888A (zh) | 2021-10-15 |
CN113504888B CN113504888B (zh) | 2024-06-25 |
Family
ID=59901584
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110625162.4A Active CN113504888B (zh) | 2016-12-30 | 2017-08-31 | 用于序列相关数据消息整合的系统和方法 |
CN201780001636.XA Active CN108604177B (zh) | 2016-12-30 | 2017-08-31 | 用于序列相关数据消息整合的系统和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780001636.XA Active CN108604177B (zh) | 2016-12-30 | 2017-08-31 | 用于序列相关数据消息整合的系统和方法 |
Country Status (8)
Country | Link |
---|---|
US (3) | US10630751B2 (zh) |
EP (3) | EP3588268B1 (zh) |
JP (3) | JP6549250B2 (zh) |
KR (3) | KR102213761B1 (zh) |
CN (2) | CN113504888B (zh) |
DE (2) | DE112017000104T5 (zh) |
GB (1) | GB2571918A (zh) |
WO (1) | WO2018125306A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10431209B2 (en) | 2016-12-30 | 2019-10-01 | Google Llc | Feedback controller for data transmissions |
US9703757B2 (en) | 2013-09-30 | 2017-07-11 | Google Inc. | Automatically determining a size for a content item for a web page |
US10614153B2 (en) * | 2013-09-30 | 2020-04-07 | Google Llc | Resource size-based content item selection |
CN110811115A (zh) * | 2018-08-13 | 2020-02-21 | 丽宝大数据股份有限公司 | 电子化妆镜装置及其脚本运行方法 |
JP7297884B2 (ja) * | 2018-10-15 | 2023-06-26 | ライブパーソン, インコーポレイテッド | 動的エンドポイント通信チャネル |
KR102254501B1 (ko) * | 2018-10-19 | 2021-05-21 | 한양대학교 산학협력단 | 부분 순서 보장 기반의 입출력 스케줄러 및 그 방법 |
US10771523B1 (en) * | 2019-04-12 | 2020-09-08 | Dish Network L.L.C. | Asynchronous real-time media transfer over wireless networks |
US10498721B1 (en) * | 2019-06-03 | 2019-12-03 | Capital One Services, Llc | Multi-device verification via non-audible sound |
CN111459451A (zh) * | 2020-03-31 | 2020-07-28 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN112631760A (zh) * | 2020-12-31 | 2021-04-09 | 深圳市大富网络技术有限公司 | 一种线程创建方法、系统、装置及计算机存储介质 |
CN113380247A (zh) * | 2021-06-08 | 2021-09-10 | 阿波罗智联(北京)科技有限公司 | 多音区语音唤醒、识别方法和装置、设备、存储介质 |
US11671249B1 (en) * | 2022-07-25 | 2023-06-06 | Gravystack, Inc. | Apparatus for generating an action-based collective |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102137085A (zh) * | 2010-01-22 | 2011-07-27 | 谷歌公司 | 语音命令的多维消歧 |
CN105027194A (zh) * | 2012-12-20 | 2015-11-04 | 亚马逊技术有限公司 | 话语主题的识别 |
CN105408890A (zh) * | 2013-07-15 | 2016-03-16 | 微软技术许可有限责任公司 | 基于声音输入执行与列表数据有关的操作 |
Family Cites Families (148)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3493441A (en) * | 1967-08-25 | 1970-02-03 | Hooker Chemical Corp | Detoxification of hexavalent chromium containing coating on a metal surface |
US4603430A (en) | 1984-09-21 | 1986-07-29 | Hughes Aircraft Company | Target discrimination utilizing median filters |
JP3181592B2 (ja) | 1992-12-01 | 2001-07-03 | マイクロソフト コーポレイション | 埋め込まれたオブジェクトとイン・プレース対話するための方法及びシステム |
US5812935A (en) | 1993-04-17 | 1998-09-22 | Hughes Electronics | Cellular system employing base station transmit diversity according to transmission quality level |
US5608727A (en) | 1995-05-02 | 1997-03-04 | Motorola, Inc. | Method and system for management of frequency spectrum among multiple applications on a shared medium |
US6119101A (en) | 1996-01-17 | 2000-09-12 | Personal Agents, Inc. | Intelligent agents for electronic commerce |
DE19716445A1 (de) | 1997-04-21 | 1998-10-22 | Heidelberger Druckmasch Ag | Verfahren zur Verbreiterung von Zeichen |
US6529730B1 (en) | 1998-05-15 | 2003-03-04 | Conexant Systems, Inc | System and method for adaptive multi-rate (AMR) vocoder rate adaption |
US6829646B1 (en) | 1999-10-13 | 2004-12-07 | L. V. Partners, L.P. | Presentation of web page content based upon computer video resolutions |
US20010016034A1 (en) * | 1998-12-08 | 2001-08-23 | Sukhinder Singh | Method and apparatus for obtaining and aggregating off-line user data for re-packaging and presentation to users over a data-packet-network |
US7003729B1 (en) | 1999-04-20 | 2006-02-21 | I2 Technologies Us, Inc. | Method and apparatus for supporting multiple alternative graphical user interfaces in computer-moderated electronic commerce |
US6275806B1 (en) | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US6684249B1 (en) | 2000-05-26 | 2004-01-27 | Sonicbox, Inc. | Method and system for adding advertisements over streaming audio based upon a user profile over a world wide area network of computers |
FI20001577A (fi) | 2000-06-30 | 2001-12-31 | Nokia Mobile Phones Ltd | Puheenkoodaus |
US6857007B1 (en) | 2000-08-30 | 2005-02-15 | Bloomfield Enterprises, Llc | Personal digital assistant facilitated communication system |
WO2002086864A1 (en) | 2001-04-18 | 2002-10-31 | Rutgers, The State University Of New Jersey | System and method for adaptive language understanding by computers |
US7219309B2 (en) | 2001-05-02 | 2007-05-15 | Bitstream Inc. | Innovations for the display of web pages |
EP1393148B1 (en) | 2001-05-02 | 2010-03-03 | Bitstream Inc. | Methods, systems, and programming for producing and displaying subpixel-optimized font bitmaps using non-linear color balancing |
GB0118294D0 (en) * | 2001-07-27 | 2001-09-19 | Ibm | Method and system for deadlock detection and avoidance |
GB2392595A (en) | 2002-08-30 | 2004-03-03 | Hewlett Packard Co | Page composition |
US20040056894A1 (en) | 2002-09-19 | 2004-03-25 | Igor Zaika | System and method for describing and instantiating extensible user interfaces |
US7296230B2 (en) | 2002-11-29 | 2007-11-13 | Nippon Telegraph And Telephone Corporation | Linked contents browsing support device, linked contents continuous browsing support device, and method and program therefor, and recording medium therewith |
WO2004068320A2 (en) | 2003-01-27 | 2004-08-12 | Vincent Wen-Jeng Lue | Method and apparatus for adapting web contents to different display area dimensions |
EP1593057B1 (en) | 2003-02-14 | 2011-09-28 | Access Co., Ltd. | Browser program for performing table-layout |
KR20040076649A (ko) | 2003-02-26 | 2004-09-03 | 삼성전자주식회사 | 종횡비별 브라우저 그래픽 표시 장치 및 방법 |
KR100447526B1 (ko) | 2003-03-18 | 2004-09-08 | 엔에이치엔(주) | 인터넷 사용자의 접속 의도 판단 방법 및 이를 이용한인터넷 상의 광고 방법과 그 시스템 |
US7962522B2 (en) | 2003-06-03 | 2011-06-14 | Norris Iii Forbes Holten | Flexible, dynamic menu-based web-page architecture |
JP3920818B2 (ja) * | 2003-07-22 | 2007-05-30 | 株式会社東芝 | スケジューリング方法および情報処理システム |
GB0320278D0 (en) | 2003-08-29 | 2003-10-01 | Hewlett Packard Development Co | Constrained document layout |
US7809843B1 (en) * | 2003-09-18 | 2010-10-05 | Intel Corporation | Globally unique identification in communications protocols and databases |
NO20034724D0 (no) | 2003-10-22 | 2003-10-22 | Opera Software Asa | Presentasjon av HTML-innhold på en skjermterminal |
KR100458461B1 (ko) | 2004-03-04 | 2004-11-26 | 엔에이치엔(주) | 지식 광고 방법 및 지식 광고 시스템 |
US7853255B2 (en) | 2004-04-16 | 2010-12-14 | Broadcom Corporation | Digital personal assistance via a broadband access gateway |
US20060103667A1 (en) | 2004-10-28 | 2006-05-18 | Universal-Ad. Ltd. | Method, system and computer readable code for automatic reize of product oriented advertisements |
US20060111971A1 (en) | 2004-11-24 | 2006-05-25 | Microsoft Corporation | System and method for on-line and off-line advertising in content delivered to a display screen |
EP1861800A1 (en) | 2005-03-09 | 2007-12-05 | Medio Systems, Inc. | Method and system of bidding for advertisement placement on computing devices |
JP4346571B2 (ja) * | 2005-03-16 | 2009-10-21 | 富士通株式会社 | 音声認識システム、音声認識方法、及びコンピュータプログラム |
US7730418B2 (en) | 2005-05-04 | 2010-06-01 | Workman Nydegger | Size to content windows for computer graphics |
JP4665639B2 (ja) | 2005-07-19 | 2011-04-06 | 日本電気株式会社 | 通信品質監視システム、通信品質監視装置、通信品質劣化箇所特定装置、その装置における方法及びプログラム |
JP2007080357A (ja) | 2005-09-13 | 2007-03-29 | Toshiba Corp | 情報記憶媒体、情報再生方法、情報再生装置 |
US8195133B2 (en) | 2005-09-14 | 2012-06-05 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
FI118779B (fi) | 2005-10-07 | 2008-03-14 | Riku Rikkola | Kortti, kortin vastaanottolaite ja järjestelmä sähköenergian välittämistä varten |
JP2007115293A (ja) | 2005-10-17 | 2007-05-10 | Toshiba Corp | 情報記憶媒体、プログラム、情報再生方法、情報再生装置、データ転送方法、及びデータ処理方法 |
US7904505B2 (en) | 2005-11-02 | 2011-03-08 | At&T Intellectual Property I, L.P. | Service to push author-spoken audio content with targeted audio advertising to users |
EP2523442A1 (en) | 2006-02-10 | 2012-11-14 | Spinvox Limited | A mass-scale, user-independent, device-independent, voice message to text conversion system |
US7606875B2 (en) | 2006-03-28 | 2009-10-20 | Microsoft Corporation | Detecting serving area of a web resource |
CN101055577A (zh) | 2006-04-12 | 2007-10-17 | 龙搜(北京)科技有限公司 | 可扩展标记语言集中器 |
US8582663B2 (en) * | 2006-08-08 | 2013-11-12 | Core Wireless Licensing S.A.R.L. | Method, device, and system for multiplexing of video streams |
US9318108B2 (en) * | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
JP5262721B2 (ja) | 2006-11-01 | 2013-08-14 | 日本電気株式会社 | 画像表示装置 |
US7742922B2 (en) | 2006-11-09 | 2010-06-22 | Goller Michael D | Speech interface for search engines |
US8031857B2 (en) | 2006-12-19 | 2011-10-04 | Scenera Technologies, Llc | Methods and systems for changing a communication quality of a communication session based on a meaning of speech data |
US7877696B2 (en) | 2007-01-05 | 2011-01-25 | Eastman Kodak Company | Multi-frame display system with semantic image arrangement |
US8107960B2 (en) * | 2007-01-23 | 2012-01-31 | Toshiba America Research, Inc. | Prioritized query |
GB2451415B (en) | 2007-02-13 | 2011-08-17 | Vodafone Plc | Content reproduction in telecommunications systems |
US8413070B1 (en) | 2007-05-07 | 2013-04-02 | Adobe Systems Incorporated | Declarative resizeable list in electronic form |
KR20100017440A (ko) | 2007-05-29 | 2010-02-16 | 가부시키가이샤 아쿠세스 | 단말 장치, 히스토리 관리 방법, 및 히스토리 관리를 위한 컴퓨터 사용 가능한 기억 매체 |
US20090085921A1 (en) | 2007-10-01 | 2009-04-02 | Lydia Mai Do | Populate Web-Based Content Based on Space Availability |
US8095865B2 (en) | 2007-11-21 | 2012-01-10 | Microsoft Corporation | Layout manager |
US8555193B2 (en) | 2008-01-17 | 2013-10-08 | Google Inc. | System for intelligent automated layout and management of interactive windows |
US8453051B1 (en) | 2008-03-31 | 2013-05-28 | Amazon Technologies, Inc. | Dynamic display dependent markup language interface |
US20090279108A1 (en) | 2008-05-12 | 2009-11-12 | Nagayasu Hoshi | Image Processing Apparatus |
JP4547638B2 (ja) | 2008-05-29 | 2010-09-22 | ソニー株式会社 | Webページ表示装置及びWebページ表示方法 |
US20090300120A1 (en) | 2008-06-03 | 2009-12-03 | Contec Innovations Inc. | Method and system for producing a presentation message for a mobile device |
CA2633177A1 (en) | 2008-06-03 | 2009-12-03 | Contec Innovations, Inc. | Method and system for producing a presentation message for a mobile device |
US9357075B1 (en) | 2008-06-05 | 2016-05-31 | Avaya Inc. | Conference call quality via a connection-testing phase |
US8527339B2 (en) | 2008-06-26 | 2013-09-03 | Microsoft Corporation | Quality based pricing and ranking for online ads |
US8438310B2 (en) | 2008-10-01 | 2013-05-07 | Adp Dealer Services, Inc. | Systems and methods for configuring a website having a plurality of operational modes |
US8938672B2 (en) | 2008-11-04 | 2015-01-20 | International Business Machines Corporation | Amending the display property of grid elements |
US8145561B1 (en) | 2009-01-05 | 2012-03-27 | Sprint Communications Company L.P. | Phone usage pattern as credit card fraud detection trigger |
JP4978629B2 (ja) | 2009-01-19 | 2012-07-18 | コニカミノルタビジネステクノロジーズ株式会社 | 項目設定装置、並びにその制御方法及び制御プログラム |
JP5018794B2 (ja) | 2009-01-20 | 2012-09-05 | コニカミノルタビジネステクノロジーズ株式会社 | 印刷ジョブ出力装置、並びにその制御方法及び制御プログラム |
JP4760921B2 (ja) | 2009-01-28 | 2011-08-31 | コニカミノルタビジネステクノロジーズ株式会社 | 項目設定装置、並びにその制御方法及び制御プログラム |
US8949582B2 (en) * | 2009-04-27 | 2015-02-03 | Lsi Corporation | Changing a flow identifier of a packet in a multi-thread, multi-flow network processor |
US8448074B2 (en) | 2009-05-01 | 2013-05-21 | Qualcomm Incorporated | Method and apparatus for providing portioned web pages in a graphical user interface |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
JP5299125B2 (ja) | 2009-06-30 | 2013-09-25 | 富士ゼロックス株式会社 | 文書処理装置及びプログラム |
JP5340088B2 (ja) | 2009-09-07 | 2013-11-13 | キヤノン株式会社 | 情報処理方法及び装置 |
JP5032543B2 (ja) | 2009-09-16 | 2012-09-26 | 株式会社東芝 | スケジューリング装置、方法及びプログラム |
US8402379B2 (en) | 2009-09-30 | 2013-03-19 | SAP Portals Israel Limited | Dynamic content layout for a user interface display |
US9124642B2 (en) | 2009-10-16 | 2015-09-01 | Qualcomm Incorporated | Adaptively streaming multimedia |
WO2011065564A1 (ja) | 2009-11-30 | 2011-06-03 | 楽天株式会社 | オブジェクト表示装置、オブジェクト表示方法、オブジェクト表示制御プログラム、及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8793598B2 (en) | 2010-04-14 | 2014-07-29 | Microsoft Corporation | Cross-browser web dialog platform |
KR101577508B1 (ko) | 2010-06-29 | 2015-12-15 | 라쿠텐 인코포레이티드 | 정보 처리 장치, 정보 처리 방법, 및 정보 처리 프로그램이 기록된 기록 매체 |
KR101731843B1 (ko) | 2010-09-02 | 2017-05-02 | 삼성전자 주식회사 | 아이템 디스플레이하는 방법 및 장치 |
KR101045589B1 (ko) | 2010-09-15 | 2011-07-01 | 주식회사 유비온 | 네트워크를 통해 수신한 컨텐츠의 표시장치 및 그 방법 |
JP2012073863A (ja) | 2010-09-29 | 2012-04-12 | Rakuten Inc | 広告表示プログラム、広告表示装置、広告表示方法、記録媒体、および、広告表示システム |
US20120158490A1 (en) | 2010-12-16 | 2012-06-21 | Yahoo! Inc. | Sponsored search auction mechanism for rich media advertising |
US20120159314A1 (en) | 2010-12-16 | 2012-06-21 | Microsoft Corporation | Adaptive content layout |
US8510237B2 (en) | 2011-03-15 | 2013-08-13 | Qualcomm Incorporated | Machine learning method to identify independent tasks for parallel layout in web browsers |
US20130007602A1 (en) | 2011-06-29 | 2013-01-03 | Apple Inc. | Fixed layout electronic publications |
US8872855B2 (en) | 2011-07-21 | 2014-10-28 | Flipboard, Inc. | Adjusting orientation of content regions in a page layout |
US9396167B2 (en) | 2011-07-21 | 2016-07-19 | Flipboard, Inc. | Template-based page layout for hosted social magazines |
US9020981B2 (en) | 2011-09-30 | 2015-04-28 | Comprehend Systems, Inc. | Systems and methods for generating schemas that represent multiple data sources |
US9760236B2 (en) | 2011-10-14 | 2017-09-12 | Georgia Tech Research Corporation | View virtualization and transformations for mobile applications |
JP5667962B2 (ja) * | 2011-11-08 | 2015-02-12 | 日本電信電話株式会社 | 音声認識装置とその方法とプログラム |
CN103959800A (zh) * | 2011-11-30 | 2014-07-30 | 三菱电机株式会社 | 信息处理系统和信息处理方法 |
US9542956B1 (en) | 2012-01-09 | 2017-01-10 | Interactive Voice, Inc. | Systems and methods for responding to human spoken audio |
EP2839391A4 (en) | 2012-04-20 | 2016-01-27 | Maluuba Inc | CONVERSATION AGENT |
WO2013162582A1 (en) | 2012-04-26 | 2013-10-31 | Empire Technology Development Llc | Multimedia application rental and billing |
US9323443B2 (en) | 2012-05-02 | 2016-04-26 | International Business Machines Corporation | Drilling of displayed content in a touch screen device |
US20130305145A1 (en) | 2012-05-09 | 2013-11-14 | Ni Group Limited | A Method of Publishing Digital Content |
US20130305144A1 (en) | 2012-05-09 | 2013-11-14 | Ni Group Limited | Method of Publishing Digital Content |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US20140019462A1 (en) | 2012-07-15 | 2014-01-16 | Microsoft Corporation | Contextual query adjustments using natural action input |
US20140033228A1 (en) | 2012-07-25 | 2014-01-30 | Google Inc. | Configuring content display dimensions |
CN104798094B (zh) | 2012-09-20 | 2019-02-19 | 谷歌有限责任公司 | 确定内容项目显示环境的配置 |
US20140108941A1 (en) | 2012-10-17 | 2014-04-17 | Christopher Stephen Joel | Method and Apparatus for Automatically Optimizing the Loading of Images in a Cloud-Based Proxy Service |
US9164966B1 (en) | 2012-10-24 | 2015-10-20 | Google Inc. | Determining sizes of content items |
US20140180796A1 (en) | 2012-12-21 | 2014-06-26 | Sándor Sás | Selecting and serving content items of different content item types for a content item slot |
KR20140089876A (ko) | 2013-01-07 | 2014-07-16 | 삼성전자주식회사 | 대화형 인터페이스 장치 및 그의 제어 방법 |
EP2954514B1 (en) | 2013-02-07 | 2021-03-31 | Apple Inc. | Voice trigger for a digital assistant |
US20140258849A1 (en) | 2013-03-06 | 2014-09-11 | Google Inc. | Automatic Alignment of a Multi-Dimensional Layout |
US11233841B2 (en) | 2013-03-15 | 2022-01-25 | Yottaa, Inc. | Systems and methods for configuration-based optimization by an intermediary |
EP2814244A1 (en) | 2013-06-11 | 2014-12-17 | Alcatel Lucent | A method and a system for improving communication quality of a video conference |
US20140372903A1 (en) * | 2013-06-14 | 2014-12-18 | Microsoft Corporation | Independent Hit Testing for Touchpad Manipulations and Double-Tap Zooming |
US9472206B2 (en) * | 2013-06-17 | 2016-10-18 | Google Technology Holdings LLC | Privacy mode for always-on voice-activated information assistant |
US9483444B2 (en) | 2013-07-09 | 2016-11-01 | Flipboard, Inc. | Dynamic layout engine for a digital magazine |
WO2015041711A1 (en) | 2013-09-20 | 2015-03-26 | Yottaa, Inc. | Systems and methods for managing loading priority or sequencing of fragments of a web object |
US10614153B2 (en) | 2013-09-30 | 2020-04-07 | Google Llc | Resource size-based content item selection |
US10431209B2 (en) | 2016-12-30 | 2019-10-01 | Google Llc | Feedback controller for data transmissions |
US9703757B2 (en) | 2013-09-30 | 2017-07-11 | Google Inc. | Automatically determining a size for a content item for a web page |
EP3063923B1 (en) * | 2013-10-29 | 2019-10-16 | Telefonaktiebolaget LM Ericsson (publ) | Control of a chain of services |
US10726831B2 (en) | 2014-05-20 | 2020-07-28 | Amazon Technologies, Inc. | Context interpretation in natural language processing using previous dialog acts |
US9350770B2 (en) | 2014-05-30 | 2016-05-24 | Apple Inc. | Redundant transmission channels for real-time applications on mobile devices |
US9330433B2 (en) * | 2014-06-30 | 2016-05-03 | Intel Corporation | Data distribution fabric in scalable GPUs |
US10108817B2 (en) | 2014-09-26 | 2018-10-23 | Microsoft Technology Licensing, Llc | Privacy-preserving cookies for personalization without user tracking |
WO2016054230A1 (en) | 2014-10-01 | 2016-04-07 | XBrain, Inc. | Voice and connection platform |
US9711141B2 (en) * | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9959129B2 (en) | 2015-01-09 | 2018-05-01 | Microsoft Technology Licensing, Llc | Headless task completion within digital personal assistants |
US10460034B2 (en) * | 2015-01-28 | 2019-10-29 | Mitsubishi Electric Corporation | Intention inference system and intention inference method |
JP6449039B2 (ja) * | 2015-02-10 | 2019-01-09 | ホーチキ株式会社 | 機器管理装置、機器管理方法、及びプログラム |
US20160274864A1 (en) | 2015-03-20 | 2016-09-22 | Google Inc. | Systems and methods for enabling user voice interaction with a host computing device |
US10331766B2 (en) | 2015-06-07 | 2019-06-25 | Apple Inc. | Templating for content authoring and distribution |
US10331312B2 (en) * | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US9940929B2 (en) | 2015-12-09 | 2018-04-10 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
CN105654950B (zh) | 2016-01-28 | 2019-07-16 | 百度在线网络技术(北京)有限公司 | 自适应语音反馈方法和装置 |
US11477139B2 (en) * | 2016-02-25 | 2022-10-18 | Meta Platforms, Inc. | Techniques for messaging bot rich communication |
US9864732B2 (en) | 2016-05-02 | 2018-01-09 | Google Inc. | User interfaces that facilitate management of formatting of digital content |
CN106033476B (zh) | 2016-05-19 | 2019-07-23 | 西安交通大学 | 一种云计算环境中分布式计算模式下的增量式图计算方法 |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US20180012595A1 (en) * | 2016-07-07 | 2018-01-11 | Intelligently Interactive, Inc. | Simple affirmative response operating system |
US20180191798A1 (en) | 2016-12-30 | 2018-07-05 | Google Inc. | Methods and systems for server-side rendering of native content for presentation |
-
2016
- 2016-12-30 US US15/395,725 patent/US10630751B2/en active Active
-
2017
- 2017-08-31 CN CN202110625162.4A patent/CN113504888B/zh active Active
- 2017-08-31 KR KR1020197026715A patent/KR102213761B1/ko active IP Right Grant
- 2017-08-31 GB GB1803011.4A patent/GB2571918A/en not_active Withdrawn
- 2017-08-31 JP JP2017556886A patent/JP6549250B2/ja active Active
- 2017-08-31 EP EP19187924.6A patent/EP3588268B1/en active Active
- 2017-08-31 EP EP21201773.5A patent/EP3979067B1/en active Active
- 2017-08-31 WO PCT/US2017/049780 patent/WO2018125306A1/en active Application Filing
- 2017-08-31 DE DE112017000104.8T patent/DE112017000104T5/de active Pending
- 2017-08-31 EP EP17768900.7A patent/EP3360037B1/en active Active
- 2017-08-31 DE DE212017000053.8U patent/DE212017000053U1/de active Active
- 2017-08-31 KR KR1020177031385A patent/KR102023148B1/ko active IP Right Grant
- 2017-08-31 KR KR1020217003319A patent/KR102327616B1/ko active IP Right Grant
- 2017-08-31 CN CN201780001636.XA patent/CN108604177B/zh active Active
-
2019
- 2019-06-25 JP JP2019117476A patent/JP6756017B2/ja active Active
-
2020
- 2020-03-13 US US16/818,736 patent/US10893088B2/en active Active
- 2020-08-26 JP JP2020142494A patent/JP6932827B2/ja active Active
- 2020-12-11 US US17/119,563 patent/US20210099511A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102137085A (zh) * | 2010-01-22 | 2011-07-27 | 谷歌公司 | 语音命令的多维消歧 |
CN105027194A (zh) * | 2012-12-20 | 2015-11-04 | 亚马逊技术有限公司 | 话语主题的识别 |
CN105408890A (zh) * | 2013-07-15 | 2016-03-16 | 微软技术许可有限责任公司 | 基于声音输入执行与列表数据有关的操作 |
Also Published As
Publication number | Publication date |
---|---|
JP6756017B2 (ja) | 2020-09-16 |
US20180191804A1 (en) | 2018-07-05 |
DE212017000053U1 (de) | 2018-08-27 |
US10630751B2 (en) | 2020-04-21 |
EP3588268A1 (en) | 2020-01-01 |
EP3979067A1 (en) | 2022-04-06 |
US20200213382A1 (en) | 2020-07-02 |
JP6932827B2 (ja) | 2021-09-08 |
EP3588268B1 (en) | 2021-11-10 |
JP2020198630A (ja) | 2020-12-10 |
EP3979067B1 (en) | 2024-07-17 |
KR102023148B1 (ko) | 2019-09-20 |
EP3360037A1 (en) | 2018-08-15 |
US20210099511A1 (en) | 2021-04-01 |
CN108604177B (zh) | 2021-06-25 |
KR20210014773A (ko) | 2021-02-09 |
GB201803011D0 (en) | 2018-04-11 |
KR102327616B1 (ko) | 2021-11-17 |
EP3360037B1 (en) | 2019-11-06 |
GB2571918A (en) | 2019-09-18 |
DE112017000104T5 (de) | 2018-09-13 |
US10893088B2 (en) | 2021-01-12 |
JP6549250B2 (ja) | 2019-07-24 |
JP2019204515A (ja) | 2019-11-28 |
KR20190107765A (ko) | 2019-09-20 |
KR102213761B1 (ko) | 2021-02-08 |
WO2018125306A1 (en) | 2018-07-05 |
CN108604177A (zh) | 2018-09-28 |
KR20180090184A (ko) | 2018-08-10 |
JP2019506641A (ja) | 2019-03-07 |
CN113504888B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108604177B (zh) | 用于序列相关数据消息整合的系统和方法 | |
AU2021200037B2 (en) | Sequence dependent operation processing of packet based data message transmissions | |
KR20210076206A (ko) | 음성 활성 데이터 패킷의 데이터 구조 풀링 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |