CN110149810A

CN110149810A - 限制在网络环境中操纵内容的传输

Info

Publication number: CN110149810A
Application number: CN201780013402.7A
Authority: CN
Inventors: 安德烈·莱文; 刘银涛; 沙拉斯·阿南特
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2017-12-08
Filing date: 2017-12-08
Publication date: 2019-08-20
Anticipated expiration: 2037-12-08
Also published as: WO2019112622A1; EP3661158B1; CN113037715A; US20210168168A1; EP3523942A1; EP3523942B1; CN113037715B; EP3661158A1; CN110149810B; US11356474B2

Abstract

本公开的系统和方法大体上涉及一种识别计算机网络环境中的可能被操纵的或者欺骗性的数字分量的数据处理系统。所述数据处理系统可以通过例如防止或者减少被操纵的或者欺骗性的数字分量传输的数量来提高在一个或者多个计算机网络上的数据分组(或者基于其他协议的)传输的效率和有效性。

Description

限制在网络环境中操纵内容的传输

背景技术

过度网络传输(基于分组或者以其他方式)计算装置之间的网络业务数据可能会妨碍计算装置恰当地处理网络业务数据、完成与网络业务数据有关的操作、或者及时对网络业务数据做出响应。如果响应计算装置处于或者高于其处理能力，则过度网络传输网络业务数据还可能会使数据路由复杂化或者降低响应的质量，这可能会导致带宽利用效率低下。可以发起计算装置之间的网络业务数据的网络传输的大量数字分量对象可能会使控制与数字分量对象相对应的网络传输变得更加复杂。

发明内容

至少一个方面涉及一种用于限制在网络环境中内容传输的系统。该系统可以包括数据处理系统，该数据处理系统可以包括接口，该接口用于从客户端计算装置接收内容请求。该系统可以包括由数据处理系统执行的内容选择器组件。内容选择器组件可以基于内容请求来选择第一数字分量。第一数字分量可以包括第一多个字符。该系统可以包括由数据处理系统执行的操纵检测组件。操纵检测组件可以检索字典，该字典包括多个数字分量中包括的候选字符的一部分的指示。操纵检测组件可以基于字典将第一多个字符转换成字符数组，该字典可以包括在多个数字分量中包括的候选字符的一部分的指示。操纵检测组件可以基于该字符数组中的第一多个字符的序列将第一数字分量分类成多个类别中的第一类别。操纵检测组件可以基于将第一数字分量分类成多个类别中的第一类别来确定在对来自客户端计算装置的内容请求的响应中不包括第一数字分量。操纵检测组件可以基于来自客户端计算装置的内容请求来生成响应。

至少一个方面涉及一种用于限制在网络环境中内容传输的方法。该方法可以包括：通过数据处理系统接收来自客户端计算装置的内容请求。该方法可以包括：通过由数据处理系统执行的内容选择器组件基于该内容请求来选择第一数字分量。第一数字分量可以包括第一多个字符。该方法可以包括：通过由数据处理系统执行的操纵检测组件来检索字典，该字典可以包括在多个数字分量中包括的候选字符的一部分的指示。该方法可以包括：通过操纵检测组件基于字典将第一多个字符转换成字符数组。该方法可以包括：基于该字符数组中的第一多个字符的序列将第一数字分量分类成多个类别中的第一类别。该方法可以包括：通过操纵检测组件基于将第一数字分量分类成多个类别中的第一类别来确定在对来自客户端计算装置的内容请求的响应中不包括第一数字分量。该方法可以包括：通过数据处理系统基于来自客户端计算装置的内容请求来生成响应。

本公开的至少一个方面涉及一种数字助理装置，该数字助理装置可以包括音频驱动器、变换器(transducer)、用于检测输入音频信号的传感器、和预处理器组件。预处理器组件可以耦合至音频驱动器、变换器和传感器。预处理器可以对输入音频信号进行过滤以产生过滤的输入音频信号。预处理器可以将过滤的输入音频信号转换成数据分组。预处理器可以将数据分组传输至数据处理系统。数据处理系统可以包括执行自然语言处理器组件、内容选择器组件、接口、和操纵检测组件的一个或者多个处理器和存储器。数据处理系统可以经由接口从预处理器组件接收数据分组，该数据分组包括由传感器检测到的过滤的输入音频信号。数据处理系统可以通过自然语言处理器组件来识别过滤的输入音频信号中的内容请求。数据处理系统可以通过内容选择器组件基于内容请求来选择第一数字分量。第一数字分量可以包括第一多个字符。数据处理系统可以通过操纵检测组件来检索字典，该字典可以包括在多个数字分量中包括的候选字符的一部分的指示。数据处理系统可以通过操纵检测组件基于字典将第一多个字符转换成字符向量，该字典包括在多个数字分量中包括的候选字符的一部分的指示。数据处理系统可以通过操纵检测组件基于字符向量中的第一多个字符的序列将第一数字分量分类成多个类别中的第一类别。数据处理系统可以通过操纵检测组件基于将第一数字分量分类成多个类别中的第一类别来确定在对来自客户端计算装置的内容请求的响应中不包括第一数字分量。数据处理系统可以通过操纵检测组件基于来自客户端计算装置的内容请求来生成响应，基于确定在响应中不包括第一数字分量，该响应不包括第一数字分量。

下面详细地讨论了这些和其他方面与实施方式。前述信息和下面的详细说明包括各个方面和实施方式的说明性示例，并且为理解所要求的方面和实施方式的本质和特征提供了概述或者框架。附图提供了对各个方面和实施方式的说明和进一步理解，并且包含在本说明书中构成本说明书的一部分。

附图说明

附图不旨在按照比例进行绘制。在不同附图中的类似的附图标记和指示表示类似的元件。为了清楚起见，并非每个组件都在每张附图中进行了标记。在附图中：

图1描绘了用于限制在网络环境中内容传输的系统。

图2描绘了用于在语音启动的计算机网络环境中限制在网络环境中内容传输的方法。

图3描绘了用于将数字分量划分成多个部分，然后在语音启动的计算机网络环境中将这些部分转换成字符数组的过程；以及

图4是图示了可以用于实现本文描述和图示的系统和方法的元件的计算机系统的一般架构的框图。

具体实施方式

以下是对与用于限制在网络环境中内容传输的方法、设备、和系统有关的各种概念和实施方式的更详细的描述。以上引入的并且以下更详细地讨论的各种概念可以按照多种方式实现。

本公开的系统和方法大体上涉及一种识别计算机网络环境中的可能被操纵的或者欺骗性的数字分量的数据处理系统。该数据处理系统可以通过例如防止或者减少被操纵的或者欺骗性的数字分量传输的数量来提高在一个或者多个计算机网络上的数据分组(或者基于其他协议的)传输的效率和有效性。被操纵的或者欺骗性的数字分量可以是包括文本或者其他内容的内容项，该文本或者其他内容被配置为不被手动或者自动内容过滤器检测到。对文本的操纵可以包括形近字的包含、重复字符的包含、字符的删除、单词的合并、字符的换位或者它们的任何组合。

本文描述的系统和方法可以用于数字助理或者其他基于音频的系统或者与数字助理或者其他基于音频的系统一起使用。例如，系统可以包括接收输入音频查询(该输入音频查询也可以被称为输入音频信号)的数据处理系统。根据输入音频查询，数据处理系统可以识别请求以及与该请求对应的触发关键字。基于触发关键字或者请求，数据处理系统可以生成可以包括一个或者多个数字分量的响应。数据处理系统可以选择数字分量，或者可以从第三方向数据处理系统提供数字分量。数字分量可以是用户生成的内容，诸如，评述或者评论。数据处理系统可以处理数字分量以确定数字分量是否为欺骗性的、被操纵的、或者应该被标记为垃圾邮件。数据处理系统可以通过识别被操纵的数字分量来删除、清除、禁止、或者以其他方式限制数字分量的传输，由于不合需要的数字分量未通过网络传输至客户端计算装置，因此这可以减少计算能力、功耗、存储器、和带宽的总消耗。

数据处理系统然后可以选择未被操纵的数字分量，可以通过分组或者基于其他协议的数据消息传输经由计算机网络向客户端计算装置提供该未被操纵的数字分量。数字分量也可以被称为内容项。数字分量可以包括在数字分量中。包括所选择的数字分量的输出信号可以使客户端计算装置的音频驱动器组件生成声波(例如，音频输出)，可以从客户端计算装置输出该声波。

图1图示了用于限制在网络环境中内容传输的示例系统100。数据处理系统102可以包括至少一个服务器，该至少一个服务器具有至少一个处理器。例如，数据处理系统102可以包括位于至少一个数据中心或者服务器场中的多个服务器。数据处理系统102可以根据输入音频信号确定请求以及与该请求相关联的触发关键字。基于请求和触发关键字，数据处理系统102可以确定或者选择至少一个动作数据结构，并且可以选择至少一个数字分量(并且发起如本文所述的其他动作)。

数据处理系统102可以包括多个逻辑编组服务器并且促进了分布式计算技术。服务器的逻辑编组可以被称为数据中心、服务器场、或者机器场。服务器可以是在地理上分散的。数据中心或者机器场可以作为单个实体进行管理，或者机器场可以包括多个机器场。各个机器场内的服务器可以是异构的——服务器或者机器中的一个或者多个可以根据一种或者多种类型的操作系统平台运行。数据处理系统102可以包括数据中心中的、被存储在一个或者多个高密度机架系统以及相关的存储系统中的(例如，位于企业数据中心中的)服务器。按照这种方式具有整合服务器的数据处理系统102可以通过将服务器和高性能存储系统定位在本地化的高性能网络上来改善系统可管理性、数据安全性、系统的物理安全性、和系统性能。集中所有或者一些数据处理系统102组件(包括服务器和存储系统)并且将它们与高级系统管理工具耦合实现了更高效地使用服务器资源，这节省了功率，降低了处理要求，并且减少了带宽使用。

数据处理系统102可以包括至少一个自然语言处理器(NLP)组件112、至少一个接口110、至少一个操纵检测组件114、至少一个内容选择器组件118、至少一个音频信号发生器组件120、至少一个直接动作应用程序接口(API)116、和至少一个数据存储库122。NLP组件112、接口110、操纵检测组件114、内容选择器组件118、音频信号发生器组件120、和直接动作API 116分别可以包括至少一个处理单元、服务器、虚拟服务器、电路、引擎、代理、设备、或者其他逻辑装置，诸如，配置为经由至少一个计算机网络105与数据存储库122和其他计算装置(例如，至少一个客户端计算装置104或者至少一个内容提供商计算装置106)通信的可编程逻辑阵列。网络105可以包括计算机网络，诸如，互联网、局域、广域、城域网、或者其他区域网络、内联网、卫星网络、其他计算机网络(诸如，语音或者数据移动电话通信网络)、以及它们的组合。

网络105可以包括或者构成显示网络，例如，互联网上可用的、与内容布置或者搜索引擎结果系统相关联的或者有资格包括第三方数字分量作为数字分量布置活动的一部分的信息资源的子集。数据处理系统102可以使用网络105来访问信息资源，诸如，可以由客户端计算装置104呈现、输出、渲染、或者显示的网页、网站、域名、或者统一资源定位符。例如，客户端计算装置104的用户可以经由网络105访问由数据处理系统102提供的信息、数据，或者以其他方式与数据处理系统102或者内容提供商装置106交互。

例如，网络105可以包括点对点网络、广播网络、广域网、局域网、电信网络、数据通信网络、计算机网络、异步传输模式(ATM)网络、同步光纤网络(SONET)网络、同步数字系列(SDH)网络、无线网络或者有线网络、以及它们的组合。网络105可以包括无线链路，诸如，红外信道或者卫星频带。网络105的拓扑可以包括总线、星形、或者环形网络拓扑。网络105可以包括使用任何协议或者用于在移动装置之间通信的协议(包括高级移动电话协议(“AMPS”)、时分多址(“TDMA”)、码分多址(“CDMA”)、全球移动通信系统(“GSM”)、通用分组无线电服务(“GPRS”)、长期演进(LTE)、或者通用移动电信系统(“UMTS”))的移动电话网络。可以经由不同协议传输不同类型的数据，或者可以经由不同协议传输相同类型的数据。

数据处理系统102可以包括操纵检测组件114。操纵检测组件114可以包括由数据处理系统102执行以检测包括被操纵的文本的数字分量的应用、脚本、或者程序。操纵检测组件114可以通过检测被操纵的数字分量，然后防止(或者减少)将被操纵的数字分量传输至客户端计算装置104，来限制网络环境中的被操纵的数字分量的传输。

操纵检测组件114可以识别由内容提供商装置106提供的被操纵的数字分量。被操纵的数字分量可以包括配置为表现为好像数字分量的内容来自不同的内容提供商装置106。被操纵的数字分量可以包括内容提供商装置106意图混淆或者欺骗查看数字分量的最终用户的内容。被操纵的数字分量可以包括配置为穿过自动和手动过滤器(例如，垃圾过滤器)的内容。

对数字分量的操纵可以包括对数字分量中的文本的操纵。操纵可以包括用其他字符替换字符、混合附加符号、移除或者添加字母、合并单词、或者换位字母。用其他字符替换字符可以包括用形近字替换字母(例如，用0替换大写字母O)、用看起来相似的符号替换字符(例如，用@替换“a”)、或者替换听起来相似的字母(例如，用“v”替换“w”)。混合附加符号可以包括向单词添加特殊字符、标点、或者空格。添加或者移除字母可以包括复制一个或者多个字母、添加随机字母、移除有意重复的字母(例如，用beter替换better)、或者移除随机字母。合并单词可以包括移除相邻单词之间的空格。换位字母可以包括换位单词体内的字母(例如，用downlaod替换download)。

被操纵的文本可以处于内容提供商装置106向数据处理系统102或者客户端计算装置104提供的数字分量中。数字分量可以包括电子文档、网页、广告、图像、输出音频文件、输出视频文件、统一资源定位符(URL)、视觉统一资源定位符(vURL)、或者其他类型的电子内容。可以通过数据处理系统102从内容提供商装置106检索数字分量。例如，数字分量可以包括由内容提供商装置106托管或者提供的用户生成的内容。用户生成的内容可以包括在线评论或者评述。在一个示例中，评论可能与用户对餐厅的评述有关。

在接收到关于给定餐厅的信息的输入查询后，数据处理系统102可以搜索由内容提供商装置106针对给定餐厅的评述提供的网页。数据处理系统102针对响应而选择的数字分量可以包括由内容提供商装置106提供的对餐厅的评述或者在内容提供商装置的网页上做出的(与给定餐厅有关的)评论中的一个或者多个评论。

例如，响应于输入查询“Ok，大家觉得餐厅XYZ怎么样？”，数据处理系统102可以选择由用户在由内容提供商装置106托管的网页上做出的关于餐厅XYZ的评论。例如，评论可以是说明“餐厅XYZ是个共进浪漫晚餐的好地方”的评述。数据处理系统102可以包括响应中的评论。例如，响应可以是“餐厅XYZ有好评”。有人提到，“餐厅XYZ是个共进浪漫晚餐的好地方”。

操纵检测组件114可以检测数字分量内的被操纵的文本，然后限制那些数字分量的传输。例如，数字分量可以是基于文本的广告，操纵检测组件114可以从中提取文本并且确定文本是否被操纵。

操纵检测组件114可以通过从数据存储库检索字典124来确定给定的数字分量是否包括被操纵的文本。字典124可以指示哪些字符(或者符号)最有可能出现在数字分量中。操纵检测组件114可以基于被测试的数字分量的语言或者主题来从多个不同字典124中选择字典124。

为了确定数字分量是否被操纵，操纵检测组件114可以提取数字分量的文本作为字符集。如果数字分量是基于视频的或者基于音频的，则操纵检测组件114可以生成在数字分量中说出的单词的转录，然后提取数字分量的文本作为字符集。操纵检测组件114可以将完整的字符集划分成不同部分。例如，操纵检测组件114可以一次仅选择并且分析大约160个字符。如果数字分量(或者产生的字符集)包括的字符少于160个字符，则操纵检测组件114可以将字符集补零以达到160个字符的长度。如果字符集包括的字符多于160个字符，则操纵检测组件114可以使用滑动窗口将字符集划分成不同部分，每个部分都包括160个字符。例如，各个部分的字符可以在大约100个字符到大约1000个字符、在大约150个字符到大约800个字符、在大约150个字符到大约600个字符、在大约150个字符到大约400个字符、或者在大约150个字符到大约200个字符。

操纵检测组件114可以为字符集(或者其部分，如果字符集被划分成不同部分的话)生成字符数组。字典124可以包括字典124中列出的各个字符的值或者数组。操纵检测组件114可以使用字典124将来自字符数组的字符数组转换成整数数组。例如，可以在字典124中将每个可能的字符表示成整数。可以将字典124用作将输入字符转换成整数的查找表。在一些实施方式中，字典124仅包括最有可能出现在未被操纵的数字分量中的字符。字典124可以包括可以出现在未操纵或者被操纵的数字分量中的一个或者多个字符。如果输入字符不在字典124中，则操纵检测组件114可以在字符的字符数组中放置0。可以对字典124进行独热(one hot)编码以将各个字符表示成二进制数组。一旦将字符数组转换成整数数组，就可以对字符数组进行独热编码。

操纵检测组件114可以生成至少一个字典124。为了生成字典124，操纵检测组件114可以接收多个数字分量。数字分量可以是未被操纵的数字分量。操纵检测组件114可以解析接收到的数字分量以确定接收到的数字分量中的每个字符的出现次数。例如，操纵检测组件114可以计算在接收到的数字分量中出现“a”、“b”、“c”等的次数。操纵检测组件114可以计算包括字母、数字、表情符号、和特殊字符的所有类型的字符的出现次数。所有可能字符的列表可以被称为候选字符。

操纵检测组件114可以基于在接收到的数字分量中出现各个相应候选字符的次数来对候选字符进行排名。操纵检测组件114可以通过从排名后的候选字符中选择最频繁出现的候选字符来生成字典。例如，操纵检测组件114可以为字典124选择最常出现的50、60、70、100、125、150、175、200、250、300、350、400、450、500个字符(或者其中的任何范围)。字典124可以包括多于500个字符。

操纵检测组件114可以为不同分组或者类别的数字分量生成不同字典124。分组可以是基于语言的或者基于主题的。例如，操纵检测组件114可以接收特定语言的多个数字分量并且生成针对这种语言的字典124。在另一示例中，操纵检测组件114可以接收多个数字分量，每个数字分量都具有与特定类别(例如，移动游戏)有关的主题，并且基于具有与移动游戏有关的主题的数字分量来为移动游戏生成字典124。

操纵检测组件114可以包括机器学习模块，该机器学习模块可以将数字分量分类成多个类别中的一种类别。机器学习模块可以包括长短期记忆(LSTM)模型或者用于对输入字符串进行分类的其他递归神经网络。LSTM模型可以在网络的一层或者多层中利用softmax函数来实现。LSTM模型可以是三级LSTM。LSTM模型可以包括大约50个到300个节点、大约100个到大约300个节点、或者大约200个到大约300个节点。类别可以包括被操纵的类别和未操纵类别。每种级别可以与相应的输出节点对应。

操纵检测组件114可以逐字符地处理字符数组。例如，对字符数组进行分类可以基于字符数组中的字符的序列(或者顺序)。如果操纵检测组件114将数字分量分类成与被操纵的数字分量相关联的分类，则操纵检测组件114可以确定不将数字分量传输至客户端计算装置104。

系统100还可以包括一个或者多个客户端计算装置104和一个或者多个内容提供商装置106。客户端计算装置104和内容提供商计算装置106可以分别包括用于经由网络105彼此通信或者与数据处理系统102通信的至少一个逻辑装置，诸如，具有处理器的计算装置。客户端计算装置104和内容提供商计算装置106可以分别包括位于至少一个数据中心中的至少一个服务器、处理器或者存储器、或者多种计算资源或者服务器。客户端计算装置104和内容提供商计算装置106可以分别包括至少一个计算装置，诸如，台式计算机、膝上型计算机、平板、个人数字助理、智能电话、便携式计算机、服务器、瘦客户端计算机、虚拟服务器、或者其他计算装置。

客户端计算装置104可以包括至少一个传感器140、至少一个变换器142、至少一个音频驱动器144、至少一个扬声器146、和至少一个预处理器148。客户端计算装置104可以是数字助理装置。数字助理装置可以是基于扬声器的。传感器140可以包括麦克风(或者其他音频输入传感器)或者相机。传感器140可以被称为接口。其他接口还可以包括计算装置、屏幕、或者输入装置的网络连接。变换器142可以将音频输入转换成电子信号，反之亦然。音频驱动器144可以包括由客户端计算装置104的一个或者多个处理器执行以控制传感器140、变换器142或者音频驱动器144以及客户端计算装置104的其他组件以对音频输入进行处理或者提供音频输入的脚本或者程序。扬声器146可以传输音频输出信号。

客户端计算装置104可以包括预处理器组件148。预处理器组件148可以包括一个或者多个处理器。预处理器组件148可以在输入音频信号由客户端计算装置104的数据处理系统102或者其他组件处理之前对输入音频信号执行一个或者多个功能。预处理器组件148可以与音频驱动器144、变换器142、和传感器140耦合。预处理器组件148可以过滤由传感器140检测到的输入音频信号(或者由客户端计算装置104以其他方式接收到的输入音频信号)以产生过滤的输入音频信号。预处理器148进行的过滤可以包括过滤(或者减少)输入音频信号中的噪声，放大输入音频信号中的预定频率、减少输入音频信号中的预定频率、或者对输入音频信号进行上采样或者下采样。预处理器组件148可以将过滤的输入音频信号转换为数据分组并且经由网络105将数据分组传输至数据处理系统102。

客户端计算装置104可以与将基于语音的、基于文本的、或者基于图像的查询输入客户端计算装置104中(经由接口)的最终用户相关联，并且可以从数据处理系统102接收对查询的响应。响应可以是与查询相同的形式。例如，响应于基于语音的音频输入查询，数据处理系统102(或者内容提供商装置106)可以将按照计算机生成的语音文件形式的输出提供给客户端计算装置104，客户端计算装置104可以将其从扬声器146输出。音频输出可以与从直接动作API 116接收的动作数据结构或者内容选择器组件118所选择的数字分量对应。计算机生成的语音可以包括来自真人或者计算机生成的语音的记录。

客户端计算装置104可以包括由数据处理系统102提供的(或者与数据处理系统102相关联的)应用、脚本、或者程序，该应用、脚本、或者程序使得客户端计算装置104能够将输入音频信号传送至数据处理系统102的至少一个接口110。数据处理系统102可以与应用通信以使得数据处理系统102能够驱动客户端计算装置104的组件渲染输出音频信号(例如，针对动作数据结构)或者其他输出信号(例如，数字分量)。

内容提供商计算装置106可以提供数字分量以在客户端计算装置104上进行渲染。内容提供商装置106可以绕过数据处理系统102将数字分量传输至客户端计算装置104。内容提供商装置106可以将数字分量提供给数据处理系统102，数据处理系统102可以将数字分量提供给客户端计算装置104。数字分量可以是由客户端计算装置104显示为音频输出的基于音频的、基于文本的、或者基于视频的数字分量或者动作数据结构。动作数据结构或者数字分量可以包括对商品或者服务的有组织的响应或者提议，诸如，基于语音的消息，该消息陈述：“今天是晴天，海滩的温度将达到80度”作为对语音输入查询“今天是去海滩玩的好日子吗？”的有组织的响应。数据处理系统102(或者其他系统100组件，诸如，内容提供商计算装置106)也可以提供数据分类作为响应，诸如，提供防晒霜的、基于语音或者文本消息的数字分量。

内容提供商计算装置106可以将数字分量提供给数据处理系统102以便存储在数据存储库122中。动作数据结构和数字分量可以包括用于经由网络105传输的基于分组的数据结构。内容提供商计算装置106还可以将基于音频或者文本的数字分量(或者其他数字分量)提供给数据处理系统102，其中，可以将数字分量存储在数据存储库122中。响应于从这些客户端计算装置104中的一者接收到的查询，数据处理系统102可以选择基于音频动作数据结构或者文本的数字分量，并且将它们提供给相同的或者不同的客户端计算装置104(或者指示内容提供商计算装置106提供)。基于音频的动作数据结构可以是专有音频或者可以与文本、图像、或者视频数据组合。数字分量可以是专有文本或者可以与音频、图像、或者视频数据组合。内容提供商装置106可以提供被操纵的数字分量。

数据存储库122可以包括一个或者多个本地数据库或者分布式数据库，并且可以包括数据库管理系统。数据存储库122可以包括计算机数据存储装置或者存储器，并且除了数据之外，还可以存储一个或者多个字典124、一个或者多个策略126、内容数据128、或者模板130。策略126可以包括用于在基于语音的系统中传输的规则。例如，可以使用策略126来定义客户端计算装置104与数据处理系统102之间的会话、连接(及其建立)。内容数据128可以包括数字分量或者相关元数据，以及可以是与客户端计算装置104的一个或者多个通信会话的一部分的输入音频消息。数字分量的元数据可以包括对数字分量的提供商的指示(例如，哪个内容提供商装置106或者其所有者提供了数字分量)。模板130可以包括可在与客户端计算装置104的通信中使用的数据结构。模板130可以包括数据处理系统102可以用例如，内容数据128、数字分量、或者其他数据填充的一个或者多个占位符。

字典124可以由操纵检测组件114生成。操纵检测组件114可以按照预定间隔生成或者更新字典124。各个操纵检测组件114可以指示跨多个未被操纵的数字分量的最常见的字符。可以通过向操纵检测组件114输入大量可信数字分量来生成字典124。可以对字典124进行独热编码。操纵检测组件114可以包括用于字典124的嵌入层。例如，并非进行独热编码，而是操纵检测组件114可以使用嵌入矩阵来保持每个字典124的大小(与仅通过使用独热编码时相比，每个字典124的大小更小)。

数据存储库122可以包括不同语言的不同字典124(例如，美式英语字典、英式英语字典、法语字典)或者不同的主题字典(例如，科学字典或者服装字典)。可以通过向操纵检测组件114提供与该语言或者主题有关的数字分量来生成不同字典124。例如，可以向操纵检测组件114提供与服装有关的多个数字分量(例如，服装广告)以生成服装字典。

动作数据结构可以包括对输入音频信号的若干有组织的或者非赞助性的响应。例如，动作数据结构可以包括海滩天气预报或者到海滩的方向。该示例中的动作数据结构包括直接响应于输入音频信号的有组织的或者非赞助性的内容。响应于输入音频信号的数字分量可以包括发起或者无组织的内容，诸如，从位于海滩附近的便利店购买防晒霜的提议。在该示例中，有组织的动作数据结构(海滩预报)响应于输入音频信号(与海滩有关的查询)，并且数字分量(针对防晒霜的提示或者提议)也响应于相同的输入音频信号。数据处理系统102可以评估系统100参数(例如，功率使用、可用显示器、显示器格式、存储器要求、带宽使用、输入功率的功率容量或者时间(例如，内部电池或者外部电源，诸如，墙壁输出电源))以向相同的客户端计算装置104上的不同候选接口或者向不同的客户端计算装置104上的不同候选接口提供动作数据结构和数字分量。

NLP组件112可以通过将输入信号与一组已存储的代表性音频波形(例如，在数据存储库122中)进行比较并且选择最为接近的匹配来将输入音频信号转换成识别到的文本。在大的用户集合中生成代表性波形，并且可以用语音样本增大代表性波形。在将音频信号转换成识别到的文本之后，NLP组件112可以将文本匹配到与例如经由用户间的训练或者通过操作规范而与数据处理系统102可以服务的动作相关联的单词。在一些实施方式中，操纵检测组件114可以处理或者以其他方式分析输入音频信号，但不需要首先将音频波形转换成文本。

可以通过客户端计算装置104的传感器140(例如，麦克风)检测输入音频信号。传感器140可以被称为客户端计算装置104的接口。经由变换器142、音频驱动器144、或者其他组件，客户端计算装置104可以(例如，经由网络105)将输入音频信号提供给数据处理系统102提供，在此输入音频信号可以(例如，通过接口110)被接收，并且被提供给NLP组件112或者作为内容数据128存储在数据存储库122中。

NLP组件112可以接收或者以其他方式获取输入音频信号。根据输入音频信号，NLP组件112可以识别至少一个请求或者与请求对应的至少一个触发关键字。该请求可以指示输入音频信号的意图或者主题。触发关键字可以指示有可能会采取的动作类型。例如，NLP组件112可以解析输入音频信号以识别对周末去海边的至少一个请求。触发关键字可以包括至少一个单词、短语、词根或者部分单词，或者指示要采取的动作的派生词。例如，来自输入音频信号的触发关键字“go”或者“to go to”可以指示需要运送或者指示离家旅行。在该示例中，输入音频信号(或者识别到的请求)不直接表达打算运送，但触发关键字指示运送是对由请求指示的至少一个其他动作的辅助动作。

NLP组件112可以识别输入音频信号中的情绪关键字或者情绪状态。情绪关键字或者状态可以指示用户在提供输入音频信号时的态度。内容选择器组件118可以使用情绪关键字和状态来选择数字分量。例如，基于情绪关键字和状态，内容选择器组件118可以跳过对数字分量的选择。例如，如果NLP组件112检测情绪关键字(诸如“只”或者“仅”)(例如，“Ok，仅告诉我电影时间的结果就好”)，则内容选择器组件118可以跳过对数字分量的选择，使得响应于输入音频信号仅返回动作数据结构。

音频信号发生器组件120可以响应于输入音频信号而生成或者以其他方式获取包括数字分量(以及动作数据结构)的输出信号。例如，数据处理系统102可以执行音频信号发生器组件120以生成或者产生与动作数据结构或者数字分量对应的输出信号。例如，音频信号发生器组件120可以将基于文本的数字分量转换成基于音频的数字分量。数据处理系统102的接口组件110可以经由计算机网络105向任何客户端计算装置104提供或者传输包括输出信号的一个或者多个数据分组。可以通过使用例如数据分组来设计、配置、构造、或者操作接口110以接收和传输信息。接口110可以通过使用一个或者多个协议(诸如，网络协议)来接收和传输信息。接口110可以包括硬件接口、软件接口、有线接口、或者无线接口。例如，接口110可以是数据处理系统102的网络接口或者端口。接口110可以有助于将数据从一种格式转换成另一种格式或者将数据从一种格式格式化为另一种格式。例如，接口110可以包括应用编程接口，该应用编程接口包括用于在各种组件(诸如，系统100的软件组件)之间进行通信的定义。

数据处理系统102可以将包括动作数据结构的输出信号从数据存储库122或者从音频信号发生器组件120提供给客户端计算装置104。数据处理系统102可以将包括数字分量的输出信号从数据存储库122或者从音频信号发生器组件120提供给相同的客户端计算装置104或者不同的客户端计算装置104。

数据处理系统102还可以经由数据分组传输指示内容提供商计算装置106或者其他计算装置将输出信号(例如，与动作数据结构或者数字分量对应)提供给客户端计算装置104。可以获取输出信号、生成输出信号、将输出信号转换成一个或者多个数据分组(或者其他通信协议)、或者作为一个或者多个数据分组(或者其他通信协议)从数据处理系统102(或者其他计算装置)传输至客户端计算装置104。

内容选择器组件118可以识别、选择、或者获取通过多个内容选择过程产生的多个数字分量。内容选择过程可以接近实时，例如，相同对话、通信会话、或者在数据处理系统102与客户端计算装置104之间的涉及公共主题的通信会话系列的部分。例如，对话可以包括彼此分开几小时或者几天的异步通信。对话或者通信会话可以持续一段时间，这段时间从接收到第一输入音频信号到对与第一输入音频信号有关的最终动作做出估计的或者已知结论或者数据处理系统102接收到对终止对话或者对话期满的指示为止。例如，数据处理系统102可以确定与周末海滩旅行有关的对话在接收到输入音频信号时开始，并且在周末结束(例如，周日晚上或者周一早上)时期满或者终止。提供动作数据结构或者数字分量以在对话的有效时间段(例如，从接收到输入音频信号到所确定的期满时间为止)期间通过客户端计算装置104的或者另一客户端计算装置104的一个或者多个接口进行渲染的数据处理系统102可以被视作正在实时运行。在该示例中，数字分量和动作数据结构的内容选择过程和渲染实时发生。

根据由内容选择器组件118接收到的信息(例如，对即将到来的海滩旅行的指示)，内容选择器组件118可以识别至少一个数字分量。数字分量可以响应于输入音频查询的主题或者与输入音频查询的主题有关。例如，数字分量可以包括识别海滩附近具有防晒霜的商店或者提议乘坐出租车去海边的数据消息。内容选择器组件118可以查询数据存储库122以(例如，从内容数据128中)选择或者以其他方式识别数字分量。内容选择器组件118还可以从内容提供商计算装置106中选择数字分量。例如，响应于从数据处理系统102接收到的查询，内容提供商计算装置106可以将数字分量提供给数据处理系统102(或者其组件)以便最终由发起输入音频信号的客户端计算装置104输出，或者以便通过不同的客户端计算装置104输出至相同的最终用户。

内容选择器组件118可以选择数字分量或者动作数据结构作为实时内容选择过程的一部分。例如，可以将动作数据结构提供给客户端计算装置104，以便通过客户端计算装置104的接口直接响应于输入音频信号以对话方式将其作为音频输出进行传输。用于识别动作数据结构并且将数字分量提供给客户端计算装置104的实时内容选择过程可以在距输入音频信号1分钟或者更短的时间内发生并且被视作是实时的。数据处理系统102还可以识别数字分量并将数字分量提供给发起输入音频信号的客户端计算装置104的至少一个接口或者不同的客户端计算装置104。

经由接口110和计算机网络105传输至客户端计算装置104的例如由音频信号发生器组件120获取或者生成的动作数据结构(或者数字分量)可以使客户端计算装置104执行音频驱动器144以驱动扬声器146生成与动作数据结构或者数字分量对应的声波。声波可以包括动作数据结构或者数字分量的单词，或者与动作数据结构或者数字分量对应的单词。

动作数据结构和数字分量可以与输入音频信号的主题对应。直接动作API 116可以执行程序或者脚本(例如，来自NLP组件112或者内容选择器组件118)以识别针对这些动作中的一个或者多个的动作数据结构或者数字分量。如通过数据处理系统102所确定的，直接动作API 116可以执行指定动作以满足最终用户的意图。根据在其输入中指定的动作，直接动作API 116可以执行代码或者识别满足用户请求所需的参数的对话脚本。这种代码可以例如在数据存储库122中查找附加信息(诸如，家庭自动化服务的名称)，或者这种代码可以提供音频输出以在客户端计算装置104处进行渲染以向最终用户询问问题，诸如，所要求的出租车的预期目的地。直接动作API 116可以确定必要参数并且可以将信息封装到动作数据结构中，然后可以将该信息发送至另一组件，诸如，内容选择器组件118或者内容提供商装置106，以被实现。

数据处理系统102的直接动作API 116可以基于请求或者触发关键字来生成动作数据结构。可以响应于输入音频信号的主题来生成动作数据结构。基于由NLP组件112解析的输入音频信号，直接动作API 116可以确定应该将消息发送至多个内容提供商装置106中的哪一个内容提供商装置(若存在)。例如，如果输入音频信号包括“OK，这周末我想去海边”，则NLP组件112可以解析输入音频信号以将请求或者触发关键字(诸如，触发关键字“去(to go to)”)识别为对需要乘坐出租车的指示。直接动作API 116可以将请求封装到动作数据结构中，以作为消息传输至出租车服务的内容提供商计算装置106。还可以将消息传递至内容选择器组件118。动作数据结构可以包括用于完成请求的信息。在该示例中，信息可以包括接送位置(例如，家)和目的地位置(例如，海滩)。直接动作API 116可以检索来自数据存储库122的模板130以确定要将哪些字段包括在动作数据结构中。直接动作API 116可以检索来自数据存储库122的内容以获取针对数据结构的字段的信息。直接动作API 116可以用该信息填充来自模板的字段以生成数据结构。直接动作API 116还可以用来自输入音频信号的数据填充字段。可以针对内容提供商的类别使模板130标准化，或者可以针对特定内容提供商使模板130标准化。例如，乘车共享提供商可以使用以下标准化模板130来创建数据结构：{client_device_identifier；authentication_credentials；pick_up_location；destination_location；no_passengers；service_level}.

数据处理系统102还可以向动作数据结构提供向用户查询以确定用户对获取数字分量的兴趣的提示。例如，动作数据结构可以指示“周六是晴天，海边的温度将达到80度，您想了解对您的旅行有帮助的一些服务吗？”。数据处理系统102可以响应于提示“您想了解对您的旅行有帮助的一些服务吗？”而从客户端计算装置104接收另一输入音频信号，诸如，“当然”。NLP组件112可以解析该响应并将其解释为通过客户端计算装置104对数字分量进行音频渲染的授权。作为响应，数据处理系统102可以提供数字分量以便由发起了响应“当然”的同一客户端计算装置104进行音频渲染。

数据处理系统102可以延迟传输与动作数据结构相关联的数字分量，以优化处理利用率。例如，数据处理系统102响应于接收到输入音频信号提供动作数据结构以便实时地渲染为通过客户端计算装置的音频输出，例如，以对话的方式，并且可以前延迟数字分量传输直至数据中心使用的离峰值期或者非高峰期，从而通过减少峰值带宽使用、热量输出、或者冷却要求来更高效地利用数据中心。数据处理系统102还可以基于数据中心利用率或者带宽度量或者网络105的要求或者包括数据处理系统102的数据中心的要求来发起与数字分量相关联的转换或者其他活动，诸如，响应于对动作数据结构或者数字分量的响应而预订汽车服务。

基于针对后续动作对数字分量或者动作数据结构的响应(诸如，点击经由所选择的接口渲染的数字分量)，数据处理系统102可以识别转换或者发起转换或者动作。数据处理系统102的处理器可以调用直接动作API 116以执行有助于转换动作的脚本，诸如，从汽车共享服务预订汽车以搭载最终用户去海边或者离开海边。直接动作API 116可以从数据存储库122获取内容数据128(或者参数或者策略126)以及从客户端计算装置104获取因最终用户同意而接收的数据，以确定位置、时间、用户账户、后勤或者其他信息以便从汽车共享服务预约汽车。

图2描绘了用于限制包含被操纵的内容的数字分量的传输的流程图200。方法200可以包括接收请求(ACT 202)。方法200可以包括选择数字分量(ACT 204)。方法200可以包括检索字典(ACT 206)。方法200可以包括生成字符数组(ACT 208)。方法200可以包括对数字分量进行分类(ACT 210)。方法200可以包括确定不将数字分量包括在响应中(ACT 212)。方法200可以包括生成响应(ACT 214)。

如上文阐述的，方法200可以包括接收请求(ACT 202)。数据处理系统102可以从客户端计算装置104接收请求。请求可以是基于文本的、基于图像的、或者基于音频的。数据处理系统102可以在接口(诸如，网络接口或者其他接口)处接收请求。对于基于音频的输入信号，数据处理系统102可以执行NLP组件112，该NLP组件112可以解析输入信号以识别输入音频信号中的请求和一个或者多个触发关键字。

方法200可以包括选择数字分量(ACT 204)。内容选择器组件118可以选择数字分量。内容选择器组件118可以基于请求和请求中识别到的一个或者多个触发关键字来选择数字分量。所选择的数字分量可以包括文本(例如，一个或者多个字符)。数字分量可以是用户生成的内容，诸如，用户提供的评论或者评述。当数字分量是基于视频的或者基于音频的时，操纵检测组件114可以将来自数字分量的音频改写成字符串。操纵检测组件114可以确定是否要基于所选择的数字分量或者其元数据对数字分量进行处理。例如，元数据可以指示数字分量是从可信内容提供商装置106接收到的，并且操纵检测组件114可以确定要将数字分量包括在响应中，而无需确定数字分量是否包括被操纵的文本，这是因为数字分量是从可信内容提供商装置106接收到的。

方法200可以包括检索字典(ACT 206)。字典可以指示在未被操纵的数字分量中最常见的字符。字典可以包括可在数字分量中使用的总体可能字符的一部分。可以对字典中的字符进行独热编码以形成独热编码字符的矩阵。例如，各个字符可以形成矩阵的一行，其中，二进制数组的值由形成这一行中的多列的独热编码生成。

数据存储库122可以包括多个不同字典124。数据处理系统102可以为不同分组的数字分量生成和存储不同字典124。可以基于在数字分量中使用的语言、生成(或者意图显示)数字分量的区域、或者数字分量的主题来对数字分量进行编组。操纵检测组件114可以识别所选择的数字分量与其相关联的编组(例如，哪种语言或者主题类别)，然后选择对应字典124。

同样参照图3，方法200可以包括生成字符数组(ACT 208)。图3图示了将数字分量300划分成多个部分302，然后将这些部分302转换成至少一个字符数组304的过程。

如图3所图示的，其中，数字分量300可以包括多个字符301。操纵检测组件114可以将多个字符划分成部分302。操纵检测组件114可以分析预定长度的字符数组。例如，操纵检测组件114可以生成和分析长度在大约1个到大约500个字符、长度在大约20个到大约150个字符、长度在大约50个到大约150个字符、长度在大约100个到大约150个字符、或者长度在大约120个到大约150个字符的字符数组。如图3所图示，当数字分量300包括比预定长度更多的字符时，操纵检测组件114可以将多个字符划分成分别具有预定长度(例如，120个字符)的不同部分。

当部分小于预定长度时，可以将这部分补零以达到预定长度。当数字分量300小于总体预定长度时，操纵检测组件114可以生成进行补零以达到预定长度的单个部分。可以通过滑动窗口生成不同部分。在一些实施方式中，这些部分之间不存在重叠。在一些示例中，在这些部分之间可以存在50％与大约99％、大约60％到大约99％、大约75％到大约99％、或者大约95％到大约99％的重叠。如图3所图示，通过将窗口滑动一个字符的距离来生成部分302(1)和302(2)。在图3中图示的示例中，如果每个部分的长度为n个字符301，则重叠为(n-1)个字符301。

参照图1和图3，其中，操纵检测组件114可以通过使用在ACT 206处选择和检索的字典124将这些部分302中的每个部分转换成字符数组304。例如，如图3所图示，可以将部分302(1)转换成字符数组304(1)，并且可以将部分302(2)转换成字符数组304(2)。字符数组304可以是包括值的数组的数据结构。可以通过使用字符301作为针对字典124的输入来将部分302中的各个字符301转换成字符数组302中的值(或者整数)，可以将该字典124用作在字符301与其相应整数之间转换的查找表。可以对字符数组304进行独热编码。例如，可以将字符数组304的每个值转换成二进制数组。当将字符转换成整数时，可以对字典索引进行独热编码以生成独热编码字符数组。

参照图2，其中，方法200可以包括对数字分量进行分类(ACT 210)。操纵检测组件114可以将数字分量分类成多个类别中的第一类别。操纵检测组件114进行的分类可以是基于字符数组中的第一多个字符的序列(或者顺序)。例如，可以将来自数字分量的字符(或者字符的独热编码版本)作为输入按顺序馈送到操纵检测组件的分类器中。分类器可以具有两种输出类别：被操纵的类别和未操纵类别。分类器可以是长短期记忆神经网络、可以包括长短期记忆神经网络、或者可以是长短期记忆神经网络的一部分。

方法200可以包括确定不将数字分量包括在响应中(ACT 212)。确定不将数字分量包括到对来自客户端计算装置的内容请求的响应中可以基于将数字分量分类成被操纵的类别。例如，如果将数字分量分类成被操纵的类别，则可以从数据存储库122中移除或者清除数字分量，或者在内容选择过程(例如，ACT 204)期间限制数字分量或者将其排除在外。

方法200可以包括生成响应(ACT 214)。可以响应于在ACT 202处接收到的请求来生成响应。数据处理系统102可以生成不包括在ACT 204处选择的数字分量的响应。不包括数字分量的决定可以基于对被操纵的类别中的数字分量的分类。

操纵检测组件114可以基于确定不将最初选择的数字分量包括在响应中(这是因为已将所选择的数字分量分类成被操纵的类别)来指示内容选择器组件118选择第二数字分量。操纵检测组件114可以重复ACTS 206-210以对第二数字分量进行分类。操纵检测组件114可以重复上述ACT，直到选择了被分类成未操纵类别的数字分量为止。可以将被分类成未操纵类别的数字分量包括到响应中。

如果操纵检测组件114确定将来自内容提供商装置106的预定数量的数字分量分类为被操纵的数字分量，则操纵检测组件114可以将内容提供商装置106分类为非可信内容提供商。一旦被分类为非可信内容提供商，数据处理系统102可以不向非可信内容提供商请求数字分量(或者可以自动拒绝来自非可信内容提供商的数字分量)。如果操纵检测组件114确定将来自内容提供商装置106的预定数量的数字分量分类为未被操纵的数字分量，则操纵检测组件114可以将内容提供商装置106分类为可信内容提供商。基于被分类为可信内容提供商装置，操纵检测组件114可以不对来自可信内容提供商装置的数字分量进行确定它们是否包括被操纵的文本的处理，或者操纵检测组件114可以仅处理来自可信内容提供商装置的数字分量的一部分。例如，操纵检测组件114可以仅对来自可信内容提供商装置的每n个数字分量进行处理。操纵检测组件114可以基于建立内容提供商装置106的所有者或者真实性将内容提供商装置106标记为可信内容提供商。例如，如果例如在向数据处理系统102进行注册期间可以验证内容提供商装置的标识，则数据处理系统102可以将内容提供商装置106标记为可信内容提供商。

输入请求可以是基于语音的，并且包括在响应中的数字分量可以是基于文本的，诸如，用户生成的评述或者评论。音频信号发生器组件可以将数字分量转换成要在客户端计算装置104处传输和渲染的输出音频文件。

图4是示例计算机系统400的框图。计算机系统或者计算装置400可以包括系统100或者其组件(诸如，数据处理系统102)，或者可以使用计算机系统或者计算装置400来实施系统100或者其组件(诸如，数据处理系统102)。计算系统400包括用于传送信息的总线405或者其他通信组件和耦合至总线405用于处理信息的处理器410或者处理电路。计算系统400还可以包括耦合至总线用于处理信息的一个或者多个处理器410或者处理电路。计算系统400还包括耦合至总线405用于存储信息和待由处理器410执行的指令的主存储器415(诸如，随机存取存储器(RAM)或者其他动态存储装置)。主存储器415可以是或者可以包括数据存储库122。主存储器415还可以用于存储位置信息、临时变量、或者在处理器410执行指令期间的其他中间信息。计算系统400可以进一步包括只读存储器(ROM)420或者耦合至总线405用于存储用于处理器410的静态信息和指令的其他静态存储装置。存储装置425(诸如，固态装置、磁盘或者光盘)可以耦合至总线405以便持久地存储信息和指令。存储装置425可以包括数据存储库122或者可以是数据存储库122的一部分。

可以经由总线405将计算系统400耦合至显示器435(诸如，液晶显示器、或者有源矩阵显示器)以便向用户显示信息。输入装置430(诸如，包括字母数字键或者其他键的键盘)可以耦合至用于将信息和命令选择传送至处理器410的总线405。输入装置430可以包括触摸屏显示器435。输入装置430还可以包括用于将方向信息和命令选择传送至处理器410和用于控制显示器435上的光标移动的光标控件(诸如，鼠标、轨迹球、或者光标方向键)。例如，显示器435可以是图1的数据处理系统102、客户端计算装置104、或者其他组件的一部分。

响应于处理器410执行包含在主存储器415中的指令的布置，可以通过计算系统400来实现完成本文所描述的过程、系统和方法。可以通过另一计算机可读介质(诸如，存储装置425)来将这些指令读入主存储器415。执行包含在主存储器415中的指令的布置使计算系统400执行本文所描述的说明性过程。还可以采用在多处理布置中的一个或者多个处理器来执行包含在存储器415中的指令。硬连线电路系统可以代替软件指令和本文所描述的系统和方法或者与软件指令和本文所描述的系统和方法结合使用。本文所描述的系统和方法不限于硬件电路系统和软件的任何特定组合。

虽然已经在图4中对示例计算系统进行了描述，但是可以利用其他类型的数字电子电路系统，或者利用计算机软件、固件、或者硬件(包括本说明书所公开的结构及其结构等效物)、或者利用它们中的一个或者多个的组合实施包括本说明书中所描述的操作的主题。

在此处讨论的系统采集有关用户的个人信息或者可以利用个人信息的情况下，可以为用户提供如下机会：控制程序或者特征是否可以采集个人信息(例如，有关用户的社交网络、社交动作或者活动、用户的偏好、或者用户的位置的信息)或者控制是否或者如何从内容服务器或者其他数据处理系统接收可能与用户更有关的内容。另外，在存储或者使用特定数据之前，可以按照一种或者多种方式使该特定数据匿名化，从而使得可以在生成参数时去除个人身份信息。例如，可以使用户的身份匿名化，从而使得无法确定用户的个人身份信息，或者可以将用户的可以从中获得位置信息(诸如，城市、邮政编码、或者州县等级)的地理位置一般化，从而使得无法确定用户的特定位置。由此，用户可以对内容服务器采集和使用的有关用户的信息的方式进行控制。

可以利用数字电子电路系统，或者利用计算机软件、固件、或者硬件(包括在本说明书所公开的结构及其结构等效物)、或者它们中的一个或者多个的组合来实施本说明书中描述的主题和操作。可以将本说明书中描述的主题实施为一个或者多个计算机程序，例如，编码在一个或者多个计算机存储介质上、由数据处理设备执行或者控制该数据处理设备的操作的计算机程序指令的一个或者多个电路。可替代地或者另外，程序指令可以编码在人工生成的传播信号上，例如，机器生成的电气、光学、或者电磁信号，生成该信号是为了对用于传输至合适的接收器设备供数据处理设备执行的信息进行编码。计算机存储介质可以是计算机可读存储装置、计算机可读存储基板、随机或者串行存取存储器阵列或者装置、或者它们中的一个或者多个的组合，或者包括在其中。当计算机存储介质不是传播信号时，计算机存储介质可以是编码在人工生成的传播信号中的计算机程序指令的源或者目的地。计算机存储介质也可以是一个或者多个单独的组件或者介质(例如，多个CD、磁盘、或者其他存储装置)，或者包括在其中。可以将本说明书中描述的操作实施为由数据处理设备对存储在一个或者多个计算机可读存储装置上的或者从其他源接收到的数据执行的操作。

术语“数据处理系统”、“计算装置”、“组件”、或者“数据处理设备”囊括了用于处理数据的各种设备、装置、和机器，该各种设备、装置、和机器包括：例如，可编程处理器、计算机、片上系统、或者前述中的多种或者组合。设备可以包括专用逻辑电路系统，例如，现场可编程门阵列(FPGA)或者专用集成电路(ASIC)。除了硬件之外，设备还可以包括为探讨中的计算机程序创建执行环境的代码，例如，构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时间环境、虚拟机、或者它们中的一个或者多个的组合的代码。设备和执行环境可以实现各种不同的计算模型基础设施，诸如，网络服务、分布式计算和网格计算基础设施。直接动作API 116、内容选择器组件118、或者NLP组件112和其他数据处理系统102组件可以包括或者共享一个或者多个数据处理设备、系统、计算装置、或者处理器。

可以用任何形式的编程语言(包括：编译语言或者解释语言、陈述性语言或者程序语言)来编写计算机程序(也称为程序、软件、软件应用、应用程序、脚本、或者代码)，并且可以按照任何形式(包括：作为独立式程序或者模块、组件、子例程、对象、或者适合用于计算环境的其他单元)来部署计算机程序。计算机程序可以与文件系统中的文件对应。可以将计算机程序存储在保持其他程序或者数据(例如，存储在标记语言文档中的一个或者多个脚本)的文件的一部分中，或者存储在专用于所探讨中的程序的单个文件中，或者存储在多个协作文件(例如，存储一个或者多个模块、子程序、或者部分代码的文件)中。可以将计算机程序部署为在一个计算机上执行或者在位于一个站点处或者分布在多个站点中并且通过通信网络互相连接的多个计算机上执行。

可以通过一个或者多个可编程处理器来进行本说明书中描述的过程和逻辑流程，该一个或者多个可编程处理器执行一个或者多个计算机程序(例如，数据处理系统102的组件)以通过操作输入数据并且生成输出来进行动作。也可以通过专用逻辑电路系统(例如，FPGA或者ASIC)来执行过程和逻辑流程，并且也可以将设备实施为专用逻辑电路系统(例如，FPGA或者ASIC)。适合于存储计算机程序指令和数据的装置包括所有形式的非易失性存储器、介质和存储器装置，包括：例如，半导体存储器装置(例如，EPROM、EEPROM、和闪速存储器装置)、磁盘(例如，内部硬盘或者可移动盘)、磁光盘、CD-ROM盘和DVD-ROM盘。处理器和存储器可以由专用逻辑电路系统补充或者可以并入该专用逻辑电路系统中。

本文所描述的主题可以实施在包括后台组件的计算系统(例如，作为数据服务器)、或者包括中间件组件的计算系统(例如，应用服务器)、或者包括前端组件的计算系统(例如，具有图形用户界面或者网络浏览器的客户端计算机，用户可以通过该图形用户界面或者该网络浏览器来与本说明书中所描述的主题的实施方式交互)、或者包括一个或者多个这种后台组件、中间件组件或者前端组件的组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的组件相互连接。通信网络的示例包括：局域网(“LAN”)和广域网(“WAN”)、网际网(例如，互联网)、以及对等网络(例如，ad hoc对等网络)。

计算系统(诸如，系统100或者系统400)可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络(例如，网络105)进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。在一些实施例中，服务器将数据(例如，表示动作数据结构或者数字分量的数据分组)传输至客户端装置(例如，传输至为了向与客户端装置交互的用户显示数据以及接收来自该用户的用户输入的客户端计算装置104、或者传输至内容提供商计算装置106)。可以从在服务器处的客户端装置接收在客户端装置处生成的数据(例如，用户交互的结果)(例如，可以通过数据处理系统102从计算装置104或者内容提供商计算装置106接收在客户端装置处生成的数据)。

虽然在附图中以特定顺序描绘了操作，但不需要以所示的特定顺序或者按顺序执行这些操作，并且不需要执行所有图示的操作。可以按照不同的顺序执行本文描述的动作。

各种系统组件的分离不是在所有实施方式中都需要分离，并且所描述的程序组件可以包括在单个硬件或者软件产品中。例如，NLP组件112或者内容选择器组件118可以是单个组件、应用程序、或者程序、或者具有一个或者多个处理电路的逻辑装置、或者数据处理系统102的一个或者多个服务器的一部分。

现在已经描述了一些说明性实施方式，显而易见的是，前述说明是说明性的而非限制性的，这是以示例的方式呈现的。具体地，虽然本文呈现的许多示例都涉及方法行为或者系统元件的具体组合，但是这些行为和这些元件可以按照其他方式组合以实现相同目标。结合一种实施方式讨论的行为、元件和特征不旨在从其他实施方式或者实施方式中的相似作用中排除。

本文使用的短语和术语是为了进行描述，不应该将其视为具有限制性。本文中使用“包括(including)”、“包括(comprising)”、“具有(having)”、“包含(containing)”、“涉及(involving)”、“其特征在于(characterized by)”、“其特征在于(characterized inthat)”及其变型旨在涵盖其后列出的项、其等效物、和附加项、以及由此外在其后列出的项组成的替代实施方式。在一种实施方式中，本文描述的系统和方法由一个、一个以上或者所有所描述的元件、行为、或者组件的每个组合组成。

对以单数形式提及的本文的系统和方法的实施方式或者元件或者行为的任何引用也可以涵盖包括多个这些元件的实施方式，并且对本文中的任何实施方式或者元件或者行为的复数引用也可以涵盖仅包括单个元件的实施方式。单数或者复数形式的引用不旨在将当前公开的系统和方法、它们的组件、行为、或者元件限制为单个或者多个配置。对基于任何信息、行为、或者元件的任何行为或者元件的引用可以包括该行为或者元件至少部分地基于任何信息、行为、或者元件的实施方式。

本文所公开的任何实施方式可以与任何其他实施方式或者实施例组合，并且对“实施方式”、“一些实施方式”、“一种实施方式”等的引用不一定是相互排斥的，并且旨在指示结合实施方式描述的特定特征、结构、或者特征可以包括在至少一个实施方式或者实施例中。如本文所使用的这种术语不一定都是指相同的实施方式。任何实施方式都可以以与本文所公开的方面和实施方式一致的任何方式包含或者排他地与任何其他实施方式组合。

对“或者”的引用可以被解释为包含性的，使得通过使用“或者”描述的任何术语都可以指示单个、一个以上、和所有所描述的术语中的任何一个。例如，对“‘A’和‘B’中的至少一个”的引用可以包括‘A’、‘B’、以及‘A’和‘B’二者。结合“包括”或者其他开放术语使用的这种引用可以包括附加项。

在附图、详细说明、或者任何权力要求中的技术特征后面附有附图标记，已经将附图标记包括进来以增加附图、详细说明、和权利要求书的可理解性。因此，具有附图标记或者不具有附图标记都不会对任何权利要求要素的范围产生任何限制作用。

在不脱离本文所描述的系统和方法的特征的情况下，本文所描述的系统和方法可以体现为其他特定形式。前述实施方式是说明性的，而不是为了限制所描述的系统和方法。因此，用随附权利要求，而不是前述说明指示本文所描述的系统和方法的范围，并且在权利要求书的等效物的含义和范围内的变化包含在其中。

Claims

1.一种用于限制在网络环境中内容传输的系统，包括：

数据处理系统接口，所述数据处理系统接口用于从客户端计算装置接收内容请求；

由所述数据处理系统执行的内容选择器组件，所述内容选择器组件用于基于所述内容请求来选择第一数字分量，所述第一数字分量包括第一多个字符；以及

由所述数据处理系统执行的操纵检测组件，所述操纵检测组件用于：

检索字典，所述字典包括在多个数字分量中包括的候选字符的一部分的指示；

基于所述字典将第一多个字符转换成字符向量，所述字典包括在所述多个数字分量中包括的所述候选字符的所述一部分的指示；

基于所述字符向量中的所述第一多个字符的序列将所述第一数字分量分类成多个类别中的第一类别；

基于将所述第一数字分量分类成所述多个类别中的所述第一类别，确定在对来自所述客户端计算装置的所述内容请求的响应中不包括所述第一数字分量；以及

基于来自所述客户端计算装置的所述内容请求来生成所述响应，基于确定在所述响应中不包括所述第一数字分量，所述响应不包括所述第一数字分量。

2.根据权利要求1所述的系统，包括：

所述接口用于从所述客户端计算装置接收第二内容请求；

所述内容选择器组件用于基于所述第二内容请求来选择第二数字分量，所述第二数字分量包括第二多个字符；以及

所述操纵检测组件用于：

将所述第二多个字符划分成第一部分和第二部分；

将所述第二多个字符的所述第一部分转换成第二字符向量，并且将所述第二多个字符的所述第二部分转换成第三字符向量；以及

基于所述第一部分中的所述第二多个字符的序列和所述第二部分中的所述第二多个字符的序列将所述第二数字分量分类成所述多个类别中的第一类别。

3.根据权利要求1所述的系统，包括操纵检测组件用于：

对所述字符向量进行独热编码；以及

对在所述多个数字分量中包括的所述候选字符的所述一部分进行独热编码。

4.根据权利要求1所述的系统，包括：

自然语言处理器，所述自然语言处理器用于：

接收包括所述内容请求的输入音频信号；

解析所述输入音频信号以识别所述内容请求和触发关键字；以及

所述内容选择器组件用于基于所述内容请求和所述触发关键字来选择所述第一数字分量。

5.根据权利要求1所述的系统，包括：

所述操纵检测组件用于将所述第一数字分量的音频输出转换成所述第一多个字符。

6.根据权利要求1所述的系统，包括：

所述内容选择器组件用于基于确定在所述响应中不包括所述第一数字分量来选择第二数字分量，所述第二数字分量包括第二多个字符；以及

所述操纵检测组件用于：

将所述第二多个字符转换成第二字符向量；

基于所述第二字符向量中的所述第二多个字符的序列将所述第二数字分量分类成所述多个类别中的第二类别；以及

将所述第二数字分量包括在所述响应中。

7.根据权利要求6所述的系统，包括：

音频信号发生器组件，所述音频信号发生器组件用于将所述第二数字分量转换成输出音频文件。

8.根据权利要求1所述的系统，包括：

所述操纵检测组件用于：

识别与所述第二数字分量相关联的语言；

基于与所述第二数字分量相关联的所述语言来选择第二字典；

基于所述第二字典将所述第二多个字符转换成第二字符向量；

将所述第二数字分量包括在所述响应中。

9.根据权利要求1所述的系统，包括所述操纵检测组件用于：

接收所述多个数字分量；

确定在所述多个数字分量中包括的所述多个候选字符中的每个候选字符的出现次数；以及

基于在所述多个数字分量中的所述多个候选字符中的每个候选字符的出现次数来选择在所述多个数字分量中包括的候选字符的所述一部分。

10.根据权利要求9所述的系统，其中，在所述多个数字分量中包括的候选字符的所述一部分中的每个候选字符的出现次数大于在所述候选字符的所述一部分中不包括的所述候选字符中的每个候选字符的出现次数。

11.根据权利要求1所述的系统，其中，所述第一数字分量是视觉统一资源定位符(vURL)。

12.根据权利要求1所述的系统，包括：

所述操纵检测组件用于通过使用长短期记忆神经网络来将所述第一数字分量分类成所述多个类别中的所述第一类别。

13.根据权利要求1所述的系统，其中，所述字典包括独热编码字符的矩阵，所述独热编码字符包括多个训练数字分量中包括的字符的一部分。

14.一种用于限制在网络环境中内容传输的方法：

通过数据处理系统接收来自客户端计算装置的内容请求；

通过由所述数据处理系统执行的内容选择器组件，基于所述内容请求来选择第一数字分量，所述第一数字分量包括第一多个字符；

通过由所述数据处理系统执行的操纵检测组件来检索字典，所述字典包括在多个数字分量中包括的候选字符的一部分的指示；

通过所述操纵检测组件基于所述字典将所述第一多个字符转换成字符向量，所述字典包括在所述多个数字分量中包括的所述候选字符的所述一部分的指示；

通过所述操纵检测组件，基于将所述第一数字分量分类成所述多个类别中的所述第一类别来确定在对来自所述客户端计算装置的所述内容请求的响应中不包括所述第一数字分量；以及

通过所述数据处理系统基于来自所述客户端计算装置的所述内容请求来生成所述响应，基于确定在所述响应中不包括所述第一数字分量，所述响应不包括所述第一数字分量。

15.根据权利要求14所述的方法，包括：

通过所述数据处理系统接收来自所述客户端计算装置的第二内容请求；

通过所述内容选择器组件基于所述第二内容请求来选择第二数字分量，所述第二数字分量包括第二多个字符；

通过所述操纵检测组件将所述第二多个字符划分成第一部分和第二部分；

通过所述操纵检测组件将所述第二多个字符的所述第一部分转换成第二字符向量，并且将所述第二多个字符的所述第二部分转换成第三字符向量；以及

通过所述操纵检测组件，基于所述第一部分中的所述第二多个字符的序列和所述第二部分中的所述第二多个字符的序列将所述第二数字分量分类成所述多个类别中的所述第一类别。

16.根据权利要求14所述的方法，包括：

通过所述内容选择器组件基于确定在所述响应中不包括所述第一数字分量来选择第二数字分量，所述第二数字分量包括第二多个字符；

通过所述操纵检测组件将所述第二多个字符转换成第二字符向量；

通过所述操纵检测组件，基于所述第二字符向量中的所述第二多个字符的序列将所述第二数字分量分类成所述多个类别中的第二类别；以及

通过所述操纵检测组件将所述第二数字分量包括在所述响应中。

17.根据权利要求14所述的方法，包括：

通过所述操纵检测组件来识别与所述第二数字分量相关联的语言；

通过所述操纵检测组件，基于与所述第二数字分量相关联的所述语言来选择第二字典；

通过所述操纵检测组件，基于所述第二字典将所述第二多个字符转换成第二字符向量；

18.根据权利要求14所述的方法，包括：

通过所述操纵检测组件接收所述多个数字分量；

通过所述操纵检测组件确定在所述多个数字分量中包括的所述多个候选字符中的每个候选字符的出现次数；以及

通过所述操纵检测组件，基于在所述多个数字分量中的所述多个候选字符中的每个候选字符的出现次数来选择在所述多个数字分量中包括的候选字符的所述一部分。

19.一种数字助理装置，包括：

音频驱动器；

变换器；

传感器，所述传感器用于检测输入音频信号；以及

预处理器组件，所述预处理器组件被耦合至所述音频驱动器、所述变换器和所述传感器，所述预处理器组件用于：

对所述输入音频信号进行过滤以产生过滤的输入音频信号；

将所述过滤的输入音频信号转换成数据分组；以及

将所述数据分组传输至数据处理系统，所述数据处理系统包括执行自然语言处理器组件、内容选择器组件、接口和操纵检测组件的一个或者多个处理器和存储器，所述数据处理系统用于：

经由所述接口从所述预处理器组件接收所述数据分组，所述数据分组包括由所述传感器检测到的所述过滤的输入音频信号；

通过所述自然语言处理器组件来识别所述过滤的输入音频信号中的内容请求；

通过所述内容选择器组件基于所述内容请求来选择第一数字分量，所述第一数字分量包括第一多个字符；

通过所述操纵检测组件来检索字典，所述字典包括在多个数字分量中包括的候选字符的一部分的指示；

通过所述操纵检测组件基于所述字典将第一多个字符转换成字符向量，所述字典包括在所述多个数字分量中包括的所述候选字符的所述一部分的指示；

通过所述操纵检测组件基于在所述字符向量中的所述第一多个字符的序列将所述第一数字分量分类成多个类别中的第一类别；

通过所述操纵检测组件基于将所述第一数字分量分类成所述多个类别中的所述第一类别来确定在对来自所述客户端计算装置的所述内容请求的响应中不包括所述第一数字分量；以及

通过所述操纵检测组件基于来自所述客户端计算装置的所述内容请求来生成所述响应，基于确定在所述响应中不包括所述第一数字分量，所述响应不包括所述第一数字分量。

20.根据权利要求19所述的数字助理装置，包括：

所述传感器用于检测第二输入音频信号；以及

所述预处理器组件用于将所述第二输入音频信号传输至所述数据处理系统，所述数据处理系统用于：

通过所述接口来接收所述第二输入音频信号；

通过所述自然语言处理器组件来识别所述第二输入音频信号中的第二内容请求；

通过所述内容选择器组件基于所述第二内容请求来选择第二数字分量，所述第二数字分量包括第二多个字符；以及

通过所述操纵检测组件基于所述第一部分中的所述第二多个字符的序列和所述第二部分中的所述第二多个字符的序列将所述第二数字分量分类成所述多个类别中的所述第一类别。