CN110546628B

CN110546628B - 用有向线缓冲器最小化存储器读取提高神经网络环境性能

Info

Publication number: CN110546628B
Application number: CN201880025415.0A
Authority: CN
Inventors: G·彼得; C·B·麦克布赖德; A·A·安巴德卡; K·D·塞多拉; B·博布罗夫; L·M·瓦尔
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2017-04-17
Filing date: 2018-04-06
Publication date: 2023-10-20
Anticipated expiration: 2038-04-06
Also published as: WO2018194845A1; WO2018194848A1; CN110520857B; CN110520853B; EP3612946B1; NZ756870A; CN110546610A; EP3612933B1; US11405051B2; CN116909984A; US20180299943A1; US11100390B2; US20180300634A1; BR112019021541A2; CN110520870B; WO2018194850A1; CN110537194A; RU2019136750A; EP3612934A1; EP3612933A1

Abstract

神经网络(NN)和/或深度神经网络(DNN)的性能可以受到正在执行的操作的数目以及NN/DNN的各种存储器组件中间的数据管理的限制。使用可操作地在数据块中插入要处理的一个或多个移位比特的有向线缓冲器，可以优化对线缓冲器的数据读/写以便由NN/DNN进行处理，从而增强NN/DNN的整体性能。可操作地，操作控制器和/或迭代器能够生成具有所计算的(多个)移位比特的一个或多个指令，以用于传送到线缓冲器。说明性地，可以使用输入数据的各种特性以及包括数据维度的NN/DNN来计算(多个)移位比特。线缓冲器可以读取用于处理的数据，插入移位比特并将数据写入线缓冲器中以供(多个)协作处理单元进行后续处理。

Description

用有向线缓冲器最小化存储器读取提高神经网络环境性能

背景技术

在人工神经网络(NN)中，神经元是用于对大脑中的生物神经元建模的基本单位。人工神经元的模型包括输入向量的内积，其中权重向量被添加到应用了非线性的偏差。对于深度神经网络(DNN)(例如，如由示例性DNN模块表示的)，可以将神经元紧密地映射到人工神经元。

在处理跨NN或DNN的数据时，需要执行示例性处理操作的控制器对大量数据进行迭代，以便应用特定操作。这样的要求可能会影响整个NN或DNN性能，从而导致损害期望的指定处理目标(例如，标识示例性输入数据中的对象和/或对象特性——图像、声音、地理坐标等)的关键时延。通常，一些现有的NN和DNN在执行各种操作时会花费可避免的处理时间(例如，每秒浮点/定点操作(GFlops/s))和存储器空间(例如，每秒传输的字节数(GBytes/s))，各种操作包括对NN/DNN的各种协作存储器组件(例如，线(line)缓冲器)的存储器读取和写入。具体地，当前的实践并未标识输入/数据的关键特征和/或未向NN或DNN的协作组件提供有关如何最佳地管理/指示协作NN或DNN存储器组件(包括线缓冲器)中的输入数据的读/写操作的指令，以避免此类性能问题。与NN或DNN中低效率的数据处理相关联的性能影响的部分原因是NN或DNN的神经处理组件中间的数据低效处理。这种低效的数据管理和处理需要附加的、通常是可避免的计算/神经处理器操作，从而进一步给整体NN/DNN性能带来压力。

一种更有利的NN/DNN将部署指令集，该指令集指示NN/DNN的协作存储器组件，特别是线缓冲器，基于指定的数据维度(例如，逻辑数据模型中表示的数据大小、数据连续性等)可操作地计算和插入一个或多个移位比特，其将在数据处理周期期间最小化对协作存储器组件的读取和写入的数目。可操作地，一个或多个移位比特可以允许将数据作为单个连续数据块写入(并随后读取)，从而允许减少的存储器操作。

相对于这些考虑和其他考虑，提出了本文的公开内容。

发明内容

本文所描述的技术提供了将在示例性神经网络(NN)和/或深度神经网络(DNN)环境中使用的一个或多个硬件迭代器的虚拟化，其中有向线缓冲器可操作地允许处理数据，其改进整体性能并优化存储器管理。在说明性实现中，示例性DNN环境可以包括一个或多个处理块(例如，计算机处理单元-CPU)，存储器控制器，线缓冲器，高带宽结构(例如，本地或外部结构)(例如，数据总线在DNN环境的示例性DNN模块与协作组件之间传递数据和/或数据元素)，操作控制器和DNN模块。在说明性实现中，示例性DNN模块可以包括示例性DNN状态控制器，描述符列表控制器(DLC)，dMA(DDMA)，DMA流激活(DSA)，操作控制器，负载控制器和存储控制器。

在说明性操作中，NN/DNN环境的操作控制器可以可操作地处理大量数据，以便应用一个或多个期望的数据处理操作(例如，卷积，最大池化，标量乘法/加法，求和，完全连接，等等)。在说明性操作中，参与的用户可以指定正被处理的数据的维度，以及有关如何通过使用有向线缓冲器(例如，一种具有一个或多个指令以插入一个或多个计算出的移位比特的线缓冲器)来处理供NN/DNN计算环境使用的数据的配置。

在说明性实现中，将由NN/DNN环境处理的数据可以被表示为blob。通常，blob表示存储器中需要迭代的数据。每个blob可以维持由各种维度(诸如宽度，高度，通道数，内核数和其他可用维度单位)定义的逻辑映射形状。在说明性操作中，操作控制器可以遍历多维blob(例如，由逻辑数据映射定义)或此类blob的较小N维切片，其中N是维数(例如，对于表示具有宽度、高度和通道数的图像的3D blob-N＝3)(例如，使用一个或多个硬件或虚拟迭代器)。遍历的blob可以利用一条或多条指令被传送到协作的线缓冲器，以管理线缓冲器内遍历的数据的读/写。

说明性地，线缓冲器可以在所遍历的数据上可操作地插入一个或多个移位比特，其可以最小化线缓冲器在其操作期间要执行的数据写入的数目。可以构造线缓冲器以将数据存储在预定义数目的行(row)/线(line)(例如64行，线)中，该行/线可以接收行/线中间的所选择的数据量(例如，可以为线缓冲器的每条线接收32个字节的数据)。线缓冲器可以操作以基于输入数据的特性(例如步幅值，连续性，高度，宽度，内核等)使用一个或多个计算的移位比特来移位输入数据(例如，如果步幅的值为0，那么线缓冲器的线可以具有相同的数据，而如果步幅的值为1，则数据可以被移位1以允许线缓冲器内更有效的读/写操作)。可以为每组输入数据计算出所计算的一个或多个移位比特，以允许生成到线缓冲器的一个或多个指令，用以从协作存储器或协作组件(例如，迭代器–硬件或虚拟)读取，插入适当量的所计算的一个或多个移位比特，以及将数据写入线缓冲器。

可操作地，线缓冲器的列(column)可以代表示例性处理周期，其中数据被一个或多个协作处理单元消费(例如，线缓冲器可以支持16列，其代表16个数据周期以供神经元对其进行操作)。线缓冲器还可以维持从协作存储器单元加载的输入数据的两个副本(例如，主副本和阴影副本)。主副本可以用来自NN/DNN环境的其他协作组件(例如，迭代器-硬件和/或虚拟迭代器)的数据来填充，并且其他协作组件可以对其他副本(例如，阴影副本)进行操作(例如，处理单元/神经元可以对阴影副本进行操作，消费阴影副本中的数据)。可操作地，一旦主副本达到其最大存储容量并消费了阴影副本，则可以将主副本数据移至阴影副本，并且NN/DNN协作组件(例如迭代器)可以开始用下一组数据填充主副本。

应当理解，尽管关于系统进行了描述，但是上述主题内容还可以被实现为计算机控制的装置，计算机过程，计算系统或诸如计算机可读介质和/或专用芯片组的制品。通过阅读以下详细描述并回顾相关联附图，这些和各种其他特征将变得明显。提供本发明内容以简化形式介绍一些概念，这些概念将在下面的详细描述中进一步描述。

本发明内容既不旨在标识所要求保护的主题内容的关键特征或必要特征，也不旨在用以限制所要求保护的主题内容的范围。此外，所要求保护的主题内容不限于解决在本公开的任何部分中指出的任何或所有缺点的实现。

附图说明

参照附图描述详细描述。在附图中，附图标记的最左边的(多个)数字标识该附图标记首次出现的附图。不同附图中的相同附图标记表示相似或相同的项目。对多个项目中的单独项目的引用可以使用带有字母序列中的字母的附图标记来引用每个单独项目。对项目的通用引用可以使用不带字母序列的特定附图标记。

图1图示了根据本文描述的系统和方法的示例性神经网络计算环境的框图。

图2图示了利用有向线缓冲器的示例性神经网络环境的框图。

图3图示了根据本文描述的系统和方法的在说明性逻辑数据映射中表示的示例性输入数据的框图。

图4图示了在说明性逻辑数据映射中表示的示例性输入数据的框图，该说明性逻辑数据映射示出了对说明性n个滑动窗口的使用，说明性n个滑动窗口可操作以跨越说明性逻辑数据映射的一条或多条线。

图5图示了在说明性逻辑数据映射中表示的示例性输入数据的框图，该说明性逻辑数据映射根据本文描述的系统和方法示出了对说明性n个滑动窗口的使用，说明性n个滑动窗口可操作以跨越说明性逻辑数据映射的一条或多条线，可操作以允许数据填充作为处理增强。

图6图示了在说明性逻辑数据映射中表示的示例性输入数据的框图，该逻辑数据映射根据本文描述的系统和方法示出了使用移位比特以允许在有向线缓冲器内进行连续的存储器读/写操作。

图7是根据本文描述的系统和方法的用于在示例性神经网络环境中使用有向线缓冲器处理数据的说明性过程的流程图。

图8示出了用于能够执行本文描述的方法的计算机的说明性计算机架构的附加细节。

图9示出了根据本文描述的系统和方法进行协作的说明性计算设备的附加细节。

具体实施方式

以下详细说明描述了在示例性神经网络(NN)和/或深度神经网络(DNN)环境中利用有向线(line)缓冲器的技术，其中有向线缓冲器可操作地允许处理数据，处理数据改进了总体性能并优化了存储器管理。在说明性实现中，示例性DNN环境可以包括一个或多个处理块(例如，计算机处理单元-CPU)，存储器控制器，线缓冲器，高带宽结构(例如，本地或外部结构)(例如，数据总线在DNN环境的示例性DNN模块与协作组件之间传递数据和/或数据元素)，操作控制器和DNN模块。在说明性实现中，示例性DNN模块可以包括示例性DNN状态控制器，描述符列表控制器(DLC)，dMA(DDMA)，DMA流激活(DSA)，操作控制器，负载控制器和存储控制器。出于本文描述的系统和方法的目的，可以在神经网络(NN)和/或深度神经网络(NN)中实现发明构思。当在本公开中提及神经网络(NN)时，还应意味着包括并可适用于深度神经网络(DNN)。

在说明性操作中，NN/DNN环境的操作控制器可以可操作地处理大量数据，以便应用一个或多个期望的数据处理操作(例如，卷积，最大池化，标量乘法/加法，求和，完全连接，等等)。在说明性操作中，参与的用户可以指定正被处理的数据的维度，以及有关如何通过使用有向线缓冲器(例如，具有一个或多个指令以插入一个或多个计算出的移位比特的线缓冲器)来处理供NN/DNN计算环境使用的数据的配置。

在说明性实现中，将由NN/DNN环境处理的数据可以被表示为blob。通常，blob表示存储器中需要迭代的数据。每个blob可以维持由各种维度(例如宽度，高度，通道数，内核数和其他可用维度单位)定义的逻辑映射形状。在示例性操作中，操作控制器可以遍历多维blob(例如，由逻辑数据映射定义)或此类blob的较小N维切片，其中N是维数(例如，对于表示具有宽度、高度和通道数的图像的3D blob-N＝3)(例如，使用一个或多个硬件或虚拟迭代器)。遍历的blob可以利用一个或多个指令被传送到协作的线缓冲器，以管理线缓冲器内遍历的数据的读/写。

说明性地，线缓冲器可以在所遍历的数据上可操作地插入一个或多个移位比特，其可以最小化线缓冲器在其操作期间要执行的数据写入的数目。可以构造线缓冲器以将数据存储在预定义数目的行(row)/线(line)(例如64行，线)中，该行/线可以接收行/线中间的所选择的数据量(例如，可以为线缓冲器的每条线接收32个字节的数据)。线缓冲器可以操作以基于输入数据的特性(例如步幅值，连续性，高度，宽度，内核等)使用一个或多个计算的移位比特来移位输入数据(例如，如果步幅的值为0，那么线缓冲器的线可以具有相同的数据，而如果步幅的值为1，则数据可以被移位1以允许线缓冲器内更有效的读/写操作)。可以为每组输入数据计算出所计算的移位比特，以允许生成到线缓冲器的一个或多个指令，用以从协作存储器或协作组件(例如，迭代器–硬件或虚拟)读取，并插入适当量的所计算的移位一个或多个比特，以及将数据写入线缓冲器。

可操作地，线缓冲器的列(column)可以代表示例性处理周期，其中数据被一个或多个协作处理单元消费(例如，线缓冲器可以支持16列，其代表16个数据周期以供神经元对其进行操作)。线缓冲器还可以维持从协作存储器单元加载的输入数据的两个副本(例如，主副本和阴影副本)。主副本可以用来自NN/DNN环境的其他协作组件(例如，迭代器–硬件和/或虚拟迭代器)的数据来填充，并且其他协作组件可以对其他副本(例如，阴影副本)进行操作(例如，处理单元/神经元可以对阴影副本进行操作，消费阴影副本中的数据)。可操作地，一旦主副本达到其最大存储容量并消费了阴影副本，则可以将主副本数据移至阴影副本，并且NN/DNN协作组件(例如迭代器)可以开始用下一组数据填充主副本。

通常，可以使用线缓冲器以在每个处理周期期间占据神经元的速率向NN/DNN的一个或多个处理单元(例如，处理神经元)提供输入。可以将示例性NN/DNN中的数据存储在逻辑数据映射的行(例如，blob)中。这样，说明性线缓冲器的大小可以取决于神经元的数目、blob的宽度、沿着blob的宽度的步幅以及blob的填充量。

线缓冲器的同时读取和写入可以导致处理低效率，因为当线缓冲器达到其存储容量时，线缓冲器通常可操作地被流水线传输到数据的阴影副本中。可操作地，可以在线缓冲器达到其最大存储容量时创建副本。此外，可以指示协作神经元从阴影副本中读取，从而提高处理效率。

在DNN芯片的示例性架构中，线缓冲器可以被表示为分级存储器。作为分级存储器，它可以操作以在其中加载一个或多个协作神经元(例如，处理单元)可以取回以执行期望的处理的数据。说明性地，可以将一个或多个协作神经元连接到线缓冲器中的一个或多个行，以便克服物理或处理方面的限制。线缓冲器可以可操作地从存储器块加载数据，并将数据从该存储器块写入与一个或多个神经元相关联的一个或多个行。这样的操作可以通过在将数据从存储块传递到线缓冲器中的下一行之前使用计算出的比特数来移位存储块的数据来实现。这样，可操作地，这允许线缓冲器执行从协作存储块的单次读取，以及对线缓冲器中多个位置的多次写入。这种方法使我们大大减少从存储器中读取的次数，并减少写入线缓冲器所需的周期数量。

神经网络背景：

在人工神经网络中，神经元是用于对大脑中的生物神经元建模的基本单位。人工神经元的模型可以包括输入向量的内积，其中将权重向量添加到偏置中并应用了非线性。相比之下，在示例性DNN模块中的神经元(例如，图1的105)被紧密映射到人工神经元。

说明性地，可以将DNN模块视为超标量处理器。可操作地，它可以将一个或多个指令调度到多个执行单元，称为神经元。执行单元可以是“同时调度同时完成”，其中每个执行单元都与所有其他执行单元同步。DNN模块可以分类为SIMD(单指令流，多数据流)架构。

转到图1的示例性DNN环境100，DNN模块105具有存储器子系统，该存储器子系统具有唯一的L1和L2缓存结构。这些不是传统的高速缓存，而是专门为神经处理而设计的。为了方便起见，这些缓存结构已经采用了反映其预期目的的名称。通过示例，L2高速缓存150可以说明性地用以所选择频率(例如每秒十六吉比特(16GBps))操作的高速专用接口来维持所选择的存储容量(例如，一兆字节(1MB))。L1高速缓存可以维持所选择的存储容量(例如，八千字节(8KB))，其可以在内核数据和激活数据之间进行分配。L1高速缓存可以称为线缓冲器，而L2高速缓存可以称为BaSRAM。

DNN模块可以是仅召回的神经网络，并以编程方式支持多种网络结构。可以在服务器场或数据中心中离线进行网络的训练；DNN模块不执行任何训练函数。训练的结果是一组可以称为权重或内核的参数。这些参数表示可以应用于输入的变换函数，其结果是分类或语义标记的输出。

在说明性操作中，DNN模块可以接受平面数据作为输入。输入不仅限于图像数据，只要呈现的数据是统一的平面格式，DNN就可以对其进行操作。

DNN模块在对应于神经网络各层的层描述符列表上进行操作。说明性地，DNN模块可以将层描述符列表视为指令。这些描述符可以从存储器被预取到DNN模块中，并按顺序执行。

通常，层描述符可以有两种主要类别：1)存储器到存储器移动描述符，以及2)操作描述符。存储器到存储器移动描述符可以被用来将数据移至主存储器/从主存储器移至本地高速缓存/从本地高速缓存移出，以供操作描述符消费。存储器到存储器的移动描述符所遵循的执行流水线与操作描述符不同。存储器到存储器移动描述符的目标流水线可以是内部DMA引擎，而操作描述符的目标流水线可以是神经元处理元件。操作描述符能够执行许多不同的层操作。

DNN的输出也是数据的blob。可选地，可以将输出流式传输到本地高速缓存或流式传输到主存储器。DNN模块可以在软件允许的范围内预取数据。软件可以通过使用隔离和设置描述符之间的依赖关系来控制预取。具有依赖关系集合的描述符在满足依赖关系之前被阻止进行。

现在转到图1，示例性神经网络环境100可以包括各种协作组件，包括DNN模块105，高速缓存存储器125或150，低带宽结构110，桥接组件115，高带宽结构120，SOC 130，PCIE“断点”135，Tensilica(泰思立达)节点140，存储器控制器145，LPDDR4存储器155和输入数据源102。此外，如图所示，DNN模块105还可以包括多个组件，包括预取105(A)，DMA 105(B)，寄存器接口105(D)，加载/存储单元105(C)，层控制器105(D)，保存/恢复组件105(E)和神经元105(F)。可操作地，示例性DNN环境100可以根据所选规范来处理数据，其中DNN模块执行此处所述的一个或多个函数。

图2图示了示例性神经网络环境200，其可操作以采用有向线缓冲器220作为数据处理的一部分。如图所示，示例性神经网络环境200(在本文中也称为计算设备或计算设备环境)包括一个或多个操作控制器230，其与线缓冲器220协作以提供一个或多个指令用于数据处理。线缓冲器220可以操作以通过外部结构230和结构215从协作的外部存储器组件225接收数据，以及可以操作以从(多个)迭代器240(例如，基于硬件和/或虚拟化的迭代器)接收一个或多个指令/命令。来自迭代器240的指令/命令可以包括从协作存储器组件读取数据的命令或指令和/或将从协作存储器组件加载的数据写入线缓冲器的指令。可操作地，线缓冲器220可以根据从一个或多个操作控制器235(在本文中也称为“协作控制器组件235”)接收的一个或多个指令，将所计算的一个或多个移位比特插入数据中，并将移位后的数据写入线缓冲器220中。此外，线缓冲器220可以与(多个)处理单元(例如，(多个)神经元)协作以提供写入的经比特移位的数据以用于进一步处理。神经网络环境结构可以是能够传递各种数据的数据总线。有向缓冲器可以被认为是一种能够根据一个或多个所接收到的指令读取和写入数据和/或数据元素的存储器组件。

在说明性操作中，示例性神经网络环境200可以根据图7中描述的过程可操作地处理数据。特定于图2中描述的组件，这些组件仅是说明性的，如本领域的普通技术人员将理解的是，图6和图7中描述的处理将由除图2所图示的组件之外的其他组件执行。

而且，如图2所示，示例性神经网络环境可以可选地包括一个或多个迭代器(例如，基于硬件的和/或虚拟化的迭代器)(如虚线所示)，其可以说明性地操作以迭代输入数据(未示出)以由一个或多个神经元处理器205进行处理。本领域技术人员应当理解，示例性一个或多个迭代器的这种可选包括仅是示例性的，因为本文公开的系统和方法所描述的发明构思在示例性神经网络环境200中可操作而无需任何迭代器。

图3图示了用于示例性输入数据的示例性逻辑数据映射300。如图所示，数据305可以被表示为具有特定维度340的数据(例如，使得整体上可以认为数据维度可以定义数据卷(volume))，维度340包括通道计数310，高度315和宽度320。根据本文描述的系统和方法，可以通过协作n个神经元330来对数据305进行分部和准备以进行处理，以便将第一部分a传送给第一神经元，将第二部分b传送给第二神经元，依此类推，直到将n个部分传送给n个神经元为止。

在说明性操作中，基于由示例性神经网络环境(例如，图2的200)的协作控制器组件提供的一个或多个指令，可以使用n个滑动窗口/内核325来确定数据305的各部分。进一步如图所示，输入数据部分a，b，c和d可以使用示例性神经网络环境(例如，图2的200)的协作操作控制器组件(235)提供的一个或多个初始化参数被寻址到物理存储器325。

图4图示了示例性输入数据(未示出)的示例性逻辑数据映射400。示例性逻辑数据映射400包括第一线410(用对角线标记图示)和第二线420(以虚线示出)。每个地图线可以包括多个滑动窗口(例如，第一线410为430、440和450，第二线420为460、470和480)。另外，如图所示，逻辑数据映射400示出了滑动窗口跨越输入数据的数据维度边界(例如，跨越第一线410和第二线420)的能力。这种能力允许提高性能，因为可以更有效地准备更多数据以用于由协作神经网络处理组件(例如，图2的205)的后续处理。

图5类似于图4，并且被呈现为描述本文描述的系统和方法的能力，以允许使用填充以进一步增强示例性神经网络环境(例如，图1的100和图2的200)的性能特性。如图所示，逻辑数据映射500(未示出的示例性输入数据的逻辑数据映射)可以包括跨过一条或多条线(例如510和520)的各种滑动窗口(530、540、550、560、570和580)。另外，逻辑数据映射500还可以包括填充580。

在示例性操作中，在示例性神经网络环境(图1的100或图2的200)的运行时，可以动态添加填充580。图2的操作控制器230可以指定输入数据(例如，blob)的、要在图3所示的每个维度340上使用的填充量(例如，使得共同采取的维度可以被认为是数据卷)，并且神经网络环境(例如，迭代器控制器指令)可以可操作地构造数据卷，就好像填充物理存在于存储器中一样。还可以通过示例性神经网络环境(例如，迭代器控制器指令)在添加了填充的迭代器输出位置中生成默认值。

图6是示例性线缓冲器数据600的框图。如图6所示，示例性线缓冲器数据600可以包括线缓冲器数据600的限制逻辑映射605。逻辑映射可以包括高度和宽度以及数据元素(605(0)，605(1)，605(2)，605(3)，605(4)，605(5)，605(6)，605(7)，605(8)，605(9)，605(10)，605(11)，605(12)，605(13)，605(14)，605(15)，605(16)，605(17)，605(18)，605(19)，605(20)，605(21)，605(22)，605(23)，605(24)，605(25)，605(26)等)。可以在逻辑映射中将示例性数据元素存储在行610、615和620中，并且可以使用n个滑动窗口对其进行迭代。线缓冲器数据600也可以被表示为具有连续数据块的未拆开的(unraveled)逻辑映射625，该连续数据块具有单独的数据段630和635。各个数据段可表示跨线缓冲器的一个或多个行/线存储的数据量。此外，如图6所示，每个未拆开的数据段630和635可以包括一个或多个滑动窗口(例如2x2)640，其可以导致附加的所需线缓冲器写入操作，而该写入操作直接影响示例性神经网络环境的整体性能。滑动窗口640可以通过执行一个或多个比特移位操作来解决这些不希望的结果。在说明性实现中，线缓冲器数据600可以包括从协作数据存储库和/或协作迭代器组件取回的数据。

此外，如图6所示，示例性线数据600可以物理地被存储在说明性线缓冲器存储块680中。示例性线缓冲器存储块680可以包括多个存储位置(例如680(0)，680(1)，680(2)，680(3)，680(4)，680(5)，680(6)，680(7)，680(8)，680(9)，680(10)，680(11)，680(12)，680(13)，680(14)，680(15)等)。如图6所示，根据一个或多个数据移位操作，示例性线缓冲器存储器块680可以可操作地用于存储有向线缓冲器数据(例如，根据一个或多个接收的指令由示例性数据操纵的数据)。

在说明性实现中，并且如图6所示，可以根据单个移位操作685将示例性线缓冲器数据600存储为数据卷积过程的一部分。在单个移位操作中，可以将计算出的一个或多个移位比特650插入线缓冲器存储器块位置八(8)和九(9)，以允许拆开线缓冲器数据600，并且可以导致意外写入线缓冲器中的多余数据。要插入的所计算的比特的数目可以根据加载数据的特性而变化。为了消除该附加的线缓冲器写入操作，可以执行双移位操作660。如图所示，在双移位操作中，数据以线缓冲器数据的元素的周期数目(例如，每9个元素)移位了所计算的比特量(例如，所计算的比特的数目可以根据加载数据的特性而变化)，该周期数目允许对数据进行连续的单次写入(例如，排除任何多余的数据)。

图7是说明性过程700的流程图，该说明性过程700利用有向线缓冲器来最小化NN/DNN环境中的存储器读取。如图所示，处理开始于框705，其中一个或多个初始化参数从神经网络环境的协作组件(例如，操作控制器)被接收，在神经网络环境中，该一个或多个初始化参数可以包括代表针对输入数据的维度的数据以及代表输入数据的行之间的数据块的所计算的非连续性的数据。然后，处理进行到框710，其中用以移位所取回的数据的比特数目可以使用该一个或多个初始化参数来计算，以生成一个或多个有向线缓冲器写入指令。

处理进行到框715，其中可以从神经网络环境的协作存储器存储库和/或协作迭代器组件中取回数据。然后在框720，将数据写入与一个或多个处理单元相关联的线缓冲器的一个或多个行。可以根据所生成的有向线缓冲器写入指令(LBWI)写入数据。LBWI可以包括一个或多个指令，以将数据写入线缓冲器中，该数据根据框705的所接收到的初始化参数被移位一个或多个所计算的位，其导致将输入数据单次写入线缓冲器中。在说明性实现中，可以基于输入数据的维度来计算并插入一个以上移位比特。可操作地，可以首先为数据(例如，连续数据)插入(多个)第一移位比特，然后可以为该数据插入其他(多个)移位比特(例如，以处理不连续数据)，从而使得最少量的数据写入到线缓冲器。说明性地，这种操作可以被认为是双移位操作，其中，通过示例，对于连续数据集，数据可以被移位一个比特，然后在数据中出现的不连续性的每个实例处被移位两个比特。

然后，处理进行到框725，其中将经比特移位的数据传送到一个或多个处理单元(例如，(多个)神经元)以用于后续数据处理。然后，经处理的数据可以充当神经网络环境和/或协作计算环境的一个或多个协作组件的输入。可以显示此类输出以供参与用户进行交互。

说明性地，如图3所描绘的，示例性逻辑数据映射协议可以将二维平面文件类型数据可操作地呈现为多维特征数据，使得可以将输入数据可视化地表示为具有特定高度，宽度，深度(例如，通道数)，深度切片(例如，内核数)的blob。该逻辑数据映射允许使用滑动窗口来关联输入数据的一个或多个数据元素以用于迭代操作。说明性地，滑动窗口可以跨越两条逻辑映射的输入数据宽度线。

然后在框735，执行检查以确定是否存在要处理的附加输入数据(即，作为迭代操作的一部分)。如果没有附加输入数据，则处理在框740处终止。然而，如果附加输入数据需要迭代操作，则处理然后返回到框705并从那里进行。

图8所图示的计算机架构800包括中央处理单元802(“CPU”)，系统存储器804(包括随机存取存储器806(“RAM”)和只读存储器(“ROM”)808)，以及将存储器804耦合到CPU 802的系统总线810。一个包含有助于在计算机架构800内的元件之间传输信息的基本例程的基本输入/输出系统(诸如在启动期间)被存储在ROM 808中。计算机架构800还包括大容量存储设备812，用于存储操作系统814，其他数据以及一个或多个应用程序。

大容量存储设备812通过连接到总线810的大容量存储控制器(未示出)被连接到CPU 802。大容量存储设备812及其关联的计算机可读介质为计算机架构800提供了非易失性存储装置。尽管此处包含的计算机可读介质的描述是指大容量存储设备，诸如固态驱动器、硬盘或CD-ROM驱动器，但本领域技术人员应该理解，计算机可读介质可以是计算机架构800可以访问的任何可用的计算机存储介质或通信介质。

通信介质包括计算机可读指令、数据结构、程序模块或经调制的数据信号(诸如载波或其他运输机制)中的其他数据，并且包括任何递送介质。术语“经调制的数据信号”是指具有以将信息编码在信号中的方式来改变或设置其一个或多个特性的信号。通过示例而非限制，通信介质包括诸如有线网络或直接有线连接之类的有线介质，以及诸如声学，RF，红外和其他无线介质之类的无线介质。以上任何内容的组合也应被包括在计算机可读介质的范围内。

通过示例而非限制，计算机存储介质可以包括以用于存储信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质，诸如计算机可读指令，数据结构，程序模块或其他数据。例如，计算机介质包括但不限于RAM，ROM，EPROM，EEPROM，闪存或其他固态存储器技术，CD-ROM，数字多功能磁盘(“DVD”)，HD-DVD，BLU-RAY或其他光学存储装置，磁带盒，磁带，磁盘存储装置或其他磁性存储设备，或任何其他可以用于存储期望信息并且可以由计算机架构800可访问的介质。出于权利要求的目的，短语“计算机存储介质”，“计算机可读存储介质”及其变体本身不包括波、信号和/或其他瞬态和/或无形的通信介质。

根据各种技术，计算机架构800可以通过网络820和/或另一网络(未示出)，使用到远程计算机805的逻辑连接在联网环境中操作。计算机架构800可以通过连接到总线810的网络接口单元816连接到网络820。应当理解，网络接口单元816也可以用于连接到其他类型的网络和远程计算机系统。计算机架构800还可以包括输入/输出控制器818，用于接收和处理来自多个其他设备的输入，其他设备包括键盘，鼠标或电子触笔(图8中未示出)。类似地，输入/输出控制器818可以将输出提供给显示屏，打印机或其他类型的输出设备(也在图8中未示出)。还应当理解，经由通过网络接口单元816到网络820的连接，计算架构可以使DNN模块105能够与计算环境100通信。

应当理解，本文描述的软件组件可以在被加载到CPU 802和/或DNN模块105中并被执行时，将CPU 802和/或DNN模块105以及整个计算机架构800从通用计算系统变换为专用计算系统，该专用计算系统被定制以便于此处呈现的功能性。CPU 802和/或DNN模块105可以由任何数目的晶体管或其他分立电路元件和/或芯片组构成，其可以单独或共同地呈现任何数目的状态。更具体地，响应于本文所公开的软件模块内包含的可执行指令，CPU 802和/或DNN模块105可以作为有限状态机操作。这些计算机可执行指令可以通过指定CPU 802如何在状态之间转变来对CPU 802进行变换，从而对构成CPU 802的晶体管或其他分立的硬件元素进行变换。

对本文呈现的软件模块进行编码也可以变换本文呈现的计算机可读介质的物理结构。在本说明书的不同实现中，物理结构的特定变换可以取决于各种因素。这样的因素的示例可以包括但不限于：用于实现计算机可读介质的技术，计算机可读介质被表征为主存储装置还是辅助存储装置等。例如，如果计算机可读介质被实现为基于半导体的存储器，则本文中公开的软件可以通过变换半导体存储器的物理状态而被编码在计算机可读介质上。例如，软件可以变换构成半导体存储器的晶体管、电容器或其他分立电路元件的状态。该软件还可以变换这些组件的物理状态，以便在其上存储数据。

作为另一示例，可以使用磁性或光学技术来实现本文所公开的计算机可读介质。在这样的实现中，当本文呈现的软件在磁性或光学介质中被编码时，该软件可以变换磁性或光学介质的物理状态。这些变换可以包括更改给定磁性介质内特定位置的磁性特性。这些变换还可以包括更改给定光学介质内特定位置的物理特征或特性，以改变那些位置的光学特性。在不脱离本说明书的范围和精神的情况下，物理介质的其他变换是可能的，其中提供前述示例仅是为了便于该讨论。

鉴于以上内容，应当理解，在计算机架构800中发生了许多类型的物理变换，以便存储和执行本文呈现的软件组件。还应当理解，计算机架构800可以包括其他类型的计算设备，包括手持式计算机，嵌入式计算机系统，个人数字助理以及本领域技术人员已知的其他类型的计算设备。还预期计算机架构800可以不包括图8所示的所有组件，可以包括未在图8中明确示出的其他组件，或者可以利用与图8中示出的架构完全不同的架构。

如上所述的计算系统800可以被部署为计算机网络的一部分。通常，以上对计算环境的描述适用于部署在网络环境中的服务器计算机和客户端计算机两者。

图9图示了示例性说明性的联网计算环境900，其中服务器经由通信网络与客户端计算机进行通信，其中可以采用本文所述的装置和方法。如图9所示，(多个)服务器905可以经由通信网络820(其可以是固定有线或无线LAN，WAN，内联网，外联网，对等网络，虚拟专用网，互联网，蓝牙通信网络，专有低电压通信网络，或其他通讯网络中的任一者或者是其组合)与多个客户端计算环境互连，客户端计算环境诸如平板个人计算机910，移动电话915，电话920，(多个)个人计算机801，个人数字助理925，智能电话手表/个人目标跟踪器(例如Apple手表，三星，FitBit等)930，以及智能电话935。例如，在通信网络820是互联网的网络环境中，(多个)服务器905可以是专用计算环境服务器，该服务器可操作以经由多种已知协议中的任何一种来处理和传送去往和来自客户端计算环境801、910、915、920、925、930、935的数据，已知协议诸如超文本传输协议(HTTP)，文件传输协议(FTP)，简单对象访问协议(SOAP)或无线应用协议(WAP)。另外，联网计算环境900可以利用各种数据安全协议，诸如安全套接字层(SSL)或非常好的保密性(PGP)。每个客户端计算环境801、810、815、820、825、830和835可以配备有操作系统814，其可操作以支持一个或多个计算应用或终端会话，诸如web浏览器(未示出)，其他图形用户界面(未示出)或移动桌面环境(未示出)，以访问(多个)服务器计算环境905。

(多个)服务器905可以被通信地耦合到其他计算环境(未示出)，并且接收关于参与用户的交互/资源网络的数据。在说明性操作中，用户(未示出)可以与在(多个)客户端计算环境上运行的计算应用交互，以获得期望的数据和/或计算应用。数据和/或计算应用可以被存储在(多个)服务器计算环境905上，并通过示例性通信网络820上的客户端计算环境901、910、915、920、925、930和935被传送到协作用户。参与用户(未示出)可以请求访问全部或部分容纳在(多个)服务器计算环境905上的特定数据和应用。这些数据可以在客户端计算环境801、910、915、920、925、930、935与(多个)服务器计算环境905之间被传送以用于处理和存储。(多个)服务器计算环境905可以托管用于数据和应用的生成、认证、加密以及通信的计算应用、过程和小应用，并且可以与其他服务器计算环境(未示出)、第三方服务提供者(未示出)、网络附加存储装置(NAS)和存储区域网络(SAN)协作以实现应用/数据事务。

示例条款

可以根据以下条款考虑本文呈现的公开内容。

示例条款A，一种用于在神经网络环境中使用一个或多个虚拟化硬件迭代器进行增强的数据处理的系统，该系统包括：至少一个处理器，至少一个线缓冲器，其可操作以执行读取和/或写入数据，以及与至少一个处理器通信的至少一个存储器，该至少一个存储器具有存储在其上的计算机可读指令，该计算机可读指令在由至少一个处理器执行时使至少一个处理器：从神经网络环境的协作控制器组件接收一个或多个初始化参数，该初始化参数包括代表要由神经网络环境处理的数据的维度的数据和代表数据的一个或多个行之间的一个或多个数据元素的一个或多个不连续性的数据，从神经网络环境的协作存储器组件加载数据，根据初始化参数计算代表比特数，以移位数据的一个或多个数据元素，根据一个或多个初始化参数，从神经网络环境的协作控制器组件接收一个或多个指令，以将一个或多个移位比特插入到经加载的数据中，以生成有向线缓冲器数据，并且将有向线缓冲器数据写入线缓冲器，并将线缓冲器中的被写入的数据传送到神经网络环境中的一个或多个处理组件以用于处理。

示例条款B，示例条款A的系统，其中一个或多个移位比特的插入导致在至少一个线缓冲器中对有向线缓冲器数据的单次写入。

示例性条款C，示例性条款A和B的系统，其中计算机可读指令还使至少一个处理器将由协作迭代器遍历的数据传送到线缓冲器。

示例条款D，示例条款A到C的系统，其中计算机可读指令还使至少一个处理器利用一个或多个滑动窗口遍历数据，窗口可操作以选择数据卷的一个或多个数据元素作为被传送到一个或多个处理组件的一个或多个部分。

示例性条款E，示例性条款A至D的系统，其中计算机可读指令还使至少一个处理器使用跨越经加载的数据的数据维度边界的一个或多个滑动窗口来遍历经加载的数据。

示例条款F，示例性条款A至E的系统，其中计算机可读指令还使至少一个处理器将一个或多个数据填充插入到经加载的数据。

示例条款G，示例性条款A至F的系统，其中计算机可读指令还使线缓冲器中的被写入的数据的副本用于由神经网络环境的一个或多个处理组件处理。

示例条款H，一种计算机实现的方法，包括：从神经网络环境的协作控制器组件接收一个或多个初始化参数，该初始化参数包括代表要由神经网络环境处理的数据的维度的数据和代表数据的一个或多个行之间的一个或多个数据元素的一个或多个不连续性的数据，从神经网络环境的协作存储器组件加载数据，由神经网络环境的协作迭代器组件根据所选择的迭代操作迭代经加载的数据，根据初始化参数计算代表比特数的移位比特，以移位数据的一个或多个数据元素，根据一个或多个初始化参数，从神经网络环境的协作控制器组件接收一个或多个指令，以将一个或多个移位比特插入到经加载的数据中，以生成有向线缓冲器数据，并且将有向线缓冲器数据写入线缓冲器中，以及将线缓冲器中的被写入的数据传送到神经网络环境的一个或多个处理组件以用于处理。

示例条款I，示例条款H的计算机实现方法，其中经加载的数据的一个或多个部分是不相等的部分。

示例条款J，示例条款H和I的计算机实现方法，其中滑动窗口可操作以跨越数据的数据维度边界。

示例条款K，示例条款H至J的计算机实现方法，还包括：将填充子卷插入到经加载的数据中，经加载的数据由从协作控制器组件接收到的一个或多个指令以及由所接收的一个或多个初始化参数定义。

示例条款L，示例条款H至K的计算机实现的方法，还包括：生成被写入的有向线缓冲器数据的副本。

示例条款M，示例条款H至K的计算机实现的方法，还包括：由神经网络环境的一个或多个协作处理单元处理被写入的有向线缓冲数据的经生成的副本。

示例条款N，示例条款H至M的计算机实现的方法，还包括：清除被写入的有向线缓冲器数据的线缓冲器，以接收附加有向线缓冲器数据以用于写入线缓冲器中。

示例条款O，示例条款H至N的计算机实现的方法，还包括：将有向线缓冲器数据写入线缓冲器中所选择数目的行中，其中线缓冲器的每条线与神经网络环境的协作处理单元相关联。

示例条款P，一种存储有计算机可执行指令的计算机可读存储介质，计算机可执行指令在由计算设备的一个或多个处理器执行时使该计算设备的一个或多个处理器：从神经网络环境的协作控制器组件接收一个或多个初始化参数，该初始化参数包括代表要由神经网络环境处理的数据维度的数据和代表数据的一个或多个行的一个或多个数据元素之间的一个或多个不连续性的数据，从神经网络环境的协作存储器组件加载数据，由神经网络环境的协作迭代器组件根据所选择的迭代操作迭代经加载的数据，根据初始化参数计算代表比特数的移位比特，以移位数据的一个或多个数据元素，从神经网络环境的协作控制器组件接收一个或多个指令，以将一个或多个移位比特插入到经加载的数据中，以生成有向线缓冲器数据，并且将有向线缓冲器数据写入在线缓冲器的一条或多条线中，其中线缓冲器的一条或多条线与神经网络环境的一个或多个处理组件相关联，以及将线缓冲器的一条或多条线中的被写入的数据传送到神经网络环境的一个或多个处理组件以用于处理，该一个或多个处理组件与线缓冲器的一条或多条线相关联。

示例条款Q，示例条款P的计算机可读存储介质，其中指令还使计算设备的一个或多个处理器将附加数据卷插入经加载的数据。

示例条款R，示例条款P和Q的计算机可读存储介质，其中指令还使计算设备的一个或多个处理器从代表所计算的移位比特的初始化参数中取回步幅值。

示例条款S，示例条款P至R的计算机可读存储介质，其中指令还使计算设备的一个或多个处理器根据所选择的处理周期数来处理被写入的有向线缓冲器数据，其中所选择的处理周期数基于线缓冲器列的数目。

示例条款T，示例条款P至S的计算机可读存储介质，其中指令还使计算设备的一个或多个处理器利用经加载的数据的逻辑数据映射来遍历经加载的数据，遍历经加载的数据包括将一个或多个滑动窗口应用于逻辑数据映射以将经加载的数据的部分与一个或多个物理存储器地址相关联。

示例条款U，示例条款P至T的计算机可读介质，其中存储器组件与物理传感器协作，该物理传感器能够产生包括音频数据、视频数据、触觉感觉数据和其他数据的输入数据，以用于由一个或多个协作处理单元进行后续处理。

示例条款V，示例条款P至U的计算机可读介质，其中协作处理单元与一个或多个输出物理组件电子地协作，该一个或多个输出物理组件可操作以接收人类交互的经处理的输入数据，输入数据包括音频数据、视频数据、触觉感觉数据和其他数据。

示例条款W，示例条款P至V的计算机可读介质，其中计算连续的针对经加载的数据的连续的第一移位比特值和针对经加载的数据的不连续的另一移位比特值。

示例条款X，示例条款P至W的计算机可读介质，还包括：首先根据所计算的第一移位比特值来移位经加载的数据，然后根据另一移位比特值来移位经加载的数据。

结论

总之，尽管已经以特定于结构特征和/或方法动作的语言描述了各种技术，但是应当理解，所附表示中限定的主题内容不必限于所描述的特定特征或动作。而是，特定特征和动作被公开为实现所要求保护的主题内容的示例形式。

Claims

1.一种用于在神经网络环境中使用一个或多个虚拟化硬件迭代器进行增强的数据处理的系统，所述系统包括：

至少一个处理器；

至少一个线缓冲器，所述至少一个线缓冲器可操作以读取和/或写入数据；以及

与所述至少一个处理器通信的至少一个存储器，所述至少一个存储器具有存储在其上的计算机可读指令，所述计算机可读指令在由所述至少一个处理器执行时使所述至少一个处理器：

从所述神经网络环境的协作控制器组件接收一个或多个初始化参数，所述初始化参数指示要由所述神经网络环境处理的所述数据的维度和代表所述数据的一个或多个行之间的一个或多个数据元素的一个或多个不连续性的数据；

从所述神经网络环境的协作存储器组件加载要由所述神经网络环境处理的所述数据；

根据所述初始化参数计算代表比特数的移位比特，以移位所述数据的所述一个或多个数据元素，以使能所述数据的连续的单次写入；

向经加载的所述数据插入一个或多个数据填充；

根据所述一个或多个初始化参数，从所述神经网络环境的所述协作控制器组件接收一个或多个指令，以将一个或多个移位比特插入到经加载的数据中，以生成有向线缓冲器数据，并且将所述有向线缓冲器数据写入所述至少一个线缓冲器中，其中对于连续数据，数据移位一比特，并且在所述数据中出现的所述不连续性的每个不连续性处，数据移位两比特以允许拆开数据并且消除至少一个线缓冲器中的多余数据写入；以及

将填充子卷插入到由接收到的一个或多个指令和由所述初始化参数定义的经加载的所述数据中；以及

将所述至少一个线缓冲器中的被写入的所述有向线缓冲数据传送到所述神经网络环境的至少一个处理器以用于处理，其中要移位的比特数是根据所述线缓冲器数据的元素的周期数目计算的，所述周期数目允许所述数据的连续的单次写入数据。

2.根据权利要求1所述的系统，其中所述一个或多个移位比特的所述插入导致在所述至少一个线缓冲器中对所述有向线缓冲器数据的单次写入。

3.根据权利要求1所述的系统，其中所述计算机可读指令还使所述至少一个处理器将由协作迭代器遍历的数据传送到所述线缓冲器。

4.根据权利要求3所述的系统，其中所述计算机可读指令还使所述至少一个处理器利用一个或多个滑动窗口来遍历所述数据，所述窗口可操作以选择所述数据元素的一个或多个数据元素。

5.根据权利要求4所述的系统，其中所述计算机可读指令还使所述至少一个处理器使用跨越所述经加载的数据的数据维度边界的一个或多个滑动窗口来遍历所述经加载的数据。

6.根据权利要求1所述的系统，其中所述计算机可读指令还使所述至少一个处理器将一个或多个数据填充插入到所述经加载的数据。

7.根据权利要求1所述的系统，其中所述计算机可读指令还使所述至少一个线缓冲器中的被写入的所述有向线缓存器数据的副本被所述神经网络环境的所述一个或多个虚拟化硬件迭代器创建和访问。

8.一种计算机实现的方法，包括：

从神经网络环境的协作控制器组件接收一个或多个初始化参数，所述初始化参数指示要由所述神经网络环境处理的数据的维度和代表所述数据的一个或多个行之间的一个或多个数据元素的一个或多个不连续性的数据；

由所述神经网络环境的协作迭代器组件根据所选择的迭代操作迭代经加载的数据；

向经加载的所述数据插入一个或多个数据填充；

根据所述一个或多个初始化参数，从所述神经网络环境的所述协作控制器组件接收一个或多个指令，以将所述移位比特中的一个或多个移位比特插入到所述经加载的数据中，以生成有向线缓冲器数据，并且将所述有向线缓冲器数据写入线缓冲器中，其中对于连续数据，数据移位一比特，并且在所述数据中出现的所述不连续性的每个不连续性处，数据移位两比特以允许拆开数据并且消除至少一个线缓冲器中的多余数据写入；以及

将所述线缓冲器中的被写入的所述有向线缓冲数据传送到所述神经网络环境的一个或多个处理组件以用于处理，其中要移位的比特数是根据所述线缓冲器数据的元素的周期数目计算的，所述周期数目允许所述数据的连续的单次写入数据。

9.根据权利要求8所述的计算机实现的方法，其中所述一个或多个移位比特的插入导致在所述至少一个线缓冲器中对所述有向线缓冲器数据的单次写入。

10.根据权利要求8所述的计算机实现的方法，还包括利用一个或多个滑动窗口来遍历所述数据，其中滑动窗口可操作以跨越所述数据的数据维度边界。

11.根据权利要求8所述的计算机实现的方法，还包括：

将填充子卷插入到所述经加载的数据中，所述经加载的数据由从所述协作控制器组件接收到的所述一个或多个指令以及所接收的所述一个或多个初始化参数来定义。

12.根据权利要求8所述的计算机实现的方法，还包括：

生成被写入的有向线缓冲器数据的副本。

13.根据权利要求12所述的计算机实现的方法，还包括：

由所述神经网络环境的一个或多个协作处理单元处理被写入的所述有向线缓冲器数据的经生成的所述副本。

14.根据权利要求8所述的计算机实现的方法，还包括：

清除被写入的所述有向线缓冲器数据的所述线缓冲器，以接收附加的有向线缓冲器数据以用于写入所述线缓冲器中。

15.根据权利要求8所述的计算机实现的方法，还包括：将所述有向线缓冲器数据写入所述线缓冲器中的所选择数目的线中，其中所述线缓冲器的每条线与所述神经网络环境的协作处理单元相关联。

16.一种计算机可读存储介质，其上存储有计算机可执行指令，所述计算机可执行指令在由计算设备的一个或多个处理器执行时使得所述计算设备的所述一个或多个处理器：

向经加载的所述数据插入一个或多个数据填充；

从所述神经网络环境的所述协作控制器组件接收一个或多个指令，以将所述移位比特中的一个或多个移位比特插入到所述经加载的数据中，以生成有向线缓冲器数据，并且将所述有向线缓冲器数据写入线缓冲器中的一条或多条线，其中所述线缓冲器的一条或多条线与所述神经网络环境的一个或多个处理组件相关联，其中对于连续数据，数据移位一比特，并且在所述数据中出现的所述不连续性的每个不连续性处，数据移位两比特以允许拆开数据并且消除至少一个线缓冲器中的多余数据写入；以及

将所述线缓冲器的所述一条或多条线中的被写入的所述有向线缓冲数据传送到所述神经网络环境的一个或多个处理组件以用于处理，所述一个或多个处理组件与所述线缓冲器的所述一条或多条线相关联，其中要移位的比特数是根据所述线缓冲器数据的元素的周期数目计算的，所述周期数目允许所述数据的连续的单次写入数据。

17.根据权利要求16所述的计算机可读存储介质，其中所述指令还使所述计算设备的所述一个或多个处理器：

将附加数据卷插入所述经加载的数据。

18.根据权利要求17所述的计算机可读存储介质，其中所述指令还使所述计算设备的所述一个或多个处理器：

从代表所计算的所述移位比特的所述初始化参数中取回步幅值。

19.根据权利要求16所述的计算机可读存储介质，其中所述指令还使所述计算设备的所述一个或多个处理器：

根据所选择的处理周期数来处理被写入的所述有向线缓冲器数据，其中所述所选择的处理周期数基于线缓冲器列的数目。

20.根据权利要求16所述的计算机可读存储介质，其中所述指令还使所述计算设备的所述一个或多个处理器：

利用所述经加载的数据的逻辑数据映射来遍历所述经加载的数据，所述经加载的数据的所述遍历包括将一个或多个滑动窗口应用于所述逻辑数据映射以将所述经加载的数据的部分与一个或多个物理存储器地址相关联。

21.根据权利要求16所述的计算机可读存储介质，其中所述存储器组件与物理传感器协作，所述物理传感器能够产生包括音频数据、视频数据、触觉感觉数据和其他数据的输入数据，以用于后续处理。

22.根据权利要求21所述的计算机可读存储介质，其中所述处理组件与一个或多个输出物理组件电子地协作，所述一个或多个输出物理组件可操作以接收用于人类交互的经处理的输入数据，所述经处理的输入数据包括音频数据、视频数据、触觉感觉数据和其他数据。

23.根据权利要求16所述的计算机可读存储介质，还包括计算针对所述经加载的数据的连续的第一移位比特值和针对所述经加载的数据的不连续的另一移位比特值。

24.根据权利要求23所述的计算机可读存储介质，还包括：首先根据所计算的第一移位比特值来移位所述经加载的数据，然后根据另一移位比特值来移位所述经加载的数据。