CN116670688A - 一种数据处理的方法以及相关设备 - Google Patents
一种数据处理的方法以及相关设备 Download PDFInfo
- Publication number
- CN116670688A CN116670688A CN202080107278.2A CN202080107278A CN116670688A CN 116670688 A CN116670688 A CN 116670688A CN 202080107278 A CN202080107278 A CN 202080107278A CN 116670688 A CN116670688 A CN 116670688A
- Authority
- CN
- China
- Prior art keywords
- value
- target
- feature
- data
- arrangement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- General Factory Administration (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Feedback Control In General (AREA)
Abstract
一种数据处理的方法以及相关设备,涉及人工智能领域,用于填补了在秩未知或者秩已知但至少一个维度的维度值未知的情况下,无法确定出目标数据的目标排布特征的空白。该方法包括:获取至少一个输入信息,每个输入信息均用于表征目标数据的排布特征,排布特征包括第一特征,第一特征的取值为第一值或第一特征的取值为第二值,第一值用于表示未知目标数据的秩,第二值用于表示已知目标数据的秩且未知至少一个维度对应的维度值;获取目标算子对应的约束条件;基于约束条件对至少一个输入信息进行处理,得到至少一个输出信息,每个输出信息均用于表征目标数据的目标排布特征,目标排布特征的取值包括第一特征的目标值。
Description
本申请涉及通信技术领域,具体涉及一种数据处理的方法以及相关设备。
人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,AI基础理论等。随着AI的快速发展以及深度学习应用进一步的拓展,不仅要实现一些定制化的算子,而且还需要一套用于实现算子的输出数据的形状的推导方法,以便于在图像编译或者运行图像的过程中该推导方法能够被调用。
而在相关技术中,仅仅通过-1表示未知的维度值,并且使用最大值与最小值来表示该维度值的范围,以用来完成输出数据的形态的推导。但是,在一个神经网络(neural network,NN)的模型中,经常会出现输入数据的维度值和秩值都存在未知的情况,因此,对如何更好地推导出输出数据的形状提出了新的挑战。
发明内容
本申请实施例提供了一种数据处理的方法以及相关设备,旨在填补在秩未知或者秩已知但至少一个维度的维度值未知的情况下,无法确定出目标数据的目标排布特征的空白。
本申请实施例的第一方面提供一种数据处理的方法,该方法可以包括:获取至少一个输入信息,其中,每个输入信息均用于表征目标数据的排布特征,排布特征包括第一特征,第一特征的取值为第一值或第一特征的取值为第二值,第一值用于表示未知目标数据的秩,第二值用于表示已知目标数据的秩且未知至少一个维度对应的维度值;获取目标算子对应的约束条件,约束条件用于表征目标算子的执行逻辑;基于约束条件对至少一个输入信息进行处理,得到至少一个输出信息,每个输出信息均用于表征目标数据的目标排布特征,目标排布特征的取值包括第一特征的目标值。通过上述方式,在排布特征中第一特征的取值反映出未知目标数据的秩或者已知目标数据的值但未知至少一个维度对应的维度值的情况下,通过目标算子的约束条件对至少一个输入信息进行处理,使得得到的至少一个输出信息均能够反映出目标数据的目标排布特征,填补了在秩未知或者秩已知但至少一个维度的维度值未知的情况下,无法确定出目标数据的目标排布特征的空白。
在一些实施例中,排布特征还包括第二特征和第三特征,第二特征的取值为第三值,第三值用于表示秩的范围,第三特征的取值为第四值或第三特征的取值为第五值,第四值用于表示第一特征的取值为第一值时,目标数据的维度总范围,第五值用于表示第一特征的取值为第二值时,每一个维度对应的维度范围;基于约束条件对至少一个输入信息,得 到至少一个输出信息,包括:基于约束条件对至少一个输入信息中第二特征的取值进行处理,得到第一目标值,第一目标值用于反映目标数据中秩的目标范围;基于约束条件对至少一个输入信息中第一特征的取值、以及第一目标值进行处理,得到第二目标值,第二目标值用于反映秩的目标值;基于约束条件对至少一个输入信息中第三特征的取值、以及第二目标值进行处理,得到第三目标值,第三目标值用于反映目标数据的目标维度范围;基于第一目标值、第二目标值以及第三目标值得到至少一个输出信息。
在一些实施例中,基于约束条件对至少一个输入信息进行处理,得到至少一个输出信息之后,该方法还可以包括:基于第一目标值和第三目标值确定对应的输出信息的预分配内存范围。通过上述方式,能够在图像编译期基于第一目标值与第三目标值提前预分配出所需要的内存范围,相较于在图像运行时期基于已知的秩和维度范围再确定内存范围,能够在运行前更好地优化内存的分配,以便于合理分配内存,减少不必要的内存浪费。
在一些实施例中,该方法还可以包括:基于第一目标值选取目标模板,目标模板用于优化目标算子。通过上述方式,能够从数据库中选择相与第一目标值相匹配的目标模板,剔除不匹配的模板,以便于能够基目标模板对目标算子进行优化和编译优化,以减少目标算子的处理分支,从而选择合适的执行算法,以提高目标算子的编译和执行性能。
在另一些实施例中,该方法还可以包括:基于至少一个输出信息中的任意一个输出信息得到目标数据的目标排布特征,其中,目标排布特征包括第一特征、第二特征以及第三特征,目标排布特征中第一特征的取值为第二目标值,目标排布特征中第二特征的取值为第一目标值,目标排布特征中第三特征的取值为第三目标值。
在另一些实施例中,第一值为符号或用于表示秩未知的数值。
本申请实施例第二方面提供了一种数据处理设备,该数据处理设备可以包括:编程接口模块,用于获取至少一个输入信息,其中,每个输入信息均用于表征目标数据的排布特征,排布特征包括第一特征,第一特征的取值为第一值或第一特征的取值为第二值,第一值用于表示未知目标数据的秩,第二值用于表示已知目标数据的秩且未知至少一个维度对应的维度值;编程接口模块,用于获取目标算子对应的约束条件,约束条件用于表征目标算子的执行逻辑;处理模块,用于基于约束条件对至少一个输入信息进行处理,得到至少一个输出信息,每个输出信息均用于表征目标数据的目标排布特征,目标排布特征的取值包括第一特征的目标值。
在一些实施例中,排布特征还包括第二特征和第三特征,第二特征的取值为第三值,第三值用于表示秩的范围,第三特征的取值为第四值或第三特征的取值为第五值,第四值用于表示第一特征的取值为第一值时,目标数据的维度总范围,第五值用于表示第一特征的取值为第二值时,每一个维度对应的维度范围;处理模块,具体用于:根据约束条件对至少一个输入信息中第二特征的取值进行处理,得到第一目标值,第一目标值用于反映目标数据中秩的目标范围;根据约束条件对至少一个输入信息中第一特征的取值、以及第一目标值进行处理,得到第二目标值,第二目标值用于反映秩的目标值;根据约束条件对至少一个输入信息中第三特征的取值、以及第二目标值进行处理,得到第三目标值,第三目标值用于范围目标数据的目标维度范围;根据第一目标值、第二目标值以及第三目标值得 到至少一个输出信息。
在另一些实施例中,处理模块,还具体用于在基于约束条件对至少一个信息进行处理,得到至少一个输出信息之后,基于第一目标值和第三目标值确定对应输出信息的预分配内存范围。
在另一些实施例中,处理模块,具体用于根据第一目标值选取目标模板,目标模板用于优化目标算子。
在另一些实施例中,处理模块,还具体用于基于至少一个输出信息中的任意一个输出信息得到目标数据的目标排布特征,其中,目标排布特征包括第一特征、第二特征以及第三特征,目标排布特征中第一特征的取值为第二目标值,目标排布特征中第二特征的取值为第一目标值,目标排布特征中第三特征的取值为第三目标值。
在另一些实施例中,第一值为符号或用于表示秩未知的数值。
本申请第三方面提供一种数据处理设备,可以包括:存储器,用于存储计算机可读指令。还可以包括,与存储器耦合的处理器,用于执行存储器中的计算机可读指令从而执行如第一方面或第一方面任意一种可能的实施方式中所描述的方法。
本申请第四方面提供一种计算机可读存储介质,当指令在计算机装置上运行时,使得计算机装置执行如第一方面或第一方面任意一种可能的实施方式中所描述的方法。
本申请第五方面提供一种计算机程序产品,当在计算机上运行时,使得计算机可以执行如第一方面或第一方面任意一种可能的实施方式中所描述的方法。
本申请第六方面提供一种芯片系统,该芯片系统可以包括处理器,用于支持终端设备或服务器实现上述第一方面或第一方面任意一种可能的实施方式中所描述的方法中所涉及的功能。
可选地,结合上述第六方面,在第一种可能的实施方式中,芯片系统还可以包括存储器,存储器,用于保存终端设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。其中,芯片系统可以可以包括专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件等。进一步,芯片系统还可以可以包括接口电路等。
需要说明的是,本申请第二方面至第六方面的实施方式所带来的有益效果可以参照第一方面的实施方式进行理解,此处不做重复赘述。
本申请实施例提供的技术方案中,由于排布特征中第一特征的取值能够反映出未知目标数据的秩或者已知目标数据的值但未知至少一个维度对应的维度值的情况,因此通过目标算子的约束条件对至少一个输入信息进行处理,使得得到的至少一个输出信息均能够反映出目标数据的目标排布特征,填补了在秩未知或者秩已知但至少一个维度的维度值未知的情况下,无法确定出目标数据的目标排布特征的空白。
图1为本申请实施例中提供的一种数据处理的流程图;
图2为本申请实施例提供的一种数据处理的方法的示意图;
图3为本申请实施例中提供的应用于图像的内存分配场景的示意图;
图4为本申请实施例中提供的应用于图像的编译场景的示意图;
图5为本申请实施例提供的数据处理设备的硬件结构示意图;
图6为本申请实施例提供的一种执行设备的结构示意图;
图7为本申请实施例提供的另一种数据处理设备的结构示意图。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。应当理解,本申请的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的,而并不意在限定本申请。
为了能够更好的理解本申请所描述的技术方案,下面对本申请实施例所涉及的关键技术术语进行解释:
由于本申请实施例涉及到了神经网络的应用,为了便于理解,下面先对本申请实施例涉及的相关术语及神经网络等相关概念进行介绍。
(1)神经网络
神经网络可以是由神经单元组成的,神经单元可以是指以x
s和截距1为输入的运算单元,该运算单元的输出可以如下公式所示:
其中,s=1、2、……n,n为大于1的自然数,Ws为xs的权重,b为神经单元的偏置。f为神经单元的激活函数(activation functions),用于将非线性特性引入神经网络中,来将神经单元中的输入信号转换为输出信号。该激活函数的输出信号可以作为下一层卷积层的输入,激活函数可以是sigmoid函数。神经网络是将多个上述单一的神经单元联结在一起形成的网络,即一个神经单元的输出可以是另一个神经单元的输入。每个神经单元的输入可以与前一层的局部接受域相连,来提取局部接受域的特征,局部接受域可以是由若干个神经单元组成的区域。
神经网络有多种类型,例如,深度神经网络(deep neural network,DNN),也称多层神经网络,也就是具有多层隐含层的神经网络;再例如,卷积神经网络(convolutional neuron network,CNN),是带有卷积结构的深度神经网络。本申请不限定涉及的神经网络的具体类型。
(2)算子
算子是指实现某种特定功能的函数。例如,以reshape算子为例,该算子用于对张量数据的形状进行重新诠释。又例如,以transpose算子为例,该算子用于调整张量数据的维度顺序。在本申请中,用于构建深度学习模型算法的常用的函数统称为算子,对任何函数进行某一项操作都可以认为是一个算子。比如卷积是一种积分变换的数学方法,比如是通过两个函数f1和f2生成的函数f3,则可以将f1、f2以及卷积结果f3分别看做一个算 子。
(3)排布特征
排布特征可以理解成用于表征目标数据的排布方式,比如该目标数据可以由几维的像素点组成,以及每一维对应维度值的具体取值或者具体的取值范围等等。上述所描述的排布特征可以包括但不限于目标数据的秩、维度范围、秩范围和/或该目标数据的形状等等特征。
(4)秩
秩可以理解成目标数据的维度数目。例如,目标数据由二维像素点组成,那么该目标数据的秩可以为2。
(5)人工智能处理器
人工智能处理器,也称之为专用处理器,在本申请实施例中,人工智能处理器是指针对特定应用或者领域的处理器。例如:图形处理器(graphics processing unit,GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上进行图像运算工作的专用处理器。又例如:神经网络处理器(neural processing unit,NPU),是一种在人工智能领域的应用中针对矩阵乘法运算的专用处理器,采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。
(6)深度学习框架
为了满足日益增长的神经网络需求,深度学习框架应运而生,通过深度学习框架,研究人员只需要关注深度学习算法网络结构,通过编写简单的python(一种跨平台的计算机程序设计语言)脚本编写网络结构就能完成一个复杂的深度学习网络任务,从而实现在硬件上模型推理和训练。换句话说,深度学习框架用于降低深度学习领域开发门槛,提供深度学习的基础计算框架,用于快速构建深度学习应用。当前业界主流的深度学习框架主要有Tensorflow、Torch、Mxnet、Thenao、Caffe等。以卷积神经网络框架Caffe为例,在实际应用中,Caffe支持多种类型的深度学习架构、面向图像分类和图像分割,还可以支持卷积神经网络(convolutional neural networks,CNN)、用于目标检测的卷积神经网络(region-CNN,RCNN)、长短期记忆神经网络(long short-term memory,LSTM)和全连接神经网络设计。深度学习框架可以支持多种类型的基本算子,具体地,这里所涉及的多种类型的基本算子可以包括:常见的神经网络算子。例如,常见的神经网络算子有:卷积/反卷积算子,池化算子,激活算子、分类器(softmax)算子,全连接算子。其中,激活算子可以包括但不限于ReLU、Sigmoid、Tanh以及其他可以用插值方式实现的算子。
在相关技术中,仅仅通过-1表示未知的维度值,并且使用最大值与最小值来表示该维度值的范围,以用来完成输出数据的形状推导。但是,在一个神经网络(neural network,NN)的模型中,经常会出现数据的维度值和秩值都存在未知的情况,在这种情况下所能够推导出的输出数据的目标排布特征极大可能地不够准确,导致后续优化算子编译等场景,优化效果欠佳。
为了解决上述的问题,本申请实施例中提供了在目标数据的秩处于未知状态的情况, 或者秩已知但存在至少一个维度对应的维度值也处于未知状态的情况下,能够较为准确地推导出目标数据的目标排布特征,使得数据处理设备能够基于目标排布特征在后续图像据编译等场景中,解决在图像优化的过程中可能会因为遍历时间过长导致编译时长不可控的问题,并且提升优化效果。图1示出了本申请实施例中提供的一种数据处理的流程图。从图1可以看出,包括n个输入信息,n为大于等于1的整数,每个输入信息均包括能够表示出输入信息的形状(shape),维度范围(dimensions range),秩(range),以及秩范围(rank range)。通过算子的约束条件对将这n个输入信息进行rank range推导、range推导、shape推导以及dimensions range推导后,得到m个输入信息,m为大于等于1的整数,而每个输出信息中也都包括推导得到的shape、dimensions range、range以及rank range等信息。
需说明的是,上述所描述的数据处理可以应用在图像、语音或者自然语言处理等应用场景中。在实际应用中,还可以应用于视频等场景中,此处不做限定说明。
为了便于更好的理解本申请,请参阅图2,为本申请实施例提供的一种数据处理的方法的示意图,具体如下:
201、获取至少一个输入信息,其中,每个输入信息均用于表征目标数据的排布特征,排布特征包括第一特征,第一特征的取值为第一值或第一特征的取值为第二值,第一值用于表示未知目标数据的秩,第二值用于表示已知目标数据的秩且未知至少一个维度对应的维度值。
实施例中,所描述的目标数据可以包括但不限于图像、语音等数据。
由于每个输入信息都能够表征同一个目标数据的不同排布特征,而不同的排布特征又反映出目标数据的不同形状,例如:在某些输入信息中只给出了目标数据的秩,且该秩的取值为2,此时数据处理设备在接收该输入信息后,能够获知该目标数据为2维数据;又如,在某些信息中给出了目标数据的秩的取值为4,那么数据处理设备应当获知到该目标数据是4维数据。
需要注意的是,排布特征中可以包括第一特征,而该第一特征可以理解成前述所描述的目标数据的秩特征。当某个输入信息中该第一特征的取值为第一值时,就意味着此时并不能直接从该输入信息中获知到目标数据的秩的具体取值,即数据处理设备无法得知该目标数据究竟是几维的数据。应当理解的是,上述所描述的第一值用于表示未知目标数据的秩,该第一值可以取值为-1,或者一个范围,如[1,100]。而在实际应用中,第一值的取值也可以为-2、-3、-4等等无法确定目标数据是几维数据的数值,也可以为#、%、或者&等符号,还可以取其他的范围,如[2,80]等等,此处将不做具体限定。
或者,当某个输入信息中该第一特征的取值为第二值时,而该第二值能够用于表示已知目标数据的秩但未知至少一个维度对应的维度值,也意味着数据处理设备能够从该输入信息中得知目标数据具体是几维的数据,但是针对每一维度对应的维度值,该目标算子却无法获知。
举例来说,某些输入信息中给出了目标数据的其中一种形状(shape),如[-1,80],此时数据处理设备在接收到该输入信息后也能够获知该目标数据的秩为2,即该目标数据是2维数据,并且第二维度对应的维度值为80,而另一个第一维度对应的维度值处于未知状态。 又譬如,若第一特征的取值为[-1,-1],此时数据处理设备能够获知该目标数据的秩为2,但是第一维度与第二维度各自对应的维度值却处于未知状态。
基于此,数据处理设备可以从上一层次的算子中获取至少一个输入信息,例如:从算子1中获取输入信息1,从算子2中获取输入信息2,…从算子n中获取输入信息n(n≥1,且为整数)等等。这样,数据处理设备在得到至少一个输入信息后,便可以根据用户的需求获取目标算子对应的约束条件,以便于基于目标算子的约束条件对至少一个输入信息进行处理。
202、获取目标算子对应的约束条件,约束条件用于表征目标算子的执行逻辑。
也就是理解成,数据处理设备在得到用于表征目标数据的排布特征的至少一个输入信息后,可以基于用户的需求获取目标算子对应的约束条件。
举例来说,若用户想要从前述所描述的至少一个输入信息中得到取交集后的能够更加能够表明目标数据的目标排布特征,那么此时数据处理设备可以确定目标算子为加法(add)算子,并对获取该加法算子对应的约束条件,即数据处理设备需要获知该目标算子的执行逻辑,例如广播、收缩等操作。值得注意的是,本申请实施例中目标算子除了上述所描述的add算子以外,在实际应用中还可以是其他的算子,如:减法算子(sub)、乘法算子(mul)、指数算子(exp)等等。
203、基于约束条件对至少一个输入信息中第二特征的取值进行处理,得到第一目标值,第一目标值用于反映目标数据中秩的目标范围,其中,排布特征还包括第二特征和第三特征,第二特征的取值为第三值,第三值用于表示秩的范围,第三特征的取值为第四值或第三特征的取值为第五值,第四值用于表示第一特征的取值为第一值时,目标数据的维度总范围,第五值用于表示第一特征的取值为第二值时,每一个维度对应的维度范围。
实施例中,由于排布特征还可以包括第二特征和第三特征,所描述的第二特征可以理解成秩范围(rank range)特征,而第三特征可以理解成维度范围(dimension range)特征。应理解的是,第二特征的取值可以为第三值,即利用第三值来表示出目标数据的秩的范围。例如,该第三值可以为[2,7]、[3,8]等范围,此处不做限定说明。
而针对第三特征,该第三特征在前述第一特征的取值为不同的值时,也会有相应不同的取值。具体地,当某个输入信息中第一特征的取值为第一值时,由于第一值能够用于表示未知目标数据的秩,那么也很难从所对应的输入信息中获知每一维度对应的维度值,因此该第三特征的取值可以为第四值,由第四值表示出目标数据的维度总范围。例如,在第一值为-2时,那么第四值可以为[50,200]、[30,150]等表示目标数据的秩未知时的维度总范围,此处不做限定说明。
或者,当某个输入信息中第一特征的取值为第二值时,由于第二值能够用于指示出已知目标数据的秩但未知至少一个维度对应的维度值,此时第三特征的取值可以为第五值,由第五值指示出每一个维度各自对应的维度范围。例如,在第二值为[-1,-1]时,此时第五值可以为[[1,100],[80,100]];又或者在第二值为[-1,80]时,此时第五值可以为[[1,100],[80,80]]等,此处不做限定说明。
这样,数据处理设备便可以基于约束条件对至少一个输入信息中第二特征的取值进行 处理,以得到第一目标值,而该第一目标值能够指示出秩的目标范围。
204、基于约束条件对至少一个输入信息中第一特征的取值、以及第一目标值进行处理,得到第二目标值,第二目标值用于反映秩的目标值。
205、基于约束条件对至少一个输入信息中第三特征的取值、以及第二目标值进行处理,得到第三目标值,第三目标值用于反映目标数据的目标维度范围。
206、基于第一目标值、第二目标值以及第三目标值得到至少一个输出信息。
实施例中,数据处理设备在得到秩的目标范围后,数据处理设备可以进一步地基于约束条件对至少一个输入信息中第一特征的取值以及第一目标值进行处理,以得到第二目标值,由该第二目标值能够表示出秩的目标值然后数据处理设备也基于约束条件对至少一个输入信息中第三特征的取值以及上述的第二目标值确定出第三目标值,由该第三目标值反映出目标数据的目标维度范围。这样,数据处理设备便可以基于第一目标值、第二目标值以及第三目标值得到至少一个输出信息,使得每个输出信息都能够表征出目标数据的目标排布特征。
举例来说,假设以目标数据为图像为例,而且数据处理设备获取到用于表征该图像的排布特征的两个输入信息,分别为:
输入信息1:shape_1:[-1,80],rank_1:2,rank_range_1:[2,2],dimensions range_1:[[1,100],[80,80]];
输入信息2:shape_2:none,rank_2:-2,rank_range_2:[2,7],dimensions range_2:[50,200]。需要说明的是,第一特征的取值为第一值可以理解成输入信息2中的rank_2:-2,而第二值可以理解成输入信息1中的[-1,80];此外,第二特征的取值为第三值可以理解成输入信息1中的rank_range_1:[2,2],以及输入信息2中的rank_range_2:[2,7];第三特征的取值为第四值可以理解成输入信息2中的dimensions range_2:[50,200],而第三特征的取值为第五值可以理解成输入信息1中的dimensions range_1:[[1,100],[80,80]]。
因此,在目标算子为add算子的情况下,数据处理设备可以基于add算子中秩范围推导约束条件取rank_range_1:[2,2]与rank_range_2:[2,7]之间的交集,得到第一目标值为rank range_out:[2,2]。然后,数据处理设备基于add算子中秩推导约束条件将第一目标值[2,2]结合rank_2:-2,以及rank_1:2进行处理,得到第二目标值为rank_out:2,此时可以确定出目标数据应当为二维数据。那么,数据处理设备还可以基于add算子中维度范围推导约束条件将dimensions range_1:[[1,100],[80,80]]、dimensions range_2:[50,200]以及第二目标值进行处理,具体地,数据处理设备将dimensions range_1:[[1,100],[80,80]]中的第一维度的维度范围[1,100]与dimensions range_2:[50,200]取交集,得到[50,100],然后将dimensions range_1:[[1,100],[80,80]]中的第二维度的维度范围[80,80]与dimensions range_2:[50,200]取交集,得到[80,80]。这样,最终得到的第三目标值则为dimensions range_out:[[50,100],[80,80]]。
基于此,图像的输出信息可以为:rank range_out:[2,2],rank_out:2,以及dimensions range_out:[[50,100],[80,80]]。因此,从输出信息可以获知图像是一个二维图像,并 且能够基于目标算子的约束条件将图像的每一个维度对应的维度范围缩小至[[50,100],[80,80]],为后续图像引擎的优化场景提供了优化基础,减少图像优化的过程中的遍历时长以及编译时长。
值得说明的是,该输出信息还可以包括shape_out:[-1,80]。另外,上述仅仅以两个输入信息以及add算子为例进行说明,具体在实际应用中,还可以将基于目标算子的约束条件对一个或多个输入信息进行处理,得到至少一个输出信息,具体可以参照前述add算子的示例进行理解,此处将不做赘述。
进一步说明的是,前述所描述的得到至少一个输出信息,针对该输出信息的个数将取决于目标算子的约束条件或约束特性,比如针对relu_grad_v2算子,若对两个输入信息进行处理,那么得到的输出信息为两个,此处将不做具体限定说明。
示例性的,在一些实施例中,基于约束条件对至少一个输入信息进行处理,得到至少一个输出信息之后,该方法还包括:
基于第一目标值和第三目标值确定对应的输出信息的预分配内存范围。
可理解的是,由于第一目标值能够反映出目标数据中秩的目标范围,而第三目标值能够反映出目标数据的目标维度范围,因此数据处理设备还能够基于第一目标值和第三目标值计算出预存储对应的输出信息需要的内存大小,即预分配内存范围。通过上述方式,能够在图像编译期基于第一目标值与第三目标值提前预分配出所需要的内存范围,相较于在图像运行时期基于已知的秩和维度范围再确定内存范围,能够在运行前更好地优化内存的分配,以便于合理分配内存,减少不必要的内存浪费。举例来说,参阅图3,为本申请实施例中提供的应用于图像的内存分配场景的示意图。从图3可以看出,数据处理设备在获取到图像的输入信息后,基于前述所描述的目标算子的约束条件对输入信息进行处理,得到输出信息,并根据输出信息进行内存预分配。
示例性的,在另一些实施例中,前述所描述的数据处理的方法还可以包括:基于第一目标值选取目标模板,目标模板用于优化目标算子。
实施例中,由于第一目标值能够反映出目标数据中秩的目标范围,因此数据处理设备还可以从数据库中选择相与第一目标值相匹配的目标模板,剔除不匹配的模板,以便于能够基目标模板对目标算子进行优化和编译优化,以减少目标算子的处理分支,从而选择合适的执行算法,提高目标算子的编译和执行性能。例如,参阅图4,为本申请实施例中提供的应用于图像的编译场景的示意图。从图4可以看出,数据处理设备获取输入信息,基于前述所描述的目标算子的约束条件对输入信息进行处理,得到输出信息,并进一步地调用目标算子提供的编译接口,从而基于第一目标值选择合适的模板进行编译,最后输出编译结果。
207、基于至少一个输出信息中的任意一个输出信息得到目标数据的目标排布特征。
实施例中,在得到至少一个输出信息后,便可以基于任意一个输出信息得到目标数据的目标排布特征,填补了在秩未知或者秩已知但至少一个维度的维度值未知的情况下,无法确定出目标数据的目标排布特征的空白。需要说明的是,该目标排布特征也同样包括上述第一特征、第二特征以及第三特征,而且该目标排布特征中第一特征的取值可以为上述 的第二目标值,而目标排布特征中第二特征的取值为上述的第一目标值,该目标排布特征中第三特征的取值为前述的第三目标值。
以上,对本申请实施例提供的一种数据处理的方法进行了介绍,通过本申请实施例提供的方案,可以得到至少一个能够用于表征目标数据的目标排布特征的输出信息,填补了在秩未知或者秩已知但至少一个维度的维度值未知的情况下,无法确定出目标数据的目标排布特征的空白。
可以理解的是,上述数据处理设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
从硬件结构上来描述,图1至图4中的数据处理设备可以由一个实体设备实现,也可以由多个实体设备共同实现,还可以是一个实体设备内的一个逻辑功能模块,本申请实施例对此不作具体限定。
例如,图5所示为本申请实施例提供的数据处理设备的硬件结构示意图。包括:通信接口501和处理器502,还可以包括存储器503。
通信接口501可以使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,RAN),无线局域网(wireless local area networks,WLAN)等。
处理器502包括但不限于中央处理器(central processing unit,CPU),网络处理器(network processor,NP),专用集成电路(application-specific integrated circuit,ASIC)或者可编程逻辑器件(programmable logic device,PLD)中的一个或多个。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。处理器502负责通信线路504和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节,电源管理以及其他控制功能。存储器503可以用于存储处理器502在执行操作时所使用的数据。
存储器503可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically er服务器able programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路504与处理器502相连接。存储器503也可以和处理器502集成在一起。如果存储器503和处理器502是相互独立的器件,存储器503和处 理器502相连,例如存储器503和处理器502可以通过通信线路504通信。通信接口501和处理器502可以通过通信线路504通信,通信接口501也可以与处理器502直连。
通信线路504可以包括任意数量的互联的总线和桥,通信线路504将包括由处理器502代表的一个或多个处理器502和存储器503代表的存储器的各种电路链接在一起。通信线路504还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本申请不再对其进行进一步描述。
在一个具体的实施方式中,该数据处理设备,可以包括:存储器,用于存储计算机可读指令。还可以包括和存储器耦合的通信接口,用于获取至少一个输入信息,其中,每个输入信息均用于表征目标数据的排布特征,排布特征包括第一特征,第一特征的取值为第一值或第一特征的取值为第二值,第一值用于表示未知目标数据的秩,第二值用于表示已知目标数据的秩且未知至少一个维度对应的维度值;以及获取目标算子对应的约束条件,约束条件用于表征目标算子的执行逻辑。还包括:与通信接口耦合的处理器,用于执行存储器中的计算机可读指令从而执行以下操作:基于约束条件对至少一个输入信息进行处理,得到至少一个输出信息,每个输出信息均用于表征目标数据的目标排布特征,目标排布特征的取值包括第一特征的目标值。
在一个具体的实施方式中,排布特征还包括第二特征和第三特征,第二特征的取值为第三值,第三值用于表示秩的范围,第三特征的取值为第四值或第三特征的取值为第五值,第四值用于表示第一特征的取值为第一值时,目标数据的维度总范围,第五值用于表示第一特征的取值为第二值时,每一个维度对应的维度范围;处理器,具体用于:基于约束条件对至少一个输入信息中第二特征的取值进行处理,得到第一目标值,第一目标值用于反映目标数据中秩的目标范围;基于约束条件对至少一个输入信息中第一特征的取值、以及第一目标值进行处理,得到第二目标值,第二目标值用于反映秩的目标值;基于约束条件对至少一个输入信息中第三特征的取值、以及第二目标值进行处理,得到第三目标值,第三目标值用于反映目标数据的目标维度范围;基于第一目标值、第二目标值以及第三目标值得到至少一个输出信息。
在一个具体的实施方式中,处理器,还用于:基于约束条件对至少一个输入信息进行处理,得到至少一个输出信息之后,基于第一目标值和第三目标值确定对应的输出信息的预分配内存范围。
在一个具体的实施方式中,处理器,具体用于:基于第一目标值选取目标模板,目标模板用于优化目标算子。
在一个具体的实施方式中,处理器,具体用于:基于至少一个输出信息中的任意一个输出信息得到目标数据的目标排布特征,其中,目标排布特征包括第一特征、第二特征以及第三特征,目标排布特征中第一特征的取值为第二目标值,目标排布特征中第二特征的取值为第一目标值,目标排布特征中第三特征的取值为第三目标值。
在一个具体的实施方式中,第一值为符号或用于表示秩未知的数值。
参见图6,是本申请实施例提供的一种执行设备的结构示意图。如图6所示,执行设备可以包括处理器601、存储器602、通信总线603、通信接口604,人工智能处理器605 通过通信总线603连接存储器602和通信接口604。
处理器601可以是中央处理单元(central processing unit,CPU),该处理器601还可以是其他通用处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器601可以是微处理器或者该处理器601也可以是任何常规的处理器等。
处理器601还可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,本申请的数据处理的方法的各个步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。
存储器602可以是只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)或其他存储器。本申请实施例中,存储器602用于存储数据以及各种软件程序。
可选的,在本申请实施例中,存储器602可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方法的媒体加以存储。本实施方式的存储器又可以包括:利用电能方式存储信息的装置,如RAM、ROM等;利用磁能方式存储信息的装置,如硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置,如CD或DVD。当然,还有其他方式的存储器,例如量子存储器、石墨烯存储器等等。
通信接口604使用例如但不限于收发器一类的收发装置,来实现执行设备与其他设备或通信网络之间的通信。例如,可以通过通信接口604接收至少一个输入信息等。
可选地,该执行设备还可以包括至少一个人工智能处理器605。
人工智能处理器605可以作为协处理器挂载到主CPU(host CPU)上,由主CPU为其分配任务。在实际应用中,人工智能处理器605可以实现一种或多种运算。例如,以神经网络处理器(network processing Unit,NPU)NPU为例,NPU的核心部分为运算电路,通过控制器控制运算电路提取存储器602中的矩阵数据并进行乘加运算。
可选的,人工智能处理器605可以包括8个集群(cluster),每个cluster中包括4个人工智能处理器核。
可选的,人工智能处理器605可以是可重构体系结构的人工智能处理器。这里,可重构体系结构是指,如果某一人工智能处理器能够利用可重用的硬件资源,根据不同的应用需求,灵活的改变自身的体系结构,以便为每个特定的应用需求提供与之相匹配的体系结构,那么这一人工智能处理器就称为可重构的计算系统,其体系结构称为可重构的体系结构。
应当理解,执行设备仅为本申请实施例提供的一个例子,并且,执行设备可具有比示出的部件更多或更少的部件,可以组合两个或更多个部件,或者可具有部件的不同配置实现。
上述主要从实体功能的角度描述了本申请实施例中提供的数据处理设备。从功能单元的角度,本申请可以根据上述方法实施例对数据处理设备进行功能单元的划分,例如,可 以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个功能单元中。上述集成的功能单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
比如,以采用集成的方式划分各个功能单元的情况下,图7示出了本申请实施例提供的一种数据处理设备的结构示意图。如图7所示,本申请的数据处理设备的一个实施例可以包括:
编程接口模块701,用于获取至少一个输入信息,其中,每个输入信息均用于表征目标数据的排布特征,排布特征包括第一特征,第一特征的取值为第一值或第一特征的取值为第二值,第一值用于表示未知目标数据的秩,第二值用于表示已知目标数据的秩且未知至少一个维度对应的维度值;
编程接口模块701,用于获取目标算子对应的约束条件,约束条件用于表征目标算子的执行逻辑;
处理模块702,用于基于约束条件对至少一个输入信息进行处理,得到至少一个输出信息,每个输出信息均用于表征目标数据的目标排布特征,目标排布特征的取值包括第一特征的目标值。
在一些实施例中,排布特征还包括第二特征和第三特征,第二特征的取值为第三值,第三值用于表示秩的范围,第三特征的取值为第四值或第三特征的取值为第五值,第四值用于表示第一特征的取值为第一值时,目标数据的维度总范围,第五值用于表示第一特征的取值为第二值时,每一个维度对应的维度范围;处理模块702,具体用于:
根据约束条件对至少一个输入信息中第二特征的取值进行处理,得到第一目标值,第一目标值用于反映目标数据中秩的目标范围;
根据约束条件对至少一个输入信息中第一特征的取值、以及第一目标值进行处理,得到第二目标值,第二目标值用于反映秩的目标值;
根据约束条件对至少一个输入信息中第三特征的取值、以及第二目标值进行处理,得到第三目标值,第三目标值用于范围目标数据的目标维度范围;
根据第一目标值、第二目标值以及第三目标值得到至少一个输出信息。
在一些实施例中,处理模块702,还具体用于:在基于约束条件对至少一个信息进行处理,得到至少一个输出信息之后,基于第一目标值和第三目标值确定对应输出信息的预分配内存范围。
在一些实施例中,处理模块702,用于根据第一目标值选取目标模板,目标模板用于优化目标算子。
在另一些实施例中,处理模块702,还用于基于至少一个输出信息中的任意一个输出信息得到目标数据的目标排布特征,其中,目标排布特征包括第一特征、第二特征以及第三特征,目标排布特征中第一特征的取值为第二目标值,目标排布特征中第二特征的取值为第一目标值,目标排布特征中第三特征的取值为第三目标值。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本申请实施例所提供的数据处理的方法、以及相关设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (15)
- 一种数据处理的方法,其特征在于,包括:获取至少一个输入信息,其中,每个所述输入信息均用于表征目标数据的排布特征,所述排布特征包括第一特征,所述第一特征的取值为第一值或所述第一特征的取值为第二值,所述第一值用于表示未知所述目标数据的秩,所述第二值用于表示所述已知所述目标数据的秩且未知至少一个维度对应的维度值;获取目标算子对应的约束条件,所述约束条件用于表征所述目标算子的执行逻辑;基于所述约束条件对所述至少一个输入信息进行处理,得到至少一个输出信息,每个所述输出信息均用于表征所述目标数据的目标排布特征,所述目标排布特征的取值包括所述第一特征的目标值。
- 根据权利要求1所述的方法,其特征在于,所述排布特征还包括第二特征和第三特征,所述第二特征的取值为第三值,所述第三值用于表示所述秩的范围,所述第三特征的取值为第四值或所述第三特征的取值为第五值,所述第四值用于表示所述第一特征的取值为第一值时,所述目标数据的维度总范围,所述第五值用于表示所述第一特征的取值为第二值时,每一个维度对应的维度范围;基于所述约束条件对所述至少一个输入信息,得到至少一个输出信息,包括:基于所述约束条件对所述至少一个输入信息中第二特征的取值进行处理,得到第一目标值,所述第一目标值用于反映所述目标数据中秩的目标范围;基于所述约束条件对所述至少一个输入信息中第一特征的取值、以及所述第一目标值进行处理,得到第二目标值,所述第二目标值用于反映所述秩的目标值;基于所述约束条件对所述至少一个输入信息中第三特征的取值、以及所述第二目标值进行处理,得到第三目标值,所述第三目标值用于反映所述目标数据的目标维度范围;基于所述第一目标值、所述第二目标值以及所述第三目标值得到至少一个输出信息。
- 根据权利要求2所述的方法,其特征在于,基于所述约束条件对所述至少一个输入信息进行处理,得到至少一个输出信息之后,所述方法还包括:基于所述第一目标值和所述第三目标值确定对应的输出信息的预分配内存范围。
- 根据权利要求2或3所述的处理方法,其特征在于,所述处理方法还包括:基于所述第一目标值选取目标模板,所述目标模板用于优化所述目标算子。
- 根据权利要求2-4中任一项所述的处理方法,其特征在于,所述处理方法还包括:基于所述至少一个输出信息中的任意一个输出信息得到所述目标数据的目标排布特征,其中,所述目标排布特征包括所述第一特征、第二特征以及第三特征,所述目标排布特征中第一特征的取值为所述第二目标值,所述目标排布特征中第二特征的取值为所述第一目标值,所述目标排布特征中第三特征的取值为所述第三目标值。
- 根据权利要求1-5中任一项所述的方法,其特征在于,所述第一值为符号或用于表示秩未知的数值。
- 一种数据处理设备,其特征在于,包括:编程接口模块,用于获取至少一个输入信息,其中,每个所述输入信息均用于表征目 标数据的排布特征,所述排布特征包括第一特征,所述第一特征的取值为第一值或所述第一特征的取值为第二值,所述第一值用于表示未知所述目标数据的秩,所述第二值用于表示所述已知所述目标数据的秩且未知至少一个维度对应的维度值;所述编程接口模块,用于获取目标算子对应的约束条件,所述约束条件用于表征所述目标算子的执行逻辑;处理模块,用于基于所述约束条件对所述至少一个输入信息进行处理,得到至少一个输出信息,每个所述输出信息均用于表征所述目标数据的目标排布特征,所述目标排布特征的取值包括所述第一特征的目标值。
- 根据权利要求7所述的数据处理设备,其特征在于,所述排布特征还包括第二特征和第三特征,所述第二特征的取值为第三值,所述第三值用于表示所述秩的范围,所述第三特征的取值为第四值或所述第三特征的取值为第五值,所述第四值用于表示所述第一特征的取值为第一值时,所述目标数据的维度总范围,所述第五值用于表示所述第一特征的取值为第二值时,每一个维度对应的维度范围;所述处理模块,用于:根据所述约束条件对所述至少一个输入信息中第二特征的取值进行处理,得到第一目标值,所述第一目标值用于反映所述目标数据中秩的目标范围;根据所述约束条件对所述至少一个输入信息中第一特征的取值、以及所述第一目标值进行处理,得到第二目标值,所述第二目标值用于反映所述秩的目标值;根据所述约束条件对所述至少一个输入信息中第三特征的取值、以及所述第二目标值进行处理,得到第三目标值,所述第三目标值用于范围所述目标数据的目标维度范围;根据所述第一目标值、所述第二目标值以及所述第三目标值得到至少一个输出信息。
- 根据权利要求8所述的数据处理设备,其特征在于,所述处理模块,还用于在基于所述约束条件对所述至少一个信息进行处理,得到至少一个输出信息之后,基于所述第一目标值和所述第三目标值确定对应输出信息的预分配内存范围。
- 根据权利要求8或9所述的数据处理设备,其特征在于,所述处理模块,用于根据所述第一目标值选取目标模板,所述目标模板用于优化所述目标算子。
- 根据权利要求8-10中任一项所述的数据处理设备,其特征在于,所述处理模块,还用于基于所述至少一个输出信息中的任意一个输出信息得到所述目标数据的目标排布特征,其中,所述目标排布特征包括所述第一特征、第二特征以及第三特征,所述目标排布特征中第一特征的取值为所述第二目标值,所述目标排布特征中第二特征的取值为所述第一目标值,所述目标排布特征中第三特征的取值为所述第三目标值。
- 根据权利要求8-11中任一项所述的数据处理设备,其特征在于,所述第一值为符号或用于表示秩未知的数值。
- 一种数据处理设备,其特征在于,包括:存储器,用于存储计算机可读指令;还包括,与所述存储器耦合的处理器,用于执行所述存储器中的计算机可读指令从而执行如权利要求1至6任一项所描述的方法。
- 一种计算机可读存储介质,其特征在于,当指令在计算机装置上运行时,使得所述计算机装置执行如权利要求1至6任一项所描述的方法。
- 一种计算机程序产品,当在计算机上运行时,使得计算机可以执行如权利要求1至6任一所描述的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2020/131120 WO2022109779A1 (zh) | 2020-11-24 | 2020-11-24 | 一种数据处理的方法以及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116670688A true CN116670688A (zh) | 2023-08-29 |
Family
ID=81755235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080107278.2A Pending CN116670688A (zh) | 2020-11-24 | 2020-11-24 | 一种数据处理的方法以及相关设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116670688A (zh) |
WO (1) | WO2022109779A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101493886B (zh) * | 2009-02-24 | 2012-05-23 | 武汉兰丁医学高科技有限公司 | 特征参数不完整情况下的细胞核分类与识别方法 |
EP3674870A1 (en) * | 2018-12-29 | 2020-07-01 | Dassault Systèmes | Learning a neural network for inference of editable feature trees |
CN110006568B (zh) * | 2019-04-12 | 2020-01-07 | 中国地质科学院地质力学研究所 | 一种利用岩芯获取三维地应力的方法及获取系统 |
CN110490309B (zh) * | 2019-08-14 | 2022-06-07 | 中科寒武纪科技股份有限公司 | 一种用于神经网络的算子融合方法及其相关产品 |
-
2020
- 2020-11-24 CN CN202080107278.2A patent/CN116670688A/zh active Pending
- 2020-11-24 WO PCT/CN2020/131120 patent/WO2022109779A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022109779A1 (zh) | 2022-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4036724A1 (en) | Method for splitting neural network model by using multi-core processor, and related product | |
EP4036803A1 (en) | Neural network model processing method and apparatus, computer device, and storage medium | |
US11741361B2 (en) | Machine learning-based network model building method and apparatus | |
US20230008597A1 (en) | Neural network model processing method and related device | |
WO2021190127A1 (zh) | 一种数据处理方法和数据处理设备 | |
US11790212B2 (en) | Quantization-aware neural architecture search | |
EP3979143A1 (en) | Method of performing splitting in neural network model by means of multi-core processor, and related product | |
CN111989697A (zh) | 用于并行和分布式张量计算的神经硬件加速器 | |
US11423288B2 (en) | Neuromorphic synthesizer | |
CN107944545B (zh) | 应用于神经网络的计算方法及计算装置 | |
KR20190099931A (ko) | 시스톨릭 배열(Systolic Array)을 이용하여 딥 러닝(Deep Learning) 연산을 수행하는 방법 및 장치 | |
US20200226458A1 (en) | Optimizing artificial neural network computations based on automatic determination of a batch size | |
CN115017178A (zh) | 数据到文本生成模型的训练方法和装置 | |
CN111444335B (zh) | 中心词的提取方法及装置 | |
Huang et al. | A stereo matching algorithm based on the improved PSMNet | |
Zhan et al. | Field programmable gate array‐based all‐layer accelerator with quantization neural networks for sustainable cyber‐physical systems | |
Zhang et al. | XNORCONV: CNNs accelerator implemented on FPGA using a hybrid CNNs structure and an inter‐layer pipeline method | |
Raha et al. | Efficient hardware acceleration of emerging neural networks for embedded machine learning: An industry perspective | |
CN109740730B (zh) | 运算方法、装置及相关产品 | |
CN110852414A (zh) | 高精度低位卷积神经网络 | |
CN116670688A (zh) | 一种数据处理的方法以及相关设备 | |
CN114723024A (zh) | 用于存算一体芯片的基于线性规划的神经网络映射方法 | |
WO2021253440A1 (en) | Depth-wise over-parameterization | |
US20220283778A1 (en) | Method and device for encoding | |
CN116755714B (zh) | 深度神经网络模型的运行方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |