CN111651487B - 处理装置及方法 - Google Patents
处理装置及方法 Download PDFInfo
- Publication number
- CN111651487B CN111651487B CN202010446950.2A CN202010446950A CN111651487B CN 111651487 B CN111651487 B CN 111651487B CN 202010446950 A CN202010446950 A CN 202010446950A CN 111651487 B CN111651487 B CN 111651487B
- Authority
- CN
- China
- Prior art keywords
- data
- searching
- input data
- lookup
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Image Processing (AREA)
Abstract
本申请公开了一种处理装置及方法,该装置包括数据传输单元和查找单元,所述查找单元包括至少一个查找子单元;所述查找单元用于接收输入数据,所述查找单元中的每个查找子单元依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元,所述输入数据为整型数据;所述数据传输单元用于接收所述输入数据,将所述输入数据广播至所述查找单元,并接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果。本申请通过配置至少一个查找子单元来并行处理查找表操作,有效地提高了查找表操作的运算速度。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种处理装置及方法。
背景技术
在人工智能应用领域,查找表技术是一种常见的处理方式,例如,在图像处理领域,通过对图像的颜色进行映射,改变图像的颜色分布,可以实现增强图像对比度、调整颜色色差等功能。但是目前的查找表技术是建立索引号与输出值的映射关系,依据输入值与映射关系快速得到输出值,但是当查找表的输入值包含多个数据时,需要对输入值进行遍历搜索,导致整个搜索的运算速度慢,搜索的流程复杂繁冗,查找周期长,查找效率低下。
发明内容
本申请实施例提供了一种处理装置及方法,能够通过配置至少一个查找子单元来并行处理查找表操作,有效地提高查找表操作的运算速度。
第一方面,本申请实施例提供一种处理装置,所述装置包括:数据传输单元、查找单元,所述查找单元包括至少一个查找子单元;
所述查找单元,用于接收输入数据,所述查找单元中的每个查找子单元依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元,所述输入数据为整型数据;
所述数据传输单元,用于接收所述输入数据,将所述输入数据广播至所述查找单元,并接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果。
可选的,所述查找子单元包括:配置模块、查找模块和运算模块,其中:
所述配置模块,用于设置所述查找单元中每个查找子单元对应的配置信息,所述配置信息包括配置表和查找表;
所述查找模块,用于依据所述配置信息确定所述查找单元中每个查找子单元当前查找输入数据的数据范围,依据所述查找单元中每个查找子单元当前查找输入数据的数据范围,从所述输入数据中确定待处理数据,将所述待处理数据发送至对应的运算模块;
所述运算模块,用于根据所述查找表的映射关系,对所述待处理数据进行处理,获得所述待处理数据对应的映射值,所述映射值为所述查找子结果。
可选的,所述配置表包括:第一参数、第二参数和第三参数,所述第一参数用于确定所述数据范围的高位,所述第二参数用于确定所述数据范围的高位的位长,所述第三参数用于确定所述查找表操作的查找分段。
可选的,所述查找模块具体用于:
依据所述第三参数确定所述查找单元执行查找表操作的查找分段的分段数;
依据所述第二参数和所述第三参数确定每个分段对应的执行查找表操作的数据范围;
依据所述第一参数、所述分段数、所述每个分段对应的执行查找表操作的数据范围确定所述查找单元中每个查找子单元当前查找输入数据的数据范围,根据所述查找单元中每个查找子单元当前查找输入数据的数据范围确定所述查找子单元的待处理数据。
可选的,所述数据传输单元还用于:
依据所述查找结果,确定所述输入数据中的所有数据是否被执行查找表操作,得到验证结果,并将所述验证结果发送至所述查找单元中的每个查找子单元。
可选的,所述配置模块还用于:
在所述验证结果为所述输入数据中的所有数据未被执行查找表操作时,重新设置所述查找单元中每个查找子单元对应的配置信息。
可选的,所述装置还包括存储单元,
所述存储单元,用于存储所述输入数据以及所述查找结果。
第二方面,本申请实施例提供一种处理方法,应用于处理装置内,所述处理装置包括数据传输单元、查找单元,所述查找单元包括至少一个查找子单元,所述方法包括:
所述数据传输单元接收输入数据,将所述输入数据广播至所述查找单元;
所述查找单元接收所述输入数据,所述查找单元中的每个查找子单元依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元,所述输入数据为整型数据;
所述数据传输单元接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果。
可选的,所述方法还包括:
设置所述查找单元中每个查找子单元对应的配置信息,所述配置信息包括配置表和查找表;
依据所述配置信息确定所述查找单元中每个查找子单元当前查找输入数据的数据范围,依据所述数据范围,从所述输入数据中确定待处理数据,将所述待处理数据发送至对应的运算模块;
根据所述查找表的映射关系,对所述待处理数据进行处理,获得所述待处理数据对应的映射值,所述映射值为所述查找子结果。
可选的,所述配置表包括:第一参数、第二参数以及第三参数,所述第一参数用于确定所述数据范围的高位,所述第二参数用于确定所述数据范围的高位的位长,所述第三参数用于确定所述查找表操作的查找分段。
可选的,所述依据所述数据范围从所述输入数据中确定待处理数据,包括:
依据所述第三参数确定所述查找单元执行查找表操作的查找分段的分段数;
依据所述第二参数和所述第三参数确定每个分段对应的执行查找表操作的数据范围;
依据所述第一参数、所述分段数、所述每个分段对应的执行查找表操作的数据范围确定所述数据范围,根据所述数据范围确定所述查找子单元的待处理数据。
可选的,所述方法还包括:
依据所述查找结果,确定所述输入数据中的所有数据是否被执行查找表操作,得到验证结果。
可选的,所述方法还包括:
在所述验证结果为所述输入数据中的所有数据未被执行查找表操作时,重新设置所述查找单元中每个查找子单元对应的配置信息。
可选的,所述方法还包括:存储所述输入数据以及所述查找结果。
第三方面,本申请实施例提供一种计算机设备,该计算机设备包括处理器、存储器以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器处理,所述程序包括用于执行如第二方面任意一项所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质包括存储用于数据交换的计算机程序,所述计算机程序被处理器执行时实现如本申请实施例第二方面所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第二方面所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,在本申请实施例中,通过数据传输单元和查找单元,所述查找单元包括至少一个查找子单元,所述查找单元用于接收输入数据,所述查找单元中的每个查找子单元依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元,所述输入数据为整型数据;所述数据传输单元用于接收所述输入数据,将所述输入数据广播至所述查找单元,并接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果。本申请通过配置至少一个查找子单元来并行处理查找表操作,有效地提高了查找表操作的运算速度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种计算机设备的结构示意图;
图2是本申请实施例提供的一种处理装置的结构示意图;
图3是本申请实施例提供的另一种处理装置的结构示意图;
图4是本申请实施例提供的一种查找子单元的结构示意图;
图5是本申请实施例提供的一种查找表的映射关系示意图;
图6是本申请实施例提供的另一种处理装置的结构示意图;
图7是本申请实施例提供的一种处理方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
请参阅图1,图1是本申请实施例提供的一种计算机设备的结构示意图,如图1所示,该计算机设备可以包括处理器,存储器以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器处理。其中,该计算机设备还可以包括通信总线、输入设备和输出设备,处理器、存储器、输入设备和输出设备之间可以通过总线相互连接。
其中,上述处理器,用于执行所述存储器上所存放的程序时,实现以下步骤:
所述数据传输单元接收输入数据,将所述输入数据广播至所述查找单元;
所述查找单元接收所述输入数据,所述查找单元中的每个查找子单元依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元,所述输入数据为整型数据;
所述数据传输单元接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果。
进一步地,上述处理器可以是中央处理器(Central Processing Unit,CPU)、智能处理器(Intelligence Processing Unit,NPU)、图形处理器(Graphics Processing Unit,GPU)或图像处理器(Image Processing Unit),本申请对此不做限定。根据处理器的不同,本申请实施例提出的处理方法可以应用于图像识别处理、深度学习处理、计算机视觉处理、智能机器人处理、自然语言处理等人工智能应用领域,执行人工智能领域中的复杂功能程序,例如,在图像识别处理方面,图像处理器可以通过查找表操作增加图像的对比度和亮度;在计算机视觉处理方面,处理器可以通过查找表操作调整显示屏上图像的颜色色差。
请参阅图2,图2是本申请实施例提供的一种处理装置200的结构示意图,该装置200应用于如图1所示的计算机设备。如图2所示,该装置200包括:数据传输单元21、查找单元22,所述查找单元22包括至少一个查找子单元220;
所述查找单元22,用于接收输入数据,所述查找单元22中的每个查找子单元220依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元21,所述输入数据为整型数据;
所述数据传输单元21,用于接收所述输入数据,将所述输入数据广播至所述查找单元22,并接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果。
具体地,查找单元22包括一个或多个查找子单元220,如图2所示,可以分别为查找子单元1、查找子单元2、……、查找子单元N,所述N为正整数,每个查找子单元220用于实现部分数据的查找表功能。数据传输单元21接收到输入数据后,将输入数据广播到查找单元22的每个查找子单元220以执行查找表操作。每个查找子单元220接收输入数据,只对输入数据中处于当前查找子单元220的数据范围内的数据进行查找表操作,每个查找子单元220将输出的查找子结果返回给数据传输单元21。数据传输单元按照输入数据的存储位置汇聚数据,并将查找子结果写回相应输入数据对应的存储位置。
举例说明,如图3,输入数据为abcdefgh,查找单元22包括查找子单元1、查找子单元2和查找子单元3。数据传输单元21接收abcdefgh后,将其广播到查找子单元1、查找子单元2和查找子单元3。查找子单元1接收到abcdefgh后,只对输入数据中的数据中的ac数据进行查找表操作,得到查找子结果a’c’;查找子单元2接收到abcdefgh后,只对输入数据中的数据中的deg数据进行查找表操作,得到查找子结果d’e’g’;查找子单元3接收到abcdefgh后,只对输入数据中的数据中的bf数据进行查找表操作,得到查找子结果b’f’。然后查找子单元1、查找子单元2和查找子单元3分别将查找子结果发送给数据传输单元21。数据传输单元21接收到查找子结果后,按照输入数据的存储位置进行汇聚排序,得到查找结果a’b’c’d’e’f’g’。
进一步地,查找单元22中包括的一个或多个查找子单元220可以根据硬件的设计需求,例如硬件面积要求或者性能要求等,调整查找子单元221的数量。每个查找子单元220负责一定范围内的数据查找表操作,当输入数据的数据范围超过所有查找子单元220的覆盖范围时,可以通过多次配置查找单元22中的每个查找子单元220的配置信息,复用查找子单元220,实现查找表功能。
在本申请实施例中,通过配置至少一个查找子单元220来并行处理查找表操作,使得每个查找子单元220能够并行处理输入数据中的部分数据,有效地缩短了输入数据的查找表操作周期,从而提高了查找表操作的运算速度。
可选的,如图4所示,图4为本申请实施例提供的一种查找子单元220的结构示意图,如图4所示,该查找子单元220包括:配置模块221、查找模块222和运算模块223,其中:
所述配置模块221,用于设置所述查找单元22中每个查找子单元220对应的配置信息,所述配置信息包括配置表和查找表;
所述查找模块222,用于依据所述配置信息确定所述查找单元22中每个查找子单元220当前查找输入数据的数据范围,依据所述查找单元22中每个查找子单元220当前查找输入数据的数据范围,从所述输入数据中确定待处理数据,将所述待处理数据发送至对应的运算模块223;
所述运算模块223,用于根据所述查找表的映射关系,对所述待处理数据进行处理,获得所述待处理数据对应的映射值,所述映射值为所述查找子结果。
在本申请实施例中,配置模块221根据功能需求,为每个查找子单元220配置相应的配置表和查找表。查找单元22中的每个查找子单元220接收到数据传输单元21广播的输入数据后,根据接收的输入数据、配置表和查找表,对处于当前查找子单元220的查找表处理范围内的输入数据执行查找表操作。
其中,该配置表包括:第一参数、第二参数和第三参数。其中,所述第一参数用于确定所述数据范围的高位,所述第二参数用于确定所述数据范围的高位的位长,所述第三参数用于确定所述查找表操作的查找分段。
具体地,通过第一参数可以用base来表示,base可以确定查找表数据范围的高位,第二参数可以用length来表示,length可以确定高位base的位长。由于输入数据为整型数据,因此通过base和length确定了当前查找子单元220执行查找表操作的数据范围。第三参数可以用k来表示,K可以确定查找表操作的查找分段,总共2k个查找分段,以整数型32为例,每个分段的查找表的映射数据范围为232-length-k。例如,base为ox5,length为4,k为2时,则当前查找表的查找数据范围为[0x5000000,0x5fffffff],查找表分为4个分段,每个分段的数据范围分别为[0x50000000,0x53ffffff],[0x54000000,0x57ffffff],[0x58000000,0x5bffffff],[0x5c000000,0x5fffffff]。
在本申请实施例中,通过对每个查找子单元220配置不同的配置表和查找表,使得每个查找子单元220能够实现不同部分数据的查找表功能,并且通过对多个查找子单元220的配置,可以性能和硬件面积开销上能够灵活地选择配置,从而简化硬件的设计。
可选的,所述查找模块222具体用于:
依据所述第三参数确定所述查找单元22执行查找表操作的查找分段的分段数;依据所述第二参数和所述第三参数确定每个分段对应的执行查找表操作的数据范围;依据所述第一参数、所述分段数、所述每个分段对应的执行查找表操作的数据范围确定所述查找单元22中每个查找子单元220当前查找输入数据的数据范围,根据所述查找单元22中每个查找子单元220当前查找输入数据的数据范围确定所述查找子单元220的待处理数据。
具体地,每个查找子单元220中均包括配置模块221,每个配置模块221中包括配置表,通过配置表中的第一参数可以确定每个查找子单元220执行查找表操作的数据范围,从而配置模块221可以根据所述数据范围从所述输入数据中确定查找数据,所述查找数据为处于该查找子单元220执行查找表操作的数据范围内的数据。通过第二参数和第三参数可以确定查找表操作的数据范围内每个分段对应的执行查找表操作的数据范围,因而可以确定查找数据的数据范围,根据该查找数据的数据范围可以确定该查找子单元220的待处理数据。
在本申请实施例中,查找表用于提供数据范围内查找表的映射关系,每个查找表分段提供一个数值映射,总共有2k个数值。查找模块222根据配置信息中的配置表从输入数据中确定处于该查找子单元220的数据范围内的待处理数据后,将待处理数据传给运算模块223,运算模块223根据查找模块221提供的查找表,根据查找表的映射关系,获得所述待处理数据对应的映射值,从而得到该查找子单元220的查找子结果,并将查找子结果通过查找模块222的数据通路写回至数据传输单元21,所述映射值为所述查找子结果。
如图5所示,图5为本申请实施例提供的一种查找表的映射关系示意图。运算模块223根据查找模块222提供的配置信息,确定当前数据处于哪个数据范围,根据查找表的映射关系,将待处理数据映射为查找表数据,获得映射值。
可选的,所述数据传输单元21还用于:
依据所述查找结果,确定所述输入数据中的所有数据是否被执行查找表操作,得到验证结果,并将所述验证结果发送至所述查找单元22中的每个查找子单元220。
具体地,数据传输单元21接收到每个查找子单元220发送的查找子结果后,将该查找子结果的内容与该输入数据进行匹配,确定该查找子结果的内容对应的输入数据的位置,将该查找子结果的内容存储至该输入数据的位置,得到查找结果。根据查找结果中是否存在空缺位置确定所述输入数据中的所有数据是否被执行查找表操作,得到验证结果。其中,若查找结果中存在空缺位置,则验证结果为输入数据中的所有数据未被执行查找表操作;若查找结果中不存在空缺位置,则验证结果输入数据中的所有数据被执行查找表操作。
进一步地,在验证结果为输入数据中的所有数据未被执行查找表操作时,数据传输单元21可以再次将输入数据广播至每个查找子单元220中以执行查找表操作;数据传输单元21也可以将查找结果中的空缺位置对应的输入数据,即未被执行查找表操作的数据,广播至每个查找子单元220中以执行查找表操作。
可选的,所述配置模块221还用于:
在所述验证结果为所述输入数据中的所有数据未被执行查找表操作时,重新设置所述查找单元中22每个查找子单元220对应的配置信息。
其中,在输入数据的数据范围超过所有查找子单元220的覆盖范围,或者,在查找子单元较少220(例如,只有一个查找子单元220)的情况下,对输入数据进行一次查找表操作可能无法覆盖所有输入数据的数据范围,例如,输入数据abcdefgh超过查找子单元1、查找子单元2和查找子单元3的数据覆盖范围,因此输入数据中的h数据没有被执行查找表操作。配置模块221可以在验证结果为所述输入数据中的所有数据未被执行查找表操作时,配置模块221可以更新各个查找子单元220的配置信息,再次对同一数据进行查找表操作。
可选的,如图6所示,所述装置还包括存储单元23,所述存储单元23用于存储所述输入数据以及所述查找结果。
具体地,输入数据可以存放至本装置的存储单元中,数据传输单元21可以从存储单元23中获取输入数据,例如,用户可以将输入数据存储与如图1所示的计算机设置的存储器中。数据传输单元21也可以将得到查找结果存储与存储单元23中。
可以看出,本申请实施例的处理装置,通过数据传输单元21和查找单元22,所述查找单元22包括至少一个查找子单元220,所述查找单元22用于接收输入数据,所述查找单元22中的每个查找子单元220依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元21,所述输入数据为整型数据;所述数据传输单元21用于接收所述输入数据,将所述输入数据广播至所述查找单元22,并接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果。本申请通过配置至少一个查找子单元220来并行处理查找表操作,有效地提高了查找表操作的运算速度。
例如,本申请提出的处理装置进行图像识别处理时,数据传输单元21接收图像识别输入数据,将图像识别输入数据广播至查找单元22,查找单元22接收图像识别输入数据,查找单元22中的每个查找子单元220依据对应的图像识别输入数据并行执行查找表操作,得到对应的查找子结果,将查找子结果返回至数据传输单元21,图像识别输入数据为整型数据;数据传输单元21接收查找子结果,依据图像识别输入数据对查找子结果进行排序得到查找结果,通过配置至少一个查找子单元220来并行处理查找表操作,有效地提高了查找表操作的运算速度,从而提升了图像识别系统的运行效率。
进一步地,本申请提出的处理装置进行深度学习时,数据传输单元21接收深度学习输入数据,将深度学习输入数据广播至查找单元22,查找单元22接收深度学习输入数据,查找单元22中的每个查找子单元220依据对应的深度学习输入数据并行执行查找表操作,得到对应的查找子结果,将查找子结果返回至数据传输单元21,深度学习输入数据为整型数据;数据传输单元21接收查找子结果,依据深度学习输入数据对查找子结果进行排序得到查找结果,通过配置至少一个查找子单元220来并行处理查找表操作,有效地提高了查找表操作的运算速度,从而提升了深度学习系统的运行效率。
请参阅图7,图7是本申请实施例提供的一种处理方法的流程示意图,应用于如图2所述的处理装置内,所述处理装置包括数据传输单元、查找单元,所述查找单元包括至少一个查找子单元。如图7所示,该方法包括如下步骤:
S710、所述数据传输单元接收输入数据,将所述输入数据广播至所述查找单元;
S720、所述查找单元接收所述输入数据,所述查找单元中的每个查找子单元依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元,所述输入数据为整型数据;
S730、所述数据传输单元接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果。
可选的,所述方法还包括:
设置所述查找单元中每个查找子单元对应的配置信息,所述配置信息包括配置表和查找表;
依据所述配置信息确定所述查找单元中每个查找子单元当前查找输入数据的数据范围,依据所述数据范围从所述输入数据中确定待处理数据,将所述待处理数据发送至对应的运算模块;
根据所述查找表的映射关系,对所述待处理数据进行处理,获得所述待处理数据对应的映射值,所述映射值为所述查找子结果。
可选的,所述配置表包括:第一参数、第二参数以及第三参数,所述第一参数用于确定所述数据范围的高位,所述第二参数用于确定所述数据范围的高位的位长,所述第三参数用于确定所述查找表操作的查找分段。
可选的,所述依据所述数据范围从所述输入数据中确定待处理数据,包括:
依据所述第三参数确定所述查找单元执行查找表操作的查找分段的分段数;
依据所述第二参数和所述第三参数确定每个分段对应的执行查找表操作的数据范围;
依据所述第一参数、所述分段数、所述每个分段对应的执行查找表操作的数据范围确定所述数据范围,根据所述数据范围确定所述查找子单元的待处理数据。
可选的,所述方法还包括:依据所述查找结果,确定所述输入数据中的所有数据是否被执行查找表操作,得到验证结果。
可选的,所述方法还包括:在所述验证结果为所述输入数据中的所有数据未被执行查找表操作时,重新设置所述查找单元中每个查找子单元对应的配置信息。
可选的,所述方法还包括:存储所述输入数据以及所述查找结果。
可以理解的是,本申请实施例的处理方法的具体实现方式可根据上述处理装置实施例中的具体实现,其具体实现过程可以参照上述装置实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、终端设备或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (14)
1.一种处理装置,其特征在于,所述装置包括数据传输单元、查找单元,所述查找单元包括至少一个查找子单元;
所述查找单元,用于接收输入数据,所述查找单元中的每个查找子单元依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元,所述输入数据为整型数据;
所述数据传输单元,用于接收所述输入数据,将所述输入数据广播至所述至少一个查找单元,并接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果;
所述查找子单元包括:配置模块、查找模块和运算模块,其中:
所述配置模块,用于设置所述查找单元中每个查找子单元对应的配置信息,所述配置信息包括配置表和查找表;
所述查找模块,用于依据所述配置信息确定所述查找单元中每个查找子单元当前查找输入数据的数据范围,依据所述数据范围从所述输入数据中确定待处理数据,将所述待处理数据发送至对应的运算模块;
所述运算模块,用于根据所述查找表的映射关系,对所述待处理数据进行处理,获得所述待处理数据对应的映射值,所述映射值为所述查找子结果。
2.根据权利要求1所述的装置,其特征在于,所述配置表包括:第一参数、第二参数和第三参数,所述第一参数用于确定所述数据范围的高位,所述第二参数用于确定所述数据范围的高位的位长,所述第三参数用于确定所述查找表操作的查找分段。
3.根据权利要求2所述的装置,其特征在于,所述查找模块具体用于:
依据所述第三参数确定所述查找单元执行查找表操作的查找分段的分段数;
依据所述第二参数和所述第三参数确定每个分段对应的执行查找表操作的数据范围;
依据所述第一参数、所述分段数、所述每个分段对应的执行查找表操作的数据范围确定所述数据范围,根据所述数据范围确定所述查找子单元的待处理数据。
4.根据权利要求1-3任一项所述的装置,其特征在于,所述数据传输单元还用于:
依据所述查找结果,确定所述输入数据中的所有数据是否被执行查找表操作,得到验证结果。
5.根据权利要求4所述的装置,其特征在于,所述配置模块还用于:
在所述验证结果为所述输入数据中的所有数据未被执行查找表操作时,重新设置所述查找单元中每个查找子单元对应的配置信息。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括存储单元,
所述存储单元,用于存储所述输入数据以及所述查找结果。
7.一种处理方法,其特征在于,应用于处理装置内,所述处理装置包括数据传输单元、查找单元,所述查找单元包括至少一个查找子单元,所述方法包括:
所述数据传输单元接收输入数据,将所述输入数据广播至所述查找单元;
所述查找单元接收所述输入数据,所述查找单元中的每个查找子单元依据对应的输入数据并行执行查找表操作,得到对应的查找子结果,将所述查找子结果返回至所述数据传输单元,所述输入数据为整型数据;
所述数据传输单元接收所述查找子结果,依据所述输入数据对所述查找子结果进行排序得到查找结果;
其中,所述方法还包括:
设置所述查找单元中每个查找子单元对应的配置信息,所述配置信息包括配置表和查找表;
依据所述配置信息确定所述查找单元中每个查找子单元当前查找输入数据的数据范围,依据所述数据范围,从所述输入数据中确定待处理数据,将所述待处理数据发送至对应的运算模块;
根据所述查找表的映射关系,对所述待处理数据进行处理,获得所述待处理数据对应的映射值,所述映射值为所述查找子结果。
8.根据权利要求7所述的方法,其特征在于,所述配置表包括:第一参数、第二参数以及第三参数,所述第一参数用于确定所述数据范围的高位,所述第二参数用于确定所述数据范围的高位的位长,所述第三参数用于确定所述查找表操作的查找分段。
9.根据权利要求8所述的方法,其特征在于,所述依据所述数据范围从所述输入数据中确定待处理数据,包括:
依据所述第三参数确定所述查找单元执行查找表操作的查找分段的分段数;
依据所述第二参数和所述第三参数确定每个分段对应的执行查找表操作的数据范围;
依据所述第一参数、所述分段数、所述每个分段对应的执行查找表操作的数据范围确定所述数据范围,根据所述数据范围确定所述查找子单元的待处理数据。
10.根据权利要求7-9任一项所述的方法,其特征在于,所述方法还包括:
依据所述查找结果,确定所述输入数据中的所有数据是否被执行查找表操作,得到验证结果。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
在所述验证结果为所述输入数据中的所有数据未被执行查找表操作时,重新设置所述查找单元中每个查找子单元对应的配置信息。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
存储所述输入数据以及所述查找结果。
13.一种计算机设备,其特征在于,包括处理器、存储器以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器处理,所述程序包括用于执行权利要求7-12任一项方法中的步骤的指令。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储用于数据交换的计算机程序,所述计算机程序被处理器执行时实现如权利要求7-12任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010446950.2A CN111651487B (zh) | 2020-05-25 | 2020-05-25 | 处理装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010446950.2A CN111651487B (zh) | 2020-05-25 | 2020-05-25 | 处理装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111651487A CN111651487A (zh) | 2020-09-11 |
CN111651487B true CN111651487B (zh) | 2023-06-27 |
Family
ID=72348363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010446950.2A Active CN111651487B (zh) | 2020-05-25 | 2020-05-25 | 处理装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111651487B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5880744A (en) * | 1997-06-27 | 1999-03-09 | Microsoft Corporation | Method and apparatus for vector transformation involving a transformation matrix |
CN101043421A (zh) * | 2006-03-21 | 2007-09-26 | 上海激动通信有限公司 | 一种基于内存的ip地址最长匹配快速查找的方法 |
CN104301228A (zh) * | 2014-09-12 | 2015-01-21 | 中国电子科技集团公司第三十二研究所 | 网络处理器中查找模块的实现方法及系统 |
CN104866502A (zh) * | 2014-02-25 | 2015-08-26 | 深圳市中兴微电子技术有限公司 | 数据匹配的方法及装置 |
CN108170203A (zh) * | 2018-02-02 | 2018-06-15 | 清华大学无锡应用技术研究院 | 用于可重构处理系统的查表算子及其配置方法 |
CN110784306A (zh) * | 2019-11-01 | 2020-02-11 | 成都卫士通信息产业股份有限公司 | Sm4算法白盒实现方法、装置、电子设备及计算机介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130111188A9 (en) * | 2003-07-24 | 2013-05-02 | Martin Vorbach | Low latency massive parallel data processing device |
-
2020
- 2020-05-25 CN CN202010446950.2A patent/CN111651487B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5880744A (en) * | 1997-06-27 | 1999-03-09 | Microsoft Corporation | Method and apparatus for vector transformation involving a transformation matrix |
CN101043421A (zh) * | 2006-03-21 | 2007-09-26 | 上海激动通信有限公司 | 一种基于内存的ip地址最长匹配快速查找的方法 |
CN104866502A (zh) * | 2014-02-25 | 2015-08-26 | 深圳市中兴微电子技术有限公司 | 数据匹配的方法及装置 |
CN104301228A (zh) * | 2014-09-12 | 2015-01-21 | 中国电子科技集团公司第三十二研究所 | 网络处理器中查找模块的实现方法及系统 |
CN108170203A (zh) * | 2018-02-02 | 2018-06-15 | 清华大学无锡应用技术研究院 | 用于可重构处理系统的查表算子及其配置方法 |
CN110784306A (zh) * | 2019-11-01 | 2020-02-11 | 成都卫士通信息产业股份有限公司 | Sm4算法白盒实现方法、装置、电子设备及计算机介质 |
Non-Patent Citations (3)
Title |
---|
Jung-Min Choi.Memory optimization of bilateral filter and its hardware implementation.IEEE.2014,第1-2页. * |
李艳红 ; 刘太辉 ; .表面矢量编码的查找表算法.北华大学学报(自然科学版).2009,第10卷(第05期),第467-470页. * |
邹云伟 ; 李冰 ; .动态查找表设计方案研究.电子与封装.2007,(第12期),第15-18转45页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111651487A (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10971133B2 (en) | Voice synthesis method, device and apparatus, as well as non-volatile storage medium | |
US10949991B2 (en) | Method and apparatus for determining position of pupil | |
CN110457704A (zh) | 目标字段的确定方法、装置、存储介质及电子装置 | |
CN107025312A (zh) | 基于视频内容的信息提供方法和装置 | |
CN109783678B (zh) | 一种图像搜索的方法及装置 | |
CN111651487B (zh) | 处理装置及方法 | |
CN114358252A (zh) | 目标神经网络模型中的操作执行方法及装置、存储介质 | |
CN110276283A (zh) | 图片识别方法、目标识别模型训练方法及装置 | |
CN104883478B (zh) | 视频处理方法及装置 | |
CN114285906A (zh) | 报文处理方法、装置、电子设备及存储介质 | |
CN111651486B (zh) | 处理装置及方法 | |
CN109658328A (zh) | 自拍视频动物头像耳朵处理方法及相关产品 | |
CN104077555B (zh) | 一种识别图片搜索中坏例的方法和装置 | |
CN109451347A (zh) | 一种特效制作方法、装置、终端及计算机可读存储介质 | |
WO2023143595A1 (zh) | 处理器之间的通信方法、系统、存储介质以及处理器 | |
CN109144853B (zh) | 一种软件定义无线电SoC芯片调试系统 | |
CN110990701A (zh) | 书籍搜索方法、计算设备及计算机存储介质 | |
CN106502775B (zh) | 一种分时调度dsp算法的方法和系统 | |
CN115529616A (zh) | 基于路由器的物联网设备的配置方法及双频无线路由器 | |
CN108874994A (zh) | 一种分块读取数据的方法、装置及计算机存储介质 | |
CN114048036A (zh) | PCIe带宽分配方法及基本输入输出系统 | |
CN112070144B (zh) | 图像聚类方法、装置、电子设备以及存储介质 | |
CN113986189A (zh) | 车载终端导航音量动态调整方法以及装置 | |
WO2020253049A1 (zh) | 数据处理方法和装置、及存储介质和电子装置 | |
CN106815183A (zh) | 媒体内容的生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |