CN111435423A - 双面模式处理器 - Google Patents
双面模式处理器 Download PDFInfo
- Publication number
- CN111435423A CN111435423A CN201910029514.2A CN201910029514A CN111435423A CN 111435423 A CN111435423 A CN 111435423A CN 201910029514 A CN201910029514 A CN 201910029514A CN 111435423 A CN111435423 A CN 111435423A
- Authority
- CN
- China
- Prior art keywords
- pattern
- memory array
- input
- memory
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/955—Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
Abstract
双面模式处理器(100)含有多个存储计算单元(100aa‑100mn),每个存储计算单元(100ij)含有至少一存储阵列(170)和一模式处理电路(180)。模式处理器(100形成在一含有第一表面(0a)和第二表面(0b)的半导体衬底(0)上。第一表面(100a)含有存储阵列(170),第二表面(100b)含有模式处理电路(180)。存储阵列(170)和模式处理电路(180)通过多个表面间连接(160)电耦合。
Description
技术领域
本发明涉及集成电路领域,更确切地说,涉及模式处理器。
背景技术
模式处理包括模式匹配和模式识别,它指在目标模式(被检索的模式,targetpattern)中查找与检索模式(用于检索的模式,search pattern)相同或接近的模式。其中,模式匹配要求查找到相同的模式,模式识别仅要求查找到接近的模式。在本说明书中,“模式”包括目标模式和检索模式;“模式库”是指一包含相关模式的数据库,它包括目标模式库或检索模式库。
模式处理应用广泛。常用的模式处理包括代码匹配、字符串匹配、语音识别和图像识别等。代码匹配广泛用于信息安全等领域,其操作包括从网络数据包或计算机文件中查找病毒、或检查它们是否符合规范,从而决定数据是否安全。字符串匹配又被称为关键词检索,它广泛用于大数据分析等领域,其操作包括正规表达式(regular expression)匹配等。语音识别在声学/语言模型库中找到与语音数据最接近的声学/语言模型。图像识别将在图像模型库中找到与图像数据最接近的图像模型。
随着大数据时代的到来,模式库已成为大型数据库。其中,检索模式库(包括相关检索模式,如病毒库、关键词库、声学/语言模型库、图像模型库等)的数据量已经很大,而目标模式库(包括相关目标模式,如整个硬盘上的计算机文件、大数据数据库、语音档案库、图像档案库等)的数据量则更为巨大。遗憾的是,现有处理器的内部存储器无法存储这些模式库,所有模式库都需要存储在外部存储器中,在模式处理时需要频繁地从外部存储器中读取模式。因此,现有的处理器及其架构无法对大型模式库实现快速模式处理。
发明内容
本发明的主要目的是对大型模式库实现高速高效模式处理。
本发明的另一目的是增强信息安全。
本发明的另一目的是增强大数据分析能力。
本发明的另一目的是增强语音识别能力并对语音档案库实现语音检索。
本发明的另一目的是增强图像识别能力并对图像档案库实现图像检索。
为了实现这些以及别的目的,本发明提出一种双面模式处理器,其基本功能是模式处理;更重要的是,大部分模式处理所涉及的模式存储同一芯片中。模式处理器含有成千上万个存储计算单元(简称为储算单元),每个储算单元含有至少一模式存储电路和一模式处理电路。模式存储电路含有存储模式的存储阵列;模式处理电路对所述模式进行模式处理。模式处理器形成在一半导体衬底上,该衬底含有第一表面和第二表面:第一表面含有多个存储阵列,第二表面中含有多个模式处理电路,它们之间通过多个表面间连接电耦合。
这种将存储阵列和模式处理电路形成衬底正反两面的集成方式被称为双面集成。双面集成能提高计算密度。采用传统的二维集成,模式处理器的面积是存储阵列和模式处理电路之和。采用双面集成后,存储阵列从边上移到衬底的另外一面,模式处理器变小,计算密度加强。
第一表面可以采用任何形式的存储器作为模式的载体,如RAM(SRAM、DRAM、MRAM、FRAM等)、或ROM(mask-ROM、OTP、NOR闪存、NAND闪存等);第二表面可以含有任何形式的模式处理电路。由于第一表面中的存储阵列形成在单晶半导体衬底上,其速度很快。此外,存储阵列和模式处理电路之间距离较近(相对于传统的冯·诺依曼架构),读取新模式所需时间很短。另外,表面间连接数量巨大,它可在存储阵列和模式处理电路之间实现超宽带宽。在模式处理时,输入数据被送到所有储算单元中,并同时进行模式处理,从而保证大规模平行计算。由于模式处理器含有成千上万个储算单元,故能对大型模式库实现高速高效模式处理。
相应地,本发明提出一种模式处理器(100),其特征在于含有:一传输至少部分第一模式的输入(110);多个与所述输入(110)电耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一模式处理电路(180),所述存储阵列(170)存储至少部分第二模式,所述模式处理电路(180)对所述第一和第二模式进行模式处理;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述模式处理电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
附图说明
图1A-图1B是对双面模式处理器100的整体介绍:图1A是其电路框图;图1B是其储算单元的电路框图。
图2A是该模式处理器第一表面的透视图;图2B是其第二表面的透视图;图2C是其截面图。
图3A-图3B是一种模式处理器100的第一和第二表面的电路布局图。
图4A-图4C是三种储算单元的电路框图。
图5A-图5C是三种储算单元在第一和第二表面中的电路布局图。
注意到,这些附图仅是概要图,它们不按比例绘图。为了显眼和方便起见,图中的部分尺寸和结构可能做了放大或缩小。在不同实施例中,数字后面的字母后缀表示同一类结构的不同实例;相同的数字前缀表示相同或类似的结构。
在本说明书中,“/”表示“和”或“或”的关系。“存储器”泛指任何基于半导体的信息存储设备,它可以长久或临时存储信息。“存储阵列”是所有共享至少一条地址线的存储元之集合。“电耦合”表示电信号可以从一元件传输到另一元件的、任何形式的耦合。“模式”既可指抽象的模式,也可指模式的物理表现(即与模式相关的数据),本说明书对它们不做区分。
具体实施方式
图1A-图1B是对一种双面模式处理器100的整体介绍。图1A是其电路框图。模式处理器100不仅能处理模式,还能存储模式;更重要的是,它处理的很大部分模式存储在本地且距离很近。模式处理器100含有一个含有m x n个储算单元100aa-100mn的储算阵列。以储算单元100ij为例,它有输入110和输出120。一般说来,一个模式处理器100可以含有成千上万个储算单元100aa-100mn,它支持大规模平行计算。
图1B是其储算单元100ij的电路框图。储算单元100ij含有至少一模式存储电路170和一模式处理电路180,它们之间通过多个表面间连接160(参见图2C)电耦合。每个模式存储电路170含有至少一存储模式的存储阵列,模式处理电路180对该模式进行处理。由于存储阵列170与模式处理电路180位于不同表面,存储阵列170用虚线表示。
图2A是一种模式处理器芯片100第一表面0a的透视图;图2B是其第二表面0b的透视图;图2C是其截面图。该模式处理器芯片100含有一半导体衬底0。该衬底0含有第一表面0a(+z方向)和第二表面0b(-z方向)。在该实施例中,模式处理电路180aa-180bb形成在衬底0的第一表面0a;模式存储电路(存储阵列)170aa-170bb形成在衬底0的第二表面0b,它们之间通过多个表面间连接(160,包括160a-160c) 进行电耦合。表面间连接(160)的例子包括穿透衬底通道孔(TSV’s)。在其它实施例中,存储阵列170aa-170bb形成在衬底0的第一表面0a;模式处理电路180aa-180bb形成在衬底0的第二表面0b。
这种将存储阵列170aa-170bb和模式处理电路180aa-180bb形成衬底0正反两面(0a、0b)的集成方式被称为双面集成。双面集成能提高计算密度。采用传统的二维集成,模式处理器的面积是存储阵列和模式处理电路之和。采用双面集成后,存储阵列从边上移到衬底的另外一面,模式处理器变小,计算密度加强。
第一表面0a可以采用任何形式的存储器作为模式的载体,如RAM(SRAM、DRAM、MRAM、FRAM等)、或ROM(mask-ROM、OTP、NOR闪存、NAND闪存等);第二表面0b可以含有任何形式的模式处理电路。由于第一表面0a中的存储阵列170形成在单晶半导体衬底上,其速度很快。此外,存储阵列170和模式处理电路180之间距离较近(相对于传统的冯·诺依曼架构),读取新模式所需时间很短。另外,表面间连接160数量巨大,它可在存储阵列170和模式处理电路180之间实现超宽带宽。在模式处理时,输入数据被送到所有储算单元中,并同时进行模式处理,从而保证大规模平行计算。由于模式处理器含有成千上万个储算单元(图1A),故能对大型模式库实现高速高效模式处理。
图3A-图3B是一种双面模式处理器100中第一和第二表面0a、0b的电路布局图。该实施例对应于图4A和图5A的实施例。熟悉本领域的专业人士可以很容易地将它推广到图4B和图5B、以及图4C和图5C的实施例中。图3A表示第一表面0a,它含有多个存储阵列170aa-170mn。图4B表示第二表面0b,它含有多个模式处理电路180aa-180mn。图4A和图4B的模式处理器100采用“全对齐”技术,即通过对两个表面0a、0b的电路布局设计实现如下目的:每个存储阵列(如170ij)都有一个模式处理电路(如180ij)与之对齐(参见图5A-图5C)。由于一个模式处理电路(如180ij)可以有多个存储阵列(如170ijA-170ijD、170ijW-170ijZ)与之对齐(参见图5B-图5C),第二表面0b上模式处理电路(如180ij)的周期是第一表面0a上存储阵列(如170ij)周期的整数倍。
图4A-图5C表示三种储算单元100ij。图4A-图4C是其电路框图;图5A-图5C是其电路布局图。在这些实施例中,一个模式处理电路180ij为不同数量的存储阵列170ij服务。
图4A中的模式处理电路180ij为一个存储阵列170ij服务:它对存储在存储阵列170ij中的数据进行处理。图4B中的模式处理电路180ij为四个存储阵列170ijA-170ijD服务:它对存储在存储阵列170ijA-170jiD中的数据进行处理。图4C中的模式处理电路180ij为八个存储阵列170ijA-170ijD和170ijW-170ijZ服务:它对存储在存储阵列170ijA-170ijD和170ijW-170ijZ中的模式进行模式处理。从后面的图5A-图5C可以看出,为更多存储阵列170ij服务的模式处理电路180ij一般占有更大的芯片面积和具有更强的功能。在图4A-图5C中,由于存储阵列170ij与模式处理电路180ij位于不同表面(参见图2A-图2C、图3A-图3B),存储阵列170ij用虚线表示。
图5A-图5C表示第二表面0b的电路布局、以及存储阵列170ij-170ijZ(位于第一表面0a中)在第二表面0b上的投影(用虚线表示)。图5A的实施例对应于图4A的实施例。在该实施例中,储算单元100ij中的模式处理电路180ij位于第二表面0b的第二半导体衬底0b中。模式处理电路180ij被存储阵列170ij至少部分覆盖。
在本实施例中,模式处理电路180ij的周期等于存储阵列170ij的周期、面积不能超过存储阵列170ij在第二芯片100b上的投影面积,故功能有限。该实施例较适于实现较简单的数据处理。图5B-图5C披露了两种复杂模式处理电路180ij。
图5B的实施例对应于图4B的实施例。在该实施例中,储算单元100ij的模式处理电路180ij位于第二表面0b中,它们被四个存储阵列170ijA-170ijD至少部分覆盖。在四个存储阵列170ijA-170ijD下方,模式处理电路180ji可以自由布局。图5B中的模式处理电路180ij的周期是图5A中存储阵列170ij周期的两倍、面积是其四倍,故能实现较复杂的处理功能。
图5C的实施例对应于图4C中的实施例。在该实施例中,储算单元100ij中的模式处理电路180ij位于第二表面0b中。这八个存储阵列170ijA-170ijD、170ijW-170ijZ分为两组170ijSA、170jiSB。每组(如170ijSA)包括四个存储阵列(如170ijA-170ijD)。在第一组170SA的四个存储阵列170ijA-170ijD下方,第一模式处理电路组件180ijA可以自由布局。类似地,在第二组170ijSB的四个存储阵列170ijW-170ijZ下方,第二模式处理电路组件180ijB可以自由布局。第一模式处理电路组件180ijA和第二模式处理电路组件180ijB构成模式处理电路180ij。布线通道182、184、186供不同模式处理电路组件180ijA、180ijB之间、或不同模式处理电路之间实现电耦合。图5C中的模式处理电路180ij的周期是图5A中存储阵列170ij周期的四倍(x方向)、面积是其八倍,它能实现更复杂的处理功能
模式处理器100可以采用两种方式——类处理器方式和类存储器方式。类处理器的模式处理器100是一种自带检索模式库的模式处理器,它能用其本地存储的检索模式对来自输入110的目标模式进行模式处理。具体说来,检索模式库(如病毒库、关键词库、声学/语言模型库、图像模型库等)存储在存储阵列170中;输入数据110包括目标模式(如网络数据包、计算机文件、大数据、语音数据、图像数据等);模式处理电路180根据检索模式对目标模式进行模式处理。由于数量众多的储算单元100ij(成千上万,图1A)支持大规模平行处理、且表面间连接160具有大带宽(图2C),模式处理器100的检索速度快、效率高。
相应地,本发明提出一种自带检索模式库的双面模式处理器(100),其特征在于含有:一传输至少部分目标模式的输入(110);多个与所述输入(110)电耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一模式处理电路(180),所述存储阵列(170)存储至少部分检索模式,所述模式处理电路(180)根据所述检索模式对所述目标模式进行模式处理;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述模式处理电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
类存储器的模式处理器100是一种自带模式处理功能的模式存储器,其主要功能是存储目标模式库,次要功能是用来自输入110的检索模式对其存储的目标模式进行检索。具体说来,目标模式库(如整个硬盘上的计算机文件、大数据数据库、语音档案库、图像档案库)存储并分布在存储阵列170中;输入数据110是检索模式(如病毒标识、关键词、声学/语言模型、图像模型等);模式处理电路180根据检索模式对目标模式进行模式匹配或模式识别。由于数量众多的储算单元100ij(成千上万,图1A)支持大规模平行处理、且表面间连接160具有大带宽(图2A-图2C),模式存储器100的模式处理速度快、效率高。
像闪存一样,多个自带模式处理功能的模式存储器100可以封装成存储卡(如SD卡、TF卡)或固态硬盘(即SSD),用于存储具有海量数据的目标模式库。尤其重要的是,它们还自带模式处理(如检索)功能。由于每个储算单元100ij都自带模式处理电路180,它仅需检索本地(处于同一储算单元100ij)存储阵列170中存储的目标模式。因此,不论存储卡或固态硬盘的容量有多大,其检索时间均接近检索单一存储阵列170所需的时间。换句话说,数据库的检索时间与数据库的容量无关,大多数情况下为秒级。
与之比较,在传统的冯·诺依曼架构中,处理器(CPU)和存储器(硬盘)相互物理分隔,数据库检索首先需要把数据库从硬盘中读出。由于CPU与硬盘之间系统总线的带宽有限,数据库的检索时间受限于数据库的读出时间。因此,数据库的检索时间与数据库的大小成正比。一般说来,基于数据库的大小,检索时间从数分钟到数小时,甚至更长。相比之下,自带模式处理功能的模式存储器100在数据库检索方面优势明显。
在自带模式处理功能的模式存储器100对大型数据库(即目标模式库)进行模式处理时,模式处理电路180仅需完成部分模式处理功能。比如说,模式处理电路180仅需对数据库完成简单的初步模式处理(如字符串匹配、代码匹配)。经过该初步模式处理筛选后剩下的数据(即目标模式)再通过输出120送到更强大的外置处理器(如CPU、GPU)中完成最终的模式处理。由于数据库中的大部分数据会被简单模式处理筛选掉,从模式存储器100中输出的数据仅占整个数据库的小部分,这能极大降低输出120的带宽压力。
相应地,本发明提出一种自带模式处理功能的双面模式存储器(100),其特征在于含有:一传输至少部分检索模式的输入(110);多个与所述输入(110)电耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一模式处理电路(180),所述存储阵列(170)存储至少部分目标模式,所述模式处理电路(180)根据所述检索模式对所述目标模式进行模式处理;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述模式处理电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
以下就模式处理器100的应用做一介绍,其应用的领域包括:A)信息安全、B)大数据分析、C)语音识别、D)图像识别等。这些应用的例子包括:a)信息安全处理器;b)可查毒的存储器;c)数据分析处理器;d)可检索的存储器;e)语音识别处理器;f)可检索的语音存储器;g)图像识别处理器;h)可检索的图像存储器。
A)信息安全。
信息安全包括网络安全和计算机安全。增强网络安全的主要手段是对网络数据包中的病毒进行查毒;增强计算机安全的主要手段是对计算机文件(包括计算机软件)中的病毒进行查毒。广义地讲,病毒(virus,也被称为malware等)包括网络病毒、计算机病毒、违反网络规范的软件和违反文件规范的文件等。在查毒过程中,处理器将网络数据包/计算机文件与一病毒库中所有病毒标识(virus patterns或virus signatures)逐一进行比较。在发现病毒标识后,对含有病毒标识的部分进行隔离或删除。
目前,病毒库日益增大,其大小已经达到数百MB;而需要查毒的计算机数据更加庞大,它们为GB级、TB级,甚至更大。另一方面,由于传统处理器中内核数量有限(如CPU中内核数目最多有数十个、GPU中内核数目最多有数百个)、每个内核一般一次只能甄别一条病毒,这导致查毒的平行度低。此外,由于采用冯·诺依曼架构,处理器和存储器相互物理分隔,每读取一条新的病毒标识需要较长时间。因此,传统处理器及其架构在处理信息安全事务时速度慢、效率低。
为了增强信息安全,本发明提出多种模式处理器100。它可以采用类处理器方式和类存储器方式:当采用类处理器方式时,模式处理器100为一信息安全处理器,即增强信息安全的处理器;当采用类存储器方式时,模式处理器100为一可查毒的存储器,即兼具查毒功能的存储器。
a)信息安全处理器。
为了保证信息安全,本发明提出一种信息安全处理器100。它在一网络数据包或一计算机文件中检索病毒库中的各种病毒标识;一旦与一病毒标识匹配,则该网络数据包或计算机文件含有相应的病毒。信息安全处理器100可以在网络或计算机中作为独立处理器,也可以集成到网络处理器、计算机的处理器(如CPU)或存储器(如硬盘)中。
在信息安全处理器100中,不同储算单元100ij中的存储阵列170存储不同病毒标识。换句话说,病毒库存储并分布在处理器100的各个储算单元100ij中。一旦输入110传来一网络数据包或计算机文件,所述网络数据包或计算机文件中的至少部分数据被发送到所有储算单元100ij中。在各个储算单元100ij中,模式处理电路180在该部分数据中检索存储在当地存储阵列170中的各种病毒标识。一旦与一病毒标识匹配,则该网络数据包或计算机文件含有相应的病毒。
上述查毒过程在所有储算单元100ij中同时进行。由于信息安全处理器100含有数量众多(成千上万个)的储算单元100ij,它支持大规模平行查毒。此外,由于表面间连接160数量众多、模式处理电路180与存储阵列170之间距离很近(相对于传统的冯·诺依曼架构),模式处理电路180可以很容易从其中读取新的病毒标识。因此,信息安全处理器100具有很快的查毒速度和很高的查毒效率。在该实施例中,模式处理电路180是一代码匹配电路。
相应地,本发明提出一种信息安全处理器(100),其特征在于含有:一传输至少一网络数据包或一计算机文件中的至少部分数据的输入(110);多个与所述输入(110)电耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一代码匹配电路(180),所述存储阵列(170)存储至少部分病毒标识,所述代码匹配电路(180)在所述数据中检索所述病毒标识;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述代码匹配电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
b)可查毒的存储器。
在新发现的病毒时,需要对整个计算机硬盘(如机械硬盘、固态硬盘)上存储的数据查毒。这种全盘查毒对传统的冯·诺依曼架构来说非常困难。由于计算机硬盘上存储海量的数据,光从硬盘中读出所有计算机数据都要花费大量时间,更不要说对它查毒。在传统的冯·诺依曼架构中,全盘查毒所需的时间与硬盘大小成正比。
为了缩短全盘查毒所需的时间,本发明提出一种可查毒的存储器100。其主要功能是计算机存储,次要功能是在存储本地对所存储的数据进行查毒。像闪存一样,多个可查毒的存储器100可以封装成存储卡或固态硬盘,用于存储海量的数据、并自带查毒功能。
在可查毒的存储器100中,不同储算单元100ij中的存储阵列170存储不同的数据。换句话说,海量的计算机文件存储并分布在存储卡或固态硬盘中各个可查毒的存储器100的储算单元100ij中。当一个新病毒被发现后需要进行全盘查毒时,将其病毒标识作为输入110发送到所有储算单元100ij中,然后模式处理电路180在当地存储阵列170存储的数据中检索该病毒标识。
上述查毒过程在所有储算单元100ij中同时进行,每个储算单元100ij所需的查毒时间相似。由于采用大规模平行查毒,不论存储卡和固态硬盘的容量有多大,其查毒时间均接近单一储算单元100ij的查毒时间,一般为秒级。与之比较,传统的全盘查毒需要数分钟到数小时,甚至更长。在该实施例中,模式处理电路180是一代码匹配电路。
相应地,本发明提出一种可查毒的存储器(100),其特征在于含有:一传输至少部分病毒标识的输入(110);多个与所述输入(110)电耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一代码匹配电路(180),所述存储阵列(170)存储至少一计算机文件中的至少部分数据,所述代码匹配电路(180)在所述数据中检索所述病毒标识;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述代码匹配电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
B)大数据分析。
大数据是巨量数据的集合,它主要涉及非结构化数据或半结构化数据。大数据分析的一个重要组成部分是关键词检索(包括字符串匹配,如正则表达式匹配)。目前,关键词库日益增大,大数据数据库更加庞大。对于如此大的关键词库和大数据数据库,传统处理器及其架构很难对非结构化数据或半结构化数据进行高速高效检索。
为了提高大数据分析的效率,本发明提出多种模式处理器100。它可采用类处理器方式和类存储器方式:当采用类处理器方式时,模式处理器100为一数据分析处理器,即用于大数据分析的处理器;当采用类存储器方式时,模式处理器100为一可检索的存储器,即兼具检索功能的存储器。
c)数据分析处理器。
为了实现对输入数据的高速高效检索,本发明提出一种数据分析处理器100,它在一输入数据中检索一关键词库中的关键词。在数据分析处理器100中,不同储算单元100ij中的存储阵列170存储不同关键词。换句话说,关键词库存储并分布在处理器100的各个储算单元100ij中。来自输入110的数据被发送到所有储算单元100ij中。在各个储算单元100ij中,模式处理电路180在输入数据中检索存储在当地存储阵列170中的各个关键词。
上述检索过程在所有储算单元100ij中同时进行。由于它含有数量众多(成千上万个)的储算单元100ij,处理器100支持大规模平行检索。此外,由于表面间连接160数量众多、且模式处理电路180与存储阵列170之间距离很近(相对于传统的冯·诺依曼架构),模式处理电路180可以很容易从本地的存储阵列170中读取关键词。因此,处理器100对非结构化数据和半结构化数据具有很快的检索速度和很高的检索效率。
在该实施例中,模式处理电路180为一字符串匹配电路。字符串匹配电路可以通过内容寻址存储器(content addressable memory,简称为CAM)或一含有异或门(XOR)的比较器来实现。此外,关键词可由正则表达式表示。这时,字符串匹配电路180通过有限状态自动机(finite-state automata,简称为FSA)来实现。
相应地,本发明提出一种数据分析处理器(100),其特征在于含有:一传输至少部分数据的输入(110);多个与所述输入(110)电耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一字符串匹配电路(180),所述存储阵列(170)存储至少部分关键词,所述字符串匹配电路(180)在所述数据中检索所述关键词;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述字符串匹配电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
d)可检索的存储器。
大数据分析经常需要对整个数据库进行检索,即全库检索。由于大数据数据库非常庞大,少则GB级,多则TB即、甚至更高,传统的冯·诺依曼架构对全库检索非常困难:光读出数据库都要花费大量时间,更不要说对它检索。在传统的冯·诺依曼架构中,全库检索时间与数据库大小成正比。
为了提高全库检索的速度和效率,本发明提出一种可检索的存储器100。该可检索的存储器100的主要功能是数据库存储,次要功能是在本地对数据库进行检索。像闪存一样,多个可检索的存储器100可以封装成存储卡或固态硬盘,用于存储大数据数据库、并自带检索功能。在该实施例中,模式处理电路180也为一字符串匹配电路。
在可检索的存储器100中,不同储算单元100ij中的存储阵列170存储数据库中的不同数据。换句话说,数据库存储并分布在存储卡或固态硬盘中各个可检索的存储器100的储算单元100ij中。在检索时,将关键词传输至输入110、并发送到所有储算单元100ij中。在各个储算单元100ij中,模式处理电路180在当地存储阵列170的数据中检索该关键词。
上述检索过程在所有储算单元100ij中同时进行;每个储算单元100ij所需的检索时间相似。由于采用大规模平行检索,不论存储卡和固态硬盘的容量有多大,其检索时间均接近对单一储算单元100ij所需的检索时间,一般为秒级。与之比较,传统的全库检索需要数分钟到数小时,甚至更长。
相应地,本发明提出一种可检索的存储器(100),其特征在于含有:一传输至少部分关键词的输入(110);多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一字符串匹配电路(180),所述存储阵列(170)存储至少部分数据,所述字符串匹配电路(180)在所述数据中检索所述关键词;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述字符串匹配电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
C)语音识别。
模式处理的一个典型应用是语音识别。语音识别的一种手段是根据声学模型库和语言模型库对用户语音进行模式识别。其中,声学模型库存储大量的声学模型;语言模型库存储大量的语言模型。在识别时,模式处理电路180根据声学/语言模型库对用户语音数据进行模式识别,寻找最接近的声学/语言模型。由于传统处理器(如CPU、GPU)内核数量有限、模式识别平行度较低,且声学/语言模型库存储在外存中,故传统处理器及其架构在处理语音识别时速度慢、效率低。
e)语音识别处理器。
为了提高语音识别的效率,本发明提出一种语音识别处理器100。在该语音识别处理器100中,用户产生的语音数据作为输入110送至每个储算单元100ij,存储阵列170存储声学/语言模型库中的至少部分模型数据,模式处理电路180根据存储在存储阵列170中的模型数据对来自输入110的语音数据进行语音识别。在该实施例中,模式处理电路180为一语音识别电路。
相应地,本发明提出一种语音识别处理器(100),其特征在于含有:一传输至少部分语音数据的输入(110);多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一语音识别电路(180),所述存储阵列(170)存储至少部分声学/语言模型,所述语音识别电路(180)利用所述模型对所述语音数据进行语音识别;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述语音识别电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
f)可检索的语音存储器。
为了在语音数据库(如语音档案库)中实现语音检索,本发明还提出一种可检索的语音存储器100。在可检索语音存储器100中,将需要查找的语音数据转化成声学/语言模型作为输入110送至每个储算单元100ij。用户产生的语音数据存储在存储阵列170中。换句话说,语音数据库存储并分布在可检索的语音存储器100的各个储算单元100ij中。模式处理电路180根据声学/语言模型对语音数据进行语音识别及检索。在该实施例中,模式处理电路180为一语音识别电路。
相应地,本发明提出一种可检索的语音存储器(100),其特征在于含有:一传输至少部分声学/语言模型的输入(110);多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一语音识别电路(180),所述存储阵列(170)存储至少部分语音数据,所述语音识别电路(180)利用所述模型对所述语音数据进行语音识别;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述语音识别电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
D)图像识别。
模式处理的另一个典型应用是图像识别。图像识别的一种手段是根据图像模型库对用户图像进行模式识别。其中,图像模型库存储大量的图像模型。在识别时,模式处理器根据图像模型库中的图像模型对用户图像数据进行模式识别,寻找最接近的图像模型。由于传统处理器(如CPU、GPU)内核数量有限、模式识别平行度较低,且图像模型库存储在外存中,故传统处理器在处理图像识别时速度慢、效率低。
g)图像识别处理器。
为了提高图像识别的效率,本发明提出一种图像识别处理器100。在图像识别处理器100中,用户产生的图像数据作为输入110送至每个储算单元100ij,存储阵列170存储至少部分图像模型,模式处理电路180根据存储在存储阵列170中的图像模型对来自输入110的图像数据进行图像识别。在该实施例中,模式处理电路180为一图像识别电路。
相应地,本发明提出一种图像识别处理器(100),其特征在于含有:一传输至少部分图像数据的输入(110);多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一图像识别电路(180),所述存储阵列(170)存储至少部分图像模型,所述图像识别电路(180)利用所述模型对所述图像数据进行图像识别;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述图像识别电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
h)可检索的图像存储器。
为了在图像数据库(如图像档案库)中实现图像检索,本发明还提出一种可检索的图像存储器100。在可检索图像存储器100中,将需要查找的图像数据转化成图像模型作为输入110送至每个储算单元100ij。用户产生的图像数据存储在存储阵列170中。换句话说,图像数据库存储并分布在可检索的图像存储器100的各个储算单元100ij中。模式处理电路180根据图像模型对图像数据进行图像识别及检索。在该实施例中,模式处理电路180为一图像识别电路。
本发明还提出一种可检索的图像存储器(100),其特征在于含有:一传输至少部分图像模型的输入(110);多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一图像识别电路(180),所述存储阵列(170)存储至少部分图像数据,所述图像识别电路(180)利用所述模型对所述图像数据进行图像识别;一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述图像识别电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
应该了解,在不远离本发明的精神和范围的前提下,可以对本发明的形式和细节进行改动,这并不妨碍它们应用本发明的精神。因此,除了根据附加的权利要求书的精神,本发明不应受到任何限制。
Claims (10)
1.一种双面模式处理器(100),其特征在于含有:
一传输至少部分第一模式的输入(110);
多个与所述输入(110)电耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一模式处理电路(180),所述存储阵列(170)存储至少部分第二模式,所述模式处理电路(180)对所述第一和第二模式进行模式处理;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述模式处理电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
2.一种自带检索模式库的双面模式处理器(100),其特征在于含有:
一传输至少部分目标模式的输入(110);
多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一模式处理电路(180),所述存储阵列(170)存储至少部分检索模式,所述模式处理电路(180)根据所述检索模式对所述目标模式进行模式处理;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述模式处理电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
3.一种自带模式处理功能的双面模式存储器(100),其特征在于含有:
一传输至少部分检索模式的输入(110);
多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一模式处理电路(180),所述存储阵列(170)存储至少部分目标模式,所述模式处理电路(180)根据所述检索模式对所述目标模式进行模式处理;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述模式处理电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
4.一种信息安全处理器(100),其特征在于含有:
一传输至少一网络数据包或一计算机文件中的至少部分数据的输入(110);
多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一代码匹配电路(180),所述存储阵列(170)存储至少部分病毒标识,所述代码匹配电路(180)在所述数据中检索所述病毒标识;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述代码匹配电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
5.一种可查毒的存储器(100),其特征在于含有:
一传输至少部分病毒标识的输入(110);
多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一代码匹配电路(180),所述存储阵列(170)存储至少一计算机文件中的至少部分数据,所述代码匹配电路(180)在所述数据中检索所述病毒标识;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述代码匹配电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
6.一种数据分析处理器(100),其特征在于含有:
一传输至少部分数据的输入(110);
多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一字符串匹配电路(180),所述存储阵列(170)存储至少部分关键词,所述字符串匹配电路(180)在所述数据中检索所述关键词;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述字符串匹配电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
7.一种可检索的存储器(100),其特征在于含有:
一传输至少部分关键词的输入(110);
多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一字符串匹配电路(180),所述存储阵列(170)存储至少部分数据,所述字符串匹配电路(180)在所述数据中检索所述关键词;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述字符串匹配电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
8.一种语音/图像识别处理器(100),其特征在于含有:
一传输至少部分语音/图像数据的输入(110);
多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一语音/图像识别电路(180),所述存储阵列(170)存储至少部分声学/语言/图像模型,所述语音/图像识别电路(180)利用所述模型对所述语音/图像数据进行语音/图像识别;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述语音/图像识别电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
9.一种可检索的语音/图像存储器(100),其特征在于含有:
一传输至少部分声学/语言/图像模型的输入(110);
多个与所述输入(110)耦合的储算单元(100aa-100mn),每个储算单元(100ij)含有至少一存储阵列(170)和一语音/图像识别电路(180),所述存储阵列(170)存储至少部分语音/图像数据,所述语音/图像识别电路(180)利用所述模型对所述语音/图像数据进行语音/图像识别;
一含有第一表面(0a)和第二表面(0b)的半导体衬底(0),所述第一表面(0a)含有所述存储阵列(170),所述第二表面(0b)含有所述语音/图像识别电路(180),所述第一表面(0a)与所述第二表面(0b)通过多个表面间连接(160)电耦合。
10.根据权利要求1-9所述的处理器或存储器(100),其特征还在于具有如下a)-e)中特征中至少一种特征:
a)所述存储阵列(170)在所述第二表面(0b)上的投影与所述模式处理电路(180)至少部分重合;
b)每个存储阵列(170)有一模式处理电路(180)与之对齐;
c)每个模式处理电路(180)有至少一存储阵列(170)与之对齐;
d)模式处理电路(180)的周期是存储阵列(170)周期的整数倍;
e)所述表面间连接(160)为穿透硅片通道孔(TSV’s)。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910029514.2A CN111435423A (zh) | 2019-01-13 | 2019-01-13 | 双面模式处理器 |
US16/248,933 US10714172B2 (en) | 2017-09-21 | 2019-01-16 | Bi-sided pattern processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910029514.2A CN111435423A (zh) | 2019-01-13 | 2019-01-13 | 双面模式处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111435423A true CN111435423A (zh) | 2020-07-21 |
Family
ID=71579833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910029514.2A Pending CN111435423A (zh) | 2017-09-21 | 2019-01-13 | 双面模式处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111435423A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169404A (zh) * | 2016-03-07 | 2017-09-15 | 杭州海存信息技术有限公司 | 含有三维存储阵列的分布式模式处理器 |
CN107220704A (zh) * | 2016-03-21 | 2017-09-29 | 杭州海存信息技术有限公司 | 含有三维存储阵列的集成神经网络处理器 |
CN107305594A (zh) * | 2016-04-22 | 2017-10-31 | 杭州海存信息技术有限公司 | 含有三维存储阵列的处理器 |
CN108053848A (zh) * | 2018-01-02 | 2018-05-18 | 清华大学 | 电路结构及神经网络芯片 |
-
2019
- 2019-01-13 CN CN201910029514.2A patent/CN111435423A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169404A (zh) * | 2016-03-07 | 2017-09-15 | 杭州海存信息技术有限公司 | 含有三维存储阵列的分布式模式处理器 |
CN107301222A (zh) * | 2016-03-07 | 2017-10-27 | 杭州海存信息技术有限公司 | 兼具数据分析功能的大数据存储器 |
CN107317803A (zh) * | 2016-03-07 | 2017-11-03 | 杭州海存信息技术有限公司 | 增强网络安全的处理器 |
CN107316014A (zh) * | 2016-03-07 | 2017-11-03 | 杭州海存信息技术有限公司 | 兼具图像识别功能的存储器 |
CN107358254A (zh) * | 2016-03-07 | 2017-11-17 | 杭州海存信息技术有限公司 | 用于图像识别的处理器 |
CN107358100A (zh) * | 2016-03-07 | 2017-11-17 | 杭州海存信息技术有限公司 | 增强计算机安全的处理器 |
CN107357828A (zh) * | 2016-03-07 | 2017-11-17 | 杭州海存信息技术有限公司 | 兼具语音识别功能的存储器 |
CN107392017A (zh) * | 2016-03-07 | 2017-11-24 | 杭州海存信息技术有限公司 | 兼具查毒功能的存储器 |
CN107393537A (zh) * | 2016-03-07 | 2017-11-24 | 杭州海存信息技术有限公司 | 用于语音识别的处理器 |
CN107220704A (zh) * | 2016-03-21 | 2017-09-29 | 杭州海存信息技术有限公司 | 含有三维存储阵列的集成神经网络处理器 |
CN107305594A (zh) * | 2016-04-22 | 2017-10-31 | 杭州海存信息技术有限公司 | 含有三维存储阵列的处理器 |
CN108053848A (zh) * | 2018-01-02 | 2018-05-18 | 清华大学 | 电路结构及神经网络芯片 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9818455B2 (en) | Query operations for stacked-die memory device | |
CN107316014B (zh) | 兼具图像识别功能的存储器 | |
JP6639420B2 (ja) | フラッシュ最適化データ・レイアウトのための方法、フラッシュ最適化記憶のための装置、およびコンピュータ・プログラム | |
US10482087B2 (en) | Storage system and method of operating the same | |
US10474690B2 (en) | Disjunctive rule mining with finite automaton hardware | |
US20190220680A1 (en) | Distributed Pattern Processor Package | |
CN111831750A (zh) | 一种区块链数据分析方法、装置、计算机设备及存储介质 | |
US20190370465A1 (en) | Searchable Storage | |
CN111435423A (zh) | 双面模式处理器 | |
US10714172B2 (en) | Bi-sided pattern processor | |
Lee et al. | HYTREM-a hybrid text-retrieval machine for large databases | |
US10108377B2 (en) | Storage processing unit arrays and methods of use | |
Liu et al. | A customized many-core hardware acceleration platform for short read mapping problems using distributed memory interface with 3D–stacked architecture | |
CN110414303A (zh) | 含有三维纵向存储阵列的模式处理器 | |
CN109145683A (zh) | 兼具图像识别功能的存储器 | |
Fajardo et al. | Multiprocess Implementation of DNA Pre-alignment Filtering using the Bit Matrix Algorithm | |
Zhou et al. | Multimedia Content-Based Visual Retrieval | |
US20190158510A1 (en) | Monolithic Three-Dimensional Pattern Processor | |
CN112597098A (zh) | 分离的三维处理器 | |
Sirajidin et al. | Deep Hashing Network Based on Split Channels for Hybrid-Source Remote Sensing Image Retrieval | |
Capuccini | Structure-Based Virtual Screening in Spark | |
Foo et al. | Using redundant bit vectors for near-duplicate image detection | |
CN109145597A (zh) | 增强网络安全的处理器 | |
CN109144401A (zh) | 兼具查毒功能的存储器 | |
CN109145596A (zh) | 增强计算机安全的处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |