CN115660079A - 用于特征选择的忆阻器遗传算法的加速器及其操作方法 - Google Patents
用于特征选择的忆阻器遗传算法的加速器及其操作方法 Download PDFInfo
- Publication number
- CN115660079A CN115660079A CN202211339578.0A CN202211339578A CN115660079A CN 115660079 A CN115660079 A CN 115660079A CN 202211339578 A CN202211339578 A CN 202211339578A CN 115660079 A CN115660079 A CN 115660079A
- Authority
- CN
- China
- Prior art keywords
- module
- memristor
- array
- data
- memristor array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Complex Calculations (AREA)
Abstract
本发明公开了一种用于特征选择的忆阻器遗传算法的加速器及其操作方法,加速器包括第一控制模块、忆阻器阵列模块、第二控制模块和处理器模块;第一控制模块将处理器模块发送的数据转换为模拟量后输入至忆阻器阵列模块中,并在解更新阶段更新忆阻器阵列模块存储单元的状态;忆阻器阵列模块存储特征子集,并实现忆阻器单元在阵列中的原位更新;第二控制模块接收忆阻器阵列模块的电流信号,并将其转换为电压信号,再将电压信号转换为数字信号后传输至处理器模块;处理器模块在适应度计算阶段发送预处理后的数据到第一控制模块,接收并处理第二控制模块输出的数字信号。本发明减少了数据传输的过程,降低了电路开销,有效的减少了运算时间和功耗。
Description
技术领域
本发明属于智能优化技术领域,更具体地,涉及一种用于特征选择的忆阻器遗传算法的加速器及其操作方法。
背景技术
随着大数据和人工智能的兴起,数据特征的维度也在日渐增加,使得数据快速分类和提取变得越来越困难。在此背景下,数据特征的选择引起了越来越多的关注,特征选择是机器学习中的一项关键的任务,目的在于保持学习性能的同时,降低特征的维数。一些过滤式的求解方法,如皮尔森相关系数、卡方验证等方法,虽然能够快速选择特征,但是对选择特征的质量没有保证;而一些包装式的求解方法,如前向搜索、元启发式算法等,能够保证所选特征的质量,但是需要循环迭代,耗费大量时间。
遗传算法是元启发式算法之一,因其具有大规模寻找解的能力,被广泛的用于解决特征选择问题。但是,随着特征维度的增加,基于冯·诺依曼架构实现的遗传算法,大量的时间和功耗花费在存储器和处理器的传输中。
因此需要一种新型的计算范式来解决这个问题。
发明内容
针对现有技术的缺陷,本发明提供了一种用于特征选择的忆阻器遗传算法的加速器及其操作方法,其目的在于解决现有遗传算法求解特征选择问题中运算时间长以及功耗大的问题。
本发明提供了一种用于特征选择的忆阻器遗传算法的加速器,包括:第一控制模块、忆阻器阵列模块、第二控制模块和处理器模块;第一控制模块与忆阻器阵列模块相连,忆阻器阵列模块与第二控制模块双向连接,第二控制模块与处理器模块双向连接,处理器模块与第一控制模块相连;第一控制模块用于接收处理器模块发送的数据,且将其转换为模拟量后输入至忆阻器阵列模块中,并在解更新阶段更新忆阻器阵列模块存储单元的状态;忆阻器阵列模块用于存储特征子集,并根据基尔霍夫定律Ij=∑GijVi,实现向量矩阵乘法的模拟运算,并在第一控制单元和第二控制单元的协同操作下,实现忆阻器单元在阵列中的原位更新;第二控制模块用于接收忆阻器阵列模块计算得到的电流信号,并将电流信号转换为电压信号,再将所述电压信号转换为数字信号后传输至处理器模块中;处理器模块用于在适应度计算阶段发送预处理后的数据到第一控制模块,接收并处理所述第二控制模块输出的数字信号;其中,Ij为忆阻器阵列中第j列的电流,Gij为忆阻器阵列中每个忆阻器单元的电导,Vi为忆阻器阵列中第i行施加的电压。
更进一步地,第一控制模块包括数据输入单元和行控制单元;所述数据输入单元包括n个数模转换器,用于将处理器模块发送的数据转换为模拟量并输出到所述行控制单元中;行控制单元用于在适应度计算阶段选择Vdata作为输入到忆阻器阵列模块行线上的数据,并在解更新阶段根据当前进行的操作选择连接对应的模拟信号。
更进一步地,行控制单元包括第一模拟多路选择器,所述模拟多路选择器的六个输入端依次连接S1[2:0]信号、Vdata信号、Vset信号、Vreset信号、Vread信号和Vp信号,所述模拟多路选择器的输出端与所述忆阻器阵列模块的输入端连接;其中,Vdata是所述数据输入单元转化后的模拟电压,S1[2:0]是来自所述处理器模块的选择信号,Vset和Vreset分别是忆阻器件的set电压和reset电压,Vread是器件的读电压,Vp是保护电压。
更进一步地,忆阻器阵列模块包括第一忆阻阵列和第二忆阻阵列;第一忆阻阵列用于存储算法中的特征子集,并在阵列内部进行向量矩阵乘法的计算,在解更新阶段通过阵列中实现的交叉操作,在第二忆阻阵列中产生新的特征子集;所述第二忆阻阵列用于存储算法中的特征子集,并在阵列内部进行向量矩阵乘法的计算,在解更新阶段通过阵列中实现的交叉操作,在第二忆阻阵列中产生新的特征子集。
更进一步地,第二控制模块包括列控制单元和输出采集单元;所述列控制单元用于在适应度计算阶段将一列得到的电流数据转换为电压数据,并通过所述输出采集单元将数字信号传输到处理器模块中,并在解更新阶段,根据所进行的操作选择相应的端口信号输出。
更进一步地,列控制单元包括2m个第二模拟多路选择器,每个模拟多路选择器的结构相同,均包括5个输入端口,依次连接选择信号S2[1:0]、有跨阻放大器TIA、保护电压Vp、操作电压VDD和地线GND;所述输出采集单元包括2m个模数转换电路,用于将模拟量转化成数字量并传输至所述处理器模块中。
更进一步地,有跨阻放大器TIA包括电阻R1和放大器;所述放大器的反向输入端作为所述有跨阻放大器的输入端,所述放大器的正向输入端接地,所述放大器的输出端作为所述有跨阻放大器的输出端;所述电阻R1连接在所述放大器的反向输入端与输出端之间。
本发明还提供了一种基于上述的加速器的操作方法,包括下述步骤:
S1进行数据集的预处理:
通过贝叶斯分类器计算方法在处理器模块中得到各个特征和各个分类类别的统计概率,并进行拉普拉斯平滑,将得到的数据进行取对数操作,并进行归一化后发送至数据输入单元;
S2参数初始化:
给定种群规模NP、交叉率、变异率、锦标赛选择的数量和最大迭代次数,并通过生成随机的初始解集获得种群;
将生成的初始种群映射并存储到第一忆阻阵列中,并设置第二忆阻阵列中的忆阻单元为高阻态;
S3通过适应度函数计算来评价种群的好坏;
S4种群更新步骤:
通过行控制单元和列控制单元来更新存储在忆阻器阵列上的种群实现交叉操作和变异操作;
S5重复步骤S3和步骤S4直到完成设置的迭代次数;
S6当迭代完成后读取忆阻器阵列模块,并采用阵列中选择的特征额外进行一次适应度函数的计算,该函数由分类的准确度和所选择特征的长度决定,即Fitness=(1-α)×Acc+α×(1-L),其中α∈(0,1),Acc为分类的准确度,L为所选特征长度占总特征长度的比例,选择适应度值最大的特征子集作为最终选择的结果。
更进一步地,步骤S3具体为:处理器模块将归一化后的数据传输到数据输入单元,经过数模转换器转换为电压数据后施加到忆阻器阵列模块的行输入端口,根据欧姆定律和基尔霍夫定律,在列上得到输入电压与对应忆阻器单元电导的累加电流结果,经过跨阻放大器将电流信号转换为电压信号,在通过模数转换器转换为数字信号后,传输到输出采集单元,最终在处理器模块中计算适应度函数。
更进一步地,步骤S4具体为:
根据适应度计算的结果,将原种群中优秀的个体交叉配对后,产生新个体从而实现交叉操作;
随机更新种群中的部分位置使其产生变化从而实现变异操作。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
(1)本发明提供的一种用于特征选择的忆阻器遗传算法的加速器,利用忆阻阵列结构,将选择的特征映射并存储到阵列中,通过模拟计算的方式,在硬件上一步实现向量矩阵乘法运算,减少了数据传输的过程,降低了电路开销,有效的减少了运算时间和功耗。
(2)本发明提供的一种忆阻器遗传算法的操作方法,将忆阻器逻辑实现方法和遗传算法的交叉操作结合,通过外围电路的控制,直接在忆阻阵列上交叉解集,减少了数据从阵列中先读出、再进行更新的步骤,减少了迭代更新解集时消耗的时间和能量。
(3)本发明提供的一种忆阻器遗传算法的操作方法,为了更好地适应忆阻阵列的操作,提出了两步变异操作的遗传算法,在保持算法的性能的同时,降低了在忆阻器阵列上进行变异操作的复杂度。
(4)本发明提供的基于忆阻器件的遗传算法加速器,能够实现存算一体架构,相较于CMOS电路结构,具有更高的集成密度、更低的功耗和更快的运算速度,能够进一步发挥遗传算法大规模求解的优势,适用于处理特征维度较高的领域,如金融、生物医学、电子信息等。
附图说明
图1是本发明提供的用于特征选择的忆阻器遗传算法的加速器结构示意图;
图2是本发明提供的行控制单元的结构示意图;
图3是本发明提供的忆阻器阵列的结构示意图;
图4是本发明提供的忆阻器阵列运算方式示意图;
图5是本发明提供的列控制单元的结构示意图;其中,(a)为列控制单元的模拟多路选择器结构示意图;(b)为跨阻放大器的结构示意图;
图6是本发明提供的忆阻遗传算法求解流程示意图;
图7是本发明提供的在忆阻器阵列中交叉操作的示意图;其中,(a)为忆阻器逻辑操作中的复制操作;(b)为忆阻器阵列中交叉操作的实现方式;
图8是本发明提供的在忆阻器阵列中变异操作的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明中,以忆阻器为代表的新型存储器件具有高集成度,低功耗,能快速进行乘法累加操作等优点,被认为是解决冯·诺依曼架构中存储墙问题的有效手段之一。通过在忆阻器阵列上实现遗传算法,可以实现更加高效的特征选择任务。
图1为本发明使用的忆阻器遗传算法的加速器结构示意图,包括第一控制模块1、忆阻器阵列模块2、第二控制模块3和处理器模块4;其中,第一控制模块1与忆阻器阵列模块2相连,忆阻器阵列模块2与第二控制模块3双向连接,第二控制模块3与处理器模块4双向连接,处理器模块4与第一控制模块相连。
其中,第一控制模块1包括数据输入单元11和行控制单元12,其中,数据输入单元11由n个数字-模拟转化器(DAC)构成,用于接收处理器模块4发送的数据,将其转换为模拟量,输入到行控制单元12中。行控制单元12根据计算过程,在处理器模块4的控制下,通过第一模拟多路选择器(MUX)选择相应的信号施加到忆阻器阵列模块2的行线上,其具体结构如图2所示,S1[2:0]是来自处理器模块4的选择信号,Vdata是数据输入单元11转化后的模拟电压,Vset和Vreset分别是忆阻器件的set电压和reset电压,Vread是器件的读电压,Vp是保护电压,一般为1/2Vset。在适应度计算阶段,行控制单元12选择Vdata作为输入到忆阻器阵列模块2行线上的数据,在解更新阶段,行控制单元12根据当前进行的操作,选择连接对应的模拟信号,具体操作在后文进行描述。
如图3所示,忆阻器阵列模块2包括第一忆阻阵列21和第二忆阻阵列22,第一忆阻阵列21与第二忆阻阵列22的各行相连。
忆阻器阵列模块2由交叉连接的忆阻单元组成,该阵列为n×2m规格,用于存储计算过程中的特征子集,在适应度计算阶段,进行输入数据和阵列权重的点乘运算,所得结果通过电流的形式按列进行累加后,输出到第二控制模块3中,其具体运算方式如图4所示,行控制单元12将电压Vdata施加到忆阻器阵列模块2的行线上,列线接地,根据基尔霍夫定律和欧姆定律Ij=∑GijVi,在每列上得到电压与电导相乘后的累加电流;在解更新阶段,通过第一控制模块1和第二控制模块3调整忆阻器中存储的数据,每列的晶体管只在调控时开启,其他情况下保持关闭。
第二控制模块3包括列控制单元31和输出采集单元32,其中列控制单元31由2m个第二模拟多路选择器(MUX)组成,每个MUX的结构如图5中(a)所示,处理器模块4的选择信号S2[1:0]控制该列连接的端口,有跨阻放大器(TIA)、保护电压Vp、操作电压VDD和地线GND。TIA用于进行电流电压的转化,具体结构如图5中(b)所示,其中R1的值一般为忆阻器件低阻态的值,在本实例中设置为1KΩ;Vp作为保护电压,选择不会对器件产生较大影响的电压值,根据器件的不同而改变,一般选择1/2Vset;VDD为更新操作所需的电压值,Vset<VDD<2×|Vreset|。输出采集单元32由2m个模数转换电路(ADC)构成,用于将模拟量转化成数字量,并传输到处理器模块4中。在适应度计算阶段,列控制单元31连接跨阻放大器(TIA),将一列得到的电流数据转换为电压数据,并通过输出采集单元32中的ADC,将数字信号传输到处理器模块4中。在解更新阶段,根据所进行的操作,处理器模块4选择MUX相应的端口信号,具体操作在后文进行描述。
处理器模块4用于数据的处理,协调算法的进程,并发送用于更新忆阻器阵列模块2的选择信号到行控制单元12和列控制单元31。在适应度计算阶段,发送预处理后的数据到数据输入单元11,接收并处理第二控制模块3的输出信号,通过操作第一控制模块1和第二控制模块3,实现对忆阻器阵列模块2的调控。
本实施例中,对于待特征选择的问题,一般是数据分类问题,即把一组数据按照某种条件进行分类。存在数据集S={X1,X2,…,Xt},每个成员Xi存在r个特征,即Xi={ai1,ai2,…,air},分类的类别集合Y={y1,y2,…,yp}。使用贝叶斯算法作为分类器,在已知P(X|Y)的情况下,求P(Y|X)的概率,根据贝叶斯公式其中P(X|Y)是在分类类别Y下各个特征出现的概率,即P(ai|yj),1≤i≤r,1≤j≤p,对于离散的特征,通过多项式分布来统计特征出现的概率,对于连续的特征或近似连续的特征,使用高斯分布来统计特征出现的概率;P(Y|X)则是在已知成员特征的情况下,判断该成员所属类别Y的概率,即P(y1,y2,…,yp|X),通常我们认为概率最大的P(yj|X)为该成员所属的类别;P(Y)是各个分类类别出现的概率;P(X)是各个特征出现的概率。
在假设各个特征是条件独立的情况下, 接着对等式两端进行取对数操作,得到 由于只需要判断不同log(P(yj|X))的大小,而对于同一成员log(P(X))保持不变,所以在计算时可以省略log(P(X))。
如图2所示,本发明实施例采用的是n×2m大小的忆阻器阵列,第一忆阻器阵列21和第二忆阻器阵列22以中心线为基准平移对称,均由n行m列的忆阻器构成。忆阻阵列中,通过高低阻态存储一个特征的选择与否,高阻态对应为0,即不选择,低阻态对应为1,即选择;每列忆阻器单元存储一种特征选择的方式,与分类项X中的aij一一对应,此外,还需要设置最后对应分类类别Y的忆阻器单元为1,用于分类的计算。
图6为本发明采用遗传算法进行特征选择的方法流程图,包括以下步骤:
S1进行数据集的预处理,通过上文所述的贝叶斯分类器计算方法,在处理器模块4中得到各个特征和各个分类类别的统计概率,并进行拉普拉斯平滑,将得到的数据进行取对数操作,并进行归一化,发送到数据输入单元11;
S2参数初始化,由于不同问题需要的算法参数不同,所以在这里给出本实施例的算法参数,种群规模NP=200,交叉率Pc=0.8,变异率Pm=0.02,锦标赛选择的数量Nt=10,最大迭代次数G=100。首先生成随机的初始解集,该解集在遗传算法中称为种群。将生成的初始种群映射并存储到第一忆阻阵列21中,设置第二忆阻阵列22中的忆阻单元为高阻态;
S3进行适应度函数计算,评价种群的好坏。处理器模块4将归一化后的数据传输到数据输入单元11,经过数模转换器转换为电压数据后,施加到忆阻器阵列模块2的行输入端口,根据欧姆定律和基尔霍夫定律,在列上得到输入电压与对应忆阻器单元电导的累加电流结果,经过跨阻放大器将电流信号转换为电压信号,在通过模数转换器转换为数字信号后,传输到输出采集单元32,最终在处理器模块4中计算适应度函数。适应度函数的值由两部分构成,分类的准确度和特征的数量,准确度越高并且特征数量越少,说明特征选择的效果越好,即Fitness=(1-α)×Acc+α×(1-L),其中α∈(0,1),Acc为分类的准确度,L为所选特征长度占总特征长度的比例,根据适应度值来进行后续解的更新操作;
S4种群更新分为两个步骤,交叉操作和变异操作。交叉操作是根据适应度计算的结果,将原种群中优秀的个体交叉配对后,产生新个体;变异操作是随机更新种群中的部分位置,使其产生变化。两种操作均是通过行控制单元12和列控制单元31,来更新存储在忆阻器阵列上的种群;
具体的,图7为本发明所使用忆阻器阵列中实现交叉操作的示意图,(a)图为忆阻器逻辑操作中的复制操作,即将一个单元的电阻状态复制到另一个单元中,当存在一个低阻器件和一个高阻器件时,从低阻器件的一端施加电压VDD,高阻器件的一端接地,此时电压全部分到高阻器件的两端,达到该器件的set电压,高阻器件被set为低阻态,从而实现低电阻状态的复制;当存在两个高阻器件时,从器件的一端施加电压VDD,另一个器件的一端接地,此时电压分部在两个高阻器件上,另一个高阻器件仍保持高阻,从而实现高电阻状态的复制。(b)图为忆阻器阵列模块中种群交叉操作的实现方式,Ci和Cj为第一忆阻阵列21中的两列,Cm1为第二忆阻阵列22中的一列;第一次种群更新中,从原有的种群中挑选出两列,如Ci和Cj,将这两列中部分位置交叉,产生一个新的个体,如Cm1,放入新种群中。通过在一列上施加VDD,新个体所在列接地的方式,实现对一列的状态进行复制,对于一列上不希望进行复制的位置,可以在对应的行输入端施加保护电压Vp。多次重复上述操作,在第二忆阻阵列22中产生新种群,并将第一忆阻阵列21的状态全部reset为高阻态,后续更新种群时,采取相同的操作方式。
图8为本发明所使用在忆阻器阵列中实现变异操作的示意图,为了适应忆阻器阵列的操作,随机挑选位置进行set和reset,该方式可以不用考虑器件原本的状态,进一步减少器件的操作步骤。一列中需要set和reset的单元可以同时进行,在对应行输入端施加Vset和Vreset,其他行输入端接保护电压Vp,列输出端接地。
S5判断迭代次数,重复S3和S4两部分,直到完成设置的迭代次数,根据求解问题的不同,迭代次数也会相应的改变,过少的迭代可能会的带较差质量的解,而迭代次数过多会使计算时间过长,一般来说设置在50~800次,本实例中设置为100次。
S6迭代完成后,读取忆阻器阵列模块,用阵列中选择的特征,额外进行一次适应度函数的计算,选择适应度值最大的特征子集作为最终结果。
通过本发明所提供的以上方案,与现有技术相比,创新的采用忆阻器阵列作为问题的计算核心,大幅度降低了在求解特征选择问题时遗传算法中适应度计算所消耗的时间。进一步地,通过外围电路实现了在忆阻器阵列中进行在线更新的方式,减少了数据的传输过程,优化了算法与硬件之间的结合。
本发明提供了一种用于特征选择的忆阻遗传算法加速器及其操作方法,将遗传算法中的种群,映射并存储到忆阻器阵列上,实现高并行计算、低功耗、高速度的求解特征选择问题。同时,采用忆阻器逻辑操作的方法,实现在忆阻器阵列上进行种群的原位更新,降低了更新种群的时间和功耗。本发明从解集的评价到解集的更新,在忆阻器阵列上系统的实现了遗传算法的计算过程,显著的提高了计算的速度和能效,为进一步利用忆阻器阵列进行存内计算提供了一种新的方式,可用于边缘计算和低功耗计算场景中。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用于特征选择的忆阻器遗传算法的加速器,其特征在于,包括:第一控制模块(1)、忆阻器阵列模块(2)、第二控制模块(3)和处理器模块(4);
所述第一控制模块(1)与所述忆阻器阵列模块(2)相连,所述忆阻器阵列模块(2)与所述第二控制模块(3)双向连接,所述第二控制模块(3)与所述处理器模块(4)双向连接,所述处理器模块(4)与所述第一控制模块(1)相连;
所述第一控制模块(1)用于将所述处理器模块(4)发送的数据转换为模拟量后输入至所述忆阻器阵列模块(2)中,并在解更新阶段更新所述忆阻器阵列模块(2)存储单元的状态;
所述忆阻器阵列模块(2)用于存储特征子集,并通过基尔霍夫定律实现向量矩阵乘法的模拟运算,并在第一控制单元(1)和第二控制单元(3)的协同操作下实现忆阻器单元在阵列中的原位更新;
所述第二控制模块(3)用于将所述忆阻器阵列模块(2)的电流信号,转换为电压信号,再将所述电压信号转换为数字信号后传输至所述处理器模块(4)中;
所述处理器模块(4)用于在适应度计算阶段发送预处理后的数据到第一控制模块(1),接收并处理所述第二控制模块(3)输出的数字信号。
2.如权利要求1所述的加速器,其特征在于,所述第一控制模块(1)包括数据输入单元(11)和行控制单元(12);
所述数据输入单元(11)包括n个数模转换器,用于将所述处理器模块(4)发送的数据转换为模拟量并输出到所述行控制单元(12)中;
所述行控制单元(12)用于在适应度计算阶段选择Vdata作为输入到所述忆阻器阵列模块(2)行线上的数据,并在解更新阶段根据当前进行的操作选择连接对应的模拟信号。
3.如权利要求2所述的加速器,其特征在于,所述行控制单元(12)包括第一模拟多路选择器,所述模拟多路选择器的六个输入端依次连接S1[2:0]信号、Vdata信号、Vset信号、Vreset信号、Vread信号和Vp信号,所述模拟多路选择器的输出端与所述忆阻器阵列模块(2)的输入端连接;
其中,Vdata是所述数据输入单元(11)转化后的模拟电压,S1[2:0]是来自所述处理器模块(4)的选择信号,Vset和Vreset分别是忆阻器件的set电压和reset电压,Vread是读电压,Vp是保护电压。
4.如权利要求1-3任一项所述的加速器,其特征在于,所述忆阻器阵列模块(2)包括第一忆阻阵列(21)和第二忆阻阵列(22);
所述第一忆阻阵列(21)用于存储算法中的特征子集,并在阵列内部进行向量矩阵乘法的计算,在解更新阶段通过阵列中实现的交叉操作,在第二忆阻阵列(22)中产生新的特征子集;
所述第二忆阻阵列(22)用于存储算法中的特征子集,并在阵列内部进行向量矩阵乘法的计算,在解更新阶段通过阵列中实现的交叉操作,在第二忆阻阵列(11)中产生新的特征子集。
5.如权利要求1所述的加速器,其特征在于,所述第二控制模块(3)包括列控制单元(31)和输出采集单元(32);
所述列控制单元(31)用于在适应度计算阶段将一列得到的电流数据转换为电压数据,并通过所述输出采集单元(32)将数字信号传输到处理器模块(4)中,并在解更新阶段,根据所进行的操作选择相应的端口信号输出。
6.如权利要求5所述的加速器,其特征在于,所述列控制单元(31)包括2m个第二模拟多路选择器,每个模拟多路选择器的结构相同,均包括5个输入端口,依次连接选择信号S2[1:0]、有跨阻放大器TIA、保护电压Vp、操作电压VDD和地线GND;
所述输出采集单元(32)包括2m个模数转换电路,用于将模拟量转化成数字量并传输至所述处理器模块(4)中。
7.如权利要求6所述的加速器,其特征在于,所述有跨阻放大器TIA包括电阻R1和放大器;
所述放大器的反向输入端作为所述有跨阻放大器的输入端,所述放大器的正向输入端接地,所述放大器的输出端作为所述有跨阻放大器的输出端;
所述电阻R1连接在所述放大器的反向输入端与输出端之间。
8.一种基于权利要求1-7任一项所述的加速器的操作方法,其特征在于,包括下述步骤:
S1进行数据集的预处理:
通过贝叶斯分类器计算方法在处理器模块中得到各个特征和各个分类类别的统计概率,并进行拉普拉斯平滑,将得到的数据进行取对数操作,并进行归一化后发送至数据输入单元;
S2参数初始化:
给定种群规模NP、交叉率、变异率、锦标赛选择的数量和最大迭代次数,并通过生成随机的初始解集获得种群;
将生成的初始种群映射并存储到第一忆阻阵列中,并设置第二忆阻阵列中的忆阻单元为高阻态;
S3通过适应度函数计算来评价种群的好坏;
S4种群更新步骤:
通过行控制单元和列控制单元来更新存储在忆阻器阵列上的种群实现交叉操作和变异操作;
S5重复步骤S3和步骤S4直到完成设置的迭代次数;
S6当迭代完成后读取忆阻器阵列模块,并采用阵列中选择的特征额外进行一次适应度函数的计算,该函数由分类的准确度和所选择特征的长度决定,即Fitness=(1-α)×Acc+α×(1-L),其中α∈(0,1),Acc为分类的准确度,L为所选特征长度占总特征长度的比例,选择适应度值最大的特征子集作为最终选择的结果。
9.如权利要求8所述的操作方法,其特征在于,步骤S3具体为:
处理器模块将归一化后的数据传输到数据输入单元,经过数模转换器转换为电压数据后施加到忆阻器阵列模块的行输入端口,根据欧姆定律和基尔霍夫定律,在列上得到输入电压与对应忆阻器单元电导的累加电流结果,经过跨阻放大器将电流信号转换为电压信号,在通过模数转换器转换为数字信号后,传输到输出采集单元,最终在处理器模块中计算适应度函数。
10.如权利要求8或9所述的操作方法,其特征在于,步骤S4具体为:
根据适应度计算的结果,将原种群中优秀的个体交叉配对后,产生新个体从而实现交叉操作;
随机更新种群中的部分位置使其产生变化从而实现变异操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211339578.0A CN115660079A (zh) | 2022-10-27 | 2022-10-27 | 用于特征选择的忆阻器遗传算法的加速器及其操作方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211339578.0A CN115660079A (zh) | 2022-10-27 | 2022-10-27 | 用于特征选择的忆阻器遗传算法的加速器及其操作方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115660079A true CN115660079A (zh) | 2023-01-31 |
Family
ID=84992969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211339578.0A Pending CN115660079A (zh) | 2022-10-27 | 2022-10-27 | 用于特征选择的忆阻器遗传算法的加速器及其操作方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115660079A (zh) |
-
2022
- 2022-10-27 CN CN202211339578.0A patent/CN115660079A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109146073B (zh) | 一种神经网络训练方法和装置 | |
Lin et al. | Learning the sparsity for ReRAM: Mapping and pruning sparse neural network for ReRAM based accelerator | |
CN109146070B (zh) | 一种支撑基于rram的神经网络训练的外围电路及系统 | |
US20200012924A1 (en) | Pipelining to improve neural network inference accuracy | |
US11531898B2 (en) | Training of artificial neural networks | |
Roy et al. | TxSim: Modeling training of deep neural networks on resistive crossbar systems | |
CN112990444B (zh) | 一种混合式神经网络训练方法、系统、设备及存储介质 | |
CN111478703B (zh) | 基于忆阻交叉阵列的处理电路及输出电流的补偿方法 | |
CN110569962B (zh) | 一种基于1t1r存储器阵列的卷积计算加速器及其操作方法 | |
CN110807519A (zh) | 基于忆阻器的神经网络的并行加速方法及处理器、装置 | |
US11922169B2 (en) | Refactoring mac operations | |
US20230185998A1 (en) | System and method for ai-assisted system design | |
CN111193511A (zh) | 一种应用于基于eFlash存算一体电路的数模混合读取电路的设计 | |
WO2020005599A1 (en) | Trend prediction based on neural network | |
CN115879530B (zh) | 一种面向rram存内计算系统阵列结构优化的方法 | |
CN111461308B (zh) | 忆阻神经网络及权值训练方法 | |
CN115660079A (zh) | 用于特征选择的忆阻器遗传算法的加速器及其操作方法 | |
Ahn et al. | Maximizing parallel activation of word-lines in MRAM-based binary neural network accelerators | |
Doevenspeck et al. | Noise tolerant ternary weight deep neural networks for analog in-memory inference | |
CN114330688A (zh) | 基于阻变式存储器的模型在线迁移训练方法、装置及芯片 | |
Lee et al. | Quantized convolutional neural network implementation on a parallel-connected memristor crossbar array for edge AI platforms | |
Zhang et al. | Quantization considerations of dense layers in convolutional neural Networks for resistive crossbar implementation | |
Li et al. | A neuromorphic computing system for bitwise neural networks based on ReRAM synaptic array | |
US11462268B1 (en) | Generating hash codes for locality sensitive hashing | |
KR102672586B1 (ko) | 인공신경망의 훈련 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |