WO2021114859A1

WO2021114859A1 - 利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置

Info

Publication number: WO2021114859A1
Application number: PCT/CN2020/121244
Authority: WO
Inventors: 吴华强; 高滨; 林钰登; 张清天; 唐建石; 钱鹤
Original assignee: 清华大学
Priority date: 2019-12-09
Filing date: 2020-10-15
Publication date: 2021-06-17
Also published as: CN110956256B; CN110956256A

Abstract

本申请公开了一种利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置，其中，该方法包括：获取贝叶斯网络，根据选定的数据集对所述贝叶斯网络进行训练得到所述贝叶斯网络的权重分布；对所述贝叶斯网络的权重分布进行处理，根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，将所述目标电导值映射到所述忆阻器中。该方法利用忆阻器交叉阵列实现贝叶斯神经网络，功耗低，计算速度快，计算能效高。

Description

利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置

相关申请的交叉引用

本申请要求清华大学于2019年12月09日提交的、发明名称为“利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置”的、中国专利申请号“201911251361.2”的优先权。

技术领域

本申请属于神经网络技术领域，特别涉及一种利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置。

背景技术

在人工智能领域，深度神经网络(Deep neural networks，DNNs)近年来得到快速发展，在图像和视觉计算、语音和语言处理、信息安全、棋类比赛等领域取得了令人瞩目的成绩。然而，普通的DNN难以抵御攻击，比如在图像分类的情况下，输入图像添加了人眼察觉不到的小扰动，但是DNN产生错误和过分自信的分类结果，因为DNN不能捕捉预测和模型中的不确定性。这样的扰动输入(被称为对抗样本，adversarial example)是在安全关键应用中使用DNN的主要障碍。另一方面，贝叶斯神经网络(Bayesian neural network，BayNN)可以通过评估预测的不确定性来检测对抗样本。基于这一优点，贝叶斯神经网络被广泛应用于医疗诊断、推荐系统、少样本学习、非线性动态系统控制和攻击检测等领域。与标准DNNs中的定值权值不同，BayNNs中的所有权值都用随机变量表示。概率分布的均值和标准差应可调，以训练网络应用在不同的场景。但是BayNNs用马尔可夫链蒙特卡罗(Markov Chain Monte-Carlo，MCMC)方法对权重分布进行采样。

马尔可夫链蒙特卡罗方法由于要进行大量的抽样计算，对计算机速度依赖性强，在传统的硬件计算平台上，BayNN需要比较大的计算成本。在神经网络预测时，如图1所示，需要先用MCMC对权重进行采样的到权重矩阵Wsample，然后输入X与Wsample进行向量矩阵乘运算(VMM)。这通常会带来很高的计算成本，成为了贝叶斯神经网络应用的一个主要限制。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的一个目的在于提出一种利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置，该方法计算功耗低，速度快。

本申请的另一个目的在于提出一种利用忆阻器本征噪声实现贝叶斯神经网络的装置。

为达到上述目的，本申请一方面实施例提出了一种利用忆阻器本征噪声实现贝叶斯神经网络的方法，包括：

S1，获取贝叶斯网络，根据选定的数据集对所述贝叶斯网络进行训练得到所述贝叶斯网络的权重分布；

S2，对所述贝叶斯网络的权重分布进行处理，根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，将所述目标电导值映射到所述忆阻器中。

本申请实施例的利用忆阻器本征噪声实现贝叶斯神经网络的方法，将贝叶斯神经网络的权重分布映射到忆阻器中，利用忆阻器交叉阵列实现分布采样和矩阵向量乘的方法以及利用忆阻器在读取时的本征噪声实现对随机变量的采样，通过忆阻器交叉阵列实现贝叶斯神经网络，功耗低，速度快。

另外，根据本申请上述实施例的利用忆阻器本征噪声实现贝叶斯神经网络的方法还可以具有以下附加的技术特征：

进一步地，在本申请的一个实施例中，在所述S2之后还包括：

通过所述贝叶斯网络进行预测计算时，将输入序列以READ电压脉冲施加到映射后的忆阻器的位线上，采集所述映射后的忆阻器的源线流出的输出电流，对所述输出电流进行计算，得到预测结果。

进一步地，在本申请的一个实施例中，所述对所述贝叶斯网络进行计算得到所述贝叶斯网络的权重分布，包括：

通过变分方法对所述选定的数据集进行计算，得到所述贝叶斯网络的权重分布。

进一步地，在本申请的一个实施例中，所述对所述贝叶斯网络的权重分布进行处理，包括：

对所述权重分布进行偏置和放缩，以使所述权重分布满足所述忆阻器的电导窗口。

进一步地，在本申请的一个实施例中，所述根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，包括：

处理后的所述贝叶斯网络的权重分布为(μ,σ ²)，其中，μ为均值，σ为标准差，多个忆阻器的电导G _ntarget(n＝1,2,…,N)；

使处理后的所述贝叶斯网络的权重分布与所述多个忆阻器的电导满足公式(1)和(2)：

sum(G _ntarget)＝μ (1)

sum[σ(G _ntarget) ²]＝σ ² (2)

对式(1)和式(2)进行求解，得到所述目标电导值。

进一步地，在本申请的一个实施例中，在将所述目标电导值映射到所述忆阻器中时，还包括：

测量所述忆阻器的电导值，验证所述忆阻器的电导值与所述目标电导值的差是否小于误差阈值，若小于，则通过验证，若不小于，则对所述忆阻器进行调节脉冲SET/RESET操作，直至通过验证或达到最大验证次数。

进一步地，在本申请的一个实施例中，所述贝叶斯网络包括但不限于全连接结构和卷积神经网络结构，所述贝叶斯网络的每个权重分布为相互独立的分布。

为达到上述目的，本申请另一方面实施例提出了一种利用忆阻器本征噪声实现贝叶斯神经网络的装置，包括：

训练模块，用于获取贝叶斯网络，根据选定的数据集对所述贝叶斯网络进行训练得到所述贝叶斯网络的权重分布；

映射模块，用于对所述贝叶斯网络的权重分布进行处理，根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，将所述目标电导值映射到所述忆阻器中。

本申请实施例的利用忆阻器本征噪声实现贝叶斯神经网络的装置，将贝叶斯神经网络的权重分布映射到忆阻器中，利用忆阻器交叉阵列实现分布采样和矩阵向量乘的方法以及利用忆阻器在读取时的本征噪声实现对随机变量的采样，通过忆阻器交叉阵列实现贝叶斯神经网络，功耗低，速度快。

另外，根据本申请上述实施例的利用忆阻器本征噪声实现贝叶斯神经网络的装置还可以具有以下附加的技术特征：

进一步地，在本申请的一个实施例中，还包括：

预测模块，用于通过所述贝叶斯网络进行预测计算时，将输入序列以READ电压脉冲施加到映射后的忆阻器的位上，采集所述映射后的忆阻器的源线流出的输出电流，对所述输出电流进行计算，得到预测结果。

进一步地，在本申请的一个实施例中，所述映射模块，具体用于，

对所述权重分布进行偏置和放缩处理，处理后的所述贝叶斯网络的权重分布为(μ,σ ²)，其中，μ为均值，σ为标准差，多个忆阻器的电导G _ntarget(n＝1,2,…,N)；

sum(G _ntarget)＝μ (1)

sum[σ(G _ntarget) ²]＝σ ² (2)

对式(1)和式(2)进行求解，得到所述目标电导值。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为基于MCMC采样方法的贝叶斯网络计算过程示意图；

图2为根据本申请一个实施例的利用忆阻器本征噪声实现贝叶斯神经网络的方法流程图；

图3为根据本申请一个实施例的基于忆阻器的贝叶斯神经网络系统架构图；

图4为根据本申请一个实施例的目标电导值计算及写入过程图；

图5为根据本申请一个实施例的贝叶斯网络映射到忆阻器阵列的示意图；

图6为根据本申请一个实施例的多个忆阻器在READ时，输出的总电流呈现高斯分布的示意图；

图7为根据本申请一个实施例的利用忆阻器本征噪声实现贝叶斯神经网络的装置结构示意图。

具体实施方式

下面详细描述本申请的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参照附图描述根据本申请实施例提出的利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置。

首先将参照附图描述根据本申请实施例提出的利用忆阻器本征噪声实现贝叶斯神经网络的方法。

图2为根据本申请一个实施例的利用忆阻器本征噪声实现贝叶斯神经网络的方法流程图。

如图2所示，该利用忆阻器本征噪声实现贝叶斯神经网络的方法包括以下步骤：

步骤S1，获取贝叶斯网络，根据选定的数据集对贝叶斯网络进行训练得到贝叶斯网络的权重分布。

图3为根据本申请一个实施例的基于忆阻器的贝叶斯神经网络系统架构图，贝叶斯神经网络的结构包括但不限于全连接结构和CNN结构等，但网络权值是随机变量。在训练完成后，全连接网络/CNN等的权值是固定值，而贝叶斯神经网络的每一个权重都是一个分布。如图3所示的，贝叶斯网络中的权重都是一个分布，如高斯分布或者拉普拉斯分布。

本申请的实施例中针对的贝叶斯神经网络，每一个权重都是相互独立的分布。

进一步地，对一个贝叶斯网络进行offline训练，offline训练为在计算机上，针对选定的数据集利用变分方法计算贝叶斯神经网络中权重的分布。

根据所要实现的不同目的选取不同的数据集对贝叶斯网络进行训练，得到贝叶斯网络的权重分布。

步骤S2，对贝叶斯网络的权重分布进行处理，根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，将目标电导值映射到忆阻器中。

在BayNN offline训练完成得到权重分布后，对权重分布进行偏置和放缩，直至权重分布满足合适的电导窗口，其中，在进行偏置和放缩时，同一层的权重都进行相同的偏置和放缩。在后续进行神经网络预测时，需要除去偏置和放缩。

对权重分布进行偏置和放缩处理后，根据处理后的权重分布和忆阻器的电导值计算目标电导值，将计算出的目标电导值映射到忆阻器阵列中。

如图4所示，假设偏置和放缩后得到的某一个权重为(μ,σ ²)，其中，μ为均值，σ为标准差，多个忆阻器的电导G _ntarget(n＝1,2,…,N)；

为了在阵列上使用N个忆阻器实现期望的分布电导权重(μ,σ ²)，N个忆阻器的电导G _ntarget(n＝1,2,…,N)需要满足方程sum(G _ntarget)＝μ与sum[σ(G _ntarget) ²]＝σ ²。

对不定方程进行求解，可以得到一组目标电导值G _ntarget(n＝1,2,…,N)，将目标电导值写入忆阻器中。

如图5所示，展示了将权重分布映射到忆阻器阵列的过程，其中，N个忆阻器充当网络中层与层之间的一个权重。将贝叶斯网络中的权重分布转换为电导值映射到忆阻器阵列的交叉序列中。

传统的贝叶斯神经网络在预测计算时，首先对这一层的所有的权重进行采样得到权重采样值矩阵，然后输入向量与该权重采样值矩阵相乘，计算功耗大，速度慢。

在本申请的实施例中，通过贝叶斯网络进行预测计算时，将输入序列以READ电压脉冲施加到映射后的忆阻器的位线(Bit-line)上，采集映射后的忆阻器的源线(Source-line)流出的输出电流，对输出电流进行计算，得到预测结果。

可以理解的是，如图6所示，输入序列以READ电压脉冲施加在BL(Bit-line)上，然后采集从SL(Source-line)流出的输出电流进行进一步计算处理。N个忆阻器在读电流且N比较大时，输出的总电流呈现类似于高斯的分布。所有电压脉冲的输出总电流就是输入向量与权重采样值矩阵相乘的结果。在忆阻器交叉阵列中，这样的一次并行读操作就相当于实现了采样和向量矩阵乘法的两个操作。

进一步地，在本申请的实施例中，还包括：测量忆阻器的电导值，验证忆阻器的电导值与目标电导值的差是否小于误差阈值，若小于，则通过验证，若不小于，则对忆阻器进行调节脉冲SET/RESET操作，直至通过验证或达到最大验证次数。

可以理解的是，在将目标电导值写入忆阻器的过程中，为减小忆阻器电导在调节时存在波动以及非线性因素的带来的影响，确保更新的有效，先测量忆阻器电导值G，验证电导值与目标电导值的差是否达到误差ε。如果没有达到再对忆阻器阵列进行调节脉冲SET/RESET操作。如果达到误差ε，则通过验证；否则，继续对对应的忆阻器进行SET/RESET操作，直到通过验证或者达到最大验证次数为止。

根据本申请实施例提出的利用忆阻器本征噪声实现贝叶斯神经网络的方法，将贝叶斯神经网络的权重分布映射到忆阻器中，利用忆阻器交叉阵列实现分布采样和矩阵向量乘的方法以及利用忆阻器在读取时的本征噪声实现对随机变量的采样，通过忆阻器交叉阵列实现贝叶斯神经网络，功耗低，速度快。

其次参照附图描述根据本申请实施例提出的利用忆阻器本征噪声实现贝叶斯神经网络的装置。

如图7所示，该利用忆阻器本征噪声实现贝叶斯神经网络的装置包括：训练模块100和映射模块200。

训练模块100，用于获取贝叶斯网络，根据选定的数据集对贝叶斯网络进行训练得到贝叶斯网络的权重分布。

映射模块200，用于对贝叶斯网络的权重分布进行处理，根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，将目标电导值映射到忆阻器中。

进一步地，在本申请的一个实施例中，还包括：预测模块，用于通过贝叶斯网络进行预测计算时，将输入序列以READ电压脉冲施加到映射后的忆阻器的位线(Bit-line)上，采集映射后的忆阻器的源线(Source-line)流出的输出电流，对输出电流进行计算，得到预测结果。

进一步地，在本申请的一个实施例中，对贝叶斯网络进行计算得到贝叶斯网络的权重分布，包括：

通过变分方法对选定的数据集进行计算，得到贝叶斯网络的权重分布。

进一步地，在本申请的一个实施例中，对贝叶斯网络的权重分布进行处理，包括：

对权重分布进行偏置和放缩，以使权重分布满足忆阻器的电导窗口。

进一步地，在本申请的一个实施例中，根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，包括：

处理后的贝叶斯网络的权重分布为(μ,σ ²)，其中，μ为均值，σ为标准差，多个忆阻器的电导G _ntarget(n＝1,2,…,N)；

使处理后的贝叶斯网络的权重分布与多个忆阻器的电导满足公式(1)和(2)：

sum(G _ntarget)＝μ (1)

sum[σ(G _ntarget) ²]＝σ ² (2)

对式(1)和式(2)进行求解，得到目标电导值。

进一步地，在本申请的一个实施例中，在将目标电导值映射到忆阻器中时，还包括：

测量忆阻器的电导值，验证忆阻器的电导值与目标电导值的差是否小于误差阈值，若小于，则通过验证，若不小于，则对忆阻器进行调节脉冲SET/RESET操作，直至通过验证或达到最大验证次数。

需要说明的是，前述对利用忆阻器本征噪声实现贝叶斯神经网络的方法实施例的解释说明也适用于该实施例的装置，此处不再赘述。

根据本申请实施例提出的利用忆阻器本征噪声实现贝叶斯神经网络的装置，将贝叶斯神经网络的权重分布映射到忆阻器中，利用忆阻器交叉阵列实现分布采样和矩阵向量乘的方法以及利用忆阻器在读取时的本征噪声实现对随机变量的采样，通过忆阻器交叉阵列实现贝叶斯神经网络，功耗低，速度快。

在本申请的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本申请中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本申请中的具体含义。

在本申请中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

一种利用忆阻器本征噪声实现贝叶斯神经网络的方法，其特征在于，包括以下步骤：

S1，获取贝叶斯网络，根据选定的数据集对所述贝叶斯网络进行训练得到所述贝叶斯网络的权重分布；

S2，对所述贝叶斯网络的权重分布进行处理，根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，将所述目标电导值映射到所述忆阻器中。
根据权利要求1所述的利用忆阻器本征噪声实现贝叶斯神经网络的方法，其特征在于，在所述S2之后还包括：

通过所述贝叶斯网络进行预测计算时，将输入序列以READ电压脉冲施加到映射后的忆阻器的位线上，采集所述映射后的忆阻器的源线流出的输出电流，对所述输出电流进行计算，得到预测结果。
根据权利要求1所述的利用忆阻器本征噪声实现贝叶斯神经网络的方法，其特征在于，所述对所述贝叶斯网络进行计算得到所述贝叶斯网络的权重分布，包括：

通过变分方法对所述选定的数据集进行计算，得到所述贝叶斯网络的权重分布。
根据权利要求1所述的利用忆阻器本征噪声实现贝叶斯神经网络的方法，其特征在于，所述对所述贝叶斯网络的权重分布进行处理，包括：

对所述权重分布进行偏置和放缩，以使所述权重分布满足所述忆阻器的电导窗口。
根据权利要求1所述的利用忆阻器本征噪声实现贝叶斯神经网络的方法，其特征在于，所述根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，包括：

处理后的所述贝叶斯网络的权重分布为(μ,σ ²)，其中，μ为均值，σ为标准差，多个忆阻器的电导G _ntarget(n＝1,2,…,N)；

使处理后的所述贝叶斯网络的权重分布与所述多个忆阻器的电导满足公式(1)和(2)：

sum(G _ntarget)＝μ (1)

sum[σ(G _ntarget) ²]＝σ ² (2)

对式(1)和式(2)进行求解，得到所述目标电导值。
根据权利要求1所述的利用忆阻器本征噪声实现贝叶斯神经网络的方法，其特征在于，在将所述目标电导值映射到所述忆阻器中时，还包括：

测量所述忆阻器的电导值，验证所述忆阻器的电导值与所述目标电导值的差是否小于误差阈值，若小于，则通过验证，若不小于，则对所述忆阻器进行调节脉冲SET/RESET操作，直至通过验证或达到最大验证次数。
根据权利要求1所述的利用忆阻器本征噪声实现贝叶斯神经网络的方法，其特征在于，所述贝叶斯网络包括但不限于全连接结构和卷积神经网络结构，所述贝叶斯网络的每个权重分布为相互独立的分布。
一种利用忆阻器本征噪声实现贝叶斯神经网络的装置，其特征在于，包括：

训练模块，用于获取贝叶斯网络，根据选定的数据集对所述贝叶斯网络进行训练得到所述贝叶斯网络的权重分布；

映射模块，用于对所述贝叶斯网络的权重分布进行处理，根据处理后的权重分布及多个忆阻器的电导进行计算，得到目标电导值，将所述目标电导值映射到所述忆阻器中。
根据权利要求8所述的利用忆阻器本征噪声实现贝叶斯神经网络的装置，其特征在于，还包括：

预测模块，用于通过所述贝叶斯网络进行预测计算时，将输入序列以READ电压脉冲施加到映射后的忆阻器的位线上，采集所述映射后的忆阻器的源线流出的输出电流，对所述输出电流进行计算，得到预测结果。
根据权利要求8所述的利用忆阻器本征噪声实现贝叶斯神经网络的装置，其特征在于，所述映射模块，具体用于，

对所述权重分布进行偏置和放缩处理，处理后的所述贝叶斯网络的权重分布为(μ,σ ²)，其中，μ为均值，σ为标准差，多个忆阻器的电导G _ntarget(n＝1,2,…,N)；

使处理后的所述贝叶斯网络的权重分布与所述多个忆阻器的电导满足公式(1)和(2)：

sum(G _ntarget)＝μ (1)

sum[σ(G _ntarget) ²]＝σ ² (2)

对式(1)和式(2)进行求解，得到所述目标电导值。