CN117057405A

CN117057405A - 基于新型激励函数的dna分子学习机方法

Info

Publication number: CN117057405A
Application number: CN202311058803.8A
Authority: CN
Inventors: 邹成业
Original assignee: Yanshan University
Current assignee: Hebei Yancai Technology Co.,Ltd.
Priority date: 2023-08-22
Filing date: 2023-08-22
Publication date: 2023-11-14
Anticipated expiration: 2043-08-22
Also published as: CN117057405B

Abstract

本发明涉及基于新型激励函数的DNA分子学习机，属于DNA分子计算及人工智能的交叉领域，本方案提出了面向分子电路的新型激励函数，并将该激励函数嵌入到DNA分子电路中，构建了DNA分子学习机，该学习机的学习过程，即权值更新无需硅基电子计算机的参与，完全依靠DNA分子杂交反应的自适应性完成；该学习系统由三部分构成，包括DNA分子学习机的输入层部分、隐藏层部分和输出层部分，该DNA学习机具有学习较复杂非线性函数的能力，与硅电路串行计算模式不同的是，该学习过程是通过DNA杂交反应的同步性实现，因此该DNA分子学习机的计算模式为并行计算模式，通过该方法可以预测或拟合多变量非线性函数，并对输入项的个数没有限制。

Description

基于新型激励函数的DNA分子学习机方法

技术领域

本发明涉及DNA计算及人工智能领域，具体涉及基于新型激励函数的DNA分子学习机方法。

背景技术

近年来，计算机技术和生物技术都取得了重大进展，经过各领域科学家和学者的共同努力，实现了生物技术与计算机技术的完美融合，通过现代计算机技术处理生物学的基本特征，实现了对生物学更直观的呈现，刷新了人们对生物学的理解，与此同时，生物技术的发展也促进了计算机技术的发展；

DNA计算机的开发过程分为三个阶段：可行性论证、计算速度改进和实用性开发，相应的计算模型分别是试管DNA计算模型、表面DNA计算模型和芯片DNA计算模型，试管DNA计算模型是指在一个或多个试管中的DNA分子和相关生物酶的溶液中通过生化反应进行的DNA计算，表面DNA计算模型是将与问题解决空间相对应的DNA分子固定在固体支撑物上的方法，例如载玻片、金属板或由各种有机聚合物制成的薄膜，解空间是通过各种生化反应逐渐产生的，最终得到计算结果，芯片DNA计算模型的主要任务是在表面模型的基础上提高其实用性，使其能够像电子计算机中的芯片一样大规模生产，使DNA计算机能够投入实际应用；

在人工智能领域，激励函数发挥着重要作用，因为它使人工智能系统能够拟合和预测非线性和复杂的变量关系，由于传统的激励函数的复杂性，利用DNA电路实现是十分困难的，曾经有研究成果利用激励函数的泰勒展开式实现激励函数，但由于泰勒展开式依然比较复杂，利用DNA计算实现依然是比较困难的；

由于传统的激励函数无法利用DNA计算轻易实现，使得DNA电路无法轻易实现传统人工智能的所有功能，大部分DNA电路需要依靠硅基电子计算机来完成训练和学习过程，存在诸多缺点和不足；

鉴于以上，本申请提供基于新型激励函数的DNA分子学习机方法用于解决上述问题。

发明内容

针对上述情况，为克服现有技术之缺陷，本方案提出了面向分子电路的新型激励函数，并将该激励函数嵌入到DNA分子电路中，构建了DNA分子学习机，该学习机的学习过程，即权值更新无需硅基电子计算机的参与，完全依靠DNA分子杂交反应的自适应性完成。

基于新型激励函数的DNA分子学习机方法，其特征在于，包括以下步骤：

S1：基于DNA链置换反应构建激励函数；

S2：利用理想化反应设计分子学习机，并将S1构建的的激励函数嵌入到该分子学习机中；

S3：根据S2中构建的分子学习机，设计相应的DNA分子反应模块，完成该分子学习机的DNA编译；

S4：将S3中的DNA分子学习机进行训练使权值得到更新，计算DNA分子学习机的输出与期望值之间的相对误差，当相对误差达到或低于设定阈值时，达到训练目标；

S5：为衡量该DNA分子学习机的拟合和预测能力，对其进行测试评估。

上述技术方案有益效果在于：

(1)本发明提出了适用于DNA分子电路的新型激励函数，该激励函数具有良好的嵌套性，可级联于任何DNA分子电路中；

(2)本方案提出的基于新型激励函数的DNA分子学习机不需要电子计算机的辅助便可以完成训练和测试过程(该机器学习的权重是通过DNA分子电路的自适应性实现的)；

(3)本发明可实现多变量较为复杂的非线性函数关系，即为θ₁，θ₂，…θ_N＞0，自变量的个数为N个，现有的研究成果基于DNA分子计算的人工神经网络只能处理2个自变量的线性函数关系，通过该方法可以学习多变量非线性函数，对输入项的个数没有限制；

(4)本发明可用于变加速直线运动中位移和时间关系的拟合和预测，并可预测物体受到的驱动力。

附图说明

图1为本发明的训练流程图；

图2为本发明新型激励函数的主要DNA链置换反应；

图3为本发明催化反应模块1的主要DNA链置换反应；

图4为本发明催化反应模块2的主要DNA链置换反应；

图5为本发明降解反应模块的主要DNA链置换反应；

图6为本发明调节反应模块1的主要DNA链置换反应；

图7为本发明调节反应模块2的主要DNA链置换反应；

图8为本发明变速直线运动的装置图；

图9为本发明平均相对误差随训练迭代次数的演化示意图；

图10为本发明DNA分子学习机的训练输出图；

图11为本发明DNA分子学习机的测试输出图；

图12为本发明相对误差随测试数据的演化示意图。

具体实施方式

有关本发明的前述及其他技术内容、特点与功效，在以下配合参考本申请附图对实施例的详细说明中，将可清楚的呈现，以下实施例中所提到的结构内容，均是以说明书附图为参考。

本方案提出一种基于新型激励函数的DNA分子学习机方法，其具体过程包括以下部分：

一、构建面向分子电路的新型激励函数

新型激励函数的理想化反应可描述为如下形式：

反应(1)的微分方程如下：

公式(2)中的第二个式子两端同时取积分可得：

由(3)可得物质A的数学解析为：

lnA(t)＝-kxt+C₁ (4)

其中，A表示在理想化反应中的一种抽象物质，其中C₁∈R，可得

当t＝0时，A(0)＝[A]₀，因此显然

A(t)＝[A]₀e^-kxt (6)

其中[*]₀代表*的初始浓度。

公式(2)中的第三个式子两端同时取积分可得：

将公式(6)的结果带入到公式(7)中，可得：

将积分变量t替换成-kxt可得：

根据公式(9)，可以得到y(t)的表达式为：

y(t)＝C₂-[A]₀e^-kxt

其中C₂∈R，当t＝0时，y(0)＝[y]₀，因此C₂＝[A]₀+[y]₀，则可得新型激励函数的表达式：

y(t)＝([A]₀+[y]₀)(1-e^-kxt) (10)

如图2所示，反应(1)可由如下DNA链置换反应实现：

其中x和y为信号DNA分子，Ga、Gb和H为辅助DNA链。

二、基于新型激励函数的DNA分子学习机的设计

(1)输入层部分表达式如下：

反应(12)包含催化反应模块1和降解反应模块，其中输入层的节点数为N，则i＝1，2，…，N，输入层的激励函数采取本方案提出的新型激励函数，其理想化反应描述为：

(2)隐藏层部分表达式如下：

反应(14)包含催化反应模块1和降解反应模块其中隐藏层的节点数量为L，则n＝1，2，…，L；

(3)输出层部分的理想化反应表达式如下：

反应(15)包含催化反应模块2和降解反应模块，其中输出层的节点数量为M，则j＝1，2，…，M。

信号分子W_in和V_nj的浓度表示权值，S_n代表求和结果，y_n代表激励函数的输出结果，Y_n代表输出层的输出结果，W_in、V_nj、S_n、y_n和Y_n的浓度需要按如下反应加以调节；

反应(16)中W_in和V_nj为短DNA链，因此前两项为调节反应模块1；而S_n、y_n和Y_j为长DNA链，因此后三项为调节反应模块2。

根据反应(12)-(16)，可得P_n、P′_j、y_n和的微分方程为

当物质P_n、P′_j和的浓度趋近于平衡的时候，则/>和/>再结合公式(17)，可得：

其中分别为隐藏层的激励函数和输出层的输出函数。

三、利用DNA分子电路实现分子学习机

由于理想化反应中反应物和生成物是抽象化的物质不是具体的某一种生化物质，而DNA杂交反应可以实现任意一种理想化反应，本部分利用DNA杂交反应实现该线性学习机；

分子学习机由DNA反应模块(催化反应模块1、催化反应模块2、降解反应模块、调节反应模块1和调节反应模块2)构成，由于上述反应模块具有同质性和级联性，可将它们级联为DNA分子电路，实现学习系统，五种DNA反应模块描述如下：

催化反应模块1反应方程为：它可由如下DNA链置换反应得到：

其中P_i被催化，X_i为输入信号DNA分子，W_i为权值报告链，Am_i、An_i和C_i为辅助DNA链，且辅助DNA链的初始浓度为C_m，并满足C_m≥[P_i]₀，[W_i]₀，[X_i]₀，反应速率q_i和k_i满足q_i≤q_m，k_i＝q_i，q_m表示最大反应速率，催化反应模块1的DNA实现如图3所示；

催化反应模块2反应方程为：可由如下DNA链置换反应得到：

其中P_i被催化，Ua_i、Ub_i、D_i及V_i为辅助DNA链，且辅助DNA链的初始浓度设定为C_m，并满足C_m≥[P_i]₀，[Y_i]₀；反应速率q_i满足q_i≤q_m，k_i＝q_i，催化反应模块2的DNA实现如图4所示；

降解反应模块的反应方程为：它可由如下DNA链置换反应得到：

其中P_i被降解，Ta_i、Tb_i和M_i为辅助DNA链，且辅助DNA链的初始浓度为C_m，并满足C_m≥[P_i]₀，[Y_i]₀；反应速率q_i满足q_i≤q_m，k_i＝q_i，降解反应模块的DNA实现如图5所示；

调节反应模块1方程为它可由如下DNA链置换反应得到：

其中DNA链W_i、Ea_i和Eb_i的初始浓度满足[W_i]₀，[Ea_i]₀＜＜[Eb_i]₀，反应速率满足kc_i＝qc_i，kd_i＝qd_i，调节反应模块1用于短DNA链的调节作用，其中W_i为短DNA链，调节反应模块1的DNA实现如图6所示；

调节反应模块2方程为它可由如下DNA链置换反应得到：

其中DNA链Y_i、Wa_i和Wb_i的初始浓度满足[Y_i]₀,[Wa_i]₀＜＜[Wb_i]₀，反应速率满足km_i＝qm_i，kn_i＝qn_i，调节反应模块2用于长DNA链的调节作用，其中Y_i为短DNA链，调节反应模块2的DNA实现如图7所示。

四、DNA分子学习机的训练

该部分属于该学习系统的应用，该分子学习机具有预测变加速直线运动中位移与时间的关系的能力，是通过数据训练获得的，因此第四部分为DNA分子学习机的训练，为了检测该学习机的学习能力，需要对该分子学习机进行测试，如图1所示，为本方案训练流程图，其中DNA数据链也是DNA信号链(可以表征DNA分子学习机的输入、输出以及权值的DNA链)；

如图8所示，物体由第一个光电门的位置从静止开始运动，设置其余光电门的位置，可测得三段位移的时间t₁、t₂和t₃，以及总位移S，将三个时间和一个总位移作为一组训练数据，在物体运动过程中，物体经过不同的光电门时施加大小不同的水平恒定驱动力F₁、F₂和F₃，调节除第一个光电门外其余光电门的位置(调节光电门的位置目的在于改变三段位移的大小，获得不同的训练和测试数据)，且保持t₁、t₂和t₃比值不变，又可以得到另外一组训练数据，将得到的这些训练数据输入给DNA分子学习机系统，通过DNA分子的杂交反应，使权值得到更新，并计算DNA分子学习机的输出与期望值之间的相对误差，当相对误差达到或低于设定阈值时，达到训练目标，并停止训练，经过训练得到的权值即为线性函数关系中的w₁、w₂和w₃的值，得到了这些参数值就可以利用总位移值和时间值拟合出它们之间的函数关系，并且获得这些参数值就可以推测物体在每一段位移受到的驱动力F₁、F₂和F₃，原因在于：

由图8可知，物体由第一个光电门到达第二个光电门的过程中驱动力为F₁，时间为t₁，加速度大小为a₁＝F₁/m，则该段位移大小为

其中m为物体的质量；

物体由第二个光电门到达第三个光电门的过程中驱动力为F₂，时间为t₂，加速度大小为a₂＝F₂/m，则该段位移大小为

物体由第三个光电门到达第四个光电门的过程中驱动力为F₃，时间为t₃，加速度大小为a₃＝F₃/m，则该段位移大小为

由公式(23)-(25)，可得物体运动的总位移为S

其中ρ₁＝t₁/t₂、ρ₂＝t₁/t₃和ρ₃＝t₂/t₃。

公式(26)可简化为如下形式：

其中w₁＝a₁/2、w₂＝a₁ρ₁+a₂/2和a₃＝a₁ρ₁+a₂ρ₃+a₃/2。

由学习得到的权值w₁、w₂和w₃可得到物体各段受到的驱动力分别为：

本发明利用DNA分子学习机学习变加速直线运动中位移与时间的关系其中权值w_i及输入t_i(i＝1,2,3)皆为实数，由于权值和输入的数值由DNA链的浓度表示，因此w_i,t_i,S≥0。

(1)训练数据的归一化处理

为保证测试实验数据和训练实验数据落在同一范围，需要对训练用数据按如下进行数据归一化处理：

其中

α_ip表示第p组训练数据中的第i个训练数据(p＝1,2，…，P)，X_i＝[αi1,α_i2,…，α_iP]表示由P组训练数据中的第i组训练数据形成的矩阵，函数max(*)和min(*)分别用于求出矩阵的最大值和最小值，此外，σ表示正调整系数，而χ_ip和分别表示分子学习系统的输入信号和输出信号。

(2)线性机器学习的训练评估

在一轮训练中，定义相对误差e_p如下：

其中

其中D_p表示使用所提出的激活函数获得的计算结果，和/>分别表示训练后W_in和V_n1达到动态平衡后的浓度；

当一组训练数据已经被完全训练时，一次训练迭代就完成了，打乱P组训练数据的顺序允许我们继续下一次训练循环，利用平均相对误差来评估该训练迭代的有效性；

第l次训练迭代的平均相对误差(Average Relative Error，ARE)定义为：

在多次训练迭代之后，当ARE(平均相对误差)的值达到或低于预定阈值时，就认为已经达到了训练目标，训练就完成了；

如图8所示，以3个输入节点的DNA分子学习机为例，说明变加速直线运动中的每一段的时间与总位移的关系的训练和评估，训练的原始数据为：

t₁∈{0.1s,0.2s,0.3s，…,3.0s}、t₂∈{0.2s,0.4s,0.6s，…,6.0s}、t₃∈{0.3s,0.6s,0.9s，…,9.0s}和S∈{0.666m，2.664m，5.994m，10.656m，16.650m，23.976m,32.634m，42.624m，53.946m，66.6m,5860m,95.904m，112.554m，130.536m，149.85m，170.496m，192.474m,215.784m，240.426m，266.4m，293.706m，322.344m，352.314m，383.616m，416.25m，450.216m,485.514m，522.144m，560.106m，599.4m}共30组数据，σ的取值为σ＝2，DNA链X₁、X₂和X₃的初始浓度设定为[X₁]₀∈{0.023nM,0.046nM，0.069nM,…,0.6897nM}，[X₂]₀∈{0.046nM,0.092nM，0.1379nM,…,1.3793nM}和[X₃]₀∈{0.069nM,0.1379nM,0.2069nM,…,2.069nM}，辅助DNA分子的初始浓度(nM)及反应速率(nM/s)的初始设定如表1所示；

表1 DNA链的浓度和反应速率的设定

本方案中，训练目标设定的平均相对误差阈值为图9展示了为达到训练目标所需要的训练迭代次数为50次；

如图10所示，DNA分子学习机的训练输出与期望输出比较吻合，说明该学习机基本实现了变速直线运动时间和总位移的非线性函数关系的拟合。

(3)线性机器学习的测试评估

为了评估分子学习系统的学习有效性，有必要使用与训练数据不同的一组单独的Q组数据作为测试数据，该测试数据还需要经过公式(28)中描述的归一化过程，以便进行如下准确评估：

其中β_iq表示第q组测试数据中的第i个训练数据，(q＝1，2，…，Q),类似地，定义相对误差e′_q用于衡量测试性能：

其中

D′_m表示使用第q组训练数据和所提出的激活函数获得的计算结果，此外，W_in和V_n1表示完成训练后获得的权重值。

仍以3个输入节点的DNA分子学习机为例，说明测试结果，测试的原始数据为：t′₁∈{0.2s,0.4s,0.6s，…,6.0s}、t′₂∈{0.4s,0.8s,1.2s，…,12.0s}、t′₃∈{0.6s,1.2s,1.8s，…,18.0s}和S′∈{2.7m,10.7m,24m,42.6m,66.6m,95.9m，130.5m170.5m，215.8m，266.4m，322.3m，383.6m,450.2m，522.1m，599.4m，682m,769.9m，863.1m，961.7m，1065.6m，1174.8m，1289.4m，1409.3m，1534.5m,1665m，1800.9m，1942.1m，2088.6m,2240.4m，2397.6m}共30组数据，如图11所示DNA分子学习机的测试输出与期望输出基本吻合，表明该学习机基本实现了变速直线运动的时间和总位移关系的预测，如图12所示，30组测试数据的相对误差都集中在0.2附近，表明该DNA分子学习机基本满足测试需求。

上面所述只是为了说明本发明，应该理解为本发明并不局限于以上实施例，符合本发明思想的各种变通形式均在本发明的保护范围之内。

Claims

1.基于新型激励函数的DNA分子学习机方法，其特征在于，包括以下步骤：

S1：基于DNA链置换反应构建激励函数；

2.根据权利要求1所述的基于新型激励函数的DNA分子学习机方法，其特征在于，所述S1中激励函数的理想化反应描述为：

反应(1)的微分方程如下：

公式(2)中的第二个式子两端同时取积分可得：

由公式(3)可得物质A的数学解析解为：

lnA(t)＝-kxt+C₁ (4)

其中c₁∈R，可得

当t＝0时,A(0)＝[A]₀,因此显然

A(t)＝[A]₀e^-kxt (6)

其中[*]₀代表*的初始浓度；

公式(2)中的第三个式子两端同时取积分可得：

将公式(6)的结果带入到公式(7)中，可得：

将积分变量t替换成-kxt可得：

根据公式(9)，可以得到y(t)的表达式为：

y(t)＝C₂-[A]₀e^-kxt

其中C₂∈R，当t＝0时，y(0)＝[y]₀,因此C₂＝[A]₀+[y]₀,则可得：

y(t)＝([A]₀+[y]₀)(1-e^-kxt) (10)

公式(10)为新型激励函数的表达式；

反应(1)由如下DNA链置换反应实现：

其中x和y为信号DNA分子，Ga、Gb和H为辅助DNA链。

3.根据权利要求1所述的基于新型激励函数的DNA分子学习机方法，其特征在于，所述S2中的分子学习机包括输入层部分、隐藏层部分、输出层部分，其中输入层部分表达式如下：

其中反应(12)包含催化反应模块1和降解反应模块，输入层的节点数为N，则i＝1，2，…，N

输入层理想化反应描述为：

隐藏层部分表达式如下：

其中反应(14)包含催化反应模块1和降解反应模块其中隐藏层的节点数量为L，则n＝1，2，…，L；

输出层部分的理想化反应表达式如下：

反应(15)包含催化反应模块2和降解反应模块，其中输出层的节点数量为M，则j＝1，2，…，M；

反应(16)中W_in和V_nj为短DNA链，前两项为调节反应模块1；而S_n、y_n和Y_j为长DNA链，后三项为调节反应模块2；

根据反应(12)-(16)，可得P_n、P′_j、y_n和的微分方程为

其中分别为隐藏层的激励函数和输出层的输出函数。

4.根据权利要求3所述的基于新型激励函数的DNA分子学习机方法，其特征在于，所述催化反应模块1反应方程为：它由如下DNA链置换反应得到：

其中P_i被催化，X_i为输入信号DNA分子，W_i为权值报告链，Am_i、An_i和C_i为辅助DNA链，且辅助DNA链的初始浓度为C_m，并满足C_m≥[P_i]₀,[W_i]₀,[X_i]₀，反应速率q_i和k_i满足q_i≤q_m，k_i＝q_i，q_m表示最大反应速率；

所述催化反应模块2反应方程为：由如下DNA链置换反应得到：

其中P_i被催化，Ua_i、Ub_i、D_i及V_i为辅助DNA链，且辅助DNA链的初始浓度设定为C_m，并满足C_m≥[P_i]₀,[Y_i]₀；反应速率q_i满足q_i≤q_m，k_i＝q_i。

所述降解反应模块的反应方程为：由如下DNA链置换反应得到：

其中P_i被降解，Tai、Tbi和M_i为辅助DNA链，且辅助DNA链的初始浓度为C_m，并满足C_m≥[P_i]₀,[Y_i]₀；反应速率q_i满足q_i≤q_m，k_i＝q_i；

所述调节反应模块1方程为由如下DNA链置换反应得到：

其中DNA链W_i、Ea_i和Eb_i的初始浓度满足[W_i]₀,[Ea_i]₀＜＜[Eb_i]₀，反应速率满足kc_i＝qc_i，kd_i＝qd_i，调节反应模块1用于短DNA链的调节作用，其中W_i为短DNA链；

所述调节反应模块2方程为由如下DNA链置换反应得到：

其中DNA链Y_i、Wa_i和Wb_i的初始浓度满足[Y_i]₀,[Wa_i]₀＜＜[Wb_i]₀，反应速率满足km_i＝qm_i，kn_i＝qn_i，调节反应模块2用于长DNA链的调节作用，其中Y_i为短DNA链。

5.根据权利要求1所述的基于新型激励函数的DNA分子学习机方法，其特征在于，所述S4中训练过程包括以下步骤：

S4-1：训练数据的归一化处理

DNA分子学习机的训练由多组训练迭代完成，每组数据又由N个数据构成，即该学习机有N个输入，则i＝1,2,L,N；

其中

α_ip表示第p组训练数据中的第i个训练数据(p＝1,2，…，P)，X_i＝[α_i1,α_i2,…，α_iP]表示由P组训练数据中的第i组训练数据形成的矩阵，函数max(*)和min(*)分别用于求出矩阵的最大值和最小值，此外，σ表示正调整系数，而χ_ip和分别表示分子学习系统的输入信号和输出信号；

S4-2：机器学习的训练评估

在一轮训练中，定义相对误差e_p如下：

其中

其中D_p表示使用所提出的激励函数获得的计算结果，和/>分别表示训练后W_in和V_n1达到动态平衡后的浓度；

当一组训练数据已经被完全训练时，打乱P组训练数据的顺序然后继续下一次训练循环，利用平均相对误差来评估该训练迭代的有效性；

在多次训练迭代之后，直至ARE的值达到或低于预定阈值。

6.根据权利要求1所述的基于新型激励函数的DNA分子学习机方法，其特征在于，所述S5中测试过程包括机器学习的测试评估，其过程如下：

使用与训练数据不同的一组单独的Q组数据作为测试数据，该测试数据需要经过公式(23)中描述的归一化过程，以便进行如下准确评估：

其中β_iq表示第q组测试数据中的第i个训练数据，(q＝1，2，…，Q),/>定义相对误差e′_q用于衡量测试性能：

其中

D′_m表示使用第q组训练数据和所提出的激励函数获得的计算结果，此外，W_in和V_n1表示完成训练后获得的权重值。

7.根据权利要求3所述的基于新型激励函数的DNA分子学习机方法，其特征在于，所述输入层部分、隐藏层部分和输出层部分中的催化反应模块1、降解反应模块属于同一类型的反应模块，但不是同一反应模块。