CN117057405A - 基于新型激励函数的dna分子学习机方法 - Google Patents
基于新型激励函数的dna分子学习机方法 Download PDFInfo
- Publication number
- CN117057405A CN117057405A CN202311058803.8A CN202311058803A CN117057405A CN 117057405 A CN117057405 A CN 117057405A CN 202311058803 A CN202311058803 A CN 202311058803A CN 117057405 A CN117057405 A CN 117057405A
- Authority
- CN
- China
- Prior art keywords
- reaction
- dna
- equation
- training
- learning machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006870 function Effects 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000005284 excitation Effects 0.000 title claims abstract description 40
- 238000006243 chemical reaction Methods 0.000 claims abstract description 74
- 238000004364 calculation method Methods 0.000 claims abstract description 25
- 230000008569 process Effects 0.000 claims abstract description 14
- 108020004414 DNA Proteins 0.000 claims description 128
- 238000012549 training Methods 0.000 claims description 68
- 102000053602 DNA Human genes 0.000 claims description 63
- 238000006073 displacement reaction Methods 0.000 claims description 33
- 238000012360 testing method Methods 0.000 claims description 21
- 238000006555 catalytic reaction Methods 0.000 claims description 17
- 238000006731 degradation reaction Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- QDZOEBFLNHCSSF-PFFBOGFISA-N (2S)-2-[[(2R)-2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-1-[(2R)-2-amino-5-carbamimidamidopentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-N-[(2R)-1-[[(2S)-1-[[(2R)-1-[[(2S)-1-[[(2S)-1-amino-4-methyl-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]pentanediamide Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CCCNC(N)=N)C1=CC=CC=C1 QDZOEBFLNHCSSF-PFFBOGFISA-N 0.000 claims description 2
- 102100024304 Protachykinin-1 Human genes 0.000 claims description 2
- 101800003906 Substance P Proteins 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000013459 approach Methods 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 238000006467 substitution reaction Methods 0.000 claims description 2
- 238000010998 test method Methods 0.000 claims 1
- 238000009396 hybridization Methods 0.000 abstract description 6
- 238000013473 artificial intelligence Methods 0.000 abstract description 5
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 abstract description 4
- 229910052710 silicon Inorganic materials 0.000 abstract description 4
- 239000010703 silicon Substances 0.000 abstract description 4
- 230000001133 acceleration Effects 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 238000005842 biochemical reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/067—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using optical means
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Neurology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及基于新型激励函数的DNA分子学习机,属于DNA分子计算及人工智能的交叉领域,本方案提出了面向分子电路的新型激励函数,并将该激励函数嵌入到DNA分子电路中,构建了DNA分子学习机,该学习机的学习过程,即权值更新无需硅基电子计算机的参与,完全依靠DNA分子杂交反应的自适应性完成;该学习系统由三部分构成,包括DNA分子学习机的输入层部分、隐藏层部分和输出层部分,该DNA学习机具有学习较复杂非线性函数的能力,与硅电路串行计算模式不同的是,该学习过程是通过DNA杂交反应的同步性实现,因此该DNA分子学习机的计算模式为并行计算模式,通过该方法可以预测或拟合多变量非线性函数,并对输入项的个数没有限制。
Description
技术领域
本发明涉及DNA计算及人工智能领域,具体涉及基于新型激励函数的DNA分子学习机方法。
背景技术
近年来,计算机技术和生物技术都取得了重大进展,经过各领域科学家和学者的共同努力,实现了生物技术与计算机技术的完美融合,通过现代计算机技术处理生物学的基本特征,实现了对生物学更直观的呈现,刷新了人们对生物学的理解,与此同时,生物技术的发展也促进了计算机技术的发展;
DNA计算机的开发过程分为三个阶段:可行性论证、计算速度改进和实用性开发,相应的计算模型分别是试管DNA计算模型、表面DNA计算模型和芯片DNA计算模型,试管DNA计算模型是指在一个或多个试管中的DNA分子和相关生物酶的溶液中通过生化反应进行的DNA计算,表面DNA计算模型是将与问题解决空间相对应的DNA分子固定在固体支撑物上的方法,例如载玻片、金属板或由各种有机聚合物制成的薄膜,解空间是通过各种生化反应逐渐产生的,最终得到计算结果,芯片DNA计算模型的主要任务是在表面模型的基础上提高其实用性,使其能够像电子计算机中的芯片一样大规模生产,使DNA计算机能够投入实际应用;
在人工智能领域,激励函数发挥着重要作用,因为它使人工智能系统能够拟合和预测非线性和复杂的变量关系,由于传统的激励函数的复杂性,利用DNA电路实现是十分困难的,曾经有研究成果利用激励函数的泰勒展开式实现激励函数,但由于泰勒展开式依然比较复杂,利用DNA计算实现依然是比较困难的;
由于传统的激励函数无法利用DNA计算轻易实现,使得DNA电路无法轻易实现传统人工智能的所有功能,大部分DNA电路需要依靠硅基电子计算机来完成训练和学习过程,存在诸多缺点和不足;
鉴于以上,本申请提供基于新型激励函数的DNA分子学习机方法用于解决上述问题。
发明内容
针对上述情况,为克服现有技术之缺陷,本方案提出了面向分子电路的新型激励函数,并将该激励函数嵌入到DNA分子电路中,构建了DNA分子学习机,该学习机的学习过程,即权值更新无需硅基电子计算机的参与,完全依靠DNA分子杂交反应的自适应性完成。
基于新型激励函数的DNA分子学习机方法,其特征在于,包括以下步骤:
S1:基于DNA链置换反应构建激励函数;
S2:利用理想化反应设计分子学习机,并将S1构建的的激励函数嵌入到该分子学习机中;
S3:根据S2中构建的分子学习机,设计相应的DNA分子反应模块,完成该分子学习机的DNA编译;
S4:将S3中的DNA分子学习机进行训练使权值得到更新,计算DNA分子学习机的输出与期望值之间的相对误差,当相对误差达到或低于设定阈值时,达到训练目标;
S5:为衡量该DNA分子学习机的拟合和预测能力,对其进行测试评估。
上述技术方案有益效果在于:
(1)本发明提出了适用于DNA分子电路的新型激励函数,该激励函数具有良好的嵌套性,可级联于任何DNA分子电路中;
(2)本方案提出的基于新型激励函数的DNA分子学习机不需要电子计算机的辅助便可以完成训练和测试过程(该机器学习的权重是通过DNA分子电路的自适应性实现的);
(3)本发明可实现多变量较为复杂的非线性函数关系,即为θ1,θ2,…θN>0,自变量的个数为N个,现有的研究成果基于DNA分子计算的人工神经网络只能处理2个自变量的线性函数关系,通过该方法可以学习多变量非线性函数,对输入项的个数没有限制;
(4)本发明可用于变加速直线运动中位移和时间关系的拟合和预测,并可预测物体受到的驱动力。
附图说明
图1为本发明的训练流程图;
图2为本发明新型激励函数的主要DNA链置换反应;
图3为本发明催化反应模块1的主要DNA链置换反应;
图4为本发明催化反应模块2的主要DNA链置换反应;
图5为本发明降解反应模块的主要DNA链置换反应;
图6为本发明调节反应模块1的主要DNA链置换反应;
图7为本发明调节反应模块2的主要DNA链置换反应;
图8为本发明变速直线运动的装置图;
图9为本发明平均相对误差随训练迭代次数的演化示意图;
图10为本发明DNA分子学习机的训练输出图;
图11为本发明DNA分子学习机的测试输出图;
图12为本发明相对误差随测试数据的演化示意图。
具体实施方式
有关本发明的前述及其他技术内容、特点与功效,在以下配合参考本申请附图对实施例的详细说明中,将可清楚的呈现,以下实施例中所提到的结构内容,均是以说明书附图为参考。
本方案提出一种基于新型激励函数的DNA分子学习机方法,其具体过程包括以下部分:
一、构建面向分子电路的新型激励函数
新型激励函数的理想化反应可描述为如下形式:
反应(1)的微分方程如下:
公式(2)中的第二个式子两端同时取积分可得:
由(3)可得物质A的数学解析为:
lnA(t)=-kxt+C1 (4)
其中,A表示在理想化反应中的一种抽象物质,其中C1∈R,可得
当t=0时,A(0)=[A]0,因此显然
A(t)=[A]0e-kxt (6)
其中[*]0代表*的初始浓度。
公式(2)中的第三个式子两端同时取积分可得:
将公式(6)的结果带入到公式(7)中,可得:
将积分变量t替换成-kxt可得:
根据公式(9),可以得到y(t)的表达式为:
y(t)=C2-[A]0e-kxt
其中C2∈R,当t=0时,y(0)=[y]0,因此C2=[A]0+[y]0,则可得新型激励函数的表达式:
y(t)=([A]0+[y]0)(1-e-kxt) (10)
如图2所示,反应(1)可由如下DNA链置换反应实现:
其中x和y为信号DNA分子,Ga、Gb和H为辅助DNA链。
二、基于新型激励函数的DNA分子学习机的设计
(1)输入层部分表达式如下:
反应(12)包含催化反应模块1和降解反应模块,其中输入层的节点数为N,则i=1,2,…,N,输入层的激励函数采取本方案提出的新型激励函数,其理想化反应描述为:
(2)隐藏层部分表达式如下:
反应(14)包含催化反应模块1和降解反应模块其中隐藏层的节点数量为L,则n=1,2,…,L;
(3)输出层部分的理想化反应表达式如下:
反应(15)包含催化反应模块2和降解反应模块,其中输出层的节点数量为M,则j=1,2,…,M。
信号分子Win和Vnj的浓度表示权值,Sn代表求和结果,yn代表激励函数的输出结果,Yn代表输出层的输出结果,Win、Vnj、Sn、yn和Yn的浓度需要按如下反应加以调节;
反应(16)中Win和Vnj为短DNA链,因此前两项为调节反应模块1;而Sn、yn和Yj为长DNA链,因此后三项为调节反应模块2。
根据反应(12)-(16),可得Pn、P′j、yn和的微分方程为
当物质Pn、P′j和的浓度趋近于平衡的时候,则/>和/>再结合公式(17),可得:
其中分别为隐藏层的激励函数和输出层的输出函数。
三、利用DNA分子电路实现分子学习机
由于理想化反应中反应物和生成物是抽象化的物质不是具体的某一种生化物质,而DNA杂交反应可以实现任意一种理想化反应,本部分利用DNA杂交反应实现该线性学习机;
分子学习机由DNA反应模块(催化反应模块1、催化反应模块2、降解反应模块、调节反应模块1和调节反应模块2)构成,由于上述反应模块具有同质性和级联性,可将它们级联为DNA分子电路,实现学习系统,五种DNA反应模块描述如下:
催化反应模块1反应方程为:它可由如下DNA链置换反应得到:
其中Pi被催化,Xi为输入信号DNA分子,Wi为权值报告链,Ami、Ani和Ci为辅助DNA链,且辅助DNA链的初始浓度为Cm,并满足Cm≥[Pi]0,[Wi]0,[Xi]0,反应速率qi和ki满足qi≤qm,ki=qi,qm表示最大反应速率,催化反应模块1的DNA实现如图3所示;
催化反应模块2反应方程为:可由如下DNA链置换反应得到:
其中Pi被催化,Uai、Ubi、Di及Vi为辅助DNA链,且辅助DNA链的初始浓度设定为Cm,并满足Cm≥[Pi]0,[Yi]0;反应速率qi满足qi≤qm,ki=qi,催化反应模块2的DNA实现如图4所示;
降解反应模块的反应方程为:它可由如下DNA链置换反应得到:
其中Pi被降解,Tai、Tbi和Mi为辅助DNA链,且辅助DNA链的初始浓度为Cm,并满足Cm≥[Pi]0,[Yi]0;反应速率qi满足qi≤qm,ki=qi,降解反应模块的DNA实现如图5所示;
调节反应模块1方程为它可由如下DNA链置换反应得到:
其中DNA链Wi、Eai和Ebi的初始浓度满足[Wi]0,[Eai]0<<[Ebi]0,反应速率满足kci=qci,kdi=qdi,调节反应模块1用于短DNA链的调节作用,其中Wi为短DNA链,调节反应模块1的DNA实现如图6所示;
调节反应模块2方程为它可由如下DNA链置换反应得到:
其中DNA链Yi、Wai和Wbi的初始浓度满足[Yi]0,[Wai]0<<[Wbi]0,反应速率满足kmi=qmi,kni=qni,调节反应模块2用于长DNA链的调节作用,其中Yi为短DNA链,调节反应模块2的DNA实现如图7所示。
四、DNA分子学习机的训练
该部分属于该学习系统的应用,该分子学习机具有预测变加速直线运动中位移与时间的关系的能力,是通过数据训练获得的,因此第四部分为DNA分子学习机的训练,为了检测该学习机的学习能力,需要对该分子学习机进行测试,如图1所示,为本方案训练流程图,其中DNA数据链也是DNA信号链(可以表征DNA分子学习机的输入、输出以及权值的DNA链);
如图8所示,物体由第一个光电门的位置从静止开始运动,设置其余光电门的位置,可测得三段位移的时间t1、t2和t3,以及总位移S,将三个时间和一个总位移作为一组训练数据,在物体运动过程中,物体经过不同的光电门时施加大小不同的水平恒定驱动力F1、F2和F3,调节除第一个光电门外其余光电门的位置(调节光电门的位置目的在于改变三段位移的大小,获得不同的训练和测试数据),且保持t1、t2和t3比值不变,又可以得到另外一组训练数据,将得到的这些训练数据输入给DNA分子学习机系统,通过DNA分子的杂交反应,使权值得到更新,并计算DNA分子学习机的输出与期望值之间的相对误差,当相对误差达到或低于设定阈值时,达到训练目标,并停止训练,经过训练得到的权值即为线性函数关系中的w1、w2和w3的值,得到了这些参数值就可以利用总位移值和时间值拟合出它们之间的函数关系,并且获得这些参数值就可以推测物体在每一段位移受到的驱动力F1、F2和F3,原因在于:
由图8可知,物体由第一个光电门到达第二个光电门的过程中驱动力为F1,时间为t1,加速度大小为a1=F1/m,则该段位移大小为
其中m为物体的质量;
物体由第二个光电门到达第三个光电门的过程中驱动力为F2,时间为t2,加速度大小为a2=F2/m,则该段位移大小为
物体由第三个光电门到达第四个光电门的过程中驱动力为F3,时间为t3,加速度大小为a3=F3/m,则该段位移大小为
由公式(23)-(25),可得物体运动的总位移为S
其中ρ1=t1/t2、ρ2=t1/t3和ρ3=t2/t3。
公式(26)可简化为如下形式:
其中w1=a1/2、w2=a1ρ1+a2/2和a3=a1ρ1+a2ρ3+a3/2。
由学习得到的权值w1、w2和w3可得到物体各段受到的驱动力分别为:
本发明利用DNA分子学习机学习变加速直线运动中位移与时间的关系其中权值wi及输入ti(i=1,2,3)皆为实数,由于权值和输入的数值由DNA链的浓度表示,因此wi,ti,S≥0。
(1)训练数据的归一化处理
为保证测试实验数据和训练实验数据落在同一范围,需要对训练用数据按如下进行数据归一化处理:
其中
αip表示第p组训练数据中的第i个训练数据(p=1,2,…,P),Xi=[αi1,αi2,…,αiP]表示由P组训练数据中的第i组训练数据形成的矩阵,函数max(*)和min(*)分别用于求出矩阵的最大值和最小值,此外,σ表示正调整系数,而χip和分别表示分子学习系统的输入信号和输出信号。
(2)线性机器学习的训练评估
在一轮训练中,定义相对误差ep如下:
其中
其中Dp表示使用所提出的激活函数获得的计算结果,和/>分别表示训练后Win和Vn1达到动态平衡后的浓度;
当一组训练数据已经被完全训练时,一次训练迭代就完成了,打乱P组训练数据的顺序允许我们继续下一次训练循环,利用平均相对误差来评估该训练迭代的有效性;
第l次训练迭代的平均相对误差(Average Relative Error,ARE)定义为:
在多次训练迭代之后,当ARE(平均相对误差)的值达到或低于预定阈值时,就认为已经达到了训练目标,训练就完成了;
如图8所示,以3个输入节点的DNA分子学习机为例,说明变加速直线运动中的每一段的时间与总位移的关系的训练和评估,训练的原始数据为:
t1∈{0.1s,0.2s,0.3s,…,3.0s}、t2∈{0.2s,0.4s,0.6s,…,6.0s}、t3∈{0.3s,0.6s,0.9s,…,9.0s}和S∈{0.666m,2.664m,5.994m,10.656m,16.650m,23.976m,32.634m,42.624m,53.946m,66.6m,5860m,95.904m,112.554m,130.536m,149.85m,170.496m,192.474m,215.784m,240.426m,266.4m,293.706m,322.344m,352.314m,383.616m,416.25m,450.216m,485.514m,522.144m,560.106m,599.4m}共30组数据,σ的取值为σ=2,DNA链X1、X2和X3的初始浓度设定为[X1]0∈{0.023nM,0.046nM,0.069nM,…,0.6897nM},[X2]0∈{0.046nM,0.092nM,0.1379nM,…,1.3793nM}和[X3]0∈{0.069nM,0.1379nM,0.2069nM,…,2.069nM},辅助DNA分子的初始浓度(nM)及反应速率(nM/s)的初始设定如表1所示;
表1 DNA链的浓度和反应速率的设定
本方案中,训练目标设定的平均相对误差阈值为图9展示了为达到训练目标所需要的训练迭代次数为50次;
如图10所示,DNA分子学习机的训练输出与期望输出比较吻合,说明该学习机基本实现了变速直线运动时间和总位移的非线性函数关系的拟合。
(3)线性机器学习的测试评估
为了评估分子学习系统的学习有效性,有必要使用与训练数据不同的一组单独的Q组数据作为测试数据,该测试数据还需要经过公式(28)中描述的归一化过程,以便进行如下准确评估:
其中βiq表示第q组测试数据中的第i个训练数据,(q=1,2,…,Q),类似地,定义相对误差e′q用于衡量测试性能:
其中
D′m表示使用第q组训练数据和所提出的激活函数获得的计算结果,此外,Win和Vn1表示完成训练后获得的权重值。
仍以3个输入节点的DNA分子学习机为例,说明测试结果,测试的原始数据为:t′1∈{0.2s,0.4s,0.6s,…,6.0s}、t′2∈{0.4s,0.8s,1.2s,…,12.0s}、t′3∈{0.6s,1.2s,1.8s,…,18.0s}和S′∈{2.7m,10.7m,24m,42.6m,66.6m,95.9m,130.5m170.5m,215.8m,266.4m,322.3m,383.6m,450.2m,522.1m,599.4m,682m,769.9m,863.1m,961.7m,1065.6m,1174.8m,1289.4m,1409.3m,1534.5m,1665m,1800.9m,1942.1m,2088.6m,2240.4m,2397.6m}共30组数据,如图11所示DNA分子学习机的测试输出与期望输出基本吻合,表明该学习机基本实现了变速直线运动的时间和总位移关系的预测,如图12所示,30组测试数据的相对误差都集中在0.2附近,表明该DNA分子学习机基本满足测试需求。
上面所述只是为了说明本发明,应该理解为本发明并不局限于以上实施例,符合本发明思想的各种变通形式均在本发明的保护范围之内。
Claims (7)
1.基于新型激励函数的DNA分子学习机方法,其特征在于,包括以下步骤:
S1:基于DNA链置换反应构建激励函数;
S2:利用理想化反应设计分子学习机,并将S1构建的的激励函数嵌入到该分子学习机中;
S3:根据S2中构建的分子学习机,设计相应的DNA分子反应模块,完成该分子学习机的DNA编译;
S4:将S3中的DNA分子学习机进行训练使权值得到更新,计算DNA分子学习机的输出与期望值之间的相对误差,当相对误差达到或低于设定阈值时,达到训练目标;
S5:为衡量该DNA分子学习机的拟合和预测能力,对其进行测试评估。
2.根据权利要求1所述的基于新型激励函数的DNA分子学习机方法,其特征在于,所述S1中激励函数的理想化反应描述为:
反应(1)的微分方程如下:
公式(2)中的第二个式子两端同时取积分可得:
由公式(3)可得物质A的数学解析解为:
lnA(t)=-kxt+C1 (4)
其中c1∈R,可得
当t=0时,A(0)=[A]0,因此显然
A(t)=[A]0e-kxt (6)
其中[*]0代表*的初始浓度;
公式(2)中的第三个式子两端同时取积分可得:
将公式(6)的结果带入到公式(7)中,可得:
将积分变量t替换成-kxt可得:
根据公式(9),可以得到y(t)的表达式为:
y(t)=C2-[A]0e-kxt
其中C2∈R,当t=0时,y(0)=[y]0,因此C2=[A]0+[y]0,则可得:
y(t)=([A]0+[y]0)(1-e-kxt) (10)
公式(10)为新型激励函数的表达式;
反应(1)由如下DNA链置换反应实现:
其中x和y为信号DNA分子,Ga、Gb和H为辅助DNA链。
3.根据权利要求1所述的基于新型激励函数的DNA分子学习机方法,其特征在于,所述S2中的分子学习机包括输入层部分、隐藏层部分、输出层部分,其中输入层部分表达式如下:
其中反应(12)包含催化反应模块1和降解反应模块,输入层的节点数为N,则i=1,2,…,N
输入层理想化反应描述为:
隐藏层部分表达式如下:
其中反应(14)包含催化反应模块1和降解反应模块其中隐藏层的节点数量为L,则n=1,2,…,L;
输出层部分的理想化反应表达式如下:
反应(15)包含催化反应模块2和降解反应模块,其中输出层的节点数量为M,则j=1,2,…,M;
信号分子Win和Vnj的浓度表示权值,Sn代表求和结果,yn代表激励函数的输出结果,Yn代表输出层的输出结果,Win、Vnj、Sn、yn和Yn的浓度需要按如下反应加以调节;
反应(16)中Win和Vnj为短DNA链,前两项为调节反应模块1;而Sn、yn和Yj为长DNA链,后三项为调节反应模块2;
根据反应(12)-(16),可得Pn、P′j、yn和的微分方程为
当物质Pn、P′j和的浓度趋近于平衡的时候,则/>和/>再结合公式(17),可得:
其中分别为隐藏层的激励函数和输出层的输出函数。
4.根据权利要求3所述的基于新型激励函数的DNA分子学习机方法,其特征在于,所述催化反应模块1反应方程为:它由如下DNA链置换反应得到:
其中Pi被催化,Xi为输入信号DNA分子,Wi为权值报告链,Ami、Ani和Ci为辅助DNA链,且辅助DNA链的初始浓度为Cm,并满足Cm≥[Pi]0,[Wi]0,[Xi]0,反应速率qi和ki满足qi≤qm,ki=qi,qm表示最大反应速率;
所述催化反应模块2反应方程为:由如下DNA链置换反应得到:
其中Pi被催化,Uai、Ubi、Di及Vi为辅助DNA链,且辅助DNA链的初始浓度设定为Cm,并满足Cm≥[Pi]0,[Yi]0;反应速率qi满足qi≤qm,ki=qi。
所述降解反应模块的反应方程为:由如下DNA链置换反应得到:
其中Pi被降解,Tai、Tbi和Mi为辅助DNA链,且辅助DNA链的初始浓度为Cm,并满足Cm≥[Pi]0,[Yi]0;反应速率qi满足qi≤qm,ki=qi;
所述调节反应模块1方程为由如下DNA链置换反应得到:
其中DNA链Wi、Eai和Ebi的初始浓度满足[Wi]0,[Eai]0<<[Ebi]0,反应速率满足kci=qci,kdi=qdi,调节反应模块1用于短DNA链的调节作用,其中Wi为短DNA链;
所述调节反应模块2方程为由如下DNA链置换反应得到:
其中DNA链Yi、Wai和Wbi的初始浓度满足[Yi]0,[Wai]0<<[Wbi]0,反应速率满足kmi=qmi,kni=qni,调节反应模块2用于长DNA链的调节作用,其中Yi为短DNA链。
5.根据权利要求1所述的基于新型激励函数的DNA分子学习机方法,其特征在于,所述S4中训练过程包括以下步骤:
S4-1:训练数据的归一化处理
DNA分子学习机的训练由多组训练迭代完成,每组数据又由N个数据构成,即该学习机有N个输入,则i=1,2,L,N;
其中
αip表示第p组训练数据中的第i个训练数据(p=1,2,…,P),Xi=[αi1,αi2,…,αiP]表示由P组训练数据中的第i组训练数据形成的矩阵,函数max(*)和min(*)分别用于求出矩阵的最大值和最小值,此外,σ表示正调整系数,而χip和分别表示分子学习系统的输入信号和输出信号;
S4-2:机器学习的训练评估
在一轮训练中,定义相对误差ep如下:
其中
其中Dp表示使用所提出的激励函数获得的计算结果,和/>分别表示训练后Win和Vn1达到动态平衡后的浓度;
当一组训练数据已经被完全训练时,打乱P组训练数据的顺序然后继续下一次训练循环,利用平均相对误差来评估该训练迭代的有效性;
第l次训练迭代的平均相对误差(Average Relative Error,ARE)定义为:
在多次训练迭代之后,直至ARE的值达到或低于预定阈值。
6.根据权利要求1所述的基于新型激励函数的DNA分子学习机方法,其特征在于,所述S5中测试过程包括机器学习的测试评估,其过程如下:
使用与训练数据不同的一组单独的Q组数据作为测试数据,该测试数据需要经过公式(23)中描述的归一化过程,以便进行如下准确评估:
其中βiq表示第q组测试数据中的第i个训练数据,(q=1,2,…,Q),/>定义相对误差e′q用于衡量测试性能:
其中
D′m表示使用第q组训练数据和所提出的激励函数获得的计算结果,此外,Win和Vn1表示完成训练后获得的权重值。
7.根据权利要求3所述的基于新型激励函数的DNA分子学习机方法,其特征在于,所述输入层部分、隐藏层部分和输出层部分中的催化反应模块1、降解反应模块属于同一类型的反应模块,但不是同一反应模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311058803.8A CN117057405B (zh) | 2023-08-22 | 2023-08-22 | 基于新型激励函数的dna分子学习机方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311058803.8A CN117057405B (zh) | 2023-08-22 | 2023-08-22 | 基于新型激励函数的dna分子学习机方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117057405A true CN117057405A (zh) | 2023-11-14 |
CN117057405B CN117057405B (zh) | 2024-04-12 |
Family
ID=88667333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311058803.8A Active CN117057405B (zh) | 2023-08-22 | 2023-08-22 | 基于新型激励函数的dna分子学习机方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117057405B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110009108A (zh) * | 2019-04-09 | 2019-07-12 | 沈阳航空航天大学 | 一种全新的量子超限学习机 |
CN113762513A (zh) * | 2021-09-09 | 2021-12-07 | 沈阳航空航天大学 | 一种基于dna链置换的dna神经元学习方法 |
CN114386574A (zh) * | 2022-01-07 | 2022-04-22 | 大连理工大学 | 基于dna支点介导链置换反应技术的非线性神经网络 |
CN115407655A (zh) * | 2022-08-25 | 2022-11-29 | 大连大学 | 一种基于DNA链置换的延迟酶促反应超灵敏Brink控制的实现方法 |
CN115834788A (zh) * | 2022-11-16 | 2023-03-21 | 安阳师范学院 | 面向可视化dna支点介导链置换反应的彩色图像加密方法 |
CN116304853A (zh) * | 2022-12-14 | 2023-06-23 | 北京航空航天大学 | 一种极限学习机与特征提取相结合的数据分类方法及系统 |
CN116343908A (zh) * | 2023-03-07 | 2023-06-27 | 中国海洋大学 | 融合dna形状特征的蛋白质编码区域预测方法、介质和装置 |
-
2023
- 2023-08-22 CN CN202311058803.8A patent/CN117057405B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110009108A (zh) * | 2019-04-09 | 2019-07-12 | 沈阳航空航天大学 | 一种全新的量子超限学习机 |
CN113762513A (zh) * | 2021-09-09 | 2021-12-07 | 沈阳航空航天大学 | 一种基于dna链置换的dna神经元学习方法 |
CN114386574A (zh) * | 2022-01-07 | 2022-04-22 | 大连理工大学 | 基于dna支点介导链置换反应技术的非线性神经网络 |
CN115407655A (zh) * | 2022-08-25 | 2022-11-29 | 大连大学 | 一种基于DNA链置换的延迟酶促反应超灵敏Brink控制的实现方法 |
CN115834788A (zh) * | 2022-11-16 | 2023-03-21 | 安阳师范学院 | 面向可视化dna支点介导链置换反应的彩色图像加密方法 |
CN116304853A (zh) * | 2022-12-14 | 2023-06-23 | 北京航空航天大学 | 一种极限学习机与特征提取相结合的数据分类方法及系统 |
CN116343908A (zh) * | 2023-03-07 | 2023-06-27 | 中国海洋大学 | 融合dna形状特征的蛋白质编码区域预测方法、介质和装置 |
Non-Patent Citations (3)
Title |
---|
CHENGYE ZOU ET AL.: "A nonlinear neural network based on an analog DNA toehold mediated strand displacement reaction circuit", 《NANOSCALE》, 14 April 2022 (2022-04-14) * |
SAYED AHMAD SALEHI ET AL.: "Computing Mathematical Functions using DNA via Fractional Coding", 《SCIENTIFIC REPORTS》, 29 May 2018 (2018-05-29) * |
赵霁巍: "基于链置换的DNA神经元的构建与应用", 《中国优秀硕士学位论文全文数据库 基础科学辑》, no. 01, 15 January 2022 (2022-01-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117057405B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | The onset temperature (Tg) of AsxSe1− x glasses transition prediction: A comparison of topological and regression analysis methods | |
Raza | Fuzzy logic based approaches for gene regulatory network inference | |
Mandenius | Recent developments in the monitoring, modeling and control of biological production systems | |
Yang et al. | Dynamical regularized echo state network for time series prediction | |
di Sciascio et al. | Biomass estimation in batch biotechnological processes by Bayesian Gaussian process regression | |
Shi et al. | Approximate linear dependence criteria with active learning for smart soft sensor design | |
CN104462850A (zh) | 基于模糊高斯混合模型的多阶段间歇过程软测量方法 | |
Khalaj et al. | Metaverse and ai digital twinning of 42sicr steel alloys | |
CN104504288A (zh) | 基于多向支持向量聚类的非线性多阶段间歇过程软测量方法 | |
Du et al. | A novel forward gene selection algorithm for microarray data | |
CN114896672B (zh) | 一种基于CSO-BiLSTM网络的桥梁动态位移重构方法 | |
CN101799888A (zh) | 基于仿生智能蚁群算法的工业软测量方法 | |
CN102054199A (zh) | 基于bp神经网络算法对涂层老化的分析方法 | |
Zhao et al. | Identifying N6-methyladenosine sites using extreme gradient boosting system optimized by particle swarm optimizer | |
Panda et al. | A novel improved prediction of protein structural class using deep recurrent neural network | |
CN107798383A (zh) | 改进的核极限学习机定位方法 | |
Liu et al. | A novel support vector regression algorithm incorporated with prior knowledge and error compensation for small datasets | |
CN111079856A (zh) | 一种基于csjitl-rvm的多时段间歇过程软测量建模方法 | |
Yan et al. | Real-time localization of pollution source for urban water supply network in emergencies | |
Neumann et al. | Reinforcement learning approaches for the optimization of the partial oxidation reaction of methane | |
CN106094513A (zh) | 在线模糊最小二乘支持向量机的烧结过程动力学建模算法 | |
CN114782740A (zh) | 结合遗传优化与极端梯度提升的遥感水质监测方法 | |
CN117057405B (zh) | 基于新型激励函数的dna分子学习机方法 | |
Yang et al. | A neural network learning algorithm of chemical process modeling based on the extended Kalman filter | |
Mi et al. | Prediction of accumulated temperature in vegetation period using artificial neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240705 Address after: Room 1303, Building A, Jianhua City Plaza, No. 447 Zhongshan East Road, Chang'an District, Shijiazhuang City, Hebei Province, China 050000 Patentee after: Hebei Yancai Technology Co.,Ltd. Country or region after: China Address before: 066000 No. 438, Hebei Avenue, Qinhuangdao, Hebei Patentee before: Yanshan University Country or region before: China |