CN109559782B - 一种基于多目标遗传算法的dna序列编码方法 - Google Patents

一种基于多目标遗传算法的dna序列编码方法 Download PDF

Info

Publication number
CN109559782B
CN109559782B CN201811326246.2A CN201811326246A CN109559782B CN 109559782 B CN109559782 B CN 109559782B CN 201811326246 A CN201811326246 A CN 201811326246A CN 109559782 B CN109559782 B CN 109559782B
Authority
CN
China
Prior art keywords
population
dna
sequences
individuals
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811326246.2A
Other languages
English (en)
Other versions
CN109559782A (zh
Inventor
张凯
赵浩志
许志伟
胡威
符海东
张晓龙
贺娟娟
刘俊
刘小明
廖雪超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Science and Engineering WUSE
Original Assignee
Wuhan University of Science and Engineering WUSE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Science and Engineering WUSE filed Critical Wuhan University of Science and Engineering WUSE
Priority to CN201811326246.2A priority Critical patent/CN109559782B/zh
Publication of CN109559782A publication Critical patent/CN109559782A/zh
Application granted granted Critical
Publication of CN109559782B publication Critical patent/CN109559782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种基于多目标遗传算法的DNA序列编码方法,通过维持一个寻优种群和一个精英种群,每次迭代只更新寻优种群中的个体,通过基于最小曼哈顿距离的动态精英选择算法从寻优种群和精英种群中选择出下一代的精英种群,直到达到最大迭代次数,最后挑选精英种群中的个体作为最终生成的一组DNA编码序列。该方法具有有效性和可靠性,可以产生高质量DNA分子集,有效提高DNA计算的规模和可靠性。

Description

一种基于多目标遗传算法的DNA序列编码方法
技术领域
本发明属于生物信息工程领域,涉及一种脱氧核糖核酸(下文中简称DNA) 的序列编码设计方法,尤其涉及基于多目标遗传算法的DNA序列编码设计方法。
背景技术
DNA中文名称是脱氧核糖核酸,是一种高分子化合物,经水解后可以获得四种脱氧核糖核苷酸。这四种脱氧核糖核苷酸之间仅仅只是碱基的成分不同,分别是腺嘌呤(Adenine)、胞嘧啶(Cytosine)、鸟嘌呤(Guanine)和胸腺嘧啶(Thymine),简记为A、C、G、T,则可以通过不同的碱基区别不同的核苷酸,用碱基序列表示DNA分子结构。
DNA二级结构即双螺旋结构模型,由一条5′→3′的DNA单链和一条3′→5 的DNA单链平行盘旋而成。两条DNA单链之间通过氢键连接,形成碱基对,其配对规律为腺嘌呤(A)和胸腺嘧啶(T)配对,鸟嘌呤(G)和胞嘧啶(C) 配对,这就是碱基的互补配对原则(也称Watson-Crick互补原则)。DNA的碱基互补是DNA分子计算的基础。DNA单链之间如果存在碱基互补配对区域,无论是整条链全部互补配对,或是部分互补配对,都可以形成双链或部分双链结构,这就是DNA分子杂交。对于DNA分子与其补链的碱基完全互补配对的杂交反应称为特异性杂交,除此以外的杂交反映均为非特异性杂交。
通过生物化学手段控制DNA分子之间的杂交反映,可以实现DNA计算。其与传统的电子计算机相比,具有高度并行性,海量的存储能力,低能耗,资源丰富易获取的特点。在1995年的第一届DNA计算会议上,科学家们充分肯定了DNA计算的可行性,普遍认为一旦DNA计算机研制成功,电子计算机将难以望其项背。
DNA计算的基本思想是:利用DNA双链结构和互补原则,按照一定的规则将原始问题的数据映射为DNA分子链,在相关酶的作用下,对DNA分子链进行可控的生化操作,生成新的DNA片段,最后利用DNA分子提取技术得到特定的DNA分子段,即为原问题的解。然而DNA计算中的特异解的提取、目标链的PCR扩增、DNA重组和DNA检测等操作的可靠性都依赖DNA分子之间的特异性杂交反应。因此杂交反应的效率和精度都直接影响着DNA计算的可靠性。
DNA编码是DNA计算的第一步,它直接影响着DNA计算中的杂交反应是否按照预期的设计而进行。而且编码数量的多少决定了DNA计算的问题规模大小,与DNA计算是否能够深入发展息息相关。编码的目的就是要使DNA计算中的生化反应尽可能为特异性杂交,且反应产物中含有足够多的,可靠性强的,能被成功提取的原始算例的解。DNA编码序列的设计通常是利用约束条件来筛选序列,使其最大限度地满足要求,本质上是一个多目标问题。求解方法主要有随机搜索、进化算法、模板映射方法、多目标优化等。DNA编码问题是一个难于求解的问题,目前还没有统一的规范方法来求解。
编码问题已成为目前DNA计算研究中迫切需要解决的关键问题。如何在满足各项约束条件的基础上构造出高效的DNA分子编码序列是这个问题的难点。随着DNA计算研究的不断深入,编码问题的重要性愈加凸显,它在一定程度上决定着DNA计算的未来。
发明内容
基于上述问题,本发明提供了如下解决方案:
一种基于多目标遗传算法的DNA序列编码方法,包括以下步骤:
S100,设置最大迭代次数T,寻优种群P大小N,精英种群Q大小M,DNA 序列长度L,变异率Pc,交叉率Pm进行初始化;
S101,随机产生N个长度为L的随机DNA序列,设为初始寻优种群P0;随机产生M个长度为L的随机DNA序列,设为初始精英种群Q0;使用0,1, 2,3来表示DNA序列中的碱基A,C,G,T,对于长度为L的DNA序列可表示为x1x2x3...xl,其中xi∈{0,1,2,3},1≤i≤l,l为DNA序列的长度;
S102,合并寻优种群Pt和精英种群Qt为Rt,根据最小曼哈顿距离算法计算种群Rt中每个个体的适应度值,其中,t为迭代次数,0≤t≤T;
S103,将Rt中的个体按照适应度值从高到低进行排序,根据动态精英选择机制挑选出前M个个体成为新的精英种群Rt+1
S104,对当前寻优种群Pt中的个体按照适应度值从高到低进行排序,挑选前N/2个个体组成有繁衍能力的优势种群;
S105,对所述优势种群中的N/2个个体进行交叉和变异操作组成由N/2个新个体组成的变异种群;
S106,合并所述优势种群和变异种群生成下一代寻优种群Pt+1
S107,判断进化代数是否达到设定的最大值T,如果达到最大值则进入步骤 S108,否则进入步骤S102;
S108,输出精英种群Q中的M个个体,作为最终生成的DNA编码序列。
进一步的,S102具体包括:对于给定种群Rt={x1,x2,..xi…,xn},i=1,2,3…n,个体评价函数为f(x),则该种群中第i个个体的曼哈顿距离如式(1)所示:
Figure BDA0001858830460000041
其中,
max(f)=Max(f(xi)),i=1,2,...,n (2)
min(f)=Min(f(xi)),i=1,2,...,n (3)
max(f)表示种群中个体评价函数值得最大值,min(f)表示最小值。
进一步的,当有d个评价函数时,个体的评价函数为fj(x),j=1,2,3…d,个体i的适应度值公式为个体i在d个评价函数上的MMD之和,如式(4)所示:
Figure BDA0001858830460000042
进一步的,S105中,对个体进行交叉操作生成新的子代个体序列包括如下方法:
首先随机选取一个交叉点i,然后将两个序列的随机点i到最后一个点之间的两个子序列进行交换,生成两个新的序列;
或者,首先随机选取两个交叉点i和j,然后将两个序列的随机点i到随机点j之间的两个子序列进行倒序交换,生成两个新的序列。
进一步的,S105中,对个体进行变异操作生成新的子代个体序列包括如下方法:
首先随机选取一个变异点i,然后在[0,1,2,3]中随机选择,替换变异点 i,生成新的序列;
或者,首先随机选取i和j两个变异点,然后在[0,1,2,3]中随机选择两个数,替换变异点i和j点,生成新的序列。
本发明的DNA序列编码方法,通过维持一个寻优种群和一个精英种群,每次迭代只更新寻优种群中的个体,通过基于最小曼哈顿距离的动态精英选择算法从寻优种群和精英种群中选择出下一代的精英种群,直到达到最大迭代次数,最后挑选精英种群中的个体作为最终生成的一组DNA编码序列。其具有如下特征和优点:
1)动态精英选择机制根据种群环境进行变化,H-measure,Similarity,HS_diff,HS_sum均在Rt种群中进行计算并更新;
2)交叉和变异操作不是在当前寻优种群上进行,而是在优势种群上进行;
3)下一代寻优种群是根据优势种群和变异种群合并得到而不是普通遗传算法中单纯的对亲代寻优种群进行交叉和变异获得。
本发明的DNA序列编码方法,具有较高的有效性和可靠性,可以产生高质量DNA分子集,有效提高DNA计算的规模和可靠性。
附图说明
图1为本发明的基于多目标遗传算法的DNA序列编码方法实施例的流程示意图。
图2为使用0,1,2,3来表示DNA序列中的碱基A,C,G,T的示意图。
图3为长度为20的DNA序列X与Y的汉明距离示意图。
图4为DNA序列X与Y移位前后汉明距离的比较示意图。
图5为一条DNA序列连接两条相同DNA序列的示意图。
图6为DNA序列X和Y的相似度示意图。
图7为碱基的连续性示意图。
图8为本发明的DNA编码方法和使用NACST/Seq方法生成的DNA序列以及它们的评价指标。
具体实施方式
为使本发明更加容易理解,下面结合附图和实施例对本发明作进一步详细说明。
如图1所示,本发明的基于多目标遗传算法的DNA序列编码方法的实施例,包括以下步骤:
S100,设置最大迭代次数T,寻优种群P大小N,精英种群Q大小M,DNA 序列长度L,变异率Pc,交叉率Pm进行初始化。M、L与需要求解的DNA 序列有关,优种群P的大小N设置为精英种群大小M的20倍,若需求解7条长度为20的DNA序列,M=7,L=20,N=140。T设置为1000,Pc设置为0.01, Pm设置为0.8,根据M和L的不同,算法参数也能进行微小调整。
S101,随机产生N个长度为L的随机DNA序列,设为初始寻优种群P0。随机产生M个长度为L的随机DNA序列,设为初始精英种群Q0。如图2所示,使用0,1,2,3来表示DNA序列中的碱基A,C,G,T,对于长度为L的DNA 序列可表示为x1,x2,x3...xl,其中xi∈{0,1,2,3},1≤i≤l,l为DNA序列的长度。
S102,合并寻优种群Pt和精英种群Qt为Rt,根据最小曼哈顿距离算法 (MinimizeManhattan Distance,MMD)计算种群Rt中每个个体的适应度值;其中,t表示迭代次数,初始值为0,且0≤t≤T。
对于给定种群Rt={x1,x2,..xi…,xn},i=1,2,3…n,个体评价函数为f(x),则这该种群中第i个个体的曼哈顿距离如式(1)所示:
Figure BDA0001858830460000061
其中,
max(f)=Max(f(xi)),i=1,2,...,n (2)
min(f)=Min(f(xi)),i=1,2,...,n (3)
max(f)表示种群中个体评价函数值得最大值,min(f)表示最小值。
对于有d个评价函数的情况,个体的评价函数为fj(x),j=1,2,3…d,个体i的适应度值公式为个体i在d个评价函数上的MMD之和,如式(4)所示:
Figure BDA0001858830460000071
本发明使用H-measure函数(H-measure),相似度函数(Similarity),发卡结构约束(Hairpin),连续度函数(Continuity),GC含量(GC),解链温度(TM),HS差函数(HS_diff),HS和函数(HS_sum)八个评价函数对DNA编码序列进行评价,评价函数均使用MMD函数进行处理且HS_diff定义为个体H-measure和 Similarity的MMD值的差的平方,HS_sum定义为个体H-measure和Similarity 的MMD值的和。
用X表示单链DNA序列,XC表示X的Watson-Crick补序列,XR表示X的反向序列,XRC表示X的反补序列。
汉明距离指两条DNA序列对应位置碱基不同的个数,如图3所示,长度为 20的DNA序列X与Y的汉明距离为4。设DNA序列X和Y分别为 X=5′–x1x2…xn–3′和Y=5′–y1y2…yn–3′,其汉明距离如(5)式所示:
Figure BDA0001858830460000072
Similarity是考虑了DNA分子序列移位,间隙,和连续匹配后的汉明距离,用以表示DNA分子序列X和Y之间的相似程度。
移位表示假设DNA序列X和Y之间的汉明距离很大,但是将YC向右移动一位之后,与X比较,它们之间的汉明距离可能变得很小,X和YC也很容易发生移位错配杂交,如图4所示。
间隙表示在实际DNA计算中,如果碱基配对的数量够多,还会出现一条 DNA序列连接两条相同DNA序列的情况,如图5所示。其中”_”表示两段相同 DNA序列之间的一个间隙(gap),则Y(_)gY表示两段Y拼接成的序列,且两段 Y之间的间隙大小为g。
碱基连续配对惩罚表示两条DNA序列的碱基配对连续性越高,其杂交的可能性越大。在本发明计算相似度的过程中,对连续碱基相等的情况设置了一个惩罚值。连续相等的碱基数越多,惩罚值越大。本发明的惩罚阈值设为6,即如果连续相等的碱基个数大于6个,就计数。如图6所示,DNA序列X和Y的碱基相等个数为11,连续相等惩罚值为7,所以X和Y的Similarity为18。
H-measure表示为XR与Y之间的Similarity。
Continuity表示碱基的连续性,如图7所示。
Hairpin表示DNA序列中发卡结构的个数。
GC表示DNA序列中碱基G和碱基C的个数占总长度的比值。
TM表示根据Nearest-Neighbors热力学模型得到的解链温度。
HS_diff表示为H-measure和Similarity的MMD值的差的平方。
HS_sum表示为H-measure和Similarity的MMD值的和
其中对于个体I的评价函数H-measure而言,需要将自身与种群中不包括自身的所有其他个体进行计算H-measure值后相加得到个体I的评价函数 H-measure。
其中对于个体I的评价函数Similarity而言,需要将自身与种群中包括自身的所有个体进行计算Similarity值后相加得到个体I的评价函数Similarity。
S103,将Rt中的个体按照适应度值从高到低进行排序,根据动态精英选择机制挑选出前M个个体成为新的精英种群Rt+1。本发明中,动态精英选择机制根据种群环境进行变化,H-measure,Similarity,HS_diff,HS_sum均在Rt种群中进行计算并更新。
S104,对当前寻优种群Pt中的个体按照适应度值从高到低进行排序,挑选前N/2个个体组成有繁衍能力的优势种群。
S105,对优势种群中的N/2个个体进行交叉和变异操作组成由N/2个新个体组成的变异种群。本发明中,交叉和变异操作不是在当前寻优种群上进行,而是在优势种群上进行。
算法随机选取两种方法对个体进行交叉操作生成新的子代个体序列。
方式1:首先随机选取一个交叉点i,然后将两个序列的随机点i到最后一个点之间的两个子序列进行交换,生成两个新的序列。
方式2:首先随机选取两个交叉点i和j,然后将两个序列的随机点i到随机点j之间的两个子序列进行倒序交换,生成两个新的序列。
算法随机选取两种方法对个体进行变异操作生成新的子代个体序列。
方式1:首先随机选取一个变异点i,然后在[0,1,2,3]中随机选择,替换变异点i,生成新的序列。
方式2:首先随机选取i和j两个变异点,然后在[0,1,2,3]中随机选择两个数,替换变异点i和j点,生成新的序列。
S106,合并优势种群和变异种群生成下一代寻优种群Pt+1。本发明中,下一代寻优种群是根据优势种群和变异种群合并得到,而不是普通遗传算法中单纯的对亲代寻优种群进行交叉和变异获得。
S107,判断进化代数是否达到设定的最大值T,如果达到最大值则进入步骤 S108,否则进入步骤S102。
S108,输出精英种群Q中的M个个体,作为最终生成的DNA编码序列。
本发明的DNA编码方法生成的7条长度为20的DNA序列和使用 NACST/Seq方法得到的7条长度为20的DNA序列,以及它们的评价指标如图 8所示。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (5)

1.一种基于多目标遗传算法的DNA序列编码方法,包括以下步骤:
S100,设置最大迭代次数T,寻优种群P大小N,精英种群Q大小M,DNA序列长度L,变异率Pc,交叉率Pm进行初始化;
S101,随机产生N个长度为L的随机DNA序列,设为初始寻优种群P0;随机产生M个长度为L的随机DNA序列,设为初始精英种群Q0;使用0,1,2,3来表示DNA序列中的碱基A,C,G,T,对于长度为L的DNA序列可表示为x1x2x3...xl,其中xi∈{0,1,2,3},1≤i≤l,l为DNA序列的长度;
S102,合并寻优种群Pt和精英种群Qt为Rt,根据最小曼哈顿距离算法计算种群Rt中每个个体的适应度值,其中,t为迭代次数,0≤t≤T;
S103,将Rt中的个体按照适应度值从高到低进行排序,根据动态精英选择机制挑选出前M个个体成为新的精英种群Rt+1
S104,对当前寻优种群Pt中的个体按照适应度值从高到低进行排序,挑选前N/2个个体组成有繁衍能力的优势种群;
S105,对所述优势种群中的N/2个个体进行交叉和变异操作组成由N/2个新个体组成的变异种群;
S106,合并所述优势种群和变异种群生成下一代寻优种群Pt+1
S107,判断进化代数是否达到设定的最大值T,如果达到最大值则进入步骤S108,否则进入步骤S102;
S108,输出精英种群Q中的M个个体,作为最终生成的DNA编码序列。
2.如权利要求1所述的基于多目标遗传算法的DNA序列编码方法,其特征在于,S102具体包括:对于给定种群Rt={x1,x2,..xi…,xn},i=1,2,3…n,个体评价函数为f(x),则该种群中第i个个体的曼哈顿距离如式(1)所示:
Figure FDA0001858830450000021
其中,
max(f)=Max(fxi)),i=1,2,...,n (2)
min(f)=Min(f(xi)),i=1,2,...,n (3)
max(f)表示种群中个体评价函数值得最大值,min(f)表示最小值。
3.如权利要求2所述的基于多目标遗传算法的DNA序列编码方法,其特征在于,当有d个评价函数时,个体的评价函数为fj(x),j=1,2,3…d,个体i的适应度值公式为个体i在d个评价函数上的MMD之和,如式(4)所示:
Figure FDA0001858830450000022
4.如权利要求1所述的基于多目标遗传算法的DNA序列编码方法,其特征在于,S105中,对个体进行交叉操作生成新的子代个体序列包括如下方法:
首先随机选取一个交叉点i,然后将两个序列的随机点i到最后一个点之间的两个子序列进行交换,生成两个新的序列;
或者,首先随机选取两个交叉点i和j,然后将两个序列的随机点i到随机点j之间的两个子序列进行倒序交换,生成两个新的序列。
5.如权利要求1所述的基于多目标遗传算法的DNA序列编码方法,其特征在于,S105中,对个体进行变异操作生成新的子代个体序列包括如下方法:
首先随机选取一个变异点i,然后在[0,1,2,3]中随机选择,替换变异点i,生成新的序列;
或者,首先随机选取i和j两个变异点,然后在[0,1,2,3]中随机选择两个数,替换变异点i和j点,生成新的序列。
CN201811326246.2A 2018-11-08 2018-11-08 一种基于多目标遗传算法的dna序列编码方法 Active CN109559782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811326246.2A CN109559782B (zh) 2018-11-08 2018-11-08 一种基于多目标遗传算法的dna序列编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811326246.2A CN109559782B (zh) 2018-11-08 2018-11-08 一种基于多目标遗传算法的dna序列编码方法

Publications (2)

Publication Number Publication Date
CN109559782A CN109559782A (zh) 2019-04-02
CN109559782B true CN109559782B (zh) 2022-11-25

Family

ID=65865892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811326246.2A Active CN109559782B (zh) 2018-11-08 2018-11-08 一种基于多目标遗传算法的dna序列编码方法

Country Status (1)

Country Link
CN (1) CN109559782B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792877B (zh) * 2021-09-18 2024-02-20 大连大学 基于双策略黑蜘蛛算法的dna存储编码优化方法
GB2619782A (en) * 2021-09-18 2023-12-20 Univ Dalian Tech DNA storage coding optimization method based on double-strategy back spider algorithm

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699514A (zh) * 2009-10-30 2010-04-28 西安电子科技大学 基于免疫克隆量子聚类的sar图像分割方法
CN102419549A (zh) * 2011-09-13 2012-04-18 浙江大学 混合dna遗传算法的复杂化工过程建模方法
GB201717125D0 (en) * 2016-11-28 2017-11-29 National Univ Of Defense Technology Differential evolution method oriented to agile satellite multi-target task planning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699514A (zh) * 2009-10-30 2010-04-28 西安电子科技大学 基于免疫克隆量子聚类的sar图像分割方法
CN102419549A (zh) * 2011-09-13 2012-04-18 浙江大学 混合dna遗传算法的复杂化工过程建模方法
GB201717125D0 (en) * 2016-11-28 2017-11-29 National Univ Of Defense Technology Differential evolution method oriented to agile satellite multi-target task planning

Also Published As

Publication number Publication date
CN109559782A (zh) 2019-04-02

Similar Documents

Publication Publication Date Title
Brenneman et al. Strand design for biomolecular computation
CN102063643B (zh) 一种基于dna计算的智能优化仿真方法
CN109559782B (zh) 一种基于多目标遗传算法的dna序列编码方法
Chaves-González et al. A multiobjective swarm intelligence approach based on artificial bee colony for reliable DNA sequence design
Cervantes-Salido et al. Improving the design of sequences for DNA computing: A multiobjective evolutionary approach
Rasool et al. BO-DNA: Biologically optimized encoding model for a highly-reliable DNA data storage
CN108509764B (zh) 一种基于遗传属性约简的古生物谱系演化分析方法
Oluoch et al. A review on RNA secondary structure prediction algorithms
CN113792877A (zh) 基于双策略黑蜘蛛算法的dna存储编码优化方法
CN112348154A (zh) 基于混沌优化鲸鱼算法的dna序列设计方法
CN110534154B (zh) 基于和声搜索的鲸鱼dna序列优化方法
Kurniawan et al. An ant colony system for DNA sequence design based on thermodynamics
CN116933485A (zh) 一种遗传贪心组合算法的装配序列规划方法
CN101866388A (zh) 一种dna计算编码系统及其方法
Bohdan A method for nucleotide sequence analysis
Garzon DNA codeword design: Theory and applications
Kwarciak et al. Tabu search algorithm for DNA sequencing by hybridization with multiplicity information available
Tsaftaris et al. DNA-based matching of digital signals
Zhang et al. On secondary structure avoidance of codes for DNA storage
Wang et al. DNA codewords design using the improved NSGA-II algorithms
Yoon et al. RNA secondary structure prediction using context-sensitive hidden Markov models
Kurniawan et al. Evaluation of ordering methods for DNA sequence design based on ant colony system
Jetlin et al. Tries based rna structure prediction
Mantha Improving Reliability in DNA based Computations with Applications to Cryptography
Tannenbaum et al. Imperfect DNA lesion repair in the semiconservative quasispecies model: Derivation of the Hamming class equations and solution of the single-fitness peak landscape

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant