CN114539422B

CN114539422B - 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用

Info

Publication number: CN114539422B
Application number: CN202011340377.3A
Authority: CN
Inventors: 杨凡; 周界文; 周柳娟; 汪焰兵; 曹婵; 闰长青
Original assignee: Ansheng Shanghai Medicine Technology Co ltd
Current assignee: Ansheng Shanghai Medicine Technology Co ltd
Priority date: 2020-11-25
Filing date: 2020-11-25
Publication date: 2024-03-29
Anticipated expiration: 2040-11-25
Also published as: JP2023551827A; AU2021390000A9; WO2022111598A1; US20240294674A1; AU2021390000A1; CN114539422A; KR20230123972A; CN116600823A; EP4253609A1; CA3200188A1

Abstract

本发明提供了核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用。具体地，本发明提供了一种基于互配核酸骨架的多聚体复合物，所述复合物是3‑6个具有互配核酸骨架的单体复合成的多聚体，其中，每个单体为具有所述的核酸单链的多肽；在所述多聚体中，每个单体的核酸单链与另外两个单体的核酸单链通过碱基互补形成双链，从而形成互配核酸骨架结构。本发明还提供含所述多聚体复合物的药物组合物，用于构建所述多聚体复合物的核酸序列文库，以及对互配核酸骨架进行优化的方法。本发明可将现成的短效蛋白药物或抗原，在无需重新构建融合蛋白或化学修饰和交联的条件下，完成蛋白药物或抗原的多价化，提高其半衰期和活性、和/或免疫原性。

Description

核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用

技术领域

本发明涉及生物技术药物领域，具体地涉及核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用。

背景技术

对于很多生物大分子来说，它们的聚集或多价状态直接影响它们体内的活性和半衰期。例如，大部分免疫受体的激活涉及受体在细胞膜上聚集，从而激活细胞内部下游的信号通路。所以，这些受体的天然配体或抗体在形成多价或高价时往往能够显著提高激活受体的能力。另外，有些分子量较低的蛋白药物(MW 40kDa)，如细胞因子、生长激素、合成多肽等药物的肾脏清除率高，体内半衰期短；这些蛋白药物也可以通过形成高价而增加分子量，提高半衰期。

因此，将蛋白多价化是生物医药领域的较收关注的一种工艺，现有的方法也很多，但是多数的化学交联方法存在连接特异性差，连接多聚体不均一的问题。目前最为广泛应用的方法是将蛋白以多价融合蛋白的形式由细胞表达生产，就是将有药功能的蛋白区域与能够形成寡聚体的蛋白融合形成嵌合体，如Fc二价融合蛋白，GCN4三价融合蛋白等。这些融合蛋白都能形成均一的寡聚体，但是融合蛋白的细胞表达量和活性往往比原始的蛋白药物差，并且Fc区域的存在带来了激活免疫系统，诱导细胞因子释放，造成细胞毒性的风险。因此，本领域亟待开发一种简单、灵活、高效的方法，可将已经被验证的蛋白药物以非融合蛋白方式形成均一的，特异性高的多价蛋白。

另外，蛋白多价化对疫苗研发也有重要意义。首先，在基于B细胞的疫苗设计里，用病毒或细菌的蛋白作为抗原激活B细胞受体(BCR)是至关重要的一步。BCR和以上所述的免疫受体一样，其有效激活需要受体在细胞膜上聚集，所以高价抗原在激活B细胞方便相比单体抗原具有绝对的优势。其次，高价抗原未必一定是单一种抗原形成寡聚体；高价抗原可以含有某种病毒里不同的蛋白或不同病毒株的相同蛋白的突变型和亚型；如此，多元化的抗原呈递理论上可以诱导宿主免疫系统的多株B細胞反应(polyclonal response)，产生更广泛性的中和抗体。

发明内容

本发明的目的一是提供一种高效且稳定组装的n阶核酸寡聚体装配骨架设计，适用于将核酸偶联的蛋白药物高效且稳定的组装，形成多价药物或疫苗。

本发明的目的二是提供一种简单、高效的将蛋白药物形成多价大分子的方法用于延长药物半衰期，增加药物活性。

本发明的目的三是提供一种简单、灵活、高效、模块化的方法将相同或不同的蛋白抗原形成多价大分子复合物，用于激活免疫细胞，提高疫苗的免疫原性。

在本发明的第一方面，提供了一种基于互配核酸骨架的多聚体复合物，所述的复合物是n个具有互配核酸骨架的单体复合形成的多聚体，其中，每个单体为具有所述的核酸单链的多肽，而n为3-6的正整数；在所述多聚体中，每个单体的核酸单链与另外两个单体的核酸单链通过碱基互补形成互配双链，从而形成互配核酸骨架结构。

在另一优选例中，n为3、4、5或6。

在另一优选例中，所述的复合物为三聚体、四聚体、或五聚体，较佳地所述复合物的结构如图1所示。

在另一优选例中，所述的单体具有式I结构：

Z1-W (I)

式中，

Z1为多肽部分(moiety)；

W为单链核酸序列；

“-”为接头或键。

在另一优选例中，“-”为共价键。

在另一优选例中，所述核酸序列选自下组：左旋核酸、肽核酸、锁核酸、硫代修饰核酸、2'-氟修饰核酸、5-羟甲基胞嘧啶核酸、吗啉磷酸酯(phosphorodiamidate morpholino)核酸、或其组合；

在另一优选例中，在所述多聚体中，每个单体的Z1是相同或不同的。

在另一优选例中，在所述多聚体中，每个单体的W是不同的。

在另一优选例中，所述的单体具有式II结构

D–[L–W]m (2)

其中，

D为蛋白药物元件部分；

W为核酸序列；

L为无或接头；

“-”为共价键；

m为1、2或3。

在另一优选例中，m为1。

在另一优选例中，所述的单体具有式II结构

A–[L–W]m (2)

其中，

A为多肽抗原元件部分；

W为核酸序列；

L为无或接头；

“-”为共价键；

m为1、2或3。

在另一优选例中，m为1。

在另一优选例中，所述的核酸序列W具有式1所示的结构：

X1–R1–X2–R2–X3 (1)

其中，

R1为碱基互补配对区域1；

R2为碱基互补配对区域2；

X1、X2和X3各自独立地为无或冗余核酸；

“－”为键。

在另一优选例中，R1和R2的长度各自独立地为10-20碱基，较佳地14-16碱基。

在另一优选例中，X1的长度为0-5碱基。

在另一优选例中，X3的长度为0-5碱基。

在另一优选例中，X2的长度为0-3碱基。

在另一优选例中，X2的序列选自下组：A，AA，AGA或AAA。

在另一优选例中，每个单体的R1与左邻(或左侧)单体的R2形成碱基互补配对结构；而R2与右邻(或右侧)单体的R1形成碱基互补配对结构。

在本发明的第二方面，提供了一种药物组合物，所述药物组合物包括：

(a)第一方面中所述的基于互配核酸骨架的多聚体复合物；和

(b)药学上可接受的载体。

在另一优选例中，所述的药物组合物包括疫苗组合物。

在另一优选例中，所述的药物组合物包括治疗性和/或预防性的药物组合物。

在另一优选例中，所述的多聚体复合物包括三聚体复合物、四聚体复合物和五聚体复合物。

在本发明的第三方面，提供了一种核酸序列文库，所述的核酸文库包括用于形成第一方面所述的基于互配核酸骨架的多聚体复合物的核酸序列。

在另一优选例中，所述的核酸序列包括：

(a)用于形成基于互配核酸骨架的三聚体复合物的核酸序列；

(b)用于形成基于互配核酸骨架的四聚体复合物的核酸序列；和/或

(c)用于形成基于互配核酸骨架的五聚体复合物的核酸序列。

在另一优选例中，所述的核酸序列W具有式1所示的结构：

X1-R1-X2-R2-X3 (1)

其中，

R1为碱基互补配对区域1；

R2为碱基互补配对区域2；

X1、X2和X3各自独立地为无或冗余核酸；

“-”为键。

在本发明的第四方面，提供了第三方面所述的核酸序列文库的用途，用于制备第一方面所述的多聚体复合物或含所述的多聚体复合物的药物组合物。

在本发明的第五方面，提供了一种确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的方法，包括步骤：

(a)设置退火算法参数：

设置退火初始温度、退火终止温度和退火温度衰减系数ΔT；

设置优化约束参数：

①核酸单链的数量n，较佳地为3-6的正整数；

②配对序列长度L，较佳地L为12-16碱基；

③配对区域解离温度阈值T_m；

④特异性配对区域序列自由能阈值

⑤非特异性配对自由能阈值

⑥连接元X2，较佳地为为A、AA和AAA，

⑦二级结构(hairpin)解离温度阈值T_m-H；

⑧配对序列中CG比例P_CG，较佳地，P_CG的范围为[0.4，0.6)，

⑨任选地，对于n＝4时，使用对称序列，根据以上参数初始化序列集合S＝{S₁，S₂，...，S_n}；

(b)计算前一步骤所述集合S的目标函数值E₀，即计算序列之间与序列自身的非特异性配对自由能之和，同时得到非特异性配对自由能矩阵C_n×n，搜索其上三角矩阵中的最小值所对应的S_i和S_j(1≤i≤n，1≤j≤n)，根据S_i和S_j非特异性配对自由能随机选择S_i或S_j进行更新操作，于是得到一条新的核酸序列，进而得到更新的序列集合S’；

(c)判断前一步骤所述集合S’中的序列是否满足步骤(a)中所设置的优化约束参数条件，验证以下参数，包括特异性配对区域解离温度T_m，特异性配对区域序列自由能二级结构解离温度T_m-H和CG比例P_CG，如若以上参数满足约束条件则执行步骤(d)，否则重复执行步骤(c)，如果在某一退火温度下，连续执行15次步骤(b)都未得到满足条件的S’则，为防止死循环，集合S成为集合S’，执行下一步；

(d)计算前一步骤所述集合S’的目标函数值E₁，比较E₀与E₁，若E₁≥E₀，表明非特异性配对自由能得到优化，序列集合S’成为序列集合S，若E₁＜E₀，，表明非特异性配对自由能未得到优化，此时需要根据Metropolis准则，判断是否接受S’集合成为S；和

(e)退火温度根据步骤(a)设置的衰减系数ΔT进行衰减，对前一步骤所述的S重复执行步骤(b)、(c)和(d)，即基于蒙特卡洛的退火算法，直至退火温度达到退火终止温度，前一步骤所述的S＝{S₁，S₂，...，S_n}成为用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列。

在另一优选例中，在步骤(a)设置退火算法参数中，包括：

例如，设置退火初始温度T_o＝50℃±2℃，退火终止温度T_f＝0.12℃±0.02℃，退火温度衰减系数ΔT视情况而定，一般为0.98±0.01；

设置优化约束参数：

①核酸单链的数量n为3-6的正整数，

②配对序列长度L，视情况而定(较佳地，L为12-16碱基)，

③配对区域解离温度阈值T_m，根据配对序列长度而定(如，L＝14碱基时，T_m＞50℃；L＝16碱基时，T_m＞52℃)，

④特异性配对区域序列自由能阈值根据配对序列长度而定(较佳地，L＝14碱基时，kcal/mol；L＝16碱基时，kcal/mol)，

⑤非特异性配对自由能阈值根据序列长度而定(较佳地， kcal/mol)，

⑥连接元X2，视情况而定(可以为A、AA和AAA等)，

⑦二级结构(hairpin)解离温度阈值T_m-H，视情况而定(较佳地，T_m-H＜40℃±2℃)，

⑧配对序列中CG比例P_CG，的范围为[0.4，0.6)，

⑨特殊地，对于n＝4时，可使用对称序列，根据以上参数初始化序列集合S＝{S₁，S₂，...，S_n}。

在另一优选例中，所述的各个单链核酸序列W具有式1所示的结构：

X1-R1-X2-R2-X3 (1)

其中，

R1为碱基互补配对区域1；

R2为碱基互补配对区域2；

X1、X2和X3各自独立地为无或冗余核酸；

“-”为键。

在另一优选例中，在步骤(d)中，所述的优化集合是满足以下条件的集合：

(C1)互配核酸骨架结构中，目标配对形成的DNA双链结构的自由能较小或最小；和

(C2)互配核酸骨架结构中，非目标配对的较大或最大化。

在另一优选例中，在步骤(d)中，所述的优势集合还满足以下条件：

(C3)R1和R2区域的配对解离温度T_m＞50℃(L＝14碱基时)。

在另一优选例中，在步骤(c)中，通过最近邻的方法计算DNA寡聚体(即互配核酸骨架结构)的自由能

在另一优选例中，在步骤(c)中，将DNA寡聚体(即互配核酸骨架结构)分解为10种不同的最近邻的成对相互作用，这些成对的相互作用是：AA/TT；AT/TA；TA/AT；CA/GT；GT/CA；CT/GA；GA/CT；CG/GC；GC/CG；和GG/CC；并基于这些成对的相互作用的焓(enthalpy，ΔH°)和熵(entropy，ΔS°)计算得到相应的各自的ΔG°值；然后将互配核酸骨架结构所包括的成对的相互作用的自由能合并(或求和)，获得互配核酸骨架结构的自由能。

在另一优选例中，所述方法包括重复步骤(b)、(c)和(d)多次(即进行n1次迭代)，从而在迭代过程中获得全局最优解。

在另一优选例中，在所述迭代过程中，根据Metropolis准则有限度地接受较差的解且接受较差解的概率慢慢趋向于0，从而使得算法终止时尽可能找到全局最优解。

在另一优选例中，使用以下优化目标函数进行模拟退火算法的迭代，从而优化非目标配对区域的自由能：

ΔG°(S_i，S_j)为序列S_i和序列S_j非目标配对自由能，为所有序列之间非目标配对自由能之和，其值为负；其中，此负值越大越有利于减少非目标配对。

在本发明的第六方面，提供了一种用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列集合，所述的单链核酸序列集合是用第五方面所述的方法所确定的。

在另一优选例中，所述的集合选自下组：

(S1)用于形成基于互配核酸骨架的三聚体复合物的单链核酸序列：

表9-1

(S2)用于形成基于互配核酸骨架的四聚体复合物的单链核酸序列：

表9-2

(S3)用于形成基于互配核酸骨架的五聚体复合物的单链核酸序列：

表9-3

在本发明的第七方面，提供了一种确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的装置，所述装置包括：

(M1)输入模块，所述输入模块用于输入退火算法参数、优化约束参数和任选的待优化的核酸序列；

其中，所述的设置退火算法参数包括：退火初始温度、退火终止温度和退火温度衰减系数ΔT；

所述的优化约束参数包括：

①核酸单链的数量n，较佳地为3-6的正整数；

②配对序列长度L，较佳地L为12-16碱基；

③配对区域解离温度阈值T_m；

④特异性配对区域序列自由能阈值

⑤非特异性配对自由能阈值

⑥连接元X2，较佳地为为A、AA和AAA，

⑦二级结构(hairpin)解离温度阈值T_m-H；

⑧配对序列中CG比例P_CG，较佳地，P_CG的范围为[0.4，0.6)，

(M2)优化运算模块，所述优化运算模块被配置为执行以下子步骤，从而获得经优化的单链核酸序列或其集合：

(z1)计算初始集合S的目标函数值E₀，即计算序列之间与序列自身的非特异性配对自由能之和，同时得到非特异性配对自由能矩阵C_n×n，搜索其上三角矩阵中的最小值所对应的S_i和S_j(1≤i≤n，1≤j≤n)，根据S_i和S_j非特异性配对自由能随机选择S_i或S_j进行更新操作，于是得到一条新的核酸序列，进而得到更新的序列集合S’；

(z2)判断前一步骤所述集合S’中的序列是否满足所设置的优化约束参数条件，验证以下参数，包括特异性配对区域解离温度T_m，特异性配对区域序列自由能二级结构解离温度T_m-H和CG比例P_CG，如若以上参数满足约束条件则执行步骤(z3)，否则重复执行步骤(z2)，如果在某一退火温度下，连续执行15次步骤都未得到满足条件的S’则，为防止死循环，集合S成为集合S’，执行下一步；

(z3)计算前一步骤所述集合S’的目标函数值E₁，比较E₀与E₁，若E₁≥E₀，表明非特异性配对自由能得到优化，序列集合S’成为序列集合S，若E₁＜E₀，，表明非特异性配对自由能未得到优化，此时需要根据Metropolis准则，判断是否接受S’集合成为S；和

(z4)退火温度根据设置的衰减系数ΔT进行衰减，对前一步骤所述的S重复执行步骤(z1)、(z2)和(z3)，即基于蒙特卡洛的退火算法，直至退火温度达到退火终止温度，前一步骤所述的S＝{S₁，S₂，...，S_n}成为用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列；和

(M3)输出模块，所述输出模块用于输出经优化的单链核酸序列或其集合。

在另一优选例中，所述的优化约束参数还包括：对于四聚体(n＝4)，使用对称序列，根据以上参数初始化序列集合S＝{S₁，S₂，...，S_n}；

应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

图1显示了多聚体示意图。

图2显示了本专利涉及的退火算法流程图。

图3显示了三聚体序列特异性配对示意图。

图4显示了三聚体优化序列核酸骨架组装跑胶图。

图5显示了四聚体优化后序列特异性配对示意图。

图6显示了四聚体优化序列间非特异性配对区域自由能之和统计图。

图7显示了四聚体优化序列核酸骨架组装跑胶图。

图8显示了四聚体转化五聚体示意图。

图9显示了五聚体转化方案1优化后序列非配对区域自由能之和统计图。

图10显示了五聚体转化方案1优化后序列核酸骨架组装跑胶示意图。

图11显示了五聚体方案2优化后序列特异性配对示意图。

图12显示了五聚体转化方案2优化后序列非配对区域自由能之和统计图。

图13显示了五聚体转化方案2优化后序列核酸骨架组装跑胶示意图。

图14显示了G-CSF与L-DNA的偶联。

图15显示了(L-DNA)-G-CSF偶联物纯化效果图。

图16显示了一价、二价和三价G-CSF复合物组装效果图。

图17显示了L-DNA四聚体框架对G-CSF体外活性的影响。

图18显示了L-DNA四聚体组装的二价和三价G-CSF的体外活性评价。

具体实施方式

本发明人经过广泛而深入的研究，首次开发了一种多价蛋白药物及其文库、以及制备方法和应用。采用本发明药物文库、制备方法可根据需要，快速、高效、低成本、高得率地将短效蛋白药物形成多价复合物提高药物半衰期，或将单体抗原形成高价抗原提高其免疫原性(immunogenicity)。在此基础上完成本发明。

具体地，本发明提供一种多价蛋白药物，它包括n蛋白药物单元，其中，每个药物单元包括同一种的药物元件部分以及与所述药物元件部分相连的不同的核酸元件部分；n为≥2的正整数；n不同的核酸元件部分通过核酸碱基互补方式形成n聚体，从而构成所述的多价蛋白药物；本发明的多价蛋白药物仅通过快速组装(如1分钟)形成稳定的核酸碱基互补的配对结构(而非复杂的肽键或其它化学修饰等)。实验表明，本发明药物可以通过高价化增加分子量，从而延长在动物体内的半衰期。

另外，基于同样的实施方式，所述的药物元件也可以是用于疫苗研发的抗原；不同的是每个抗原单元包括同一种或不同的抗原元件部分以及与所述抗原元件部分相连的不同的核酸元件部分；n不同的核酸元件部分通过核酸碱基互补方式形成n聚体，从而构成所述的多价抗原。

最后，本发明提供了高度优化的核酸序列文库，包括高效，精准组装成2-5聚体的核酸序列组，用于快速，精准的将以上所述的药物或抗原单元自组装成多价大分子复合物。

术语

除非另外定义，否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。如本文所用，在提到具体列举的数值中使用时，术语“约”意指该值可以从列举的值变动不多于1％。例如，如本文所用，表述“约100”包括99和101和之间的全部值(例如，99.1、99.2、99.3、99.4等)。

药物D

本发明中，所述药物元件部分为蛋白类药物、多肽类药物。

典型地，所述蛋白类药物包括但不限于细胞因子、激素(例如胰岛素、生长激素等)、抗体药物、多肽。

在本发明的一个优选的实施例中，所述蛋白类药物为治疗白细胞减少症的G-CSF。

抗原文库A

本发明提供一种抗原文库，所述抗原文库包括N抗原单元；

其中，所述的抗原单元包括抗原元件部分以及与所述抗原元件部分相连的核酸元件部分；不同的核酸元件部分通过核酸碱基互补方式形成n聚体，从而构成多价抗原；

其中，所述抗原元件部分为蛋白类抗原、多肽类抗原；

典型地，所述的蛋白类、多肽类抗原包括但不限于病毒，细菌蛋白，其结构区域，和片段；

本发明中，所述的抗原元件部分选自于文库里M种不同抗原蛋白，M≤N；M种不同抗原蛋白含有某种病毒里不同的蛋白或不同病毒株的相同蛋白的突变体；

在本发明的一个优选的实施例中，所述蛋白类抗原来自新型冠状病毒SARS-CoV-2；具体的，是病毒刺突蛋白的受体结合结构域(RBD)形成的高价抗原。

左旋核酸

左旋核酸是指相对自然界存在的右旋核酸(D-核酸)而言，成镜像存在，可分为左旋DNA(L-DNA)和左旋RNA(L-RNA)。左旋(手性中心)主要存在于核酸的脱氧核糖或核糖部分，呈镜像翻转。因此，左旋核酸无法被血浆中无处不在的核酸酶(如核酸外切酶、核酸内切酶)所降解。

制备方法

1.L-核酸链框架的设计与制备

根据本发明，L-核酸链框架由两条及以上的L-核酸单链通过碱基配对形成。每条L-核酸单链的5'或3'端均活化成可供后续修饰的基团(如NH2等)，然后用连接物(如SMCC、SBAP等)的一端与L-核酸单链上的活化基团偶联。带连接物的L-核酸可组装成所需的L-核酸链框架。在另一优选例中，L-核酸单链的5'或3'端的活化官能团(如aldehyde，maleimide等)在核酸合成中已经包括在内。在确定带连接物的L-核酸可以成功自组装成框架后，则可将带连接物的L-核酸单链分别偶联抗体进行后续的组装。本发明L-核酸框架基本上可通过如下步骤制备。

1.1设计可快速自组装的L-核酸单链

确定所需的多价数目n(如三聚体，四聚体)；根据多价数目n确定所需的L-核酸单链数目n；设计相应数目的L-核酸单链序列，通过优化碱基配对调节目的核酸框架稳定性，减少核酸链间非特异性配对的可能性。核酸序列设计细节在发明内容和实施例里有具体描述。

1.2L-DNA或L-RNA的活化

L-核酸的活化包括其5'端(X1)或3'端(X3)的活性基团修饰和后续的连接物偶联。活性基团修饰可由核酸合成公司订制完成；连接物一般拥有双功能基团，即一端可偶联核酸的活性基团，另一端可与蛋白上的特异性位点(如NH3，SH)连接。

根据本发明一个优选的实施方式，组成框架的所有L-核酸在5'端添加醛修饰，至此完成L-核酸的活化，可后续偶联蛋白的N端α-amine。

2.蛋白-L-核酸复合物的制备方法

首先L-核酸的5'或3'端用醛修饰，然后在低pH(5-6)的条件下，通过还原性的胺反应(reductive amination reaction)，将L-核酸的醛基特异性地与蛋白N端NH₃连接。

算法和经算法优化的核酸序列

本发明还提供了确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的方法和装置。优选地，所述方法包括了本发明的优选算法。

典型地，本发明的用计算机算法优化的核酸序列文库，可包括：(a)可通过碱基互补配对自组装形成三聚体的核酸序列；(b)可通过碱基互补配对自组装形成四聚体的核酸序列；和(c)可通过碱基互补配对自组装形成五聚体的核酸序列。

代表性的的核酸序列所形成的复合物是例如如图1所示的三聚体，四聚体，五聚体分子。

优选地，本发明的所述的核酸序列W具有式1所示的结构：

W＝X1–R1–X2–R2–X3 (1)

其中，

R1为碱基互补配对区域1；

R2为碱基互补配对区域2；

X1、X2和X3为各自独立地为无或冗余核酸；

R1和R2的长度为14-16碱基；

X1，X3的长度为0-5碱基；

X2的长度为0-3碱基，序列为A，AA，AGA或AAA；

其中，核酸序列的R1与不同核酸序列的R2形成目标配对，而核酸序列的R2与另一条核酸序列的R1形成目标配对。

在本发明中，所述核酸序列的任何区域的自配都属于非目标配对，是在设计中需要避免的。

优选地，本发明的所述的核酸序列可通过退火算法(Simulated Annealing，SA)的计算机算法进行设计或优化。

所述的计算机算法将目标配对形成的DNA双链结构的自由能(free energy，ΔG°)最小化，同时将非目标配对的ΔG°最大化；

具体地，DNA双链结构的稳定性取决于序列中各个最近邻的碱基对；任何沃森-克里克DNA双链结构中可能都存在10种不同的最近邻相互作用，这些成对的相互作用是：AA/TT；AT/TA；TA/AT；CA/GT；GT/CA；CT/GA；GA/CT；CG/GC；GC/CG；GG/CC；

更具体地，以上所述的10种碱基对的ΔG°值，在任意温度下，可以通过焓(enthalpy，ΔH°)和熵(entropy，ΔS°)计算得到；表1统计了10种序列的焓、熵和自由能数据。

表1. 10种序列的热力学数据

注：ΔH°、ΔS°和都是在1M Nacl，25℃，pH为7的条件下测得。从IDT网站(https：//sg.idtdna.com/calc/analyzer)测得。

用表1的热力学值，DNA寡聚体的焓值ΔH°和自由能值ΔG°都可以通过最近邻的方法进行有效得预测。以GGAATTCC/CCTTAAGG的互补配对为例，通过最近邻的方法计算，ΔG°＝-14.63kcal/mol。

所述的退火算法除了优化值，还实施了核酸序列配对解离温度(T_m)的约束，确保R1和R2区域的T_m＞50℃(L＝14碱基时)。

最近邻模型以热力学计算为基础，对DNA双链稳定性做出了精确的预测，该模型对于给定碱基序列的预测基于最近邻的碱基对。其解链温度的计算涉及到焓(enthalpy，ΔH°)和熵(entropy，ΔS°)，其计算方法如下：

其中，R是一个常数(1.987cal K^-1mol^-1)，CT是链浓度给定为0.1μM，ΔS°[Na⁺]是在给定钠离子浓度下的DNA双链的熵值，ΔH°是给定条件下的焓值。

模拟退火是一种通用概率算法，它是一种基于蒙特卡洛思想设计的近似求解最优化问题的方法，旨在一定时间内寻找在一个很大搜寻空间中的近似最优解。模拟退火算法的思想源于物理中固体物质退火过程：先对固体充分加温，再让其缓慢冷却，加温时，固体内部粒子自由运动内能增大，以后随着温度的逐渐下降粒子趋于有序，在每个温度都达到平衡态，若在凝结点附近温度下降速率足够慢则达到基态，内能减为最小。根据Metropolis准则，粒子在温度T时趋于平衡的概率为exp(-ΔE/(KT))，其中E为温度T时的内能，ΔE为其改变量，K为波尔兹曼(Boltzmann)常数。对于组合优化问题也存在类似过程，将固体微观状态i模拟为一个解X，目标函数等价于状态i时的内能E_i，并以控制参数T模拟固体温度。对于T的每一个取值重复进行“产生新解→计算目标函数差→判断是否接受→接受/舍弃”的迭代过程，并逐步衰减T值，在迭代过程中根据Metropolis准则有限度地接受较差的解，且接受较差解的概率慢慢趋向于0，使得算法终止时尽可能找到全局最优解。

在本发明中，将多聚体核酸单链之间非目标配对区域的自由能模拟为内能，在保证核酸单链之间目标配对区域的自由能与解离温度的情况下，经过模拟退火算法的迭代，优化非目标配对区域的自由能，最后经过优化的单链更有利于多聚体的组装。使用的优化目标函数如下：

ΔG°(S_i，S_j)为序列S_i和序列S_j非目标配对自由能，为所有序列之间非目标配对自由能之和，其值为负，此值越大越有利于减少非目标配对。因此，依据退化算法求解能量最小化的思路构建目标函数，在ΔG°(S_i，S_j)之前加入负号，将其转化为正数，此时的值越小越有利于减少非目标配对。

一种代表性的本发明的算法的流程图如图2所示。

在本发明中，模拟退火算法引入了随机因素，在每一次迭代更新的过程中，会以一定的概率来接受一个比当前要差的解，因此有可能跳出局部最优解，达到全局最优解。

多价大分子复合物

本发明还提供了用以上算法设计的核酸多聚体介导蛋白药物形成多价大分子复合物，所述的复合物具有提高的药物半衰期和活性。

优选地，所述的核酸序列是核酸序列文库里特异性组装成n聚体的核酸序列组；

优选地，在本发明中，所述的蛋白药物是需要形成多价来提高半衰期或活性的蛋白药物。

典型地，所述的核酸序列组的每条核酸链分别与所述的蛋白药物连接，形成蛋白药物-核酸链单元，具有式2所示的结构：

D–[L–W_i]，i＝1至n (2)

其中，

D为蛋白药物元件部分；

每个W_i独立地为核酸序列；所述核酸序列选自下组：左旋核酸、肽核酸、锁核酸、硫代修饰核酸、2'-氟修饰核酸、5-羟甲基胞嘧啶核酸、或其组合；所述核酸序列具有式1所示的结构，选自以上所述的能形成n聚体的核酸序列组；

L为连接物；所述连接物部分在W_i的合成或制备中已经包括在内，连接在W_i的X1或X3上(见式1)；

“-”为共价键；

在另一优选例中，所述的药物元件部分选自下组：需要增加分子量而提高半衰期的蛋白药物和多肽药物，需要形成多价而提高活性的蛋白药物和多肽药物；

在另一优选例中，L靠近D端具有aldehyde，NHS ester或类似的官能团，用于连接D上的N端的α-amine或lysineε-amine；

在另一优选例中，L靠近D端具有maleimide官能团或haloacetyl(如bromoacetyl,iodoacetyl等)官能团，用于连接D上的free thiol(-SH)官能团；

在另一优选例中，D选自下组：天然蛋白，重组蛋白，化学修饰过的蛋白，合成的多肽；

在另一优选例中，D可以有定点修饰或定点加入非天然氨基酸用于连接式1的L-W_i；

所述的蛋白药物分别连接不同的可以组装成n聚体的L–W_i，形成蛋白药物自组装单元，D–[L–W₁]，D–[L–W₂]，…，D–[L–W_n]；

蛋白药物自组装单元，D–[L–W₁]，D–[L–W₂]，…，D–[L–W_n]通过等摩尔在溶液中混合，组装成蛋白药物多价分子复合物。

本发明还提供了用以上算法设计的核酸多聚体介导一种或多种抗原形成多价大分子复合物，提高疫苗在体内诱导中和性抗体产生的效果；

其中，所述的核酸序列是核酸序列文库里特异性组装成n聚体的核酸序列组；

其中，所述的抗原是一种抗原或抗原文库；所述的抗原文库包括M种不同抗原蛋白，1≤M≤n；

所述的核酸序列组的每条核酸链分别与所述的抗原文库里的抗原连接，形成抗原–核酸链单元，具有式3所示的结构：

A_k–[L–W_i]，i＝1-n，k＝1-M (3)

其中，

A_k为所述抗原文库里抗原k；一种A_k分别对应一种或多种L–W_i(如：A₁–[L–W₁]，A₁–[L–W₂]，A₂–[L–W₃]，A₃–[L–W₄])；

式3的其它方面和以上的式3一样；

所述的抗原蛋白分别连接不同的可以组装成n聚体的L–W_i，形成抗原自组装单元，如A₁–[L–W₁]，A₂–[L–W₂]，…，A₃–[L–W_N]；

抗原自组装单元通过等摩尔在溶液中混合，组装成多价抗原复合物。

本发明的主要优点在于：

(1)本发明可以将现成的短效蛋白药物，在无需重新构建融合蛋白或复杂化学修饰和交联的条件下，完成蛋白药物的多价化，提高其半衰期和活性；L-核酸的aldehyde修饰可以特异性的连接蛋白的N端amine，形成可以自组装成寡聚体的蛋白药物单元；

(2)本发明蛋白药物单元(蛋白-核酸连接体)在一分钟内即可利用左旋核酸链介导完成蛋白药物多价化；

(3)在疫苗开发方面，本发明可以将单体蛋白抗原形成高价，提高其免疫原性；

(4)在疫苗开发方面，本发明也可以将不同病毒或细菌毒株的抗原突变型和亚型组装成多元性高价抗原，以诱更广泛性的中和抗体。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件，例如Sambrook等人，分子克隆：实验室手册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件，或按照制造厂商所建议的条件。除非另外说明，否则百分比和份数是重量百分比和重量份数。

实施例1：三聚体核酸骨架装配设计、合成及验证

设计三条可按照图1(A)形状配对的核酸。具体地，R₁核酸单链与R₆核酸单链进行特异性互补配对，而不与其他核酸单链配对，同样地，R₃、R₅分别与R₂、R₄进行特异性互补配对，而不与其他核酸单链配对，且特异性互补配对的自由能要远小于非特异性配对自由能特异性互补配对的自由能小于-29kcal/mol，而非特异性配对自由能则均大于-7kcal/mol，如此，三聚体的形式在反应体系中最为稳定。三聚体优化的具体实施步骤如示意图2所描述；其退火参数是：退火初始温度T_o＝50℃，退火终止温度T_f＝0.12℃，退火温度衰减系数ΔT＝0.98(退火初始温度每一次衰减为当前的0.98)；优化参数约束为：配对序列长度L＝16碱基，解离温度阈值T_m＞54℃，配对序列自由能阈值：kcal/mol，非特异性配对自由能阈值：kcal/mol。优化的具体实施步骤如下：

序列初始化：根据参数初始化配对序列R＝{R₁，R₃，R₅}，依据碱基互补配对得到R₆、R₂和R₄，六条序列经过如图1(A)所示的拼接，最终得到初始化序列集合S＝{S₁，S₂，S₃}。

新解产生：新解S’都是对序列集合S更新得到的。首先计算||-ΔG°(S_i，S_j)||_∞，这是为了找出集合S非特异性配对中对目标配对影响最大的两条序列S_i和S_j，然后根据ΔG°(S_i，S_j)非目标配对区域随机选择S_i或S_j进行更新，于是得到一条新的核酸序列，检验这条核酸序列的配对区域解离温度(T_m)是否大于54℃，同时配对区域自由能是否小于-29kcal/mol，若没有达到解离温度和配对区域自由能的约束要求则重复更新，若达到解离温度和配对区域自由能的约束要求，根据碱基互补配对原则对S进行更新，最终得到新的序列集合S’。若经过十五次更新，得到的新核酸序列始终未达到解离温度和配对区域自由能的约束要求，为了防止死循环，集合S成为新解S’。

优化判断：根据公式2分别计算集合S和S’的目标函数值E_i和E_i+1，若E_i+1-E_i≥0，说明更新对非目标配对自由能进行了优化则S←S’，新解S’成为S。若E_i+1-E_i＜0，说明更新得到了恶化解，根据Metropolis准则，计算概率p＝exp(-ΔE/T_o)，同时随机生成r，r∈[0，1)，如果p＞r，则接受这个恶化解，否则拒绝恶化解。最后退火初始温度衰减为当前的0.98，产生下一个新解，直至衰减到退火终止温度，得到优化后的序列集合S。

表21中优化后序列是经过以上算法优化得到，每条序列5’端A目的是活性基团修饰和后续的连接物偶联。在非目标配对自由能矩阵表与目标配对区域参数指标表中，统计的是一些主要参数值。三聚体优化后序列特异性配对示意图详见图3，从对应的核酸骨架跑胶图(图4)可看出，Lane9为人工设计的三聚体，其条带不清晰且拖尾，Lane10为优化后序列S₁、S₂和S₃形成的主条带，表明形成了三聚体，且表现出极高的稳定性。

表2_1.三聚体初始化序列与优化后序列

序列编号	初始化序列	SEQ ID No：
			S₁	AGTGATCCGAAGTCGACAAACGTATTAGCGCTCGAT	241
S₂	AATCGAGCGCTAATACGAAAGTGCAATGCGTCGATG	242
			S₃	ACATCGACGCATTGCACAAAGTCGACTTCGGATCAC	243
序列编号	优化后序列
			S₁	ACCACCGTGTATGACCTAAAAGTGACAGCACATCGC	244
S₂	AGCGATGTGCTGTCACTAAAACAGGCTCTACGAGGA	245
			S₃	ATCCTCGTAGAGCCTGTAAAAGGTCATACACGGTGG	246

表2_2.三聚体初始化序列与优化后化序列自由能矩阵

表2_3.三聚体优化后序列目标配对区域参数指标

实施例2：四聚体核酸骨架装配设计、合成及验证

设计四条可按照图1(B)形状配对的核酸。其中，核酸单链R₁、R₃、R₅和R₇分别与核酸单链R₈、R₂、R₄和R₆进行特异性互补配对，而不与其他核酸单链配对，且特异性互补配对的自由能要远小于非特异性配对自由能特异性互补配对的自由能小于-27.4kcal/mol，而非特异性配对自由能则均大于-7kcal/mol，如此，四聚体的形式在反应体系中最为稳定。四聚体优化的具体实施步骤如示意图2所描述；其退火参数是：退火初始温度T_o＝50℃，退火终止温度T_f＝0.12℃，退火温度衰减系数ΔT＝0.98(退火初始温度每一次衰减为当前的0.98)；优化参数约束为：配对序列长度L＝14碱基，解离温度阈值T_m＞52℃，配对序列自由能阈值：kcal/mol，非特异性配对自由能阈值kcal/mol。

优化的具体实施步骤如下：

序列初始化：根据参数初始化配对序列R＝{R₁，R₃，R₅，R₇}，依据碱基互补配对得到R₈、R₂、R₄和R₆，八条序列经过如图l(B)所示的拼接，最终得到初始化序列集合S＝{S₁，S₂，S₃，S₄}。在四聚体实验过程中，发现一种固定核结构可以有效提升核酸序列的组装效率，在核酸序列式1基础之上发展核酸序列W2，W2具有式4的结构：

W2＝X1-Q1-C1-X2-C2-Q2-X3 (4)

其中，C1和C2为固定核结构部分，Q1和Q2为除固定核结构之外的序列。

表3.包含固定核结构的核酸序列S₁、S₂、S₃和S₄

S₁	X1-Q1-AATCC-X2-TGAGC-Q2-X3
		S₂	X1-Q3-GCTCA-X2-CCGAA-Q4-X3
S₃	X1-Q5-TTCGG-X2-ACTAT-Q6-X3
		S₄	X1-Q7-ATAGT-X2-GGATT-Q8-X3

新解产生：同实施例1中新解产生。不同地，若使用固定核结构，则更新不包括固定核结构部分；要严格遵守参数约束，新核酸序列配对区域的解离温度(T_m)应大于52℃，同时配对区域自由能小于-27.4kcal/mol。

优化判断：同实施例1的优化判断。

表4_1优化后序列是经过以上算法优化得到，其特异性配对示意图如图5所示，四聚体优化序列在优化过程中非配对目标自由能的折线统计图如6所示，本发明寻求在加入连接元的情况下，不会对未加入连接元的优化序列自由能产生较大影响，不管是否加入连接元优化后序列的自由能矩阵之和都尽量大，因此在优化过程中统计了未加入连接元优化序列的目标函数值，只对加入连接元优化序列做最后检测，从对应的核酸骨架跑胶图(图7)可看出，Lane15为人工设计四聚体的条带，有拖尾现象，Lane16为算法优化后序列S₁、S₂、S₃和S₄形成的主条带在100bp左右，表明形成了四聚体，且表现出极高的稳定性。

以上四聚体实施步骤主要优化的是序列之间非特异性配对自由能，而序列自身折叠形成的二级结构对四聚体的组装也有较大影响。如果序列自身形成的二级结构解离温度太高，则一旦形成这种稳定的二级结构就很难打破这种状态，导致四聚体不易组装。因此，需要控制组装四聚体的四条序列对应的二级结构解离温度不能太高。对于四聚体而言，需要控制四条核酸序列的二级结构解离温度，如果使用对称结构(图1中的R₁，R₃，R₅，R₇分别与R₄，R₆，R₈，R₂保持对称)，两两序列之间会出现相似的二级结构，并且两者二级结构解离温度相差不大，此时只需控制两条核酸序列的二级结构即可达到之前的效果，因此，对称在四聚体优化中有利于对二级结构的控制。

表4_1：四聚体初始化序列与优化后序列

序列编号	初始化序列	SEQ ID No：
			S₁	AACCTGGTACAATCCAAATGAGCTACACTAGC	247
S₂	AGCTAGTGTAGCTCAAAACCGAAGTATCGATT	248
			S₃	AAATCGATACTTCGGAAAACTATAGTGAGTTG	249
S₄	ACAACTCACTATAGTAAAGGATTGTACCAGGT	250
			序列编号	优化后序列
S₁	AGGCGATCACAATCCAAATGAGCGTGTTACGG	251
			S₂	ACCGTAACACGCTCAAAACCGAAGTGCCAATT	252
S₃	AAATTGGCACTTCGGAAAACTATGCGGCTGCT	253
			S₄	AAGCAGCCGCATAGTAAAGGATTGTGATCGCC	254

表4_2：四聚体初始化序列与优化后序列自由能矩阵

表4_3：四聚体优化序列配对区域参数指标

实施例3：五聚体核酸骨架装配设计、合成及验证

四聚体的优化序列表现出非常良好的组装效果，很大程度上是因为四聚体中心部位没有形成配对，也就是固定核结构给予了四聚体充分的自由度，不会在中心区域形成复杂的复合物。因此，为在五聚体序列的优化中整合四聚体序列及固定核结构，探索、设计出两种利用实施例2四聚体序列与固定核结构的方案。

第一种转化方案：设计五条可按照图8(B)形状配对的核酸，此方案保留了实施例2中四聚体的部分序列和完整的固定核结构，并且核结构没有被打开。在原四聚体的R₁和R₈处除核结构之外打开四聚体，加入两条长度为14的核酸序列R₉和R₁₀。其中，核酸单链R₁、R₃、R₅、R₇和R₉分别与核酸单链R₁₀、R₂、R₄、R₆和R₈进行特异性互补配对，而不与其他核酸单链配对。特异性互补配对的自由能小于-27.4kcal/mol，而非特异性配对自由能则均大于-7kcal/mol，如此，五聚体的形式在反应体系中最为稳定。五聚体第一种转化方案优化的具体实施步骤如示意图2所描述；其退火参数是：退火初始温度T_o＝50℃，退火终止温度T_f＝0.12℃，退火温度衰减系数ΔT＝0.9(退火初始温度每一次衰减为当前的0.9，因使用四聚体部分序列故更新区域变少退火温度衰减更快)；优化参数约束为：配对序列长度L＝14碱基，解离温度阈值T_m＞52℃，配对序列自由能阈值：kcal/mol，非特异性配对自由能阈值kcal/mol。

此种方案中使用了完整的四聚体固定核结构，在核酸序列式4基础之上发展核酸序列W5，在核酸序列式4基础之上发展核酸序列W6，W5具有式7的结构，W6具有式8的结构：

W3＝X1-R1-X2-C1-X2-C2-Q1-X3 (5)

W4＝X1-Q1-C1-X2-C2-X2-R1-X3 (6)

此种方案包含式1、式4、式5和式6，四种结构的序列。

表5.包含部分核结构的核酸序列S₁、S₂、S₃、S₄和S₅

S₁	X1-R9-X2-R10-X3
		S₂	X1-R1-X2-AATCC-X2-TGAGC-Q1-X3
S₃	X1-Q2-GCTCA-X2-CCGAA-Q3-X3
		S₄	X1-Q4-TTCGG-X2-ACTAT-Q5-X3
S₅	X1-Q6-ATAGT-X2-GGATT-X2-R8-X3

优化的具体实施步骤如下：

根据参数初始化配对序列R＝{R₉，Rl₀}，依据碱基互补配对得到R₈和R₁，R₂、R₃、R₄、R₅、R₆和R₇来自于实施例2四聚体优化后序列的同名序列。R₉与R₁₀拼接得到S₁，R₁与R₂按式5拼接得到S₂，R₃与R₄拼接得到S₃，R₅与R₆拼接得到S₄，R₇与R₈按式6拼接得到S₅，最终得到初始化序列集合S＝{S₁，S₂，S₃，S₄，S₅}。

新解产生：随机在R₁、R₈、R₉和R₁₀中选择一条序列进行更新，于是得到一条新的核酸序列，检验这条核酸序列的解离温度是否大于52℃，同时配对区域自由能是否小于-27.4kcal/mol，若没有达到解离温度和配对区域自由能的约束要求则重复更新，若达到解离温度和配对区域自由能的约束要求，根据碱基互补配对原则对S进行更新，最终得到新的序列集合S’。若经过十五次更新，得到的新核酸序列始终未达到解离温度和配对区域自由能的约束要求，为了防止死循环，集合S成为新解S’。因为此种方案使用了完整的固定核结构及部分四聚体序列，在新解产生的过程中要保证固定核结构和保留的四聚体序列部分不变。

优化判断：同实施例1的优化判断。不同地，退火初始温度衰减为当前的0.9。

表6_1中五聚体第一种转化方案优化后序列是经过此算法优化得到，图9为在此优化过程中序列间非目标配对区域自由能值之和折线统计图(S₃与S₃，S₃与S₄，S₄与S₄之间的非目标配对区域自由能未参与统计)，图10中Lane9为优化后序列组装形成的主条带，表明形成了五聚体，且表现出极高的稳定性。

表6_1.五聚体第一种转化方案初始化序列与优化后序列

序列编号	初始化序列	SEQ ID No：
			S₁	ATCACAGAGCGCGTAAAAACGCCACTCATGGA	255
S₂	ATCCATGAGTGGCGTAAAAATCCAAATGAGCGTGTTACGG	256
			S₃	ACCGTAACACGCTCAAAACCGAAGTGCCAATT	257
S₄	AAATTGGCACTTCGGAAAACTATGCGGCTGCT	258
			S₅	AAGCAGCCGCATAGTAAAGGATTAAATACGCGCTCTGTGA	259
序列编号	优化后序列
			S₁	ATTCAGGCGACTCCTAAAAGCACGACGATGGT	260
S₂	AACCATCGTCGTGCTAAAAATCCAAATGAGCGTGTTACGG	261
			S₃	ACCGTAACACGCTCAAAACCGAAGTGCCAATT	262
S₄	AAATTGGCACTTCGGAAAACTATGCGGCTGCT	263
			S₅	AAGCAGCCGCATAGTAAAGGATTAAAAGGAGTCGCCTGAA	264

表6_2.五聚体第一种转化方案初始化序列与优化后序列自由能矩阵

表6_3.五聚体优化序列1配对区域参数指标

第二种转化方案：设计五条可按照图8(C)形状配对的核酸，此种方案只保留了四聚体的固定核结构序列，为了适应五聚体，核结构在R₁和R₂处打开，其他部分需要随机产生然后进行五聚体优化。其中，核酸单链R₁₀、R₂、R₄、R₆和R₈分别与核酸单链R₁、R₃、R₅、R₇和R₉进行特异性互补配对，而不与其他核酸单链配对。特异性互补配对的自由能小于-27.4kcal/mol，而非特异性配对自由能则均大于-7.2kcal/mol，如此，五聚体的形式在反应体系中最为稳定。五聚体第二种转化方案优化的具体实施步骤如示意图2所描述；其退火参数是：退火初始温度T_o＝50℃，退火终止温度T_f＝0.12℃，退火温度衰减系数ΔT＝0.98(退火初始温度每一次衰减为当前的0.98)；优化参数约束为：配对序列长度L＝14碱基，解离温度阈值T_m＞52℃，配对序列自由能阈值：kcal/mol，非特异性配对自由能阈值kcal/mol。

表7：包含部分核结构的核酸序列S₁、S₂、S₃、S₄和S₅

S₁	X1-Q1-AATCC-X2-R10-X3
		S₂	X1-R2-X2-TGAGC-Q2-X3
S₃	X1-Q3-GCTCA-X2-CCGAA-Q4-X3
		S₄	X1-Q5-TTCGG-X2-ACTAT-Q6-X3
S₅	X1-Q7-ATAGT-X2-GGATT-Q8-X3

优化的具体实施步骤如下：

序列初始化：根据优化参数约束初始化配对序列R₉和除核结构之外长度为9的序列集合Q＝{Q₁，Q₃，Q₅，Q₇}，依据碱基互补配对的原则得到R₈、Q₂、Q₄、Q₆和Q₈，按表7拼接，最终得到初始化序列集合S＝{S₁，S₂，S₃，S₄，S₅}。

新解产生：同实施例1的新解产生。不同地，因为此种方案使用了四聚体的固定核结构，在新解产生的过程中要保证固定核结构部分不变。同时严格遵守参数约束，更新核酸序列配对区域的解离温度大于52℃，同时配对区域自由能小于-27.4kcal/mol。

优化判断：同实施例1的优化判断。

表81中五聚体第二种转化方案的优化后序列是经过此算法优化得到，其特异性配对示意图如图11所示，图12为在此优化过程中序列间非目标配对区域自由能值之和折线统计图，图13中Lane35为序列S₁、S₂、S₃、S₄和S₅形成的主条带，虽然五聚体有些拖尾但组装效果良好。

表8_1.五聚体第二种转化方案初始化序列与优化后序列

序列编号	初始化序列	SEQ ID No：
			S₁	ATGAGTGCGCAATCCAAATCGCCAGTCATGCA	265
S₂	ATGCATGACTGGCGAAAATGAGCGCTCGTTGA	266
			S₃	ATCAACGAGCGCTCAAAACCGAAGTGCCAACT	267
S₄	AAGTTGGCACTTCGGAAAACTATCGCGCGACT	268
			S₅	AAGTCGCGCGATAGTAAAGGATTGCGCACTCA	269
序列编号	优化后序列
			S₁	ATCACGCAGCAATCCAAATCGCCATCACAACG	270
S₂	ACGTTGTGATGGCGAAAATGAGCACGAGCCTT	271
			S₃	AAAGGCTCGTGCTCAAAACCGAAGGTTGCACT	272
S₄	AAGTGCAACCTTCGGAAAACTATGCCGCTCCA	273
			S₅	ATGGAGCGGCATAGTAAAGGATTGCTGCGTGA	274

表8_2.五聚体第二种转化方案初始化序列与优化后序列自由能矩阵

表8_3.五聚体优化序列2配对区域参数指标

此外，重复实施例1、2和3，从而获得了表9-1、表9-2和表9-3(见上文)所示的用于形成基于互配核酸骨架的三、四和五聚体复合物的单链核酸序列及其集合。

实施例4：G-CSF与L-DNA的偶联

G-CSF与L-DNA的偶联采用还原胺化反应的方式将5’端带有醛基修饰的L-DNA有选择性地偶联在G-CSF的N末端。用稀释法或凝胶过滤层析等方法将G-CSF的缓冲液置换为醋酸盐缓冲液(20mM acetate,150mM NaCl,pH 5.0)并将样品浓缩至30mg/ml。取100OD(1OD＝33μg)5’端带有醛基修饰的L-DNA干粉溶解于60μL醋酸盐缓冲液。取30mg氰基硼氢化钠,用醋酸盐缓冲液溶解，将浓度调整为800mM。分别取50μL，60μL,20μL上述浓度的G-CSF，L-DNA，氰基硼氢化钠并混合均匀,避光室温旋转孵育反应48小时。反应前后的样品用聚丙烯酰胺凝胶电泳验证偶联反应效果，(L-DNA)-(G-CSF)偶联物相比未偶联的G-CSF在电泳胶图上发生了明显偏移，偶联效率可达70％～80％(图14)。

实施例5：(L-DNA)-(G-CSF)偶联物的纯化

(L-DNA)-(G-CSF)偶联物的纯化分为2个步骤。第一步，利用Hitrap Q HP除去未反应的G-CSF以及连上2条L-DNA的(L-DNA)₂-(G-CSF)偶联物(图15a)。将实施例5获得的反应混合液用Q柱的上样缓冲液稀释10倍后上样，用上样缓冲液洗脱10倍柱体积以除去未反应的G-CSF，之后采用0-100％线性梯度洗脱的方式洗脱50倍柱体积以分离(L-DNA)-(G-CSF)偶联物和(L-DNA)₂-(G-CSF)偶联物，运用聚丙烯酰胺凝胶电泳鉴定各A280吸收峰所属组分类型(图15b)，收集(L-DNA)-(G-CSF)偶联物(含未反应的核酸)。第二步利用HiscreenCapto MMC除去未反应的核酸，最终分离获得纯度较高的(L-DNA)-(G-CSF)偶联物(图15c)。将步骤一收集的样品直接上样至Hiscreen Capto MMC柱子，用上样缓冲液洗脱10倍柱体积以除去未反应的核酸，之后用100％洗脱缓冲液洗脱(L-DNA)-(G-CSF)偶联物。

纯化条件如下表：

经过两步纯化法获得的(L-DNA)-(G-CSF)偶联物样品用2％的琼脂糖凝胶电泳鉴定样品纯度(图15d)，胶图显示样品中仅有一条核酸条带且(L-DNA)-(G-CSF)偶联物相比未偶联的L-DNA在电泳胶图上发生了明显偏移，表明未反应的核酸以及(L-DNA)₂-(G-CSF)偶联物已清除干净。

实施例6：一价、二价和三价G-CSF复合物的组装

分别用Nanodrop测定S1-G-CSF、S3-G-CSF、S4-G-CSF、S2、S3、S4的核酸浓度。按照一、二价和三价蛋白复合物的结构设计取适量上述组分，按照1:1:1:1摩尔比例混合，混合后各组装单元根据碱基互补配对原则自动完成组装。组装前后样品用聚丙烯酰胺凝胶电泳鉴定组装效果和样品纯度(图16)。

实施例7：G-CSF体外活性评价

将M-NFS-60细胞(小鼠白血病淋巴细胞/G-CSF依赖性细胞)接种于复苏培养液(RPMI1640+10％FBS+15ng/ml G-CSF+1X青霉素-链霉素)中，37℃，5％CO₂条件下进行细胞复苏，待细胞密度达80％-90％进行传代，传代两到三次后，接种于96孔板中进行细胞铺板。细胞铺板实验采用corning 3599#96孔板，细胞铺板密度为6000个/孔。对不同的样品(GCSF，NAPPA₄-GCSF，NAPPA₄-GCSF₂，NAPPA₄-GCSF₃)进行梯度稀释，工作浓度为(0.001,0.01,0.1,1 10,100ng/ml)，终体积为100μL，使用PBS作为对照。在恒温培养箱中培养48小时后，向每孔加入10μL CCK8溶液，将培养板在培养箱内孵育1-4小时，用酶标仪测定在450nm处的吸光度，计算不同样品的细胞增殖率。

细胞增殖率(％)＝[A(加药)-A(0加药)]/[A(0加药)-A(空白)]×100

A(加药)：具有细胞、CCK溶液和药物溶液的孔的吸光度

A(空白)：具有培养基和CCK8溶液而没有细胞的孔的吸光度

A(0加药)：具有细胞、CCK8溶液而没有药物溶液的孔的吸光度

用以上的活性测试方法对一个G-CSF连接L-DNA四聚体框架进行了活性评价，发现L-DNA四聚体框架对G-CSF的活性没有影响(图17)。用同样的活性测试方法发现用L-DNA四聚体组装的二价和三价G-CSF对G-CSF的活性也没有负面影响(图18)。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 安升（上海）医药科技有限公司

<120> 核酸多聚化介导的多价蛋白药物和疫苗的构建方法及应用

<130> P2020-0999-1CNCN

<140> CN2020113403773

<141> 2020-11-25

<160> 274

<170> PatentIn version 3.5

<210> 1

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

acacctggtt gttggataaa tcgttgaagg ctagga 36

<210> 2

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

atcctagcct tcaacgaaaa aactagagtc cgccga 36

<210> 3

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

atcggcggac tctagttaaa atccaacaac caggtg 36

<210> 4

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atgcgttgag ttccagtaaa ggcaacatca ccacat 36

<210> 5

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

aatgtggtga tgttgccaaa tctgaatcct cgtgct 36

<210> 6

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

aagcacgagg attcagaaaa actggaactc aacgca 36

<210> 7

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

attccaatcg tcctgtgaaa agttccgctc tgagtt 36

<210> 8

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

aaactcagag cggaactaaa ctggcagatg gatgaa 36

<210> 9

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

attcatccat ctgccagaaa cacaggacga ttggaa 36

<210> 10

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

acgaggcaag ttctgtgaaa atgactacca ggtccg 36

<210> 11

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

acggacctgg tagtcataaa atccactgac gctgaa 36

<210> 12

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

attcagcgtc agtggataaa cacagaactt gcctcg 36

<210> 13

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

atagttcgtt gctcggaaaa ggcattgaga ggacct 36

<210> 14

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

aaggtcctct caatgccaaa atggtgatgt cgcttg 36

<210> 15

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

acaagcgaca tcaccataaa tccgagcaac gaacta 36

<210> 16

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

agtcgtgtgc ttccaagaaa tagccaggtg aggact 36

<210> 17

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

aagtcctcac ctggctaaaa aacagcggag tgtcat 36

<210> 18

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

aatgacactc cgctgttaaa cttggaagca cacgac 36

<210> 19

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

aacgcatcgc ttgatagaaa agaggagcac ggttat 36

<210> 20

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

aataaccgtg ctcctctaaa gtaggcaatc caccat 36

<210> 21

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

aatggtggat tgcctacaaa ctatcaagcg atgcgt 36

<210> 22

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

agtcgttcca ccgaacaaaa tggctctggt cattga 36

<210> 23

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

atcaatgacc agagccaaaa aatcgcacat ctcagg 36

<210> 24

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

acctgagatg tgcgattaaa tgttcggtgg aacgac 36

<210> 25

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

agcggagtga ccatagtaaa aggcaggaca ttgttc 36

<210> 26

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

agaacaatgt cctgcctaaa gtgctcgtcg tgaaga 36

<210> 27

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

atcttcacga cgagcacaaa actatggtca ctccgc 36

<210> 28

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

aattggaccg ctctactaaa atggcaccac agtcaa 36

<210> 29

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

attgactgtg gtgccataaa caggctatca gcatcc 36

<210> 30

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

aggatgctga tagcctgaaa agtagagcgg tccaat 36

<210> 31

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

accattgagc cagtgataaa aaccgttgtg agttgc 36

<210> 32

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

agcaactcac aacggttaaa tcgcacacct gtcgta 36

<210> 33

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

atacgacagg tgtgcgaaaa atcactggct caatgg 36

<210> 34

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

aagtgaagaa gcagcctaaa gttgtcatcg cacacc 36

<210> 35

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

aggtgtgcga tgacaacaaa atgtcgtaac cgtgga 36

<210> 36

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

atccacggtt acgacataaa aggctgcttc ttcact 36

<210> 37

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

aatagcgtct tgagcctaaa tggaggacat accgac 36

<210> 38

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

agtcggtatg tcctccaaaa ggtcacagtt gctgct 36

<210> 39

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

aagcagcaac tgtgaccaaa aggctcaaga cgctat 36

<210> 40

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

atgccgtgtt cagattcaaa tgtgcgtctg gattga 36

<210> 41

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

atcaatccag acgcacaaaa agacaggtgg tccgat 36

<210> 42

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

aatcggacca cctgtctaaa gaatctgaac acggca 36

<210> 43

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

attcaggaca gcgtcataaa accgactgga gcaact 36

<210> 44

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

aagttgctcc agtcggtaaa gatgccttcg tgtgag 36

<210> 45

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

actcacacga aggcatcaaa atgacgctgt cctgaa 36

<210> 46

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

agcagccaag gttatctaaa caatgacacg gaggat 36

<210> 47

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

aatcctccgt gtcattgaaa gtgattcgca ccagac 36

<210> 48

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

agtctggtgc gaatcacaaa agataacctt ggctgc 36

<210> 49

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

accaccgtgt atgacctaaa agtgacagca catcgc 36

<210> 50

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

agcgatgtgc tgtcactaaa acaggctcta cgagga 36

<210> 51

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

atcctcgtag agcctgtaaa aggtcataca cggtgg 36

<210> 52

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

aactacggag cgaagataaa tcctgaccaa cttgct 36

<210> 53

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

aagcaagttg gtcaggaaaa gactggctga acacga 36

<210> 54

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

atcgtgttca gccagtcaaa atcttcgctc cgtagt 36

<210> 55

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

agttcctgat ccagcctaaa catccttgtc ttgcca 36

<210> 56

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

atggcaagac aaggatgaaa cacgaccgct tagaag 36

<210> 57

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

acttctaagc ggtcgtgaaa aggctggatc aggaac 36

<210> 58

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

atatcgcact ccagcataaa ccgtgtgaac atcagg 36

<210> 59

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

acctgatgtt cacacggaaa agcctacgag acttgg 36

<210> 60

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

accaagtctc gtaggctaaa atgctggagt gcgata 36

<210> 61

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

aagcgtcgtg aatccaaatg agcctgccaa tg 32

<210> 62

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

acattggcag gctcaaaacc gaagtcaacg ct 32

<210> 63

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

aagcgttgac ttcggaaaac tatggacggc ga 32

<210> 64

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

atcgccgtcc atagtaaagg attcacgacg ct 32

<210> 65

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

aatggcgagc aatccaaatg agcctggacc aa 32

<210> 66

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

attggtccag gctcaaaacc gaacgctgtg at 32

<210> 67

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

aatcacagcg ttcggaaaac tatcgtgcgg ca 32

<210> 68

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

atgccgcacg atagtaaagg attgctcgcc at 32

<210> 69

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 69

atgaccacgc aatccaaatg agccaacctc ca 32

<210> 70

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 70

atggaggttg gctcaaaacc gaacagcagc tt 32

<210> 71

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 71

aaagctgctg ttcggaaaac tatctgccgc ct 32

<210> 72

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 72

aaggcggcag atagtaaagg attgcgtggt ca 32

<210> 73

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 73

atgtcgcacc aatccaaatg agcaagcctc gt 32

<210> 74

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 74

aacgaggctt gctcaaaacc gaacgctgtc at 32

<210> 75

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 75

aatgacagcg ttcggaaaac tatgtggcgg ca 32

<210> 76

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 76

atgccgccac atagtaaagg attggtgcga ca 32

<210> 77

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 77

atgctggcac aatccaaatg agcgacgagg tt 32

<210> 78

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 78

aaacctcgtc gctcaaaacc gaagtgccag tt 32

<210> 79

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 79

aaactggcac ttcggaaaac tatgaggcgg ct 32

<210> 80

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 80

aagccgcctc atagtaaagg attgtgccag ca 32

<210> 81

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 81

atgtcgcacc aatccaaatg agcaggttgg ca 32

<210> 82

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 82

atgccaacct gctcaaaacc gaacgctgtc aa 32

<210> 83

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 83

attgacagcg ttcggaaaac tatcagccgc ct 32

<210> 84

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 84

aaggcggctg atagtaaagg attggtgcga ca 32

<210> 85

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 85

atgtggtcgc aatccaaatg agcacctgcc aa 32

<210> 86

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 86

attggcaggt gctcaaaacc gaacgtgacg at 32

<210> 87

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 87

aatcgtcacg ttcggaaaac tatcaacgcc gc 32

<210> 88

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 88

agcggcgttg atagtaaagg attgcgacca ca 32

<210> 89

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 89

aagcgtcgtc aatccaaatg agcacggcaa tg 32

<210> 90

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 90

acattgccgt gctcaaaacc gaagtgaacg ct 32

<210> 91

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 91

aagcgttcac ttcggaaaac tatggctcgc ct 32

<210> 92

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 92

aaggcgagcc atagtaaagg attgacgacg ct 32

<210> 93

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 93

atgtggcgac aatccaaatg agcaagcctc ca 32

<210> 94

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 94

atggaggctt gctcaaaacc gaagacgctg tt 32

<210> 95

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 95

aaacagcgtc ttcggaaaac tatcgtgcgg ca 32

<210> 96

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 96

atgccgcacg atagtaaagg attgtcgcca ca 32

<210> 97

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 97

atgctgccac aatccaaatg agcctggaac ca 32

<210> 98

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 98

atggttccag gctcaaaacc gaacgcagtc at 32

<210> 99

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 99

aatgactgcg ttcggaaaac tatcgccgct ct 32

<210> 100

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 100

aagagcggcg atagtaaagg attgtggcag ca 32

<210> 101

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 101

atgcgtcgtc aatccaaatg agcttggcaa gg 32

<210> 102

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 102

accttgccaa gctcaaaacc gaacgtgctg tt 32

<210> 103

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 103

aaacagcacg ttcggaaaac tatggagcgg ct 32

<210> 104

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 104

aagccgctcc atagtaaagg attgacgacg ca 32

<210> 105

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 105

aactgccagc aatccaaatg agcctcgttc ca 32

<210> 106

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 106

atggaacgag gctcaaaacc gaagttggca gt 32

<210> 107

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 107

aactgccaac ttcggaaaac tatcgccgct tg 32

<210> 108

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 108

acaagcggcg atagtaaagg attgctggca gt 32

<210> 109

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 109

atgcgtcgtc aatccaaatg agcctccagg tt 32

<210> 110

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 110

aaacctggag gctcaaaacc gaatgacacg ct 32

<210> 111

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 111

aagcgtgtca ttcggaaaac tatggcggca gt 32

<210> 112

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 112

aactgccgcc atagtaaagg attgacgacg ca 32

<210> 113

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 113

aagcgtcgtg aatccaaatg agccatcgtc ca 32

<210> 114

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 114

atggacgatg gctcaaaacc gaatgtgctg gt 32

<210> 115

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 115

aaccagcaca ttcggaaaac tatgcggcaa cc 32

<210> 116

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 116

aggttgccgc atagtaaagg attcacgacg ct 32

<210> 117

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 117

attgccagga tgctgaatca cggtcggaca 30

<210> 118

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 118

atgtccgacc gtgatagtcg cagaaggcat 30

<210> 119

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 119

aatgccttct gcgacatagt acaacgccgc 30

<210> 120

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 120

agcggcgttg tactaacagc atcctggcaa 30

<210> 121

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 121

aggcgatcac aatccaaatg agcgtgttac gg 32

<210> 122

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 122

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 123

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 123

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 124

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 124

aagcagccgc atagtaaagg attgtgatcg cc 32

<210> 125

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 125

atggtccaac acgctaagcc tcaccgtctt 30

<210> 126

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 126

aaagacggtg aggctatcgc acaacctggt 30

<210> 127

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 127

aaccaggttg tgcgaatcgg agtggcagaa 30

<210> 128

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 128

attctgccac tccgaaagcg tgttggacca 30

<210> 129

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 129

aaccttggtg tgcgaaactc ctggcagcaa 30

<210> 130

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 130

attgctgcca ggagtaagcg tgtggttcca 30

<210> 131

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 131

atggaaccac acgctatgag gaccgtcgtt 30

<210> 132

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 132

aaacgacggt cctcaatcgc acaccaaggt 30

<210> 133

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 133

atgccaagtc cgagaatgct gcgaactggt 30

<210> 134

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 134

aaccagttcg cagcaaagag cctgaaccgt 30

<210> 135

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 135

aacggttcag gctctaacga cgcttgacca 30

<210> 136

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 136

atggtcaagc gtcgtatctc ggacttggca 30

<210> 137

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 137

aagcagcctc gttgaatcgc caagacacct 30

<210> 138

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 138

aaggtgtctt ggcgaaagtt gctccgacga 30

<210> 139

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 139

atcgtcggag caactaagcg gttctgtgga 30

<210> 140

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 140

atccacagaa ccgctatcaa cgaggctgct 30

<210> 141

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 141

atcaggcgac ctcttaaaac caccatcgtt gc 32

<210> 142

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 142

agcaacgatg gtggtaaaaa tccaaatgag cgtgttacgg 40

<210> 143

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 143

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 144

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 144

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 145

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 145

aagcagccgc atagtaaagg attaaaaaga ggtcgcctga 40

<210> 146

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 146

aggcgacgat gtcttaaaac ctggttgctg ga 32

<210> 147

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 147

atccagcaac caggtaaaaa tccaaatgag cgtgttacgg 40

<210> 148

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 148

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 149

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 149

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 150

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 150

aagcagccgc atagtaaagg attaaaaaga catcgtcgcc 40

<210> 151

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 151

atggaacctg gtgctaaatg ctcgcctgtc aa 32

<210> 152

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 152

attgacaggc gagcaaaaaa tccaaatgag cgtgttacgg 40

<210> 153

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 153

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 154

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 154

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 155

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 155

aagcagccgc atagtaaagg attaaaagca ccaggttcca 40

<210> 156

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 156

atggtcaggc gacttaaaag gacgaggttg ct 32

<210> 157

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 157

aagcaacctc gtcctaaaaa tccaaatgag cgtgttacgg 40

<210> 158

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 158

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 159

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 159

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 160

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 160

aagcagccgc atagtaaagg attaaaaagt cgcctgacca 40

<210> 161

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 161

atgctggacc accttaaatc agatggaggc ga 32

<210> 162

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 162

atcgcctcca tctgaaaaaa tccaaatgag cgtgttacgg 40

<210> 163

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 163

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 164

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 164

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 165

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 165

aagcagccgc atagtaaagg attaaaaagg tggtccagca 40

<210> 166

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 166

aaacgtccag gagctaaatc tcgtcgcctg aa 32

<210> 167

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 167

attcaggcga cgagaaaaaa tccaaatgag cgtgttacgg 40

<210> 168

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 168

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 169

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 169

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 170

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 170

aagcagccgc atagtaaagg attaaaagct cctggacgtt 40

<210> 171

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 171

accacgacca ttgctaaaaa cttcaggcga cg 32

<210> 172

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 172

acgtcgcctg aagttaaaaa tccaaatgag cgtgttacgg 40

<210> 173

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 173

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 174

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 174

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 175

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 175

aagcagccgc atagtaaagg attaaaagca atggtcgtgg 40

<210> 176

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 176

aaggcgaggt cttcaaaatg gttgctggac ga 32

<210> 177

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 177

atcgtccagc aaccaaaaaa tccaaatgag cgtgttacgg 40

<210> 178

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 178

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 179

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 179

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 180

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 180

aagcagccgc atagtaaagg attaaatgaa gacctcgcct 40

<210> 181

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 181

atcaaggcga ccagtaaaaa gctcctcgac ga 32

<210> 182

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 182

atcgtcgagg agcttaaaaa tccaaatgag cgtgttacgg 40

<210> 183

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 183

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 184

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 184

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 185

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 185

aagcagccgc atagtaaagg attaaaactg gtcgccttga 40

<210> 186

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 186

attcaggcga ctcctaaaag cacgacgatg gt 32

<210> 187

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 187

aaccatcgtc gtgctaaaaa tccaaatgag cgtgttacgg 40

<210> 188

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 188

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 189

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 189

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 190

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 190

aagcagccgc atagtaaagg attaaaagga gtcgcctgaa 40

<210> 191

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 191

aagcacctgc aatccaaatc gccaggacaa gt 32

<210> 192

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 192

aacttgtcct ggcgaaaatg agcaaccatg cc 32

<210> 193

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 193

aggcatggtt gctcaaaacc gaacgtcgtg at 32

<210> 194

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 194

aatcacgacg ttcggaaaac tatggagcgg ct 32

<210> 195

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 195

aagccgctcc atagtaaagg attgcaggtg ct 32

<210> 196

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 196

aacctgctgc aatccaaatc gccacctcaa ga 32

<210> 197

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 197

atcttgaggt ggcgaaaatg agcctggacg tt 32

<210> 198

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 198

aaacgtccag gctcaaaacc gaactggtgc tt 32

<210> 199

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 199

aaagcaccag ttcggaaaac tatgccgctc ct 32

<210> 200

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 200

aaggagcggc atagtaaagg attgcagcag gt 32

<210> 201

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 201

aagctggtgc aatccaaatc gcctcctgac aa 32

<210> 202

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 202

attgtcagga ggcgaaaatg agcaaggttg gc 32

<210> 203

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 203

agccaacctt gctcaaaacc gaacgcagat gt 32

<210> 204

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 204

aacatctgcg ttcggaaaac tatggagcgg ca 32

<210> 205

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 205

atgccgctcc atagtaaagg attgcaccag ct 32

<210> 206

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 206

atgcacgcac aatccaaatc gccatcagag gt 32

<210> 207

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 207

aacctctgat ggcgaaaatg agctgcctcc at 32

<210> 208

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 208

aatggaggca gctcaaaacc gaacgtcgtc at 32

<210> 209

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 209

aatgacgacg ttcggaaaac tatcgagcgg ct 32

<210> 210

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 210

aagccgctcg atagtaaagg attgtgcgtg ca 32

<210> 211

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 211

aagcgtcgtg aatccaaatc gccatcagac ca 32

<210> 212

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 212

atggtctgat ggcgaaaatg agcaaggctc gt 32

<210> 213

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 213

aacgagcctt gctcaaaacc gaaccagctt gt 32

<210> 214

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 214

aacaagctgg ttcggaaaac tatgcggcag gt 32

<210> 215

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 215

aacctgccgc atagtaaagg attcacgacg ct 32

<210> 216

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 216

atcagcacgc aatccaaatc gccagttcaa cc 32

<210> 217

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 217

aggttgaact ggcgaaaatg agcaagcagg ct 32

<210> 218

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 218

aagcctgctt gctcaaaacc gaacgtggtg tt 32

<210> 219

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 219

aaacaccacg ttcggaaaac tatggagcgg ca 32

<210> 220

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 220

atgccgctcc atagtaaagg attgcgtgct ga 32

<210> 221

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 221

aagctgcacc aatccaaatc gccagaaggt ca 32

<210> 222

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 222

atgaccttct ggcgaaaatg agcacgacgc at 32

<210> 223

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 223

aatgcgtcgt gctcaaaacc gaacaacctg ct 32

<210> 224

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 224

aagcaggttg ttcggaaaac tatggagcgg ca 32

<210> 225

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 225

atgccgctcc atagtaaagg attggtgcag ct 32

<210> 226

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 226

aacgctcgtc aatccaaatc gcctcaggac aa 32

<210> 227

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 227

attgtcctga ggcgaaaatg agccaacgac ct 32

<210> 228

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 228

aaggtcgttg gctcaaaacc gaagctggtg tt 32

<210> 229

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 229

aaacaccagc ttcggaaaac tatgccgcac ct 32

<210> 230

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 230

aaggtgcggc atagtaaagg attgacgagc gt 32

<210> 231

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 231

aagtgcgtcg aatccaaatc gccaagacct ca 32

<210> 232

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 232

atgaggtctt ggcgaaaatg agcaggctgg aa 32

<210> 233

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 233

attccagcct gctcaaaacc gaagcaacgt gt 32

<210> 234

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 234

aacacgttgc ttcggaaaac tatgccgctc ct 32

<210> 235

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 235

aaggagcggc atagtaaagg attcgacgca ct 32

<210> 236

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 236

atcacgcagc aatccaaatc gccatcacaa cg 32

<210> 237

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 237

acgttgtgat ggcgaaaatg agcacgagcc tt 32

<210> 238

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 238

aaaggctcgt gctcaaaacc gaaggttgca ct 32

<210> 239

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 239

aagtgcaacc ttcggaaaac tatgccgctc ca 32

<210> 240

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 240

atggagcggc atagtaaagg attgctgcgt ga 32

<210> 241

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 241

agtgatccga agtcgacaaa cgtattagcg ctcgat 36

<210> 242

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 242

aatcgagcgc taatacgaaa gtgcaatgcg tcgatg 36

<210> 243

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 243

acatcgacgc attgcacaaa gtcgacttcg gatcac 36

<210> 244

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 244

accaccgtgt atgacctaaa agtgacagca catcgc 36

<210> 245

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 245

agcgatgtgc tgtcactaaa acaggctcta cgagga 36

<210> 246

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 246

atcctcgtag agcctgtaaa aggtcataca cggtgg 36

<210> 247

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 247

aacctggtac aatccaaatg agctacacta gc 32

<210> 248

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 248

agctagtgta gctcaaaacc gaagtatcga tt 32

<210> 249

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 249

aaatcgatac ttcggaaaac tatagtgagt tg 32

<210> 250

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 250

acaactcact atagtaaagg attgtaccag gt 32

<210> 251

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 251

aggcgatcac aatccaaatg agcgtgttac gg 32

<210> 252

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 252

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 253

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 253

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 254

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 254

aagcagccgc atagtaaagg attgtgatcg cc 32

<210> 255

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 255

atcacagagc gcgtaaaaac gccactcatg ga 32

<210> 256

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 256

atccatgagt ggcgtaaaaa tccaaatgag cgtgttacgg 40

<210> 257

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 257

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 258

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 258

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 259

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 259

aagcagccgc atagtaaagg attaaatacg cgctctgtga 40

<210> 260

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 260

attcaggcga ctcctaaaag cacgacgatg gt 32

<210> 261

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 261

aaccatcgtc gtgctaaaaa tccaaatgag cgtgttacgg 40

<210> 262

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 262

accgtaacac gctcaaaacc gaagtgccaa tt 32

<210> 263

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 263

aaattggcac ttcggaaaac tatgcggctg ct 32

<210> 264

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 264

aagcagccgc atagtaaagg attaaaagga gtcgcctgaa 40

<210> 265

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 265

atgagtgcgc aatccaaatc gccagtcatg ca 32

<210> 266

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 266

atgcatgact ggcgaaaatg agcgctcgtt ga 32

<210> 267

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 267

atcaacgagc gctcaaaacc gaagtgccaa ct 32

<210> 268

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 268

aagttggcac ttcggaaaac tatcgcgcga ct 32

<210> 269

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 269

aagtcgcgcg atagtaaagg attgcgcact ca 32

<210> 270

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 270

atcacgcagc aatccaaatc gccatcacaa cg 32

<210> 271

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 271

acgttgtgat ggcgaaaatg agcacgagcc tt 32

<210> 272

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 272

aaaggctcgt gctcaaaacc gaaggttgca ct 32

<210> 273

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 273

aagtgcaacc ttcggaaaac tatgccgctc ca 32

<210> 274

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 274

atggagcggc atagtaaagg attgctgcgt ga 32

Claims

1.一种确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的方法，其特征在于，包括步骤：

(a)设置退火算法参数：

设置退火初始温度、退火终止温度和退火温度衰减系数ΔT；

设置优化约束参数：

①核酸单链的数量n，其中n为3-6的正整数；

②配对序列长度L，其中L为12-16碱基；

③配对区域解离温度阈值T_m，所述T_m根据配对序列长度而定，其中L＝14碱基时，T_m>50℃；L＝16碱基时，T_m>52℃；

④特异性配对区域序列自由能阈值所述根据配对序列长度而定，其中L＝14碱基时，L＝16碱基时，

⑤非特异性配对自由能阈值其中

⑥连接元X2，所述连接元X2选自下组：A、AA、AAA；

⑦二级结构(hairpin)解离温度阈值T_m-H，所述T_m-H<40℃；

⑧配对序列中CG比例P_CG，其范围为[0.4,0.6)，

根据以上参数初始化序列集合S＝{S₁,S₂,…,S_n}；

(b)计算前一步骤所述集合S的目标函数值E₀，即计算序列之间与序列自身的非特异性配对自由能之和，同时得到非特异性配对自由能矩阵C_n×n，搜索其上三角矩阵中的最小值所对应的S_i和S_j，其中1≤i≤n,1≤j≤n，根据S_i和S_j非特异性配对自由能随机选择S_i或S_j进行更新操作，于是得到一条新的核酸序列，进而得到更新的序列集合S’；

(c)判断前一步骤所述集合S’中的序列是否满足步骤(a)中所设置的优化约束参数条件，验证以下参数，包括特异性配对区域解离温度T_m,特异性配对区域序列自由能二级结构解离温度T_m-H和CG比例P_CG，如若以上参数满足约束条件则执行步骤(d)，否则重复执行步骤(c)，如果在某一退火温度下，连续执行15次步骤(b)都未得到满足条件的S’则，为防止死循环，集合S成为集合S’，执行下一步；

(d)计算前一步骤所述集合S’的目标函数值E₁，比较E₀与E₁，若E₁≥E₀，表明非特异性配对自由能得到优化，序列集合S’成为序列集合S，若E₁<E₀，表明非特异性配对自由能未得到优化，此时需要根据Metropolis准则，判断是否接受S’集合成为S；和

(e)退火温度根据步骤(a)设置的衰减系数ΔT进行衰减，对前一步骤所述的S重复执行步骤(b)、(c)和(d)，即基于蒙特卡洛的退火算法，直至退火温度达到退火终止温度，前一步骤所述的S＝{S₁,S₂,…,S_n}成为用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列；

其中，在步骤(d)中，所述的优化集合是满足以下条件的集合：

(C1)核酸骨架结构中，序列之间目标配对形成的DNA双链结构的自由能小于或最小；和

(C2)核酸骨架结构中，序列之间非目标配对的大于-7kcal/mol或最大化。

2.如权利要求1所述的方法，其特征在于，在步骤(c)中，将互配核酸骨架结构分解为10种不同的最近邻的成对相互作用，这些成对的相互作用是：AA/TT；AT/TA；TA/AT；CA/GT；GT/CA；CT/GA；GA/CT；CG/GC；GC/CG；和GG/CC；并基于这些成对的相互作用的焓ΔH°和熵ΔS°计算得到相应的各自的ΔG°值；然后将互配核酸骨架结构所包括的成对的相互作用的自由能合并或求和，获得互配核酸骨架结构的自由能。

3.如权利要求1所述的方法，其特征在于，所述方法包括重复步骤(b)、(c)和(d)多次，从而在迭代过程中获得全局最优解。

4.如权利要求3所述的方法，其特征在于，使用以下优化目标函数进行模拟退火算法的迭代，从而优化非目标配对区域的自由能：

5.如权利要求1所述的方法，其特征在于，所述优化约束参数进一步包括：对于n＝4时，使用对称序列。

6.一种用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列集合，其特征在于，所述的单链核酸序列集合是用权利要求1所述的方法所确定的，并且所述的集合选自Group1-Group3中所示的用于形成基于互配核酸骨架的三、四或五聚体复合物的单链核酸序列集合：

(Group1)用于形成基于互配核酸骨架的三聚体复合物的单链核酸序列：

(Group2)用于形成基于互配核酸骨架的四聚体复合物的单链核酸序列：

(Group3)用于形成基于互配核酸骨架的五聚体复合物的单链核酸序列：

7.一种基于互配核酸骨架的多聚体复合物，其特征在于，所述的复合物是n个具有互配核酸骨架的单体复合形成的多聚体，其中，每个单体为具有核酸单链的多肽，而n为3-5的正整数；在所述多聚体中，每个单体的核酸单链与另外两个单体的核酸单链通过碱基互补形成互配双链，从而形成互配核酸骨架结构，

其中，所述多聚体复合物中的单链核酸序列由如权利要求6所述的单链核酸序列集合组成。

8.如权利要求7所述的多聚体复合物，其特征在于，所述的单体具有式I结构：

Z1-W(I)

式中，

Z1为多肽部分(moiety)；

W为单链核酸序列；

“-”为接头或键。

9.如权利要求8所述的多聚体复合物，其特征在于，所述的核酸序列W具有式1所示的结构：

X1–R1–X2–R2–X3(1)

其中，

R1为碱基互补配对区域1；

R2为碱基互补配对区域2；

X1、X2和X3各自独立地为无或冗余核酸；

“－”为键。

10.一种药物组合物，其特征在于，所述药物组合物包括：

(a)权利要求7中所述的基于互配核酸骨架的多聚体复合物；和

(b)药学上可接受的载体。

11.一种核酸序列文库，其特征在于，所述的核酸文库包括用于形成权利要求7所述的基于互配核酸骨架的多聚体复合物的核酸序列。

12.如权利要求11所述的核酸序列文库，其特征在于，所述的核酸序列W具有式1所示的结构：

X1–R1–X2–R2–X3 (1)

其中，

R1为碱基互补配对区域1；

R2为碱基互补配对区域2；

X1、X2和X3各自独立地为无或冗余核酸；

“－”为键。

13.如权利要求11所述的核酸序列文库的用途，其特征在于，用于制备权利要求7所述的多聚体复合物或含权利要求7所述的多聚体复合物的药物组合物。

14.一种用于如权利要求1所述的确定用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列的方法的装置，所述装置包括:

(M1)输入模块，所述输入模块用于输入退火算法参数、优化约束参数；

所述的优化约束参数包括：

①核酸单链的数量n，其中n为3-6的正整数；

②配对序列长度L，其中L为12-16碱基；

⑤非特异性配对自由能阈值其中

⑥连接元X2，所述连接元X2选自下组：A、AA、AAA；

⑦二级结构(hairpin)解离温度阈值T_m-H，所述T_m-H<40℃；

⑧配对序列中CG比例P_CG，其范围为[0.4,0.6)，

(z1)计算初始集合S的目标函数值E₀，即计算序列之间与序列自身的非特异性配对自由能之和，同时得到非特异性配对自由能矩阵C_n×n，搜索其上三角矩阵中的最小值所对应的S_i和S_j，其中1≤i≤n,1≤j≤n，根据S_i和S_j非特异性配对自由能随机选择S_i或S_j进行更新操作，于是得到一条新的核酸序列，进而得到更新的序列集合S’；

(z2)判断前一步骤所述集合S’中的序列是否满足所设置的优化约束参数条件，验证以下参数，包括特异性配对区域解离温度T_m,特异性配对区域序列自由能二级结构解离温度T_m-H和CG比例P_CG，如若以上参数满足约束条件则执行步骤(z3)，否则重复执行步骤(z2)，如果在某一退火温度下，连续执行15次步骤都未得到满足条件的S’则，为防止死循环，集合S成为集合S’，执行下一步；

(z3)计算前一步骤所述集合S’的目标函数值E₁，比较E₀与E₁，若E₁≥E₀，表明非特异性配对自由能得到优化，序列集合S’成为序列集合S，若E₁<E₀，表明非特异性配对自由能未得到优化，此时需要根据Metropolis准则，判断是否接受S’集合成为S；和

(z4)退火温度根据设置的衰减系数ΔT进行衰减，对前一步骤所述的S重复执行步骤(z1)、(z2)和(z3)，即基于蒙特卡洛的退火算法，直至退火温度达到退火终止温度，前一步骤所述的S＝{S₁,S₂,…,S_n}成为用于形成基于互配核酸骨架的多聚体复合物的单链核酸序列；和