CN101200763A

CN101200763A - 待测核酸序列的编码及解码方法

Info

Publication number: CN101200763A
Application number: CNA200710135581XA
Authority: CN
Inventors: 肖鹏峰; 陆祖宏; 李燕强; 潘志强; 唐静
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2007-11-13
Filing date: 2007-11-13
Publication date: 2008-06-18
Anticipated expiration: 2027-11-13
Also published as: CN100590203C

Abstract

本发明公开了一种待测核酸序列的编码方法，是一种实现了不同样本核酸序列或者同一样本不同核酸序列高通量同时分析的方法，尤其涉及一种待测核酸序列的编码及解码方法。本发明的方案是将每个待测的核酸序列分别切割成核酸片段，再在核酸片段的两端分别连接一个连接子，使其形成模板，其中一个连接子由一段扩增的(与测序引物互补)序列片段和一段序列码构成，并且使属于同一核酸序列的核酸片段上的序列码相同，由此形成编码的待测核酸序列，上述序列码由A、T、C或G四种碱基构成并用人工合成的方法得到。本发明能够解决现有高能量DNA序列测定技术与用户所测样品通量较低但样品数多的矛盾，降低测定成本，方法简单。

Description

待测核酸序列的编码及解码方法

技术领域

本发明是一种实现了不同样本核酸序列或者同一样本不同核酸序列高通量同时分析的方法，尤其涉及一种待测核酸序列的编码及解码方法。

技术背景

随着人类基因组计划和各种模式生物基因组计划的开展和完成，使人类步入了后基因时代，对当代的生物学研究和医学研究产生了巨大的影响，分子生物学相关学科得到了迅猛的发展。从基因水平上认识生命的差异，疾病发生、发展的规律，以及药物与生命体的相互作用将成为可能。就基因序列分析而言，后基因时代的重点已由全基因组序列测定转移到了对基因组中个体遗传差异及物种间遗传差异的比较。目前，无论是找寻新的还是确认已知SNP位点，传统的Sanger DNA测序法，仍处于无可替代的地位。但这一方法存在通量低和价格高的问题。第一个人类基因组序列测定的费用大约为10亿美元，目前这一费用已经降低到大约2千万美元。但是，功能基因组的研究进展仍然受限于DNA测序技术。为此，美国Venter基金会在2003年提出了1000美金人类全基因组测序的研究目标。2004年初，美国国立卫生院投入7千多万美元支持DNA测序新技术的研究计划，其目标是发展10万美金的测序技术，并最终减低为1千美金。美国国立卫生研究院人类基因组研究中心主任Collins教授指出：大幅度降低DNA测序的成本将会大大推动生命科学和医学的研究，甚至会带来革命性的变化。目前，全基因组DNA测序技术已经成为国际上一个竞争十分激烈的研究领域。美国的454Life Sciences公司基于乳液PCR产物的高通量并行焦测序技术；Illumina(Solexa)公司的桥式扩增-DNA芯片延伸测序技术；以及Applied Biosestems(SOLiD)公司基于乳液PCR产物的杂交-酶连接-酶切割高通量测序技术都有成熟的商品化仪器上市。

然而，这些仪器均主要针对全基因组测序而开发的，每次可以对上千万的序列进行同时检测，虽然相对于全基因组序列测定其费用比以往有大幅度的降低，然而针对某些通量不需要这样高的序列分析，检测费用相当昂贵。因此，如果能将许多这些通量不是很高的样本组合到一起来进行分析，无疑摊派到每个样本上的费用将大大降低。

本发明的目的就是通过一种基于碱基序列编码及其解码方法：应用碱基A、G、C、T构成的已知核酸序列为码，作为连接子或者扩增引物中的一个序列片段，通过对待分析的核酸序列进行连接或者扩增而实现对待分析核酸序列编码，然后对这些编码的核酸序列直接或者通过扩增放大固定在载体上进行高通量序列检测，完成对所有编码核酸序列的分析和对所有码进行解码。

发明内容

本发明提供一种能够有效解决现有高能量DNA序列测定技术与用户所测样品通量较低但样品数多的矛盾的待测核酸序列的编码及解码方法，本发明有助于降低测定成本，具有方法简单的优点。

本发明采用如下技术方案：

本发明所述的一种待测核酸序列的编码方法，将每个待测的核酸序列分别切割成核酸片段，再在核酸片段的两端分别连接一个连接子，使其形成模板，其中一个连接子由一段扩增的(与测序引物互补)序列片段和一段序列码构成，并且使属于同一核酸序列的核酸片段上的序列码相同，由此形成编码的待测核酸序列，上述序列码由A、T、C或G四种碱基构成并用人工合成的方法得到。

本发明所述的一种适于权利要求1所述待测核酸序列的编码方法的解码方法，以扩增引物序列片段对应的互补片段作为模板的测序引物，用现有的碱基序列测定方法，测定已编码的待测核酸序列上的序列码，从而得到序列码的A、T、C或G四种碱基构成的片段。

本发明与现有技术相比，具有如下优点：

本发明应用碱基A、G、C、T构成的已知的核酸序列为序列码，这些序列码作为连接子或者扩增引物中的一个序列片段，通过对待分析的核酸序列进行连接或者扩增而实现对待分析核酸序列编码，然后对这些编码的核酸序列直接或者通过扩增放大固定在载体上进行高通量序列检测，完成对所有编码核酸序列的分析和对所有码进行解码。

1.本发明的最大优点是实现了不同样本的同时检测，解决了现有的高能量DNA序列测定技术与用户所测样品通量较低但样品数多的矛盾，大大降低了实验成本。

2.本发明将每个样本进行分别编码后，可将不同样本的模板制备、芯片制备、以及序列测定的合并进行，与目前广泛使用的核酸序列分析方法兼容，大大简化了分析不同样本的操作工艺。

3.本发明适用面广。编码数目不受限制，而且可以和目前广泛使用的微珠编码，以及空间位置编码相兼容使用，可以用于DNA、RNA的编码和编码DNA、RNA的其它检测应用。

4.本发明方法简单，易于解码。用于编码核酸的碱基序列可以通过人工合成在连接子上，通过编码的连接子连接待测序的核酸而编码核酸；编码核酸的码可以通过同时待测核酸序列测定和码序列而得到解码。

附图说明

图1是本发明一种碱基序列编码、解码核酸序列方法的编码核酸序列过程示意图。

图2是本发明一种碱基序列编码、解码核酸序列方法的解码核酸序列示意图之一。

图3是本发明一种碱基序列编码、解码核酸序列方法的解码核酸序列示意图之二。

具体实施方式

一种待测核酸序列的编码方法，将每个待测的核酸序列分别切割成核酸片段2，再在核酸片段2的两端分别连接一个连接子3、4，使其形成模板，其中一个连接子4由一段扩增的(与测序引物互补)序列片段4-1和一段序列码4-2构成，并且使属于同一核酸序列的核酸片段上的序列码相同，由此形成编码的待测核酸序列，上述序列码4-2由A、T、C或G四种碱基构成并用人工合成的方法得到。

碱基序列码实际上是合成在一组特定的已知碱基序列片段，每个码具有已知唯一的碱基序列。这些碱基序列码是先通过编码连接子或者扩增引物，然后对待分析的核酸序列进行连接或者扩增而实现对待分析核酸序列编码的，亦即是一组编码的寡核苷酸序列通过连接、或者作为PCR扩增引物转入到待分析的核酸序列片段中实现对待分析核酸序列编码。编码核酸序列最好通过扩增放大后固定在载体上进行高通量序列检测，完成对所有编码核酸序列的分析和对所有码进行解码，实现不同样本核酸序列的高通量分析。

一种适于权利要求1所述待测核酸序列的编码方法的解码方法，以扩增引物序列片段4-1对应的互补片段7作为模板的测序引物，用现有的碱基序列测定方法，测定已编码的待测核酸序列上的序列码4-2，从而得到序列码4-2的A、T、C或G四种碱基构成的片段。

本发明的具体做法为：首先，用酶切或其他方法把样本片段化。然后，把片段化的序列两端加上接头，其中一个接头的3或者5未端位置含有特定的碱基序列码。再把所有这些编码核酸序列样品混合在一起，通过接头引物上的公共序列进行单克隆扩增；或者片段化的序列两端加上接头后用一个含有碱基序列码的引物对片段化序列进行扩增。对扩增产物进行序列分析后，完成对所有编码核酸序列的分析和对所有码进行解码，便可以知道各克隆或者扩增产物所对应的样品及其序列信息。

以下将结合附图对本发明作进一步说明。

参照图1，基因组序列1用酶切割(或者超声破碎)成一定碱基数目的核酸片段2)，并在连接酶的作用下，将这些片段化核酸序列2用一对连接子进行连接子3、4连接成模板5，其中连接子4由一段扩增引物序列片段4-1和一段独特已知碱基序列码4-2构成。这样通过将碱基序列码引入到待分析的核酸序列中，就实现了核酸序列的编码。

参照图2，包括序列待测片段2、连接子3、4的扩增产物，即DNA测序模板固定到载体6上。用扩增引物序列片段4-1对应的互补片段7作为模板的测序引物，按照目前的序列测定方法，测定编码序列4-2和序列待测片段2，由于码序列与一段已知序列相连接，因此解码和编码具有准确一一对应关系。这样就实现了编码核酸序列的解码以及相对应编码待测序列的测定。

参照图3，包括序列待测片段2、连接子3、4的扩增产物，即DNA测序模板固定到载体6上。用引物序列片段4-1对应的互补片段8作为解码的测序引物，按照目前的序列测定方法，测定编码序列4-2，这样就实现了编码序列的解码。这种情况下，将解码的测序引物用变性的方法清除，然后采用连接子3对应的互补片段作为编码核酸序列的测序引物，按照目前的序列测定方法，测定编码核酸的碱基序列。使用两对引物测序后，就完成了编码核酸序列的解码以及对应编码核酸序列的测定。

实例1：编码不同样本DNA序列的高通量分析。

将不同样本DNA序列用酶切割(或者超声破碎)成大小为50-100碱基的片段，并在连接酶的作用下将这些片段化核酸序列用一对连接子进行连接(其中一个为通用连接子寡核酸序列与扩增引物的序列完全互补，另一个为带有不同样本相对应的独特已知序列编码和一段与测序引物相同的寡核苷酸序列片段。

将这些连接臂连接的片段化核酸序列与固定连接子互补序列到微珠进行乳液并行PCR反应，扩增片段化的人全基因组。并将这些微珠固定到平板基片上，通过酶切或者变性得到不同样本DNA序列的测序模板。

采用现行的序列测定方法将这些不同样本DNA序列确定。由于编码序列与测序引物相同的寡核苷酸序列片段相连接，因此当所有序列测定(解码)后，通过对照序列上编码区域对应的编码便可用确定哪些序列归属哪些分析样本。

实例2：编码不同来源mRNA序列的表达分析。

步骤1：分别提取多种不同来源的细胞mRNA，用磁珠固定有30个T的核苷酸链通过杂交mRNA的方式纯化mRNA。

步骤2：分别反转录为cDNA，并用RNaseH、DNA聚合酶等作用下合成第二链。

步骤3：用识别四个碱基的内切酶(Sau 3AI)消化上述双链核酸序列，并用缓冲液洗干净磁珠。

步骤4：在连接酶的作用下将上述消化的双链核酸序列加上接头引物3(引物上带有内切酶Acu I识别位点)。

步骤5：用Acu I消化步骤4的产物。得到接头引物3后面跟着要测的16个未知序列的cDNA文库。

步骤6：步骤5产物连接一接头引物4，对待分析核酸序列完成编码。其中接头引物4特点是：5‘未端用生物素修饰；双链DNA且生物修饰条链3‘未端有两个突出的通用碱基(与上一步酶切产物相对应)；突出两个碱基之后是一些编码序列。连接上接头引物4后，把所有不同样品一混在一起，然后用乳液PCR进行扩增。

步骤7：扩增产物固定在芯片上。

步骤8：将所制备的固定的编码DNA模板进行高通量测序，最后通过解码，以区分不同扩增点的来源。

Claims

1.一种待测核酸序列的编码方法，其特征在于将每个待测的核酸序列分别切割成核酸片段(2)，再在核酸片段(2)的两端分别连接一个连接子(3、4)，使其形成模板，其中一个连接子(4)由一段扩增的(与测序引物互补)序列片段(4-1)和一段序列码(4-2)构成，并且使属于同一核酸序列的核酸片段上的序列码相同，由此形成编码的待测核酸序列，上述序列码(4-2)由A、T、C或G四种碱基构成并用人工合成的方法得到。

2.一种适于权利要求1所述待测核酸序列的编码方法的解码方法，其特征在于以扩增引物序列片段(4-1)对应的互补片段(7)作为模板的测序引物，用现有的碱基序列测定方法，测定已编码的待测核酸序列上的序列码(4-2)，从而得到序列码(4-2)的A、T、C或G四种碱基构成的片段。