CN1784491A - 操作目标dna序列的方法 - Google Patents
操作目标dna序列的方法 Download PDFInfo
- Publication number
- CN1784491A CN1784491A CN200480011916.1A CN200480011916A CN1784491A CN 1784491 A CN1784491 A CN 1784491A CN 200480011916 A CN200480011916 A CN 200480011916A CN 1784491 A CN1784491 A CN 1784491A
- Authority
- CN
- China
- Prior art keywords
- sre
- sequence
- dna sequence
- exogenous array
- sites
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了操作目标DNA序列的方法。该方法包括以下步骤:1)在目标DNA序列的特定位点或随机位点上引入一个至少含有一个SRE特异识别位点的外源序列F1;2)利用与F1中含有的SRE特异识别位点对应的SRE在所述目标DNA序列上制造双链断裂,在该双链断裂处引入另一个至少含有一个SRE特异识别位点的外源序列F2;利用与F2中含有的SRE特异识别位点对应的SRE在所述目标DNA序列上制造双链断裂,在该双链断裂处引入第三个至少含有一个SRE特异识别位点的外源序列F3;重复该操作直至在所述目标DNA序列中引入第n个外源序列Fn;3)对任意两个外源序列之间的所述目标DNA序列进行操作。
Description
操作目标 DNA序列的方法 技术领域
' 本发明涉及生物技术领域中操作目标 DNA序列的方法。
背景技术
生命科学发展到基因组和 /或后基因组时代,研究人员所遇到的一个新的 挑战, 就是需要对大量的已知或未知核酸序列, 包括 DNA序列, R A序列, 或 者任何具备 RNA和 /或 DNA序列特征的序列, 进行结构和功能的研究。特别是 在包括人类基因组计划在内的多个物种的基因组计划取得成功之后, 越来越 迫切地需要更多的更方便的基因结构和功能研究相关实验方法。
在所有基因结构和功能相关的研究中, 对基因序列的定点修饰, 是最基 本的任务。 这类修饰通常可以分为两大类: 其一是特异性的修饰, 即修饰过 程中引入的序列是确定的; 其二是随机修饰, 即修饰过程中引入的序列中至 少有一部分是随机序列。 但在目前应用的相关方法中, 无论是特异性的修饰 还是随机修饰, 都存在多方面的不足。 例如, 与特异性的修饰相关的多种方 法中, 通常都对被修饰位点的序列结构有一定的要求, 此外, 如果对同一区 段的序列进行多种不同的甚至是大规模的修饰时, 现有的手段就显得费时费 力。 而就随机修饰的方法看, 一般情况下, 无论是化学方法还是它分子生物 学手段, 通常都很难保证在目标核酸序列的某个特定的位置上进行, 其中许 多依赖基因操作手段对目标序列进行的随机修饰, 例如依靠外源序列的整合 或者插入时, 由于外源序列的弓 I入从而使得精确的突变修饰变得较为困难。 并且无论是特异性的修饰还是随机修饰, 如果需要对目标位点周围的其它序 列进行修饰, 则更加困难。
在基因操作中, 一般情况下, 常用的限制性内切酶即 restriction endonuclease, 大致可以被分为两类: 一类是其特异性的识别位点即是最后 的酶活性作用位点, 例如常用的 EcoRI, Hindlll等, 均属于此类; 而另一类 其它的一些酶,其特异 识别位点和最后的酶活性作用位点是分离的,如 Alw I, Bae I, Bbs I等, 其酶作用位点落在特异识别位点周围的位置上。
发明内容
本发明的目的是提供三种操作目标 DNA序列的方法。
本发明所提供的一种操作目标 DNA序列的方法, 包括以下步骤:
1)在目标 DNA序列中引入至少一个含有 SRE特异识别位点的外源序列; 所述外源序列含有至少一个 SRE特异识别位点;
2)对 1 ) 中得到的序列中的所述目标 DNA序列中的两个位点之间的序列 片段进行操作; 所述两个位点中至少一个是由所述外源序列中的 SRE特异识 别位点对应的 SRE在所述目标 DNA序列上的一个切割位点; 所述两个位点不 包含和所述 SRE的切割位点对应的 SRE识别位点所在的外源序列在所述目标 DNA序列中的引入位置。
其中, 所述目标 DNA序列和外源序列均为双链 DNA序列或可转化为双链 DNA序列的其它核酸序列。所述 SRE是一类限制性内切酶,其特征是限制性内 切酶的序列特异识别位点和其切割位点不完全重叠或是分离的, 例如 Alw l, Bae I, Bbs I, Bsg I, Bsax I等。
步骤 2) 中所述两个位点是下列情况: 1 )其中一个位点是所述外源序列 中的 SRE特异识别位点对应的 SRE在所述目标 DNA序列上的一个切割位点, 另一个位点是在目标 DNA序列中含有的或外源引入的 RE的切割位点或其它特 异位点。 在本发明中, 所述外源引入的限制性内切酶的切割位点在操作上被 视作目标 DNA序列上的位点; 通过与任意外源序列中的 SRE特异识别位点对 应的 SRE在所述目标 DNA序列上的切割位点引入所述目标 DNA序列以外的其 它序列所含有的任意位点在操作上也被视作目标 DNA序列上的位点;
2 )所述两个位点均为在所述目标 DNA序列中弓 I入的外源序列中含有的 SRE特异识别位点对应的 SRE在所述目标 DNA序列上的切割位点;
a) 和所述切割位点对应的 SRE的特异识别位点位于同一个外源序列中; al )所述切割位点是由所述外源序列中两个可被相同或不同的 SRE识别 位点对应的 SRE作用产生;
a2)所述切割位点是由所述外源序列中同一个 SRE识别位点对应的 SRE 同时在所述目标 DNA序列中的两个位置切割产生。
b)所述两个切割位点是由两个外源序列中含有的相同或不同的 SRE特异 识别位点对应的 SRE切割产生。 '
对步骤 2) 中所述两个位点之间的序列片段进行的操作, 包括以下步骤:
1 )在所述目标 DNA序列的特定位点或随机位点上引入一个至少含有一个 SRE特异识别位点的外源序列 F1;
2)利用与 F1中含有的 SRE特异识别位点对应的 SRE在所述目标 DNA序 列上制造双链断裂, 在该双链断裂处引入另一个至少含有一个 SRE特异识别 位点的外源序列 F2;利用与 F2中含有的 SRE特异识别位点对应的 SRE在所述 目标 DNA序列上制造双链断裂,在该双链断裂处引入第三个至少含有一个 SRE 特异识别位点的外源序列 F3; 重复该操作直至在所述目标 DNA序列中引入第
n个外源序列 Fn, 其中 n 3;
3 )利用任意两个外源序列中的位点对所述目标 DNA序列进行下述两种操 作:
①当所述两个外源序列是连续插入时, 所述两个位点至少有一个是任意 一个外源序列中含有的 SRE特异识别位点对应的 SRE在所述目标 序列中 切割产生的在所述两个外源序列之外的位点;
②当所述两个外源序列是非连续插入的外源序列时, 使用所述两个外源 序列分别含有的任意一个 SRE特异识别位点和 /或其它位点进行操作。 ' 步骤 2) 中所述在目标 DNA序列中引入的含有或不含有 SRE特异识别位 点的外源序列是直接被引入或通过对所述直接弓 I入的外源序列作突变修饰形 成。
步骤 2 ) 中所述操作包括对所述两个位点之间的目标 DNA序列进行序列 置换和 /或全部或部分序列进行删除。
将所述两个位点之间的目标 DNA序列片段克隆出来。 所克隆得到的目标 DNA序列片段是位于所述两个位点之间完整的目标 DNA序列片段。所克隆得到 的目标 DNA序列片段是含有突变的位于所述两个位点之间的目标 DNA序列片 段。 所述两个位点之间的目标 DNA序列片段含有外源序列, 该外源序列被用 于对所克隆的目标 DNA序列片段进行突变操作。
所述含有 SRE特异识别位点的外源序列在与所述 SRE特异识别位点对应 的 SRE切割作用完成后, 并在该切割位点引入外源序列或利用该切割位点将 目标 DNA序列片段克隆之后被完全删除。
所述完整的目标 DNA序列片段包含有外源序列; 所述外源序列可在后续 步骤中删除, 使所述目标 DNA序列片段完全恢复。
将所述克隆得到的目标 DNA序列片段转换为由正区, 中间区和反区三部 分组成的双链 DNA序列, 将该双链 DNA序列表达为具有发夹回环结构的互补 R A序列。
所述克隆得到的目标 DNA序列片段长度为 19- 29bp, 优选为 21- 23bp。 所述发夹回环结构使具有该发夹回环结构的互补 RNA序列能诱导 RNAi效 应。
在克隆得到目标 DNA序列片段后, 按以下步骤进行操作:
1 )在所述目标 DNA序列片段的一端引入一个适应子 (adaptor) ;
2)在所述目标 DNA序列片段的另一端制备至少一个引物区;
3 ) 以步骤 2 ) 中得到的结构为模板, 以与该引物区互补的寡聚核苷酸序
列为引物进行聚合反应, 得到由正区、 反区和中间区组成的双链 DM序列。 本发明所提供的第二种操作目标 DM序列的方法, 包括以下步骤:
1 )在任意长度的 DNA序列的一端引入一个适应子(adaptor) ;
2)在所述 DNA序列的另一端制备至少一个引物区;
3) 以步骤 2) 中得到的结构为模板, 以与该引物区互补的寡聚核苷酸序 列为引物进行聚合反应, 得到由正区、 反区和中间区组成的双链 DNA序列。
可用步骤 3)得到的由正区、 反区和中间区组成的双链 DNA序列, 可在 被克隆进合适的载体之后,用于表达可诱发 RNAi效应的小分子 R A结构, 在 这种情况下, 通常需要从目标序列中截取的目标 DNA序列片段的长度的区间 为 19- 29bp, 优选为 21- 23bp。
本发明所提供的第三种操作目标 DNA序列的方法, 所述目标 DNA序列含 有待检测的可变区, 所述方法是将含有 SRE特异识别位点的外源序列或 SRE 特异识别位点引入所述目标 DNA序列, 然后利用该 SRE特异识别位点对应的 SRE作用,在所述目标 DNA序列的可变区形成切割末端,并利用该切割末端的 特点对所述目标 DNA序列的可变区的核酸序列进行检测。
本发明所述的插入位点可以在所述目标 DNA序列的任意位点。
本发明所述的外源序列含有或不含有 SRE特异识别位点。
附图说明
图 1为本发明的基本原理的简要示意图
图 2为对外源序列在目标序列中的插入及其对目标序列的修饰过程的简 要示意图
图 3为对外源序列中含有的 SRE位点及其作用的简要说明示意图 图 4至图 6为利用外源序列的插入在目 序列实现定点突变的原理的示 意图
图 7为提供筛选标记的外源序列示意图
图 8为利用外源序列中的筛选标记选择阳性克隆示意图
图 9至图 10为利用外源序列对目标序列的序列结构进行修饰的一般程序 示意图
图 11为利用外源序列中含有的 SRE对自身进行修饰示意图
图 12为利用一个以上的外源序列对目标序列进行修饰示意图
图 13为具备自我删除功能的外源序列示意图
图 14为利用外源序列中的 Fokl位点实现外源序列的自我删除示意图 图 15为可删除性的外源序列的具体形态的几种变化的示意图
图 16为利用两个具备自我删除功能的外源序列对目标序列中任意两点 间的序列结构进行修饰的示意图
图 17为利用外源序列中含有的特异重组酶或者其它重组机制的特异识 别位点即 IS实现对目标序列任意两点间的序列置换示意图;
图 18至图 19为外源序列在目标序列中的跳跃示意图
图 20为利用外源序列在目标序列中的跳跃实现在目标序列中的定点插 入示意图
图 21为利用外源序列在目标序列的任意相距 21个碱基的位点形成插入 的方法的示意图
图 22为对克隆得到的目标序列片段的末端的不同形式的修饰示意图 图 23为利用外源序列中的 SRE位点确定目标序列中含有的特定位点的序 列结构示意图
图 24为利用本发明提供的原理制备含有被克隆的目标序列片段及其反 向复制的序列的方法的简要示意图
图 25至图 31为利用本发明提供的原理制备含有被克隆的目标序列片段 及其反向复制的序列的一般步骤的示意图
图 32为对绿色荧光蛋白基因的编码区进行突变的示意图
图 33至图 36a, 图 36b和图 36c为以 mR A为出发序列获得的 DNA序列 中随机截取特定的长度的序列片段,并在此基础上制备能够表达具备 RNAi效 应的小分子 RNA的载体
图 37为从目标 DNA序列截取特定长度的序列片段
具体实施方式
为了描述的方便, 本发明将用 R来指示 SRE的识别相关的功能结构, 用 C指示 SRE的催化相关的功能结构。但这并不代表本发明对 SRE的在结构上的 任何特殊要求, 因而不构成对本发明的限制。
这里仅就本发明提供的主要原理做一个概括性的描述。 就一般原理讲, 本发明的实现, 可分为来两大步骤: 外源序列的定点插入和对插入点及其周 围的序列进行修饰。 以下是概括性的说明, 但需要指出的是, 这里只是对本 发明的一般性说明, 因此不构成对本发明的任何限制。 为说明的方便, 这里 假定目标序列是具有一定长度(假定长度为 L)的 DNA片段。如图 1所示, 实 验的目的是在 N位置上形成插入, 并对 N位点或者周围的序列进行修饰。 下 面将分为两大步骤进行阐述:
第一大步骤: 在 N位点上形成插入。 这里再将具体的实现过程, 分为以
下小的步骤:
步骤 1 : 在目标序列中插入一段外源序列 F
外源序列 F可以通过任意方式导入。 一般情况下, F的导入是不能精确 到 N位点的。例如,可以借助一些酶切位点将 F导入, 但一般情况下, 其和 N 位点完全重叠的可能性较小。 当然, 也可以借助多中类型的转座子的随机整 合机制将 F导入目标序列, 但这显然 F的插入位点是无法精确控制的, 因此 不能保证可以得到在 N位点的插入。
为说明的方便, 这里不妨假定 F通过 N位点附近的限制性内切酶的切点 插入。 不过, 通常情况下, 即使 N位点附近没有合适的酶切点, 则利用常规 的分子生物学方法, 完全可以得到插入位置接近 N位点的克隆。 例如, 当 F 通过某种类型的转座子导入时, 可以利用 F与目标序列或者含有目标序列的 载体间其它酶切点的相对距离, 甚至利用 PCR的办法 (引物分别落在外源序 列 F上和目标序列所在的载体上) , 对 F大概的插入位置进行判断, 而一旦 大概的位置确定后, 其具体的插入位置就可以通过测序的方法进行确定。 这 样, 就可以得到距离接近 N位点的插入。 通常情况下, 只需利用一般的分子 生物手段, 完全可以获得插入位点距离 N有几十到一百碱基左右的克隆。
步骤 2:
假定通过步骤 1, 利用距离 N位点几十到一百碱基的内切酶, 得到了目 标序列的中含有 F插入的克隆。 后续的实验中, 将以此为基点, 实现外源序 列在 N位置的插入。 这里要利用预先在 F片段中设计的一个特殊的限制性内 切酶, 或者其它具有类似功能的酶。
显然, 如果在外源序列 F的末端的合适的位置上, 放置一个合适的 SRE 特异识别位点 R, 例如 F片段的下游的适当位置放置属于 SRE1的 Fok I的特 异识别位点序列 5 'GGATG3 这里不妨假定外源序列 F的下游末端的序列是- 5, GGATGNN 3 ( , 那么, 利用 Fok I就可以在 F的插入位点的下游, 即 以外源序列 F在目标序列中的初始插入点 3 '端的下游的正链的第 7和第 8 碱基间 (C1 ) 以及反链的第 11和第 12碱基间进行酶切。 当然, 毫无疑问, 通过对不同的 SRE1的选择以及 F的末端的不同设计, 使得 SRE1在目标序列 上的切点落在不同的位置上。显然,这个酶切点就可以作为另一个外源序列 F' 的插入位点。
步骤 3:
在 SRE1的酶切作用下形成末端中连入 F '的方法很多。 为说明的便利, 不妨假定酶切点是由 Fok I的作用形成, 然后利用 Klenow将末断补齐, 再通
过平端连接的方式将 F' 导入。 同样如果在 F' 的 3 ' 端的合适位置上设计 另一个合适的 SRE2的识别位点,那么,就可以在其下游的另一个位置 C2处, 再形成一个潜在的 SRE2的酶作用位点 C2。
步骤 4:
将目标序列中的 F序列按设计要求完全或者部分删除。 这里只考虑一般 情况下的完全删除的情况。
对 F片段的删除, 可以根据最初 F被插入的方式的不同, 而出现不同的 变化。 例如, 如果 F是利用目标序列上的一个限制性内切酶位点导入的, 那 么, 一般情况下, 利用同样的位点可以将 F删除出去。 不过, 更多的情形, 是其它的导入方式, 这些情况下, 就要利用 F的设计上的特点, 对 F自身进 行删除。 通常情况下, 基于相同的原理, 可根据 F的导入方式的不同, 设计 不同的删除方式。 这里再举 F被转座子 7的导入为例对 F自我删除依据的 原理进行说明 (Hahn et al 2003; Castano I, Kaur R, Pan S, Cregg R, Penas AD, Guo N, Biery MC, Craig NL, Cormack BP. Tn7— Based Genome-Wide Random Insert ional Mutagenesis of Candida glabrata. Genome Res 2003 Apr 14); 假定 F的导入, 是以 Tn7为基础的转座子体系的插入实现的, 转座子在 5' N1N2N3N4N5 3 ' 处形成插入。 Τη7插入后, 形成以下的序列结构: 5, Nl 2 Ν3 Ν4 Ν5 TGTTTAAACA (N) nl TGTTTAAACA Nl N2 N3 N4 N5 3' , 这里 N1N2N3N4N5的重复是由于转座子的插入造成的。可以将 (N) n结构设计成: 5' NNNCTGCAC (N) 2 GTGCAGN 3, ,这样,只要利用 Bsg I的作用,就可以将(N) nl 删除掉同时将外源的 F片段引入, 最终形成以下结构: 5' ― Nl N2 N3 N4 N5 (F) N4 N5.- 3' 的结构, 而这里的外源序列 F的基本结构可以是: 5' (N) 14 CTGCAC (N) n3 GTGCAG (N) n4 CTGGAG (N) n5 3' , 其中 n4 n5所代表 的碱基数目的和应等于 10, 这样, 依靠 Bpml或者 Gsul便在 F的插入位点的 下游的目标序列的位置上,建立一个潜在的 C1点,并借助这个 C1点将 导 入, 然后, 可以利用 Bsg I酶, 将 F删除, 这样, 插入位点的序列就可以很 容易地恢复为: 5' Nl N2 N3 N4 N5 3' 的结构。
■ 通过步骤 3的描述可以知道, 外源序列 F在功能上具备的特征中, 应包 括在插入点周围的目标序列上制造潜在的 C位点, 同时也拥有按设计要求自 我删除的能力。 在结构上, 这两个方面的功能的实现, 可以用多种分子生物 学手段,而具有代表性的 F的结构特点是: 5 ' (N) nl SRE1 (N) n2 SRE2 (N) n3 SRE3 (N) n4 3, , 其中 SRE1和 SRE2可以是同一 SRE的识别位点, 而 SRE3 的作用则是制造潜在的 C位点。
显然, 依靠和步骤 2和步骤 3类似的机制,在将 F' 导入目标序列并将 F 删除之后, 就可以在此将 , 导入基因组, 具备和 F类似的功能特征, 当然, 在 SRE的选择上, 不能和 F中含有的 SRE1和 SRE2重复。
步骤 5: 将 F, 删除
通过以上的步骤 1至步骤 5的程序中不同 C位点的逐步跳跃, 就可以达 到实验需要的 N位点。 通常情况下, 可以利用常规的分子生物学手段, 筛选 初始插入位点接近 N位点, 当然, 如果位点较远, 可以在步骤 5之后, 不断 重复步骤 4和步骤 5。 , 最后达到将外源序列插入 N位点的目的。
第二大步骤: 对插入位点及其周围的序列进行修饰或者利用 N位点的插 入进行其它类型的操作。
对目标序列的修饰, 大体可以分为两种情形考虑:
第一种情况, 是在目标序列中只有建立一个插入序列。 这样, 对 N位点 及其周围序列的修饰, 就可以利用 SRE的不同设计进行, 例如可以利用将目 标序列中 N位点上的 F连带周围的部分序列一道删除, 然后再将含有突变序 列的片段连进目标序列中。 当然, 这只是多种可行的办法中的一种。
第二种情况, 可以在目标序列中建立一个以上的插入序列。 这里以在目 标序列中建立两个插入点为例。事实上, 可以用三种方式建立多个插入位点。 一是在以上跳跃的过程中, 将上一级的 F位点保留, 其二是在不同的位置分 别建立起始插入点, 然后分别向某一个共同的区域跳跃; 其三是利用同一个 插入起始点, 分别完成向上游和下游两个方向跳跃。 很明显, 通过两个位点 的建立, 就可以对它们所在位置的一定范围内的序列, 非常方便的进行修饰。 而在众多可能的辅助这种修饰的手段中, 比较方便的方式, 可以结合利用插 入的不同 F片段带有的 SRE特异识别位点, 将包括插入的外源序列在内的序 列删除, 然后将含突变位点的序列片段导入。
除对目标序列的修饰外, 也可以利用以上插入点, 对目标序列中任意位 置任意长度的片段进行克隆。 例如, 利用一个或者两个插入点, 就可以将该 点周围或者两个插入点之间及周围的序列, 精确地克隆出来。 由于克隆本身 不需要目标序列中的任何特殊结构的存在, 因而这里的特定长度的目标序列 片段的克隆方法, 可以被用于不同来源的目标序列的特定长度片段的克隆。 而这些被克隆出来的片段, 则可以用作进一步的研究。
通过以上的概要描述, 这里介绍了本发明所提供的基因操作方法的一般 原理。 值得再次强调的是, 由于本发明的具体实施将涉及多种变化形式, 而 为描述的方便, 以上的说明中基本是通过一个概略和简化的方式进行的。 在
后续的描述中, 将对本发明的原理及其应用做具体的说明。 本发明的实现, 其最基本的原理可以分为三步, 如图 2所示: 第一步: 确定目标序列,再根据目标序列和具体的研究需要,确定外源序列 F;第二步: 将外源序列 F导入目标序列; 这里外源序列的导入, 可以用任何合适的办法, 包括分子生物学, 生物化学, 甚至物理或者化学意义上的任意对具体的研究 需要合适的办法;第三步: SRE识别位于外源序列中相应的特异识别位点, 同 时对特异识别位点以外的序列或者结构发生修饰作用, 而这个修饰作用, 也 可以按研究的需要, 在设计上最终使其对落在插入点两端的目标序列进行直 接或者间接的修饰, 即 C点落在目标序列的一个或者一个以上的位置或者区 域。 图 2中, R负责对外源序列中含有的相应的特异识别序列或者结构进行 识别, 同时又将在 C的作用下, 在相应的位置上, 对特异识别位点以外的序 列进行直接或者间接的修饰。 而后续的实验, 将在此基础上进行。
图 2仅显示了在目标序列中间插入一个外源序列, 同时外源序列中又只 含有一个识别位点的情形。 事实上本发明提供的方法有如下的特点: 第一, 本发明可以对一个或者一个以上的目标序列进行操作; 第二, 外源序列在目 标序列中的插入位置, 可以按具体研究的需要插入在目标序列的两端或者两 端之间的任意区域; 第三, 在同一目标序列中, 可以含有一个以上的外源序 列; 第四, 每一个外源序列中也可以含有一个或者一个以上的与相同的或者 不同的 SRE对应的特异识别位点, 而当出现一个以上的特异识别位点时, 不 同的位点可以是同源的即可以被同一 SRE所识别, 当然也可以是不同源的即 分别为不同的 SRE所识别; 第五, 和外源序列中的一个识别位点结合的 SRE, 可以作用于识别点以外的一个或者一个以上的位置或者区域,即同一 SRE中 C 对应的催化功能, 也可以作用于一个以上的位置或者区域。
就外源序列而言, 其所包含的和 R对应的特异识别位点, 可以是序列本 身为基础组成的结构, 例如某种酶的特异识别位点、 也可以是附于序列上的 其它结构例如经过 BIOTIN等;但优选的情况下, 外源序列中和 R相对应的识 别位点, 是序列本身为基础形成的结构、 也包含被修饰的序列结构; 在更优 选的情况下, 外源序列中被 R识别的识别位点, 是酶的特异识别位点;
在优选的条件下, 本发明所说的 SRE相关的识别催化体系是一种能识别 外源序列中相应的特异识别位点、 同时又可以对识别位点之外的序列或者结 构进行修饰的酶; 在更优选的情况下, 本发明所说的识别和催化体系, 是可 以识别外源序列中的特异序列结构、 同时又能对被识别的序列结构以外包括
与其与外周的界面上的序列或者结构的一个或者一个以上的催化作用亚点位 置进行修饰的酶, 这将包括一类特殊的限制性内切酶 (restriction endonuclease)或者具备限制性内切酶特征的酶。 识别和催化体系的催化作 用, 既可以是直接的作用, 也可以是间接的作用;例如, 如果实验的目的是产 生双链断裂,那么就既可以利用限制性内切酶的功能,也可以间接由 nicking endonuclease来实现, 比如, 可以通过含有 N. Alw I特异识别位点的双链 DNA上制造单链缺刻, 然后在利用其它的酶的功能制造双链断裂。
限制性内切酶(Dryden et al, 2001 ; Noreen et al, 2000 ; Li et al 1993) 及其含有的其它参考文献)在分子生物学领域有非常广泛的应用。 一般情况 下, 限制性内切酶有两个方面功能, 即对相应特异序列的识别功能和酶作用 功能。 本发明中, 为进一步描述的方便, 则将限制性内切酶分为两大类型: 第一类: 酶的特异识别序列和酶的催化作用位点重叠的限制性内切酶, 即在 酶的特异识别序列中包含了酶切的位点,例如常用的 EcoRI, Hind III, PvuII 等等; 第二类: 酶的特异识别序列和酶催化作用的位点部分或者完全分离的 限制性内切酶; 即特异的识别序列在一个位置上、 而酶催化作用位点或者酶 的催化作用亚点则部分或者完全落在决定酶的特异性的特异识别序列之外, 例如 Bae I, BbV I, Beg I, BsrDI, Sau3AI等。 这里定义的第二类限制性内 切酶, 将在本发明中有重要的应用。 本发明所说的识别和催化体系, 即包括 了这里定义的自然出现的或者人工制造的第二类限制性内切酶, 在此后的描 述中, 将主要以这样的一些识别和催化体系为例来进行说明, 这些识别和催 化体系是上面所说的自然出现的或者人工制造的广义的第二类限制性内切 酶, 其特征是: 在功能上包含两个部分, 即特异序列或者特异结构的识别部 分以及催化酶切部分, 当其发挥作用时, 其相应的特异识别序列和酶催化作 用位点是部分或者完全分离的, 不过, 当特异性的识别位点被确定以后, 其 酶作用的方式和位点也可以预期, 因此可以通过能被该酶所识别的特异位点 的位置来确定酶的作用方式和作用位点, 此后的描述将把这一类人工制造或 者自然出现的由本发明定义的第二类限制性内切酶标记为特殊的限制性内切 酶,即 SRE,而与 SRE相对应的特异识别序列或者特异识别结构称为 SRE位点, 而在本发明的图示中, 通常也将 SRE位点直接标记为 SRE; 另一方面, 将与 SRE及 SRE位点对应的酶作用位点称为 SRE作用位点;但就概念的完整性来讲, 本发明完整定义的 SRE,除了以上的定义内容外,还包括任意满足以下条件的 具备限制性内切酶功能的特点的体系,这些特点是: 1 )功能上包括两个部分, 其中一个部分负责对特异识别序列或者特异识别结构的识别, 另一个部分则
负责在特异识别序列或者识别结构之外的一个或者一个以上的位置上行使内 切酶的功能; 2)这里 1 ) 中说的能被识别的对象, 即可以是特异的核酸序列 结构, 也可以是其它的和核酸序列结合在一起的特异结构, 也可以是由核酸 序列以及结合在核酸序列上的结构共同构成的被识别的结构; 3 )当和特异的 被识别的结构结合以后, 该体系的内切酶催化功能则部分或者完全作用于被 识别结构之外的位置上, 即至少有一个催化作用位点中的一个亚点落在特异 识别位点之外的位置上; 4)酶催化功能发生作用的具体方式可以预期; 而酶 的作用的具体位置可以是一个或者一个以上的位点, 也可以是一个或者一个 以上的位置区间即作用在一定的序列范围之内; 5)所说的内切酶功能, 既包 括制造单链缺刻和 /或降解、 也包括制造双链断裂和 /或降解。 本发明在此后 的描述中, 除非特别说明, 将是指这里所说的完整定义的 SRE而言的, 其相 应的特异识别位点是指完整定义的 SRE特异识别位点, 与完整定义的 SRE特 异识别位点对应的识别和催化体系, 则是完整定义的 SRE体系。
优选的情况下, 根据以上的描述和约定, 本发明此后的描述, 除非特别 的说明,则将主要在这样的基础上进行: 1 )目标序列是以上所说的核酸序列, 它可以是自然来源的或者人工合成的核酸序列, 也可以是经过修饰的自然或 者人工合成的核酸序列, 甚至可以是任意具备 RNA或者 DNA性质的序列; 也 包括任意可以转变成这里所说的几种序列的序列; 2 )外源序列是含有至少一 个完整定义的 SRE位点, 它至少构成相应的识别和催化体系的特异识别序列 的一个部分; 3 )外源序列可以在 RNA或者 DNA的水平上整合进目标序列; 4) 与特异识别位点相对应的识别和催化体系是完整定义的 SRE体系; 5 ) SRE体 系对其特异识别位点以外的序列或者结构的修饰的实施, 主要在 DNA的水平 上进行。 但值得再次强调的是, 做出这样的约定, 只是为了描述的方便和清 晰, 并不能构成对本发明及其应用的任何形式的限制。
在以上描述和约定的基础上, 本发明提供的方法, 其基本的原理的实施 过程是这样的(图 3) : 1 ) 目标序列是 DNA分子; 2)外源序列含有一个或者 —个以上的 SRE位点, 图 3所示有两个 SRE位点; 这两个 SRE位点, 可以是 同一 SRE体系的识别位点, 也可以是不同 SRE体系的识别位点; 3 )外源序列 对插入后的目标序列的修饰, 依赖 SRE体系所具有的直接或者间接的内切酶 的功能, 包括直接或者间接的缺刻功能等; 由于在多数情况下, 当 SRE体系 的识别位点确定以后, 其 SRE作用方式或 /和作用位点也随之确定, 因此, 利 用 SRE体系对目标序列的修饰, 就可以预期并掌握。
如图 3的示意中, 本发明不限制外源序列在目标序列形成插入的具体途
径, 事实上, 可以利用任意分子生物学甚至化学手段将外源序列整合到目标 序列中去。 可以运用到本发明中的一些常规的手段包括: 利用酶切点插入,
PCR合成, 不同的定点突变的方式, 随机突变的方式插入,物理的手段, 化学 合成等等, 但不同的插入手段, 通常会导致在插入点的外源序列和目标序列 形成的界面序列的一些变化, 对这些变化的处理方式, 将通过下面利用本发 明提供的原理对目标序列的不同的修饰目的中得到详细的说明。
本发明在以上原理和定义以及约定的基础上, 可以利用外源序列对目标 序列进行多种操作, 不过, 这里需要强调指出的是, 虽然为描述的简便, 本 发明在后续的说明中将本发明的一些实施过程分为不同的操作, 但这些不同 的部分, 都应被视做一个整体, 它们在原理上和概念上, 都是相互联系相互 支持的整体, 所以, 不应将它们分割开来。
操作一: 对目标序列的序列结构的改变
优选的条件下, 依赖外源序列对目标序列的序列结构进行的修饰, 是在 DNA的水平上进行的。 这一操作的目的是改变目标序列的序列结构。
显然, 目标序列可以是位于任何遗传载体上的任意 DNA片段。 但为描述 的方便,这类假定目标序列是一段被克隆到常规质粒(plasmid)载体上的 DNA 片段, 图 4的示意中标为基因 A。显然,这种假设不应构成对本发明构成任何 限制。从前文的描述中还可以知道, 外源序列(标为 F)可以以任何形式、在 任何阶段引入目标序列。 这里仅以外源序列是在 DNA水平上被引入为例来说 明, 但这显然也不构成对本发明的限制, 例如外源序列完全可以在 RNA的水 平上被引入, 然后再转化成 DNA进行 DNA水平的操作。 以下是对操作过程的 详细说明 (图 4、 图 5、 图 6) :
步骤一: 外源序列在 DNA水平上的引入
' 如前所述, 不同水平上将外源序列引入目标序列的办法很多。 本发明在 这里提供的, 是在 DNA水平上将外源序列引入目标序列的几种方法。 在图 4 的示意中, 本发明提供的方法是: 在潜在的外源序列的插入位点区域, 制造 缺刻或者断裂并将其修饰成适宜作连接反应的末端, 然后在将在所得到的含 有合适末端的产物与外源序列间做常规意义上的 DNA连接反应。 在多种可以 用来在目标序列中制造双链断裂的方法中, 本发明在这里提供两个依赖引物 的 DNA聚合反应的途径:
1 )单引物法: 如图 4所示, 可以根据潜在的外源序列的插入位点, 设计 合适的引物, 然后利用合适的 DNA聚合酶进行链延伸反应, 最后相当于在目 标序列的相应位置上制造了一个缺刻 (nick) 。
在优选的条件下, 这里所用的引物和 /或 DNA聚合酶,可以保证聚合反应 不具备链置换的功能, §P: 当从引物开始的 DNA链延伸反应围绕环型模板反 应到引物的 5' 端的时,反应将不再继续,这样所得的新合成的 DM链和模板 一起, 就构成了一个含有一个缺刻的环形双螺旋分子; 这里所用的引物, 可 以是常规意义上的 DNA引物, 也可以是一些在一个或者一个以上的核苷酸位 置上经过修饰的引物, 这里所说的修饰方式包括以下几种形式中的一种或者 多种: 其一是不完全匹配的引物, 即引物与其模板对应的区域并不完全匹配, 在引物中包含有错配, 插入(insertion)或者缺失(deletion); 其二引物制 备过程中加入特殊的修饰核糖核酸单体, 例如含有 Uracil, 8-oxohguanine 的引物等; 其三是经过其它类型的化学修饰的引物, 例如在引物上序列的某 些位置附加 DNA adduct修饰基团等; 利用这些特殊的修饰和一些能识别这些 特殊的修饰的酶, 如识别错配插入或者缺失的 T7 endonuclease I, 和具有类 似功能的识别 dUMP, abasic site位点的 endonuclease IV, endonuclease V 等, 同时借助其它的具备核酸内切酶和 /或核酸外切酶的作用, 就可以在引物 区域及其对应的模板的相应位置上, 制备一个以上的缺刻乃至下面将要提到 的双链断裂。
在含缺刻的含有目标序列的载体 DNA分子准备好以后, 可以进一步以缺 刻为基础将其转化成断裂, 即将含缺刻的双链 DNA转化成线性双链; 利用缺 刻制备双链断裂的途径很多, 这也和前面使用的引物是否被修饰有关, 这里 分几种情况: 其一, 如果是未经修饰的引物, 则形成简单缺刻, 这种情况下, 就可以利用一些可以在单链缺刻的基础上制造双链断裂的酶例如 T7 endonuclease I和 /或 Nuclease BAL-31等的有限度的作用, 或者其它任何具 备类似功能的酶的作用, 将单链缺刻变成双链的断裂; 其二, 如果是经过特 殊修饰的引物, 则可以根据对引物所作的修饰的性质来确定制备线性 DNA的 程序; 例如, 对于不完全匹配的引物, 则可以借助多种识别错配、 缺失、 插 入并以直接或者间接的方式介导在被识别的位置制造缺刻或者断裂的体系, 例如多种含有 endonuclease功能和 /或 exonuclease功能的体系等, 优选的 情况下, 可以选择 Nuclease BAL- 31, T7 endonuclease I两者中的一种或者 它们的组合; 而对在引物中含有特殊的核糖核酸单体的情况, 除了能够特异 识别的这些特殊单体的酶如 endonuclease V等外, 也可以先用相应的酶来降 角早, 例如 Uracil - DNA Glycosylase (UDG) , formamidopyrimidine (f apy) -DNA Glycosylase (Fpg或者 hOGGl ) 等,然后在利用含有 endonuclease功能 以 及 exonuclease功能的体系等来将载体线性化, 优选的情况下, 也可以选择
Nuclease BAL- 31, T7 endonuclease I两者中的一种或者它们的组合来进行; 而对于其它类型的经过化学修饰的引物, 则需要根据不同的修饰方式来确定 帮助使载体线性化的方式。
在利用引物在目标 DNA制备缺刻的方法中, 作为一种选择, 还可以直接 用引物(Oligo)本身来进行, 而无需经过 DNA聚合酶介导延伸反应。 本发明 为此提供的方式是: 如图 6所示, 在潜在 '的外源序列的插入区域, 设计并制 备常规的引物或者经过修饰的引物, 再通过变性和退火过程使引物和其在目 标序列上的互补序列结合, 这样就在引物结合区形成了一个特殊的结构, 在 三明治的结构形成以后,再在分别根据不同的情况实现使双链线性化的过程: 其一, 如果是未经修饰的引物, 就可以利用一些可以在特殊结构的基础上制 造双链断裂的酶例如 T4 endonuclease VII、 T7 endonuclease I、 endonuclease V、 Nuclease BAL- 31等的有限度的作用, 或者其它任何具备类 似功能的酶的作用, 制造单链缺刻乃至双链的断裂; 其二, 如果是经过特殊 修饰的引物, 则可以根据对引物所作的修饰的性质来确定制备线性 DNA的程 序; 例如, 对于不完全匹配的引物, 则可以借助多种识别错配、 缺失、 插入 并以直接或者间接的方式介导在被识别的位置制造缺刻或者断裂的体系, 例 如多种含有 endonuclease功能和 /或 exonuclease功能的体系等, 优选的情 况下,可以选择 T4 endonuclease VII、 endonuclease V、 Nuclease BAL- 31,、 T7 endonuclease I中的一种或者它们的任意组合; 而对在引物中含有特殊的 核糖核酸单体的情况, 则可以先用相应的酶来降解, 例如 Uracil- DNA
Glycosylase (UDG) , f ormamidopyrimidine (f apy) -DNA Glycosylase (Fpg ^者 hOGGl ) 等, 然后再利用含有 endonuclease功能 以及 exonuclease功 能的体系等来将载体线性化, 优选的情况下, 也可以选择 T4 endonuclease VII、 Nuclease Bal- 31、 T7 endonuclease I中的一种或者它们的任意组合进 行操作。 而对于其它类型的经过化学修饰的引物, 则需要根据不同的修饰方 式来确定帮助使载体线性化的方式, 由于不需要进行延伸反应, 本发明在这 里的化学修饰的引物的选择的范围就比较大, 即任意能和引物区的序列稳定 杂交的分子都可以考虑, 例如 PNA等。 在获得双链断裂之后, 就可以借助一 些常规的手段, 将双链的末端修饰到适合为后面的外源序列的插入。
2)双引物法或者 PCR法: 如图 5所示, 在潜在的外源序列的插入区域, 设计 PCR引物, 这样经过聚合酶扩增后就可以得到一个线性双链产物则相当 于制造了一个断裂, 而将 PCR产物和外源序列连接, 就可以将外源序列插入 目标序列中去。 作为一种选择, 也可以以常规的分子生物学技巧, 通过引物
的特殊设计及其相应的修饰手段使得最终的 PCR产物含有不同的末端, 以利 于后续的外源序列的插入。
显然, 不论是以上的单引物法还是双弓 I物法, 显然在制备缺刻乃至断裂 的具体方法中, 有可能在插入外源序列的同时, 导致目标序列的删除、插入、 突变等多种变化, 但在后面的描述中将会看到, 在本发明中, 这些改变都是 可以容忍的。
步骤二: 将外源序列和以上制备的断裂的含有目标序列的载体连接起 来。
经过以上所说的单引物法和双引物法, 就可以获得线性 DNA; 当然, 任 何其它的可以从环性双链 DNA制备线性 DNA的方法, 也可以被用于本发明, 例如, 如果在潜在的引物区存在适当的限制性内切酶的位点, 则完全可以被 利用起来。
总之,不论以何种方式得到的在潜在的引物区断裂的(或者线性的) DNA, 都可以在后续的步骤中, 利用常规的分子生物学连接反应, 将外源序列整合 到目标序列中去。
作为一种选择, 也可以在以上的 PCR反应中, 将外源序列的全部或者一 部分, 作为引物的尾(TAG)设计到引物中间去, 而当外源序列全部都设计到 引物中的时候, 则可以将经过多聚酶链反应得到的产物自连, 这样就可以得 到含有外源序列的目标序列; 当然, 如果利用引物的设计带入 PCR产物的是 外源序列的一部分, 则可以将 PCR产物和外源序列的另一部分构成的 DNA片 段连接起来。 然而, 无论是那种情况, 由于所有的相关方法最后得到的产物 都是在目标序列中整合有外源序列的载体, 因此, 在后面的描述中, 将不再 对不同的途径加以特别的强调。
本发明中, 也可以利用以上的方法, 经过一次以上的操作, 将一个以上 的外源序列插入同一个目标序列中去。
当然, 以上描述的只是将外源序列引入目标序列的诸多方法中的几种。 事实上, 其它的所有可以将外源序列引入目标序列的方法, 都可以被用到本 发明中来,例如,现在已经开发成功的可以在体外的系统使用的转座子系统, 例如, Tn5, Tn7, Mu, HImar, Tyl等 (Goryshin IY, Jendrisak J, Hoffman LM, Meis R, Reznikoff WS. Insertional transposon mutagenesis by electroporation of released Tn5 transposition complexes. Nat
Biotechnol 2000 Jan ; 18 (1) : 97-100 ) 。
本发明中, 可以在同一目标序列中引入一个以上的相同或者不同的外源
序列, 其具体的途径, 可以是相关方法中同一手段的重复利用, 或者不同手 段的综合使用。
步骤三: 利用插入的外源序列, 修饰目标序列的序列结构
利用外源序列对目标序列进行修饰, 将依赖外源序列的特点。
如图 7所示意, 作为一种选择, 可以在外源序列中附加识别信号或者附 加一个筛选基因的表达单位, 其功能是为外源序列在目标序列中的插入提供 正向的或者负向的筛选和 /或指示信号。这里的基因表达单位含有保证在特定 体系中保证其所含有基因序列的转录和表达的基本结构, 即转录启动子, 基 因序列, 转录终止信号。 优选的情况下, 这里的筛选或者指示信号是一个在 受体菌内提供通过表达直接或者间接的颜色反应或者药物筛选信号的蛋白编 码基因, 例如荧光蛋白的编码基因, b- gal, 药物抗性基因等; 一般情况下, 外源序列中含有的筛选基因的表达产物, 应该区别与目标序列所在的载体所 能表达的基因产物。 这样, 当外源序列中有筛选信号的表达单位存在时, 就 意味着整合有外源序列的目标序列获得了同样的筛选信号的表达单位, 而这 个信号将会在受体菌内为成功的连接反应提供筛选信号,而在优选的条件下, 当这个信号是不同于母载体的药物筛选信号时, 例如可以提供载体所缺乏的 表达 ampicilin抗性基如 beta- lactamase基因或者 kanamycin抗性基因的能 力时, 那么就为外源序列和含有目标序列的载体之间的成功的连接提供了很 好的在受体菌内进行药物筛选指标。
图 8所示, 是利用外源序列中的筛选信号的一个例子, 但显然这是为了 对本发明的一个具体的说明,所以不构成对本发明的任何形式的限制。在图 8 中,假定目标序列是位于一个含有抗氨变青霉素基因(即图示的 p- R)的质 粒载体里, 而被引进的外源序列则含有了一个抗 kanamycin蛋白基因 (图示 中的 kan- R)的表达单位,而作为一种选择,这里的较长的外源序列的部分或 者全部都可以预先放置在一个备用载体中, 再根据具体的实验过程, 将外源 序列释放出来, 其释放的手段也根据具体实施过程不同而选择, 只要这些手 段满足后续的将完整的外源序列克隆到目标序列中去即可, 这里提供可能选 择中的几种如限制性酶切, PCR, 不同的重组机制如转座子插入等等; 而同样 作为一种选择, 可以在图 8所示的 Kan- R的两侧放置不同的 SRE位点, 优选 的情况下, 是将可以被同一种 SRE体系识别的 SRE位点, 同时置于图 8所示 中的 kan- R的两侧, 但 SRE的酶特异识别位点 (R位点)则分别指向如图 8 所示意的 kan-R的外侧,例如,可以将 5' —— SRE1 Kan- R SRE1—— 3, 的辯 ¼殳计成: 5, —— GMGAGC—— Kan-R—— GCTCTTC ~~ 3^ 的形式, 如果将这
样的两个可以被同一种 SRE体系识别的两个 SRE位点看作一个 SRE对,那么, 也可以在图 8所示的 Kan-R的两侧, 同时设计一个以上的 SRE对, 以在不同 的具体实验中, 满足对不同的 SRE位点的需要; 当外源序列插入载体中的目 标序列后, 就可以被通过常规的技术转化合适的受体菌中去, 而由于外源序 列中含有的抗 kanamycin基因的表达单位的存在, 所以 kanamycin就成了一 个筛选载体中含有外源序列的阳性克隆的信号; 当然, 如前所说, 任何合适 的筛选信号, 只要可以用来做实验要求的阳性克隆的筛选, 都可以被用到本 发明中来。
这里利用图 9和图 10来说明本发明所提供的利用外源序列对目标序列的 序列结构进行修饰的一般程序;但值得强调的是, 图 9和图 10的说明中的若 干假定和设计, 只是为了说明本发明, 显然不构成对本发明在原理或者设计 上的任何限制; 这里描述的具体的程序如下:
假定本例中的实验目的, 是将一段目标序列中的 A和 B序列分别或者同 时修饰成 A ' 和 B' 。
1, 按照前面的描述, 在目标序列中导入外源序列, 图 9中是外源序列
Fl 0 这里需特别指出的是: 在利用不同的方法将外源序列导入目标序列的过 程中, 最后有可能在插入位置上, 外源序列和目标序列的界面发生若干的序 列结构的改变, 而根据引入外源序列的方法的不同, 将可以出现序列丢失、 插入或者复制等变化, 对这些可能发生的变化, 如果是不能预期的, 也基本 都可以利用基因测序或者其它常规的分子生物学手段迸行检测, 因此不会使 后续实验中的 C位点的确定发生困难;而作为本发明提供的方法的优势之一, 只要将这些变化涵盖在后续步骤所描述的两个 C识别位点之间, 就不会对本 发明的实施产生任何影响。
在外源序列 F1中, 含有两个 SRE的识别位点(图中用 SRE指示), 它们 被相应的 SRE识别后,其相应的 C作用位点分别落在 A和 B的两侧,即 A和 B 位点涵盖在两个 C作用位点之间。 与这两个 SRE的识别位点相对应的 SRE体 系, 可以是相同的, 也可以不同; 例如, 当两个位点分别是 5' CATCC3' 和 5' CATCC3' 时, 就可以同时被 Fok l识别。 当然, 在一些特殊的情况下, 可 以用一个 SRE位点及其相应的 SRE体系, 就可以对两侧同时进行作用, 例如, 在特殊的外源序列的设计中, 内切酶 BsaX I就可以同时作用上游和下游两个 位点;
2, 利用相应的 SRE的酶作用, 分别作用于两个 C识别位点, 当 SRE具备 直接或者间接的内切酶功能时, 则落在 C位点之间的部分, 包括目标序列上
的 A和 B之间的序列和外源序列将可以被完全删除;
3, 在两个 C位点之间, 插入修饰序列, 而对目标序列的任何需要的修饰 都可以通过经过相应设计的修饰片段引入。显然,无论是对 A位点, B位点还 是同时对 A和 B进行修饰, 只需要对将相应的位点包括在两个 C位点之间, 则就可以将按照任意设计的要求, 改变目标序列的序列结构。 显然, 从这里 可以看到: 对于前面的步骤中, 由于外源序列的插入导致的对目标序列的改 变, 只要设法使得这些改变最终被包含在两个 C识别位点之间, 那么就不会 对本发明的实施产生任何影响。
如前所说, 这里只是利用图 9及图 10对本发明的原理的进行说明,从图 9及其相关的说明可以知道,这里所能提供的方法,事实上可以对目标序列中 位于任意4、 B两点之间的序列进行任意修饰, 其具体的途径是: 只要将 A、 B 两点包含在两个 C作用位点之间, 那么, 所需要的序列修饰、 包括各种形式 的点突变、 插入突变、 缺失突变等, 或者其它类型的结修饰, 只要它们对修 饰序列的整合过程不发生影响, 都可以被引入,目标序列中去。 本发明为在同 一区域的多种不同形式的突变, 提供了一个全新的手段。
通过以上的描述可以知道, 本发明提供的方法, 可以对 SRE的两个 C作 用位点之间的序列进行修饰, 图 9、 图 10及其相关的描述, 只是对发明原理 的一般描述, 在具体的应用中, 也可以利用具体的目标序列上的某些特点来 辅助本发明的实施, 例如, 除了可以目标序列中含有的内切酶位点引入外源 序列外, 如图 10所示, 还可以利用这些位点辅助本发明的实施: 即在图 10 的条件下,利用在 A位点的上游存在一个合适的内切酶位点(图中标为 RE), 那么在外源序列的设计中, 只需要设计一个 SRE位点就可以实现本发明, 即 利用 RE和 SRE的共同作用来完成,所以,借助一些其它的常规的分子生物学 方面的技巧, 本发明的实现将变得非常灵活, 不过, 由于这些技巧是常规性 质的, 本发明就不在一一叙述了, 但显然这些常规的意义上的分子生物学技 巧, 不能被视作是本发明的例外。
对于不同的目标序列和不同的研究要求而言, 虽然基本的原理相同, 但 有时需要本发明的具体实施方案作必要的变化, 这里将提供的, 是几种可以 根据具体的情况选择的在实施方案中的变化形式:
第一, 在一些情况下, 由于所使用的在目标序列中导入外源序列的手段 的限制, 例如当外源序列是由 Tn7或其它类似的转座子系统导入的情况下, 就可能在外源序列的末端留下较长的末端; 这些末端序列长度的限制, 就会 进而对合适的 SRE的选择产生限制,如图 11所示,如果实验所用的 SRE体系,
其特异 R识别位点和 C作用位点的距离过短, 无法跨过这些末端序列而达到 目标序列的位置上, 作为克服这些末端的选择之一, 是可以利用外源序列和 目标序列中的内切酶位点包括利用 SRE的特异识别位点, 将这些长末端缩短 或者消除,但作为一种更为一般的选择, 本发明还可以利用逐步蚕食的办法: 即利用外源序列中的 SRE特异识别位点, 将 SRE的 C作用位点之间的序列删 除, 再将新的外源序列 F2引入; 如果有必要, 这里的删除和引入步骤可以重 复进行, 直到待修饰的位点落入引入的外源序列中两个 SRE的 C作用位点之 间就可以了。 这里提供的方法, 可以经过适当的改变, 就可以分别针对一侧 的长末端序列进行部分或者全部删除, 而在单侧删除的情况下, 作为一种选 择, 也可以利用外源序列或者目标序列中的合适的内切酶位点辅助本发明的 实施, 但由于这些相关的变化只设计常规意义的分子生物学技巧, 所以不在 赘述, 但显然这不能构成对本发明的限制。 事实上, 这里提供的方法, 不但 可以用于对外源序列中的长末端的删除, 当外源序列的插入位点距离待突变 的位点较远时, 这里的方法显然也可以用于对外源序列的插入点周围的目标 序列的片段的删除, 从而使待突变位点涵盖在 C作用位点可及的距离之内。
第二, 利用一个以上的外源序列对目标序列进行修饰。 如本发明前文提 及, 本发明中可以在目标序列中插入一个以上的外源序列, 这里就是一个以 上的外源序列的具体的应用形式。如图 12所示: 在目标序列中分别或者同时 引入两个外源序列, 如图所示是 F1A和 F1B, F1A和 FIB中含有的 SRE的识别 位点, 可以被同一种 SRE体系或者不同的 SRE体系所识别; 在 F1A和 F1B引 入之后,则就可以对图示中的两个 C作用位点之间的序列进行任意的修饰了。 显然, 针对一个以上的外源序列的插入, 虽然以上所说的关于外源序列的设 计和应用的原理是一致的, 但针对具体的应用, 还是可以用一些常规分子生 物学意义上的变化, 例如, 在多数情况下, F1A和 F1B分别只需要一个 SRE 识别位点即可。
本发明中, 显然根据不同的研究需要, 在同样的原理下, 外源序列的设 计方式将有很大的变化。 作为一种选择, 本发明提供一种可以实现自我删除 的外源序列的方式。 本发明中具备自我删除功能的外源序列, 是这样的一类 外源序列, 其含有的 SRE特异识别序列的位置, 能保证在相应的 SRE体系的 作用下, 外源序列可以全部删除, 同时使得目标序列完全恢复为外源序列插 入以前的状态。这里用图 13做具体的说明: 首先是具备自我删除功能的外源 序列的形成。 可自我删除的外源序列可以是在最初的插入过程中直接形成, 也可以是分步骤形成的: 例如可以在一般意义上的外源序列的基础上, 通过
序列变换获得可自我删除的外源序列。
假定在图案 13所示的外源序列, 其结构是: 5,
(N) nl— SRE— (N) n2— SRE— (N) n3 3 ' , 即按 DNA的正链的 5' 到 3' 的方向, 为(N) nl, 代表含有 nl个碱基对的 DM序列, (N) n2, 代表含有 n2个碱基对 的 DNA序列, 余类推; 而 SRE代表一个可以被相应的 SRE体系识别的特异识 别位点, (N) n2, 代表含有 n2个碱基对的 DNA序列, 其后的 SRE则代表了另 一个可以被相应的 SRE体系识别的特异识别位点; 前后两个 SRE的特异识别 位点可以相同也可以不同, 可以被相同的 SRE体系识别也可以被不同的 SRE 体系识别; 而 (N) n3则代表了含有 n3个碱基对的 DNA序列; 这里除了 SRE特 异识别位点, 其它的位置上, 可以是任意在长度上满足要求的 DNA序列, 其 中包括其它的 SRE体系的特异识别位点。 显然, 将外源序列的结构做这样的 设计, 纯粹是为了描述的简便, 其并不能被看成是对在本发明原理下所可能 出现的多种不同形式的外源序列设计方式的任何限制。
在图 13、 图 14、 图 15所示意的设计中, 外源序列插入目标序列之后, 其两个相应的 SRE体系的催化作用位点, 则刚好落在外源序列和目标序列的 界面或者左右的位置上, 其特征是: 利用相应的 SRE体系的作用之后, 留下 末端, 可以经过适当的后续手段, 将原来的目标序列完全恢复; 例如, 在图 13的示意中, 外源序列最后插入到目标序列的 5, Nl N2 N3 N4 N5 N6 N7 N8 N9 N10 3' 区域; 那么, 在相应的 SRE体系的作用下, 外源序列被删除, 而 同时能够保证利用一些后续的手段使得插入前 5' Nl N2 N3 N4 N5 N6 N7 N8 N9 N10 3' 序列能够得到完全恢复。
为进一步说明具备自我删除功能的外源序列,这里用图 14中的一个具体 的例子来说明, 但显然本例所做的任何假设, 不应认为是对本发明的限制。 图 14的示意中,外源序列的正链的结构为, 5端至 3' 端的顺序: ^ 的0 序列, CATCC, (N) n2可以是任意长度的 DNA序列, GGATG, 9 的0 序列; 该外源序列被插入到目标序列 M的下游, 但插入的同时又形成了一个
N2N3N4N5的复制; 这样, 当插入体系在限制性内切酶 Fok I的作用下, 就可 以将外源序列删除, 而接着只需要一个简单的粘性末端的连接反应, 就可以 将使原来的插入点周围的目标序列得到恢复。
在本发明中, 即使对同一性质的插入, 由于具体的目标序列和外源序列 的情况的不同, 以及后续手段中可以使用的手段的多样, 可删除性的外源序 列的具体形态也可以不同, 例如, 在图 14所示的可删除的外源序列, 也可以 形成图 15中所示意的模式, gp: 同样的外源序列结构,插入到目标序列的 M
的下游, 但并没有造成 N2N3N4N5的复制, 这样, 在 Fokl的作用下, 如果将 后续的手段变成: 用合适的聚合酶将 Fok I的作用后留下的粘性末端补齐, 那么, 连接后也可以使目标序列得到完全的恢复。
当然, 如前所述, 图 13、 图 14、 图 15中所示的只是外源序列的结构中 的一种, 即使对于自我删除的外源序列而言, 也可以是在其它的合适的酶体 系特别是限制性内切酶体系的帮助下, 将插入目标序列的外源序列删除并能 保证在有后续的手段使目标序列得到完全的恢复, 总之, 是任意外源序列的 设计, 只要保证在必要的时候, 外源序列被删除的同时原来的目标序列能得 到完全恢复, 则就可以被用到本发明中来。 而作为一种选择, 而在一些情况 下, 可能出现只需对插入点一侧的目标序列进行恢复, 在这些情况下的 实验要求中, 只需要在外源序列被删除的同时和 /或在后续的步骤中, 目标序 列中位于外源序列的插入点的 5' 端的上游的一侧或者; 端的下游的一侧 的目标序列的序列结构被恢复, 但对与其相对的另一侧的目标序列的序列结 构是否被恢复并不对实验产生影响, 对于在这些情况下, 相对于以上的具备 完全的自我删除的外源序列, 这里就形成了单侧自我删除的序列, 例如如果 只需要对图 13所示意的插入点的上游或者下游的一侧的序列进行恢复, 那 么, 相应的在图 14和图 15的 B和 C后两种情形下, 则需要在设计上做出相 应的变化, 分别关注插入的外源序列两侧的目标序列的恢复就可以了。 在本 发明的描述中, 具备自我表现删除功能的外源序列通常和具备完全自我表现 删除功能的外源序列在概念上是一致的, 但它们和具备单侧自我删除功能的 外源序列在概念上有区别。
在本发明中, 具备自我删除功能的序列的重要应用之一, 就是形成一种 新的改变目标序列的序列结构的方法, 如图 16所示, 例如需要在任意涵盖两 点之间的序列进行任意突变, 则就可以分别在用两个具备自我删除功能的外 源序列, 这里定义为 SF1和 SF2, 图 16中只是示意了 SF1和 SF2的若干可能 的结构形式的一种,而 SF1和 SF2的具体序列结构本身也可以相同或者不同, 其中所含有的 SRE体系及其识别位点, 也可以相同也可以不同; 显然, 在图 16和图 17的示意中, SF1和 SF2涵盖了 A和 B两点的范围, 所以, 可以利用 SF1和 SF2上所含有的特殊位点, 例如限制性内切酶位点、 或者如图 17是利 用 SF1、 SF2和 SF3中特殊的定点定向的重组酶位点或者任意具备位点特异的 重组功能的酶 (site-specific recombinase) 的识别位点即 IS (Gorman C, Bullock C. Site-specific gene targeting for gene expression in eukaryotes. Curr Opin Biotechnol. 2000 Oct ; 11 (5) : 455-60 ; Andreas et
al 2002, Current Opinion in Biotechnology 1994, 5 : 521 - 527), 在同一 外源序列中, 可以含有一个或者一个以上的相同的或者不同的 IS位点; 这里 的重组酶包括任何野生型或者突变型的可以在两个相应的特异的识别位点间 删除或者进行其它类型重组的酶,其包括的范围, Hin家族的重组酶 (the hin family of recombinase) ,例如, hin, bin, pin, and cin (Feng et al, 1994, Science, 263 : 348-355), Lambda家族的重组酶, (the Lambda integrase family) , Flp- recombinase, Cre- recombinase, TN916 transposons, the resolvase family (例如 TN21 resolvase等等,所有能 进行序列特异的重组的酶及其突变形式, 当然也可以是其他具备类似功能的 酶;而重组酶的识别位点也包含以上酶的自然识别序列和为特殊重组目的的 突变后的识别序列,即该序列可以是野生型的 IS,也可以是突变型的 IS,在 优选的情况下, IS是可以被野生型或者突变型的 Cre recombinase识别的序 列(LoxP) ,或者被野生型或考突变型的 Flp recombinase识别的序列 (FRT) 等等, 当然, 也可以是任意其它的具备类似的定点重组功能的酶或者体系; 不过以下为描述的方便;图 17中的不同具备完全自我删除功能的外源序列中 的位点特异的重组机制对应的识别位点分别标为 IS1, IS2, IS3,例如它们是 野生型或者突变性的 Cre recombinase或者 Flp recombinase的识别位点等, 在更优选的情况下,是禾 'J用 RMCE即 recombianse mediated cassette exchange 的方法来帮助实现序列置换(Baer et al, 2001 ; Lauth M et al 2002); 作 为一种选择, 可以将这些帮助进行序列置换的位点置于 SF1和 SF2和 SF3各 自的 (N) n2区域,当然也可以是其它任意不影响 SF1或 SF2或者 SF3自我删除 的外源序列的特点的机制, 很方便的对 SF1和 SF2和 SF3之间的序列进行置 换;在优选的条件下,还可以在 SF1和 /或 SF2和 /或 SF3的 (N) n2区域或者其 它任意在操作过程中不影响 SF1或 SF2或 SF3自我删除的外源序列的特点的 机制的区域, 附加合适的筛选信号例如可以在分子克隆的意义上帮助鉴定重 组的发生的药物筛选信号等等, 那么, 就会使序列的置换变得非常容易, 这 样, 只要在序列置换后, 分别将 SF1和 SF2和 SF3删除, 那么, 就可以完成 实验所需要的序列结构的改变。 显然, 可以在同一个目标序列中, 插入两个 以上的任意数量的外源序列, 则对任意外源序列之间的目标序列的置换就会 变得非常容易实现。 图 16和图 17所示意的方法的原理, 为大规模的序列置 换提供了一个新的方法。
显然, 本发明在这里提供的原理, 可以为多种形式的对目标序列的修饰 提供了一个全新的方法, 而将这种方法和其它的技术结合, 则可以为多种不
同目的的研究, 提供技术手段。 举例来说, 本发明这里即提供一种锁定抗原 决定簇的途径, 其具体的实施途径是:
1, 假定待检测的抗原分子是蛋白分子, 这里称为蛋白 A, 当然, 也可以 是其它任意形式的抗原, 以下仅用待检测的抗原分子是蛋白分子来说明, 但 这并不构成对本发明的任何形式的限制; 那么, 这里首先建立一种可以标记 蛋白 A的方法, 优选的情况下, 可以将蛋白 A的基因编码框架和其它可以通 过直接或者间接的方法观察的蛋白表达框架融合起来形成融合基因, 优选的 情况下, 可以用蛋白 A和荧光蛋白例如绿色荧光蛋白 (GFP)的表达框架融合 起来, 这样, 在后续的实验中, 对融合蛋白的观察就等同于对蛋白 A的观察。 为描述的简便, 在以上的步骤中, 将主要以蛋白 A和 GFP的融合来说明;
2,从经过人工或者自然条件下的蛋白 A免疫的动物或者人的血液中收集 T淋巴细胞或者 B淋巴细胞, 然后, 用以上融合蛋白, 本例中是蛋白 A和 GFP 的融合蛋白进行标记; 并通过流式细胞仪或者其它的手段将被标记的细胞筛 选出来;
3 ,将 2中的阳性细胞收集,并取单个细胞, 当然,根据具体的实验要求, 也可以是一个以上的细胞; 这里的细胞样品或者其提取物将直接用于 RT- PCR 反应, 或者 PCR反应, 并将细胞内的抗原受体或者抗体基因克隆到合适的载 体中; 一般情况下, 由于 T细胞受体或者 B细胞表达的抗体分子, 都是由两 个 mRNA分子的表达产物组装起来的, 因此, 需要针对同一样品, 同时将两个 mRNA分子和 /或相应的基因组扩增出来;而对应的 RT- PCR反应和 /或 PCR反应, 既可以在同一个反应试管中完成, 也可以在不同的反应管中完成; 这里的 RT - PCR和 /或 PCR产物, 可以被克隆到合适的载体中去; 例如对于 RT- PCR产 物而言, 则可以被克隆到合适的表达载体中去; 同样由于 T细胞受体或者 B 细胞表达的抗体分子是由两个 mRNA分子的表达产物组装起来的,所以, 无论 是用于原核表达的载体中, 还是用于真核表达的载体中, 优选的情况下, 都 可以将这两个基因置于同一启动子的控制之下, 即利用原核的 S- D序列, 或 者真核的 IRES等来获得能够实现多顺反子表达;
4,将以上得到的含有被克隆的基因的载体置于合适的体系中表达; 优选 的条件下, 是将真核表达载体转到相应的真核表达体系中例如体外培养的动 物细胞系如 CH0细胞中; 然后再利用蛋白 A和 GFP的融合分子, 确定表达产 物的特异性;
5, 利用本发明在前面提供的对目标序列进行修饰的技术, 当然也可以是 其它类似的技术,制备蛋白 A的系列突变,然后利用突变基因的表达产物和 4
中表达的 T细胞受体和 /或 Β细胞表达的抗体分子进行结合试验,而抗原决定 簇也可以通过不同的突变基因的表达产物和 TCR和 /或 Β细胞表达的抗体之间 的结合能力被确定;
显然, 以上提供的, 也是一种快速克隆 Β细胞内表达针对特定抗原的抗 体的方法, 显然, 只要将以上蛋白 Α换成和细胞的特征性表面分子结合的分 子, 那么, 这个方法, 也就可以被用于对任意表达能与该分子通过直接或者 间接的方式结合的产物的细胞的克隆, 更进一步, 本发明在这里提供的对任 意目标序列进行修饰的方法, 则又为针对任意基因及其表达产物的结构和功 能的研究, 提供了有用的手段。
操作二: 外源序列在目标序列中的跳跃或者移动
将本发明提供的在目标序列中插入外源序列、 以及在此基础上形成的具 备自我删除功能的外源序列等综合在一起, 可以形成一种使得外源序列在目 标序列中作自由的跳跃、 或者是定点移动的方法, 即可以通过跳跃式样的移 动方式, 在目标序列的任何一个位置插入外源序列。 外源序列在目标序列中 的跳跃, 即是需要利用外源序列本身的一些设计上的变化, 以实现外源序列 在目标序列中的定点移动。
本发明提供的外源序列的跳跃的基本原理是:
首先通过不同的方式在目标序列中建立具备完全自我删除功能的外源序 列,这个外源序列的特征是: 1,可以在一定的机制的作用下使其被完全删除, 即在其被删除后, 其所在插入点的目标序列得到完全的恢复; 这里所说的机 制,既可以是利用前面描述的具备完全自我删除特点的外源序列相关的机制, 也可以是其它任意能满足外源序列的彻底删除以及目标序列的完全恢复的机 制; 2, 除了具备完全自我删除的特征外, 还含有至少一个 SRE相关的特异识 别位点, 而与该识别位点对应的 SRE体系中至少一个催化作用位点、 或者至 少是一个催化作用位点的一个亚点、 能够作用于外源序列之外的目标序列中 的某个位置上; 本发明将这里描述的这样一来的 SRE体系, 称为跳跃 SRE或 者 J- SRE;当这里所说的外源序列含有一个以上的类似的跳跃 SRE位点时,则 可以被用来作不同方向例如外源序列的上游的目标序列、 或者外源序列下游 的目标序列, 当然, 不同的跳跃式的 SRE位点, 也可以服务于不同的跳跃距 离; 不过, 为了描述的简便, 这里仅用外源序列中含有一个跳跃 SRE对应的 特异识别序列的情况来说明; 但显然这不能被认为是对本发明的限制;
其次, 在以上建立的含有跳跃 SRE的特异识别位点的外源序列建立好以 后, 则可以在相应的 SRE体系的作用下, 在对应处于目标序列的某个位置上
形成第二个外源序列的插入点, 这样, 第二个外源序列就可以整合进目标序 列; 而当第二个外源序列建立好以后, 如果有必要, 第一个外源序列就可以 被删除了。
第三, 如果以上第二个外源序列同样是具备完全自我删除功能的外源序 列、 并含有至少一个跳跃式 SRE的特异识别位点, 那么, 就可以在第二个外 源序列的基础上实现第二次跳跃: 即在第二个外源序列的跳跃 SRE体系所对 应的位于目标序列中的催化作用位点的基础上,插入第三个外源序列; 当然, 当目标序列中的第三个外源序列建立好之后,第二个目标序列就可以被删除; 显然, 这样的跳跃过程还可以重复迸行。
以上描述的是本发明提供的外源序列在目标序列中实现跳跃的一般原 理, 依据同样的原理, 针对具体的目标序列和研究目的的不同, 其外源序列 的设计方式以及具体的跳跃方式, 也会呈现不同的形态。 以下, 通过图 18图 和图 19的示意则对此做进一步的说明,但这里在图 18和图 19的示意中所显 示的具体的设计, 只代表各种可能设计方式的一种, 因此, 图 18和图 19的 示意本身不应被看成是对本发明的限制。
在以下的描述中, 图 18所示, 是对外源序列在目标序列中的跳跃过程的 一个具体的设计形式下的说明:
为说明的方便, 这里假定第一级外源序列是具有完全的自我删除功能的 外源序列 SF1, 其结构是: 按 5' 至 3' 的顺序为:
(N) nl— SRE— (N) n2— SRE— (N) n30值得再次强调的是, 这里的关于外源序列 的结构的假设, 只是为了说明的方便, 所以并不能被认为是本发明的任何形 式的限制; 显然, 在这里的 SF1的结构中, 在不影响 SF1的完全自我删除的 功能的前提下, (N) n3可以是任意的序列,所以在图 18的设计中,则在 (N) n3 的区域,放置另一个 SRE3的特异识别位点,图中就用 SRE3代替,这里的 SRE3 就是第一级外源序列中的跳跃 SRE即 J- SRE; 在这种情况下, 图 18中的 SF1 的结构就变成了: 按 5' 至 3' 的顺序为:
(N) nl— SRE— (N) n2— SRE— (N) n3a— SRE3— (N) n3b , 显然, 只要选择合适的 SRE3以及调整 (N) n3a和 (N) n3b之间的长度分配,那么, 就可以在不改变 SF1 的完全自我删除功能的前提下,利用 SRE3的内切酶作用于目标序列中的某个 特定的位置上, 并在该位置上插入一个新的外源序列; 在图 18中, 这个过程 是这样实现的- 第一步: 在将 SF1通过适当的途径插入目标序列之后, SF1可以是直接 插入形成的,也可以是在首先形成一个插入后在通过不同的修饰手段形成的;
这里利用 SRE3的外切酶活性,作用于目标序列的某个点 C3上, 而 C3的具体 作用位置则靠调节 (N) n3b的长度来实现, 例如, 如果特异的识别序列和 C3 之间的距离是 16bp, 而设计要求的 C位点为 SF3之后的 10 bp, 显然只要使 得 (N) n3b的长度等于 6bp就可以了;
第二步, 在 C3对应的位置插入 SF2; 作为一种选择, SRE3还可以继续被 设计到 SF2中来, 但这里为保证后续的删除的实验的进行, SRE3体系不能和 SF1拥有的自我删除机制发生冲突;
第三步, 利用 SF1的自我删除将 SF1去删除。
以上的跳跃和删除步骤可以连续进行, 即如果在一次跳跃后不能到达预 期的位置, 则可以做连续的跳跃, 直到到达预期的位置为止。 显然, 在本例 所示的跳跃过程中, 唯一的要求是后一级的 SF中所含有的 SRE相关的机制, 不能和前一级的 SF的自我删除机制冲突, 否则, 当次一级的外源序列被成功 整合进目标序列后, 就会在后续阶段中的删除前一级的外源序列的同时, 对 次一级的外源序列发生影响; 不过作为另一种选择, 本发明中也提供了一个 避免出现这个问题的方法, 如图 19所示: 可以在外源序列中的合适位置上设 计相应的机制, 通常是设计一些特异的限制性内切酶的位点即图 19中的 RE, 其作用是可以介导相应的机制例如酶切的作用, 将所在外源序列中所有可能 对后续步骤发生干扰的 SRE相关的特异识别序列或者其它任意序列删除, 这 样, 当次一级的外源序列插入到目标序列中后, 可以首先将前一级外源序列 中发生干扰的序列删除, 显然, 除非出现非常特殊的情形, 一般这样的删除 都会留下残余序列, 所以通常还不构成完整的外源序列的自我删除, 但前一 级外源序列对后续的外源序列的干扰则暂时解除了; 而连续跳跃过程中出现 的所有的外源序列也可以釆用相同的形式避免互相干扰, 只要避免这些潜在 干扰位点的删除机制不相互重复就可以了; 而对遗留下来的残余序列的彻底 刪除, 则可以在各级跳跃完成后, 分别利用和干扰删除相同的机制, 例如相 同的内切酶位点, 当然也可以是其它任意满足要求的位点, 插入一段序列, 只要这些位点和序列能帮助将残余序列恢复到具备完全自我删除功能的外源 序列的特征就可以了, 这样, 就可以逐个利用就残余序列恢复成完全删除序 列的办法, 对遗留下的序列进行彻底的删除。
同样是作为一种选择, 还可以在以上的帮助实现连续跳跃的各级外源序 列中, 加入至少一个特殊的可以提供筛选信号的序列和结构,优选的情况下, 这些筛选信号是可以在和载体所对应的受体菌中表达抗药物基因的表达单 位, 显然, 筛选可以加在外源序列中任意不影响跳跃功能和自我删除的区域,
例如, 当外源序列是图 18和图 19所示的
(N) nl— SRE— (N) n2— SRE— (N) n3a— SRE3— (N) n3b的结构时, 通常 (N) n2就 是一个潜在的可以加入筛选信号的区域。
以上是本发明提供的关于外源序列在目标序列中实现连续的跳跃的基本 原理及对基本原理的说明, 事实上, 由于在以上的连续跳跃过程中, 每一级 的外源序列的在特定位置的插入形成后, 它其后的命运除了最终被完全删除 夕 h 也可以被保留甚至进一步修饰从而在目标序列中形成稳定的插入点, 当 然, 对于那些需要最终形成稳定的插入位点, 其所对应的外源序列就不一定 需要具备自我删除的功能, 同时, 对在连续跳跃过程中最后一个插入到目标 序列中的插入序列, 其具体的序列特征则完全由具体的研究目的来确定, 例 如, 如果如图 18所示的 SF1需要保留时, 则其序列结构的特征, 跳跃 SRE的 功能则是必需的, 但完全自我删除的功能就是可以选择的, 当然, 在经过后 面的连续的跳跃过程中, 任何一个需要最终保留的插入点的外源序列, 都是 遇到类似的情形。 因此, 这里提供的依赖外源基因的跳动在目标序列的任意 位置插入外源序列或者进行其它类型的修饰的方法, 可以立刻用来在目标序 列的任意两点或者多个位点上插入外源序列, 当然, 利用本发明提供的原理, 外源序列的跳跃过程, 也可以分别从一个以上的插入位置分别幵始。
显然利用外源序列在目标序列中的跳跃, 可以将插入的位点控制在目标 序列的任意两点之间; 和本发明在其它方面的应用一样, 由于外源序列的跳 跃本身不对目标序列有任何特殊的要求, 因此, 这里提供的方法, 显然可以 被应用于任意的随机序列。如图 20所示, 是利用另一种跳跃方式在目标序列 的两个点之间形成的插入, 其具体的步骤如下:
第一步: 在目标序列中揷入外源序列 Fl。 F1可以被任意合适的方式加入 到目标序列中去, 其位置可在目标序列的任意位置上, 包括目标序列的上游 末端和下游末端; 在 F1中, 含有一个 SRE1的特异识别位点; 当然, 在 SRE1 特异的识别位点的下游, 还 (N)nl, 其功能之一是调节和 SRE1对应的酶作用 位点 C1落在目标序列中的位置;
第二步, 利用 SEK1的作用, 在目标序列的 C1位置, 制造一个插入点; 第三步, 在第二步制造的插入点上, 插入外源序列 F2; 这里在外源序列 F中分别含有一个和 SRE1和 SRE2对应的特异识别位点, 其中, SRE1相对应 的酶切位点落在 F2下游与目标序列的界面附近, 其功能是保证后续步骤中, 在 SRE1的作用下, F2能够被完全删除; 当然, 在本发明的设计中, 外源序列 F2中的 SRE1的特异识别位点也可以被另一个可以发挥类似作用的 SRE的特异
识别序列所取代; 这里的 F2中的 SRE2特异识别序列相对应的酶作用位点则 可以落在 C2的位置上;
第四步, 利用和 F2中的 SRE2特异识别位点对应的酶作用, 在目标序列 的 C2位置, 制造一个插入点;
第五步, 在第四步制造的插入点上, 插入外源序列 F3;
第六步, 再次用 SRE1作用, 此时将会有两个 SRE1的特异识别序列, 一 个由 F1提供, 显然其相应的酶作用位点是在 F2接近 F1的那一端,而另一个 SRE1的特异识别位点是在 F2中间, 如前所言, 其在外源序列中的设计方式, 将保证其相对应的酶作用位点落在 F2远离 F1的下游端; 当然如果在外源序 列 F2中含有的是另一个替代 SRE1特异识别功能的 SRE特异识别序列的, 这 里则需要 SRE1和该替代的 SRE共同的作用;这样,外源序列 F2将可以在 SRE1 的作用下被删除; 当然, 在本发明的设计中
第七步, 利用合适的后续手段, 将有 SRE1作用下留下的两个末端连接, 将序列完全恢复为 F2插入前的目标序列。
显然, 这里提供的是另一种利用在跳跃的过程中恢复完全删除某个步骤 引入的外源序列, 并将相应的插入点的目标序列完全恢复的手段。
操作三: 利用外源序列在目标序列中的插入、 跳跃或者移动对目标序列 的任意特征的序列进行研究
显然, 本发明提供的方法, 可以用于对任意目标序列的任意位点间的序 列的操作, 而除了对任意两个位点间的序列进行各种形式的修饰外, 也可以 对任意设定的两个位点间的序列进行其它形式的操作, 例如克隆及其它结构 和功能的研究等。 由于本发明提供的方法, 并不一定需要依赖目标序列的具 体的序列特征来实现, 因此, 本发明的适用范围, 将不但是已知序列的目标 序列, 也包括了未知序列的目标序列。 以下通过就本发明在目标序列的任意 点间的克隆做一个描述, 显然这里的描述是在前面的所有的关于本发明的描 述的基础上进行的。
显然本发明提供的方法,为对任意序列的任意两点之间的序列进行操作, 提供了一个有力的手段。 以下将用一些具体的设计, 对本发明提供的方法做 进一步的说明, 同样, 在这些具体的说明中的所做的某些假设, 并不能被认 为是对本发明的任何形式的限制。
对目标序列的任意两点间的序列的克隆, 可以按以下的途径进行, 这里 为了描述的清晰, 将用从目标序列中克隆相距 21个 bp的两点间的序列为例 进行具体的说明:
首先, 第一级外源序列的导入。
如前所述, 外源序列在目标序列中的插入的方式可以有多种选择, 而每 一种选择则完全根据研究的目的甚至研究人员的个人取向来决定,在本例中, 由于研究的目的是将目标序列中任意相距一定距离的片段克隆出来, 所以, 只要将外源序列以随机的方式插入目标序列就可以了; 而仅就外源序列在目 标序列中的随机插入而言, 可以选择的方式可以很多, 即可以在 RNA的反转 录的水平上进行, 也可以在获得单链和双链过程中的不同的阶段进行; 在本 例中, 则选择用带有随机引物区的引物来实现, 显然, 这个方式只是若干可 能的方式中的一种, 显然并不意味这是对本发明的限制。
如图 21所示, 假定目标序列来自信息 R A来源的 cDNA上, 当然, 也可 以是其它来源的 DNA序列中, 在任意两个相隔 21bp的位置上, 建立两个插入 点; 这里在以上所描述的发明原理上的基础形成的具体的实施过程, 如图 21 所示- 步骤 1 : 假定对象是某个细胞表达的信息 RNA分子, 则可以用多种方法 制备 mRNA库;
步骤 2: 单链的 cDNA可以通过常用的含有多聚 dT的引物来合成, 当然, 也可以通过其它的方式合成互补的 DNA链;
步骤 3 : 利用含有随机序列的引物来获得双链 DNA;
这里的上游引物 Primer 1的结构是: Primer 1 : 5 ' (primer V ) cagctgggatg (N) n=9 3 '
即下游引物的结构是: 按从 5 ' 端至 3 ' 端的顺序, 依次是: 一个次级引 物区即 primer 所在的区域, 中间一段是 5 ' CAGCTGGGATG 3 ' 的序列, 其中含有的 5 ' CAGCTG3 ' 对应一个潜在的 Pvu II的特异识别位点, 而含 有的 5' GGATG 3 ' 则对应了一个属于 SRE类型的限制性内切酶 Fok I的特异 识别位点; 紧随其后的是一段随机序列, 这里设计了 9 bp的随机序列, 当然 在不同引物设计中, 根据不同需要, 也可以改变随机序列的长度; 另一方面, 这里的随机序列也可以为一些部分随机的序列所取代, 例如当需要对具有特 别的序列特征的片段进行克隆时,则就可以通过对上游引物的序列来做限制; 这里的下游引物的结构是: Primer 2 : 5, (Primer 2, ) oligo (dT) 23VN 3,
即上游引物的结构是: 按 5 , 至 3, 的顺序, 依次为: 一个次级引物区即 primer 2 ' 所在的区域, 紧接着多聚 dT区域, 这里的设计是含有 23个 dT的 长度; 紧接着的是 VN, 其中 V代表 A或 C或者 G中的任意一个, 而 N则如在
本发明其它地方用到的一样, 代表 A或者 G或者 C或者 T中的任意一个; 显然, 借助这两个引物和其中所含有的次级引物区的帮助, 就可以利用 被广泛使用的 PCR手段, 克隆到不同长度的 DNA片段, 其中的一端对应于原 来的信息 RNA链的任意位置上, 而另一端则对应于信息 RNA的下游端;
步骤 4: 以上得到的 PCR产物, 可以克隆到合适的载体中去, 在该载体 中, 应该允许本例中的后续实验中所要求的不同的内切酶的操作。
第二: 第二级外源序列的导入
这里可能含有两个步骤, 即如果预期的第二级的外源序列的插入点在第 一级外源序列所含有的 SRE体系的作用范围内, 则可以直接将第二级外源序 列引入; 但如果预期的第二级外源序列插入位点不能立刻由第一级外源序列 所含有的 SRE体系直接达到, 则需要经过一个或者一个以上的利用具备自我 删除功能的外源序列进行的中间的跳跃阶段。在图 21的具体示中, 则设计了 这个利用具备完全自我删除功能的外源序列进行的中间的跳跃阶段。
在第一级的外源序列导入之后, 这里就需要按实验要求再导入第二级外 源序列。在本例的具体实施过程中, 显然, 经过步骤 1至步骤 4, 则相当于将 第一级外源序列插进了目标序列中; 而在图 21所示的具体例子中, 由于 PCR 的产物最终被克隆到了合适的载体中去, 那么, 这里的外源序列就: 1, 既可 能是预先设计到上游引物中的序列; 2, 也可能是设计在载体中的用作 PCR产 物克隆位点的位于 PCR产物的上游引物区一侧的载体序列; 3, 或者是上游引 物区和载体上的序列共同构成的序列; 4, 通过对含有上述 PCR产物的载体进 行修饰获得的序列。如前所言, 由于上游引物可以从任意的位置开始, 那么, 最终的产物就相当于以随机的方式将第一级外源序列插入到目标序列中去, 或者至少是确定了第一级外源序列的插入位置。在图 21的示意的例子的情况 下, 则对相当于利用本发明在前面的描述中提供的使外源序列进行自我修饰 以接近目标点的方法, 对第一级外源序列的插入位置的 PCR产物上游端的序 列进行了修饰, 这样可以方便后续实验的进行。
步骤 5: 对步骤 4中得到的处于载体中的 PCR产物, 用 Fokl和 PvuII分 步进行酶切, 然后再用聚合酶例如大片段酶将留下的末端补齐, 其效果即是- 将上游引物区属于包含有 Fokl和随机引物的序列删除; 这样在后续的步骤 中, 则再将一个连接子引进来;
步骤 6: 通过常规韋义的连接反应, 将含有 5 ' GGATGAG 3' 的序列引 入, 则就在该位置制造了一个新的 Fok I位点;
步骤 7: 利用 Fok I的作用, 将在目标序列的片段上形成一个断裂, 位
置相当于正链的第七和第八个碱基之间、 以及另一条链的第十一和第十二碱 基之间, 这样就留下了一个 5' 端突出的粘性末端;
步骤 8: 利用合适的聚合酶例如大片段聚合酶, 将以上留下的末端补齐, 这样就相当于距离第一级外源序列的插入点之后的第十一和第十二位的碱基 之间, 制造了一个平端的缺刻, 但同时也制造了一小段重复序列;
步骤 9: 在以上位置上, 插入一段外源序列, 显然, 在优选的情况下, 这是一级具备完全自我删除特征的外源序列; 作为一种选择, 这里的外源序 列的序列结构是: 5, (N) n (还是 N? 图 21中为 N) GGATGNGTGCAG 3' , 其中含有两个 SRE的特异位点, 即 Fok I和 Bsg I的特异识别位点;
步骤 10: 利用 Bsg I的酶切作用, 则可以在目标序列上形成一个新的断 裂, 其位置在相当于原来的距第一级外源序列的插入点的正链的第二十一和 第二十二碱基之间、 以及在另一条链的第十九和第二十碱基之间; Bsg I的酶 切反应在这里留下一个 3' 端突出的粘性末端;
步骤 11 : 在以上步骤 10形成的断裂处插入新的外源序列,即相当于是以 上所说的一定长度的目标序列的另一端插入第二级外源序列, 当然, 由于这 里是一个; 端突出的粘性末端,所以,作为第二级外源序列, 必须在其设计 中将原来的末端修复; 通常情况下, 对于那些已经知道序列结构的末端, 这 一类型的修复相对比较容易, 但在未知序列特征的情况下, 这种类型的修复 就相对困难一些, 在众多可能的修复方法中, 作为一个选择, 对类似的情况, 这里提供一个方法是: 制备含有不同的末端的插入序列, 例如在本例的焴况 下, 就可能含有十六个可能的末端, 那么, 就可以在末端序列的设计中, 将 这些所有可能的十六种末端都包括迸去,而含有不同末端的第二级外源序列, 就可以合并或者分别放在不同的反应试管中; 当然, 如果需要对某一种特别 的末端做选择,例如研究目的只需要选择含有 AG的末端, 则也可以通过外源 序列中末端的设计来达到目的; 当然, 即使对于同样的研究目的, 也可以利 用本发明提供的原理, 形成不同的设计方式, 例如可以将上一级具备完整的 自我删除功能的外源的序列结构改为 5' (N) n (还是 N? 图 21中为 N) GGATGNGTGCAG3' , 则就可以将 Bsg I的酶切位置向下游推动两个碱基对, 这 样, 只要利用合适的酶体系的核酸外切酶的功能, 就可以将其突出的两个碱 基消除。显然, 如前所强调的, 由于第二级外源序列将代表一个稳定的插入, 所以, 它的序列结构将完全根据具体研究的需要而确定, 因此不一定需要具 备本发明所说的外源序列的典型特征; 在本例的情况下, 第二级外源序列的 基本功能是在这里将目标序列片段隔开。
步骤 12: 利用 Fok l的酶切作用, 将步骤 9中引进的外源序列删除, 并 将留下的末端连接起来, 这样, 在相应的瑋入点的目标序列的结构就可以被 完全恢复。
第三步: 克隆后的修饰
显然, 在经过以上的步骤之后, 完全可以在任意序列的两个位点插入外 源序列, 并将这些序列克隆出来。在图 21所示意的情况下, 则是将目标序列 即任意从信息 RNA或者其它序列来的序列上, 随机克隆一定长度的片段。 这 些克隆通常都服务于结构或者功能研究的不同的方面, 所以, 针对不同的引 用, 则需要对所得的克隆进行一定的修饰; 本发明在这里提供两个方面常用 的修饰办法, 如图 22的所示意:
其一, 被克隆出来的片段, 通常需要在不同的方面得到应用, 因此, 也 有可能需要被再次克隆到不同的载体环境中去, 在这些情况下, 可能出现需 要改变既有的被克隆的目标序列片段两侧的序列的情况, 在类似的情况下, 如图 22中的 A所示意,则可以利用本发明在前面的描述中提供的各种修饰 DNA 序列的手段, 或者这些手段和其它的常规的手段的结合, 最后得到这样的结 构:在目标序列片段的上游端,即 5' 端,引进一个 SRE相应的特异识别位点, 而这个 SRE对应的酶作用体系的作用点则落在上游外源序列和目标序列的界 面上, 其作用的特征类似本发明在前面的描述中提及的具备单侧删除功能的 外源序列, 即: 该 SRE的作用方式和作用位置, 能保证在后续的步骤中目标 序列片段上游片段序列的完整恢复; 同样, 对下游的序列两言, 也可以用类 似的办法,将下游的外源序列中引入另一个 SRE的特异识别位点,下游的 SRE 体系既可以和上游的 SRE相同但也可以和上游的 SRE不同, 而下游外源序列 含有的 SRE的特异识别序列的特征是: 其对应的酶的作用位点落在目标序列 片段与下游的外源序列合适界面左右适当的位置上, 而该 SRE的作用的方式 和位置, 也能够保证后续的步骤中, 目标序列片段下游的序列结构能够被完 全恢复;
其二, 作为一种选择, 对目标序列中任意两个位点间序列的克隆, 也可 以采取逐步收缩的方式, 如图 22中的 B所示, 即首先克隆一段含有指定位点 的片段或者含有指定长度的目标序列, 然后再利用本发明在前面描述所提供 的手段、当然在必要的情况下也可以借助其它的常规意义的分子生物学手段, 通过一步或者一步以上的操作,利用被克隆片段的上游和 /或下游的外源序列 的设计, 最终使其中所包含的 SRE特异识别位点对应的 SRE体系的酶作用位 点, 落在所需要的位置上, 当然, 根据不同的具体情况, 这样的操作可以是
同时对被克隆序列的两侧或者其中的某一侧进行; 总之, 这样得到的被克隆 出来的, 就对其后的各种后续的操作, 提供了便利的条件, 作为一种选择, 还可以对图 22中的 B所示意的上游和 /或下游外源序列的做进一步的修饰, 例如, 可以根据具体的研究目的, 附加不同的序列结构如酶切点, 特异的重 组位点, 甚至不同的用于体内和 /或体外的表达的序列结构等;
其三, 作为本发明提供的一种选择, 可以在以上的外援序列的插入、 跳 跃乃至克隆的过程中, 可以对具备某些序列特征的序列进行选择, 其具体的 实施办是: 1, 由于 SRE体系的酶功能通常都会在其相应的酶作用位点留下某 种类似的末端, 因此, 当需要对某些具备特殊序列特征的目标序列或者目标 序列片段做选择性操作时, 只要选择合适的设计、 将合适的 SRE体系的酶作 用位点落到这一范围之内, 这样可以得这些将要被选择的序列结构能以直接 或者间接的方式参与这里和 /或后续的、在此酶切位置进行的新的外源序列或 者其它类型的序列的插入过程; 2, 在 1的基础上, 对以上留下的末端进行适 当的修饰, 并使新的外源序列的末端能够在插入的构成中, 或者插入后的形 成的结构中, 使得以上被选择的序列信号能够通过被直接或者间接的手段被 识别出来。例如, 如图 22中的 C所示, 假如一定长度的目标序列被克隆出来 之后, 需要对上游端具备 5' GA3' 特征的目标序列片段进行筛选, 那么, 则 需要找到一个合适的 SRE酶,例如,属于本发明所定义的 SRE的 BpuEI,只要 将 BpuEI的特异识别位点放在上游外源序列的合适的位置上, 以使其酶切位 点落在目标序列片段的上游位置, 并在该位置上的目标序列片段上留下含有 5, TC3' 突出的末端, 然后在该位置插入一个含有相应可以匹配的末端的连 接子或者称为 linker, 那么, 由于其它类型的末端将无法和该连接子发生连 接反应,则只有目标序列片段的上游端含有 5' GA3' 的序列,才能够在后续的 连接反应中被筛选出来, 当然, 这仅是多种可能的筛选含有 5' GA3末端的设 计手段的一种; 另一方面, 对于处于目标序列的任意位置的序列, 都可以利 用这里提供的方法加以筛选;
显然, 在本发明提供的原理的基础上, 可以产生多种不同的灵活的设计 方式, 作为对以上所提供的利用外源序列确定目标序列的任意位置的序列结 构的一个补充, 本发明在这里提供一种检测目标序列的内部序列结构变化的 一种方法; 但值得强调的是, 这里为了描述的方便所做的一些假定, 不能被 认为是对本发明的任何形式的限制; 假定一段目标序列中, 存在一个多态性 的位点, 这里仅标记若干可能的多态性中的一种、例如以 A/T来标志; 那么, 这里提供的检测这一位点的具体实施步骤是-
首先, 需要准备好样品;然后,利用合适的方法,在待测位点的上游(当 然也可以是下游, 或者同时分别从两侧进行测定) , 插入第一级外源序列, 优选的情况下, 这个外源序列只是一个 SRE1位点, 而这个 SRE1特异识别位 点相对应的 SRE体系, 其酶作用位点则落在待检测的位点所在的区域; 同样 如前所言, 这里将外源序列引进目标序列的方法可以是多样的, 只假定是通 过 PCR或者其它的方式, 在上游的合适位置上, 插入一个 SRE的特异识别位 点, 优选的情况下, 可以利用定点突变的方法, 将目标序列的合适位置上的 序列加以改造从而形成需要的 SRE位点; 一般情况下, 对于同一目标序列的 相同的待检测区, 可设计不同的 SRE体系和作用方式, 并对不同设计得到的 结果相互对照;需要检测某个位置上的碱基对是否为 A/T,那么,作为若干可 能的设计中的一种, 就可以选择在该位置的上游的合适的位置上建立一个 SRE1位点, 这里建立的 SRE1位点是 Fokl位点, 则需要在待检测位点上游约 9个碱基对的位置上, 引入 Fokl位点对应的 5' GGATG3' 序列, 显然, 多数 情况下,可以在该位置上的目标序列的固有特征的基础上加以改造就可以了; 作为一种选择, 可以将 SRE1位点设计在待检测位点一侧的引物中, 显然, 这 里含有 SRE1位点的引物, 通常并不和目标序列上对应位置的序列完全一致, 因此可以被认为是突变引物, 但只要被引入的突变不会影响后续的步骤, 就 可以忍受, 例如, 可以让含有 SRE1位点的引物和依据待检测位点的另一侧的 合适位置上的序列设计的引物, 共同作为一对 PCR引物, 来扩增含有待检测 位点的目标序列片段,这种情况下,可以很容易地做到不让含有 SRE1位点的 引物不影响后续的 PCR反应及其对含有待检测位点的目标序列片段的扩增; 当在待检测位点的上游引入 Fokl的特异识别位点 ^ GGATG3' 时, 而这里也 可以分别将该位点设计在距离待检测位点不同的位置上, 以使后续的酶作用 产物中待检测位置的碱基处于粘性末端的不同位置上, 而如前所言, 这样就 可以针对同一带检测位点设计不同的反应以便相互对照和验证; 接着, 利用 第一级外源序列中 SRE1的作用, 将目标序列在待测区域断裂,在本例的情况 下, 则是 Fokl酶切后留下的粘性末端;
事实上, 就对目标序列中的待检测位点而言, 以上即完成了两个任务, 其一, 将合适的外源序列、 优选的条件下, 是 SRE位点, 引入目标序列中待 检测位点一侧的合适的位置上, 可以选择将 SRE1位点设计在一个突变引物 中,并利用后续的 PCR反应实现将 SRE1位点引入待检测位点的上游的合适位 置上的目的; 其二, 利用以上被引入的 SRE1位点对应的 SRE1酶的作用, 对 含有待检测位点的目标序列的片段迸行酶切; 当以上两个任务完成后, 后续
的步骤则是在此基础上对待检测位点上的序列进行检定; 由于前面的工作已 经在待检测区域建立了一个可以供进一步确定序列特征的基础, 后续的步骤 中, 则根据具体的情况有多种不同的设计, 图 23、 图 24的示意中, 也将提供 各种不同的方式中的两种:
—是末端连接法。在以上的 SRE1的酶切作用下, 就会在含有待检测位点 的目标序列区留下不同的末端结构,而在优选的条件下, 可以通过对 SRE1位 点的设计的选择, 使得 SRE1对应的内切酶的作用后, 留下一个粘性末端; 这 里的方法则是通过连接反应及其后续的步骤,将 SRE1作用后留下的末端所包 含的关于目标序列中待检测位点的信息; 这里提供的末端连接法的基本的实 施过程是: 根据 SRE1的酶切的特点, 另外设计具备相应的末端特征的适应子 或者称为 adaptor, 而通过 SRE1酶切后留下的末端能否与某一类的适应子的 末端相配并发生连接反应以及对是否发生连接反应的不同的观测手段, 就可 以判定待检测位点的序列特征; 例如, 当 SRE1位点是 Fokl识别位点时, 其 被引入目标序列后, Fokl的酶切作用,刚好可以在待检测的位置形成一个 5' 单链突出的粘性末端, 即: 突出部分的结构是: 5' T N, 1 N' 2 N, 3 3' , 那么, 只要存在一个适应子, 同时该适应子具备的末端和 SRE1、 即本例的情 况下是 Fokl留下的末端相匹配, 即具备 5' 的单链突出的粘性末端, 其 5' 单链突出的结构是: 5' N3 N2 Nl A 3' , 那么, 在合适的条件下, 这里的 两个末端之间就可以发生连接反应, 而待检测的位点的序列特征则可以通过 后续的手段进行判定; 当然, 作为不同的选择, 也可以通过对上面的步骤中 被引入的 SRE1位点的位置进行调整,以产生其它形式的含有待检测位点的序 列结构信息的末端; 显然, 如果同时设计含有不同的末端的适应子, 那么, 通过对 SRE1酶切后留下的末端与含有不同末端的适应子之间连接效率的观 测,就可以判定目标序列中待检测位点的序列结构的信息; 这里对 SRE1酶切 后留下的末端和适应子含有的末端之间发生的连接反应的观测方式很多, 本 发明在这里提供的几个选择是: 1,通过连接反应发生后的一定长度的产物的 出现来判断; 显然, 只要运用常规的设计技巧, 就可以使得连接反应发生后, 连接体系中由于含有 SRE1作用后留下的末端的目标序列和含有匹配的末端 的适应子之间的连接反应, 就可以得到一个特殊长度的连接产物, 显然, 对 特定长度的; 连接产物的观察, 只需要常规的分子生物学技术; 2, PCR法; 即可以设计一对 PCR引物,其相应的区域分别落在含有 SRE1酶切后留下的末 端的目标序列片段上以及适应子序列上, 这样, 只有以连接产物为模板, 才 能发生预期的 PCR反应, 而 PCR反应的产物的出现, 即是一个观测信号; 3,
使用带有标记物的适应子; 这里的标记物可以利用直接或者间接的方式被观 测, 这样, 当以上所描述的连接反应发生时, 就使得被 SRE1酶切后含有待检 测位点信息的目标序列片段被标记上; 4, 在以上的适应子中设计 SRE2位点, 使其成为第二级外源序列; 显然, 这里第二级外源序列的特点是: 根据 SRE1 在待检测位点留下的粘性末端, 再根据待检测位点的多态性结构的不同, 设 计含有可以匹配的末端的第二级外源序列, 那么, 在不同的可能性中, 只有 含有可以完全匹配的末端的第二级外源序列, 才能得到高效的连接; 而对预 期的连接产物而言, 如果在第二级外源序列中设计一个 SRE2的特异识别位 点,并使得 SRE2体系在连接产物中的酶作用位点落在由目标序列而来的片段 那一侧, 则来自目标序列的片段将被进一步降解, 这样只要设计得当, 就可 以通过特殊长度的片段的出现来判别待测区域的序列特征;
以上对利用本发明研究目标序列中特定区域的序列结构的方法的原理; 显然, 在这个原理的基础上, 可以形成多种不同的具体应用形式, 本发明在 这里再提供一种具备同时处理多个目标序列的应用方法, 如图 23所示意, 这 里的对目标序列的特定位置上的序列特征进行测定的具体的实施途径是:
1, 在目标序列中潜在的检测位点的附近, 插入一段其它序列, 被插入的 其它序列的作用是, 可以为后续的聚合反应提供一个合适的引物区; 在本例 的情况下,假定目标序列是基因组 DNA,那么, 作为一种选择, 就可以通过多 种方法,将基因组 DNA裂解成较小片段的 DM,然后,再在其末端连进一个适 应子, 而这个适应子则可以为后续的步骤提供引物区;
2, 利用 PCR反应, 对含有待检测位点的目标基因序列进行扩增; 这里用 于 PCR反应的两个引物, 一个是特异性的引物, 即图 23所示的 primer 1 : specific primer, 如前面所描述的那样, 这里在特异性引物的序列中的合适 位置上, 制造了一个 SRE1位点; 另一个是对应于适应子所含有序列的引物, 即图 27所示意的 Primer 2 : Universal primer,-依赖这两个引物的 PCR反应, 则可以在扩增含有待检测位点的目标序列的片段的同时, 在距离待检测位点 的合适的位置上, 建立一个 SRE位点;
3,利用 SRE酶对以上 PCR产物进行作用, 并利用前面所描述的后续手段 通过对 SRE酶的作用效率和 /或 SRE作用后留下的末端的特征的检测来确定待 检测位点的序列结构;
以上基本的实施过程, 但通过对这一基本事实过程的改动, 则可以获得 多种不同的应用方法:
1, 将图 23中所示意的 Primer 2 : Universal primer改为针对任意基因
或者基因群的特异性引物, 则就可以将本方法用于对这些基因或者基因群的 特异位点的序列结构的检测;
2, 可以将 primer 1 : specific primer附着在固体表面上, 那么, 只要 在相应的反应体系中加如通用引物, 就可以对多个目标序列进行扩增; 而扩 增产物也因此被留在固体表面, 这样就可以利用前面所描述的多种后续手段 通过对 SRE1作用后留下的末端的特征的检测来间接获得待检测位点的序列 结构的信息。
总之, 在本发明提供的原理的基础上, 可以形成多种不同的应用方法, 由于这些方法通常只涉及常规的分子生物学技巧, 本发明将不再一一描述, 但显然, 这不应构成对本发明的应用的任何形式的限制。
操作四: 在本发明提供的原理的基础上形成一种获得含有被克隆的目标 序列片段及其反向复制的方法
本发明在前面的描述中, 对本发明的原理, 尤其是利用这些原理实现的 外源序列对目标序列中进行的各种修饰进行了说明。 显然, 本发明在基因结 构和功能研究方面的应用是多方面的, 这里将要提供的, 是本发明在另一个 方面的应用, gP : 在目标序列中取得任意长度的序列、 片段, 在优选的情况 下, 目标序列是 DNA,需要在目标序列中取得一定长度的 DNA片段, 并在取得 这些片段后, 通过后续手段, 使被克隆的目标序列片段形成反向复制, 即形 成含有被克隆的目标序列片段的原拷贝和反向复制拷贝的最终产物, 如果在 单链的意义上考虑, 则原拷贝和反向的复制, 就可以在链内形成互补的二级 结构。 现在就本发明在这个方面的应用的具体实施过程进行说明。 显然, 本 发明在前面描述的所有相关的原理或者原则, 都适用与这里的描述, 但是为 了说明的简便, 在以下的描述中, 这里将涉及一些假设, 但显然这里为说明 的简便进行的假设, 并不能构成对本发明的任何限制。 这里的基本实施过程 如图 24所示: 要根据需要准备样品, 如前所言, 这里的目标序列可以是满足 发明定义的任意序列, 但优选的情况下, 则是 RNA或者 DNA序列; 但样品 准备好以后, 则按照前面的描述的多种方法或者它们的综合, 按指定的要求, 将目标序列中的片段克隆出来; 接着, 就是将被克隆片段的制备被成一个同 时含有原来的被克隆的目标序列片段及其反向复制的产物, 即这个产物在单 链的意义上, 同时含有被克隆片段的正义(SENSE)和反义(ANTISENSE)序 列, 所以在合适的条件下可以互补并以内部二级结构的形式形成内部双链。 以下是具体的说明, 为描述的简便, 将假设目标序列是 RNA或者 DNA序列, 实验的目的是在目标序列中克隆一个片段, 并在后续的步骤将之制备成同时
含有原来克隆片段及其反向复制片段的产物; 同时在描述的过程中, 将以针 对一个具体的研究目的, 即在任意序列中克隆长度为 19碱基对的片段, 并将 被克隆出来的片段制备成同时含有被克隆片段及其反向复制的产物, 最后经 过适当的修饰,制备能够表达被克隆的 19个碱基的正义和反以互补的 RNA链; 以下是具体的实施过程:
第一, 根据不同的目标序列和研究目的的不同, 将外源序列插入目标序 列中去, 并将目标序列片段克隆出来, 关于克隆目标片段的具体办法, 已经 在前面的描述中做了详细的描述。 这里只针对以上设定的具体事例, 加一点 说明:
研究的目的是在任意序列中克隆长度为 19碱基对的片段,当然目标序列 可以是任意来源的, 例如 R A或者 DNA, 事实上, 在前面图 21及其相关的描 述中, 已经对类似的情况进行了详细的描述; 对本例所要求的克隆而言, 将 外源序列以随机的方式插入目标序列是关键, 所以, 无论是如图 21借助随机 引物的方法, 还是其它的方法, 都可以被使用; 当然就克隆的具体设计而言, 未知序列的克隆的难度相对大一些, 同时, 如果需要对目标序歹 lj中的被克隆 片段做出某些限制,则需要一些特别的设计,如图 25所示:假定这里和图 21 及其相关的描述中的情形类似, 要求在一个信息 RNA库中克隆具备一定长度 的片段, 在图 25所示的具体研究中的要求是: 从信息 RNA库中克隆 19碱基 长度的基因片段,但其在信息 R A中的位置,必须是接在两个连续的 AA之后; 对这个选择性克隆的情形, 本例中可以采用改变引物设计来达到, 当然即使 在明确利用引物的设计来进行选择性克隆的情况下, 也可能存在多种不同的 方案, 如图 25和图 26所示, 本例中则是首先如图 21所示, 将信息 R A转化 成单链的 cDNA,接下来再利用图 21所示的含有随机区域的引物进行克隆的时 候,将引物 3' 端的序列设计成 5' M 或者 5' AAG3' 或 者 5' AAC3' 或者 5' AAT3 ' , 这些含有不同的末端的引 物可以分别或者共同使用, 以满足不同的实验要求; 显然, 类似的办法, 还 可以用于其它有特殊需要的限制性克隆要求, 例如, 当在某些情形下, 要求 被克隆的 19个碱基长度的信息 RNA片段是紧接在一个 A后面, 那么, 相应的 引物则可以设计成 5' A3' 或者 5' GA3' 或者 5 '
CA3' 或者 5' TA3 ' 等, 再通过这些含有不同的下游末端 的引物进行选择性克隆; 当然, 对特殊的选择过程, 也可以在后续阶段进行, 例如对于本例的从信息 R A中克隆位于两个连续的 M之后的 19个碱基的目 标序列片段而言, 可以首先随机克隆含有 21个碱基的目标序列片段, 然后利
用包括图 22以及至图 23及其相关的描述中所提供的方法, 特别选择被克隆 的目标序列中其上游具有 M的片段, 然后, 如果这两个 AA不需要在最后的 克隆产物出现的话, 还可以利用本发明在前面的描述中提供的方法, 将 M删 除; 同时, 如果将这里的选择性要求更进一步, 即不但要求被克隆的具备 19 个碱基长度的目标序列位于两个连续的 M之后,同时也要求被克隆的目标序 列片段是下游紧接着两个额外的 UU, 那么, 在这种情况下, 可以的选择方案 之一, 可以首先克隆上游含有 M的具备 23个碱基长度的目标序列片段, 然 后, 再利用本发明在其它前面的描述中包括图 22以及至图 23及其相关的描 述中提供的方法,选择性的筛选在上游端含有 AA的同时、又在下游端含有 TT 的目标序列片段; 显然, 用本发明提供的不同方法, 就可以完成本例中不同 长度的片段和 /或含有不同特征的目标序列片段的克隆。
这里为使更清晰地描述本发明在这里提供的方法, 如图 26所示意, 不妨 假定对信息 RNA中的上游位于两个连续的 M后面的 19个碱基长度的片段进 行克隆, 而在获得与信息 RNA互补的单链 DNA后, 则利用引物的设计的不同 来做选择性克隆, 如图 26所示, 本例中所用的引物的下游序列是的 3' 端的 结构是: 5, CTGGAG (N) 1-14 AAB 3' , 这里的 CTGGAG是限制性内 切酶 Bpm I或者 Gsu I 的识别位点, 其后的 (N) 14是一段长度有 14个碱基 的序列, 其下游端即如果将按 5' 至 3' 编号的为 Nl、 N2、 N3、 N3、 N4、 N5、 N6、 N7、 N8、 N9、 N10、 Nil, N12、 N13、 N14, 那么, 如果设置 4个随机区域, 则位置应为 Nll、 N12、 N13、 N14, 当然, 根据不同的研究目的, 可以设计不 同程度的随机区域, 在 (N) 1 14之后, 则是 AAB, 其中 B代表 C或者 G或者 T 中的任意一个; 利用这里的引物, 再经过其它的常规的分子生物手段, 可以 将单链 DNA转化为双链 DNA;作为一种选择,在一些情况下,为避免在这里的 PCR产物中含有其它的图 26所示的上游引物中 SRE位点、 图 26中是其它的 Bpm I或者 Gsu I的识别位点的千扰, 可以利用一些手段, 将图 26所得的双 链产物缩短,例如,可以用识别序列较短的限制性内切酶例如 Rsa l, Alu l等 对这里的双链产物进行切割, 缩小双链产 的长度, 然后, 在本例的条件下, 再用 Not I酶切, 如此就基本可以避免^得的双链产物中含有其它的 SRE位 点对后续步骤的干扰; 无论是釆取那种途径, 这里所得到的双链 DNA产物将 克隆到合适的载体上, 这里所用的载体应该可以允许针对目标序列的各种操 作; 本例中在载体上设置一个对载体而言单一的限制性内切酶 Not I的位点, 这样在 Not I和 Bpm I或者 Gsu I两个酶的分别作用下, 就可以将载体上的 这个限制性内切酶位点到被克隆的目标序列片段的上游端之间的序列完全删
除, 然后再连进一个连接子或者其它任意根据具体的研究目的设计的序列, 当然, 这个新连接进来的序列的末端必须与以上的经酶作用后留下的末端匹 配, 也可以利用这里的连接反应中新连接近来的连接子的末端的设计, 对含 有两个 M的来源于目标序列的序列进行进一步的选择性克隆; 在本例中, 由 于这里的两个连续的 M不需要出现在最终的产物中, 因此,可以在这一阶段 被删除, 其具体的办法可以有多种选择, 这里提供的两种选择是: 一, 将以 上所提及的 5' CTGGAG (N) l-14 AAB 3' 中的 (N) 1-14区域, 除了 其下游端的随机序列外, 可以在其它区域去掉两个碱基, 这样就将 (N〉l - 14 缩短成为 (N) l- 12, 长度为 12个碱基; 而另一个可以选择的办法是, 利用新 连接进来连接子, 在其中的适当位置设计合适的 SRE位点, 使得其酶作用位 点能够保证在后续的步骤中目标序列上游端的两个 AA可以被删除; 总之, 对 于本例的情况, 可以有多种不同的可供选择的手段, 将外源序列插入目标序 列、 在本例的情况下, 是确定将外源序列和待克隆的目标序列片段的一端相 连接; 而在此基础上, 利用本发明在前面的描述中提供的多种办法, 可以通 过外源序列在目标序列中的跳跃等途径, 确定待克隆的目标序列的下游位点 并在其中插入一段根据具体的研究目的设计的序列, 如图 26所示, 则是形成 这样的产物:上游的外侧序列、标记为 5' F, 中间的来自目标序列的 19个碱 基长度的片段, 下游的外侧序列 3' F, 而无论是上游的外侧序列, 还是下游 的外侧序列, 其具体的序列结构则完全由具体的研究目的而设定;
第二, 在已经得到的目标序列片段的基础上, 制备同时含有该目标序列 片段以及它的反向复制的 DNA产物。 本发明在这里提供的方法的一般原理, 如图 27所示意如下:
步骤 1: 通过以上的步骤及其相关的描述可以知道, 利用本发明提供的 方法, 可以不同的途径, 将被克隆的目标序列片段置于任意的序列环境中, 即对于图 26所获得的具备: 上游外侧序列(5' F) --被克隆的目标序列片段 一下游外侧序列 (3' F) 的结构而言, 本发明提供的方法对上游外侧序列和 下游外侧序列的结构并没有任何限制, 这个优势就为针对不同研究目的而进 行的研究提供了优势; 但为了说明的方便, 这里假定后续步骤的起点就是一 段从前面的步骤中获得的产物, 它的结构是: 上游外侧序列 (5' F)一目标 序列片一下游外侧序列(3' F) ; 这里的后续的步骤则在这个基础上进行; 这 里首先在下游外侧序列中以任意方式形成一个双链断裂的末端, 其特征是- 该双链断裂的末端能够保证在后续的步骤中, 被克隆的目标序列片段能够最 终得到保留; 作为一种选择, 可以在下游外侧序列中设计一个可以以直接或
者间接的方式导致下游外侧序列的断裂的点, 在优选的情况下, 这是一个限 制性内切酶的识别位点, 在图 27的示意中标为 RE1, 显然, RE1所具备的特 点是: 与其相对应的酶切作用, 能够产生一个双链断裂, 但这个断裂能够保 证在后续的步骤中, 被克隆的目标序列片段可以得到保留; 但为了本例中说 明的简便, 这里假定 RE1对应的酶作用位点, 落在目标序列片段和下游外侧 序列交界的某个位置上,但显然, RE1对应的酶切作用能够保证在后续的步骤 中, 被克隆的目标序列的片段能够得到保留;
步骤 2: 在以上合适的机制的作用下, 获得一个双链断裂的末端; 在图 27所示意的条件下, 则是在 RE1的作用下获得一个双链断裂的末端;
步骤 3: 根据以上所形成的双链断裂的末端的具体结构的特点, 在末端 位置上, 连迸一个单链发卡形成的末端结构; 该单链发卡形成的结构的特点 是: 如图 27中的单链发卡末端的展开中所示意, 其基本结构含有三个主要区 域即正区(SENSE区) 、 中间的环区、 及反区 (A TISENSE区) , 其中的正区 和反区在序列上有互补, 因而在合适的条件下, 该单链结构就形成了一个内 部互补的二级结构, 最终形成由正链和反链互补形成的发卡区和一个环区共 同构成的单链末端结构, 该结构位于发卡区的一端是开放的双链末端, 而位 于环区的一端则是封闭的, 显然, 对于任意具体的实验而言, 这里的单链发 卡结构的幵放末端的末端特征必须与步骤 2中得到的末端相互匹配即可以在 适当的条件下被连接或者重组起来; 在图 27所示意的具体的例子中,连接或 者重组反应的结果,是形成了一个下游端被单链发卡结构的环区封闭的结构; 步骤 4: 类似步骤 1和步骤 2中的在 3 ' F制造一个双链断裂, 这里需要 在上游外侧序列 5' F制造一个双链断裂, 其特征是: 能够保证在后续的步骤 中, 被克隆的目标序列片段以及在步骤 4中导入的单链发卡来源的结构能够 保留; 通常可以用任意合适的在上游的外侧序列制造双链断裂, 但优选的情 况下, 是用合适的限制性内切酶的位点; 在图 34所示意的具体例中, 是利用 出现在上游外侧序列中的限制性内切酶即图中所示的 RE2, RE2相对应的酶作 用位点落在 5' F中间的某个位置上;
步骤 5: 在步骤 4的所得的产物上, 引入一个开放发卡结构; 该开放发 卡结构的特点是: 由两条核酸单链构成,其中一条单链的 3' 端的部分序列和 另一条链的 5 ' 端的部分序列形成互补, 因此,在合适的条件下,这两条链即 可以依靠互补区的介导形成双链结构, 该双链结构包括了互补区的结构外, 还包括了另一侧的不互补的结构; 显然, 这里由两条部分互补的单链形成的 双链结构中, 互补区一侧就形成了一个相当于正常的线性核酸双链的末端,
因此, 只要互相匹配, 就可以和其它的双链末端间发生连接或者重组反应, 而当该部分互补的双链结构被导入步骤 4中形成的上游末端之后, 就得到一 个性质上等同于一个一条有内部互补区的单链结构, 而和这里的部分互补的 双链结构的非互补区对应的结构区域, 就分别构成了两个合适的引物区; 在 图 31所示意的本例的情况下,则是将两条由部分互补的单链组成的双链结构 通过互补区的末端与步骤 4中得到的产物的上游末端相连,结果形成的产物, 则在性质上等同于一条具备互补区的单链, 而这里的上游末端的两个非互补 区, 在图中被分别标记为 A区和 B区;
步骤 6: 以在步骤 5中引入的非互补区的碱基序列为基础, 分别设计引 物, 在合适的条件下, 利用聚合酶体系, 将步骤 5中得到的单链转化为双链 结构, 在这个过程中, 就得到了同时含有被克隆的目标序列的片段及其反向 复制的产物; 在图 27的示意中, 则是以 A区和 B区为基础设计引物, 最后将 步骤 5得到的单链转化为双链, 而在此过程中, 也获得了同时含有被克隆的 目标序列及其反向复制的双链产物;在图 27的示意中, 如果以 A区和 B区为 基础设计引物并利用 PCR等手段将步骤 5所示意的单链转化为双链, 那么, 通常情况下, 可以将含有这里所得的双链的载体转入任意合适的常规的受体 菌中进行扩增, 但作为另一种选择, 也可以将这里含有所得的双链的载体转 入一类特殊的允许有错配区(mismatch)的载体的扩增。例如 CL0NTECH公司 提供的 E. coli BMH71-18 MutS strain或者 STRATAGEGE公司提供的 XL MutS 相关系列的菌株等; 另一方面, 在图 27的示意中, 在步骤 5中, 可以仅针对 B区的序列结构设计引物, 然后通过一轮 DNA聚合反应, 将单链转化为双链; 以上是利用任意被克隆的目标序列片段, 并在此基础上制备同时含有被克隆 的目标序列片段及其反向复制的产物的过程的说明, 显然, 本发明在这里提 供的方法,适用于从任意序列制备同时含有该序列及其反向复制产物的情况; 另一方面, 利用本发明在这里提供的原则, 还可以产生不同的选择: 其一, 以上步骤 3中所得到的产物,还可以通过具备特别的 3' 末端自身互补的单链 的聚合酶作用下的延伸反应获得; 例如, 如图 28所示, 对于一段具有 19个 碱基长度的随机序列, 如果需要制备同时含有该随机序列及其反向复制的产 物, 则可以通过化学合成或者其它任意的手段, 将该随机序列区包含在一段 单链结构中,该结构的特点是:在其 3' 末端有自身互补结构,而在合适的聚 合酶的作用下, 就可以延伸并将开放端补齐, 这样得到的结构就等同于图 27 中相应的结构了, 而利用图 27中提供的办法, 就可以通过后续的步骤, 最终 获得同时含有 19个碱基长度的随机序列片段及其反向复制的产物; 显然, 图
28所示,也是一种将任意单链序列转变成双链序列的方法,如果将图 35中的 19个碱基长度的随机序列换成其它任意长度的任意序列, 同时在其上游的序 列的合适位置上设计一个 SRE位点对应的序列, 而在回环结构的部分的合适 位置上设计另一个相同或者不同的 SRE位点, 那么, 在经过聚合酶的延伸反 应后, 即可以利用上游和 /或者下游的 SRE位点对应的 SRE体系的作用, 将已 经转化为双链的任意序列释放出来并利用它做迸一步的工作;
其二, 作为一个选择, 在图 27的示意中, 可以直接在步骤 3设计引物, 从而步骤 3的发卡的基础上直接通过聚合反应获得步骤 6所示意的双链产物; 其三, 作为另一种选择, 在图 27的示意中, 在步骤 5中被引入的由两条具有 部分互补区的单链在合适的条件组成的开放发卡结构, 也可以从一个特殊单 链结构, 其特征类似图 27中在步骤 3引入的单链发卡结构, 即具备: 正区一 环区一反区的结构, 所不同的是, 在这里的特殊的单链结构的环区中含有一 个或者一个以上的被特殊修饰的核苷酸或者其它有类似功能的位点, 例如 Uracil等; 在合适的条件下, 这样的特殊的单链可以组成一个发卡结构并被 引入图 27中步骤 4所获得的产物的末端,而在后续的步骤中,可以通过适当 的针对以上环区所含有的被特殊修饰的核苷酸的降解体系, 例如当这些被特 殊修饰的核苷酸是 Uracil时, 则可以 UDG的作用将之降解, 如此就可以将末 端转化成图 27中步骤 5所示意的结构, 从而方便后续步骤的实施。 总之, 在 本发明图 27及其相关的描述中所提供的原理的基础, 根据不同的研究目的, 可以形成多种灵活的变化。
第三,对图 27和 /或图 28所获得的在同一段序列中含有被克隆的目标序 列片段或者其它任意序列及其反向复制的产物进行修饰。 很显然, 在获得以 上产物之后, 需要根据不同的研究目的对其进行进一步的操作, 而在多数情 况下, 即相当于将含有所克隆的目标序列片段及其反向复制的产物, 分别置 于不同的序列环境中去; 如图 29所示意, 这里将图 27和图 28所示意的步骤 中得到的最终产物变换成一个更一般的形式, 即: 上游区一含有被克隆的目 标序列片段的正区一中间区一含有被克隆的目标序列片段的反向复制的反 区一下游区; 这样, 对许多不同的后续的操作而言, 则相当于对上游区、 中 间区和下游区的某些序列或者全部的序列做变换; 显然, 对于类似的变换, 就可以利用本发明在前面的描述中所提及的利用外源序列在目标序列中形成 的插入而对目标序列的任意位点或者区间进行修饰的办法来达到目的;然而, 正如本发明在前面的描述中所强调的那样, 利用本发明提供的原理, 在针对 不同严究目的的具体实施过程中, 可以形成多种不同的变化; 作为本发明的
原理下多种不同的选择的一个部分,本发明提供两个比较有普遍意义的方法: 其一是对上游区和 /或下游区序列的变换; 如图 29所示, 则可在分别在 前面的步骤中, 在上游区和 /或下游区引入 SRE特异识别位点; 上游区和下游 区含有的 SRE特异识别序列, 可以被同一种或者不同的 SRE体系所识别; 上 游区和下游区含有的 SRE特异识别序列, 它们各自的酶作用位点则分别落在 上游区和正区的交接处的某个位置上以及反区的下游端, 其特点是: 在相应 的 SRE体系的酶功能的作用下,能够保证在正区上游末端和 /或反区的下游末 端形成双链断裂的同时, 又能保证在后续的步骤中, 正区和 /或反区的序列或 者结构能够得到保留, 因此, 这里的 SRE的作用的形式, 分别类同于前面定 义的具备单侧自我表现删除功能的外源序列的作用形式。在图 28、图 29和图 30所示的具体的例子中,则可以在图 31的步骤 1中,在上游外侧序列(5 ' F) 的下,游的合适的位置上设计一个合适的 SRE的特异识别位点, 而由于该位点 在上游外侧序列的下游, 因此, 在步骤 4的 RE2作用之后继续保留, 这样, 在经过步骤 5至步骤 6的产物中, 以上的 SRE也形成了一个反向复制; 这样, 如图 29所示意, 在与该 SRE特异识别位点对应的 SRE体系的作用下, 就可以 将含有 "正区一中间区一反区"的序列分离出来并置于任意其它的序列环境 中, 如此即意味着相关的上游区和下游区序列变换过程的完成; 作为一种选 择, 如果在图 28的示意及其相关的描述中, 利用步骤 5中的 A区和 /或 B区 不会在两侧形成复制的特点, 将一个或者一个以上的 SRE位点分别设计在这 两个区域, 则相应的位点就不会被复制, 因此, 通过对 SRE的选择及其相应 的 SRE位点的选择, 就可以在两侧形成不同的酶切末端, 这样的上游和下游 不同的末端无疑更适用于定向克隆; 如图 29中 B2所示意的一个具体的设计 中,只要不同的 SRE的选择及其位置的设计满足要求,例如 SRE1、 SRE2、 S E3 的酶作用位点分别均落在正区和上游的交界的区间或者反区和下游区交界的 区间,那么,就可以通过以下几种途径获得有利于定向克隆的不同的末端: 1, 先用 SRE2酶切,然后在用 SRE1酶切,则如此得到的末端,上游由 SRE2决定, 下游由 SRE1决定; 2, 先用 SRE3酶切, 然后再用 SRE1酶切, 则如此得到的 末端上游由 SRE1决定, 下游由 SRE3决定; 3, 用 SRE2和 SRE3酶切, 则如此 得到的末端, 上游由 SRE2决定, 下游由 SRE3决定; 当然, 在同样的原理下, 还可以产生其它的设计上的变化, 这里就不一一描述了, 这不应认为是对本 发明的任何形式的限制;
其二是对中间区序列的变换; 如图 29所示, 这里提供几个选择: 1, 在 前面的步骤中,在图 27中步骤 3中引入的单链发卡末端的正区的适当位置上
设计一个适当的 SRE的特异识别位点, 那么, 该位点在反区也存在一段互补 序列, 这样, 经过后续的步骤 5和步骤 6得到的产物中, 就可以在被展开的 发卡结构中的对应正区和反区的位置, 各含有一个可以被同一 SRE体系识别 的 SRE特异识别位点, 这样如图 29中的 C1所示意, 位于中间区的这两个位 于合适位置上的合适的 SRE位点, 就可以在与之对应的 SRE体系的作用下, 将中间区完全删除, 在此基础上, 就可以通过常规的手段将任意其它的中间 序列连接进来; 2, 在前面的步骤中, 如图 27中所示意的步骤 3中所引人的 单链发卡末端, 在环区的位置上设计一个或者一个以上的 SRE的特异识别位 点, 那么, 在后续的步骤 5和步骤 6获得产物中, 任意设计在环区的 SRE特 异识别位点将不会被复制, 这样, 在图 29中的 C2的示意中, 位于环区的合 适位置上的合适的 SRE特异识别位点, 就可以在与之对应的 SRE体系的作用 下, 对中间序列的任意一侧的末端或者两侧的末端同时进行修饰; 总之, 如 前所说, 作为一个选择, 这里的对中间区的修饰的途径, 就是设法将中间区 转变为具备完全自我删除功能或者单侧自我删除功能的外源序列, 这样就可 以针对不同的具体研究进行序列变换; 3,性质上类似于以上图 29中 C1和 C2 的综合,即在图 27中所示意的步骤 3中所引人的单链发卡的互补区以及环区 的合适位置上, 分别设计两个不同的 SRE位点, 那么, 在后续步骤中, 位于 互补区的 SRE位点将被复制,而位于环区的 SRE位点则保持单一状态,那么, 为了在置换中间区的过程中得到两个不同的末端, 则可以先用和环区对应的 SRE酶切,再用和互补区对应的 SRE酶切,则就可以为后续的定向克隆提供条 件。 此外, 在图 29中 Cl、 C2、 C3的示意及其相关的描述中, 中间区的置换 可以直接进行, 既在 SRE酶切完成后直接将中间序列作为连接,子连进, 但作 为一种选择, 也可以分步骤进行, 既先连进一段序列, 然后再对序列进行修 饰; 例如可以先连进一段含有筛选标记的序列, 然后再将该序列修饰成特定 的中间序列。
图 29中的 Cl、 C2、 C3及其相关的描述中提及的方法, 是分别对被克隆 片段的正区和反区的两侧和中间区序列的变换, 而在具体的应用中, 这种变 换实际上就可以等同于以下两中情形: 1, 对于图 29中的 C1极其相关的描述 中示意的情形, 则被克隆片段的 "正区 -中间区-反区"可隆到另外载体中去, 显然, C1中所示意的模式, 由于 SRE1位点的复制, 所以, 在 SRE1的作用下, 较多的情况下, 会产生两个形似的上游和下游末端, 但这对于那些需要做定 向克隆的实验而言, 显然是不利的; 2, 对于图 29中的 C2及其相关的描述中 示意的情形, 在具体的操作过程中, 则等同于将既有的来源于前面步骤的中
间序列删除, 同时将新的中间序列连进来; 显然, 如果在利用 SRE删除原有 的中间序列的过程中, 在载体上留下不同的末端, 则可以为后面的定向连接 提供条件; 这里再继续图 24、 图 25和图 26中的具体的例子, 即被克隆的目 标序列片段是来自信息 RNA的长度为 19个碱基的片段,显然,通过图 27、图 28及其相关的描述中所提供的方法, 就可以被克隆的片段转化成同时含有该 被克隆的长度为 19个碱基的片段及其反向复制的产物; 那么, 作为图 29和 图 30及其相关的描述中所提供的方法的具体的应用,这里的具体的例子中的 研究目的,是最终获得能在合适的体系中发挥 R A干扰作用即具备 RNAi作用 (Shi et al 2003 ; Hiroaki Kawasaki et al 2003 ; Hutvagner G et al 2002 May ; 20 (5) : 497-500) 的双链互补 RNA的表达体系; 如图 30所示意, 将和两 个 SRE1特异识别位点相对应的 SRE体系的作用,将含有前面所得到的含有长 度为 19个碱基的目标序列片段一中间区一长度为 19个碱基的反向复制的片 段分离出来, 并插入到另一个序列环境中并形成如下的结构: 合适的外部 (external)转录的 Pol III启动子例如 U6肩动子或者其它具备类似功能的 ,启动子等 (Myslinski E et al 2001 ; Medina MF et al 1999 ; Schramm L et al 2002, Yu et al Mol Ther 2003 Feb ; 7 (2) : 237-47) --正区一中间区一 反区一转录终止信号;然后,再利用和中间区的 SRE2特异识别位点对应的 SRE 体系的作用,将中间取完全删除, 并在此位置将一段长度为 9个碱基的片段, 其序列是: 5, TTCAGAGA3' , 这样就可以得到满足要求的结构; 而作为一种 .选择, 也可以在中间连进另一个序列, 即: 转录终止信号一 Pol HI启动子; 而连最终形成的结构,则将以上长度为 19个碱基的正链和它的反链分别置于 两个相同或者不同的外部转 Pol III启动子的控制之下, 但它们各自的产物 则能够互补并形成 RNA双链;显然,作为另一种可能的选择,如图 31所示意, 如果将图 30中的 Pol III启动子换为来自于噬菌体的 T3、 Τ7或者 SP6启动 子,同时将图 31中的转录终止信号换为一个含有 SRE3特异识别位点的结构, 其特点是: 在与 SRE3相对应的 SRE体系的酶的作用下, 可以为上游的来自于 噬菌体的启动子控制下的转录过程提供一个断裂点的同时, 又使得预期的转 录产物的完整性得到保留。
显然,在这里描述的方法中,如果在图 27中的步骤一或者本发明中其它 任意对一定特征的目标序列片段的克隆相关的实验, 既可以是从一个目标序 列开始的, 也可以是从一个以上的目标序列开始的, 而对于从一个目标序列 开始的情况, 则可以得到多个对应于目标序列中的片段的最终产物, 显然, 除了直接的应用外, 本发明在这里提供的方法, 也为从针对同一目标序列的
不同片段的产物中筛选具备不同效率的产物提供了基础, 而针对从一个以上 的目标序列的情况, 则就拥有了一个同时针对一个以上的目标序列的不同片 段的最终产物库, 显然, 这也为针对一个以上的目标序列的相关研究提供了 基础。
以下是几个实施例, 但这里的实施例仅可以被认为是对本发明的进一步 说明, 而不是对本发明的任何形式上的限制。
实施例一
对绿色荧光蛋白基因的编码区的突变研究
本例的目的是将绿色荧光屏蛋白基因的编码区中,利用定点突变的方法, 制造出两个转译终止码, 即 stop codon, 这样, 就可以使原来的基因失去编 码全长的绿色荧光蛋白的功能。如图 41所示意, 增强型的绿色荧光蛋白基因 EGFP位于载体 pA- EGFP中, 这里的 pA- EGFP的序列中的 EGFP基因, 是来自 pEGFP-N2 (Clontech Laboratories, Inc., USA), 而其主要的背景支架 (Backbone)则来自于 pGPS3. (New England Biolabs, Inc. , USA) ; 最后形成 的 pA- EGFP载体中除含有一个在 CMV启动子控制下的 EGFP基因以及下游的转 录终止信号外,还含有一个表达具备青霉素抗性的蛋白的基因、图示为 Amp - R, 当然, 载体中还含有其它必要的保证载体在受体菌中复制的序列; pA- EGFP 的全序列如序列表中的序列 1所示。 序列表中的序列 1由 4192个碱基组成。 其中具体的序列组成是: 自 5' 端的 1-1647来自 pEGFP N2的 1-1647;
1648-4192则来自 pGPS3的 1-2545, 但位于该序列片段的一个 Bbs I位点, 已经被通过点突变的方式被消除掉。
在本实施例中, 其具体的实验目的是利用本发明提供的原理和方法, 将 pA-EGFP中的 EGFP基因的蛋白编码框架位于自 5 ' 端的第 683个碱基至第 1402个碱基的位置上, 实验的目的是将自 5 ' 端的第 890个碱基至第 895个 碱基位置的序列, 从原来的 5' CAGTGC3' 突变为 5, TAGTAA3' , 原来在 EGFP基因中编码 QC的序列, 就被两个连续的转译终止码所取代, 可以预期 的是, EGFP基因的编码全成多肽链的功能也将受到破坏;
如图 32所示意,本例中设计了一对 PCR引物,即 PERIMER 1和 PRIMER 2, 具体的序列结构如下:
PRIMER 1 : 5, GCC GTA GGT CAG GGT GGT CAC 3, (SEQ ID NO: 2)
PRIMER 2: 5, C GGC GTG CAG TGC TTC AGC C 3, (SEQ ID NO: 3) 以上引物的 5' 端最上游的碱基磷酸化的引物; PCR反应, 则是利用 pA - EGFP为模板, 利用以上的 PERIMER 1和 PRIMER 2为引物进行, 具体的反
应条件参照 Stratagene公司的 QuickChange Site-Directed Mutagenesis Kit 提供的 PCR反应条件,但循环温度为: 95 °C 1分钟、 61 ° C. 1分钟、 68 ° C 10 分钟, 共反应 12个循环; 所得的 PCR产物, 通过电泳回收以备下一步使用; 这里的含有 Kan- R的外源序列是通过对 pGPS3进行修饰所得到的 pD-kan-R,这里具体的修饰过程如下:
首先设计一对 PCR引物, 引物的具体序列结构如下:
P1-UP: 5' GAAGAC TT GAAGAGC GA GCCACGGTTG ATGAGAGCTT TGTTGTAGGT GGACCAG 3,
P1-D0W : 5, TGCCT GTTCA TCCGC GTCCA GCTCG TTGAG TTTCT CCAGA AGCGT 3'
这里的两个引物的 5' 端最上游的碱基也是磷酸化的引物; 而接下来则 是进行 PCR反应,则是以 PGPS3为模板进行; PCR反应和突变筛选的反应则利 用 Stratagene公司的 QuickChange Site-Directed Mutagenesis Kit提供的 聚合酶和其它试剂进行, PCR循环条件为: 95 D C 1分钟、 65 DC 1分钟、 68 °C 10分钟, 共反应 19个循环, PCR循环结束后, 继续根据厂家在 Kit中推荐的 程序进行, 直到最后获得转化的阳性细菌克隆, 在经过酶切和测序鉴定后, 所得到的突变载体被命名为 pGPS3-mutR;
下一步的实验则在 pGPS3 mutR的基础上进行;这里利用另一对 PCR引物, 引物的具体序列结构如下- P2-UP: 5' GCTCTTC AA GTCTTC GGTACCCTGT GAATGCGCAA ACCMCC' 3,
P2-D0WN: 5, TCTCA AAATC TCTGA TGTTA CATTG CACAA G 3'
这里的两个引物的 5' 端的最上游的碱基是磷酸化的引物; 而接下来则 是进行 PCR反应,则是以 pGPS3为模板进行; PCR反应和突变筛选的反应则利 用 Stratagene公司的 QuickChange Site-Directed Mutagenesis Kit提供的 聚合酶和其它试剂进行, PCR循环条件为: 95 ° C 1分钟、 65 ° C 1分钟、 68 ° C 10分钟, 共反应 19个循环, PCR循环结束后, 继续根据厂家在 Kit中推荐的 程序进行, 直到最后获得转化的阳性细菌克隆, 在经过酶切和测序鉴定后, 所得到的突变载体则为所需要的载体 pD- kan- R, 其序列如序列表中的序列 4 所示, pD- kan- R由 3692个碱基组成。
其中具体的序列组成则相当于分别将 PGPS3中含有 Tn7R和 Tn7L的两个 区域的部分序列删除, 并同时在相应的区域引入一段含有 Bbs I位点和 Sap I 位点的序列;
这里的 PD- kan-R在限制性内切酶 Bbsl的作用下, 释放出一个长度为
1. lkb的含有以上所说的 Kna- R的的片段,再利用大片段酶即 Klenow将末端补 齐:
将以上从 pA- EGFP为模板所得的 PCR产物和含有被补齐的 Kan- R的片段 利用连接酶反应体系,将两者相连接,连接产物被转入 XL- 1- BLUE感受态菌中, 在利用含有 Ampicillin和 Kanamycin的培养条件进行筛选,这样就得到了在 EGFP基因中安插有外源序列的载体,接下来的实验中,则是用 Sapl进行酶切, 这样就将含有 kan- R的片段删除, 留下的载体部分则用于后面的连接, 而被 连接进载体的, 是一个由两个 DNA 0LIG0链互补构成的适应子, 本发明所说 的 daptor :
5, C GGC GTG TAG TAA TTC AGC C 3' (SEQ IN NO: 5)
5, A GCG GCT GAA TTA CTA CAC G 3, (SEQ ID NO: 6)
以上这两条链构成的连接子,含有实验所需要的突变序列, 而作为对照, 本例中还设计了一个由两个回复突变性质的 0LIG0构成的连接子:
5, C GGC GTG CAG TGC TTC AGC C 3, (SEQ ID NO: 7)
5' A GCG GCT GAA GCA CTG CAC G 3' (SEQ ID NO: 8)
以上突变性质的连接子和恢复突变性质的连接子分别被连接进上面删除 掉含有 Kan- R片段的载体中, 所得到的产物的序列经 DNA测序的办法得到了 证实。 将所得的最终载体通过常规的磷酸钙转染的方法分别转迸 CH0细胞, 转染后 72小时, 再利用荧光显微镜观察, 含有突变序列的载体转化的细胞不 表达绿色荧光蛋白, 而含有回复性质的序列的载体转化后的细胞, 则表达了 和突变前的载体同样的绿色荧光蛋白。
实施例二
本实例的目的,与将实施例一中所示意的在载体 pA- EGFP中的 EGFP编码 基因的部分序列, 即载体的第 886个碱基至第 902个碱基突变, 用一段同样 长度的完全随机序列库插入, 形成一个随机突变库。
实验的程序与实施例一中的描述基本一致, 所不同的是, 在最后的几步 中, 当含有 Kan-R的片段在 Sap I 的作用下被删除后, 留下的载体序列则和 一个来源于随机序列库的片段相连接,该随机序列库是按以下的方法制备的: 首先合成一个 oligo, 其序列是- 5' GTAAG GTAAG GTTCT GGCTC TTCAC GGN1 N2 N3 N4 N5 N6 N7 N8 N9
N10 Nil N12 N13
N14N15 N16 N17 G CTTGA AGAGC AGTCT GATTC CAGAC TGCTCTTCAAGC 3, (SEQ ID NO: 9)
这里的 Nl至 N19的位置是随机序列.将含有以上 oligo的水溶液在煮沸 10分钟,然后再缓慢降温,然后再从冷却到室温的含有该 oligo溶液中取出, 在相应的常规的条件下,利用 Takara高保真的不在 PCR产物的末端添加额外 的碱基的 Tag聚合酶 , 94 ° C变性 5分钟, 然后以 2摄氏度为间隔, 逐步降 低反应温度, 并在每一个间隔反应 1分钟, 最后停留在 55. 5 e C反应 2分钟; 然后利用 PAGE变性胶电泳,将长度约约为 126 nt的 DM回收回来,将回收的 DNA溶液在 100 °C变性 10分钟, 然后以 0. 5摄氏度为一个间隔逐步降低温 度, 每个时间间隔停留 5分钟, 最后停留在室温度, 如此得到复性产物, 然 后再用 Sapl对回收回来的复性产物进行酶切,再通过 PAGE非变性电泳,将对 应于含有随机序列的片段回收回来,如此得到的回收产物则作为连接子被用 T4 DNA ligase 本发明中的连接反应除特别注明的外均是在 T4 DNA ligase 的介导下完成的、连进以上在删除含有 kan- R的片段后留下的载体,所得到产 物即为一个随机突变库, 随机选择 10个阳性克隆, 提取质粒 DM进行分析结 果显示, 其中 7个克隆的随机序列区有预期的不同的序列, 但另外 2个克隆 的随机序列区的长度比预期的短, 还有一个克隆的在随机序列区上游外侧缺 少一个碱基; 出现非预期的序列结构的原因, 可能 引物合成过程中出现的, 但由于随机序列库中的大多数的序列片段为预期的长度, 因此, 本实验的提 供的方法显然是成功的。
实施例三
检测由实施例一中得到的突变产物,即 pA-EGFP的突变后形成的载体中, 第 890个碱基,是否为 A。 这里的检测同时将突变前的载体作为实验对照; 实验首先设计一对针对突变载体中待检测位点的 PCR引物, 即一个上游 引物和一个下游引物, 这里在上游引物中引入一个 BpuEI位点; 这里的上游 引物和下游引物的序列结构分别是: 。
上游引物: 5' CCC TGG CCC ACC CTC GTG ACC ACC C TTGAG TG ACC TAC
GGC G 3' (SEQ ID NO: 9) ;
下游引物: 5' GAG CTG CAC GCT GCC GTC CTC GAT GTT 3' (SEQ ID NO: 10) ;
这里的 PCR反应是以突变载体为模板, (突变前载体为对照) , 利用以 上的上游引物和下游引物进行的, 具体的反应条件参照 Stratagene公司的 QuickChange Site-Directed Mutagenesis Kit提供的 PCR反应条件,但循环 温度为: 95 ° C 1分钟、 57 ° C 1分钟、 68 °C 2分钟, 共反应 25个循环; 得 到长度约为 370 bp的片段;这里所得的 PCR产物的一部分,实验中是将 50微
升的 PCR反应液中, 取出 5微升用于下一步的反应;
将以从 PCR反应液中取出的 5微升样品, 用 BpuEI迸行酶切, 然后经 65 ° C、 20分钟将酶灭活, 再用常规的方法, 将反应缓冲液置换为适合后续步骤 中的反应条件的溶液; '
将以上酶切后得到的样品用于连接反应, 在常规的连接反应条件下, 使 得以上 PCR产物经 BpuEI作用后留下的末端,与一个两条由 TOP和 BOTTOM两 条 DNA寡聚链组成的适应子相连,其中 TOP寡聚链的 5' 端经过了磷酸化处理, 而 BOTTOM寡聚合链的 5' 端则没有经过类似的处理; 这里的 TOP寡聚链和 BOTTOM寡聚链的序列结构是:
TOP寡聚链: 5' phosphate- GAG GAG GCT CTT CGC GGC CGC AAC GTT TAA
ACT TAA TTA ATG CGT GCA GTG TCA GTG TCA GTG TGC GTG TAC GTT CAC TAG TCT CCG TCG ATC 3, (SEQ ID NO: 11);
BOTTOM寡聚链: 5, GAT CGA CGG AGA CTA GTG AAC GTA CAC GCA CAC TGA CAC TGA CAC TGC ACG CAT TAA TTA AGT TTA AAC GTT GCG GCC GCG AAG AGC CTC CTC TA 3' (SEQ IN NO: 12);
连接反应的体积为 50微升,其中以上经酶切后的 PCR产物的浓度和这里 的适应子的浓度的摩尔比为 1.· 20; 连接反应完成后, 即经过 65 ° C、 10分 钟处理灭活连接酶; 接着从连接反应液中取出 1微升并将之用于下面的 PCR 反应; 这一步的 PCR反应所用的引物是:
上游引物: 5' CCC TGG CCC ACC CTC GTG ACC ACC CTT GAG TGA CC 3'
(SEQ ID NO .: 13);
下游引物: 5, GAG CTG CAC GCT GCC GTC CTC GAT GTT 3' (SEQ ID NO:
14);
这里的 PCR反应的循环条件为: 95 ° C 1分钟、 57 ° C 1分钟、 72 ° C 1 分钟, 共反应 25个循环; 对所得产物迸行常规电泳分析, 即可以观察到一条 位于 130 bp至 140 bp之间出现的一条双链 DNA带;而将这里的 PCR产物经 Bse RI或 Sap I或 Pme I或 Pacl酶作用后, 这条带即消失, 由此可以得出结论: 在突变载体中的第 890个碱基是4, 它的互补位置上是 T; 另一方面, 作为对 照,用突变前的 pA- EGFP载体进行同样的实验,则没有得到这里观察到的 PCR 产物, 由于在本例的情况下, 载体的第 890个碱基只有突变后的 T或突变前 的 C两种可能, 因此, 通过对照实验的结果也可以证明突变前载体的第 890 个碱基是 C而不是 T。
实施例四
本例的目的, 是从一个 mR A库的分子中, 克隆上游端位于两个连续的 AA之后的长度为 19个碱基长度的片段。 '
实验用来源于 Hela细胞的 m丽 A,如图 33所示,利用常规的的实验条件, 完成下列操作:
利用一个含有 oligo (dT)的引物 Primer 1 , 将 mRNA转化为单链 DM, 即图 33所示意的 ss cDNA, 引物的序列为:
Primer 1: 5, C TGT CAT CTC GTC ACT CTC GCT GCC ACT TTT TTT TTT TTT TTT 3, (SEQ ID NO.: 15)
在将 mRNA转化为单链 DNA后, 再利用 Primer 2将单链 DNA转化为双链 DNA; 这里的 Primer 2的序列是:
Primer 2: 5, TCA CTA GTC TCA TCA CGC GGC CGC CAT ATA GGA TG 麵 麵 AA 3, (SEQ ID NO: 16) ;
所得到的双链产物经过 PCR反应进一步扩增, 用于 PCR反应的引物是 Primer 1, 和 Primer 2, , 它们的序列分别是:
Primer V : 5' CTG TCA TCT CGT CAC TCT CGC TGC CAC 3, (SEQ ID
NO: 17) ;
Primer 2 ' : 5, TCA CTA GTC TCA TCA CGC GGC CGC CAT ATA GG V (SEQ ID NO: 18);
PCR反应的循环温度为: 95。C 1分钟、 65e C 1分钟、 72 ° C 1分钟,共 反应 20个循环;所得的 PCR产物经纯化即分离并丢弃反应体系中的引物后,将 双链产物分成四份,分别用 Rsa I、 Alu I、 Hae III、 HpyCH4 V进行酶切, 然后再将不同的酶作用后所得的产物用 Notl酶切,然后将所得的产物用电泳 的办法进行分离, 利用 PAGE将所有处于 50 bp至 400 bp 区间的 DNA片段回 收并被用于紧接着进行的连接反应, 该连接反应中作为载体的部分是来自经 Notl及 EcoRV酶切的 pj- 1载体, 这里的 pj-l载体的构建过程如下:
首先设计两个 PCR引物, 其具体的序列结构是:
Primer A: 5' catgtagggtaccctt gat ate gaagac aagcccAATCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTC G3,
Primer B: 5'
gcggccgcGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATG 3'
这两个引物均为 5' 端的最上游位置的碱基磷酸化的引物; PCR反应, 以 PUC19为模板进行, 后续实验则利用 Stratagene公司的 QuickChange Site-Directed Mutagenesis Kit提供的聚合酶和其它试剂进行, PCR循环条
件为: 95 ° C 1分钟、 67. 5。C 1分钟、 68。C 10分钟, 共反应 19个循环, PCR循环结束后,继续根据厂家在 Kit中推荐的程序进行,直到最后获得转化 的阳性细菌克隆, 在经过酶切和测序鉴定后, 所得到的突变载体被命名为 pUC-mutLacZ;
以下的实验修饰则在 pUC- mutLacZ的基础上进行; 修饰的主要目的是消 除载体中含有的 Fok I位点; 这里先利用以下的引物作突变修饰-
Primer : 5, C TAT CTC AG C GAT CTG TCT ATT TCG ΎΊΟ GTC Ο.Ί AGT TG C CTG ACT CCC CGTCGTGTAG 3,
Primer : 5' CTACA CGACG GGGAG TCAGG CAACT ATGGA CGAAC GAAAT AGACA GATCG CTGAG ATAG 3 ,
这两个引物均为 5' 端的最上游位置的碱基磷酸化的引物; PCR反应, 以 pUC-mutLacZ为模板进行, 后续实验则利用 Stratagene公司的 QuickChange Site-Directed Mutagenesis Kit提供的聚合酶和其它试剂进行, PCR循环条 件为: 95 ° C 1分钟、 62. 5 ° C 1分钟、 68。C 10分钟, 共反应 15个循环, PCR循环结束后,继续根据厂家在 Kit中推荐的程序进行,直到最后获得转化 的阳性细菌克隆, 在经过酶切和测序鉴定后, 所得到的突变载体则被用作下 面一步修饰的模板;
接着的实验中使用以下的引物作突变修饰:
Primer : 5 ' CTGCA TAATT CTCTT ACTGT CATGC CATCT GlkkG ATGCT TTTCT GTGAC TG 3,
Primer : 5' CAGTC ACAGA AAAGC ATCTT ACAGA TGGCA TGACA GTAAG AGAAT TATGC AG 3 ' =
同样, 这里的两个引物的 5' 端的碱基也是被磷酸化的; 这里利用 Stratagene公司的 QuickChange Site-Directed Mutagenesis Kit提供的聚 合酶和其它试剂进行, PCR循环条件为: 95 ° C 1分钟、 62. 5 Q C 1分钟、 68 ° C 10分钟, 共反应 15个循环, PCR循环结束后, 继续根据厂家在 Kit中推荐的 程序进行, 直到最后获得转化的阳性细菌克隆, 在经过酶切和测序鉴定后, 所得到的突变载体则被用作下面一步修饰的基础;
接下来的修饰按以下的程序进行- 利用一个连接子, 该连接子由以下的两个 Oligo复性后反应而成:
Oligo 1: 5, ATCCG CdNNNCC GTCTA TTAAT TGTTG CCGGG AAGCT AGAGT AAGTA GTTCG CCAGT TAATA GTTTG C 3,
Oligo 2 : 5, G CAAAC TATTA ACTGG CGAAC TAG 3'
这里的两个 OHgo的 5' 端最上游的碱基是被磷酸化的;将这两个 Oligo 复性后, 再利用 Klenow补齐末端, 所得到的连接子经 PAGE回收后, 用于连 接反应, 连接反应中的载体部分是以上突变载体经过以下处理所得: Fok I 酶切, 然后用 Kl enow将末端补齐, 再利用 Fsp I酶切, 最后回收载体部分, 并将之和以上的连接子一起做连接反应, 连接反应完成后, 将所得到的连接 产物再次用 Fok l酶切,然后,再将之转入受体菌,所得到的具备 Ampicillin 抗性菌中的 100个克隆被混合培养,然后将其中含有的质粒提取,再次用 Fok I酶切并转入受体菌, 由此得到的具备 Ampicillin抗性菌中含有的质粒载体 被提取并用来做后一步的实验;
接着的修饰是利用以下的两个 Oligo复性后形成的连接子进行的-
Oligo A: 5, ggccg cagtt cgtcg tcgtg cgatg ctcaa gggct gtcag tcatg taggg taccc ttgat 3'
Oligo B: 5, ATCM GGGTA CCCTA CATGA CTGAC AGCCC TTGAG CATCG CACGA CGACG MCTG C 3,
这两个引物的 5, 最上游端的碱基是被磷酸化的; 在将这里的连接子准 备好以后, 则将之用于连接反应, 所用的 i¾体是通过对以上的质粒载体处理 获得的, 即利用 Not I和 EcoR V做酶切, 然后, 将之用于连接反应, 由此得 到的阳性克隆中含有的质粒子载体即为 pj- 1 ; 除通过以上的分步突变消除 pUC-mutLacZ中含有的 Ampicillin抗性基因中含有的三个 Fok I位点之外, 本发明还使用了人工合成的 Ampicillin抗性基因片段,其中的三个 Fok I位 点也已经在序列合成的过程中使用在不改变 Ampipillin抗性基因编码的表 达产物的生物活性的点突变的手段, 将其中含有的三个 Fok I位点消除, 并 将这里合成的含有 Ampicillin抗性基因片段置换入 pUC-mutLacZ的对应的同 源区域以形成新的载体, 由于该新的载体和通过以上分步突变的方法获得的 载体在后续的实验的使用上完全相同, 同时, 这两个载体又在后续实验的所 有相关步骤又被同步用作所有相关实验的起并行对照作用的实验本, 所以在 后面的描述中, 将不再对以上两个载体分别说明, 而都称为 pj - 1。
如图 34所示意, 以上从 mR A作为原始序列逐步获得的被回收回来的处 于 50 bp至 400 bp区间的片段被连接进经过 Notl及 EcoRV酶切的 pj- 1载 体;紧接着的步骤是用对克隆到 pj-l中的来自于 Hela细胞的 mRNA的目标序 列片段进行操作, 其主要的步骤是: 1, 利用 Fok l进行酶切, 接着用 Klenow 将酶切后形成的末端补齐; 然后再用 Not I酶切, 然后将得到的载体部分回 收, 并在其中连进一个连接子,该连接子是由两个合成的 oligo链组成, 其序
列分别是:
5, GGC CGC ATA ATC TGT AAT GAG TCG GAT G 3' (SEQ ID NO: 19); 5, C ATC CGA CTC ATT ACA GAT TAT GC 3' (SEQ ID NO: 20); 由此得到的连接产物, 经转化筛选后得到阳性细菌中含有的质粒将用于 下一步的如图 35所示意的连接反应, 其过程是: 将这里所得到的连接产物, 用 Fokl进行酶切, 在将酶切产生的末端用 Klenw补齐, 此可以作为连接反 应中的载体; 而连接反应中的另一个片段, 则是来自 pD- kan-FB; pD-kan-FB 是通过对 pGPS3进行修饰而获得的, D-kan-FB的序列如序列表中的序列 21 所示, 由 3690个碱基组成。
利用 EcoRV和 Bbsl的作用,再用 Klenow将 Bbsl酶作用后留下的末端补 齐, 这样就得到一个长度约为 1. 1 kb的片段,该片段构成了这里的连接反应 的一个部分, 而连接反应的产物则可以被转化到用 XL- 1-Blue制备的受体菌 中, 则可以表达具有抗 kanamycin活性的蛋白, 这样, 阳性克隆就可以很容 易地被筛选了出来; 这里得到的阳性克隆所含有的质粒, 则如图 36a和 36b 和 36c所示意, 被用于后续的步骤中: 利用 BseRI和 Bbsl的作用, 并将酶切 产物中长度约在 4. 7 至4. 9 kb之间的载体片段回收, 这样就将以上两个 酶切位点之间的小片段删除, 同时也留下两个末端, 紧接着则将一个合成的 由两个 oligo组成的连接子连进来, 这两个 oligo的序列是:
5, TTC AGA AGA GCG TCT TCA TCT GTC TGA CT 3, (SEQ ID NO: 22) 5' GGGCAGTCA GAC AGAT GAAGACGCTCTTCTGAA 3, (SEQ ID NO: 23) 后面一个 oiigo的: 端含有两个丽, 就其可能的组合而言, 可以形成
16个不同的末端, 这里则分别使用与 16个不同末端对应的 16个连接子, 这 些连接子则能分别与匹配的载体末端相连接,如此得到的连接产物在经过常 规的转化、 阳性克隆的筛选及扩增后, 如图 36a和 36b和 36c所示意, 则用 Fok I进行酶切, 然后通过常规的方法将含有 Kan- R的片段分离出去, 剩下的 载体部分则用来做自身连接反应,这样得到的连接产物则包含了长度为 19个 碱基的目标序列片段的载体库,随机选择 10个克隆并对从中提取的载体做序 列分析, 结果表明: 其中有 9个克隆中的质粒载体的相应区域含有长度为 19 个碱基的片段; 这里获得的序列库构成了后续的实验基础。
实施例五
以从 CH0细胞中提取的 mR A为起始目标序列, 从中随机获取长度为 23 个碱基的序列片段;
如图 37所示意, 这里的实验按如下的步骤进行的:
1, 首先在以上 mRNA的基础上, 合成 cDNA, 这里的第一条 cDNA链的合 成是利用 Biotin- oligo (dT) 15进行的,在首先合成了单链的 cDNA的基础上, 然后再通过常规的方法合成双链 cDNA,这里的整个 cDNA的合成条件,是按照 Superscript® Choice System for cDNA Synthesis (Cat no : 18090-019, Invi trogen)推荐的反应条件迸行;
2, 将以上合成的得到的双链 cDNA断裂成小的 DNA片段, 这里的反应是 根据 Anderson S的工作, 利用 DNase I进行的(Anderson S, Nucleic Acids Research 1981, 9 : 3015-3027); 这里所使用的 DNase I (Cat #: 2220A, Takara) , 酶的最终反应浓度为 0. 1 Unit I微升; DNase I的反应结束后, 禾 'J用 Avidin- coated paraqmagnetic Beads (Dynabeads, Dynel) 进行处理, 这样就将含有 Bi0tin-0lig0 (dT) 15的片段清除; 此后, 将所得到的 DNA片段 T4 DNA polymerase处理, 以将所得到的 DNA片段的末端修饰成齐头末端; 在 经过这些处理后, 位于 100 bp和 400 bp之间的片段被回收并用做下一步实 验;
3,将一个适应子连接在 2最后获得的 DNA片段的末端, 该适应子的两条 互补的 Oligo的结构是:
Oligo 1 : 5, p-GGAGATGCCAGATG 3, ;
Oligo 2 : 5' p CATCTGGCAT 3,
Oligo序列中, 5' 端最上游的 "p- "符号代表该位置的碱基已经过磷酸 化修饰; 这里的连接反应中, DNA片段与适应子的分子浓度的比例约为 1 : 50; 连接反应完成后,利用 2%的 Agrose胶电泳,将未能连接到 DNA片段的末端的 适应子去除, 同时将 DNA片段回收并用做后续的实验;
4, 将以上连接了适应子的 DNA片段, 连入 pj- 2的两个 Bbs I的酶切位 点之间; 这里的 pj- 2是对 pj- 1的一个修饰载体, 将 pj- 1中位于 Not l位点 5, gcggccgc 3,、 和 Bbs I位点及 Bbs I的酶切位点 5, gaagacaagccc 3, 所包含的序列置换为序列表中的序列 24:
将 pj- 2用 Bbs I酶切, 然后利用常规电泳将含有载体的片段分离并纯化 用于连接反应, 即将从以上 3中回收的 DNA片段, 作为插入序列连进这里的 载体; 最后所得到的阳性细菌中含有的质粒产物被用于下一步的实验; 5, 用 BseR I对将从 4中得到的质粒产物做酶切, 常规电泳将长度约位于 2. 5 kb 至 3. 2 kb之间的片段回收, 并作载体自我连接反应, 最后所得到的阳性细菌 中的含有的质粒产物被用于下一步实验;
6, 用 Fok I对 5中得到的质粒做酶切, 然后利用 Klenow将末端补齐,
接着再将以下的一个由以下两个 Oligo组成的适应子连入被补齐的末端- Oligo 1 : 5, p-ggctcctcaagctagacttccgatacgatggaagaggaggtgcag 3, Oligo 2 : 5' p-ctgcacctcctcttccatcgtatcggaagtctagcttgaggag 3, 这里的连接反应中, 载体和适应子的分子比例为 1: 50; 连接反应完成 后, 利用常规电泳回收载体片段, 然后, 将回收来的片段用于下一步的连接 反应, 在这个连接反应中除载体片段外, 还有一个由以下的 Oligo的两个单 体互补形成的含有 10 bp的互补区和两侧各有两个 5' 的 CC突出的连接子: Oligo : 5, p-Gcattaggcctaat 3,
这里的连接反应中, 载体片段和连接子的分子数目的比例为 1 : 50; 连 接反应完成后, 转化筛选后得到的阳性细菌中所含有的质粒被用作下一步的 实验;
7, 利用 Fok I对 6中所得到的质粒产物进行酶切, 接着利用 Klenow将 酶切得到的末端补齐, 然后, 再利用 Stu I进行酶切, 所得产物经过常规电 泳分离后, 将所得的载体片段回收并用于自身连接反应, 连接产物经转化筛 选后, 所得的阳性细菌中含有的质粒载体被用于下一步的实验;
8, 用 Bsg I和 Pac I对以上 7中所得到的质粒产物进行酶切, 然后, 利 用 T4 DNA polymerase将末端修齐, 常规电泳将载体片段回收并用于下一步 的实验; '
9, 利用以上 8中所回收的载体片段, 做自身连接反应, 经转化筛选后所 得到的阳性细菌中含有的质粒被用于后续的实验;
10, 用 BseR I对以上 9中得到的质粒产物做酶切, 然后, 通过常规的电 泳将载体部分分离回收, 再将回收回来的载体片段做自身连接反应, 转化筛 选后得到的阳性细菌中含有的质粒载体中即含有所需长度的片段; 随机挑选 19个克隆做测序分析,所得到的结果显示:其中 17个克隆含有所需长度的片 段; 显然, 本实施例的目标已经达成; 这里得到的含有长度为 23 bp的可以 被用两侧的酶切位点, 例如 Mly I和 Xho I.释放出来, 用于任意需要的实验 研究。
实施例六 在和实施例五相同的目标序列来源的基础上, 随机获取长度为 29 bp的 片段;
前面 7个步骤的操作和实施例五的前面 7个步骤的操作完全相同, 后续 的操作步骤如下:
8, 用 Bsg I对所得到的质粒产物进行酶切, 然后, 将一个由以下两个 Oligo组成的适应子连入留下的末端:
Oligo 1 : 5' p-ggggagtgcgaagacaaagac nl n2 3,
Oligo 2 : b' p-gtctttgtcttcgcact 3,
Oligo 1中的 nl和 n2分别代表由 A、 G、 C、 T中随机选出的碱基构成的 组合, 由于 nl n2的组合共有 16种, 所以, 可以各自形成共 8组适应子, 每 一组中含有两个适应子, 这两个适应分别可以在 nl n2的位置上形成互补, 例如, 当一个适应子的 nl n2为 GT时, 则另一个适应子的 nl n2则为 AC; 在 这里的连接反应中, 则分别设置了 8个连接反应; 在这里设置的所有连接反 应中, 载体片段和适应子之间的分子数目的比例为 1 : 50; 连接反应结束后, 则分别利用常规电泳将载体片段分离出来, 并将分离得到的片段分别和一个 由下面的 Oligo的两个单体互补形成的连接子相连接:
Oligo: 5' p-ccccgaagatcttc 3'
这里的连接反应中, 载体片段和连接子之间的分子数目的比例为 1 : 100; 8个连接反应中所得到的连接产物经转化和筛选后,所得到的阳性细菌中含有 的质粒分别被用做下一步的实验; '
9, 用 Bsg I和 Bgl II对以上各个连接反应后得到的质粒做酶切, 常规 电泳将载体片段回收, 再将回收回来的片段用于和由以下的两个 Oligo组成 的连接子相互连接:
Oligo 1: 5' p-ccgtttgtcttcagcaagac 3'
Oligo 2 : 5' p-gatcgtcttgctgaagacaaacgg nl n2 3'
和以上的情形类似,这里的连接反应也根据以上步骤中各自使用的 nl n2 末端的情况, 分别利用具备和以上连接反应中相同的具备互补的 nl π2的连 接子, 这里的连接反应中, 载体片段和连接子之间的分子比例为 1 : 100; 连 接反应的产物经过转化和筛选后, 阳性细菌中所含有的质粒被用于下一步的 实验;
10, 利用 BseR I对以上步骤 9中得到的质粒产物做酶切, 然后, 用常规 电泳将载体片段分离出来, 并作自我连接反应, 转化筛选后所得到的阳性细 菌中所含有的质粒被用于下一步的实验;
11, 利用 Bbs I对以上步骤中得到的质粒做酶切, 然后, 利用常规的电 泳将载体片段分离出来, 并将之和一个由下面的两个 Oligo组成的连接子相 连接-
Oligo 1: 5' p-ccgtcttcagctaccgaacgtgcagaaga 3,
P T/CN2004/000484
Oligo 2 : 5, p-gtcttcttctgcacgttcggtagctgaag 2'
这里的连接反应中, 载体片段和连接子的分子数目的比例为 1: 50; 连 接产物经过转化和筛选后, 所得到的阳性细菌中含有的质粒被用于下一步的 实验;
12, 对以上 11中得到的质粒, 执行和实施例五中的步骤 8相同的操作;
13, 在以上 12的基础上, 执行和实施例五中的步骤 9相同的操作; 14, 利用 Bbs I对以上 13中得到的质粒做酶切, 然后, 利用 Klenow将 酶切产 '生的末端补齐, 常规的电泳将载体片段回收, 并将回收得到的片段用 于自身连接反应, 连接产物经过转化筛选后, 所得到的阳性细菌中所含有的 质粒, 即为含有所需要的长度的目标序列片段的载体; 随机选择 15个克隆做 序列测定, 结果显示: 其中 12个克隆含有预期长度的序列片段;
实施例七
从绿色荧光蛋白 EGFP基因中, 随机获取长度为 21 bp的序列片段; 这里的操作是以 pEGFP- N2 (Genebank Accession #: U57608)中含有的绿 色荧光蛋白基因 EGFP为目标序列, 按以下的步骤实行的:
1, 利用 BamH I和 Not I对 pEGFP- N2进行酶切, 并通过常规电泳将含有 EGFP基因的片段回收回来, 并用于下一步的实验;
2, 利用和实施例五中的步骤相同的反应条件, 利用 DNase I酶对所得到 的含有 EGFP基因的序列片段进行处理, 并同样利用 T4 DNA polymerase将由 DNase I酶反应留下的末端修齐, 然后, 再将长度位于 100 bp至 400 bp之间 的片段回收, 而后续的实验, 则是在此基础上, 实行和实施例五的步骤 3至 步骤 10相同的操作; 最后随即选择 15个克隆做测序分析, 结果显示: 其中 有 14个克隆均含有长度为 21 bp的序列片段, 和 EGFP的序列对比的结果表 明, 这些序列均来自作为目标序列。
实施例八
从 Luciferase基因中随即获取任意长度为 29 bp的序列片段; 这里以 pGL3- Basic (Genebank accession #: U47295)中含有的
Lucif erase基因为基础, 实行以下的操作:
1, 利用 Hind III和 Xba I对 pGL3 - Basic进行酶切, 然后, 利用常规的 电泳将酶切产物中含有 Luciferase基因的片段回收回来,并在此基础上做下 一步的实验;
2, 利用以上 1中所得到的含有 Luciferase基因的片段, 执行和实施例 六所描述的完全相同的操作, 在最后得到的克隆中, 随机选择 7个克隆做测
序, 结果显示: 其中有 5个克隆的质粒子中含有预期长度的被克隆的序列片 段,将其和 Luciferase基因序列做比较, 则都分别在后者中发现了对应的序 列组成。
实施例九:
以实施例四所得到的产物为基础, 制备能够表达所得到的目标序列片段 的单链发卡回环结构的 R A结构;
如图 36a和 36b和 36c所示意,则是制备同时含有被克隆的 19个碱基的 目标序列的片段及其反向复制的载体, 其实施过程如下- 首先, 用 Sap I对以上图 36a和 36b和 36c的示意中所得到的载体库进 行酶切,然后, 回收所得到的酶切产物,并将之与一个 5' 端经过磯酸化处理 的具有自身互补结构的单链 DM分子构成的适应子相连接; 这里所用的适应 子的序列结构是-
5, (phosphate) -TTC AGA AGA GCA TCA GCT CAC TGA ATC CAG TGA GCG' GAT GCT CTT CT 3, (SEQ ID NO: 25)
连接反应 Horie等提供的方法进行 (Horie K et al ; 1994); 这里的连 接产物在经过常规的沉淀回收后, 进一步经 Mly l的作用, 然后, 回收所得到 的酶切产物, 并将之与另一个同样是 5' 经过磷酸化处理的适应子相连接,这 里的适应子的序列结构是:
5, (phosphate) -TTG TCT TCT ACT CCT CGC ACT CTC CAG CCT CTC CCC GCA IJU T AGG AGT AGA AGA CAA 3, ;
这里的连接反应条件与前一步骤中的条件相似, ,连接反应的产物再经过 Uracil Glycosylate在
37 °C、 30分钟的处理后, 即通过以下的引物,将单链 DNA转化成双链 DNA; 这里所用的引物的序列结构是:
5' TGC GGG GAG AGG CTG GAG AGT GCG AGG AGT AG 3, (SEQ ID NO:
26) ;
这里单链转换成双链的反应,相当于仅一个循环的 PCR反应, 其循环条件 是: 95°C 2分钟, 68°C 5分钟; 反应产物通过常规的连接反应被克隆到前面 曾经提及的 pj-l载体的 EcoRV位点中去; 接着, 则在此基础上, 对位于 19个碱 基长度的正链及其反向复制之间的中间序列进行必要的置换, 如图 36a和 36b 和 36c所示意, 其实施的途径是:
利用 Fokl进行酶切, 并利用大片段酶即 Klenc 将酶切后留下的末端补 齐; 经常规的分子生物手段更换缓冲液后, 再用 Sap I进行酶切, 然后通过电
泳的办法, 将酶切产生的小片段丢弃, 而载体部分则回收; 后续的步骤则是 将经两次酶切后在载体上形成的两个末端上连进一个由两条互补的寡聚 DNA 链组成的适应子, 这两条寡聚 DNA链的序列结构是:
5, TTC AAG AGA GAA GAG CAT GCC ATC GAG CGC TCT TCA GAG 3' (SEQ ID NO: 27);
5, CTC TGA AGA GCG CTC GAT GGC ATG CTC TTC TCT CTT 3, (SEQ ID NO:
28);
对以上连接反应得到的产物, 经过常规的转化、 扩增后, 再利用 Sap I 进行酶切, 并使酶切后留下的载体部分进行自连, 这样, 以上所说的位于 19 个碱基长度的正链及其反向复制之间的中间序列就变换成了设计的以下的序 列结构:
5' TTC AAG AGA 3,
将这里自连得到的产物, 经常规的转化、 扩增后, 然后再经过以下的处 理:首先用 BseRI酶切,然后再用 Bbsl进行酶切,再用大片段酶即 Klenow将 Bbsl 作用后留下的末端补齐;常规的电泳分离后,丢掉载体部分,同时将接近 50 bp 的片段回收, 并将回收的片段用于紧接着进行的连接反应, 这里的连接反应 的载体部分则来自 pU6- BB; pU6-BB的具有序列表中序列 29所示的核苷酸序 列, 序列 29由 3952个碱基组成。
这里, pU6- BB先经过 Bbsl的酶切, 然后再用大片段酶将 Bbsl酶切后留 下的末端补齐, 所得的产物, 再用 BseRI酶切, 接着再用常规的电泳手段将 所得的产物分离, 载体部分用于这里的连接反应; 以上获得的接近 50 bp的 片段以定向的方式连入这里由 pU6- BB经过以上处理获得的载体后,则得到了 本实施例要得到的最终产物.任意选取十个克隆并对其中含有的序列进行测 定, 结构表明, 所有克隆均含有预期的序列特征, 而所有的克隆中包含的来 源最初的 Hela细胞的 niRNA的 19个碱基长的目标序列片段,都可以在相关的 公共数据库中, 找到相对应的基因序列或者 EST序列。
实施例十:
本例中的研究目的,是将 pA- EGFP中所含有的绿色荧光蛋白 EGFP的编码 ' 基因为目标序列,克隆任意具备 21个碱基长度的片段, 并制备含有被克隆的 片段及其反向复制的序列产物, 并进一步制备可以培养的哺乳动物细胞中能 够表达干扰 EGFP基因的表达的含有以上来源的 19碱基互补区的小 RNA分子。
本例的具体实施过程基本上是由对实施例四和实施例八所描述的过程的 修饰形成的, 所以, 整个实验过程只是对实施例四作了以下的改动:
由于实施例四中的目标序列的来源是 mRNA分子, 而这里确是克隆于 pA - EGFP中的绿色荧光蛋白的编码基因,所以,这里首先利用以下一对引物做 PCR反应来扩增 EGFP的编码基因片段, 这一对引物是:
引物 A: 5, CCA TGG TGA GCA AGG GCG AGG AGC TGT TC 3, (SEQ ID NO: 30);
引物 B: 5' TTA CTT GTA CAG CTC GTC CAT GC 3, (SEQ ID NO: 31); PCR反应的循环温度为: 95 ° C 1分钟、 57° C 1分钟、 72 ° C 1分钟,共 反应 30个循环;所得的 PCR产物则经过常规的电泳回收, 而回收获得的 PCR 产物, 则用于利用以上的引物 B进行的单链扩增反应, 扩增反应的循环温度 为: 95 ° C 1分钟、 57° C 1分钟、 72 ° C 1分钟,共反应 30个循环;单链扩增 反应所得到的相当于 EGFP编码基因的反义链的产物,就在回收后被用于后续 的实验;和图 33及其相关的描述中提及的情形相比,这里得到的相当于 EGFP 反义链的产物, 在实验的实施过程中, 相当于获得了单链互补 cDNA的阶段, 而在后续的步骤中,除了在双链合成的过程中,将图 33中所示意的 Primer 1 ' 换成这里的引物 B并同时对 PCR反应的复性温度稍作调整外, 其它的步骤则 完全相同; 最后得到的产物则同样是克隆进 PU6-BB中的产物, 而分别对这些 产物所含有的不同的被克隆片段的测序表明, 这些产物的序列结构完全符合 实验预期,而它们所含有的不同的被克隆的片段, 则分别对应于 EGFP编码框 架的不同区域。
工业应用
本发明提供了一种新的基因操作的方法。 利用本发明提供的方法, 不但 可以对任意目标序列的任意需要的位点进行精确修饰, 而且还可以对此位点 及其周围的序列进行精确修饰; 还可以对目标序列中的任意位点特定长度的 片段进行克隆操作等, 这些都为目标序列的结构和功能等方面的研究提供了 全新的工具。
Claims (24)
- 权利要求1、 一种操作目标 DNA序列的方法, 包括以下步骤:1 )在目标 DNA序列中引入至少一个含有 SRE特异识别位点的外源序列; 所述外源序列含有至少一个 SRE特异识别位点;2 )对 1 ) 中得到的序列中的所述目标 DNA序列中的两个位点之间的序列 片段进行操作; 所述两个位点中至少一个是由所述外源序列中的 SRE特异识 别位点对应的 SRE在所述目标 DNA序列上的一个切割位点; 所述两个位点不 包含和所述 SRE的切割位点对应的 SRE识别位点所在的外源序列在所述目标 DNA序列中的引入位置。
- 2、 艮据权利要求 1所述的方法, 其特征在于: 步骤 2 ) 中所述两个位点 的中一个位点是所述外源序列中的 SRE特异识别位点对应的 SRE在所述目标 DNA序列上的一个切割位点,另一个位点是在目标 DNA序列中含有的或外源引 入的 RE的切割位点或其它特异位点。
- 3、 根据权利要求 2所述的方法, 其特征在于: 所述外源引入的 RE的切 割位点在操作上被视作目标 DNA序列上的位点;通过与任意外源序列中的 SRE 特异识别位点对应的 SRE在所述目标 DNA序列上的切割位点引入所述目标 A 序列以外的其它序列所含有的任意位点在操作上也被视作目标 DNA序列上的 位点。
- 4、 根据权利要求 1所述的方法, 其特征在于: 步骤 2) 中所述两个位点 的均为在所述目标 DNA序列中引入的外源序列中含有的 SRE特异识别位点对 应的 SRE在所述目标 DMA序列上的切割位点。
- 5、 根据权利要求 4所述的方法, 其特征在于: 和所述切割位点对应的SRE的特异识别位点位于同一个外源序列中。 '
- 6、根据权利要求 5所述的方法, 其特征在于: 所述切割位点是由所述外 源序列中两个可被相同或不同的 SRE识别位点对应的 SRE作用产生。
- 7、根据权利要求 5所述的方法, 其特征在于: 所述切割位点是由所述外 源序列中同一个 SRE识别位点对应的 SRE同时在所述目标 DNA序列中的两个 位置切割产生。
- 8、 根据权利要求 2所述的方法, 其特征在于: 所述两个切割位点是由两 个外源序列中含有的相同或不同的 SRE特异识别位点对应的 SRE切割产生。
- 9、 根据权利要求 1所述的方法, 其特征在于: 对步骤 2 ) 中所述两个位 点之间的序列片段进行的操作, 包括以下步骤: 1 )在所述目标 DNA序列的特定位点或随机位点上引入一个至少含有一个 SRE特异识别位点的外源序列 F1;2 )利用与 F1中含有的 SRE特异识别位点对应的 SRE在所述目标 DNA序 列上制造双链断裂, 在该双链断裂处引入另一个至少含有一个 SRE特异识别 位点的外源序列 F2;利用与 F2中含有的 SRE特异识别位点对应的 SRE在所述 目标蘭 A序列上制造双链断裂,在该双链断裂处引入第三个至少含有一个 SRE 特异识别位点的外源序列 F3; 重复该操作直至在所述目标 DNA序列中引入第 n个外源序列 Fn, 其中 n 3;3 )利用任意两个外源序列中的位点对所述目标 DNA序列进行下述两种操 作:①当所述两个外源序列是连续插入时, 所述两个位点至少有一个是任意 一个外源序列中含有的 SRE特异识别位点对应的 SRE在所述目标 DNA序列中 切割产生的在所述两个外源序列之外的位点;②当所述两个外源序列是非连续插入的外源序列时, 使用所述两个外源 序列分别含有的任意一个 SRE特异识别位点和 /或其它位点进行操作。
- 10、 根据权利要求 1所述的方法, 其特征在于: 步骤 2 ) 中所述在目标 DNA序列中引入的含有或不含有 SRE特异识别位点的外源序列是直接被引入 或通过对所述直接引入的外源序列作突变修饰形成。
- 11、 根据权利要求 1所述的方法, 其特征在于: 步骤 2 ) 中所述操作包 括对所述两个位点之间的目标 DNA序列进行序列置换和 /或全部或部分序列 进行删除。
- 12、 根据权利要求 1所述的方法, 其特征在于: 将所述两个位点之间的 目标 DNA序列片段克隆出来。
- 13、 根据权利要求 12所述的方法, 其特征在于: 所克隆得到的目标 DNA 序列片段是位于所述两个位点之间完整的目标 DM序列片段。
- 14、 根据权利要求 12所述的方法, 其特征在于: 所克隆得到的目标 DNA 序列片段是含有突变的位于所述两个位点之间的目标 DNA序列片段。
- 15、根据权利要求 12所述的方法, 其特征在于: 所述两个位点之间的目 标 DNA序列片段含有外源序列, 该外源序列被用于对所克隆的目标 DNA序列 片段进行突变操作。
- 16、 根据权利要求 1所述的方法, 其特征在于: 所述含有 SRE特异识别 位点的外源序列在与所述 SRE特异识别位点对应的 SRE切割作用完成后, 并 在该切割位点引入外源序列或利用该切割位点将目标 DNA序列片段克隆之后 被完全删除。
- 17、根据权利要求 13所述的方法, 其特征在于: 所述完整的目标 DNA序 列片段包含有外源序列;所述外源序列可在后续步骤中删除,使所述目标 DNA 序列片段完全恢复。
- 18、根据权利要求 1或 13所述的方法, 其特征在于: 将所述克隆得到的 目标 DNA序列片段转换为由正区,中间区和反区三部分组成的双链 DNA序列, 将该双链 DNA序列表达为具有发夹回环结构的互补腿序列。
- 19、 根据权利要求 18所述的方法, 其特征在于: 所述克隆得到的目标 DNA序列片段长度为 19 - 29bp, 优选为 21 - 23bp。
- 20、 根据权利要求 18或 19所述的方法, 其特征在于: 所述发夹回环结 构使具有该发夹回环结构的互补 R A序列能诱导 RNAi效应。
- 21、 根据权利要求 18或 19所述的方法, 其特征在于: 在克隆得到目标 DNA序列片段后, 按以下步骤进行操作:1 )在所述目标 DNA序列片段的一端引入一个适应子 (adaptor) ; ' 2 )在所述目标 DNA序列片段的另一端制备至少一个引物区;3) 以步骤 2) 中得到的结构为模板, 以与该引物区互补的寡聚核苷酸序 列为引物进行聚合反应, 得到由正区、 反区和中间区组成的双链 DNA序列。
- 22、 一种操作目标 DNA序列的方法, 包括以下步骤-1 )在任意长度的 DNA序列的一端引入一个适应子 (adaptor) ;2)在所述 DNA序列的另一端制备至少一个引物区;3) 以步骤 2 ) 中得到的结构为模板, 以与该引物区互补的寡聚核苷酸序 列为引物进行聚合反应, 得到由正区、 反区和中间区组成的双链 DNA序列。
- 23、根据权利要求 22所述的方法, 其特征在于: 所述 DNA序列的长度为 19- 29bp, 优选为 21- 23bp。
- 24、 一种操作目标 DNA序列的方法, 所述目标 DNA序列含有待检测的可 变区, 所述方法是将含有 SRE特异识别位点的外源序列或 SRE特异识别位点 弓 I入所述目标 DNA序列, 然后利用该 SRE特异识别位点对应的 SRE作用, 在 所述目标 DNA序列的可变区形成切割末端, 并利用该切割末端的特点对所述 目标 DNA序列的可变区的核酸序列进行检测。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN03136136 | 2003-05-16 | ||
CN03136136.6 | 2003-05-16 | ||
PCT/CN2004/000484 WO2004101783A1 (fr) | 2003-05-16 | 2004-05-14 | Methode d'utilisation d'une sequence d'adn cible |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1784491A true CN1784491A (zh) | 2006-06-07 |
Family
ID=33438180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200480011916.1A Pending CN1784491A (zh) | 2003-05-16 | 2004-05-14 | 操作目标dna序列的方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN1784491A (zh) |
WO (1) | WO2004101783A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111394379B (zh) * | 2020-02-25 | 2023-11-03 | 武汉科技大学 | 基于重组酶和超保真dna聚合酶的大载体dna的定点突变方法 |
-
2004
- 2004-05-14 CN CN200480011916.1A patent/CN1784491A/zh active Pending
- 2004-05-14 WO PCT/CN2004/000484 patent/WO2004101783A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2004101783A1 (fr) | 2004-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210363570A1 (en) | Method for increasing throughput of single molecule sequencing by concatenating short dna fragments | |
AU2016365720B2 (en) | Methods and compositions for the making and using of guide nucleic acids | |
US7262031B2 (en) | Method for producing a synthetic gene or other DNA sequence | |
CN114787347B (zh) | 新颖的mad核酸酶 | |
CN107406875A (zh) | 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法 | |
CN109196115A (zh) | 跟踪核酸靶标来源以用于核酸测序的方法和试剂盒 | |
JP2015536680A (ja) | 分子の作製 | |
US20210198660A1 (en) | Compositions and methods for making guide nucleic acids | |
CN103882530B (zh) | 用随机序列标记质粒对dna片段进行高通量两端测序的方法 | |
US11339427B2 (en) | Method for target specific RNA transcription of DNA sequences | |
EP3485034B1 (en) | System and method for transposase-mediated amplicon sequencing | |
WO2020172199A1 (en) | Guide strand library construction and methods of use thereof | |
AU2003267008B2 (en) | Method for the selective combinatorial randomization of polynucleotides | |
AU2017217868B2 (en) | Method for target specific RNA transcription of DNA sequence | |
CN1784491A (zh) | 操作目标dna序列的方法 | |
US20050106590A1 (en) | Method for producing a synthetic gene or other DNA sequence | |
WO2024119461A1 (en) | Compositions and methods for detecting target cleavage sites of crispr/cas nucleases and dna translocation | |
US20240352507A1 (en) | Method for increasing throughput of single molecule sequencing by concatenating short dna fragments | |
WO2024209000A1 (en) | Linkers for duplex sequencing | |
CA3167758A1 (en) | Methods of sample normalization | |
Glick et al. | Molecular Genetics: Gene Isolation, Characterization and Manipulation | |
KR20160149158A (ko) | 고집적도 올리고뉴클레오티드 디자인을 통한 유전자 합성 방법 | |
WO2005010184A1 (ja) | 変異の検出方法 | |
WO2005038026A1 (ja) | 変異のタイピング方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |