CN101679976A - 核酸和文库 - Google Patents

核酸和文库 Download PDF

Info

Publication number
CN101679976A
CN101679976A CN200880018518A CN200880018518A CN101679976A CN 101679976 A CN101679976 A CN 101679976A CN 200880018518 A CN200880018518 A CN 200880018518A CN 200880018518 A CN200880018518 A CN 200880018518A CN 101679976 A CN101679976 A CN 101679976A
Authority
CN
China
Prior art keywords
nucleic acid
cell
mirna
selected marker
target sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880018518A
Other languages
English (en)
Other versions
CN101679976B (zh
Inventor
约翰内斯·阿德里安努斯·盖肯
阿齐姆·莫哈姆戴利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kings College London
Original Assignee
Kings College London
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kings College London filed Critical Kings College London
Publication of CN101679976A publication Critical patent/CN101679976A/zh
Application granted granted Critical
Publication of CN101679976B publication Critical patent/CN101679976B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及包含以5′至3′方向排列的以下连续元件的核酸:启动子、选择性标记物、用于接受核酸片段的克隆位点和多腺苷酸化信号,其中,所述片段包含候选miRNA靶序列,所述元件的排列使由所述启动子指导的转录本包含按以上述顺序排列的所述选择性标记物、所述候选miRNA靶序列和所述多腺苷酸化信号。合适地,miRNA测试序列为3′UTR或源自3′UTR。本发明还涉及制备和筛选文库的方法。

Description

核酸和文库
发明领域
本发明涉及如核酸和文库的物质,其用于调控RNA(例如小RNA(miRNA))的功能分析,特别是用于测试或筛选调控RNA的靶标,例如3′非翻译区(UTR)序列。
背景技术
目前认为小RNA(miRNA)是调控许多基因表达的一类新型小调控RNA分子。已经证明它们介导血管生成,细胞粘附,细胞增殖、存活,并在造血作用中发挥重要作用。它们由初级RNA转录本(pri-miRNA)产生,该初级RNA转录本被DROSHA酶加工成~70bp的双链,随后被DICER进一步加工成~22bp miRNA双链。22bp双链的一条链与RNA诱导的沉默复合体(RISC)结合,该复合体靶向mRNA的3′非翻译区(UTR)内的位点,从而导致翻译抑制、mRNA切割或诱导脱腺苷化。目前认为,在人中,RISC复合体主要通过与靶mRNA的3′UTR的结合以及mRNA靶标的较低程度降解来诱导特异性翻译抑制,从而发挥作用。
小RNA(miRNA)属于长度为21-25个核苷酸的、成熟的非编码小RNA家族。它们对蛋白编码基因的表达进行负调控。miRNA由初级miRNA(pri-miRNA)前体转录本经连续加工而产生,并在转录后水平上调控基因表达。miRNA的表达具有高度的组织特异性和发育阶段特异性,但关于如何调控这些表达谱却知之甚少。现已鉴定出的人miRNA基因超过541个,但目前生物信息学方法预测该数据为约1,000个。目前的评估表明,大约三分之一的人mRNA似乎是miRNA靶标。已经证明,这些miRNA介导血管生成,细胞粘附,细胞增殖、存活,并在造血作用和癌症中发挥重要作用。
由于miRNA和其靶标之间的部分同源性以及miRNA抑制翻译而并不是mRNA降解,靶标的鉴定成为难题。已经研发出根据“种子(seed)”序列预测miRNA靶标的生物信息学算法。四种主要算法预测出101,031个miRNA/靶标对(平均每个miRNA有200个靶标)。在这些对中,仅有0.01%(12)是由所有四种算法共同预测出的,2.8%由其中三种算法预测,15.4%由两种算法预测,81.8%仅由一种算法预测。在经鉴定的465个人miRNA中,仅有57个miRNA具有位于85个基因中的经试验验证的103个靶位点。
迄今为止,对大多数miRNA的作用及其特异性靶标还几乎一无所知。这主要是由于靶标鉴定中的困难造成的,因为与小干扰RNA(siRNA)相反,miRNA结合仅仅部分是由于与靶标的同源性。此外,翻译抑制使mRNA表达阵列试验不能用于靶标的发现。
为了更深入地了解miRNA的功能,人们在利用各种算法进行miRNA靶标的计算机鉴定方面作出了许多努力(例如miRBase(Sanger Institute:http://microrna.sanger.ac.uk/sequences/),TargetScan(Whitehead Institute forBiomedical Research:http://www.targetscan.org/和PicTar(New York University:http://pictar.bio.nyu.edu/))。然而,这些预测的缺点在于它们都产生了大量的假阳性。此外,由于所述预测主要是基于从极少的已知miRNA:靶标相互作用获取的信息,因此其很可能存在固有的偏差(由在统计学上非常小的样品量而导致预测的偏差几乎是理所当然的)。
对miRNA基因调控的现有技术中的研究缺乏鉴定和验证靶标所必需的工具,特别是缺乏功能性研究所必需的工具。
已知siRNA具有酶促作用并能够降解mRNA。因此,可以通过利用加入siRNA前后的表达谱阵列分析对siRNA进行研究。然而,由于大多数miRNA不具有引起mRNA降解的酶活性,而使这些类型的分析不能应用于miRNA的研究中。
现有技术中关于miRNA功能的另一个理论是,它们抑制肽的延伸。在这种情况下,为了分析miRNA的行为,将需要观察蛋白产物。
用于miRNA检测的现有技术是基于miRNA阵列。这些阵列只有根据miRNA自身序列的信息才能产生。此外,已经尝试利用针对特异miRNA的实时PCR对这些现象进行研究。然而,这种分析同样也依赖于了解准确的miRNA序列。
为了更深入地了解miRNA的功能,人们在利用各种算法进行miRNA靶标的计算机鉴定方面作出了许多努力。然而,这些预测的缺点在于它们都产生了大量的假阳性,并且由于所述预测主要是基于从少量的已知miRNA:靶标相互作用获取的信息,因此可能存在偏差。因此,在该领域中显然要通过计算机技术寻找候选miRNA。然而,用于寻找miRNA的计算机技术具有缺陷,例如其固有地偏向于实际上已经试验验证的少量miRNA。由于经验证的miRNA数量非常少,由此用于提取出保守基序或保守域的经验证的miRNA库也小。首先,这使得难以由少数已知序列的重叠外推出更宽的候选miRNA库。其次,在来自整体大组的任何统计学上的小样品中,都会存在偶然因素造成的固有统计学偏差。因此,由于作为计算机预测基础的miRNA数量非常小,在该预测中存在大的统计学偏差几乎是理所当然的。
此外,对于所述四种基本预测算法,仅有0.01%的miRNA/靶标对在各种算法中都被预测到。事实上,超过80%的配对仅被其中一种算法预测到。因此,准确鉴定或验证miRNA/靶标对是本领域的一个难题。
本领域的主要难点在于寻找miRNA的靶标。由于已知miRNA靶标的序列并不一定等同于miRNA序列本身,而使得寻找miRNA靶标特别困难。
尝试研究或量化miRNA作用的一个现有技术是Ambion Inc的荧光素酶试验。该试验包括利用Ambion的pMIR-REPORTTM质粒(目录号:AM5795),克隆靶标并与候选miRNA组合,随后进行设计用于读取任何作用的荧光素酶试验。首先,可以理解,在可以进行该此类分析前,通常需要了解靶标或候选靶标。其次,由于无法将不在筛选类型设置内的克隆与具有目标核酸的克隆相分离,需要对每个克隆个体进行单独处理。
另一种分析miRNA作用的方法是使用2D凝胶研究蛋白表达谱。在这种情况下,比较经miRNA处理和未经miRNA处理的各种蛋白的2D表达谱。然而,这种技术的灵敏度非常低。使用这种相当粗的方法非常可能没有检测到所有的蛋白。事实上,据估计在2D凝胶型蛋白表达分析中仅显示约10%的表达蛋白。很显然,这种方法对于miRNA作用的有效研究还不够灵敏。
此外,如上所述,由于miRNA并不按照与siRNA相同的方式降解靶标RNA,因此也不可能通过监测mRNA水平来研究miRNA的作用。
WO2004/097042公开了siRNA的选择方法。siRNA与其靶序列具有100%的同一性。所使用的克隆在每个转录本中仅包含一个标记物。该方法用于选择靶向所克隆的cDNA的siRNA。
现有技术具有以上缺陷。此外,现有技术中没有用于在miRNA领域中发现靶标的功能试验。另外,还有实例揭露了计算机模型的局限性。例如,LED7是来自线虫(C.elegans)的miRNA。该基因(已知为“致死7”)敲除多种基因并导致表达该基因的那些细胞系凋亡。利用计算机模型,可能鉴定出应当与LED7结合的预测序列。然而,通过试验证明这些预测靶标中的很多根本不与LED7结合。与之相比,已经研究了ETWK3基因。在该研究过程中,已经证明被称为miR143的miRNA是ETWK3的真正靶标。然而,miR143并没有被上述所有计算机模型所预测出,而最多仅由这些计算机模型中的一部分所预测出。因此,除了预测出了实际上并不与miRNA结合的靶标外,计算机模型还不能预测真正的miRNA配对。由此,可以理解,本领域的这些计算机系统具有许多与其相关的严重问题和缺陷。
本发明旨在克服与现有技术相关的问题。
发明概述
有利的是,本发明人设计了能够对调控RNA进行功能检测(例如检测miRNA的作用)的新系统。本发明将选择性基因标记物与可以插入候选3′UTR文库(UTR’s)的克隆系统进行了有利地组合。这样便可能以阳性方式和阴性方式研究各种miRNA的作用和特定RNA的表达。关键构思是所研究的RNA(候选3′UTR文库或miRNA作用的靶位点)直接与阳性和/或阴性选择性标记物的编码序列连接。
因此,通过追踪一个或多个选择性标记物,可以方便地获得特定miRNA作用的直接功能读数和这些mRNA。本发明是基于这种惊人的发现。本发明的主要优点是提供蛋白水平上的功能读数。虽然一些调控RNA(例如siRNA)引起靶RNA的切割,从而可以通过例如监测RNA的水平或切割在RNA水平上进行检测,然而其它调控RNA(例如miRNA)则不产生这种作用。如本文所述,通过检测蛋白水平上的作用,可以对大量调控RNA类型进行功能上的研究,这是相对于现有技术的进步。
因此,本发明主要提供了包含以5′至3′方向排列的以下连续元件的核酸:
a)启动子;
b)选择性标记物;
c)用于接受核酸片段的克隆位点,所述片段包含候选调控RNA靶序列;和
d)多腺苷酸化信号,
所述元件的排列使由所述启动子指导的转录本包含按上述顺序排列的所述选择性标记物、所述候选调控RNA靶序列和所述多腺苷酸化信号。
第一方面,本发明提供了包含以5′至3′方向排列的以下连续元件的核酸:
a)启动子;
b)至少两个选择性标记物;
c)用于接受核酸片段的克隆位点,所述片段包含候选调控RNA靶序列;和
d)多腺苷酸化信号,
所述元件的排列使由所述启动子指导的转录本包含按上述顺序排列的所述至少两个选择性标记物、所述候选调控RNA靶序列和所述多腺苷酸化信号。
合适地,所述核酸包括DNA,例如DNA质粒。当所述核酸包括DNA时,根据惯例来理解相关的RNA靶序列和小RNA等,即其定义出特定的核苷酸序列,且其并不一定要求所述核酸为RNA(或DNA-RNA杂合体)。因此,本领域技术人员可以理解,核酸的性质决定所述核苷酸序列在适当位点包含T或U,这是本领域的常识。
本发明的重要特征在于,所述元件的排列使所述启动子指导的转录本(单个转录本)包含按上述顺序排列的所述选择性标记物、所述候选调控RNA靶序列和所述多腺苷酸化信号(即作为单个“融合”RNA转录本)。用于非相关应用的已知质粒不能允许以此方式融合的转录本,例如传统的cDNA文库并不指导此类融合转录本。这是本发明的独特优点。
合适地,所述候选调控RNA靶序列为候选的小RNA(miRNA)靶序列或候选小干扰RNA(siRNA)靶序列。合适地,所述候选调控RNA靶序列为候选的小RNA(miRNA)靶序列。
所使用的与本发明核酸相关的术语“选择性标记物”具有本领域的通常含义,合适地,其表示包含编码多肽选择性标记物(即赋予选择特性或活性的多肽)的开放读框的核酸。
合适地,所述核酸还包含位于所述选择性标记物和所述克隆位点之间的终止密码子。合适地,所述终止密码子为终止盒,所述终止盒包含在三个正向读框的每一个中的终止密码子。
所述选择性标记物可以用于阳性选择。
所述选择性标记物可以用于阴性选择。
合适地,所述核酸还可以包含(e)转录终止子信号。通常认为多腺苷酸化信号对于高等真核生物(例如本发明的哺乳动物应用)而言是足够的,但如果将本发明用于低等真核生物(例如单细胞真核生物)乃至用于原核生物,则转录终止子可以对RNA转录提供有利的额外控制。
合适地,所述选择性标记物包含两个或更多个选择性标记物,合适地,其包含两个选择性标记物。合适地,所提供的所述两个或更多个选择性标记物为单个多肽或单个开放读框(即“融合蛋白”)。因此,合适地,所提供的所述两个选择性标记物为编码包含所述两个选择性标记物的单个多肽的开放读框。合适地,所述选择性标记物包含至少一个阳性选择标记物和至少一个阴性选择标记物。合适地,所述选择性标记物为HSVTK/PURO融合蛋白。
合适地,所述克隆位点为定向克隆位点。
合适地,所述克隆位点具有插入其中的包含3′UTR或候选3′UTR的核酸片段。另一方面,本发明提供了3′UTR文库,所述文库包含多个所述核酸。合适地,所述候选miRNA靶序列包含在cDNA文库(cDNA’s)中。合适地,所述候选miRNA靶序列小于6kb。合适地,所述候选miRNA靶序列约为2kb。
合适地,所述cDNA文库为脑cDNA文库、睾丸cDNA文库或来自急性髓细胞白血病细胞的cDNA文库。
本发明还提供了包含上述核酸的细胞,或包含上述文库的细胞。
另一方面,本发明提供了细胞群,所述细胞共同具有上述文库的至少一部分。
另一方面,本发明提供了制备3′UTR文库的方法,其包括提供上述核酸,和向所述克隆位点中插入包含3′UTR或候选3′UTR的核酸。
另一方面,本发明提供了制备5′UTR文库的方法,其包括提供上述核酸,和向所述克隆位点中插入包含5′UTR或候选5′UTR的核酸。
另一方面,本发明提供了包含上述核酸的载体。所述载体可以为任何基于核酸的载体,例如质粒载体、转座子载体、病毒或逆病毒载体或其它载体。合适地,所述载体为质粒载体。合适地,向所述载体中提供“穿梭”元件,从而使其可以在宿主生物体中繁殖和/或扩增。合适地,所述穿梭元件用于在大肠杆菌(E.coli)细胞中繁殖,并包含大肠杆菌的复制起点。
另一方面,本发明提供了用于鉴定miRNA靶序列的方法,其包括以下步骤:
(a)向宿主细胞中引入包含候选miRNA靶序列的上述核酸;
(b)选择表达所述核酸的至少一个选择性标记物的宿主细胞;
(c)向(b)的所述宿主细胞中引入至少一个目标miRNA;和
(d)检测所述核酸的至少一个选择性标记物在(c)的细胞中的表达,
其中,如果(c)的细胞没有显示至少一个选择性标记物的表达,则所述候选miRNA靶序列被鉴定为miRNA靶序列。
另一方面,本发明提供了用于鉴定对miRNA靶序列具有活性的miRNA的方法,其包括以下步骤:
(a)向宿主细胞中引入包含所述候选miRNA靶序列的上述核酸;
(b)选择表达所述核酸的至少一个选择性标记物的宿主细胞;
(c)向(b)的所述宿主细胞中引入至少一个目标miRNA;和
(d)检测所述核酸的至少一个选择性标记物在(c)的细胞中的表达,
其中,如果(c)的细胞没有显示至少一个选择性标记物的表达,则所述目标miRNA被鉴定为对所述miRNA靶序列具有活性的miRNA。
步骤(d)可以包括选除(select against)表达至少一个选择性标记物的细胞。
步骤(d)可以包括选出(select for)不表达至少一个选择性标记物的细胞。
另一方面,本发明提供了用于鉴定调控RNA的抑制剂的方法,其包括以下步骤:
(a)向宿主细胞中引入至少一个目标调控RNA;
(b)向所述宿主细胞中引入包含候选miRNA靶序列的上述核酸;
(c)选择不表达所述核酸的至少一个选择性标记物的宿主细胞;
(d)向所述宿主细胞中引入测试物质或核酸;
(e)检测至少一个所述选择性标记物在(d)的细胞中的表达;
其中,如果(d)的细胞显示至少一个选择性标记物的表达,则所述测试物质或核酸被鉴定为抑制所述调控RNA。
另一方面,本发明提供了用于鉴定调控RNA靶序列的方法,其包括以下步骤:
(a)向宿主细胞中引入包含候选调控RNA靶序列的上述核酸;
(b)选择表达所述核酸的至少一个选择性标记物的宿主细胞;
(c)向(b)的所述宿主细胞中引入至少一个目标调控RNA;和
(d)检测所述核酸的至少一个选择性标记物在(c)的细胞中的表达;
其中,如果(c)的细胞没有显示至少一个选择性标记物的表达,则所述候选调控RNA靶序列被鉴定为调控RNA靶序列。
合适地,所述调控RNA为siRNA,且所述候选调控RNA靶序列为候选siRNA靶序列。
另一方面,本发明提供的上述方法还包括将所鉴定的靶序列与目标调控RNA的已知靶序列进行比较的步骤,从而确定所述调控RNA的新靶序列。
另一方面,本发明提供了上述核酸,其中所述核酸包括一个或多个以下核酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6或SEQ ID NO:7。
另一方面,本发明提供了上述核酸,其中所述核酸选自质粒p3′UTR3、p3′UTRTKPuro、p3′UTRHyTK或p3′UTRTKzeo。
发明详述
有利地,本发明提供了用于发现和验证小RNA靶标的功能试验。可以理解,小RNA是一类调控RNA(如小调控RNA)。在本文列出的实施方案中还描述了其它类别的小调控RNA。具体而言,可以使用小干扰RNA(siRNA)取代小RNA。甚至可以将miRNA和siRNA的应用二者组合。方便起见,本发明描述的调控RNA多指miRNA。
术语“种子序列”是本领域熟知的,并通常表示调控RNA(例如siRNA或miRNA)的5′末端。其通常表示调控RNA的5′末端的6或7个碱基。其通常与靶序列100%匹配。
术语“3′UTR”在字面上表示3′非翻译区。这是mRNA的不翻译区,且通常为翻译调控(例如通过miRNA的翻译调控)的靶标。由于miRNA靶序列可能不是源自或未经试验证明是源自3′UTR,例如miRNA靶序列由产生于或来源于非mRNA源,所以本文通常使用该术语(3′UTR)表示范围更宽的术语“miRNA靶序列”。通常大多数或所有miRNA靶序列都是在3′UTR中发现的。然而,miRNA靶序列显然可以源自其它位置,例如整个基因组,或者甚至可以通过构建可能包含miRNA靶序列的文库或随机序列或半随机序列,从而人工产生miRNA靶序列。因此,必须清楚,本发明通常应用于miRNA靶序列,而本文中为了方便通常将其称为3′UTR,但所述靶序列或候选靶序列事实上可以来自不同于实际的经试验定义的3′UTR的一个或多个来源。合适地,所述miRNA靶序列为3′UTR,或源自3′UTR。
术语“克隆位点”具有其在本领域的通常定义。具体而言,其表示允许限制性酶或类似催化剂切割核酸从而在所述切割位点插入核酸的核酸元件或序列。克隆位点的实例为多克隆位点(MCS),其特点在于其核酸序列包含多个核酸限制性酶的识别位点,从而可以在单个克隆位点内选择克隆策略。合适地,本发明的克隆位点包含可以被至少一种限制性酶识别的核酸序列,合适地,所述限制性酶允许进行定向克隆,合适地,所述限制性酶为SfiI。因此,在一个实施方案中,所述克隆位点简单地为SfiI识别位点。
有利地,可以根据将用于表达的靶标细胞(宿主细胞)对本发明的待表达多肽的编码序列进行密码子优化。特别合适地,根据将用于选择的细胞对所述选择性标记物进行密码子优化。合适地,对于人细胞,根据人的标准进行所述密码子优化。
发明优点
用于分析miRNA作用的现有技术是基于荧光素酶的使用。荧光素酶是可以通过监测发光度或发射光来测定其活性的蛋白。荧光素酶不提供任何阳性或阴性选择。利用基于荧光素酶的系统筛选特定miRNA的作用无疑非常费力。首先,如果将该技术应用于3′UTR文库或候选3′UTR文库,则每次都必须在单独的处理中完成。这可能包括多达40-100,000次单独试验或处理。显然,这是一个非常繁琐且昂贵的方法。与之相反,根据本发明可以利用遗传选择技术对miRNA的作用进行评价。有利地,这可以选择表达某些选择性标记物的细胞,并有利于直接通过遗传的方式选择miRNA的作用(不论是阳性作用还是阴性作用),而不需要借助任何发光试验。除了避免费时的发光试验,本发明的另一个优点是能够平行处理多个分析,这是因为只有具有(表达)某些预定遗传构建体的细胞才能在筛选方法中幸存。
可以参考以下说明以更好地理解上述优点。首先,根据本发明,可以在第一步阳性筛选中选出具有特定遗传构建体的细胞。这导致没有携带目标核酸的细胞失去。因此,通过参比(通过筛选)所有存活细胞都必然携带有目标遗传构建体。随后可以对第一步阳性筛选得到的细胞群进行该方法的第二步骤。在该方法的第二步骤中,利用miRNA处理这些细胞,并选出miRNA影响目标标记物的蛋白表达的细胞。因此,通过进行该第二筛选步骤,在遗传上分离出具有对所研究的特定miRNA作出应答的遗传构建体的那些细胞。
本发明的优点是可以通过多步骤的选择方法研究细胞群。事实上,在实际操作中,本发明的优点是可以在单个培养皿中研究其细胞个体分别具有不同遗传构建体的细胞群。当然,当研究大的细胞群时,或者为方便起见而依靠于研究的形式时,多个培养皿也可能是有利的,但本发明的主要优点是多步骤的选择方法允许在选择阶段平行处理具有不同遗传构建体的细胞,而不是必须在整个方法中单独处理各个克隆个体。此类应用对于基于荧光素酶分析的现有技术显然是不可能的。关于这一点,至少一个理由是:将表达特定水平的荧光素酶的细胞与区别仅在于其荧光素酶表达的某些特性的相似细胞分离是不可行的。
选择性标记物
本发明的核酸还包含选择性标记基因。在相应选择性试剂存在下,选择性标记基因允许特异地选出或选除携带所述基因的细胞。选择性标记物可以是阳性、阴性或双功能的。阳性选择标记物允许选出携带所述标记物的细胞,而阴性选择标记物允许选择性地排除携带所述标记物的细胞。双功能选择性标记物包括用于阳性或阴性选择包含所述选择性标记基因或融合基因的细胞的方式(参见,Schwartz et al Proc.Natl.Acad.Sci USA 88:10416-10420(1991))。
在本发明的核酸和技术中使用选择性标记物带来本文指出的多个优点。一个优点是可以选择具有目标遗传构建体的细胞。此外,使用多个选择性标记物可以实现更复杂的选择方案。例如,通过使用两个选择性标记物可以选择出具有文库核酸的第一细胞群,并可以使用第二选择性标记物选择在加入miRNA后通过UTR下调表达的细胞。
通常,选择性标记基因可赋予宿主细胞耐药性(例如前药转化酶)或弥补宿主细胞的新陈代谢或分解代谢缺陷。例如,通常在哺乳动物细胞中使用的选择性标记物包括腺嘌呤脱氨酶(ada),潮霉素B磷酸转移酶(Hph),二氢叶酸还原酶(DHFR),胸苷激酶(TK),胸苷酸激酶(其转化AZT且可能比胸苷激酶更为强效),谷氨酰胺合成酶(GS),天冬酰胺合成酶的基因,和编码抗新霉素(G418)、嘌呤霉素、组氨醇、zeocin(zeocin可以被博来霉素)和/或腐草霉素(thleomycin)替代,三者的抗性基因相同;通常zeomycin由于其成本低廉而较适合)和杀稻瘟素S的基因。
适宜地,根据生产商的推荐使用选择剂。作为指导,ZEO选择可能需要大约3周,PURO选择可能需要大约1周。本领域技术人员可以操纵浓度和包括选择性标记物的表达水平在内的条件,从而根据需要改变选择时间。
选择性标记基因可以是能够弥补可识别的细胞缺陷的任何基因。因此,例如在应用缺乏HPRT活性的细胞时,可以将HPRT基因用作选择性标记基因序列。因此,该基因是表达产物可以用于选择突变细胞或用于“阴性选择”表达该基因产物的细胞的基因的实例。另一个实例是使用使携带该基因的细胞产生嘌呤霉素药物抗性的选择性标记基因嘌呤霉素N-乙酰基转移酶(Pac)。
另一种常用于哺乳动物表达系统的选择性标记基因为胸苷激酶。不含活性胸苷激酶(TK)的细胞不能在含胸腺嘧啶的培养基中生长,但能够在含核苷类似物(例如5-溴脱氧尿苷、6-硫代鸟嘌呤、8-氮杂鸟嘌呤等)的培养基中生长。相反,表达活性胸苷激酶的细胞能够在含次黄嘌呤、氨基蝶呤、胸腺嘧啶和甘氨酸的培养基(HATG培养基)中生长,但不能在含诸如5-氮杂胞苷的核苷类似物的培养基中生长(Giphart-Gassler,M et al Mutat.Res.214:223-232(1989),Sambrook et al,In:Molecular Cloning A Laboratory Manual,2nd Ed,Cold Spring Harbour Laboratory Press,N.Y.(1989))。包含作为选择性标记基因的活性单纯疱疹病毒胸苷激酶基因(HSV-TK)的细胞不能在更昔洛韦或类似试剂存在下生长。很明显,用于实现选择的试剂应该根据生产商的说明使用。可能需要根据所使用的特定构建体或选择性标记物来优化加入细胞的所述试剂的浓度或方式/时间,从而产生最强效和可信的选择。这种优化在本领域技术人员的能力范围内。甚至可以使用分级选择策略(split-level selectionstrategy),例如利用增高水平的目标试剂来选择表达最高的克隆,反之用较低水平的目标试剂筛选表达较低的克隆。此种变化在实施本发明的本领域技术人员的能力范围内。
此外,已经制备了具有较高药物敏感性的代谢酶突变体。例如,胸苷酸激酶F105Y提高了细胞对AZT的敏感性,从而可以使用较少的AZT,或可以在给定的AZT浓度下产生较快的死亡。还可以使用R16GLL突变体。此外,已经证明被称为SC39的HSVTK突变体对更昔洛韦和/或类似试剂的敏感性显著提高(Blumental et al,Mol.Therapy,2007)。因此,已知选择性标记物的突变也可以在本发明所述实施方案中获得应用。
因此,对于HSVTK阴性选择,可以使用胸苷酸激酶(例如F105Y等)。对于阳性选择,可以使用PURO、ZEO、HYGRO乃至NEO。合适地,本发明的融合体包含来自这些组的一个阳性标记物和一个阴性标记物。合适地,所述融合体可以按任意顺序排列。最优选是在实施例部分中的融合体。事实上,确实已经成功地证明了这些融合体如所示地发挥作用,这不可能根据对其他情况中其行为的理解而假定出来。
在本发明之前,已出现一些融合体,例如TK/ZEO(Cayla/Invitrogen)或HYGRO/TK(Immunex)。已知这些仅用于基因治疗类型的应用,例如在终止处理后使接受载体的细胞死亡(即,作为自杀基因使用)。优选在本文中首次公开的组合或融合体。无论如何,本发明所教导的调控RNA的融合体在此前从未描述或提示过。
此外,选择性标记物并不一定需要涉及细胞死亡,例如可以使用绿色荧光蛋白(GFP)/PURO(其它荧光物或可视蛋白)用于流式分选,即流式分选的选择性标记物。
特别合适的组合包括TK/PURO、wtThym/PURO、R16GLLThym/PURO、F105YThym/PURO、R16GLL-F 105YThym/PURO、F105YThym/Zeo、Zeo/F105YThym、GFP/PURO。
在一些实施方案中,可以使用具有单个选择性标记物的双重选择策略。在这个实施方案中,需要选择既能够进行阳性选择也能够进行阴性选择的选择性标记物。例如,由URA基因编码的代谢酶可以在某些真核系统中提供尿嘧啶独立性。因此,可以利用不含尿嘧啶的培养基阳性选择具有URA基因的细胞:仅有携带URA基因的细胞能够通过独立产生尿嘧啶而生长。该基因还能够将5-氟-乳清酸(5-FA)前体转化为毒性代谢物。因此,通过向培养基中引入5-FA选除具有尿嘧啶基因的细胞:具有URA基因的细胞将5-FA转化为毒性代谢物,由此通过选择程序被除去。因此,在该实施方案中,单个选择性标记物事实上既能够提供阳性选择步骤,也能够提供阴性选择步骤。然而,在大多数情况下,将通过提供两个或更多个选择性标记物来提供阳性选择和阴性选择步骤。
可以以类似的方式将胞嘧啶脱氨酶用作选择性标记物。正常的哺乳动物细胞不含胞嘧啶脱氨酶。表达胞嘧啶脱氨酶基因的细胞将相对无毒的前药5-氟胞嘧啶代谢为高毒性的5-氟尿嘧啶。因此,胞嘧啶脱氨酶可以用作选择性标记物,这样在不同的实施方案中,可以在利用5-氟胞嘧啶进行处理时进行阴性选择。
合适地,在本发明的核酸分子上在单个开放读框中以融合体的形式提供多个选择性标记物。
合适地,使用至少两个选择性标记物。合适地,使用三个选择性标记物。合适地,使用四个或更多个选择性标记物。
合适地,使用两个选择性标记物,合适地,所述两个选择性标记物为融合的。“融合(的)”具有本领域的通常含义,即其表示,合适地,所述标记物可以由编码具有各个所述标记物的氨基酸序列的多肽的单个开放读框表达。因此,“融合(的)”表示,合适地,在单个多肽中提供所述两个或更多个选择性标记物(或者由单个核酸或转录本编码包含所述两个或更多个选择性标记物的单个多肽)。换而言之,所述标记物的开放读框在核酸水平上“融合”,从而表达包含所述“融合(的)”两个(或更多个)标记物中每一个的氨基酸序列的“融合蛋白”。这样有利于进行随后的双重选择程序,例如阳性选出存在的遗传构建体,随后阴性选除在所测试的miRNA存在下没有下调表达的细胞。
因此,合适地,编码以单个“融合”多肽提供的两个或更多个选择性标记物的核酸在编码所述两个选择性标记物的开放读框部分之间没有任何终止密码子。
合适地,选择性标记融合体选自以下组合:TK/PURO、TK/HYGRO或TK/ZEO。通常可以颠倒所列出的选择性标记融合体,例如HYGRO/TK或TK/HYGRO等效,每个均应被理解为包括“HYGRO/TK”或“TK/HYGRO”。除非需要任何进一步的说明,否则,合适地,默认将融合体写为例如HYGRO/TK,表示N末端-HYGRO-TK-C末端。最合适地,选择性标记物为TK/PURO融合体。该融合体的优点是嘌呤霉素非常有效。这可能是最佳的选择性标记物。嘌呤霉素阻断蛋白合成。这样在实验室条件下,可以约1周内选择出纯的转染细胞群。
潮霉素也是一种非常有效的选择性标记物。潮霉素的功效与嘌呤霉素相当。
Zeomycin是嵌入剂。与嘌呤霉素或潮霉素相比,Zeomycin的作用模式较慢。这在某些情况下可能是有利的。
因此,合适地,所述选择性标记物为HSVTK和PURO蛋白的融合体。合适地,所述融合体包含SEQ ID NO:1,合适地,所述融合体由SEQ ID NO:1组成。
也可以使用其它前药转化酶替代HSVTK,例如β-葡糖苷酶或本文中提到的其它酶,特别是上文提到的酶(选择性标记基因)。
在广义的实施方案中,也可以使用其它选择细胞的方法(例如微珠选择)检测细胞表面标记物(例如LNGFR)的存在或缺失。
启动子
本发明的核酸包含与编码如选择性标记基因的编码序列可操作地连接的启动子。术语“可操作地连接”表示所述元件所处的关系允许其以预定的方式发挥功能。与编码序列可操作地连接的启动子所处的位置使得在所述启动子具有活性的条件下实现所述编码序列的表达。
术语“启动子”指控制可操作地与其相连的基因或序列的转录的多核苷酸序列。启动子包括用于RNA聚合酶结合和转录起始的信号。启动子是本领域熟知的术语,并涵盖大小和复杂性的范围在最小启动子至包括上游元件和增强子的启动子之间的多核苷酸序列。
启动子通常但不一定位于表达受其调控的编码序列的上游。此外,包含启动子的调控元件通常位于基因转录起始位点的2kb以内。
本领域技术人员可以理解,对特别有用的启动子的筛选依赖于具体细胞系和用于表达编码序列的表达载体的其它多个参数。本领域熟知来自多种不同来源的包括组成型、诱导型和抑制性启动子在内的大量启动子,其可以在数据库(例如GenBank)中得到鉴定,并可以从例如保藏库(例如ATCC)以及其它商业或个人来源获得作为克隆的多核苷酸或包含在克隆的多核苷酸内的启动子。
适合在本发明核酸中使用的启动子包括源于哺乳动物、微生物、病毒或昆虫基因的启动子。常用的哺乳动物细胞启动子序列源自多瘤病毒、腺病毒、逆转录病毒、乙型肝炎病毒、猿猴病毒40(SV40)和巨细胞病毒。还可以使用最小启动子,例如单纯疱疹病毒胸苷激酶启动子(HSVtk)。哺乳动物启动子,例如β-肌动蛋白启动子也适合在本发明的核酸中使用。来自宿主细胞或相关物种的启动子也可以是合适的。
可以使用组成型巨细胞病毒立即早期启动子,从而在哺乳动物细胞中获得高水平的基因表达。此类启动子可广泛获得,并可以获自例如Stratagene(例如,pCMV-
Figure A20088001851800201
载体)。本领域中还经常使用另一种组成型启动子SV40增强子/启动子(包括晚期SV40启动子或早期SV40启动子),其能够使哺乳动物细胞产生中等高水平的表达基因。
诱导型启动子也可是有利的。利用诱导型启动子,启动子的活性响应信号而提高或降低。例如,包含四环素操纵子序列(tetO)的四环素(tet)启动子可以被四环素调控的转录激活蛋白(tTA)诱导。tTA与tetO的结合在tet存在时受到抑制。Tet-On和Tet-Off基因表达系统(Clontech)使用四环素应答元件以开(组成型地关闭,但受四环素诱导)或关(组成型地打开,但受四环素或强力霉素抑制)的模式维持重组蛋白的表达。关于包括jun、fos和金属硫蛋白启动子和热休克蛋白启动子在内的其它合适的诱导型启动子的详细信息可以参见Sambrook et al,Molecular Cloning A Laboratory Manual,2nd Ed,Cold SpringHarbour Laboratory Press,N.Y.(1989)和Gossen et al Curr Opi Biotech5:516-520(1994)。
此外,可以通过加入其它调控序列(例如,可操作地与编码序列连接的增强子序列)对这些启动子中的任何一个进行修饰。增强子是作用于启动子从而提高转录的顺式作用DNA元件。增强子可能必须与启动子共同发挥作用,从而提高由启动子单独产生的表达水平。可操作地连接的增强子可以位于编码序列上游、编码序列内或编码序列下游,并可以距离启动子相当大的距离。转录终止子
本发明的核酸还可以包含转录终止子。“转录终止子”指通常由目标基因3′端表示的核苷酸序列或者待转录序列中导致RNA聚合酶终止转录的延伸片段。
多腺苷酸化信号是单独的遗传元件,其促进在初始转录本的3′-末端加入多腺苷酸序列。所述多腺苷酸化信号序列包括位于剪切位点上游约10-30个核苷酸的AATAAA序列和下游的序列。所述多腺苷酸化信号的位置可非常接近转录终止子(当存在时),在某些情况下甚至可能与其重叠。
通常,大多数转录终止子包括位于终止位点之前的富含GC的序列,和非模板DNA链中与所述终止位点连接的T-残基序列。RNA聚合酶经过富含GC的序列所产生的mRNA能够在mRNA内部形成稳定的碱基配对颈环结构。随后,转录通常在颈环结构的下游附近终止,此处由T残基产生主要包含尿苷酸残基的RNA末端(Brennan and Geiduschek,1983,Nucleic Acids Res.11:4157)。
终止子序列的一个实例来自牛生长激素基因。该终止子元件也可以产生多腺苷酸化信号。还可以从熟知的供货商获取终止子序列,例如ZAP载体系统(Stratagene)和pCMV-V5-His6(可获自Clontech实验室(PaloAlto,Calif.)。文献中描述了在哺乳动物表达系统中具有活性的终止子,且本领域技术人员可以容易地获得这些终止子。
转染/转化
“细胞转染”指将外源核酸引入到细胞中。有多种向细胞中引入DNA和RNA的方法,包括化学转染法(脂质体介导、非脂质体脂质、树枝状化合物)、物理递送法(电穿孔、显微注射、热休克)和基于病毒的基因转移(逆转录病毒、腺相关病毒和慢病毒)。通常根据细胞类型和克隆应用来选择方法,且其它方法对本领域技术人员也是熟知的。此类方法在许多标准实验室手册中都有阐述,例如Davis et al,Basic Methods In Molecular Biology(1986)。
所转染的遗传物质可以在细胞中瞬时表达或者持久表达。在瞬时转染中,DNA被转移并存在于细胞中,但核酸并不整合到宿主细胞的染色体中。瞬时转染通常可以在转染后24-72小时引起所引入RNA的高水平表达,在转染后48-96小时引起所引入DNA的高水平表达。可以通过将DNA载体整合到染色体DNA中获得稳定转染,其在所述细胞的基因组中持久表达。
可以使用利用可商购的脂质体(例如Lipofectinamine 2000)的转染、电穿孔或任何其它形式的转导方法。此外,可以将诸如小RNA的目标核酸克隆至病毒或非病毒表达质粒中,随后通过感染(病毒载体)或转染(非病毒载体)引入。这将产生细胞的稳定转导。其详细信息较为常见,且是本领域技术人员熟知的。具体而言,可按照Sambrook,E.F.Fritsch,and T.Maniatis,1989,Molecular Cloning:A Laboratory Manual,Second Edition,Books 1-3,ColdSpring Harbor Laboratory Press;Ausubel,F.M.et al.(1995and periodicsupplements;Current Protocols in Molecular Biology,ch.9,13,and 16,JohnWiley&Sons,New York,N.Y.)实施此技术。
利用外源核酸转染细胞的化学方法包括使用DEAE-葡聚糖、磷酸钙或人工脂质体。DEAE-葡聚糖是与带负电的核酸相连的阳离子聚合物。DNA/聚合物复合体中聚合物产生的过量正电荷允许所述复合物与带负电的细胞膜更紧密的结合。认为细胞随后对所述复合体的摄入是通过内吞作用进行的。该方法可以成功地将核酸递送至用于瞬时表达的细胞中。其它合成的阳离子聚合物也可以用于将核酸转移至细胞中,所述合成的阳离子聚合物包括聚凝胺、聚乙烯亚胺和树枝状化合物。
利用磷酸钙共沉淀法的转染可以用于瞬时或稳定转染多种细胞类型。这种方法包括将待转染的核酸与氯化钙混合,以可控的方式将其加入到缓冲盐水/磷酸盐溶液中,并将混合物在室温下温育。该步骤产生分散到所培养细胞上的沉淀。细胞通过内吞作用或噬菌作用摄取包含核酸的所述沉淀。已经在哺乳动物细胞中完成大规模的磷酸钙共沉淀转染,如J R Rayner and T JGonda(″A simple and efficient procedure for generaing stable expressionlibraries by cDNA cloning in a retroviral vector.″Mol Cell Biol.1994February;14(2):880-887)的教导。
使用人工脂质体的转染可用于获取外源核酸在宿主细胞中的瞬时表达或较长时间的表达。该方法还可以用于转染对磷酸钙或DEAE-葡聚糖无响应的某些细胞类型。
脂质体是能够与细胞膜实现融合并向细胞中释放核酸的小型膜结合体。在生理pH下总体带净正电荷的脂质是为利用人工脂质体的转染方法而研发的脂质体中最常见的合成脂质成分。阳离子脂质通常与中性脂质(例如L-二油酰磷脂酰乙醇胺,DOPE)混合。脂质分子的阳离子部分与带负电的核酸结合,从而使所述核酸束缚在脂质体/核酸复合体中。内吞作用之后,所述复合体出现于内涵体中,随后出现在细胞核中。使用阳离子脂质向哺乳动物细胞递送核酸的转染试剂来源广泛,并可购自于如Promega(TRNAsFastTM转染试剂)。
其它优点
先前并没有公开选择性标记物在miRNA的功能研究的应用。如上所述,本领域的分析通常局限于应用可量化的标记物,例如荧光素酶。在尝试量化特定miRNA对蛋白表达的作用时,荧光素酶特别具有吸引力。这样可以对进行的且在不同处理组之间比较的发光进行直接的可比测量。与之截然相反,选择性标记物在另外的二元基础上起作用。选择性标记物的基础构思是能够使具有所述标记物的细胞存活,并去除不具有所述标记物(或不表达所述标记物)的细胞。因此,可以认为在miRNA分析领域中使用选择性标记物是反直觉的。此外,与使用荧光素酶的现有技术相比,使用选择性标记物代表信息的损失。如上所述,这是由于荧光素酶非常适合量化和比较处理组间的表达水平,而利用选择性标记物几乎不能获得或测出这些信息。因此,认为本发明的方法和材料与现有技术相比是反直觉的。显然,在如此密切基于可比表达水平的领域(例如miRNA分析)中,采用将允许进行宽范围的正比例测量并推导相关蛋白表达的系统背景转化为仅允许进行二元分析的系统的思路将被直接摈弃。推理地,对于可以从此类分析中有效提取的信息而言,这的确似乎是退步。然而,如本文所证明的,事实上,其对于将遗传筛选技术应用于miRNA功能分析中是令人惊奇的有用,特别是对于所述miRNA靶标的鉴定更是如此。
本发明的优点是使用了定向克隆策略。在优选的实施方案中,使用了SfiI克隆。这是一个罕见的限制性剪切酶。SfiI切割8个碱基对的识别序列。此外,SfiI切割在两个切割末端产生对称的突出端。这样有利于在SfiI酶切后实施定向克隆策略。这些技术公开于现有技术中,例如美国专利第5,595,895号,其通过引用并入本文。显然,本发明包括适合用于核酸构建体的任何定向克隆系统,例如BstXI克隆。用于定向克隆的限制性酶可以为BstXI。其也公开于美国专利第5,595,895号中。SfiI定向克隆由于其简单性而被优选。利用SfiI克隆的另一个优点是8个碱基对的识别序列在基因组中相对较罕见。例如,如果使用较常见的限制性剪切酶(例如Spe I或Hind III),则其在克隆操作中酶切靶序列的风险也相应较高,而使用较长的识别序列(例如8个碱基对的识别序列)则可以降低这种风险。
与其它领域的表达载体相反,优选本发明核酸的特征是选择性标记物之后的终止密码子。在该实施方案中,当所述选择性标记物为由核酸编码的多肽时,所述选择性标记多肽的翻译终止于所述终止密码子。因此,无论作为3′UTR或候选3′UTR而存在于本发明核酸中的任何序列是否编码任何多肽,都不影响本发明的实施。事实上,存在于3′UTR或候选3′UTR中的任何此编码序列在理论上都不融合到选择性标记物的多肽中可以是本发明的优点。因此,紧邻在编码所述选择性标记多肽的开放读框之后的一个或多个终止密码子(适合地为终止盒)具有阻止或至少阻碍对任何其它下游核酸序列进行翻译的优点。
终止盒是本领域普遍知晓的遗传元件。总起来说,终止盒包含至少三个终止密码子,所述终止密码子以重叠或非重叠的方式排列,使得在所述终止盒的5′末端和3′末端之间终止密码子在三种可能的正向读框的每一种中存在。所述终止密码子可以重叠,也可以被少数核苷酸分隔,例如被一个、两个、四个、五个或更多核苷酸分隔。明显地,所述终止密码子不可能被三个、六个、九个或可以被三整除的其它任何数量的核苷酸分隔,因为以这种方式排列的终止密码子不会存在于不同的读框中。然而,当然应当注意,根据需要,框中有两个或更多个终止密码子也是有用的,例如用于防止通读,并因此可以将其用于合适的实施方案中,例如适宜地利用重复的或二重终止密码子乃至终止盒。本领域技术人员熟知这些细节。
cDNA文库
合适地,3′UTR文库或候选3′UTR文库源自cDNA文库。合适地,所述cDNA文库为哺乳动物cDNA文库。合适地,所述cDNA文库来自感兴趣的组织或疾病。例如,所述cDNA文库可以来自脑。这样的优点是所利用的组织提供最多样性的cDNA文库。这样可以从单个组织制备cDNA文库,但这些cDNA文库却有最大可能性代表最大可能数量的不同基因。在另一个实施方案中,cDNA文库可以来自感兴趣的疾病。此类疾病的一个实例为急性髓细胞白血病。在该实施方案中,合适地,所有所述cDNA文库均源自急性髓细胞白血病细胞。这具有提供可能与所选疾病相关的3′UTR文库或候选3′UTR文库的优点。
原则上,3′UTR文库或候选3′UTR文库可以源自任何合适的遗传源。cDNA文库是获取3′UTR文库或候选3′UTR文库的特别便利的来源。利用cDNA文库作为目标UTR文库的来源具有多个优点。首先,可以利用寡聚-dT来筛选cDNA文库,例如单独利用寡居-dT或是利用寡聚-dT与随机六聚体的组合进行筛选。这样可以使文库在3′末端(该末端邻近polyA尾)最为强效(robust)。由于其制备方法,cDNA文库具有5′末端未被充分表现的倾向,特别对于最长的cDNA转录本。然而,这对于利用cDNA文库作为3′UTR文库或候选3′UTR文库的来源的影响最小(如果有),原因是cDNA文库的3′末端通常得到最完整且多样的序列的最佳表现。
当然,在基因的5′UTR或其它位置内也可能存在miRNA靶标位点。因此,使用寡聚-dT和随机六聚体的组合有利地使得由此产生的cDNA文库覆盖更多的候选miRNA靶标位点。
由于cDNA文库通常用于编码多肽的研究,所以此类物质能够用作不同UTR文库或候选UTR文库的来源本身就是令人惊奇的。
任选地,可以根据大小选择所述候选3′UTR。这样的优点是优化了核酸的整体大小。这样的另一个优点是可以基于对衍生出3′UTR的目标生物或组织中3′UTR的最常见大小的知识而使包括最大可能数量的完整3′UTR的机会最佳化。
宿主细胞
有利地,本发明的试验可以在宿主细胞中(或对宿主细胞)进行。合适地,所述宿主细胞为真核细胞。合适地,所述宿主细胞为来自多细胞生物体的细胞。合适地,所述细胞来自昆虫或脊椎动物。当所述细胞来自脊椎动物时,合适地,它们是哺乳动物细胞。合适地,所述细胞与所研究的miRNA或3′UTR“同源(cognate)”,合适地,所述细胞与所研究的miRNA和3′UTR二者都是“同源”的。同源优选表示源自相同的生物。这样的优点是细胞的加工系统(例如用于加工miRNA或用于翻译mRNA的系统)将是通用的,并因此可以提供用于研究或检测miRNA-3′UTR功能的生物学上最相关的条件。
在一些实施方案中,期望所述宿主细胞与所研究的miRNA和/或3′UTR的来源不同。此类应用的一个实例为存在可以干扰所研究的靶序列(例如3′UTR或候选3′UTR)或与所研究的靶序列(例如3′UTR或候选3′UTR)相互作用的内源miRNA的情况。在该实施方案中,期望所使用的细胞或细胞系来自与miRNA和/或靶序列的来源生物体不同的生物体。例如,在研究人miRNA时,可能期望使用昆虫细胞,例如Sf9细胞。这样可能能够避免天然存在的miRNA或内源miRNA“干扰”研究或筛选或使研究或筛选复杂化。当然可以通过向所述一个或多个细胞中引入携带靶序列的核酸并检测选择性标记物的表达,从而直接检测目标细胞或细胞系中是否存在内源的干扰miRNA。如果即使在不加入或引入目标miRNA时也未观察到表达,则可能表示天然存在的miRNA或内源的miRNA抑制或下调了选择性标记物的表达。这种观察结果表明在开始进行针对性的研究或筛选前需要解决这种问题,例如通过检测其他细胞或细胞系直至建立了用于在内源miRNA不存在时可靠表达选择性标记基因的条件。参考本文提供的指导,这对于本领域技术人员来说显然是常规技术。
合适地,所述宿主细胞至少包含用于miRNA加工和蛋白表达的必要细胞器。此外,如上所述,通过引入本发明的核酸和监测标记基因的表达容易地对其进行检测。
合适地,细胞包括3T3细胞,例如NIH 3T3小鼠成纤维细胞(虽然这些细胞表达MIR 10a和MIR 130);人HL60或Jurkat细胞(其优点在于不表达显著的MIR 10a或MIR 130);人HeLa细胞(其优点在于表达非常低的MIR 10a和MIR 130);Cos细胞(其优点在于易于被转染)。
HIH 3T3和HeLa细胞具有易于被转染的额外优点。
最合适地,所述细胞为MCF7细胞。
在文库或筛选模式中,考虑到如果在所使用的宿主细胞中内源表达其miRNA,则UTR不会通过第一轮筛选/选择,细胞系可以被认为是“自清除”的。
特别合适的是如实施例部分指明的细胞或细胞系。
其他应用
小RNA在诸如分化,血管生成,细胞粘附,细胞增殖、存活的很多生物过程中发挥作用,并在造血过程中发挥重要作用。已经证明,它们还在癌症中发挥重要作用。因此,本发明可以有利地应用在很多不同的工业领域中。
本发明人阐述了所开发的用于鉴定小RNA靶标的功能试验,该功能试验能够在一个方法中鉴定特定小RNA的多个靶标。这发现了跨越小RNA研究拓展领域的应用。
有利地,对该筛选方法进行改进可以使本发明在来自不同生物体的miRNA和/或miRNA靶标方面是有用的。此外,小RNA靶标的鉴定对于小RNA在其中发挥重要作用的疾病(例如癌症)非常重要。所鉴定的靶标为小分子的开发提供了新靶标(例如BCR/ABL、glivec等)。
此外,本发明还提供了用于克隆在HSVTK/puro之后的UTR的新质粒,例如图2所示。
本发明还提供了新型选择性标记融合体。
基因的5′UTR内也可能存在miRNA靶标位点。因此,与单独使用寡聚-dT相比,使用寡聚-dT和随机六聚体的组合有利于使cDNA文库覆盖更多的靶标位点。
调控RNA的调控剂
利用特定小RNA的靶标,所述系统可用于鉴定该小RNA的调控剂。表达与选择性标记物(例如TKpuro融合体)相连的靶序列(例如靶标UTR)和小RNA的细胞群将具有更昔洛韦抗性和嘌呤霉素敏感性。如果随后向这些细胞中引入某种物质或cDNA文库并在嘌呤霉素中选择,则可以鉴定出调控该小RNA表达的基因,即阻止或抑制miRNA作用并由此允许或提高选择性标记物(在不存在所述基因或物质时,选择性基因的表达被抑制)表达的基因或物质。
换而言之,该系统可用于研究或筛选对调控RNA(例如小RNA)进行调控的基因、化学物质、小分子或其它实体。例如,如果mirX调控靶标Y,那么为了鉴定下调mirX表达的实体或处理,需要向所述细胞中引入该物质或基因(例如cDNA文库或小分子文库)。mirX的下调将引起选择性标记物(例如puroTK)的表达并使所述细胞产生嘌呤霉素抗性。当所述测试实体为cDNA时,鉴定所引入的cDNA将揭示调控mirX表达和/功能的基因。本领域技术人员熟知,当所述实体为小分子时,此小分子文库可以便利地应用于单一试验或多个化合物,并常例如通过使用机器化样品操作方便地进行自动化处理。
脱靶筛选
很多调控RNA(例如siRNA分子)都处于研发或临床试验中。本发明的实施方案可以用于根据所述siRNA的脱靶效应来筛选这些siRNA分子。这是该系统的另一个非常重要的工业应用和用途。
在这些实施方案中,所述系统可用于研究调控RNA(例如小干扰RNA,siRNA)的脱靶效应。临床试验中正在开发的很多siRNA分子是用于敲减诸如癌症中的致癌基因(例如BCL2)和/或其它遗传疾病中涉及的突变基因。单个siRNA的问题是由于种子序列(在siRNA或小RNA的5′末端的六聚体序列)引起的脱靶效应。设计不含种子序列的siRNA是不切实际的,该种子序列除了目标序列以外在人基因组中不存在。这仅是由于人基因组的大小和这种短序列(例如6mer)在基因组中的唯一存在的可能性造成的。预期在人基因组中这种种子序列可能出现数百次。具有脱靶种子序列的siRNA可以在这些不恰当的位点或脱靶位点发挥小RNA(仅与靶标部分同源,而siRNA与靶标100%同源)的作用。本文中阐述的系统可用于检测推定的siRNA分子的可能的脱靶效应。合适地,可以使用全长cDNA文库作为本发明核酸中的候选调控RNA靶序列的来源。这样的优点是,与截短的cDNA或其他来源相比,其更有可能涵盖所有可能的种子序列,不过当然如果需要同样也可以使用所述截短的cDNA或其他来源。
以下通过实施例对本发明进行阐述。这些实施例用于说明而非限制本发明的权利要求书。
附图说明
图1表示本发明方法的示意图。
图2表示本发明核酸的示意图。
图3表示本发明核酸的示意图。
图4表示本发明核酸的示意图。
图5表示本发明核酸的示意图。
图6表示荧光素酶/MAFB UTR下调表达的条形图和MAFB蛋白表达的照片。
图7和图8表示第10天GCV敏感性的条形图。
图9表示mir-10a和mir-130a表达的条形图。
图10表示第7天TKZEO更昔洛韦的条形图。
图11表示第13天TKZEO更昔洛韦的条形图。
图12表示第7天AZT敏感性的条形图。
图13表示MCF7细胞对mir10a和mir130a的瞬时表达(上)和稳定表达(下)。
图14表示本发明的代表性脑UTR文库的照片。
图15A表示所选根据大小选择的cDNA;图15B表示用Sfi I酶切的克隆文库。
图16表示文库的PCR分析。
实施例
实施例1:核酸
所构建的核酸包含按5′至3′方向排列的以下连续元件:启动子、选择性标记物、用于接受核酸片段的克隆位点(所述核酸片段包含候选miRNA靶序列)和多腺苷酸化信号。
所述元件的排列使所述启动子指导的转录本包含按以上顺序排列的选择性标记物、所述候选miRNA靶序列和所述多腺苷酸化信号。
实施例2:双选择性标记物
如本文所述,选择性标记物是本发明的关键部分。在某些实施方案中,所述选择性标记物可以有利地包含多于一种活性。该实施例证明了具有多于一种活性的选择性标记物的产生。在这个实施例中,这可以通过将两个不同的选择性标记物个体的ORF融合成单个核酸片段而实现。这样可以便利地产生包含两个不同的多肽域且每个多肽域具有其特定(选择性)活性的单个多肽。
在该实施例中,所使用的两个标记物个体为HSVTK和PURO。可以将其融合而形成TK/PURO双选择性标记物。
本发明人研究了HSVTK和PURO的开放读框。为了使所述融合产物尽可能地保留其活性,基于对所述多肽产物性质的考虑来选择合适的融合点。在该阶段,可以决定两个多肽之间的结合处是否包含连接子(例如连接区或“系链”(tether)或其它此类连接)。还需要注意操作实务,例如扫描核酸序列中可能干扰本发明方法或融合体的使用的限制性酶识别位点(例如在这个阶段应有利地除去预期用于在本发明的最终核酸中插入UTR的SfiI、BstXL或其它限制性酶位点)。合适地,可以通过定点突变产生或类似技术实现此类位点的去除。
随后可以产生所述核酸序列,并根据需要进行连接。这可以通过本领域已知的任何合适的方法实现。例如,这可以通过限制性酶切并将不同的元件连接在一起以形成融合体(根据需要,包括对中间片段的选择性填充或平端化)来实现。或者,这可以通过期望片段的PCR扩增以及随后的适当克隆/连接来实现。也可以以完整的形式直接合成所设计的完整核酸序列,例如通过化学方式合成。
在该实施例中,产生Hygro/TK融合体。该融合体具有SEQ ID NO:3所示的序列。
实施例3:HSVTK/PURO双选择性标记物
在本实施例中,将两个选择性标记物融合从而产生包含两种活性/多肽的单个翻译产物。
在本实施例中,所使用的两个标记个体为HSVTK和PURO。将其融合从而形成TK/PURO双选择性标记物。
研究HSVTK和PURO的开放读框。随后根据实施例2的阐述将所述标记物融合。
所产生的选择性标记物示于SEQ ID NO:1中。这是一个双选择性标记物。这是本发明的TK-PURO融合体。
实施例4:具有双选择性标记物的核酸
在本实施例中,将两个选择性标记物并入到本发明的核酸中。
在本实施例中,产生具有作为选择性标记物的HSVTK/puro的核酸。
如实施例3所述,将所述两个选择性标记物融合,从而产生包含两种活性/多肽的单个翻译产物。
随后将编码所述双选择性标记物的该核酸序列并入到本发明的核酸中(启动子之后(即其下游或3′端)和3′UTR插入位点之前(即其上游或5′端))。
实施例5:3′UTR文库
根据本发明产生3′UTR文库。
通过提供上述核酸(例如实施例1所述的核酸)并将包含候选miRNA靶序列的核酸插入到所述克隆位点中,从而制备3′UTR文库。在本实施例中,所述候选miRNA靶序列是3′UTR或候选3′UTR。
更详细地,其中插入3′UTR或候选3′UTR的核酸包含在实施例4所述的核酸中。具体地,所述核酸包含在质粒p3′UTR3中(参见图2)。
在本实施例中,携带3′UTR或候选3′UTR的核酸片段为cDNA或源自cDNA。在此具体实施例中,所述cDNA源自脑。与其它任何组织相比,脑具有最大数量的独特转录本。这有利于产生具有最大多样性的文库。显然,可以使用来自任何组织的cDNA,为了使多样性最大化,当然也可以使用来自不同组织的cDNA混合物。
本发明人使用寡聚-dT引导的人脑cDNA文库(如上所述,脑表达最大数量的不同mRNA文库)。在这个cDNA文库中,cDNA已经被定向克隆至具有不同3′突出端(GGCCNNNNNGGCC)的两个SfiI位点中。
人3′UTR的平均长度为~1000nt。因此,利用SfiI对所述文库进行酶切并任选地根据大小进行选择,即分离1500bp以下的片段,从而确保捕获大多数3′UTR。随后,将该cDNA定向克隆至p3′UTR载体中TKpuro下游的SfiI位点中。
由此产生本发明的3′UTR文库。
实施例6:AML文库
将实施例5的技术应用于疾病特异性3′UTR文库的构建。
所述3′UTR(候选3′UTR)源自cDNA文库。在本实施例中,该文库源自急性髓细胞白血病细胞。
任选地,根据大小选择所述cDNA。在本实施例中,根据大小对其进行选择,大小最大为约1500nt。
随后将该cDNA定向克隆至p3′UTR载体中TKpuro下游的SfiI位点。
由此产生本发明的3′UTR文库。
实施例7:基于细胞的文库
根据以上实施例5或实施例6产生质粒文库并将其大规模引入到宿主细胞中。在本实施例中,所述细胞为非人细胞,并根据Mourtada et al 2005(Mourtada-Maarabouni M,Kirkham L,Farzaneh F,Williams GT.Functionalexpression cloning reveals a central role for the receptor for activated proteinkinase C 1(RACK1)in T cell apoptosis.J Leukoc Biol.2005.2:503)的阐述将所述文库引入所述细胞。
随后在嘌呤霉素存在下选择包含所述质粒文库的细胞,这样只有摄入了质粒文库的细胞才能够生长。
随后扩增所述细胞同时保持细胞库(collection)的多样性。随后混合扩增的细胞。随后保存混合的扩增细胞等分样品备用,例如冷冻保藏在-196℃的液氮中。
如果需要,将细胞解冻并重新培养以用于筛选/分析中。可以在任何时间运用嘌呤霉素选择以确保仅保留具有靶标质粒的细胞。如此获得的包含所述质粒文库的细胞库被认为是本发明的基于细胞的文库。
实施例8:筛选
本发明提供了用于鉴定并验证miRNA基因调控中的靶标的工具和方法。本发明还提供了用于鉴定miRNA靶标的功能试验,例如通过文库筛选。
选择研究(筛选研究)
在本实施例中,本发明人应用了用于鉴定由于miRNA与3′UTR的结合引起的蛋白下调的新的选择方法。为此,本发明人利用了克隆至HSVTK/Puro融合基因下游的3′UTR,当该融合基因表达时使细胞具有嘌呤霉素抗性和更昔洛韦敏感性。由于miRNA与3′UTR结合而产生的翻译下调将所述细胞转变为嘌呤霉素敏感性和更昔洛韦抗性细胞(相关概况可参见图1)。
为了证明该方法,本发明人将经验证的miRNA靶位点和HOXAl和MAFB基因的全长3′UTR克隆至p3′UTR中TKpuro下游的SfiI位点中(参见图2)。HOXAl和MAFB分别与miRNA mir-10a和mir-130a具有已知的相互作用(Garzon R,Pichiorri F,Palumbo T,et al.MicroRNA fingerprints duringhuman megakaryocytopoiesis.PNAS 2006;103:5078-5083)。
利用p3′UTR表达质粒转染小鼠或昆虫细胞,并在嘌呤霉素中进行选择以获得转染细胞群。
随后,转染前体miRNA(mir-10a、mir-130a,Ambion)和无序的对照RNA寡聚体并在更昔洛韦存在下扩增所述细胞,从而分离miRNA已经下调了TKpuro蛋白表达并将这些细胞转变为更昔洛韦抗性的克隆。
增殖存活的细胞,并通过PCR和测序验证HOXAl和MAFB靶标位点或UTR。
可以利用可商购的抗体(Insight Biotechnology)通过针对HSVTK的蛋白质杂交来研究miRNA存在时TKpuro的表达水平。
文库筛选
根据上述实施例5产生质粒文库并将其大规模引入到宿主细胞中。在本实施例中,所述细胞为非人细胞,且根据Mourtada et al 2005(Mourtada-Maarabouni M,Kirkham L,Farzaneh F,Williams GT.Functionalexpression cloning reveals a central role for the receptor for activated proteinkinase C 1(RACKl)in T cell apoptosis.J Leukoc Biol.2005.2:503)中的阐述将所述文库引入所述细胞。
在嘌呤霉素选择后,引入目标miRNA和/或对照miRNA。在本实施例中,引入的是mir-10a、mir-130a或无序寡聚体。
使用利用可商购的脂质体(例如Lipofectinamine 2000)的转染、电穿孔或其它任何形式的转导。
随后在更昔洛韦存在下培养包含所述文库的细胞,并检测抗性克隆中是否存在HOXAl或MAFB 3′UTR。
该方法还鉴定出了mir-10a和mir-130a的多个其它靶标。通过对这些克隆中的TK/puro表达进行蛋白质杂交分析验证这些靶标。该文库筛选技术被证明是用于鉴定和验证已知miRNA文库和尚未鉴定miRNA文库的靶标的非常宝贵的工具。
实施例9:脱靶筛选
在本实施例中,用于敲减肝癌相关基因的siRNA为目标调控RNA。合适地,其可以特异地靶向体内的肝脏。
为了研究所述调控RNA的脱靶效应,按照上文所述对与选择性标记物(例如TKpuro)相连的脑或肝3′UTR文库或cDNA文库进行检测。
将所研究的siRNA引入到细胞中。
随后,将来自更昔洛韦抗性集落的候选靶序列进行PCR并测序。如果回收到目标基因X以外的基因,则表示了所述调控RNA的脱靶效应。随后,可以对其进行评价或根据需要对其进行进一步研究。
这些结果有助于确定是继续进行试验,还是设计不同的调控RNA,例如siRNA。
实施例10:示例性文库筛选
A)本发明人用掺入(spiked)20%MAFBUTR的UTR文库转染MCF7和MCF7mir130A。在zeocin存在下筛选所述细胞,所有对照都死亡,且获得多个集落。将mir130A引入到所转染的MCF7细胞中,随后在嘌呤霉素存在下进行选择(7-10天),随后在更昔洛韦中进行选择。随后,对克隆进行测序。
B)除此之外,对MCF7和表达mir130A的MCF7mir130A进行二次筛选。由于MCF7并不天然地表达mir130A,因此在zeocin筛选后所回收的克隆中应有~20%包含MAFBUTR的克隆。然而,在MCF7mir130A中,MAFBUTR应被沉默从而引起zeocin抗性的丧失。在zeocin选择后,从第二次转染的MCF7mir130A回收的克隆应该不具有或几乎不具有MAFBUTR插入。
随后,从来自两次转染的混合细胞群中分离DNA,对UTR插入物(混合群)进行PCR。将这些插入物克隆至TA克隆载体中并对96孔板中的克隆个体进行测序。对来自各转染的约48个克隆进行测序。
随后,本发明人计算了MAFBUTR在来自MCF7和MCF7mir130A转染克隆中的存在机率。由此证明了所述方法的原理。
同时,所述方法也可以按照GCV筛选进行。
实施例11:进一步的文库筛选
本发明人转染了MCF细胞和MCF7(mir130)细胞。MCF不表达mir130,对于MCF7(mir130)中已引入了mir130并通过qPCR证明了mir130的表达。
在小规模试验(每次10个平板)中,发明人引入了克隆至p3′TKzeo载体中的文库。该文库中掺入了20%MAFB UTR(mir130的靶标)。
两个细胞系均在1mg/ml zeocin存在下进行选择,每个细胞系产生200-300个集落。由于MCF7中不存在mir130,MAFB UTR不应被下调。MAFBUTR的下调将引起TKzeo蛋白的缺失,从而导致这些细胞在zeocin中死亡。在MCF7(mir130)中,MAFBUTR被下调从而引起含有MAFBUTR的细胞死亡。
总之,在zeocin中选择后,MCF7细胞中~20%的克隆应包含MAFBUTR,而在MCF7(mir130)中,所述百分比应该低得多。为了对此进行研究,本发明人设计了仅扩增存在于所述文库中的MAFBUTR DNA而不能扩增内源MAFB的引物。结果示于图16中。在两个不同的细胞之间,MAFBUTRDNA的数量差异为~10X,这清楚地证明了所述方法的有效性。
本发明人还通过PCR扩增了存在于所述两种细胞中的完整UTR,并将PCR产物克隆至质粒中。对各种细胞的24个克隆进行测序。包含MAFB的克隆的数量也下降了4倍。
解释性说明:这可能是一种低估。不拘泥于理论,这可以是由于质粒制品的清洁度不同造成的。用于掺入的MAFBUTR为SigmaTM的maxiprepTM,而文库制品为qiagenTM的gigaprepTM。SigmaTM制备品可能更洁净从而形成更多的转染细胞。本领域技术人员显然可以根据本领域已知的任何合适的技术通过纯化文库制品从而使其得到优化。
此外,本发明人还向包含所述文库的MCF7细胞中引入了针对MAFBurt的mir10、mir130和短发夹RNA(shRNA)。将这些细胞置于zeocin选择条件下,这样将从表达mir130或shRNA的细胞中除去MAFBUTR,但不能除去表达mir10的细胞中的MAFBUTR。在平行的试验中,可以将这些细胞置于更昔洛韦选择条件下,这样将恢复表达mir130或shRNA的细胞中的MAFBUTR,但不能恢复表达mir10的细胞中的MAFBUTR。
实施例12:功能试验
选择比常规筛选(其中仍保留非目标物(non-hits),而不是使其消失或被选除)更有效,因此,本发明人应用了基于选择的如下筛选:
药物选择
阳性/阴性选择
选择性标记物(例如,puro、hygro、zeo或其它合适的选择性标记物)和前药转化酶(例如,HSVtk-GCV、胞嘧啶脱胺酶-5FC、腺苷酸激酶-AZT或其它合适的前药转化酶)的融合蛋白
用于筛选和FACS分选的GFP-puro融合体。
实施例13:3′UTR文库
根据如下所述构建文库:
3′UTR的中值长度为1kb
起始物质:脑cDNA文库
引导的寡聚dT:大多数插入物包含至少部分3′UTR
利用不同的Sfi I位点进行定向克隆
根据大小进行选择(>2.5kB)。
实施例14:筛选
HoxA1和MAFB分别被mir10a和mir130下调。
将HoxA1和MAFB UTR以及预测的靶位点克隆至pos/neg选择载体和荧光素酶载体中。
MAFB是miR-130的靶标(参见图6);还证实了mir10a对HOXA1的下调。
图7和图8显示了第10天的GVC敏感性。
图9显示了mir-10a和mir-130a的表达。
图10显示了第7天的TKZEO更昔洛韦,图11显示了第13天的TKZEO更昔洛韦。
图12显示了第7天的AZT敏感性。
图13显示了MCF7细胞对mir10a和mir130a的瞬时表达(上)和稳定表达(下)。
实施例15:文库制备的细节
按照以下所述制备文库:
根据大小选择经Sfi I酶切后>2.5Kb的cDNA
克隆至TKzeo Sfi I中
15μl连接物1μg TKzeo+200ng文库转化物(LibraryTransformed)1.0μl
从1000μl中取出1μl和10μl进行铺板
由1μl产生>500个集落
500×1000×15=7,500,000
50个小提物(minipreps)50个不同的插入物
收集±600,000个独立的克隆
Giga prep 7.5mg
图14显示了本发明的代表性脑UTR文库。
图15A和图15B分别显示了根据大小选择的cDNA和Sfi I酶切的克隆文库。文库中掺入了20%的MAFB-UTR质粒。
选择筛选:
转染到MCF7细胞和表达mir130A的MCF7细胞中。
利用zeocin选择转染细胞(~2000个集落)。
分离基因组DNA,通过对存在于MCF7+文库和MCF7mir130A+文库中的UTR进行qPCRPCR测定质粒MAFB-UTR的数量,并进行Topo TA克隆从而对克隆个体进行测序。
用针对MAFB的mir10A、mir130A和shRNA转染MCF7+文库+20%MAFB。
在zeocin中选择(减少MAFB)。
在更昔洛韦中选择(富集MAFB和鉴定mirl0A与mir 130A靶标)。
以上说明书中提及的所有出版物都通过引用并入本文。本发明中所述的各方面和实施方案的各种改进和变体对于本领域技术人员都是显而易见的,并且不背离本发明的范围。虽然根据具体优选的实施方案对本发明进行了阐述,但应该理解,本发明要求保护的范围应不仅限于此具体实施方案。事实上,对于本领域技术人员显而易见的用于实施本发明所述方式的各种改进都将落入以下权利要求书的范围之内。
序列表:
SEQ ID NO:1
TK-PURO融合体的核酸序列
ATGGCCTCGTACCCCGGCCATCAACACGCGTCTGCGTTCGACCAGGCTGCGCGTTCTCGCGGCCATAGCAACCGAC
GTACGGCGTTGCGCCCTCGCCGGCAGCAAGAAGCCACGGAAGTCCGCCCGGAGCAGAAAATGCCCACGCTACTG
CGGGTTTATATAGACGGTCCCCACGGGATGGGGAAAACCACCACCACGCAACTGCTGGTGGCCCTGGGTTCGCGC
GACGATATCGTCTACGTACCCGAGCCGATGACTTACTGGCGGGTGCTGGGGGCTTCCGAGACAATCGCGAACATCT
ACACCACACAACACCGCCTCGACCAGGGTGAGATATCGGCCGGGGACGCGGCGGTGGTAATGACAAGCGCCCAG
ATAACAATGGGCATGCCTTATGCCGTGACCGACGCCGTTCTGGCTCCTCATATCGGGGGGGAGGCTGGGAGCTCAC
ATGCCCCGCCCCCGGCCCTCACCCTCATCTTCGACCGCCATCCCATCGCCGCCCTCCTGTGCTACCCGGCCGCGCG
GTACCTTATGGGCAGCATGACCCCCCAGGCCGTGCTGGCGTTCGTGGCCCTCATCCCGCCGACCTTGCCCGGCACC
AACATCGTGCTTGGGGCCCTTCCGGAGGACAGACACATCGACCGCCTGGCCAAACGCCAGCGCCCCGGCGAGCG
GCTGGACCTGGCTATGCTGGCTGCGATTCGCCGCGTTTACGGGCTACTTGCCAATACGGTGCGGTATCTGCAGTGC
GGCGGGTCGTGGCGGGAGGACTGGGGACAGCTTTCGGGGACGGCCGTGCCGCCCCAGGGTGCCGAGCCCCAGAG
CAACGCGGGCCCACGACCCCATATCGGGGACACGTTATTTACCCTGTTTCGGGCCCCCGAGTTGCTGGCCCCCAAC
GGCGACCTGTATAACGTGTTTGCCTGGGCCTTGACGTCTTGGCCCAAACGCCTCCGTTCCATGCACGTCTTTATCCT
GGATTACGACCAATCGCCCGCCGGCTGCCGGGACGCCCTGCTGCAACTTACCTCCGGGATGGTCCAGACCCACGT
CACCACCCCCGGCTCCATACCGACGATATGCGACCTGGCGCGCACGTTTGCCCGAGAAATGAAGCTTACCATGACC
GAGTACAAGCCCACGGTGCGCCTCGCCACCCGCGACGACGTCCCCAGGGCCGTACGCACCCTCGCCGCCGCGTTC
GCCGACTACCCCGCCACGCGCCACACCGTCGATCCGGACCGCCACATCGAGCGGGTCACCGAGCTGCAAGAACTC
TTCCTCACGCGCGTCGGGCTCGACATCGGCAAGGTGTGGGTCGCGGACGACGGCGCCGCGGTGGCGGTCTGGAC
CACGCCGGAGAGCGTCGAAGCGGGGGCGGTGTTCGCCGAGATCGGCCCGCGCATGGCCGAGTTGAGCGGTTCCC
GGCTGGCCGCGCAGCAACAGATGGAAGGCCTCCTGGCGCCGCACCGGCCCAAGGAGCCCGCGTGGTTCCTGGCC
ACCGTCGGCGTCTCGCCCGACCACCAGGGCAAGGGTCTGGGCAGCGCCGTCGTGCTCCCCGGAGTGGAGGCGGC
CGAGCGCGCCGGGGTGCCCGCCTTCCTGGAGACCTCCGCGCCCCGCAACCTCCCCTTCTACGAGCGGCTCGGCTT
CACCGTCACCGCCGACGTCGAGGTGCCCGAAGGACCGCGCACCTGGTGCATGACCCGCAAGCCCGGTGCCTGA
SEQ ID NO:2
质粒骨架的核酸序列
GCTAGCATCGATAAGAATTCCGGATCCTTAGGCCATTAAGGCCGGCCGCCTCGGCCCACTTCGTGGGGTACCGAGC
TCGAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAG
CACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGTGGCCG
AGGAGCAGGACTGACACGTGCTACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGT
TTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTT
ATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCT
AGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCGTCGACCTCTAGCTAGAGCTTGGCGTAA
TCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAA
GTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCG
GGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCT
TCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGG
TAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGG
AACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGC
TCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGC
TCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATG
CTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAG
CCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAG
CAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACT
ACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAG
CTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAA
AAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGG
GATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTA
AAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATT
TCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTG
CTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCG
AGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAG
TTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGG
CTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAGCGGTTAGCTC
CTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATT
CTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGC
TCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACC
CACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAA
AATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAG
CATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCG
CACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGATCGGGAGATCTCCCGATCCCCTATGGTCGACTCTCAGTA
CAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCG
AGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTG
CGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGG
GGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCC
AACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCA
ATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTG
ACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTAC
ATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGAC
TCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTC
CAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAG
AGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAA
GCTG
SEQ ID NO:3
Hygro/TK融合体的核酸序列
ATGGGTAAAAAGCCTGAACTCACCGCGACGTCTGTCGAGAAGTTTCTGATCGAAAAGTTCGACAGCGTCTCCGAC
CTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTGCTTTCAGCTTCGATGTAGGAGGGCGTGGATATGTCCTGCGGG
TAAATAGCTGCGCCGATGGTTTCTACAAAGATCGTTATGTTTATCGGCACTTTGCATCGGCCGCGCTCCCGATTCCG
GAAGTGCTTGACATTGGGGAATTCAGCGAGAGCCTGACCTATTGCATCTCCCGCCGTGCACAGGGTGTCACGTTGC
AAGACCTGCCTGAAACCGAACTGCCCGCTGTTCTGCAGCCGGTCGCGGAGGCCATGGATGCGATCGCTGCGGCCG
ATCTTAGCCAGACGAGCGGGTTCGGCCCATTCGGACCGCAAGGAATCGGTCAATACACTACATGGCGTGATTTCAT
ATGCGCGATTGCTGATCCCCATGTGTATCACTGGCAAACTGTGATGGACGACACCGTCAGTGCGTCCGTCGCGCAG
GCTCTCGATGAGCTGATGCTTTGGGCCGAGGACTGCCCCGAAGTCCGGCACCTCGTGCACGCGGATTTCGGCTCC
AACAATGTCCTGACGGACAATGGCCGCATAACAGCGGTCATTGACTGGAGCGAGGCGATGTTCGGGGATTCCCAAT
ACGAGGTCGCCAACATCTTCTTCTGGAGGCCGTGGTTGGCTTGTATGGAGCAGCAGACGCGCTACTTCGAGCGGA
GGCATCCGGAGCTTGCAGGATCGCCGCGGCTCCGGGCGTATATGCTCCGCATTGGTCTTGACCAACTCTATCAGAG
CTTGGTTGACGGCAATTTCGATGATGCAGCTTGGGCGCAGGGTCGATGCGACGCAATCGTCCGATCCGGAGCCGG
GACTGTCGGGCGTACACAAATCGCCCGCAGAAGCGCGGCCGTCTGGACCGATGGCTGTGTAGAAGTCGCGTCTGC
GTTCGACCAGGCTGCGCGTTCTCGCGGCCATAGCAACCGACGTACGGCGTTGCGCCCTCGCCGGCAGCAAGAAGC
CACGGAAGTCCGCCCGGAGCAGAAAATGCCCACGCTACTGCGGGTTTATATAGACGGTCCCCACGGGATGGGGAA
AACCACCACCACGCAACTGCTGGTGGCCCTGGGTTCGCGCGACGATATCGTCTACGTACCCGAGCCGATGACTTAC
TGGCGGGTGCTGGGGGCTTCCGAGACAATCGCGAACATCTACACCACACAACACCGCCTCGACCAGGGTGAGATA
TCGGCCGGGGACGCGGCGGTGGTAATGACAAGCGCCCAGATAACAATGGGCATGCCTTATGCCGTGACCGACGCC
GTTCTGGCTCCTCATATCGGGGGGGAGGCTGGGAGCTCACATGCCCCGCCCCCGGCCCTCACCCTCATCTTCGACC
GCCATCCCATCGCCGCCCTCCTGTGCTACCCGGCCGCGCGGTACCTTATGGGCAGCATGACCCCCCAGGCCGTGCT
GGCGTTCGTGGCCCTCATCCCGCCGACCTTGCCCGGCACCAACATCGTGCTTGGGGCCCTTCCGGAGGACAGACA
CATCGACCGCCTGGCCAAACGCCAGCGCCCCGGCGAGCGGCTGGACCTGGCTATGCTGGCTGCGATTCGCCGCGT
TTACGGGCTACTTGCCAATACGGTGCGGTATCTGCAGTGCGGCGGGTCGTGGCGGGAGGACTGGGGACAGCTTTC
GGGGACGGCCGTGCCGCCCCAGGGTGCCGAGCCCCAGAGCAACGCGGGCCCACGACCCCATATCGGGGACACGT
TATTTACCCTGTTTCGGGCCCCCGAGTTGCTGGCCCCCAACGGCGACCTGTATAACGTGTTTGCCTGGGCCTTGAC
GTCTTGGCCCAAACGCCTCCGTTCCATGCACGTCTTTATCCTGGATTACGACCAATCGCCCGCCGGCTGCCGGGAC
GCCCTGCTGCAACTTACCTCCGGGATGGTCCAGACCCACGTCACCACCCCCGGCTCCATACCGACGATATGCGACC
TGGCGCGCACGTTTGCCCGAGAAATGAAGCTTCGATAA
SEQ ID NO:4
TKzeo融合体的核酸序列
ATGGCTTCGTACCCCGGCCATCAACACGCGTCTGCGTTCGACCAGGCTGCGCGTTCTCGCGGCCATAGCAACCGAC
GTACGGCGTTGCGCCCTCGCCGGCAGCAAGAAGCCACGGAAGTCCGCCCGGAGCAGAAAATGCCCACGCTACTG
CGGGTTTATATAGACGGTCCCCACGGGATGGGGAAAACCACCACCACGCAACTGCTGGTGGCCCTGGGTTCGCGC
GACGATATCGTCTACGTACCCGAGCCGATGACTTACTGGCGGGTGCTGGGGGCTTCCGAGACAATCGCGAACATCT
ACACCACACAACACCGCCTCGACCAGGGTGAGATATCGGCCGGGGACGCGGCGGTGGTAATGACAAGCGCCCAG
ATAACAATGGGCATGCCTTATGCCGTGACCGACGCCGTTCTGGCTCCTCATATCGGGGGGGAGGCTGGGAGCTCAC
ATGCCCCGCCCCCGGCCCTCACCCTCATCTTCGACCGCCATCCCATCGCCGCCCTCCTGTGCTACCCGGCCGCGCG
GTACCTTATGGGCAGCATGACCCCCCAGGCCGTGCTGGCGTTCGTGGCCCTCATCCCGCCGACCTTGCCCGGCACC
AACATCGTGCTTGGGGCCCTTCCGGAGGACAGACACATCGACCGCCTGGCCAAACGCCAGCGCCCCGGCGAGCG
GCTGGACCTGGCTATGCTGGCTGCGATTCGCCGCGTTTACGGGCTACTTGCCAATACGGTGCGGTATCTGCAGTGC
GGCGGGTCGTGGCGGGAGGACTGGGGACAGCTTTCGGGGACGGCCGTGCCGCCCCAGGGTGCCGAGCCCCAGAG
CAACGCGGGCCCACGACCCCATATCGGGGACACGTTATTTACCCTGTTTCGGGCCCCCGAGTTGCTGGCCCCCAAC
GGCGACCTGTATAACGTGTTTGCCTGGGCCTTGGACGTCTTGGCCAAACGCCTCCGTTCCATGCACGTCTTTATCCT
GGATTACGACCAATCGCCCGCCGGCTGCCGGGACGCCCTGCTGCAACTTACCTCCGGGATGGTCCAGACCCACGT
CACCACCCCCGGCTCCATACCGACGATATGCGACCTGGCGCGCACGTTTGCCCGAGAGATGATCAGCGGAGCTAAT
GGCGTCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGG
ACCGACCGGCTCGGGTTCTCCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTG
TTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGA
GCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAGATCGG
CGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGC
AGGACTGA
SEQ ID NO:5
p3′HYTK
CCTAGGCTTTTGCAAAAAGCTTGGCCACATGGGTAAAAAGCCTGAACTCACCGCGACGTCTGTCGAGAAGTTTCT
GATCGAAAAGTTCGACAGCGTCTCCGACCTGATGCAGCTCTCGGAGGGCGAAGAATCTCGTGCTTTCAGCTTCGAT
GTAGGAGGGCGTGGATATGTCCTGCGGGTAAATAGCTGCGCCGATGGTTTCTACAAAGATCGTTATGTTTATCGGCA
CTTTGCATCGGCCGCGCTCCCGATTCCGGAAGTGCTTGACATTGGGGAATTCAGCGAGAGCCTGACCTATTGCATC
TCCCGCCGTGCACAGGGTGTCACGTTGCAAGACCTGCCTGAAACCGAACTGCCCGCTGTTCTGCAGCCGGTCGCG
GAGGCCATGGATGCGATCGCTGCGGCCGATCTTAGCCAGACGAGCGGGTTCGGCCCATTCGGACCGCAAGGAATC
GGTCAATACACTACATGGCGTGATTTCATATGCGCGATTGCTGATCCCCATGTGTATCACTGGCAAACTGTGATGGA
CGACACCGTCAGTGCGTCCGTCGCGCAGGCTCTCGATGAGCTGATGCTTTGGGCCGAGGACTGCCCCGAAGTCCG
GCACCTCGTGCACGCGGATTTCGGCTCCAACAATGTCCTGACGGACAATGGCCGCATAACAGCGGTCATTGACTGG
AGCGAGGCGATGTTCGGGGATTCCCAATACGAGGTCGCCAACATCTTCTTCTGGAGGCCGTGGTTGGCTTGTATGG
AGCAGCAGACGCGCTACTTCGAGCGGAGGCATCCGGAGCTTGCAGGATCGCCGCGGCTCCGGGCGTATATGCTCC
GCATTGGTCTTGACCAACTCTATCAGAGCTTGGTTGACGGCAATTTCGATGATGCAGCTTGGGCGCAGGGTCGATG
CGACGCAATCGTCCGATCCGGAGCCGGGACTGTCGGGCGTACACAAATCGCCCGCAGAAGCGCGGCCGTCTGGAC
CGATGGCTGTGTAGAAGTCGCGTCTGCGTTCGACCAGGCTGCGCGTTCTCGCGGCCATAGCAACCGACGTACGGC
GTTGCGCCCTCGCCGGCAGCAAGAAGCCACGGAAGTCCGCCCGGAGCAGAAAATGCCCACGCTACTGCGGGTTTA
TATAGACGGTCCCCACGGGATGGGGAAAACCACCACCACGCAACTGCTGGTGGCCCTGGGTTCGCGCGACGATAT
CGTCTACGTACCCGAGCCGATGACTTACTGGCGGGTGCTGGGGGCTTCCGAGACAATCGCGAACATCTACACCAC
ACAACACCGCCTCGACCAGGGTGAGATATCGGCCGGGGACGCGGCGGTGGTAATGACAAGCGCCCAGATAACAAT
GGGCATGCCTTATGCCGTGACCGACGCCGTTCTGGCTCCTCATATCGGGGGGGAGGCTGGGAGCTCACATGCCCCG
CCCCCGGCCCTCACCCTCATCTTCGACCGCCATCCCATCGCCGCCCTCCTGTGCTACCCGGCCGCGCGGTACCTTAT
GGGCAGCATGACCCCCCAGGCCGTGCTGGCGTTCGTGGCCCTCATCCCGCCGACCTTGCCCGGCACCAACATCGT
GCTTGGGGCCCTTCCGGAGGACAGACACATCGACCGCCTGGCCAAACGCCAGCGCCCCGGCGAGCGGCTGGACC
TGGCTATGCTGGCTGCGATTCGCCGCGTTTACGGGCTACTTGCCAATACGGTGCGGTATCTGCAGTGCGGCGGGTC
GTGGCGGGAGGACTGGGGACAGCTTTCGGGGACGGCCGTGCCGCCCCAGGGTGCCGAGCCCCAGAGCAACGCG
GGCCCACGACCCCATATCGGGGACACGTTATTTACCCTGTTTCGGGCCCCCGAGTTGCTGGCCCCCAACGGCGACC
TGTATAACGTGTTTGCCTGGGCCTTGACGTCTTGGCCCAAACGCCTCCGTTCCATGCACGTCTTTATCCTGGATTAC
GACCAATCGCCCGCCGGCTGCCGGGACGCCCTGCTGCAACTTACCTCCGGGATGGTCCAGACCCACGTCACCACC
CCCGGCTCCATACCGACGATATGCGACCTGGCGCGCACGTTTGCCCGAGAAATGAAGCTTCGATAAGAATTCCGGA
TCCTTAGGCCATTAAGGCCGGCCGCCTCGGCCCACTTCGTGGGGTACCGAGCTCGAATTCACTGGCCGTCGTTTTA
CAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGC
GTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGTGGCCGAGGAGCAGGACTGACACGTGCTA
CGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTTTCCGGGACGCCGGCTGGATGA
TCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAA
TAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCAT
CAATGTATCTTATCATGTCTGTATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGT
GTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAA
TGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGC
ATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTC
GCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCA
GGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGC
TGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACC
CGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCT
TACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTT
CGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGG
TAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGC
AGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTA
TTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCA
CCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTT
GATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAA
AGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCT
GACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTC
CCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCAC
GCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTT
TATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAAC
GTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACG
ATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGA
AGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGA
TGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCC
CGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGG
GCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCA
GCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGG
GCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATG
AGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCAC
CTGACGTCGACGGATCGGGAGATCTCCCGATCCCCTATGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGT
TAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAG
GCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCC
AGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATA
TGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTC
AATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAA
CTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCC
GCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATT
ACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCC
ACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGC
CCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAA
CCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTGGCTAG
SEQ ID NO:6
p3′TKPUR
GCTAGCTTATCGCATGGCCTCGTACCCCGGCCATCAACACGCGTCTGCGTTCGACCAGGCTGCGCGTTCTCGCGGC
CATAGCAACCGACGTACGGCGTTGCGCCCTCGCCGGCAGCAAGAAGCCACGGAAGTCCGCCCGGAGCAGAAAAT
GCCCACGCTACTGCGGGTTTATATAGACGGTCCCCACGGGATGGGGAAAACCACCACCACGCAACTGCTGGTGGC
CCTGGGTTCGCGCGACGATATCGTCTACGTACCCGAGCCGATGACTTACTGGCGGGTGCTGGGGGCTTCCGAGACA
ATCGCGAACATCTACACCACACAACACCGCCTCGACCAGGGTGAGATATCGGCCGGGGACGCGGCGGTGGTAATG
ACAAGCGCCCAGATAACAATGGGCATGCCTTATGCCGTGACCGACGCCGTTCTGGCTCCTCATATCGGGGGGGAGG
CTGGGAGCTCACATGCCCCGCCCCCGGCCCTCACCCTCATCTTCGACCGCCATCCCATCGCCGCCCTCCTGTGCTAC
CCGGCCGCGCGGTACCTTATGGGCAGCATGACCCCCCAGGCCGTGCTGGCGTTCGTGGCCCTCATCCCGCCGACCT
TGCCCGGCACCAACATCGTGCTTGGGGCCCTTCCGGAGGACAGACACATCGACCGCCTGGCCAAACGCCAGCGCC
CCGGCGAGCGGCTGGACCTGGCTATGCTGGCTGCGATTCGCCGCGTTTACGGGCTACTTGCCAATACGGTGCGGTA
TCTGCAGTGCGGCGGGTCGTGGCGGGAGGACTGGGGACAGCTTTCGGGGACGGCCGTGCCGCCCCAGGGTGCCG
AGCCCCAGAGCAACGCGGGCCCACGACCCCATATCGGGGACACGTTATTTACCCTGTTTCGGGCCCCCGAGTTGCT
GGCCCCCAACGGCGACCTGTATAACGTGTTTGCCTGGGCCTTGACGTCTTGGCCCAAACGCCTCCGTTCCATGCAC
GTCTTTATCCTGGATTACGACCAATCGCCCGCCGGCTGCCGGGACGCCCTGCTGCAACTTACCTCCGGGATGGTCC
AGACCCACGTCACCACCCCCGGCTCCATACCGACGATATGCGACCTGGCGCGCACGTTTGCCCGAGAAATGAAGC
TTACCATGACCGAGTACAAGCCCACGGTGCGCCTCGCCACCCGCGACGACGTCCCCAGGGCCGTACGCACCCTCG
CCGCCGCGTTCGCCGACTACCCCGCCACGCGCCACACCGTCGATCCGGACCGCCACATCGAGCGGGTCACCGAGC
TGCAAGAACTCTTCCTCACGCGCGTCGGGCTCGACATCGGCAAGGTGTGGGTCGCGGACGACGGCGCCGCGGTG
GCGGTCTGGACCACGCCGGAGAGCGTCGAAGCGGGGGCGGTGTTCGCCGAGATCGGCCCGCGCATGGCCGAGTT
GAGCGGTTCCCGGCTGGCCGCGCAGCAACAGATGGAAGGCCTCCTGGCGCCGCACCGGCCCAAGGAGCCCGCGT
GGTTCCTGGCCACCGTCGGCGTCTCGCCCGACCACCAGGGCAAGGGTCTGGGCAGCGCCGTCGTGCTCCCCGGAG
TGGAGGCGGCCGAGCGCGCCGGGGTGCCCGCCTTCCTGGAGACCTCCGCGCCCCGCAACCTCCCCTTCTACGAGC
GGCTCGGCTTCACCGTCACCGCCGACGTCGAGGTGCCCGAAGGACCGCGCACCTGGTGCATGACCCGCAAGCCC
GGTGCCTGACGCCCGCCCCACGACCCGCAGCGCCCGACCGAAAGGAGCGCACGACCCCATGCATCGATAAGAATT
CCGGATCCTTAGGCCATTAAGGCCGGCCGCCTCGGCCCACTTCGTGGGGTACCGAGCTCGAATTCACTGGCCGTCG
TTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAG
CTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGTGGCCGAGGAGCAGGACTGACAC
GTGCTACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTTTCCGGGACGCCGGCT
GGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGT
TACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAA
ACTCATCAATGTATCTTATCATGTCTGTATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTT
CCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTG
CCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCA
GCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACT
GACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAG
AATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGC
GTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCG
AAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTG
CCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCT
CAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGA
TTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGA
CAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACA
AACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGA
TCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTAT
CAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAATCAATCTAAAGTATATATGAGTAAACTT
GGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCT
GACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGA
CCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGC
AACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGC
GCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTG
TCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCC
GTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCT
CTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTC
TTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGA
TCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGA
ATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGT
CTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGT
GCCACCTGACGTCGACGGATCGGGAGATCTCCCGATCCCCTATGGTCGACTCTCAGTACAATCTGCTCTGATGCCG
CATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTAC
AACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTA
CGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGC
CCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATT
GACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTAC
GGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAA
TGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATC
GCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAG
TCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAAC
TCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTA
GAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTG
SEQ ID NO:7
p3′TKZEO
CATGGCTTCGTACCCCGGCCATCAACACGCGTCTGCGTTCGACCAGGCTGCGCGTTCTCGCGGCCATAGCAACCGA
CGTACGGCGTTGCGCCCTCGCCGGCAGCAAGAAGCCACGGAAGTCCGCCCGGAGCAGAAAATGCCCACGCTACT
GCGGGTTTATATAGACGGTCCCCACGGGATGGGGAAAACCACCACCACGCAACTGCTGGTGGCCCTGGGTTCGCG
CGACGATATCGTCTACGTACCCGAGCCGATGACTTACTGGCGGGTGCTGGGGGCTTCCGAGACAATCGCGAACATC
TACACCACACAACACCGCCTCGACCAGGGTGAGATATCGGCCGGGGACGCGGCGGTGGTAATGACAAGCGCCCA
GATAACAATGGGCATGCCTTATGCCGTGACCGACGCCGTTCTGGCTCCTCATATCGGGGGGGAGGCTGGGAGCTCA
CATGCCCCGCCCCCGGCCCTCACCCTCATCTTCGACCGCCATCCCATCGCCGCCCTCCTGTGCTACCCGGCCGCGC
GGTACCTTATGGGCAGCATGACCCCCCAGGCCGTGCTGGCGTTCGTGGCCCTCATCCCGCCGACCTTGCCCGGCAC
CAACATCGTGCTTGGGGCCCTTCCGGAGGACAGACACATCGACCGCCTGGCCAAACGCCAGCGCCCCGGCGAGC
GGCTGGACCTGGCTATGCTGGCTGCGATTCGCCGCGTTTACGGGCTACTTGCCAATACGGTGCGGTATCTGCAGTG
CGGCGGGTCGTGGCGGGAGGACTGGGGACAGCTTTCGGGGACGGCCGTGCCGCCCCAGGGTGCCGAGCCCCAGA
GCAACGCGGGCCCACGACCCCATATCGGGGACACGTTATTTACCCTGTTTCGGGCCCCCGAGTTGCTGGCCCCCAA
CGGCGACCTGTATAACGTGTTTGCCTGGGCCTTGGACGTCTTGGCCAAACGCCTCCGTTCCATGCACGTCTTTATCC
TGGATTACGACCAATCGCCCGCCGGCTGCCGGGACGCCCTGCTGCAACTTACCTCCGGGATGGTCCAGACCCACG
TCACCACCCCCGGCTCCATACCGACGATATGCGACCTGGCGCGCACGTTTGCCCGAGAGATGATCAGCGGAGCTAA
TGGCGTCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTG
GACCGACCGGCTCGGGTTCTCCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCT
GTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACG
AGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAGATCG
GCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAG
CAGGACTGACCGACGCCGACCAACACCGCCGGTCCGACGGCGGCCCACGGGTCCCAGGGTCGACCTCGAGATCC
TTAGGCCATTAAGGCCGGCCGCCTCGGCCCACTTCGTGGGGTACCGAGCTCGAATTCACTGGCCGTCGTTTTACAA
CGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTA
ATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGTGGCCGAGGAGCAGGACTGACACGTGCTACG
AGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTTTCCGGGACGCCGGCTGGATGATC
CTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATA
AAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCA
ATGTATCTTATCATGTCTGTATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGT
GAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATG
AGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCAT
TAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGC
TGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGG
GGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTG
GCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCG
ACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTA
CCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCG
GTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTA
ACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAG
AGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTT
GGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACC
GCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGA
TCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAG
GATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGA
CAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCC
CGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGC
TCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTA
TCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGAT
CAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAG
TAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATG
CTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCG
GCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGC
GAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGC
ATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGC
GACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAG
CGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTG
ACGTCGACGGATCGGGAGATCTCCCGATCCCCTATGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAGGCA
AGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGA
TATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGG
AGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAAT
AATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTG
CCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCC
TGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCA
TGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCC
CATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCA
TTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCC
ACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGTGGATCCCCCGGGCTGC
AGGAATTCGATATCAAGCTTATCG
序列表
<110>伦敦王室学院
约翰内斯·阿德里安努斯·盖肯
阿齐姆·莫哈姆戴利
<120>核酸和文库
<130>P2427PCO1
<160>7
<170>PatentIn version 3.3
<210>1
<211>1725
<212>DNA
<213>人工序列
<220>
<223>融合体
<400>1
atggcctcgt accccggcca tcaacacgcg tctgcgttcg accaggctgc gcgttctcgc  60
ggccatagca accgacgtac ggcgttgcgc cctcgccggc agcaagaagc cacggaagtc  120
cgcccggagc agaaaatgcc cacgctactg cgggtttata tagacggtcc ccacgggatg  180
gggaaaacca ccaccacgca actgctggtg gccctgggtt cgcgcgacga tatcgtctac  240
gtacccgagc cgatgactta ctggcgggtg ctgggggctt ccgagacaat cgcgaacatc  300
tacaccacac aacaccgcct cgaccagggt gagatatcgg ccggggacgc ggcggtggta  360
atgacaagcg cccagataac aatgggcatg ccttatgccg tgaccgacgc cgttctggct  420
cctcatatcg ggggggaggc tgggagctca catgccccgc ccccggccct caccctcatc  480
ttcgaccgcc atcccatcgc cgccctcctg tgctacccgg ccgcgcggta ccttatgggc  540
agcatgaccc cccaggccgt gctggcgttc gtggccctca tcccgccgac cttgcccggc  600
accaacatcg tgcttggggc ccttccggag gacagacaca tcgaccgcct ggccaaacgc  660
cagcgccccg gcgagcggct ggacctggct atgctggctg cgattcgccg cgtttacggg  720
ctacttgcca atacggtgcg gtatctgcag tgcggcgggt cgtggcggga ggactgggga  780
cagctttcgg ggacggccgt gccgccccag ggtgccgagc cccagagcaa cgcgggccca  840
cgaccccata tcggggacac gttatttacc ctgtttcggg cccccgagtt gctggccccc  900
aacggcgacc tgtataacgt gtttgcctgg gccttgacgt cttggcccaa acgcctccgt  960
tccatgcacg tctttatcct ggattacgac caatcgcccg ccggctgccg ggacgccctg  1020
ctgcaactta cctccgggat ggtccagacc cacgtcacca cccccggctc cataccgacg  1080
atatgcgacc tggcgcgcac gtttgcccga gaaatgaagc ttaccatgac cgagtacaag  1140
cccacggtgc gcctcgccac ccgcgacgac gtccccaggg ccgtacgcac cctcgccgcc  1200
gcgttcgccg actaccccgc cacgcgccac accgtcgatc cggaccgcca catcgagcgg  1260
gtcaccgagc tgcaagaact cttcctcacg cgcgtcgggc tcgacatcgg caaggtgtgg  1320
gtcgcggacg acggcgccgc ggtggcggtc tggaccacgc cggagagcgt cgaagcgggg  1380
gcggtgttcg ccgagatcgg cccgcgcatg gccgagttga gcggttcccg gctggccgcg  1440
cagcaacaga tggaaggcct cctggcgccg caccggccca aggagcccgc gtggttcctg  1500
gccaccgtcg gcgtctcgcc cgaccaccag ggcaagggtc tgggcagcgc cgtcgtgctc  1560
cccggagtgg aggcggccga gcgcgccggg gtgcccgcct tcctggagac ctccgcgccc  1620
cgcaacctcc ccttctacga gcggctcggc ttcaccgtca ccgccgacgt cgaggtgccc  1680
gaaggaccgc gcacctggtg catgacccgc aagcccggtg cctga                  1725
<210>2
<211>3593
<212>DNA
<213>人工序列
<220>
<223>质粒骨架
<400>2
gctagcatcg ataagaattc cggatcctta ggccattaag gccggccgcc tcggcccact  60
tcgtggggta ccgagctcga attcactggc cgtcgtttta caacgtcgtg actgggaaaa  120
ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa  180
tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgtggccgag gagcaggact  240
gacacgtgct acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa  300
tcgttttccg ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct  360
tcgcccaccc caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca  420
caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca  480
tcaatgtatc ttatcatgtc tgtataccgt cgacctctag ctagagcttg gcgtaatcat  540
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag  600
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg  660
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa  720
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca  780
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg  840
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc  900
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc  960
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac  1020
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc  1080
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat  1140
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc  1200
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca  1260
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag  1320
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta  1380
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg  1440
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc  1500
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt  1560
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa  1620
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat  1680
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga  1740
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac  1800
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg  1860
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg  1920
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt  1980
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct  2040
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat  2100
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta  2160
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca  2220
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat  2280
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac  2340
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa  2400
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt  2460
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg  2520
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat  2580
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt  2640
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtcg  2700
acggatcggg agatctcccg atcccctatg gtcgactctc agtacaatct gctctgatgc  2760
cgcatagtta agccagtatc tgctccctgc ttgtgtgttg gaggtcgctg agtagtgcgc  2820
gagcaaaatt taagctacaa caaggcaagg cttgaccgac aattgcatga agaatctgct  2880
tagggttagg cgttttgcgc tgcttcgcga tgtacgggcc agatatacgc gttgacattg  2940
attattgact agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat  3000
ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc  3060
ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca  3120
ttgacgtcaa tgggtggact atttacggta aactgcccac ttggcagtac atcaagtgta  3180
tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta  3240
tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat  3300
cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat agcggtttga  3360
ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca  3420
aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg  3480
taggcgtgta cggtgggagg tctatataag cagagctctc tggctaacta gagaacccac  3540
tgcttactgg cttatcgaaa ttaatacgac tcactatagg gagacccaag ctg         3593
<210>3
<211>2076
<212>DNA
<213>人工序列
<220>
<223>融合体
<400>3
atgggtaaaa agcctgaact caccgcgacg tctgtcgaga agtttctgat cgaaaagttc    60
gacagcgtct ccgacctgat gcagctctcg gagggcgaag aatctcgtgc tttcagcttc    120
gatgtaggag ggcgtggata tgtcctgcgg gtaaatagct gcgccgatgg tttctacaaa  180
gatcgttatg tttatcggca ctttgcatcg gccgcgctcc cgattccgga agtgcttgac  240
attggggaat tcagcgagag cctgacctat tgcatctccc gccgtgcaca gggtgtcacg  300
ttgcaagacc tgcctgaaac cgaactgccc gctgttctgc agccggtcgc ggaggccatg  360
gatgcgatcg ctgcggccga tcttagccag acgagcgggt tcggcccatt cggaccgcaa  420
ggaatcggtc aatacactac atggcgtgat ttcatatgcg cgattgctga tccccatgtg  480
tatcactggc aaactgtgat ggacgacacc gtcagtgcgt ccgtcgcgca ggctctcgat  540
gagctgatgc tttgggccga ggactgcccc gaagtccggc acctcgtgca cgcggatttc  600
ggctccaaca atgtcctgac ggacaatggc cgcataacag cggtcattga ctggagcgag  660
gcgatgttcg gggattccca atacgaggtc gccaacatct tcttctggag gccgtggttg  720
gcttgtatgg agcagcagac gcgctacttc gagcggaggc atccggagct tgcaggatcg  780
ccgcggctcc gggcgtatat gctccgcatt ggtcttgacc aactctatca gagcttggtt  840
gacggcaatt tcgatgatgc agcttgggcg cagggtcgat gcgacgcaat cgtccgatcc  900
ggagccggga ctgtcgggcg tacacaaatc gcccgcagaa gcgcggccgt ctggaccgat  960
ggctgtgtag aagtcgcgtc tgcgttcgac caggctgcgc gttctcgcgg ccatagcaac  1020
cgacgtacgg cgttgcgccc tcgccggcag caagaagcca cggaagtccg cccggagcag  1080
aaaatgccca cgctactgcg ggtttatata gacggtcccc acgggatggg gaaaaccacc  1140
accacgcaac tgctggtggc cctgggttcg cgcgacgata tcgtctacgt acccgagccg  1200
atgacttact ggcgggtgct gggggcttcc gagacaatcg cgaacatcta caccacacaa  1260
caccgcctcg accagggtga gatatcggcc ggggacgcgg cggtggtaat gacaagcgcc  1320
cagataacaa tgggcatgcc ttatgccgtg accgacgccg ttctggctcc tcatatcggg  1380
ggggaggctg ggagctcaca tgccccgccc ccggccctca ccctcatctt cgaccgccat  1440
cccatcgccg ccctcctgtg ctacccggcc gcgcggtacc ttatgggcag catgaccccc  1500
caggccgtgc tggcgttcgt ggccctcatc ccgccgacct tgcccggcac caacatcgtg  1560
cttggggccc ttccggagga cagacacatc gaccgcctgg ccaaacgcca gcgccccggc  1620
gagcggctgg acctggctat gctggctgcg attcgccgcg tttacgggct acttgccaat  1680
acggtgcggt atctgcagtg cggcgggtcg tggcgggagg actggggaca gctttcgggg  1740
acggccgtgc cgccccaggg tgccgagccc cagagcaacg cgggcccacg accccatatc  1800
ggggacacgt tatttaccct gtttcgggcc cccgagttgc tggcccccaa cggcgacctg  1860
tataacgtgt ttgcctgggc cttgacgtct tggcccaaac gcctccgttc catgcacgtc  1920
tttatcctgg attacgacca atcgcccgcc ggctgccggg acgccctgct gcaacttacc  1980
tccgggatgg tccagaccca cgtcaccacc cccggctcca taccgacgat atgcgacctg  2040
gcgcgcacgt ttgcccgaga aatgaagctt cgataa                            2076
<210>4
<211>1512
<212>DNA
<213>人工序列
<220>
<223>融合体
<400>4
atggcttcgt accccggcca tcaacacgcg tctgcgttcg accaggctgc gcgttctcgc    60
ggccatagca accgacgtac ggcgttgcgc cctcgccggc agcaagaagc cacggaagtc    120
cgcccggagc agaaaatgcc cacgctactg cgggtttata tagacggtcc ccacgggatg    180
gggaaaacca ccaccacgca actgctggtg gccctgggtt cgcgcgacga tatcgtctac    240
gtacccgagc cgatgactta ctggcgggtg ctgggggctt ccgagacaat cgcgaacatc    300
tacaccacac aacaccgcct cgaccagggt gagatatcgg ccggggacgc ggcggtggta    360
atgacaagcg cccagataac aatgggcatg ccttatgccg tgaccgacgc cgttctggct    420
cctcatatcg ggggggaggc tgggagctca catgccccgc ccccggccct caccctcatc    480
ttcgaccgcc atcccatcgc cgccctcctg tgctacccgg ccgcgcggta ccttatgggc    540
agcatgaccc cccaggccgt gctggcgttc gtggccctca tcccgccgac cttgcccggc    600
accaacatcg tgcttggggc ccttccggag gacagacaca tcgaccgcct ggccaaacgc    660
cagcgccccg gcgagcggct ggacctggct atgctggctg cgattcgccg cgtttacggg    720
ctacttgcca atacggtgcg gtatctgcag tgcggcgggt cgtggcggga ggactgggga    780
cagctttcgg ggacggccgt gccgccccag ggtgccgagc cccagagcaa cgcgggccca    840
cgaccccata tcggggacac gttatttacc ctgtttcggg cccccgagtt gctggccccc    900
aacggcgacc tgtataacgt gtttgcctgg gccttggacg tcttggccaa acgcctccgt    960
tccatgcacg tctttatcct ggattacgac caatcgcccg ccggctgccg ggacgccctg    1020
ctgcaactta cctccgggat ggtccagacc cacgtcacca cccccggctc cataccgacg    1080
atatgcgacc tggcgcgcac gtttgcccga gagatgatca gcggagctaa tggcgtcatg    1140
gccaagttga ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag    1200
ttctggaccg accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg    1260
gtccgggacg acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac    1320
accctggcct gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc    1380
gtgtccacga acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg    1440
tgggggcggg agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag    1500
gagcaggact ga                                                        1512
<210>5
<211>5688
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>5
cctaggcttt tgcaaaaagc ttggccacat gggtaaaaag cctgaactca ccgcgacgtc    60
tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc gacctgatgc agctctcgga    120
gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg cgtggatatg tcctgcgggt    180
aaatagctgc gccgatggtt tctacaaaga tcgttatgtt tatcggcact ttgcatcggc    240
cgcgctcccg attccggaag tgcttgacat tggggaattc agcgagagcc tgacctattg    300
catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg cctgaaaccg aactgcccgc    360
tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct gcggccgatc ttagccagac    420
gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa tacactacat ggcgtgattt    480
catatgcgcg attgctgatc cccatgtgta tcactggcaa actgtgatgg acgacaccgt    540
cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt tgggccgagg actgccccga    600
agtccggcac ctcgtgcacg cggatttcgg ctccaacaat gtcctgacgg acaatggccg    660
cataacagcg gtcattgact ggagcgaggc gatgttcggg gattcccaat acgaggtcgc    720
caacatcttc ttctggaggc cgtggttggc ttgtatggag cagcagacgc gctacttcga    780
gcggaggcat ccggagcttg caggatcgcc gcggctccgg gcgtatatgc tccgcattgg    840
tcttgaccaa ctctatcaga gcttggttga cggcaatttc gatgatgcag cttgggcgca    900
gggtcgatgc gacgcaatcg tccgatccgg agccgggact gtcgggcgta cacaaatcgc    960
ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa gtcgcgtctg cgttcgacca    1020
ggctgcgcgt tctcgcggcc atagcaaccg acgtacggcg ttgcgccctc gccggcagca    1080
agaagccacg gaagtccgcc cggagcagaa aatgcccacg ctactgcggg tttatataga    1140
cggtccccac gggatgggga aaaccaccac cacgcaactg ctggtggccc tgggttcgcg    1200
cgacgatatc gtctacgtac ccgagccgat gacttactgg cgggtgctgg gggcttccga    1260
gacaatcgcg aacatctaca ccacacaaca ccgcctcgac cagggtgaga tatcggccgg    1320
ggacgcggcg gtggtaatga caagcgccca gataacaatg ggcatgcctt atgccgtgac    1380
cgacgccgtt ctggctcctc atatcggggg ggaggctggg agctcacatg ccccgccccc    1440
ggccctcacc ctcatcttcg accgccatcc catcgccgcc ctcctgtgct acccggccgc    1500
gcggtacctt atgggcagca tgacccccca ggccgtgctg gcgttcgtgg ccctcatccc    1560
gccgaccttg cccggcacca acatcgtgct tggggccctt ccggaggaca gacacatcga    1620
ccgcctggcc aaacgccagc gccccggcga gcggctggac ctggctatgc tggctgcgat    1680
tcgccgcgtt tacgggctac ttgccaatac ggtgcggtat ctgcagtgcg gcgggtcgtg    1740
gcgggaggac tggggacagc tttcggggac ggccgtgccg ccccagggtg ccgagcccca    1800
gagcaacgcg ggcccacgac cccatatcgg ggacacgtta tttaccctgt ttcgggcccc    1860
cgagttgctg gcccccaacg gcgacctgta taacgtgttt gcctgggcct tgacgtcttg    1920
gcccaaacgc ctccgttcca tgcacgtctt tatcctggat tacgaccaat cgcccgccgg    1980
ctgccgggac gccctgctgc aacttacctc cgggatggtc cagacccacg tcaccacccc    2040
cggctccata ccgacgatat gcgacctggc gcgcacgttt gcccgagaaa tgaagcttcg    2100
ataagaattc cggatcctta ggccattaag gccggccgcc tcggcccact tcgtggggta    2160
ccgagctcga attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt    2220
acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag    2280
gcccgcaccg atcgcccttc ccaacagttg cgtggccgag gagcaggact gacacgtgct    2340
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg    2400
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc    2460
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac    2520
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc    2580
ttatcatgtc tgtataccgt cgacctctag ctagagcttg gcgtaatcat ggtcatagct    2640
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat    2700
aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc    2760
actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg    2820
cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct    2880
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt    2940
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc    3000
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga    3060
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata    3120
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac    3180
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg    3240
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc    3300
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag    3360
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt    3420
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt    3480
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg    3540
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac    3600
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca    3660
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac    3720
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac    3780
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt    3840
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt    3900
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt    3960
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc    4020
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa    4080
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg    4140
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt    4200
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc    4260
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt    4320
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg    4380
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac    4440
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc    4500
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt    4560
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg    4620
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag    4680
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa    4740
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtcg acggatcggg    4800
agatctcccg atcccctatg gtcgactctc agtacaatct gctctgatgc cgcatagtta    4860
agccagtatc tgctccctgc ttgtgtgttg gaggtcgctg agtagtgcgc gagcaaaatt  4920
taagctacaa caaggcaagg cttgaccgac aattgcatga agaatctgct tagggttagg  4980
cgttttgcgc tgcttcgcga tgtacgggcc agatatacgc gttgacattg attattgact  5040
agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc  5100
gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg  5160
acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa  5220
tgggtggact atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca  5280
agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac  5340
atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc  5400
atggtgatgc ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga  5460
tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg  5520
gactttccaa aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta  5580
cggtgggagg tctatataag cagagctctc tggctaacta gagaacccac tgcttactgg  5640
cttatcgaaa ttaatacgac tcactatagg gagacccaag ctggctag               5688
<210>6
<211>5378
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>6
gctagcttat cgcatggcct cgtaccccgg ccatcaacac gcgtctgcgt tcgaccaggc  60
tgcgcgttct cgcggccata gcaaccgacg tacggcgttg cgccctcgcc ggcagcaaga  120
agccacggaa gtccgcccgg agcagaaaat gcccacgcta ctgcgggttt atatagacgg  180
tccccacggg atggggaaaa ccaccaccac gcaactgctg gtggccctgg gttcgcgcga  240
cgatatcgtc tacgtacccg agccgatgac ttactggcgg gtgctggggg cttccgagac  300
aatcgcgaac atctacacca cacaacaccg cctcgaccag ggtgagatat cggccgggga  360
cgcggcggtg gtaatgacaa gcgcccagat aacaatgggc atgccttatg ccgtgaccga  420
cgccgttctg gctcctcata tcggggggga ggctgggagc tcacatgccc cgcccccggc  480
cctcaccctc atcttcgacc gccatcccat cgccgccctc ctgtgctacc cggccgcgcg  540
gtaccttatg ggcagcatga ccccccaggc cgtgctggcg ttcgtggccc tcatcccgcc  600
gaccttgccc ggcaccaaca tcgtgcttgg ggcccttccg gaggacagac acatcgaccg  660
cctggccaaa cgccagcgcc ccggcgagcg gctggacctg gctatgctgg ctgcgattcg  720
ccgcgtttac gggctacttg ccaatacggt gcggtatctg cagtgcggcg ggtcgtggcg  780
ggaggactgg ggacagcttt cggggacggc cgtgccgccc cagggtgccg agccccagag  840
caacgcgggc ccacgacccc atatcgggga cacgttattt accctgtttc gggcccccga  900
gttgctggcc cccaacggcg acctgtataa cgtgtttgcc tgggccttga cgtcttggcc  960
caaacgcctc cgttccatgc acgtctttat cctggattac gaccaatcgc ccgccggctg  1020
ccgggacgcc ctgctgcaac ttacctccgg gatggtccag acccacgtca ccacccccgg  1080
ctccataccg acgatatgcg acctggcgcg cacgtttgcc cgagaaatga agcttaccat  1140
gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg    1200
caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg atccggaccg    1260
ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg ggctcgacat    1320
cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca cgccggagag    1380
cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt tgagcggttc    1440
ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc ccaaggagcc    1500
cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac cagggcaagg gtctgggcag    1560
cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga    1620
gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga    1680
cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgacg    1740
cccgccccac gacccgcagc gcccgaccga aaggagcgca cgaccccatg catcgataag    1800
aattccggat ccttaggcca ttaaggccgg ccgcctcggc ccacttcgtg gggtaccgag    1860
ctcgaattca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca    1920
acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg    1980
caccgatcgc ccttcccaac agttgcgtgg ccgaggagca ggactgacac gtgctacgag    2040
atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg    2100
ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact    2160
tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata    2220
aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc    2280
atgtctgtat accgtcgacc tctagctaga gcttggcgta atcatggtca tagctgtttc    2340
ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt    2400
gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc    2460
ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg    2520
ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct    2580
cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca    2640
cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga    2700
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc    2760
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg    2820
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat    2880
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt    2940
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc    3000
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg    3060
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg    3120
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg    3180
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg    3240
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca    3300
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga    3360
acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga  3420
tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt  3480
ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt  3540
catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat  3600
ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag  3660
caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct  3720
ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt  3780
tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg  3840
cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca  3900
aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt  3960
tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat  4020
gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac  4080
cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa  4140
aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt  4200
tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt  4260
tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa  4320
gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt  4380
atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa  4440
taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtcgacgga tcgggagatc  4500
tcccgatccc ctatggtcga ctctcagtac aatctgctct gatgccgcat agttaagcca  4560
gtatctgctc cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca aaatttaagc  4620
tacaacaagg caaggcttga ccgacaattg catgaagaat ctgcttaggg ttaggcgttt  4680
tgcgctgctt cgcgatgtac gggccagata tacgcgttga cattgattat tgactagtta  4740
ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac  4800
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc  4860
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt  4920
ggactattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac  4980
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac  5040
cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt  5100
gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc  5160
aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt  5220
tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg  5280
ggaggtctat ataagcagag ctctctggct aactagagaa cccactgctt actggcttat  5340
cgaaattaat acgactcact atagggagac ccaagctg                          5378
<210>7
<211>5190
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>7
catggcttcg taccccggcc atcaacacgc gtctgcgttc gaccaggctg cgcgttctcg    60
cggccatagc aaccgacgta cggcgttgcg ccctcgccgg cagcaagaag ccacggaagt    120
ccgcccggag cagaaaatgc ccacgctact gcgggtttat atagacggtc cccacgggat    180
ggggaaaacc accaccacgc aactgctggt ggccctgggt tcgcgcgacg atatcgtcta    240
cgtacccgag ccgatgactt actggcgggt gctgggggct tccgagacaa tcgcgaacat    300
ctacaccaca caacaccgcc tcgaccaggg tgagatatcg gccggggacg cggcggtggt    360
aatgacaagc gcccagataa caatgggcat gccttatgcc gtgaccgacg ccgttctggc    420
tcctcatatc gggggggagg ctgggagctc acatgccccg cccccggccc tcaccctcat    480
cttcgaccgc catcccatcg ccgccctcct gtgctacccg gccgcgcggt accttatggg    540
cagcatgacc ccccaggccg tgctggcgtt cgtggccctc atcccgccga ccttgcccgg    600
caccaacatc gtgcttgggg cccttccgga ggacagacac atcgaccgcc tggccaaacg    660
ccagcgcccc ggcgagcggc tggacctggc tatgctggct gcgattcgcc gcgtttacgg    720
gctacttgcc aatacggtgc ggtatctgca gtgcggcggg tcgtggcggg aggactgggg    780
acagctttcg gggacggccg tgccgcccca gggtgccgag ccccagagca acgcgggccc    840
acgaccccat atcggggaca cgttatttac cctgtttcgg gcccccgagt tgctggcccc    900
caacggcgac ctgtataacg tgtttgcctg ggccttggac gtcttggcca aacgcctccg    960
ttccatgcac gtctttatcc tggattacga ccaatcgccc gccggctgcc gggacgccct    1020
gctgcaactt acctccggga tggtccagac ccacgtcacc acccccggct ccataccgac    1080
gatatgcgac ctggcgcgca cgtttgcccg agagatgatc agcggagcta atggcgtcat    1140
ggccaagttg accagtgccg ttccggtgct caccgcgcgc gacgtcgccg gagcggtcga    1200
gttctggacc gaccggctcg ggttctcccg ggacttcgtg gaggacgact tcgccggtgt    1260
ggtccgggac gacgtgaccc tgttcatcag cgcggtccag gaccaggtgg tgccggacaa    1320
caccctggcc tgggtgtggg tgcgcggcct ggacgagctg tacgccgagt ggtcggaggt    1380
cgtgtccacg aacttccggg acgcctccgg gccggccatg accgagatcg gcgagcagcc    1440
gtgggggcgg gagttcgccc tgcgcgaccc ggccggcaac tgcgtgcact tcgtggccga    1500
ggagcaggac tgaccgacgc cgaccaacac cgccggtccg acggcggccc acgggtccca    1560
gggtcgacct cgagatcctt aggccattaa ggccggccgc ctcggcccac ttcgtggggt    1620
accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt    1680
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga    1740
ggcccgcacc gatcgccctt cccaacagtt gcgtggccga ggagcaggac tgacacgtgc    1800
tacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc    1860
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc    1920
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca    1980
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat    2040
cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc    2100
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca    2160
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct    2220
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac    2280
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc    2340
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt    2400
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg    2460
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg    2520
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat    2580
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta    2640
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct    2700
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc    2760
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa    2820
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg    2880
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag    2940
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt    3000
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta    3060
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc    3120
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca    3180
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa    3240
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat    3300
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct    3360
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt    3420
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat    3480
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta    3540
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg    3600
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt    3660
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg    3720
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg    3780
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc    3840
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa    3900
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac    3960
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt    4020
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg    4080
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa    4140
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata    4200
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc gacggatcgg    4260
gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg ccgcatagtt    4320
aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg cgagcaaaat    4380
ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc ttagggttag    4440
gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt gattattgac    4500
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg    4560
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt    4620
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca    4680
atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc    4740
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta    4800
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac    4860
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg    4920
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg    4980
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt    5040
acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca ctgcttactg    5100
gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt ggatcccccg    5160
ggctgcagga attcgatatc aagcttatcg                                     5190

Claims (31)

1.核酸,其包含以5′至3′方向排列的以下连续元件:
a)启动子;
b)至少两个选择性标记物;
c)用于接受核酸片段的克隆位点,所述片段包含候选调控RNA靶序列;和
d)多腺苷酸化信号,
所述元件的排列使由所述启动子指导的转录本包含按如上顺序排列的所述至少两个选择性标记物、所述候选调控RNA靶序列和所述多腺苷酸化信号。
2.如权利要求1所述的核酸,其中所述候选调控RNA靶序列为候选小RNA(miRNA)靶序列。
3.如权利要求1或权利要求2所述的核酸,其还包含位于所述选择性标记物和所述克隆位点间的终止密码子。
4.如权利要求3所述的核酸,其中所述终止密码子为终止盒,所述终止盒包含在三个正向读框的每一个中的终止密码子。
5.如权利要求1-4中任一项所述的核酸,其中至少一个所述选择性标记物用于阳性选择。
6.如权利要求1-4中任一项所述的核酸,其中至少一个所述选择性标记物用于阴性选择。
7.如前述任一项权利要求所述的核酸,其中以编码包含至少两个选择性标记物的单个多肽的开放读框的形式提供至少两个所述选择性标记物。
8.如权利要求7所述的核酸,其中所述选择性标记物包含一个用于阳性选择的标记物和一个用于阴性选择的标记物。
9.如前述任一项权利要求所述的核酸,其中所述选择性标记物包含HSVTK/PURO融合蛋白。
10.如前述任一项权利要求所述的核酸,其中所述克隆位点为定向克隆位点。
11.如前述任一项权利要求所述的核酸,其中所述克隆位点具有插入其中的包含3′非翻译区(UTR)或候选3′UTR的核酸片段。
12.3′UTR文库,所述文库包含多种权利要求11所述的核酸。
13.如权利要求12所述的3′UTR文库,其中所述候选miRNA靶序列包含在cDNA文库中。
14.如权利要求12或权利要求13所述的3′UTR文库,其中所述候选miRNA靶序列小于6kb。
15.如权利要求14所述的3′UTR文库,其中所述候选miRNA靶序列约为2kb。
16.如权利要求12-15中任一项所述的3′UTR文库,其中所述cDNA文库为脑cDNA文库或为来自急性髓细胞白血病细胞的cDNA文库。
17.细胞,其包含权利要求1-11中任一项所述的核酸或权利要求12-16中任一项所述的文库。
18.细胞群,所述细胞共同具有权利要求12-16中任一项所述文库的至少一部分。
19.制备3′UTR文库的方法,其包括提供权利要求1-11中任一项所述的核酸,并在所述克隆位点插入包含3′UTR或候选3′UTR的核酸。
20.制备5′UTR文库的方法,其包括提供权利要求1-11中任一项所述的核酸,并在所述克隆位点插入包含5′UTR或候选5′UTR的核酸。
21.载体,其包含权利要求1-11中任一项所述的核酸。
22.鉴定miRNA靶序列的方法,其包括以下步骤:
(a)向宿主细胞中引入包含候选miRNA靶序列的权利要求1-11中任一项所述的核酸;
(b)选择表达所述核酸的至少一个选择性标记物的宿主细胞;
(c)向(b)的所述宿主细胞中引入至少一个目标miRNA;和
(d)检测所述核酸的至少一个选择性标记物在(c)的细胞中的表达;
其中,如果(c)的细胞没有显示至少一个选择性标记物的表达,则所述候选miRNA靶序列被鉴定为miRNA靶序列。
23.鉴定对miRNA靶序列具有活性的miRNA的方法,其包括以下步骤:
(a)向宿主细胞中引入包含所述miRNA靶序列的权利要求1-11中任一项所述的核酸;
(b)选择表达所述核酸的至少一个选择性标记物的宿主细胞;
(c)向(b)的所述宿主细胞中引入至少一个目标miRNA;和
(d)检测所述核酸的至少一个选择性标记物在(c)的细胞中的表达;
其中,如果(c)的细胞没有显示至少一个选择性标记物的表达,则所述目标miRNA被鉴定为对所述miRNA靶序列具有活性的miRNA。
24.如权利要求22或权利要求23的方法,其中步骤(d)包括选除表达至少一个选择性标记物的细胞。
25.如权利要求22或权利要求23的方法,其中步骤(d)包括选择不表达至少一个选择性标记物的细胞。
26.调控RNA的抑制剂的鉴定方法,其包括以下步骤:
(a)向宿主细胞中引入至少一个目标调控RNA;
(b)向所述宿主细胞中引入包含候选RNA靶序列的权利要求1-11中任一项所述的核酸;
(c)选择没有显示表达所述核酸的至少一个选择性标记物的宿主细胞;
(d)向所述宿主细胞中引入测试物质或核酸;
(e)检测至少一个所述选择性标记物在(d)的细胞中的表达;
其中,如果(d)的细胞显示至少一个选择性标记物的表达,则所述测试物质或核酸被鉴定为抑制所述调控RNA。
27.调控RNA靶序列的鉴定方法,其包括以下步骤:
(a)向宿主细胞中引入包含候选调控RNA靶序列的权利要求1-11中任一项所述的核酸;
(b)选择表达所述核酸的至少一个选择性标记物的宿主细胞;
(c)向(b)的所述宿主细胞中引入至少一个目标调控RNA;和
(d)检测所述核酸的至少一个选择性标记物在(c)的细胞中的表达;
其中,如果(c)的细胞没有显示至少一个选择性标记物的表达,则所述候选调控RNA靶序列被鉴定为调控RNA靶序列。
28.如权利要求27所述的方法,其中所述调控RNA为siRNA,且其中所述候选调控RNA靶序列为候选siRNA靶序列。
29.如权利要求27或28所述的方法,其还包括将所鉴定的靶序列与目标调控RNA的已知靶序列进行比较的步骤,从而鉴定所述调控RNA的新靶序列。
30.如权利要求1所述的核酸,其中所述核酸包括一个或多个以下核酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6或SEQ ID NO:7。
31.本发明参考附图所述的核酸或方法。
CN2008800185180A 2007-04-04 2008-04-04 核酸和文库 Expired - Fee Related CN101679976B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0706631.9 2007-04-04
GBGB0706631.9A GB0706631D0 (en) 2007-04-04 2007-04-04 Nucleic acids and libraries
PCT/GB2008/001176 WO2008122770A2 (en) 2007-04-04 2008-04-04 Nucleic acids and libraries for use in functional analysis of regulatory rnas such as micrornas (mirnas)

Publications (2)

Publication Number Publication Date
CN101679976A true CN101679976A (zh) 2010-03-24
CN101679976B CN101679976B (zh) 2013-01-09

Family

ID=38090892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800185180A Expired - Fee Related CN101679976B (zh) 2007-04-04 2008-04-04 核酸和文库

Country Status (9)

Country Link
US (2) US20130029882A1 (zh)
EP (1) EP2155875B1 (zh)
JP (1) JP2010523100A (zh)
CN (1) CN101679976B (zh)
AU (1) AU2008235364A1 (zh)
CA (1) CA2684792A1 (zh)
ES (1) ES2388199T3 (zh)
GB (1) GB0706631D0 (zh)
WO (1) WO2008122770A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113624953A (zh) * 2015-05-11 2021-11-09 亿明达股份有限公司 用于发现和分析治疗剂的平台

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011138787A1 (en) * 2010-05-05 2011-11-10 Ariel - University Research And Development Company, Ltd. Identification of mrna-specific micrornas
DE102014217288A1 (de) * 2014-08-29 2016-03-03 BSH Hausgeräte GmbH Haushaltsgerät mit einer Eingabemittelsperreinrichtung

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2096222C (en) * 1990-11-13 1998-12-29 Stephen D. Lupton Bifunctional selectable fusion genes
US6555370B1 (en) * 1990-11-13 2003-04-29 Immunex Corporation Bifunctional selectable fusion genes
WO2001027254A2 (de) * 1999-10-12 2001-04-19 Fritz Schwarzmann Gentransfervektoren zur therapie von autoimmunerkrankungen und erkrankungen mit immunpathogenese
WO2001053481A1 (en) * 2000-01-20 2001-07-26 Cell Therapeutics, Inc. Methods and compositions for identification of genomic polynucleotides which are transcriptionally regulated
DE10319478A1 (de) 2003-04-30 2004-11-18 Universität Zu Köln siRNA-Selektionsverfahren
JP4747245B2 (ja) * 2003-12-31 2011-08-17 謙造 廣瀬 RNAiライブラリーの酵素的構築方法
JP2007082436A (ja) * 2005-09-20 2007-04-05 Bioinformatics Institute For Global Good Inc 機能性RNAが制御するターゲットmRNAの予測・同定方法及びその利用方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113624953A (zh) * 2015-05-11 2021-11-09 亿明达股份有限公司 用于发现和分析治疗剂的平台

Also Published As

Publication number Publication date
US20130029876A1 (en) 2013-01-31
GB0706631D0 (en) 2007-05-16
EP2155875B1 (en) 2012-05-16
EP2155875A2 (en) 2010-02-24
WO2008122770A3 (en) 2009-02-12
CA2684792A1 (en) 2008-10-16
JP2010523100A (ja) 2010-07-15
ES2388199T3 (es) 2012-10-10
WO2008122770A2 (en) 2008-10-16
CN101679976B (zh) 2013-01-09
AU2008235364A1 (en) 2008-10-16
US20130029882A1 (en) 2013-01-31

Similar Documents

Publication Publication Date Title
CN106456660B (zh) 用于色素性视网膜炎的基因疗法
US11965012B2 (en) Compositions and methods for TCR reprogramming using fusion proteins
US6773920B1 (en) Delivery of functional protein sequences by translocating polypeptides
KR101833589B1 (ko) 이상혈색소증 치료를 위한 조성물 및 방법
CN101208425A (zh) 产生复制缺陷型腺病毒的细胞系
CN110656123B (zh) 基于CRISPR-Cas13d系统的sgRNA高效作用靶点的筛选方法及应用
US20040214290A1 (en) Plant artificial chromosomes, uses thereof and methods of preparing plant artificial chromosomes
KR20160029124A (ko) Pd-1 항원 또는 pd-1 리간드 항원을 포함하는 바이러스 유사 입자
US6187991B1 (en) Transgenic animal models for type II diabetes mellitus
DK2713712T3 (en) TRANSGEN CHICKEN, INCLUDING AN INACTIVATED IMMUNGLOBULIN GENE
CN108949825A (zh) 一种靶向her2的car-t细胞的制备方法及应用
KR20210049133A (ko) 무혈청 배지에서 벡터 제조
WO2005081716A2 (en) DNA VACCINES TARGETING ANTIGENS OF THE SEVERE ACUTE RESPIRATORY SYNDROME CORONAVIRUS (SARS-CoV)
KR101616572B1 (ko) 홍역-말라리아 조합 백신
CN101679976A (zh) 核酸和文库
CN110305902B (zh) 一种在工具细胞中激活hSyn启动子的方法及其应用
CN100338219C (zh) 成视网膜细胞瘤蛋白的组织特异性表达
US20210130818A1 (en) Compositions and Methods for Enhancement of Homology-Directed Repair Mediated Precise Gene Editing by Programming DNA Repair with a Single RNA-Guided Endonuclease
CN114480385A (zh) 基于来自耐酸酵母的基因的合成启动子
KR20150021839A (ko) 암특이적 유전자를 표적하는 트랜스-스플라이싱 라이보자임의 조절 유도체를 포함하는 재조합 아데노바이러스 및 이의 용도
CN115747213A (zh) 一种在基因组上高通量实现tag到taa转换的方法
CN114990163A (zh) 用于干细胞基因修饰的慢病毒载体及其构建方法和应用
CN104862336A (zh) 一种表达乙肝病毒受体——人ntcp的小鼠模型的构建方法
KR20230153437A (ko) 코로나바이러스를 방지하는 백신 생산을 위한 완전 합성 장쇄 핵산
Carlson Microscopic studies in nascent frustule formation from protoplasts of the marine pennate apochlorotic diatom Nitzschia alba and production of novel transformation vectors for studies in N. alba and the marine centric photoautotrophic diatom Thalassiosira pseudonana

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130109

Termination date: 20140404