CN116615546A - 自靶向性表达载体 - Google Patents

自靶向性表达载体 Download PDF

Info

Publication number
CN116615546A
CN116615546A CN202180077166.1A CN202180077166A CN116615546A CN 116615546 A CN116615546 A CN 116615546A CN 202180077166 A CN202180077166 A CN 202180077166A CN 116615546 A CN116615546 A CN 116615546A
Authority
CN
China
Prior art keywords
dna
motif
binding
vector
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180077166.1A
Other languages
English (en)
Inventor
保罗·詹姆斯·罗斯韦尔
M·莱吉维茨
T·A·J·艾迪
L·M·金塔内罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Touchlight Genetics Ltd
Original Assignee
Touchlight Genetics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Touchlight Genetics Ltd filed Critical Touchlight Genetics Ltd
Publication of CN116615546A publication Critical patent/CN116615546A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/16Aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/532Closed or circular
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Toilet Supplies (AREA)
  • Control Of Electric Motors In General (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及可用于多种应用的新核酸分子及其制备方法。这些核酸分子优选是DNA载体,任选是DNA表达载体。所述核酸分子由于本身具有一个或多个特异性结合基序而能够将载体靶向特定的细胞位置,例如细胞核。因此,本发明的核酸分子也可以被描述为靶向性递送载体,尤其是自靶向性递送载体或智能递送载体。

Description

自靶向性表达载体
发明领域
本发明涉及可用于许多应用的新核酸分子及其制备方法。这些核酸分子优选是DNA载体,任选地是DNA表达载体。所述核酸分子由于自身内存在一个或多个特异性结合基序而能够将所述载体靶向特定的细胞位置,例如细胞核。因此,本发明的核酸分子也可以描述为靶向性递送载体,特别是自靶向性递送载体或智能递送载体。因此,这些构建体可以被描述为靶向性的,因为它们能够有效地将载荷递送到需要表达的位置。本发明还涉及一种制备载体的独特方法。本发明的载体可以是闭合的,即没有任何自由末端,或者它可以是开口的,其中末端核苷酸在所述载体内碱基配对但不相互连接。有效地公开了一种具有允许载体靶向目标位置的至少一个“粘性末端”的载体。
发明背景
将遗传物质引入细胞的原因有多种,包括为了补偿或纠正异常基因或为了产生有益蛋白。如果突变基因导致关键蛋白的缺失或突变,则需要引入所述基因的正常拷贝以恢复细胞功能。此外,期望引入的是编码活性RNA实体的遗传物质而不是肽。
遗传物质如基因一般不直接用于治疗。它包含在用于递送至细胞的载体中。可以通过多种方法将遗传物质递送到细胞中。某些病毒经常被用作载体,因为它们可以通过感染细胞来递送遗传物质。也使用裸DNA或DNA复合物(非病毒载体)。
非病毒载体与病毒载体相比具有某些优势,例如生产规模更大和宿主免疫原性低。然而,非病毒载体如质粒可产生较低水平的转染和表达,从而功效较低。传统的非病毒载体如质粒也可以在细菌中扩增,这意味着具有感染遗传物质的可能性,如下文更详细的讨论。
非病毒载体,例如质粒和小环,可能面临巨大的递送障碍,特别是如何将核酸送至正确的细胞,使其进入细胞,并根据需要进一步进入细胞核或其他细胞内位置。将遗传物质有效转移到细胞中存在许多屏障,包括细胞外基质、内体/溶酶体环境、内体膜和核膜。
核输入是真核细胞中基因表达的一个众所周知的瓶颈,并且相对小部分的转染DNA被转运至细胞核。
已采用多种策略,包括将非病毒载体加上标签肽如核定位信号或序列(NLS)。双链DNA核靶向性序列(DTS)的使用也增加了载体定位于细胞核的能力,但这些包含在双链体内,不是本文所述的结合基序。此外,DNA已与具有表面功能化的脂质体复合,以试图进行靶向。脂质体的使用并非没有限制,因为阳离子脂质的毒性可导致不能全身递送。
靶向递送系统通常包括感兴趣的DNA、聚阳离子(通常是聚赖氨酸或阳离子脂质)和与聚阳离子缀合的靶向性配体。然而,DNA有可能在循环期间与靶向性配体分离。此外,需要将功能结构域与DNA直接缀合,同时保持DNA的活性。例如,当NLS与质粒缀合时,已证明质粒的核吸收显著增加。然而,由于使用的缀合方法,质粒在缀合后丧失其表达活性(Sebestyen等,Natl.Biotech.,16(1998),pp.80-85)。因此,缀合可导致DNA表达的减少。
化学靶向递送的附加条件是DNA载体的特征,包括病毒衍生的ITR。例如,WO2019/143885中描述的无衣壳AAV载体包括病毒衍生序列,例如ITR序列,使用WO2019/051289中描述的脂质纳米颗粒递送系统递送。类似地,WO2019/246544描述了具有病毒衍生的ITR的载体,其依赖于次级试剂来靶向DNA载体。
如果没有靶向性,则需要远远更大量的载体才能确保达到预期效果,因为有很多载体在到达期望目的地之前丢失。因此希望能够减少提供的载体量。
然而,用肽、实际上是蛋白和其他小分子标记DNA可能具有挑战性,这意味着载体将包含额外的实体。更为期望的是提供一种―一体化(all in one)”或最小方案,它允许特异性靶向的同时不需要为了靶向而在载体上加额外的标签实体。因此,用于靶向递送的单一单元很有吸引力。
本领域通常使用的核酸分子,例如衍生自病毒基因组的基因递送载体可能存在问题,因为它们可能在基因递送载体的接受者中诱导免疫应答,这是因为免疫系统能够识别循环的―外来”DNA。此类基因递送载体可具有病毒序列,例如反向末端重复(ITR),这可能会激发先天免疫系统并募集抑制载体表达的DNA修复酶。如果DNA是在细菌细胞中产生的,则它将具有原核模式的DNA甲基化,这可能在真核生物中被识别为外来物,并同样被拒绝。例如,质粒(pDNA)是天然存在的环状dsDNA分子,是从一代稳定遗传到下一代的额外染色体DNA片段。质粒及其衍生物已被用作基因递送载体,并取得了不同程度的成功。
生产核酸载体的方法也可能存在问题。在细菌细胞内制备核酸分子的风险是最终产品被脂多糖(LPS)、内毒素和其他原核生物特异性分子污染。这些分子具有在真核生物中产生免疫应答的能力,因为它们是微生物病原体的有效指示物。事实上,在任何基于细胞的系统中制造核酸载体都会具有最终产品中存在来自细胞培养的污染物的风险,这些污染物包括来自宿主细胞的基因组材料。在细胞内生产核酸效率低,因为生产核酸需要提供比合成方法远远更多的物质。除了成本问题外,在许多情况下使用细胞培养可能对扩增过程的再现性造成困难。在复杂的细胞生化环境中,难以控制所需核酸产物的质量和产量。处理可能对核酸在其中扩增的细胞有毒的序列也很困难。重组事件也可能对可靠生产目标核酸造成问题。
DNA可以在不使用细胞的情况下合成产生。寡核苷酸可以通过使用修饰的核苷酸延伸链来化学合成。这些构建模块(building block)的制备需要付出一定的代价。每个核苷酸的逐步添加是一个不完美的过程(每条链被延伸的几率被称为―偶联效率”),并且对于较长序列,大多数启动的链将不会成为正确的全长产物。这阻碍了长序列的大规模生产——这些方法始终在长度、准确性和规模之间必需存在牺牲。此类寡核苷酸的主要用途仍在几百个核苷酸范围内(例如,引物和探针),最大准确长度被认为在300个核苷酸左右的长度。通常,合成的寡核苷酸是长度为约15-25个碱基的单链核酸分子。
合成方法的优选替代方法是依赖于模板的核酸的酶促生产。用于合成核酸的无细胞体外酶促方法避免了使用任何宿主细胞的需求,因此是有利的,尤其是当生产需要符合良好生产规范(GMP)标准时。因此,酶促产生的核酸可以更高效地制备,并且没有细胞来源的污染物的风险。
因此,需要酶促生产和改进的构建体,它们更安全且更被接受者耐受,理想地,它们还能抵抗细胞内的立即降解。此外,期望的是这些改进的构建体是靶向性的,例如它们能够将构建体引导至特定组织或细胞类型或细胞内的特定位置(包括细胞核)。将载体靶向至目标位置是基因治疗等的目标。或者,靶向特定细菌细胞可以允许在特定细胞类型中表达杀菌剂。类似的方法可用于其他微生物,如真菌或原生生物。
本发明尤其涉及一种高效且有效地制备靶向性核酸构建体的新型无细胞体外方法,还涉及靶向性构建体本身。
现有技术没有公开基本上从DNA制备的合成的靶向性构建体/载体,也没有描述制造此类构建体的方法。
附图简要说明
图1:显示了在载体右侧的帽中包含不同结构基序以及结合基序的载体的性能比较。结合基序经选择而与靶蛋白相互作用,以劫持核输入途径并增强所报告的DNA的核输入;在HEK293中测试。在这个实例中,载体是完全共价闭合的。
图2:显示了以中等浓度转染的在帽内具有单个结合基序的载体的性能;在HEK293中测试。
图3:显示了以低浓度转染的在帽内具有单个结合基序的载体的性能;在HEK293中测试。
图4:显示了以中等浓度转染在帽内具有单个结合基序的载体的性能;在HepG2中测试。
图5:描绘了本发明的载体的多个实施方案,其中载体全部是共价闭合的。顶部显示了在左端和右端均具有G-四链体的载体。第二种载体在左端包含适体,并且在右端包含不同的适体。第三种结构在一端包含G-四链体,在另一个末端包含适体。第四种结构在每一个末端都包含茎环,其中环是单链DNA,通过茎结构结合在一起。在这种情况下,环可以是简单的三核苷酸,例如GAA。
图6:描述了本发明的多个实施方案,其中载体不是共价闭合的,并且包括一个或多个缺口。所有实例均在左端和右端包含G-四链体。缺口可存在于双链体的任一个末端,或存在于双链体的两端,如图所示。
图7A:描述了本申请实施例中使用的示例性载体。顶部是载体的简化描述,其中在一个末端包括帽,其包含多个链霉亲和素适体,而另一个末端是简单的茎环(环中为GAA)。还显示了载体中存在的表达盒,以及包含单个适体的载体。图7B描述了实施例4中使用的部分实验方案。
图8:这是图7B中显示的结合实验图。显示的是包含4个链霉亲和素适体载体的结合能力的提高,同时单个适体也获得了良好的结合结果。对照(无适体)没有显示特异性结合。
图9:示出了实施例中使用的载体上的各种帽。使用的多种加帽末端有茎环、适体、G-四链体和多重适体。
图10:示出了本文所述方法的一个实施方案。显示的是双链模板分子(1),其包括编码加工基序和结构基序的序列。一旦处于单链形式,即形成了加工基序,并且可以使用合适的酶如核酸内切酶(剪刀和虚线)进行加工(2)。一旦加工完成(3),所述分子即可以与聚合酶接触以填充双链体,双链体可以保持打开(4)或利用连接酶共价闭合(5)。
图11:示出了实施例5中使用的模板。
图12:凝胶照片,显示了使用本发明的方法产生靶向性载体的结果,如实施例5中详述。
图13:显示了以中等浓度转染的单个帽内具有多个结合基序的载体的性能;在HEK293中测试。
发明内容
本发明涉及一种靶向性载体,其本文在全文中也可互换地称为构建体。靶向性载体也可称为靶向性递送载体。靶向性载体优选是DNA载体或DNA和RNA的杂合体。所述载体包括一部分双链核酸。靶向性载体优选是表达载体。用于―表达”的遗传物质可以包含在双链体中。双链部分在每一个末端均加帽。这些帽可以与双链体完全连续,即加帽末端是闭合端,或者可以仅与双链体的一条链连续并且在―非连续”链的末端核苷酸之间包括缺口或较大的间隙。载体可以由连续的(共价闭合的)或不连续的(包括缺口或空隙)单链核酸组成。在一些实施方案中,在一个加帽末端存在单个空隙或仅存在缺口。所述载体在至少一个加帽末端包含至少一个结构基序。结构基序包括至少一个能够靶向、引导或定向载体的结合基序。载体优选是合成的,并且以无细胞方式酶促制备。
载体的靶标优选是细胞靶标。细胞靶标是与细胞相关的靶标。所述靶标可以是细胞上或细胞内的任何合适的实体,使得能够靶向该细胞或细胞位置(即,细胞核)。因此,本文所用的靶向是使核酸相对于非靶细胞而能够优选被递送至靶细胞或靶细胞位置,以有助于表达水平。
因此,提供了一种包含双链部分的靶向性DNA载体,其特征在于,所述双链体在两端加帽,其中所述双链体的至少一个末端用结构基序加帽,并且所述结构基序包含至少一个结合基序。
靶向性DNA载体可以是递送载体。所述载体可以被递送至期望的靶细胞或细胞中的期望靶位置。
独立地,所述载体可包含以下任选特征中的任何一项或多项:
双链体DNA可以在两端用结构基序加帽,所述结构基序可以是相同的或不同的。
每个加帽末端可以独立地共价闭合,即与双链DNA连续,或者是开口的,即包括缺口或空隙。
双链体DNA可以独立地在一个末端用结构基序加帽,在另一个末端用发夹、T形发夹、茎环、环、凸起或十字形加帽。
结构基序可包括多个结合基序,其可以是相同的或不同的。结构基序可以包括结合基序的阵列,例如3个或更多个结合基序,其可以是相同的或不同的。因此,所述阵列可以是结合基序的多重体。
结合基序负责载体的靶向递送。结合基序与细胞靶标结合。结合基序形成允许与细胞靶标结合的构象。
结合基序能够结合以下任何一项或多项上的靶标:
(i)细胞表面;
(ii)核膜;
(iii)核运输系统;
(iv)细胞区室;
(v)核组分;
(vi)细胞质内含物;和/或
(vii)细胞质蛋白或肽。
可优选的是结合基序能够进行核靶向。因此,结合基序可对通常运输至细胞核的实体具有特异性。此类实体包括组蛋白、核仁素、端粒结合蛋白等。
可优选的是结合基序被设计成不包括募集DNA修复酶的已知位点。代表性位点包括病毒ITR。
可优选的是,结合基序经设计使得构象或构象与关键/特定残基和/或序列的组合负责结合基序的结合特异性。
为避免疑义,本文所用的结合基序不是双链DNA中存在的共有序列。代表性共有序列位点是限制性核酸内切酶位点、甲基转移酶和转录因子。这样不需要特定的构象。结合是由结构而不是一级序列决定的。
任选地,结合基序不是衍生自病毒来源的基因组序列,例如反向末端重复等。
值得注意的是,这里介绍了结合基序在结构基序内,并且有效地作为单链提供。如果结合基序与互补序列都存在,则可能导致潜在的双链干扰。在这种情况下,双链体或双链序列的形成将与结合基序构象的形成产生竞争,这是不希望的。如果结合基序与互补序列一起存在,则每个结合基序将作为有义和反义形式存在,从而可以形成双链体。因此,优选的是在结构基序内而不是在双链部分内包含结合基序。
所述载体还可以包括能够结合以下任何一项或多项的进一步的结合基序:
(i)肽或蛋白;
(ii)小分子;
(iii)抗体或其衍生物;
(iv)酶;
(v)免疫刺激剂;
(vi)激动剂或拮抗剂;
(vii)佐剂和/或
(viii)核酸。
这样的结合基序可以与负责靶向的结合基序不同。因此,这是提供给载体以向载体提供附加功能的进一步的结合基序。
靶向性载体可以针对存在于真核细胞之中或之上的细胞靶标,所述真核细胞任选地是植物细胞、原生生物细胞、真菌细胞、人细胞或非人动物细胞。靶标实体可以是任何合适的细胞靶标。
靶向性载体可以针对存在于原核细胞如细菌细胞之上或之中的细胞靶标。任选地,所述细胞是革兰氏阴性或革兰氏阳性细菌细胞。靶向性载体通过结合基序的特异性结合而被递送至靶标。
可能优选的是,载体通过结合基序被递送至细胞核。靶标可以是组蛋白、核仁素和/或端粒结合蛋白。
双链体DNA可以包括基因序列或其片段和任选的启动子。启动子可以有效连接至基因序列或其片段。
靶向性载体可以是靶向性表达载体。
靶向性载体可以包括修饰的核苷酸,任选地,加帽末端中的修饰的核苷酸。
靶向性载体可以是基本上纯的DNA,任选地,95%DNA(按重量计)。
靶向性载体可以是DNA/RNA杂合体。
结构基序可以允许在结构基序的序列中的核苷酸碱基之间形成氢键,任选地,其中所述核苷酸碱基之间的氢键涉及Watson-Crick碱基对、Hoogsteen碱基配对或非规范碱基配对。
结构基序形成非规范DNA结构,并且可包括以下任何一项或多项:
a)发夹;
b)横臂(cross-arm);
c)三链体;
d)G-三链体;
e)G-四链体;
f)i-基序;
g)假结;
h)茎环;和/或
i)凸起或环。
结合基序所呈现的结构或构象可以允许以结构和/或序列依赖性方式与目标结合。
结合基序可以是以下任何一项或多项:
a)适体;
b)G-四链体;
c)催化剂;
d)i-基序和/或
e)三链DNA。
结合基序可以是特异性的。特异性是指结合基序与任何其他实体相比优选选择性结合靶标实体。这主要是由于它形成的构象,但也可能包括特定或关键残基的存在。
本发明还涉及将DNA载体递送至靶细胞位置的方法,包括将本文所述的载体施用给接受者。接受者可以是有此需要的人或动物,或者可以是体外的细胞、组织或器官。因此,本发明扩展到如本文所述的载体用于将DNA载体递送至靶标位置的用途。
本发明还涉及制造核酸载体的方法。所述载体可以如本文所述。
所述方法的步骤可以包括:
(a)提供核酸模板,所述核酸模板包含编码以下的序列:
(i)第一加工基序,其毗邻
(ii)第一结构基序,其包含第一加帽末端的至少一部分,
(iii)所述双链体DNA的单链,
(iv)第二结构基序,其包含第二加帽末端的至少一部分,其毗邻
(v)第二加工基序
所述加工基序包括能够形成碱基配对部分的序列,其包含含有切割位点的内切核酸酶的识别位点,
所述结构基序包括至少一个能够形成分子内氢键的序列,
所述第一或第二加帽末端中的任一者或两者包含含有结合基序的结构基序;
(b)使用能够进行滚环扩增的聚合酶扩增所述模板,从而产生单链多联体(concatemer);
(c)使单链多联体与核酸内切酶接触以释放单链DNA构建体,其中3'末端核苷酸在毗邻构建体的单链部分处碱基配对;和
(d)使单链DNA构建体与聚合酶接触,以使用单链DNA构建体作为模板延伸3'末端核苷酸,从而形成双链体部分。
该方法的扩增部分可能需要使用引物或可使用引物酶或缺口酶启动。
本领域技术人员将理解,使用此处描述的方法将产生其中加帽末端中的一个被切口或间隔的载体。因此,加帽末端中的一个是闭合末端。如果两端都需要缺口,可以使用缺口酶来实现。
5'末端核苷酸也可以与构建体的单链部分进行碱基配对,并且聚合酶可以构建双链体直至5'末端核苷酸。然后可以适当地连接5'核苷酸和3'核苷酸之间的缺口。
所述方法可进一步包括步骤(e)添加合适的酶或试剂以使缺口或空隙共价闭合。合适的酶可以是连接酶。
模板核酸可以包括加帽末端的一部分,其大于形成加帽末端所需的整个序列。在这种情况下,从其转录的单链产物可以在用聚合酶延伸之前与缺口酶接触。缺口酶可以暴露于适当的3'末端核苷酸,用于延伸。
附图详细说明
图1显示了用不同载体转染的HEK293细胞中来自载体的标准化SEAP表达(U/mL培养基)的比较,所述不同载体的区别在于选择用于帽中的结合基序。选择结合基序与导入细胞核的靶蛋白相互作用:组蛋白H4:H4_Gq和H4_sl,核仁素:nucl,以及识别人端粒G-四链体的因子:hTel。该图是条形图,显示了所用各载体的结果(SEAP表达以U/mL为单位)。
图2显示了用减少量的右端含有单个结合基序的载体转染的HEK293细胞中的标准化SEAP表达(U/mL培养基)。所述结合基序是人端粒G-四链体基序。使用0.4μg具有加帽末端的载体和0.5μg竞争载体(无SEAP)。该图是条形图,显示了所用各载体的结果(SEAP表达以U/mL为单位)。
图3显示了用减少量的右端含有单个结合基序的载体转染的HEK293细胞中的标准化SEAP表达(U/mL培养基)。所述结合基序是人端粒G-四链体基序。将0.2μg具有结合基序的载体掺杂0.7μg竞争载体(无SEAP)。该图是条形图,显示了所用各载体的结果(SEAP表达以U/mL为单位)。
图4显示了用减少量的右手端含有单个结合基序的载体转染的HepG2细胞中的SEAP表达(U/ml培养基)。结合基序是人端粒G-四链体基序。使用0.4μg具有结合基序的载体和0.5μg竞争载体(无SEAP)。该图是条形图,显示了所用各载体的结果(SEAP表达以U/mL为单位);
图5:显示了本发明载体的多个实施方案,其中载体全部共价闭合。顶部显示了在左端和右端均具有G-四链体的载体。第二种载体在左端包含适体,在右端包含不同适体。第三种结构在一个末端包含G-四链体,并在另一个末端包含适体。第四种结构在每一个末端都包含茎环,其中环是单链DNA,通过茎结构结合在一起。所有都包括DNA的双链部分和至少一个加帽末端,其由结构基序形成并包括结合基序,使得载体可以根据需要被靶向或引导。
图6:显示了本发明载体的多个实施方案,其中载体不是共价闭合的并且包括一个或多个缺口(nick)或空隙(gap)。所有实例均显示了线性双链体部分以及加帽末端。此处显示的所有示例性载体在左端和右端均包含G-四链体。缺口(简单的主链断裂)或空隙(双链部分中的一个或多个核苷酸单链)可以存在于双链体的任一个末端(右或左)或双链体的两端(右和左),如所示。
图7A:描述了本申请实施例中使用的示例性载体。顶部的载体是载体的简化显示,其是双链线性载体,一个末端有帽,该帽包括多个链霉亲和素适体,而另一个帽是简单的茎环(环中为GAA)。该示例中的载体是共价闭合的。还显示了载体中存在的表达盒,具有启动子(EF1α)、基因(SEAP)和polyA信号(SV40)。在这种情况下,载体包括具有单个适体作为结合基序的加帽末端,该适体结合链霉亲和素,或包含4个链霉亲和素适体的加帽末端。图7B描述了实施例中使用的部分实验方案,其中在未结合的载体被洗去之前,载体暴露于链霉亲和素包被的板两个半小时。不具有适体的载体用作对照。然后使用嵌入荧光团与结合至板的载体结合,以用于检测目的。
图8:这是图7B中所示的结合实验图,使用了三个载体。这些载体是对照(无适体)、单个适体和包含四个适体的加帽末端。显示了包含四个链霉亲和素适体的载体的改进的结合能力,同时单个适体也获得了良好的结合结果。对照(无适体)显示没有特异性结合并被洗去。该图是载体浓度(单位为nM)与结合的DNA(单位为RFU(相对荧光单位))的关系图。
图9:该图显示了实施例中制备和测试的载体所采用的各种可选加帽末端。使用的各种加帽末端有茎环、适体、G-四链体和多重适体。在这种情况下,所有加帽末端均已包含在载体的右端(从基因的有义序列来看),但本领域技术人员理解任一―端”(左或右)均可包括结合基序。
图10:显示了本文所述方法的一个实施方案。显示了双链模板分子(1)。三角形表示合适的缺口位点,它使双链模板能够形成缺口,因此仅启动模板的一条链的扩增。显示了编码加工基序(101)和结构基序(103)的序列。在这种情况下,结构基序包括3个组分:两个序列形成结构茎(105和106),一个中心序列形成结合基序(107)。一旦处于单链形式(2),加工基序(201)就会形成,并且可以使用合适的酶如核酸内切酶(202)进行加工。可以看出,结构基序(203)允许结构形成,在这种情况下是在(205)和(206)之间形成的茎,中间有G-四链体(207)。在加工(3)之后,分子可以与聚合酶接触以填充双链体(210),如(4)所示,双链体(210)可以保持打开(显示缺口(211))或如部分(5)所示地通过连接(213)共价闭合。为清楚起见,一次只标记一个末端,但这些标签同样适用于另一个末端。
图11显示了实施例5中使用的模板,其包括缺口位点、与构象基序毗邻的加工基序、感兴趣的序列、与第二加工基序毗邻的第二构象基序以及与感兴趣的序列大小相似的主链。主链中有一个额外的核酸内切酶靶位点,它将仅在dsDNA中切割。
图12显示了用SafeView染色的0.8%琼脂糖凝胶,证实了实施例5中通过第二链合成和连接产生的载体。泳道1和9是Thermo Scientific Gene Ruler1kb Plus DNA ladder。泳道2缺少所有酶;泳道3包括T4 DNA连接酶;泳道4包括T4 DNA连接酶和T5核酸外切酶清理步骤;泳道5包括T4 DNA聚合酶;泳道6包括T4 DNA聚合酶和T5核酸外切酶清理步骤;泳道7包括T4聚合酶和T4连接酶;泳道8包括T4聚合酶和T4连接酶以及T5核酸外切酶步骤。
图13显示了用在单个末端含有多个结构化末端基序的报告基因DNA转染的HEK293细胞中的标准化SEAP表达(U/ml培养基),如实施例6所述。
发明详述
本发明满足了提供载体的需要,所述载体可以靶向并将自身递送至期望的细胞位置。因此,可以将载体描述为靶向性的,因为它不需要额外的帮助就可以到达其期望的位置。可以理解,期望的位置可以是组织类型、细胞类型和/或细胞内的位置。期望的位置可以是病原体如细菌或真菌的特定菌株。所述细胞可以是体内的或离体的或体外的。由于包含在载体内,尤其是在结构基序内的结合基序的存在,所述载体能够靶向。优选地,包含一个或多个结合基序。优选地,结合基序存在于加帽末端中,而不是双链体或线性部分。在实验上,本发明人已经证明了包含多个结合基序甚至可以进一步改善靶向性。可以将所述载体描述为包括在两端加帽的双链核酸部分。可以将双链体描述为线性部分。帽可以是相同的或不同的。帽可以是开口的或闭合的。至少一个帽包含结构基序。所述结构基序能够呈现结构。结构基序包括一个或多个结合基序。结合基序一起可以形成结构基序,或者结构基序可以支持一个或多个结合基序的结构。载体可以具有相同的加帽末端,或者每一末端可以不同。只需要一个末端包含用于靶向的结合基序。另一个末端可以包括用于其他功能如运输小分子的结合基序。因此,载体可以是不对称的。
所述载体被设计为借助结合基序的特异性结合而被递送至期望的细胞靶标。所述载体被设计为避免了已知会募集DNA修复酶的序列和结构,因为如果需要,DNA损伤修复途径的启动可以减少载体的表达。此类结构可以包括优选被排除的病毒ITR。
载体
本发明涉及核酸载体,优选是DNA载体。核酸载体可以定义为将遗传物质携带到细胞中的媒介物,它可以在所述细胞中复制和/或表达。将遗传信息转移到细胞的载体的目的通常是在靶细胞中分离、扩增或表达插入物。载体可设计为用于转录成RNA和/或蛋白表达。专门设计用于在靶细胞中表达转基因或其片段的载体可以具有驱动基因或其片段表达的启动子序列。本发明的载体可以是任何合适类型的载体并且可以导致任何类型的RNA或蛋白在细胞内的表达。所述载体允许将基因或其片段中编码的信息翻译成细胞中的蛋白或RNA结构。表达的基因包括转录成信使RNA(mRNA)然后翻译成蛋白的基因,以及转录成RNA的基因,例如转移和核糖体RNA,但不翻译成蛋白。可以优选的是,载体是表达载体。表达载体可以包括基因或其片段,所述基因可以是转基因,即在要引入的细胞中尚不存在的基因。所述基因可以编码蛋白或RNA实体。
表达载体可以通过基因或其片段的转录,然后翻译产生的mRNA,而在细胞内生产蛋白。在不同生物体中进行表达时尽管许多元件相似,但实现蛋白生产有不同要求。通常,所需的元件可以是用于启动转录的启动子和终止信号。可包括表达盒。为了在真核细胞中表达,表达盒包含一个或多个启动子或增强子元件和编码感兴趣的mRNA或蛋白的基因、基因的片段或其他编码序列。表达盒可以由有效连接至感兴趣蛋白的编码序列的真核启动子以及任选的增强子和/或真核转录终止序列组成。用于真核系统的感兴趣的基因或编码序列的实例可以包括抗原性实体的编码序列,并且因此所述载体可以是核酸疫苗。对于原核表达载体,所述载体可以包括原核启动子和终止序列。任何表达载体或表达盒中的启动子都可以是可诱导的,这意味着表达仅在需要时通过引入诱导子而启动。
所设计的用于生产RNA而不生产蛋白的表达载体可以包括合适的启动子以驱动基因或其片段的转录。所述基因或其片段可以编码任何合适的RNA分子,例如信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、反义RNA(asRNA)、指导RNA(gRNA)、小干扰RNA(siRNA)、microRNA(miRNA)、长链非编码RNA(lncRNA)、Piwi相互作用RNA(piRNA)和短发夹RNA(siRNA)。或者,所述RNA可以形成核酶或适体。
由于载体优选是人工合成的,例如在无细胞过程中酶促制备,因此可以设计任何基因或其片段用于表达。因此它可能具有细胞毒性,该基因序列难以在细菌等中扩增。
所述基因或其片段因此在细胞内编码RNA或蛋白产物。基因片段可与仅含外显子(基因中实际编码蛋白序列的那些部分)的基因片段有关。或者,基因片段可以编码较大蛋白的单体或亚基,而不是整个蛋白本身。基因片段也可与核酸疫苗的生产有关,例如包含来自病毒的抗原性蛋白的一部分,用于在细胞中表达。在此类情况下,可能不希望在细胞中产生完整的蛋白。因此,如果适合在细胞中表达,片段可以是基因的一小段。示例性的是用于诱导免疫应答的病毒突刺蛋白的一部分。
载体优选是DNA(脱氧核糖核酸)载体。载体可以是杂合载体,意味着载体中并入不同类型的核苷酸,这可使用本文讨论的合成方法而实现。在杂合载体中,可以优选的是双链体部分为DNA,而加帽末端可以是另一种类型的核酸,例如RNA(核糖核酸)或使用修饰的核苷酸。或者,双链体的部分可以是RNA或修饰的核苷酸。载体可以是80%DNA,或更多,85%、90%或95%DNA。
优选地,载体是基本上纯的核酸,例如载体是至少95%的核酸。载体可以是95%、96%、97%、98%、99%或100%的核酸。任选地,载体是基本上纯的DNA,例如,载体是至少95%的DNA。载体可以是95%、96%、97%、98%、99%或100%的DNA。可优选的是,载体基本上不含蛋白或肽,使得小于5%的载体是蛋白或肽。任选地,载体是少于4%、3%、2%或1%的肽或蛋白。优选的是,载体不包括肽靶向序列如NLS。如本文所用,百分比是指载体自身的重量百分比。可以理解,通过使用结合位点(attachment site),分子可以作为治疗剂结合到要被携带的载体上,并且由此既不是载体的物质也不是靶向机制。
载体可以是天然核酸分子,例如DNA或RNA。优选地,载体是DNA。载体还可以包括非天然核酸分子。非天然核酸分子或异种核酸(XNA)的实例包括1,5-脱水己糖醇核酸(HNA)、环己烯核酸(CeNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、锁核酸(LNA)、肽核酸(PNA)和FANA。Hachimoji DNA是一种合成核酸类似物,除了天然核酸、DNA和RNA中存在的四/五种核苷酸之外,它还使用四种合成核苷酸。已经对酶进行工程化、突变或开发以识别合成核酸分子,因此本发明的方法和产品同样适用于这些类似物,或合成和天然核酸的杂合体及其嵌合体。
所述载体已经在多个图(包括图5和6)中示出。在绘制DNA载体时,常规将线性双链体的―上链”作为―有义链”放置在正确的方向(如果末端是开口的,则是5'-3'方向)。这种常规性适用于此处包含的附图。为清楚起见,当实际上分子可共价闭合并且没有任何末端核苷酸时,在根据此类常规性进行显示时,载体的加帽末端可称为―左”和―右”,而不是5'和3'(意味着在末端有自由核苷酸)。结构基序可以存在于左端和/或右端。
所述载体是合成的DNA结构,其能够以无细胞方式在体外酶促生产。该合成DNA能够从头制造,而不是通过编辑天然基因组结构如染色体来产生的。所述载体不包括着丝粒序列或充当着丝粒的序列。所述载体不是人工人类染色体。
载体可以是任何合适的大小,任选地是小于5Mb的大小,例如0.1KB和5Mb之间的任何大小,例如高达1Mb、高达2Mb、高达3Mb、高达4Mb或高达5Mb。对于基因序列的递送,载体可以是0.1Kb和1Mb之间的任何合适大小,任选地0.1Kb和0.75Mb之间,任选地0.1Kb和0.5Mb之间,任选地0.1Kb和0.25Mb(250Kb)之间。最小大小将取决于双链序列的长度,但可在0.1Kb、0.2Kb、0.3Kb、0.4Kb或0.5Kb的数量级。这些之间的任何中间尺寸范围都是可能的。
双链体
载体可包含双链部分或―双链体”。双链部分也可以描述为线性部分。双链体是具有互补的多核苷酸链(可以是DNA,也可以是DNA和RNA的杂合体)的分子的部分。本领域技术人员将理解,双链体可以由两条互补的多核苷酸链(分子间)或同一多核苷酸链的两个互补部分(分子内)形成。本发明的双链体可以具有任何合适的长度。双链体可以由两条链或一条链形成。双链体可以是纯DNA或与RNA的杂合体。本文所述的方法可以生产具有RNA和DNA的双链体。
优选地,基因或其片段包含在双链体部分中。因此,整个表达盒可以存在于双链体中,包括启动子和任选的终止序列。启动子可以有效连接至基因或其片段。
由于可以人工制备载体,因此不需要包括外来序列,例如用于选择的标志物。这些是载体在细胞环境中扩增时需要的,例如抗生素抗性基因。
双链部分不具有平的、开口的末端,因此不具有平行的末端核苷酸残基-每条互补链的3'和5'末端(其可以是具有自互补性的一条链)。在两个末端,双链化的链中至少一条链延伸超过另一条链,使得存在悬突(overhang)。该悬突可形成加帽末端。悬突可继续并连接至双链体(闭合端)的相对链。
双链体可以具有任何合适的长度,并且将取决于它所携带的序列,因为一些人基因的长度为数千个碱基。载体是质粒的有效替代物,可携带至多100,000个碱基对的插入物。因此,双链体部分的长度可高达100,000个碱基对、50,000个碱基对或25,000个碱基对。
如本文所述的用于靶向和递送的结合基序优选地不包括在双链体部分中;相反,它们存在于所述分子末端的结构基序中。这是为了确保载体的载荷被适当地递送而不受到任何结构的干扰。
双链体可包含任何期望递送至细胞的适当序列(―载荷”),包括基因、转基因、活性RNA的编码序列、用于基因编辑的供体序列等。
双链体可包含适当的序列,例如启动子、增强子、终止子、polyA信号序列等,其增加核酸在靶细胞内的活性。这些在本领域技术人员的能力范围内。
加帽末端
双链体的每一个末端均加帽。加帽末端或―帽”用于保护双链体的末端,特别是防止通过核酸外切酶在细胞内的降解。如本文所用,双链体的加帽末端可呈现可使用分子内氢键结合在一起的结构。因此,双链体的至少一条链继续超过另一条链的末端并形成帽,帮助保护双链体免于在细胞中降解。因此,双链体不是具有自由5'和3'端的平端化形式。可以认为,加帽末端是由双链体链中一条链形成,该链比另一条链长,并且这条延长的单链折叠成一个结构,并且优选地在双链体的另一条链的末端核苷酸附近退火,例如帮助给末端―加帽”,并在空间上防止核酸外切酶等的进入。它可以与闭合端的另一条链相连,由此提供共价闭合端。
加帽末端可以是闭合端,这意味着双链体的每一个末端均共价结合至帽。或者说,帽和双链体是一条连续的链。
加帽末端可以是开口末端,这意味着双链体仅一个末端共价结合帽。换言之,双链体仅有一条链延伸至帽中,而帽的末端核苷酸和双链体相对链的末端核苷酸之间存在空隙。在这种情况下,末端核苷酸可以固定在载体内以稳定载体并防止在细胞内立即降解。
双链体的一个加帽末端可以是简单的帽,例如它可以是一个或多个发夹(连续的)或一个或多个带缺口的发夹(具有空隙)。或者,一个末端可以采用多种简单的构象,例如茎环(具有单链核酸环的双链体)、环(单链核酸环)、由两个发夹形成的T形、凸起(bulge)或类似物。然而,加帽末端可以在帽内包括更复杂的结构,例如多个茎环(形成星形)、多个发夹、横臂、十字形、假结、G-四链体或i-基序。这些用作人染色体末端的帽。此种简单或更复杂的帽可以是开口的或闭合的。如果帽是开口的,则末端核苷酸可以固定在帽内和/或双链体内,如下文进一步讨论的。
为了成为能够递送至期望位置的靶向性载体,至少一个帽包含结构基序。两个帽均可以包含结构基序,每个都可以独立地设计。结构基序是可以在帽中形成所需结构的序列。可以设计这样的结构使得该结构在相关条件下形成,所述相关条件例如生理条件或使用载体的环境(例如细菌细胞培养)。结构基序可以起到稳定载体的作用,例如使其更能抵抗降解。需要稳定的载体以确保基因或其片段完整地到达目标靶标而不发生变化。结构基序可能仅在特定条件下形成结构,这取决于其环境的离子强度和/或pH值。如果载体被设计为仅在一系列特定条件,例如细胞条件下形成特定结构,则可优选的是包含结构基序的加帽末端是闭合末端,其因此可以在其他条件下在双链体的末端之间简单地形成单链环。
闭合的加帽末端意味着没有需要固定(secure)的末端核苷酸。闭合端与双链体的两端相连。可能优选的是,至少一个加帽末端是闭合的,或者两个加帽末端都是闭合的。
如果加帽末端是开口的,优选地,末端核苷酸被固定,以防止立即降解。
加帽末端可包括任何合适长度的多核苷酸段。加帽末端的长度将取决于加帽末端的复杂性。如果它是一个简单的发夹,则在双链体末端形成发夹所需的序列量最少。然而,对于更复杂的结构,例如多个适体或G-四链体,加帽末端的长度可以是几百个碱基,例如长度为至多800个碱基,或至多700个碱基,至多600个碱基或至多500个碱基。
开口的加帽末端
本发明的载体可具有一个或两个―开口(open)”的加帽末端,使得多核苷酸/载体不连续。在存在开口加帽末端的情况下,缺口/空隙的每一侧均有一个游离末端核苷酸(5'和3'末端核苷酸)。在两个相邻的核苷酸之间存在一个缺口,其中主链是不完整的从而使它们不彼此连接。空隙出现在在末端残基之间存在一个或多个缺失的核苷酸的地方,任选地其中末端核苷酸相隔许多个核苷酸。该缺口或空隙出现在帽处或帽附近,而不是在双链体部分中。
如果加帽末端是开口的,则优选地,末端核苷酸残基通过分子内氢键结合至载体的另一部分,包括结构基序(如果存在于该末端)。因此,例如加帽末端的末端核苷酸(3'或5')可以与加帽末端中的另一个残基碱基配对,双链体的末端残基(5'或3')在双链体内部进行碱基配对。在一方面,末端核苷酸与构建体中的其他核苷酸形成碱基对。实际上,所述载体确保没有游离的单核酸链,其末端核苷酸可被核酸外切酶降解。
然而,末端残基中的一个或多个可以不含氢键或更具体地不含碱基配对。在这种情况下,加帽末端通过包围、环绕或围绕末端核苷酸来固定末端核苷酸,使得单链核酸酶不能自由地将其从构建体中的相邻核苷酸上切割下来(然后切割相邻的核苷酸等等)。换言之,所述末端在空间上被保护免于降解,因为较大的实体不可能到达它。例如,末端核苷酸可以固定在四链体基序内。
另一方面,每个末端可以通过形成至少包括末端残基的双链体来固定。所述双链体由核苷酸序列之间的碱基配对形成。这些序列可以是相邻的(发夹)或分开的(茎环等)。
残基是指构成核酸聚合物的单个单元,例如核苷酸。末端残基是核苷酸链末端的残基,位于3'或5'端。
末端可以固定在构象/结构内,例如四链体内。
四链体(quadruplex)是四倍(四链化)结构,其可能与染色体端粒末端的结构有关。基本模式是四分体(tetrad),即4个残基的平面排列,通过Hoogsteen氢键和与中心阳离子的配位而稳定。四链体通过多个四分体的堆叠而形成。根据序列最初如何折叠成这些排列,可能形成许多不同的拓扑结构。四链体结构可以通过阳离子,尤其是钾的存在而进一步稳定。四链体已被证明在DNA、RNA、LNA和PNA中是可能的,并且可能是分子内的。
示例性四链体包括G-四链体,其由富含G的序列和由富含胞嘧啶的序列形成的i-基序(嵌入基序)而形成。
因此,在一方面,末端核苷酸被固定在四链体中,任选地是G-四链体或i-基序。
结构基序
结构基序设计为由单链核酸形成。结构基序具有允许其形成结构的序列,并且该结构优选是由单链DNA形成的二级结构。这种结构可以描述为折叠的单链核酸,因为双链体的一条链延伸出来形成加帽末端。在闭合端构型中,这条单链然后形成双链体的相对的互补链。因此,处于未折叠构型时的闭合端是在双链体末端之间环化的单链核酸。在某些条件下,例如储存条件下,结构基序简单地作为单链环存在是可能的。然后该结构可以在适合使用的条件如生理条件下重新形成。
基序形成的结构可以通过核酸的碱基彼此相互作用来实现。所述结构可以包括分子内氢键以将基序保持在结构中。将结构保持在位的适当的相互作用和键在本文中进一步描述。
结构基序可以形成任何合适的结构或构象。基于单链核酸,许多结构都是可能的。这些包括发夹、茎、茎环、环、凸起、T形(配对的发夹)和十字形。也可以实现更复杂的结构,例如三链体(三条核酸链,其可以是分子内的)、G-三链体、四链体、i-基序、假结或其任何组合。
可以通过在单链中包含适当的互补序列区域来设计结构基序。互补性在本文中定义。
根据序列和其他条件,核酸可以形成被认为具有生物学意义的各种结构基序。
当同一条链的两个区域(通常在相反方向读取时核苷酸序列互补)碱基配对形成双链体时,将形成发夹。回文核苷酸序列能够形成发夹。发夹可以完全互补,但由于空间位阻,发夹尖端的一些碱基对可未配对。发夹可以在尖端包括一些非互补序列碱基。
茎环分子内碱基配对是单链核酸中可发生的一种模式。该结构也称为发夹环。当同一条链的两个区域(通常在相反方向读取时核苷酸序列互补)通过碱基配对而形成以未配对的单链环结束的双螺旋时,就会发生这种情况。
假结是包含至少两个茎环结构的核酸二级结构,其中一个茎的一半嵌入在另一个茎的两半之间。
十字形核酸结构需要至少6个核苷酸的序列的反向重复,从而形成十字形的由茎、分支点和环组成的结构。
G-四链体二级结构(G4)通过富含鸟嘌呤的序列在核酸中形成。它们呈螺旋状,包含可由一条或多条链形成的鸟嘌呤四分体。i-基序是由富含胞嘧啶的DNA形成的四链化四链体结构,类似于G-四链体结构。富含C的DNA区域在人类基因组的基因调控部分中很常见。
i-基序(嵌入的基序DNA)是富含胞嘧啶的四链化的四链体DNA结构,类似于G-四链体结构。
三链体DNA(也称为H-DNA或三链化DNA)是其中三个寡核苷酸彼此缠绕并形成三螺旋的DNA结构。在三链化DNA中,第三条链通过形成Hoogsteen碱基配对或反向Hoogsteen氢键与B型DNA双螺旋(通过Watson-Crick碱基配对)结合。
因此,结构基序允许核苷酸形成非规范结构。该结构在结构基序功能的背景下很重要,用以提供结合基序。结合基序被描述为具有―构象”以防止不同部分之间的混淆,但是术语构象、结构、二级结构、三级结构、构型或几何形状均可以互换使用。为了确认,双螺旋或B-DNA是具有规范Watson-Crick碱基对的DNA结构。
结构基序包含能够形成分子内氢键的序列。这些氢键可以是任何类型的碱基对,或在诸如四链体/四倍体等结构中所见的Hoogsteen型氢键。
值得注意的是,结构基序可以是包括能够与序列的另一部分形成碱基对的一个或多个序列部分的序列。
因此,结构基序可以简单地包括―互补”的两个序列部分,其通过碱基对以形成反平行或实际上平行的双链体。该双链体可以包括或可以不包括链的末端残基(即3'或5'端)。在这种情况下,结构基序可以形成发夹(两个部分是连续的)或茎环(如果所述两个部分被间隔序列分开,则形成单链核酸)。应当理解,这样的结构可以通过在结构基序中包括反向重复序列来实现。回文序列是双链核酸序列部分,其中在一个部分上从5'至3'的正向读取则与在与之形成双链体的互补部分上从5'至3'的正向读取相匹配。
因此,结构基序可以包括形成以下一种或多种所必需的序列:发夹、茎环或假结。所有这些构象均具有可以形成双链体的两个序列部分。替代结构包括系绳(lariat)或套索(lasso),它们也包括可以形成双链体的序列部分。
结构基序可以是三链体。在这种情况下,三个寡核苷酸彼此缠绕并形成三螺旋。在三链化DNA中,第三条链通过形成Hoogsteen碱基配对或反向Hoogsteen氢键与B型DNA双螺旋(通过Watson-Crick碱基配对)结合。三链体DNA也称为H-DNA。当三个部分具有适当的序列时,它可以在分子内形成。在一些情况下,可以使用载体内的双链体并且添加额外的三链体形成寡核苷酸而形成三链体,因此三链体是分子间的。三链体可以是DNA链和RNA链之间的杂合体。
结构基序可以是不同构象或结构的杂合体。
根据链的序列、长度和方向以及条件,结构的形成有某些先决条件。核酸的水合和各种离子和/或配体的存在也可能影响核酸的结构。例如,在更酸性的pH值下,更可能形成i-基序,而在碱性或中性pH值时,它可能是单链的。四链体基序可以在较低的盐浓度下形成较简单的发夹结构,而在生理pH下在钾离子中它们将采用G-四链体形式。
下表1中的一些示例性序列详细说明了结构形成的一些序列要求:
表1
所有这些结构已被记录为在生理条件下形成。
结构基序有效地提供了允许形成加帽末端的序列。因此,它的长度可以是至多800个核苷酸、至多700个、至多600个或至多500个核苷酸。最小结构基序可包括约12个核苷酸,使得可形成6个碱基对的发夹,连同最小的结合基序部分,优选至少5个核苷酸长。
当为结构基序设计合适的序列时,本领域技术人员将理解,需要注意避免在结构基序和双链体中使用互补的重要序列(significant sequence),因为这会中断双链体和加帽末端在正确方向的形成,尤其是当载体是从单链起始分子制备时。本领域技术人员将意识到,可以使用适当的软件来检查序列的结构,包括
https://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html。
结构基序包括至少一个结合基序。本文所述的不同结构可能有能力形成结合基序。例如,四链体是一种结构基序,其包括富含G的环,这些环是针对核仁素的结合基序。
氢键和碱基配对
氢键是分子之间或在分子内的一类非共价键。这些键由一个电负性原子(氢受体)和氢原子形成,所述氢原子共价结合相同分子或不同分子中的另一个电负性原子(氢供体可以是氮、氧或氟原子,尽管可能与其他供体形成较弱的氢键)。它们是最强的偶极-偶极相互作用类型。氢键负责DNA双螺旋中特定碱基对的形成,并且是决定DNA双螺旋结构稳定性的一个因素。
通常,在Watson-Crick碱基配对中,氢键在核苷酸的含氮碱基(核碱基)之间形成。在标准碱基配对中,即DNA中的腺嘌呤-胸腺嘧啶(A-T)、RNA中的腺嘌呤-尿嘧啶(A-U)和两者中的胞嘧啶-鸟嘌呤(C-G),形成氢键。A-T/U和C-G配对的作用是在互补碱基上的胺基和羰基之间形成双氢键或三氢键。
摆动碱基对(wobble base pair)是核酸分子中两个核苷酸之间的配对,最尤其是在RNA中,它不遵循标准的Watson-Crick碱基对规则。四个主要的摆动碱基对是鸟嘌呤-尿嘧啶(G-U)、次黄嘌呤-尿嘧啶(I-U)、次黄嘌呤-腺嘌呤(I-A)和次黄嘌呤-胞嘧啶(I-C)。摆动碱基对的热力学稳定性与Watson-Crick碱基对相当。摆动碱基对是RNA结构的基础。
替代或非规范碱基配对也可能存在于核酸结构中,也是通过氢键结合在一起。这些通常在RNA中更常见,但也可能存在于DNA和其他核酸中。非规范碱基配对的一个示例是Hoogsteen和反向Hoogsteen碱基配对。在这些相互作用中,嘌呤碱基,即腺嘌呤和鸟嘌呤,翻转它们的正常方向,并与其配偶体形成一组新的氢键。已显示Hoogsteen氢键存在于四链体中,例如本文更详细讨论的i-基序和G-四链体。
也可以包括各种碱基配对机制的组合。例如,当规范B型DNA中的A-T和G-C碱基对中的氢键形成时,核碱基中的数个氢键供体和受体基团仍未被使用。每个嘌呤碱基在边缘都有两个这样的基团,暴露在大沟(major groove)中。三链体DNA可以在双链体和第三条寡核苷酸链之间分子间形成。第三链碱基可与B型双链体中的嘌呤形成Hoogsteen型氢键。
碱基对也可以在天然碱基和非天然碱基之间形成,也可以在非天然碱基对之间形成。
分子内氢键也可以是未被定义为经典碱基配对的相互作用,例如G-四链体的G-四分体中鸟嘌呤残基的平面排列,其通过Hoogsteen氢键进行稳定。下面将进一步讨论这些结构。
此外,核酸分子的稳定化也可依赖于碱基堆叠相互作用。Pi-pi堆叠(也称为π-π堆叠)是指芳环之间有吸引力的非共价相互作用,因为它们含有pi键。这些相互作用对于核酸分子内的核碱基堆叠来说很重要,所述核酸分子通过氢键结合在一起。因此,单链核酸构建体可能通过碱基堆叠相互作用进一步稳定。稳定核酸的其他相互作用也是可能的,这些相互作用包括pi-阳离子相互作用、范德华相互作用和疏水相互作用。
所有这些相互作用和键可以存在于本发明的双链化部分中的任何类型的加帽末端中,存在于简单或复杂的加帽末端中或存在于结构基序中(如果存在)。
当两个核苷酸序列在严谨条件下彼此杂交时,可以认为这两个核苷酸序列是基本上互补的。在一些实施方案中,当两个核苷酸序列在高度严谨条件下彼此杂交时,它们被认为是基本上互补的。
核酸杂合背景下的严谨杂合条件是序列依赖性的,并且在不同条件下是不同的。核酸的杂交详细描述于Tijssen Laboratory Techniques in Biochemistry andMolecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2,Elsevier,New York(1993)中,其通过引用并入本文。严谨性由杂合温度和盐浓度决定(高温和低盐更严谨)。对于不完全互补的序列,必须将严谨性降低至允许形成不完美杂合体的水平。如果杂交的严谨性太低,则会发生过多的非特异性结合,并且不会形成或维持所需的载体,并且此类低严谨性条件在本发明的背景下是不希望的。
通常,高度严谨的杂交条件被选择为比特定序列在确定的离子强度和pH下的熔点(Tm)低约5℃。
Tm是50%的靶序列与完美匹配的序列(互补)杂交时的温度(在规定的离子强度和pH值下)。选择非常严谨的条件以等于一组特定互补序列的Tm。
可以使用适合杂交的条件,例如适合PCR引物退火的条件。杂交可以在45至65℃、任选50至55℃的温度下发生。
四链体
G-四链体的序列是多种多样的,可以用以下推定公式来定义:
(G3+N1-nG3+N1-nG3+N1-nG3+),其中N是任何核苷酸,包括鸟嘌呤。鸟嘌呤之间的残基数决定了环的长度。已经看到大于7个核苷酸的环。G-四链体本质上是高度多态性的。自然界中已经报道了右手和左手四链体。
例如,四链体(Quadruplexe或tetraplexe)可围绕中心离子复合。许多配体,包括小分子和蛋白,都可以与四链体结合。这些配体可以是天然存在的或合成的。已经发现,所有表征的G-四链体结合蛋白共有一个20个氨基酸长的基序/结构域(RGRGR GRGGG SGGSGGRGRG–SEQ ID No.1),称为NIQI(Novel Interesting Quadruplex Interaction Motif,新的有趣的四链体相互作用基序),其类似于先前描述的FMR1 G-四链体结合蛋白的富含RG的结构域(RRGDG RRRGG GGRGQ GGRGR GGGFKG–SEQ ID No.2)。阳离子卟啉已被证明与G-四链体嵌入结合。匹配具有堆叠四联体(quartet)的四链体和将其保持在一起的核酸环可能很重要。π-π相互作用可能是配体结合的重要决定因素。配体应该对平行折叠的四链体具有更高的亲和力。还考虑了结合其他结构基序以使它们稳定的配体。
i-基序
形成双链体的至少两条平行的富含胞嘧啶的链以反平行方向嵌入,导致形成―嵌入基序”。此类结构可由1、2、3或4条链形成,并且每条链在链方向、序列长度和C:C+碱基对数量方面不同。通常,使此类结构在酸性条件下稳定。已经设计了多种配体来稳定i-基序,使得它们可以在生理条件下运行。
横臂
横臂结构由具有反向重复序列的核酸形成,并涉及链内碱基配对。在DNA中,它通常嵌入富含AT的区域。这些臂可以形成锐角。T形发夹是横臂结构的示例。
发夹
具有反向重复(IR)或回文的序列导致发夹的形成。发夹可以在末端/尖端具有未配对碱基的小环,即使序列是完全互补的。发夹可以包含任何合适的反向重复序列。
泡或凸起
此类结构在双链核酸中形成,其中一条链包括以单链凸出的未配对核苷酸。这可以发生在双链体的一侧或两侧。这些在转录泡中天然发生。
三链体DNA
三链体通过Hoogsteen或反向Hoogsteen键以序列特异性方式在寡嘌呤-寡嘧啶双链体和第三条链之间形成。三链体可以是纯的DNA、纯的RNA或两者的杂合体。三链体结构的形成取决于多种因素,例如寡核苷酸长度、碱基组成、pH、二价阳离子的存在和温度。已在人细胞中检测到三链体,因此其会在生理条件下形成。
结合基序
结构基序包括一个或多个结合基序。结合基序负责载体的靶向。结合基序允许载体与期望靶标相互作用,以帮助将载体递送至期望位置。由于结合基序包含在结构基序中,因此它构成了该结构的一部分。因此,结合基序能够在结构基序内呈现构象。换言之,结合基序具有形状、形式、几何形状或构型。这样的构象对于结合基序的功能性很重要。单独的构象可能足以确保基序与靶标的结合。
尽管结合基序的构象取决于基序的序列,但负责结合基序活性的不仅仅是序列本身。因此,该效果不是由于核酸序列在递送期间与自体互补核酸序列杂交,或对可能存在于双链DNA中的共有DNA序列的识别。
结合基序的特异性可能是由于特定残基的存在和重要构象的组合——例如四链体环中用于结合核仁素的G残基。
因此,结合基序的活性可能是由于单独的构象,或构象与结构内一个或多个残基的位置的组合。这些残基可以描述为关键或特定残基,例如四链体环中的G残基。
结合基序可包含本文所述的任何一种或多种结构/构象的任何组合。例如,与凝血酶结合的DNA适体具有序列d(GGTTGGTGTGGTTGG),并且已被注意到在溶液中形成折叠结构,包含两个鸟嘌呤四链体,所述两个鸟嘌呤四链体通过在一个末端跨越窄沟的两个T-T环和在另一个末端跨越宽沟的T-G-T环连接。G四联体是方形平面结构,也称为G四分体,这些结构形成在G四链体中。因此,这个特定的适体需要四联体和环。
结合基序存在于结构基序内,因为所述结构对于结合基序的功能很重要。例如,从图10可以看出,结合基序(在该示例中为207)位于形成茎结构的两个序列(205和206)之间。因此,在该示例中,整个结构基序包括结合基序加上茎。在该示例中,结构基序为结合基序提供支持,充当支架,并提供加帽末端的稳定性。结构基序可基本上包括一个或多个结合基序,使得需要最少数量的残基来支持载体中的结合基序。例如,四链体可以提供结构基序,其中所述四链体的环提供所述结合基序。
如果存在结合基序的阵列,则这些结合基序中的每一个都可以通过嵌入序列分离,以使每个结合基序形成正确的构象。为了确保阵列的正确折叠,这些嵌入序列可以形成独特序列的分支茎,或者可以以其他方式设计以强制每个基序的独立折叠并将阵列的折叠限制为单个构象。
结合基序可以是适体。适体是与特定靶分子结合的寡核苷酸。通常,适体具有独特的结构和潜在的靶标结合能力。这些特征使适体具有高亲和力(在nM到pM范围内)和特异性结合分子,能够区分仅相差一个官能团的靶标。适体可称为―核酸抗体”。它们能够结合从小分子和蛋白到完整细胞或细菌的所定义靶标。已经定义了能够与癌细胞结合的适体(Tawiah等人,Biomedicines 2017,5,51,5030051,通过引用并入本文)
适体通常可以通过从大的随机序列池中重复选择它们来产生,但天然适体也存在于例如核糖开关中。核酸适体是针对其靶标通过体外选择或等同地通过SELEX(指数富集的配体系统进化技术)产生的,针对给定靶标具有与抗体相当的选择性的核酸种类(抗体模拟物)。范围可以从小分子到细胞。适体可以通过各种非共价相互作用(例如静电相互作用、疏水相互作用、构象选择和诱导拟合)与其同源靶标结合。适体序列的可变性提供给它们以多功能性(veratility)。适体折叠的方式、核酸的顺序和它们所处的环境条件都有助于结合靶标。适体可以提供区别性识别,但与抗体相比具有优势,因为它们可以完全在体外进行工程化,容易通过化学合成产生,并且在治疗应用中很少或不会引起免疫原性。
适体通常作为单链核酸提供,这导致了快速清除(例如从人体),但本发明通过将适体包含在更大的载体中,有效地稳定了适体,保护它免于立即降解。
适体经设计以结合细胞表面上或细胞内的任何合适的靶标。示例包括细胞表面受体或核转运组分。靶标可以如本文所定义。
结合基序可以是三链体。三链体如本文所述。
结合基序可以是四链体。四链体如本文所讨论。四链体的形成需要堆叠的G-四分体或C-四分体,其使用八个Hoogsteen氢键通过四个残基平面组装而形成,从而使这些结构具有高度热稳定性。可以包括使稳定的金属阳离子,或者可以使用使稳定的小分子。这些描述在Maleki等人,Nucleic Acid Research,47(20),10744-10753,2019和等人,Chem Commun,2006,7(45),4685-4687中,两者均通过引用并入本文。
四链体可各自具有独特的区别特征。它们的独特性可以从其独特的折叠模式看出。这些折叠模式上的固有差异可能涉及环连通性和使稳定的金属阳离子的变化,从而导致沟结构的差异。沟宽度和形状的差异为设计结合能力提供了可能。四链体能够结合特定靶标。可以使用四链体将载体靶向细胞核。
结合基序可以是催化剂,例如核酶或脱氧核酶(DNAzyme)。催化性核酸在结构上可编程,易于修饰,且更稳定;尤其是由DNA组成的那些。它们可被设计为以与适体大致相同的方式对靶标特异。催化性核酸是本领域技术人员已知的。催化性核酸在结构上可编程,易于修饰,且DNA酶往往比它们的蛋白对应物更稳定。与适体开发类似的方法可用于开发催化性核酸。报道的首个DNAzyme称为GR5,被设计用于RNA切割,而在活性位点仅有15个核苷酸。DNAzyme可包含在G-四链体或三链体结构中。这些描述在Ma&Liu,iScience 23,100815,2020中,其通过引用并入本文。
结合基序可以是结构或构象元件的任何合适的混合物。结合基序可依赖于特定位置中的一个或多个关键或特定残基来提供结合特异性。
结合基序可以是单链核酸部分,其由结构基序保持在位。这样的结构的一个实例是G-四链体中的环。因此载体中不存在所述单链的互补序列。这防止了形成结合基序和形成双链体之间的竞争。
如前文所述,正是构象或构象与特定(具体或关键)残基的存在的组合赋予了结合基序选择性结合其靶标实体的能力。因此,结合基序不会仅基于与期望位置内核苷酸序列的互补性来靶向载体进行递送。
因此,结合基序的构象或非线性信息内容很重要。下文进一步定义的共有序列依赖于线性信息内容而不依赖于构象。这意味着只要保持结构不变,结合基序就更适合序列修饰。
此外,为避免疑义,结合基序不是独立于构象的共有序列。例如,共有序列存在于双链DNA中,这允许蛋白和酶与DNA结合,例如限制酶、甲基转移酶、重组酶、转录因子等。这些往往是短的DNA序列,通常长度为4-50个核苷酸。序列特异性DNA结合蛋白通常与双链B-DNA的大沟相互作用,因为它暴露出更多识别碱基对的功能基团。因此,当序列存在于双链或甚至有时是单链DNA中且没有任何非规范结构时,所述序列通常会被识别。
优选地,结合基序是特异性的,使得结合基序特异性结合期望靶标而不结合任何其他组分。结合条件优选是生理条件或在其中维持细胞的条件。结合可具有足够的特异性以区分修饰的和未修饰的靶标,例如翻译后修饰,例如糖基化、泛素化、甲基化等。例如,适体已被证明具有足够的特异性以仅结合未修饰的靶标。
结构基序内可以有唯一的结合基序,但优选有多个结合基序,例如1、2、3、4、5、6、7、8、9或10个结合基序,优选2至5个、2至4个结合基序。这些结合基序可以相同或不同。如果它们不同,则它们可以结合不同的实体,或者更优选地,它们各自结合相同靶标的不同部分。通过这种方式,它可以确保实现特异性靶向。
可以提供结合基序的阵列。阵列包含三个或更多个结合基序,其中每个结合基序可以相同或不同。阵列中的结合基序可以通过接头或间隔序列适当分离,以便基序折叠。
结合亲和力可以定义为载体(在该情况下为结合基序)与其配体/结合配偶体之间的结合相互作用的强度。结合亲和力通常通过平衡解离常数(KD)来测量和报告;它定义了两个实体之间的相互作用破坏的可能性。KD值越小,结合基序对其靶标的结合亲和力越大。KD值越大,结合基序和靶标相互吸引和结合越弱。可以进行配体结合测定,优选在平衡条件下进行。用于确定KD的方案是本领域技术人员熟知的,并且包括多种技术,例如凝胶迁移测定、下拉测定、平衡渗析、ELISA、分析超速离心、生物层干涉测量、表面等离子体共振(SPR)和光谱测定。KD根据Koff与Kon的比率(即Koff/Kon)获得,并以摩尔浓度(M)表示。
结合亲和力受非共价分子间相互作用的影响,例如两个分子之间的氢键、静电相互作用、疏水性和范德华力。因此,结合基序的精心设计使其结合期望靶标成为可能。
在最佳/生理条件下的结合特异性可以定义为可以被结合的靶标的一致性。特异性越高,可以被结合的靶标就越一致。高特异性适体不仅可以区分靶标的类型,还可以区分已经进行的修饰。相比之下,混杂的结合基序会结合各种相关结构。
在具体的实施方案中,特异性结合靶标的结合基序旨在指以1mM或更小、100nM或更小、10nM或更小、或3nM或更小的KD结合靶标的基序。将来有可能选择以皮摩尔或甚至飞摩尔级范围的KD结合的结合基序。
竞争性测定可用于确定基序与其靶标结合的能力。
如本文所用,术语特异性结合是指基序在结合发生的环境中区分可能的结合配偶体的能力。当存在其他潜在靶标时与一个特定靶标相互作用的结合基序被称为“特异性结合”与其相互作用的靶标。在一些实施方案中,通过检测或测定结合基序与其靶标之间的缔合度(degree of association),来评估特异性结合;在一些实施方案中,通过检测或测定结合基序-靶标复合物的解离度来评估特异性结合;在一些实施方案中,通过检测或测定结合剂竞争其靶标和另一实体之间的相互作用中的能力来评估特异性结合。在一些实施方案中,特异性结合是通过在一定浓度范围内进行此类检测或测定来评估的。
结合基序靶标
结合基序优选对靶标具有特异性,或能够特异性结合靶标。该靶标可以是任何合适的或期望的靶标。如本文所用,结合基序意指能够结合靶标的可靶向核酸。结合基序是结构基序的一部分。载体包括至少一个对细胞靶标具有特异性的结合基序。如果需要,载体可以任选地包括对非细胞靶标特异的单独的结合基序,以使载体能够用于携带非DNA载荷。
如本文所用,靶标意指可以能够结合一种或多种结合基序或以其他方式与一种或多种结合基序相互作用的任何化合物或实体。靶标的实例包括肽、蛋白、修饰的蛋白、糖蛋白、肽聚糖、脂质、磷脂、糖脂、核酸和/或胆固醇。靶标也可以称为靶标实体或简称为实体。
细胞靶标可以存在于细胞表面,例如膜蛋白、受体、配体、糖、糖基化蛋白、肽聚糖、脂质、磷脂或糖脂。
靶向细胞表面靶标是期望的,因为在多细胞生物体中,它能够通过选择合适的标记物/靶标使载体指向特定组织或细胞类型。所述细胞类型可以是癌性的并且靶标可以仅在此类细胞上表达。这样可以允许仅将细胞毒性基因或其片段仅特异性递送至希望去除的细胞。或者,结合基序可以允许载体靶向特定组织类型,例如心肌,以治疗心脏病。
细胞靶标可以位于血脑屏障,帮助载体穿过血脑屏障。适体已被成功证明可以靶向并穿过血脑屏障。
细胞靶标可存在于细胞内。对于真核细胞,靶标可存在于细胞内膜上,围绕细胞器,例如核膜、线粒体膜、内质网(ER)膜、高尔基体膜和溶酶体膜。每种内膜都是独特的,并且因此可以利用这些差异来实现对这些特定细胞器的靶向。
靶向细胞核对于真核细胞来说是期望的,因为这可以将载体递送至合适的位置进行表达。核膜也称为核套膜,因为它是双层膜。靶标可以是核孔复合体(NPC)的一部分。靶标可以是细胞的核转运蛋白,例如输入蛋白-α和输入蛋白-β。靶标可以是核运输系统的任何部分。核靶向可以通过引入四链体来实现。靶向细胞核也可以通过设计靶向组蛋白等的结合基序来实现。靶向核基质也可能是有利的。许多蛋白可能与核基质相关,例如支架或基质相关蛋白(SAR或MAR),它们被认为在染色质的组织化中起作用。如果希望将载体定位到细胞核内的转录活性点,这样的靶向可能是有利的。
细胞靶标可以是内体系统的一部分,因此有助于转运进或转运出细胞。
或者,可以靶向细胞质组分,例如蛋白和内含物。例如,这可以允许特异性靶向具有不希望的细胞质组分如朊病毒或蛋白斑块的细胞。
细胞靶标可存在于线粒体上,以允许在线粒体中表达。这可能与线粒体相关疾病有关。
核靶向是有利的,因为它可以减少治疗剂量所需的载体量,这是由于更多的基因或其片段被递送至希望表达的位置。此外,对于疫苗等应用,它可以实现基因或其片段的更早表达,从而提供更快速的免疫系统应答。
核酸通常通过核孔复合体(NPC)进入细胞核;这是核膜中的水性通道,它很大,由许多蛋白组成。通过NPC的进入可能是大小依赖性的,较小的载体能够更快地定位到细胞核。其他技术可能会连接NLS肽以试图使载体通过NPC,尽管这样的方法取得了不同程度的成功。根据细胞类型和/或细胞的发育阶段,诸如转录因子的蛋白可能存在于细胞质中,准备好被运输至细胞核。此外,转录因子的丰度和表达可能是可变的。优选靶向通常被运输至细胞核的实体,以确保核递送。此类靶标包括组蛋白、核仁素、端粒结合蛋白等。这些是优选的靶标,因为它们在不同细胞类型中更具组成性表达,并且这些靶标已被证明具有允许核靶向的能力。
通过靶向被运输至细胞核的细胞特异性蛋白,细胞特异性核靶向可成为可能。
载体的生产性转移可能不仅需要细胞进入,而且还需要许多细胞事件,这些事件允许载体从细胞表面移动,穿过细胞质并最终穿过核膜进入细胞核。因此,细胞内运输组分也可以为结合基序提供靶标。有数种蛋白和其他分子参与细胞内运输/细胞质运输/核输入,它们包括多胺、核酸结合蛋白、微管、动力蛋白、阳离子蛋白、伴侣蛋白和核输入蛋白、端粒结合蛋白、组蛋白或核仁素。
细胞质中充满了蛋白,先前已经显示大于2000个碱基对的核酸无法在有用的时间范围内有效地进行细胞质扩散。因此,包括结合细胞内运输中组分的结合基序可以增加穿过细胞质的转移速度,尤其是对于较大的载体。
当载体进入细胞时,它们可能被内吞,导致载体聚集在内体中。最终,内体可能被递送至溶酶体,且内体的内容物被降解。因此,为了有效靶向载体,不希望靶向内体途径。因此,载体可以通过内吞作用以外的机制(例如靶向特定的转运蛋白)实现细胞进入,或者引入逃逸内体的机制。可以通过选择表现一种或多种以下特性的受体来实现高效的内体逃逸:高表达的细胞表面受体(>105)、快速的受体摄取(大约20分钟被认为是快速的)和/或受体具有增强的内体逃逸效率(大约1%的载荷逃逸)。例如,肝细胞表面受体ASGPR在肝细胞表面高水平表达(每个细胞106个受体)并迅速内化。
可以选择不仅与靶标结合而且内化进细胞中的结合基序。关于适体,例如,基于细胞的SELEX已被用于确保适体在与靶标结合后被内化。
下面包括了可能用于靶向的跨膜受体;此列表并不全面:
表2
/>
/>
以下包括了一些合适的细胞靶向性适体:
表3–能够靶向的示例性适体。
/>
/>
下表示出了由本发明人选择并举例说明的靶标(见实施例)。组蛋白H4是包括在真核细胞染色质结构中的五种主要组蛋白之一。
表4:靶标候选物和结合基序结构。
本发明的载体可以具有多个结合基序,因此可以结合多个靶标。例如,可能不仅包括针对特定细胞靶标的结合基序,还包括针对核靶标的结合基序,不仅确保特异性进入细胞,还确保进入该特定细胞中的细胞核。在该种情况下,可优选的是结合基序位于载体的不同末端。或者,这些不同的结合基序可以作为阵列存在于载体的一个末端。
递送
本发明的核酸载体可以描述为递送载体,这是由于结合基序将载体引导至期望细胞靶标。因此,本发明的载体可以是递送载体,其中通过包括包含结合基序的结构基序,在载体本身的核酸内引入细胞靶向机制。
本发明的载体可用于将其自身递送至指定的或期望的细胞靶标。该细胞靶标可以是体内或体外的。
可以在不使用化学递送剂如肽序列、脂质体等的情况下制备用于这样的递送的载体。这是因为载体提供了一体化的解决方案,为尚未被完全解决的问题提供了最简化的解决方案。换言之,载体可以作为“裸”DNA提供。裸DNA是一种有吸引力的非病毒基因载体,因为它固有的简单性和DNA本身的低免疫原性。
可以将本发明的载体并入适合施用于受试者的药物组合物中,以用于体内递送至受试者的细胞、组织或器官。通常,所述药物组合物包含本发明的载体和药学上可接受的载体。例如,可以将本发明的载体并入适用于期望的治疗施用途径的药物组合物中。通过高压静脉内或动脉内输注的被动组织转导是潜在的治疗途径。用于治疗目的的药物组合物可以配制成溶液、微乳液、分散液等。无菌可注射溶液可通过将所需量的载体并入具有一种成分或成分组合的合适缓冲液中来制备,根据需要,然后过滤灭菌。
可以将本文所公开的载体并入适合于局部、全身、羊膜内、鞘内、颅内、动脉内、静脉内、淋巴内、腹膜内、皮下、经气管、组织内(例如,肌内、心脏内、肝内、肾内、脑内)、鞘内、膀胱内、经结膜(例如,眼眶外、眼眶内、眼眶后、视网膜内、视网膜下、经脉络膜、脉络膜下、基质内、前房内和玻璃体内)、耳蜗内和经粘膜(例如,经口、经直肠、经鼻)施用的药物组合物中。
可以配制包含载体的在药学上有活性的组合物,以将转基因递送至接受者的特定细胞,导致转基因在其中治疗性表达。所述组合物还可以包括药学上可接受的载体。
本文提供的组合物和载体可用于递送用于各种目的的转基因。
可将本文所述的载体施用于生物体,以在体内转导细胞。
施用此类核酸的合适方法有很多,并且是本领域技术人员熟知的。本文公开的载体的示例性施用方式包括经口、经直肠、透粘膜、鼻内、吸入(例如,通过气雾剂)、经颊(例如,舌下)、经阴道、鞘内、眼内、真皮下、透皮、皮内、子宫内、胃肠外(例如,静脉内、皮下、皮内、颅内、肌内、胸膜内、脑内和关节内)、局部(例如,对皮肤和粘膜表面两者,包括气道表面和透皮施用)、淋巴管内等,以及直接组织或器官注射。当期望的细胞是肌细胞时,直接注射可能是贴切的,例如疫苗。
此外,多于一个转基因/编码序列可包含在组合物内的单个载体或多个载体中。
或者,可以从受试者中取出细胞,将载体引入其中,然后将细胞放回受试者体内。从受试者中取出细胞进行离体治疗,然后将其引回受试者体内的方法是本领域技术人员已知的。另外,可以修饰同种异体细胞(来自不同供体)并将其引入受试者。
递送可以对不是受试者细胞的靶细胞特异——例如细菌、真菌或寄生虫细胞。在这种情况下,载体可包含毒性转基因以帮助去除不想要的细胞类型。
条件
核酸结构可能受到条件变化的影响。可以选择结构基序的序列,使得在使用核酸构建体的条件下(例如pH、温度、盐浓度、压力、蛋白浓度、糖浓度、渗透压等)采用所述构象。
载体可用于许多不同的条件,例如生理条件或例如有利于在微生物中生产蛋白的条件。
生理条件是生物体或细胞系统在自然界中可能发生的外部或内部环境条件,并且可以是结构基序呈现相关构象的适当条件。
可以采用额外的稳定实体来帮助帽/结构基序的折叠。例如,G-四链体可以使用离子和小分子配体来稳定,如前文所述。三链体的稳定剂包括具有延伸的芳环结构的分子,如del Mundo等人,BBA–Molecular Cell Research 1866(2019)118539中所述,其通过引用并入本文。
优选地,本文定义为互补的序列能够在生理条件下形成双链体。
核酸疫苗
特别地,本发明的载体用作核酸,任选用作DNA疫苗。
所述载体可用于在宿主细胞中表达,尤其是用于产生抗原。DNA或RNA疫苗通常编码感染性生物体的修饰形式或一部分。将DNA或RNA疫苗施用于受试者,然后它们表达感染性生物体的选定蛋白,启动针对该蛋白的免疫应答,这通常具有保护性。在癌症免疫治疗方法中,DNA或RNA疫苗也可以编码肿瘤抗原。
因此,本发明的载体可以是疫苗组合物。所述组合物可进一步包含任何佐剂序列以增强免疫原性作用。疫苗组合物可以被靶向至可容易表达这种疫苗的合适组织。示例性的是肌细胞。如果疫苗是癌症疫苗,则载体可以被靶向受癌症影响的细胞类型以允许局部应答,例如前列腺癌疫苗可以被靶向前列腺细胞。
基因治疗
载体可用于表达功能基因或其片段,其中受试者患有由该基因的功能障碍形式引起的遗传病症。此类疾病的实例是本领域公知的。可能需要靶向基因或其片段在受疾病影响的组织、器官或细胞类型中的表达,例如胰岛素在胰腺中表达。
细胞毒素递送
载体可用于表达对细胞具有细胞毒性的基因或其片段。这在癌症治疗中是期望的。通过将载体特异性地靶向表达癌症相关标志物的细胞,可以杀伤该细胞。此外,可以采用相同的方法来获得抗细菌或抗真菌方法。这些可以是引起受试者感染的病原生物体,所述受试者是人或动物,或者存在于环境或工业过程中。通过将载体靶向至特定微生物,可以选择性地去除该微生物。这在治疗上有明显的好处,因为例如只有病原细菌将被靶向,并且在环境和工业上也有好处,因为污染物也可以被清除,例如水体中的蓝细菌。
细胞毒素可以是可以通过细胞凋亡或细胞坏死诱导细胞死亡的任何合适的蛋白或肽。细胞毒素可以是由受试者的免疫细胞产生的,或者可以源自不同的物种,例如来自植物的毒液或毒素。
治疗用途
优选用于人类或动物的治疗用途,特别优选载体缺乏细菌复制起点、缺乏抗性基因(即,对抗生素的抗性基因)、缺乏原核甲基化模式(除了可能对疫苗有帮助的情况),并且缺少将核酸识别为对宿主细胞来说外来的序列。
所述载体的任何可能的治疗用途都涵盖在内。
额外功能
本发明的载体可以包括修饰的核苷酸。在下一节中可以看出,由于一种载体制备方法包括使用聚合酶,因此可以向反应提供修饰的核苷酸。修饰的核苷酸可以形成许多其他实体的结合点,这些实体例如小分子、肽、佐剂、激动剂、拮抗剂、免疫刺激剂、标记物、信标(beacon)、抗体或其片段和/或蛋白。这些实体可在细胞内具有功能,并发挥作用以补充载体提供的基因或其片段,和/或提供额外的靶向性。例如,紫杉醇等化疗药物可以结合至细胞毒性基因,用于靶向癌细胞。
因此,本发明的载体能够将联合治疗剂靶向目标位置。
如果载体递送疫苗,则可能在载体中包括编码佐剂、免疫刺激剂或激动剂的序列,或使用本文所述的结合点使它们结合至载体而提供。癌症疫苗可能尤其如此。
或者,载体可以包括对诸如小分子、肽、佐剂、激动剂、拮抗剂、免疫刺激剂、标记物、信标、抗体或其片段和/或蛋白的实体具有特异性的额外的结合基序。这将额外允许载体将这些实体送至期望位置。在一个实施方案中,加帽末端中的一个可以包括对靶标特异的结合基序,而另一个加帽末端包括携带诸如小分子药物的实体的结合基序。
进一步可选地,该技术允许载体连接标记物和示踪剂,例如允许跟踪的荧光核苷酸。
载体的加帽末端还可以包括额外的序列以提供进一步的功能,例如引物结合位点的位置或引物酶的识别序列。
被引入载体的修饰核苷酸可允许其他实体的连接或可有助于电荷修饰或提供可追踪标记。下表5描述了此类示例:
表5
修饰的核苷酸可以包含在载体的任何部分中。从生产载体的独特方法可以看出,可以将修饰的核苷酸添加到双链体部分和/或实际上添加到加帽末端的一个或两个。
制备载体
本文所述的载体可使用本文所述的独特方法制备。下面的制备方法适用于制备具有两个加帽末端的载体,其中至少一个是闭合端。所述方法是高效的,并且通过初始生产可以被填充和闭合的单链中间体来实现大规模生产。通过使用酶如连接酶来连接两个自由端,可以修改所述方法以产生完全共价闭合的载体。或者,如果需要两个开口的帽,可以使用特定的切口酶将缺口引入帽中,并且可以在载体中包含该切口酶的特异性识别位点。
载体的制备方法依赖于通过用相关聚合酶进行滚环扩增来扩增模板核酸,导致产生包括模板的多个重复的单链核酸,也称为多联体。然后可以将该单链核酸多联体加工成载体。因此,载体可以通过初始合成单链核酸来制备。
本发明的方法依赖于单链中碱基配对部分的形成,该部分允许用适当的酶切割,因为发夹的双链部分允许酶结合和切割。然后这会使每个单独的载体与许多载体的多联体分离。
通过该方法制备的载体是具有双链体部分(其单链)的载体,其两端用结构基序加帽。在这种情况下,结构基序可以是简单的,也可以是复杂的。如果根据该方法制备,则其中一个加帽末端是闭合的,即载体完全由一条核酸链制成,而相对端则不是,其由单链的5'和3'末端核苷酸形成。可以在一个额外的步骤中使载体完全共价闭合。
所述模板编码单链核酸。所述模板编码:
(i)第一加工基序,其毗邻
(ii)第一结构基序,
(iii)所述双链部分的单链,
(iv)第二结构基序,其毗邻
(v)第二加工基序
所述加工基序包括能够形成碱基配对部分的序列,所述碱基配对部分包括含有切割位点的内切核酸酶的识别位点,并且
所述结构基序包括至少一个能够形成分子内氢键并形成加帽末端的序列,其中可选地,所述第一或第二(左或右)加帽末端中的任一个包括含有结合基序的结构基序。
可以使用滚环扩增来扩增模板,产生单链多联体。可以使用核酸内切酶将该多联体加工成单链中间体。
然后可以使单链中间体与第二聚合酶接触,其优选不是链置换,使用中间体作为模板以延伸3'末端,从而形成双链体部分。
所述链可延伸至自由5'端,在此载体可与酶如连接酶接触,相邻残基之间的缺口闭合。
扩增过程或延伸过程将需要添加底物(即用于生成核酸的适当核苷)和任何辅因子(例如盐、离子等)。反应的适当条件包括缓冲液的存在和酶可以运行的温度。滚环扩增的适当条件可以是等温的。链延伸的适当条件可以是等温的。
扩增是产生核酸模板的多个拷贝,或产生与核酸模板互补的多个核酸序列拷贝。在本发明的方法中,优选地,扩增是指产生与核酸模板互补的多个核酸序列拷贝。
优选地,在模板是双链的情况下,使用技术以确保与目标产物互补的链被用作模板。这可以通过下面进一步讨论的几种方法来实现。
当用于扩增或延伸时,核苷是其中核酸碱基(核碱基)与糖部分连接的化合物。核酸碱基可以是天然的或修饰的/合成的核碱基。核酸碱基可包括嘌呤碱基(例如,腺嘌呤或鸟嘌呤)、嘧啶(例如,胞嘧啶、尿嘧啶或胸腺嘧啶)或脱氮嘌呤碱基等。核酸碱基可以是核糖或脱氧核糖糖部分。所述糖部分可包括天然糖、糖取代物、取代糖或修饰的糖。核苷可含有糖部分的2'-羟基、2'-脱氧或2',3'-双脱氧形式。
核苷酸或核苷酸碱基是指磷酸核苷。这包括天然的、合成的或修饰的核苷酸,或代理替代部分(surrogate replacement moiety)(例如肌苷)。核苷磷酸可以是核苷单磷酸(NMP)、核苷二磷酸(NDP)或核苷三磷酸(NTP)。核苷磷酸中的糖部分可以是戊糖,例如核糖。核苷酸可以是但不限于脱氧核糖核苷三磷酸(dNTP)或核糖核苷三磷酸(rNTP)。
核苷酸类似物是在结构上类似于天然存在的核苷酸的化合物。核苷酸类似物可具有改变的主链、糖部分、核碱基或其组合。应当理解,使用此类类似物会导致核酸可能具有不同的碱基配对特性,并且当此类碱基堆叠时发生的相互作用可能与在天然核酸中见到的不同。
扩增反应和/或延伸反应优选是等温的(在恒定温度下),这与需要温度循环的扩增例如PCR不同。所述方法可用于扩增任何合适的模板,优选环状核酸模板。可以任何适当的量向反应提供核酸模板,包括最小量。
优选使用RCA扩增核酸模板。
用于扩增的一种或多种聚合酶可以是校准性或非校准性核酸聚合酶。使用的核酸聚合酶可以是链置换核酸聚合酶。核酸聚合酶可以是嗜热或嗜温核酸聚合酶。
所述方法可能需要高加工性的链置换聚合酶,以在高保真扩增条件下扩增核酸模板。聚合酶准确复制模板的能力称为聚合酶的保真度。除了有效区分正确与错误的核苷酸并入之外,一些聚合酶还具有3’至5’核酸外切酶活性。该校准活性用于切除错误并入的碱基,然后用正确的碱基替换。高保真扩增利用聚合酶将低错误并入率与校准活性相结合,以提供对模板的忠实复制。或者,可以连同解旋酶一起使用非链置换酶。
扩增反应可使用聚合酶,其在扩增后产生单链的扩增核酸。因此聚合酶能够进行链置换合成。
在一些实施方案中,可使用Phi29 DNA聚合酶或Phi29样聚合酶扩增模板。或者,可以使用Phi29 DNA聚合酶和另一种聚合酶的组合。
在所述方法的一种形式中,扩增反应可以采用低浓度的引物。本发明人已发现低浓度的引物是有利的,因为它使扩增反应仅产生单链核酸。引物是短的线性寡核苷酸,其与模板内的序列杂交以引导核酸合成反应。引物可以是任何核酸,例如RNA、DNA、非天然核酸或其混合物。引物可以包含天然的、合成的或修饰的核苷酸。
或者,假设模板是双链环状模板,可以使用切口酶在双链模板的一条链上制造缺口。这为聚合酶留下了一个进入点,然后聚合酶利用模板本身的缺口链来引导核酸合成反应。
因此,通过使模板与至少一种聚合酶和核苷酸接触并在适合于核酸扩增的条件下孵育反应混合物,来扩增核酸模板。核酸模板的扩增可以在等温条件下进行。额外的组分可以包括一种或多种以下:切口酶(nicking enzyme或nickase)、辅因子(例如镁离子)、引物、引物酶、解旋酶和/或缓冲剂。
环状模板的滚环扩增产生线性单链多联体,其具有由模板编码的相邻的多个重复(每个重复在本文中称为一个序列单元)。由于模板的性质,这意味着每个序列单元都包含一个用于形成双链体的部分,该部分侧翼是结构基序,外侧是加工基序。每个序列单元还可以包括主链序列。
可以使用核酸内切酶将多联体加工成核酸构建体。切割位点释放结构基序的末端残基。
当多联核酸中的切割位点被必需的核酸内切酶切割时,这会从加工基序中释放结构基序,从而能够在适当条件下形成加帽末端。
扩增和加工反应可以同时发生,即可以存在核酸内切酶以在多联体形成时立即对其进行加工,或者可以延迟添加核酸内切酶直到扩增进一步进行,或者实际上完成。
该方法的初始步骤制备单链核酸,其加帽末端由结构基序形成。在某些情况下,结构基序可以提供一部分序列以形成加帽末端,从而在第二步中进一步延伸以形成完整的加帽末端。如果完全固定,则可能需要将该单链核酸中间体与切口酶接触以暴露3'核苷酸用于延伸。
所述方法的后续步骤是使单链核酸中间体与聚合酶接触。聚合酶延伸中间体的自由3'端,使用―双链部分”的单链部分作为模板以合成该部分的互补序列,从而形成双链体。因此,整个“双链部分”可以通过链的延伸来产生。所述链可以延伸至中间体的自由5'端,仅在两个相邻残基之间留下一个缺口。该缺口可以使用适当的酶如连接酶来闭合,以完全共价闭合所述分子。
第二步可能需要不进行链置换的聚合酶。它可以是任何合适的聚合酶,包括RNA聚合酶以制备杂合双链体。合适的酶包括高保真DNA聚合酶(NEB,US)、/>热启动高保真DNA聚合酶(NEB)、/>高保真DNA聚合酶(NEB)、/>聚合酶(NEB)、Taq DNA聚合酶(NEB)、/>DNA聚合酶(NEB)、/>热启动Taq DNA聚合酶(NEB)、T7 DNA聚合酶(NEB)、DNA聚合酶I(NEB)、SP6 RNA聚合酶(NEB)、T7 RNA聚合酶(NEB)、大肠杆菌Poly(A)聚合酶(NEB)、Poly(U)聚合酶(NEB)、T3 RNA聚合酶(NEB)、大肠杆菌RNA聚合酶核心酶(NEB)、大肠杆菌RNA聚合酶全酶(NEB)或/>聚合酶(NEB)。末端转移酶也适用于本发明的方法。
扩增步骤或延伸步骤均可在合适的核苷酸存在下进行以合成核酸。可以在任一步骤中提供修饰的核苷酸,以将它们并入载体。
因此,载体的制备方法既简练又高效。
模板
在模板(1)中,编码双链体(104)一条链的序列的两个侧翼是编码结构基序(103)的序列,外侧翼(outer flank)由加工基序(101)提供。编码序列是巢式的,从而双链体部分的侧翼是结构基序,而结构基序又与加工基序直接相邻,结构基序和加工基序一起形成格式化元件(formatting element)。因此,加工基序和结构基序的序列是连续的。换言之,双链体部分每一个末端的格式化元件处于相对或镜像的朝向,以确保结构基序最接近双链体部分,而加工基序是格式化元件的最外侧部分。
格式化元件是独特的,但在最终产物中并不以完整的形式存在,因为加工基序被从结构基序中切割下来。加工过程中核酸内切酶的作用确保了加工基序的切割位点被切割,从而丢弃加工基序。因此,这种机制可以产生被部分去除的有用产物,以确保最终产物包含最少量的非必要序列,为双链体部分提供更多空间。因此,加工基序和相邻的结构基序有效地连接在一起,直到切割位点被切割,从而释放产物的末端残基。加工基序与相邻的结构基序的连接被核酸内切酶的切割位点有效分离,使得能够在单步方法中使用核酸内切酶从较长的单链核酸分子直接产生具有隔离末端的单链核酸。加工基序通过用限制酶加工从单链核酸中去除,并且不存在于具有隔离末端的单链核酸中。
格式化元件通过核酸内切酶的作用被有效切割,并因此从最终产物中部分去除。
加工基序
加工基序(101)包括能够形成碱基配对部分(201)的序列,包括核酸内切酶的识别位点和相连的切割位点。应当理解,切割位点可以远离识别位点,但两者通常都需要处于双链结构中。
在一种格式中,由于在加工基序中包含至少一个能够与另一序列结合的序列区域,加工基序可以能够形成碱基配对部分,这些部分可能被视为是在序列上自互补。这些序列可以是连续的或可以通过间隔元件分隔。此类基序可以通过在单链核酸中包括序列互补段来设计。应当理解,虽然两个序列均存在于同一条核酸链上,但分子的设计确保了一个序列处于正确的方向以分子内结合至另一个序列。例如,在DNA中,序列需要反平行以形成碱基对。例如,此类基序在病毒单链基因组中很常见。
加工基序的碱基配对部分可以是连续的,使得该部分形成发夹等。核酸可形成反平行双链发夹样结构。发夹结构由称为茎的双链碱基配对区域组成。可选地,加工基序的碱基配对部分可以包括在能够碱基配对的两段序列之间的间隔序列,从而形成诸如茎环的结构。间隔物可以是任何合适的长度。发夹可以由回文核酸序列形成,如本文所定义。
核酸分子的碱基配对或双链部分也可具有互补序列。碱基配对和双链体在本文中进一步定义。
在加工基序的碱基配对部分中,包括核酸内切酶的识别位点和相连的切割位点。优选地,切割位点在碱基配对部分的足部形成,使得整个加工基序可以使用必需的核酸内切酶从单链上切割下来。
碱基配对发生在单链内地至少两个序列部分之间。该碱基配对可以是标准的(即Watson和Crick经典碱基对,其是DNA中的腺嘌呤(A)-胸腺嘧啶(T)、RNA中的腺嘌呤(A)-尿嘧啶(U)以及DNA和RNA中的胞嘧啶(C)-鸟嘌呤(G))或非规范的(即Hoogsteen碱基配对,或碳-氢和氧/氮基团等之间的相互作用)。这些在别处描述。
所述模板包括一个或多个编码具有任何这些特征的加工基序的序列。加工基序可以是不同的序列。
所述模板可以包含编码第一加工基序的序列和编码第二加工基序的序列。第一和第二加工基序由模板编码,它们位于结构基序的外边缘(和格式化元件内),从而双链体部分的每一个末端都以相反方向(正向和反向)的格式化元件结束。
考虑到对单链核酸多联体中加工基序的要求的性质(加工前),第一和第二加工基序的序列可以相同或不同。如果它们相同,则限制性位点在碱基配对部分的足部(footing)形成,从而整个加工基序可以使用必需的核酸内切酶从单链上切割下来。因此,无论加工基序相对于双链部分的方向如何(之前或之后),整个加工基序都可以从核酸上切割下来,因为切割位点位于碱基配对部分的足部,这也可以描述为配对部分的最后一个碱基对,或其碱基。
或者,单链核酸多联体中的第一和第二加工基序(加工前)可以不同,从而含有切割位点的核酸内切酶的每个识别位点也不同,从而能够在加工本发明的单链多联体时能够使用不同的核酸内切酶。
因此,所述模板可以包括编码相同或不同的第一和第二加工基序的序列。
核酸内切酶是一种酶,无论是蛋白的还是由核酸如DNA组成的,其切割多核苷酸链中的磷酸二酯键。在本发明中,需要贯穿双链核酸的切割以产生具有隔离末端的核酸分子。因此,可能需要两种核酸内切酶的组合,每一种都贯穿单链切割。或者,可以使用切割两条链的单个酶。核酸内切酶可以是例如切口核酸内切酶、归巢核酸内切酶、引导核酸内切酶如Cas9或限制性核酸内切酶。切口核酸内切酶可以是经修饰以仅切割一条链的修饰的限制性核酸内切酶。
在一个方面,核酸内切酶是限制性核酸内切酶。
限制性核酸内切酶是在特定识别位点内的或附近的切割位点处切割双链核酸的酶。为了切割,所有的限制性核酸内切酶均制造两个切口,贯穿双链体的每个主链(即每条链)。由于限制性核酸内切酶需要双链核酸的存在以识别识别位点,需要这样的结构以允许核酸内切酶切割核酸。因此,本发明人提出在单链核酸内构建碱基配对部分,优选使用自互补序列,使得单链分子形成包含识别位点和切割位点的双链结构。
限制性核酸内切酶识别特定的核苷酸序列并在双链体中产生双链切割。识别位点也可以按碱基数分类,一般在4-8个碱基之间。许多但不是全部的识别位点是回文的,并且此特性在设计加工基序时非常有用,因为它有助于序列的设计,使其能够更容易地被放置在碱基配对部分中。在单链格式中,在彼此碱基配对时能够形成回文的部分称为反向重复序列。这两个序列可以通过单链核酸中的间隔序列分隔。
限制性核酸内切酶可以是平端切割器(即直接贯穿碱基配对部分切割)或以偏移方式切割(即错位贯穿碱基配对部分切割)。切割位点可以在识别位点内或附近,因此切割位点不需要是识别位点的一部分。因此,切割位点与识别位点相连,但不一定构成识别位点的一部分。
已知有数以千计的限制性核酸内切酶,包括天然的和工程化的,连同它们的识别和切割位点。任何合适的识别和切割位点均可以包含在加工基序中。通常用于克隆等的示例性限制性核酸内切酶有HhaI、HindIII、NotI、EcoRI、ClaI、BamHI、BglII、DraI、EcoRV、PstI、SalI、SmaI、SchI和XmaI。许多可从New England Biolabs和ThermoFisherScientific等供应商处购买。
为了使用核酸内切酶切割以从单链核酸多联体中的格式化元件释放结构基序,优选地,切割位点在模板中与结构基序相邻,使得结构基序的末端核苷酸形成单链核酸分子中间体的末端残基和末端。
在模板中,编码的有格式化元件,其一部分是编码结构基序的序列,其被设计为在中间单链核酸分子和最终载体中折叠。结构基序可以固定单链核酸分子中间体的末端(即DNA和RNA的5'和3'末端),使得3'和5'末端可以最终连接,尤其是使得3'末端作为进行延伸的引物。
结构基序
结构基序(103)包括能够内部形成碱基配对部分或双链体的序列(105和106)。该碱基配对部分或双链体可以在用内切核酸酶加工之前在多联体中形成,或者它可以在用内切核酸酶加工之后形成,在加工基序已从多联体中去除后。这些结构可在加工基序被核酸内切酶切割之后才形成。
双链体可以通过单链内至少两个序列部分之间的碱基配对形成。该碱基配对可以是标准的(即Watson和Crick经典碱基对,其是DNA中的腺嘌呤(A)-胸腺嘧啶(T)、RNA中的腺嘌呤(A)-尿嘧啶(U)以及DNA和RNA中的胞嘧啶(C)-鸟嘌呤(G))或非规范的(即Hoogsteen碱基配对、碳-氢和氧/氮基团等之间的相互作用)。Hoogsteen配对允许形成称为G-四链体的单链核酸富G片段或称为i-基序的富C片段的特定结构。G四联体通常需要四个G三联体,由短间隔物分隔。这允许平面四分体的组装,所述平面四分体由Hoogsteen键合的鸟嘌呤分子的堆叠结合组成。
因此,结构基序可包括自互补或与单链核酸分子内的另一序列(即,双链体部分或双链体部分内的间隔序列)互补的序列部分。
结构基序可以包括用于形成多于一个碱基配对部分或双链体的序列,每个碱基配对部分或双链体通过单链核酸的间隔序列分隔,或者碱基配对部分或双链体可以形成更大结构的一部分,所述更大结构可以包括以下任意一个或多个:发夹;单链区域;凸起环;内部环;多分支环或交叉(junction)。结构基序可以如上文关于载体所述。结构基序可以包括结合基序,其也如上文关于载体所述。
一旦结构基序形成至少一个碱基配对部分或双链体,单链核酸分子的末端残基就可以被固定。单链DNA任一个末端的末端核苷酸(或残基)优选与中间体中的另一残基碱基配对。这使得末端残基适合用聚合酶延伸或连接至延伸链。
优选地,末端(末端核苷酸)在单链核酸中间体中不是单链形式。这些末端由于每个末端残基与单链核酸中间体的另一部分之间存在碱基配对而稳定。
来自多联体核酸分子的结构基序一旦被加工,就形成单链核酸构建体的一个末端。末端残基通常通过结构基序固定。
本发明的优选结构基序包括可以折叠为发夹、茎环、交叉、假结、ITR、修饰的ITR、合成ITR、i-基序和G-四链体的序列。结构基序可以如前文所述。
发夹是核酸(例如DNA或RNA)中的一种结构,由于核酸单链的相邻互补序列之间的碱基配对而形成。相邻的互补序列可以由数个核苷酸分隔,例如1-10或1-5个核苷酸。如果在两个互补序列部分之间包含一个非互补序列的环,则形成发夹环或茎环。环可以是任何合适的长度,茎或双链部分也可以是任何合适的长度。其他类似的结构包括套索。
每端的结构基序可以折叠成相同的特定结构(即发夹、茎环、ITR等),或者它们可以各自独立地被设计为折叠成不同的结构(即,第一个末端是发夹,第二个末端是ITR)。
如先前所述,结构基序可包括结合基序,如上文所述。它们可以形成功能结构,例如适体等。在示例性过程中,两个互补序列(105和106)侧翼是结构基序内的结合基序。这样的设计允许发明人去除结合基序的中心部分并用替代基序替换它,同时确保结构基序适用于本发明的方法,因为侧翼互补序列确保了茎结构的形成以“支持”结合基序。
双链体
所述模板还编码双链体部分的单链。双链体部分可以是任何期望的核酸序列,具有任何合适的长度。
双链体部分优选包括基因或其片段,任选地在表达盒内。双链体部分可以包括用于在细胞中表达的转基因,例如基因或遗传物质。转基因可以有效连接至表达盒内的启动子序列。
双链体部分可以包括编码治疗产品的序列。治疗产品可以是DNA适体、蛋白、肽或RNA分子,例如小干扰RNA。为了提供治疗效用,这样的双链体部分可以包含表达盒,所述表达盒包含一个或多个启动子或增强子元件以及编码感兴趣的mRNA或蛋白的基因或其他编码序列。表达盒可包含有效连接至感兴趣蛋白的编码序列的真核启动子,以及任选的增强子和/或真核转录终止序列。
双链体部分可用于生产DNA用于在宿主细胞中表达,尤其是用于生产DNA疫苗。DNA疫苗通常编码感染性生物体DNA的修饰形式,例如整个基因组。将DNA疫苗施用于受试者,然后它们表达感染性生物体的选定蛋白,启动通常具有保护性针对所述蛋白的免疫应答。DNA疫苗还可以在癌症免疫治疗方法中编码肿瘤抗原。任何DNA疫苗都可以用作双链体部分。
此外,本发明的方法可以产生其他类型的治疗性DNA分子,例如用于基因治疗的那些。例如,此类DNA分子可用于表达功能基因,其中受试者患有由该基因的功能失调形式引起的遗传病症。此类疾病的实例是本领域公知的。
优选的是编码双链部分或结构基序的模板的部分缺乏细菌复制起点、缺乏抗性基因(即针对抗生素的抗性基因)、原核的缺乏甲基化模式(除了可能有帮助的DNA疫苗)或任何其他外来DNA标记。然而,这些实体可以存在于双链部分和结构基序之外,因为模板的其余部分经过加工并从产物中去除。
模板优选是环状的或能够环化。模板可以是双链的或单链的。
如果模板是双链的,则优选它在第一加工基序之前包括用于切口酶的序列。或者称为切口核酸内切酶,这些酶仅水解双链体的一条链,以产生“缺口”而非被切割的核酸分子。这为滚环扩增提供了起点,不需要额外的引物,并且可以确保在扩增反应中只产生核酸多联体的一条链。此类酶可商购,例如从New England Biolabs和Thermo FisherScientific商购。这些酶具有足够的特异性,使得可以在模板的相关链上设计识别和切割位点,以确保将正确的链直接用作模板。
模板可以是任何合适的核酸,可以是天然的如DNA或RNA,也可以是人工的,如前文所述。优选地,模板是DNA。
产生的核酸可以是任何合适的核酸,例如DNA、RNA或其杂合体。优选的是DNA载体。载体可以包括修饰的碱基,使得其他实体可以使用简单的化学方法与载体连接。
模板的扩增
为了产生单链核酸中间体,必须对模板进行酶促扩增。
模板可以用一种或多种聚合酶扩增。如果提供足够的原料或底物(如核苷酸)和辅因子(如金属离子等)来扩增核酸,则聚合酶可以使用模板合成互补的核酸拷贝。
任何合适的聚合酶都可用于该扩增步骤,并且可以使用一种酶或多种酶的组合。
根据模板的性质,酶可以是DNA聚合酶或RNA聚合酶,或者是人工的、修饰的、工程化的或突变的聚合酶,以使用合成模板或生产合成的单链核酸。
优选通过链置换方法进行扩增。这是一种不需要重复的加热和冷却循环(如PCR那样)的等温方法,但聚合酶能够置换与模板退火的任何链。链置换型聚合酶是已知的,包括Phi29、DeepBST DNA聚合酶I及其变体。这意味着多种聚合酶都可以同时作用于同一模板,每一种均置换由更早的聚合酶产生的新生链。
最优选的链置换扩增技术是滚环扩增(RCA)。在这种扩增方法中,链置换聚合酶在延伸新生寡核苷酸的同时围绕环形模板不断前进。这导致产生长的核酸多联链。
优选地,通过用切口核酸内切酶对模板进行切口,可以在双链环状模板上启动扩增反应。此类酶已在上文讨论。通过对双链模板的单个链进行切口,打开模板用于聚合酶结合,并且它可以利用产生的自由3'端,通过围绕环状模板多次加工以将这条链延伸成多联体核酸。
在模板中使用切口位点和切口核酸内切酶还允许所述方法仅从RCA制造单链多联体,并防止相对链的扩增,因为只有一个主链用酶来切割。
因此,优选在模板中使用切口位点,因为它允许产生目标产物,并防止双链模板的互补链的不期望的扩增。
另外,本发明人已经发现,使用非常少量的被设计为与目标模板链(而不是其互补链)退火的特异性引物,可以强制进行扩增来产生大量的双链模板的仅一条链。在这个方面,仅需要皮摩尔量的引物。因此,引物可以以1pM至100nM的量提供。
如果模板是单链的,则可以使用引物来启动滚环扩增。优选地,引物被设计成仅与模板退火而不与多联核酸分子退火,从而确保仅产生一种多联体。
使模板与至少一种聚合酶接触。可以使用一种、两种、三种、四种或五种不同的聚合酶。聚合酶可以是任何合适的聚合酶,使得它合成核酸的聚合物。聚合酶可以是DNA或RNA聚合酶。可以使用任何聚合酶,包括任何市售聚合酶。可以使用两种、三种、四种、五种或更多种不同的聚合酶,例如一种提供校准功能而其他一种或多种不提供校准功能。可以使用具有不同机制的聚合酶,例如链置换型聚合酶和通过其他方法复制核酸的聚合酶。不具有链置换活性的DNA聚合酶的合适实例有T4 DNA聚合酶。
聚合酶可以是高度稳定的,使得其活性不会因在工艺条件下的长时间孵育而显著降低。因此,酶优选在工艺条件范围(包括但不限于温度和pH)下具有长的半衰期。还优选地,聚合酶具有适合制备方法的一种或多种特性。聚合酶优选具有高保真度,例如通过具有校准活性。此外,优选地,聚合酶对核苷酸和核酸表现出高的持续性、高的链置换活性和低Km。聚合酶可以能够使用环状和/或线性DNA作为模板。聚合酶可以能够使用双链或单链核酸作为模板。优选地,聚合酶不显示与其校准活性无关的核酸外切酶活性。
技术人员可以通过与市售聚合酶展现的性质进行比较,来确定给定聚合酶是否显示出如上所定义的特征,所述市售聚合酶例如Phi29(New England Biolabs,Inc.,Ipswich,MA,US)、(New England Biolabs,Inc.)、嗜热脂肪芽孢杆菌(Bst)DNA聚合酶I(New England Biolabs,Inc.)、DNA聚合酶I的Klenow片段(New EnglandBiolabs,Inc.)、M-MuLV逆转录酶(New England Biolabs,Inc.)、/>(exo-minus)DNA聚合酶(New England Biolabs,Inc.)、/>聚合酶(New England Biolabs,Inc.)、/>(exo-)DNA聚合酶(New England Biolabs,Inc.)、Bst DNA聚合酶大片段(New England Biolabs,Inc.)、高保真融合DNA聚合酶(例如,火球菌样(pyrococcus-like),New England Biolabs,MA)、来自强烈火球菌(Pyrococcus furiosus)的Pfu DNA聚合酶(Agilent,La Jolla,CA)、T7 DNA聚合酶的SequenaseTM变体、T7 DNA聚合酶、T4 DNA聚合酶、来自火球菌种GB-D的DNA聚合酶(New England Biolabs,MA)或来自海滨嗜热球菌(Thermococcus litoralis)的DNA聚合酶(New England Biolabs-NEB,MA)。。
或者,聚合酶可以是依赖于DNA的RNA聚合酶。示例性酶包括T3 RNA聚合酶、T7 RNA聚合酶、Hi-T7TMRNA聚合酶、SP6 RNA聚合酶、大肠杆菌Poly(A)聚合酶、大肠杆菌RNA聚合酶和大肠杆菌RNA聚合酶全酶(均可从NEB获得)。
当提及高持续性时,这通常表示每次与模板结合/解离时由聚合酶添加的平均核苷酸数,即从单个结合事件获得的引物延伸长度。
链置换型聚合酶是优选的。优选的链置换型聚合酶是Phi29、Deep Vent和Bst DNA聚合酶I或其任何变体。“链置换”描述了聚合酶在合成期间在遭遇双链DNA区域时置换互补链的能力。因此通过置换互补链和合成新的互补链来扩增模板。因此,在链置换复制过程中,新复制的链将被置换,为聚合酶复制另一条互补链让路。当引物或单链模板的自由端与模板上的互补序列退火时(两者都是引发事件),扩增反应开始。当核酸合成推进时,如果它遭遇了进一步的引物或与模板退火的其他链,则聚合酶会置换它并继续其链延伸。应当理解,链置换扩增方法不同于基于PCR的方法之处在于变性循环不是有效扩增必需的,这是因为双链模板不会阻碍新链的继续合成。链置换扩增可只需要一轮初始加热,使初始模板变性(如果它是双链的),以允许引物与引物结合位点(如果使用的话)退火。此后,扩增可被描述为等温的,因为不需要进一步加热或冷却。相比之下,PCR方法需要在扩增过程中进行数轮变性(即,将温度升高至94摄氏度或更高)以熔解双链DNA并提供新的单链模板。在链置换过程中,聚合酶将置换已合成核酸的链。
在本发明的方法中使用的链置换聚合酶优选具有至少20kb、更优选至少30kb、至少50kb或至少70kb或更大的持续性。在一个实施方案中,链置换DNA聚合酶具有与phi29DNA聚合酶相当或更高的持续性。
模板与聚合酶和切口酶或引物的接触可以在促进引物与模板退火的条件下发生。所述条件包括允许引物杂交的单链DNA的存在。所述条件还包括允许引物与模板退火的温度和缓冲液。可以根据引物的性质选择合适的退火/杂交条件。在本发明中使用的优选退火条件的实例包括包含30mM Tris-HCl pH 7.5,20Mm KCl、8Mm MgCl2的缓冲液。退火可以在加热变性之后通过逐渐冷却至期望的反应温度来进行。
模板和聚合酶也与核苷酸接触。模板、聚合酶和核苷酸的组合形成反应混合物。所述反应混合物还可以包含一种或多种引物或可选地切口酶或引发酶(priming enzyme或primase)。所述反应混合物还可以独立地包括一种或多种金属阳离子或核酸合成所需的任何其他辅因子。
核苷酸是核酸的单体或单个单元,核苷酸由含氮碱基、五碳糖(核糖或脱氧核糖)和至少一个磷酸基团组成。可以使用任何合适的核苷酸。
核苷酸可以作为游离酸、它们的盐或螯合物或游离酸和/或盐或螯合物的混合物存在。
核苷酸可以作为单价金属离子核苷酸盐或二价金属离子核苷酸盐存在。
含氮碱基可以是腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和/或尿嘧啶(U)。含氮碱基也可以是修饰的碱基,例如5-甲基胞嘧啶(m5C)、假尿苷(Ψ)、二氢尿苷(D)、肌苷(I)和/或7-甲基鸟苷(m7G)。
优选地,五碳糖是脱氧核糖,使得核苷酸是脱氧核苷酸。
核苷酸可以是脱氧核苷三磷酸的形式,表示为dNTP。这是本发明的优选实施方案。合适的dNTP可以包括dATP(脱氧腺苷三磷酸)、dGTP(脱氧鸟苷三磷酸)、dTTP(脱氧胸苷三磷酸)、dUTP(脱氧尿苷三磷酸)、dCTP(脱氧胞苷三磷酸)、dITP(脱氧肌苷三磷酸)、dXTP(脱氧黄苷三磷酸)及其衍生物和修饰形式。优选地,dNTP包含dATP、dGTP、dTTP或dCTP或其修饰形式或衍生物中的一种或多种。优选使用dATP、dGTP、dTTP和dCTP或其修饰形式的混合物。
核苷酸可以在溶液中或以冻干形式提供。核苷酸溶液是优选的。
核苷酸可以以一种或多种合适碱基的混合物形式提供,包括任何新设计的人工碱基,优选地,腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)中的一种或多种。在核酸的合成方法中使用两种、三种或优选所有四种核苷酸(A、G、T和C)。
多联体
多联体是具有模板中存在的序列单元的重复单元的核酸分子。如前所述,每个序列单元都包含双链体部分的序列,两侧侧翼是格式化元件。序列单元还可以包括由模板编码的主链序列,其最终不存在于本发明的载体中。
多联体核酸分子可包含多个序列单元,例如连续串联的10、50、100、200、500或甚至1000个或更多个序列单元。多联体分子的大小可以是至少5kb、至少50kb、至少100kb或甚至长达200kb。
加工多联体核酸分子
一旦模板被扩增,或者甚至在扩增过程中,可以使用必要的切割一个或多个加工位点的内切核酸酶,将多联体核酸加工成单链中间体。
因此,优选地,加工基序能够形成碱基配对部分,同时处于多联体核酸的形式。因此,可以设计加工基序使得碱基对在适合于等温扩增的条件下形成。一旦这些碱基配对部分在多联体核酸内形成,则内切核酸酶的识别位点连同必要的切割位点一起形成。这个精巧的系统可以加工多联体,尽管它只是核酸单链。模板的设计允许在多联体核酸内形成加工位点,从而允许通过添加一种或多种核酸内切酶对该多联体进行一步加工。
一旦扩增反应完成,就可以添加内切核酸酶,同时它可以在扩增反应进行中或开始时添加。优选地,在添加核酸内切酶之前扩增反应已经在进行中,以确保多联体核酸被快速加工。或者,可以允许在添加核酸内切酶之前完成扩增过程(即,模板耗尽、核苷酸耗尽、反应混合物太粘稠)。
还生产有副产品,其由加工基序和任何相连的模板“主链”组成。
延长3'端和任选的闭合
在用内切核酸酶切割后,单链中间体的3'端与中间体碱基配对,使其能够用作引物。可以在3'端处或3'端附近设计切口位点,以确保3'端在施用切口酶后可用于延伸。
使中间体与一种或多种聚合酶接触。可以使用一种、两种、三种、四种或五种不同的聚合酶。聚合酶可以是任何合适的聚合酶,使得它合成核酸的聚合物。聚合酶可以是DNA或RNA聚合酶。可以使用任何聚合酶,包括任何可商购的聚合酶。可以使用两种、三种、四种、五种或更多种不同的聚合酶,例如一种提供校准功能而另外一种或多种不提供校准功能。可以使用具有不同机制的聚合酶,但优选聚合酶不进行链置换。不具有链置换活性的DNA聚合酶的合适实例是T4 DNA聚合酶。
聚合酶可以是高度稳定的,使得其活性不会因在工艺条件下的长时间孵育而显著降低。因此,酶优选在工艺条件范围(包括但不限于温度和pH)下具有长的半衰期。还优选地,聚合酶具有适合制备方法的一种或多种特性。聚合酶优选具有高保真度,例如通过具有校准活性。此外,优选地,聚合酶对核苷酸和核酸表现出高的持续性和低Km。聚合酶可以能够使用线性DNA作为模板。聚合酶可以能够使用单链核酸作为模板。优选地,聚合酶不显示与其校准活性无关的核酸外切酶活性。
技术人员可以通过与市售聚合酶展现的性质进行比较来确定给定聚合酶是否显示出如上所定义的特征,所述市售聚合酶例如(New England Biolabs,Inc.)、嗜热脂肪芽孢杆菌(Bst)DNA聚合酶I(New England Biolabs,Inc.)、DNA聚合酶I的Klenow片段(New England Biolabs,Inc.)、M-MuLV逆转录酶(New England Biolabs,Inc.)、/>(exo-minus)DNA聚合酶(New England Biolabs,Inc.)、/>聚合酶(New England Biolabs,Inc.)、/>(exo-)DNA聚合酶(New EnglandBiolabs,Inc.)、Bst DNA聚合酶大片段(New England Biolabs,Inc.)、高保真融合DNA聚合酶(例如,火球菌样,New England Biolabs,MA)、来自强烈火球菌的Pfu DNA聚合酶(Agilent,La Jolla,CA)、T7 DNA聚合酶的SequenaseTM变体、T7 DNA聚合酶、T4 DNA聚合酶、来自火球菌种GB-D的DNA聚合酶(New England Biolabs,MA)或来自海滨嗜热球菌的DNA聚合酶(New England Biolabs-NEB,MA)。
或者,聚合酶可以是依赖于DNA的RNA聚合酶。示例性酶包括T3 RNA聚合酶、T7 RNA聚合酶、Hi-T7TMRNA聚合酶、SP6 RNA聚合酶、大肠杆菌Poly(A)聚合酶、大肠杆菌RNA聚合酶和大肠杆菌RNA聚合酶全酶(均可从NEB获得)。
当提及高持续性时,这通常表示每次与模板结合/解离时由聚合酶添加的平均核苷酸数,即从单个结合事件获得的引物延伸长度。
中间体和聚合酶也将置于合适的条件下并与合适的试剂一起使用以使用双链体部分的单链作为引物来延伸中间体的3'端,从而合成双链体的互补链。因此,该步骤中聚合酶的作用是使用单链部分作为模板合成双链体。优选地,3'端延伸至双链体部分的末端,最优选至邻近中间体的5'端。延伸3'端直到它与5'端毗邻是有利的,因为这允许使用诸如连接酶的酶将载体共价闭合。延伸反应的合适条件在提及扩增步骤时有描述,包括试剂的提供。
可以连接3'和5'端,共价闭合载体。可以使延伸的中间体与连接酶接触以使载体共价闭合。DNA载体的末端通过一个末端的3'-羟基与另一个末端的5'-磷酰基之间形成磷酸二酯键而连接在一起。RNA也可以类似地连接。辅因子通常参与反应,这通常是ATP或NAD+
核靶向
组蛋白是细胞核中最丰富的蛋白,并且独特的输入途径参与组蛋白从细胞质到细胞核的主动转运。这一事实意味着,劫持组蛋白导入途径是增强感兴趣的DNA的核定位以用于治疗或其他目的的通用方法。
核仁素是一种具有多种功能的穿梭蛋白,虽然它存在于不同的细胞区室中,但其含量最多的是细胞核。
人类端粒由多种蛋白保持,其中一些与G-四链体结构特异性结合,所述G-四链体结构可由端粒序列(TTAGGG)n的重复形成,而四个重复(TTAGGG)4构成形成G-四链体结构所需的最小序列。此外,有证据表明,包含(TTAGGG)n重复的染色体的末端可有效结合对G-四链体结构具有选择性的DNA适体。
发明人已采用形成G-四联体结构(TTAGGG)4所需的最小DNA序列来构建结构基序,所述结构基序能够形成具有结合基序的结构,所述结合基序可以劫持天然识别G-四链体结构的蛋白的核输入。
本文所例示的结构基序靶向三种不同类别的蛋白因子以劫持它们的核输入途径。用包含结合基序的帽将感兴趣的双链体DNA的一个末端或两端闭合,这是增强感兴趣DNA的核摄取和表达以用于治疗或其他目的的创新策略。
现在将参照以下非限制性实施例来描述本发明。
实施例1
DNA载体中存在的结合基序增强了核输入
载体合成:
内部合成了具有分泌型胚胎碱性磷酸酶(SEAP)基因的载体DNA。构建了各种版本,每个版本具有不同的加帽末端。这些加帽末端是:
i)组蛋白H4适体,
ii)核仁素适体,
iii)端粒G-四链体结构。
产生了具有哺乳动物表达盒[启动子-基因-polyA序列][Ef1α-SEAP-SV40poly(A)]的各种线性双链DNA,每个版本含有针对各种加帽末端的结构基序,这些加帽末端中的每个都置于表达盒下游,因此形成载体的右加帽末端。
i)组蛋白H4(H4_Gq和H4_sl)
ii)核仁素:(nucl)
iii)人端粒G-四联体(hTel)
载体的左端也用结构基序加帽,在这种情况下是简单茎环加上3个核苷酸的环GAA的序列,其对已知的蛋白因子没有结合亲和力。
参考DNA(称为“无适体”)在两端包含3个核苷酸GAA的环。
转染:
按照制造商的指南,使用市售的PEIpro转染试剂(Polyplus-转染)将DNA转染至HEK293细胞(ATCC)。
简单来说,在转染前,以每孔7x105个细胞的密度将细胞接种在6孔板中,总体积为2ml DMEM培养基,补充有10% FBS(Sigma)、2mM L-谷氨酰胺(Sigma)和1%非必需氨基酸溶液(Sigma)。
将细胞于37℃下在5% CO2孵育箱中孵育,直到它们达到70%汇合度(24小时)。如表6所示,生成具有PEIpro的载体复合物。在室温下孵育15分钟后,将含有DNA-PEI复合物的无血清DMEM添加到细胞培养物中(逐滴)。将具有细胞培养物的板置于保持在37℃、5%CO2的孵育箱中。9小时后收集培养基用于检测分泌型碱性磷酸酶(SEAP)活性,并对所有样品进行生物学重复。基于发光的SEAP报告基因测试试剂盒(Abcam)用于确定SEAP表达水平(U/ml培养基)。
为了确保整个实验过程中的转染效率相等,利用CMV-eGFP载体进行共转染(用于转染的DNA质量的10%是编码eGFP的线性DNA)。48小时后使用流式细胞术测量荧光中值,并确认其在整个实验过程中不变。
表6.转染方案:
培养基中的PEIpro稀释(混合物B)
溶液 体积(μl)
PEIpro 10
DMEM培养基 240
250
转染混合物(用于2.5孔)
溶液 体积(μl)
混合物A(DNA) 250
混合物B(PEIpro) 250
500
添加至每个孔
体积(μl) 总DNA(μg)
200 1.00
以下是位于表达盒(Ef1a-SEAP-SV40poly(A))下游的各种结构基序的序列。标有下划线的序列显示了作为结合基序的结构基序部分(或在对照中形成三核苷酸环的部分)。在结合基序的每一侧(侧翼)是来自结构基序的序列,在这种情况下是互补序列,它们彼此杂合形成支持性茎结构,有效地将适体在载体中保持在位。因此,可以看出,可以设计“模板”结构基序,其中可以放置特异性结合基序。在这种情况下,侧翼序列彼此互补。
>无适体(对照)
ctgctcacctgccagctacggacgcggaacgcgtccgtagctggcaggtgagcag
>H4_Gq
ctgctcacctgccagctacggacgcgtggtggggttcccgggagggcggctacgggttccgtaatcag atttgtgtcgcgtccgtagctggcaggtgagcag
>H4_SL
ctgctcacctgccagctacggacgcgcgcaggttaaatcccaaatggtccgagggttgcgcgcgtccgtagctggcaggtgagcag
>nucl
ctgctcacctgccagctacggacgcgtggtggtggtggttgtggtggtggtgggcgcgtccgtagctggcaggtgagcag>hTEL
ctgcgcgctcgctcgctcactgaggcctttagggttagggttagggttagggttggcctcagtgagcgagcgagcgcgcag
EF1α-SEAP-SV40pA盒的序列
ggctccggtgcccgtcagtgggcagagcgcacatcgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaaggtggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagggtgggggagaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacacaggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttgaattacttccacctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggagagttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctggggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctctagccatttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaagatctgcacactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgcacatgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctcaagctggccggcctgctctggtgcctggtctcgcgccgccgtgtatcgccccgccctgggcggcaaggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggccctgctgcagggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaaggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtccaggcacctcgattagttctcgagcttttggagtacgtcgtctttaggttggggggaggggttttatgcgatggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttgatgtaattctccttggaatttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagtttttttcttccatttcaggtgtcgtgacctaggaagcttgccaccatggttctggggccctgcatgctgctgctgctgctgctgctgggcctgaggctacagctctccctgggcatcatcccagttgaggaggagaacccggacttctggaaccgcgaggcagccgaggccctgggtgccgccaagaagctgcagcctgcacagacagccgccaagaacctcatcatcttcctgggcgatgggatgggggtgtctacggtgacagcagccaggatcctaaaagggcagaagaaggacaaactggggcctgagatacccctggctatggaccgcttcccatatgtggctctgtccaagacatacaatgtagacaaacatgtgccagacagtggagccacagccacggcctacctgtgcggggtcaagggcaacttccagaccattggcttgagtgcagccgcccgctttaaccagtgcaacacgacacgcggcaacgaggtcatctccgtgatgaatcgggccaagaaagcagggaagtcagtgggagtggtaaccaccacacgagtgcagcacgcctcgccagccggcacctacgcccacacggtgaaccgcaactggtactcggacgccgacgtgcctgcctcggcccgccaggaggggtgccaggacatcgctacgcagctcatctccaacatggacattgatgtgatcctgggtggaggccgaaagtacatgtttcgcatgggaaccccagaccctgagtacccagatgactacagccaaggtgggaccaggctggacgggaagaatctggtgcaggaatggctggcgaagcgccagggtgcccggtatgtgtggaaccgcactgagctcatgcaggcttccctggacccgtctgtgacccatctcatgggcctctttgagcctggagacatgaaatacgagatccaccgagactccacactggacccctccctgatggagatgacagaggctgccctgcgcctgctgagcaggaacccccgcggcttcttcctcttcgtggagggtggtcgcatcgaccacggtcatcacgaaagcagggcttaccgggcactgactgagacgatcatgttcgacgacgccattgagagggcgggccagctcaccagcgaggaggacacgctgagcctcgtcactgccgaccactcccacgttttctccttcggaggctaccccctgcgagggagctccatcttcgggctggcccctggcaaggcacgggacaggaaggcctacacggtcctcctatacggaaacggtccaggctatgtgctcaaggacggcgcccggccggatgttaccgagagcgagagcgggagccccgagtatcggcagcagtcagcagtgcccctggacgaagagacgcacgcaggcgaggacgtggcggtgttcgcgcgcggcccgcaggcgcacctggttcacggcgtgcaggagcagaccttcatagcgcacgtcatggccttcgccgcctgcctggagccctacaccgcctgcgacctggcgccccccgccggcaccaccgacgccgcgcacccagggcggtcccggtccaagcgtctggattgagaattcgcccgggcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgtggta
结果
与对照载体(无apt)相比,在加帽末端包含适体以改善核输入途径的载体显示出SEAP表达显著增加(图1)。减去SEAP的“载体”显示无表达。
实施例2
当使用减少量的载体时,包括适体的加帽末端的存在增强了载体的核输入。
如实施例1中所述,按照制造商的方案使用PEI Pro将上述载体转染到HEK293中;使用6孔板,并对所有样品进行生物学重复。转染9小时后,使用AbCam商业试剂盒测定分泌型碱性磷酸酶(SEAP)活性(表示为U/ml培养基)。
为了确保整个实验过程中的转染效率相等,利用CMV-eGFP载体共转染(用于转染的DNA质量的10%是编码eGFP的线性DNA)。使用流式细胞术测量荧光中值,并确认其在整个实验过程中保持不变。
使用减少量的具有SEAP报告基因的载体,而竞争载体(无报告基因)保持恒定质量的转染DNA。
表7.载体量减少(0.4μg/孔)的转染方案
在培养基中稀释PEIpro(混合物B)
转染混合物(用于2.5个孔)
添加至每个孔
表8.载体量减少(0.2μg/孔)的转染方案
培养基中的DNA稀释(混合物A)
培养基中的PEIpro稀释(混合物B)
转染混合物(用于2.5个孔)
添加至每个孔
>hTEL:
ctgcgcgctcgctcgctcactgaggcctttagggttagggttagggttagggttggcctcagtgagcgagcgagcgcgcag
结果
当在转染中使用较少量的载体时——0.4μg/孔(图2)和0.2μg/孔,包含结构基序hTel的载体的表达水平显著高于参考载体(无apt)(图3)。这证明所述载体可以比未修饰的载体以更低的量使用。
实施例3
在HepG2细胞系中评估核输入增强
如实施例1中所述,根据制造商的建议,使用PEIPro转染试剂将上述载体转染到HepG2中。使用6孔板,并对所有样品进行生物学重复。转染9小时后,使用AbCam商业试剂盒测定分泌型碱性磷酸酶(SEAP)活性(表示为U/ml培养基)。为了确保整个实验过程中的转染效率相等,利用CMV-eGFP载体共转染(用于转染的DNA质量的10%是编码eGFP的线性DNA)。使用流式细胞术测量荧光中值,并确认其在整个实验过程中保持不变。
表9.载体量减少的转染方案
培养基中的DNA稀释(混合物A)
培养基中的PEIpro稀释(混合物B)
转染混合物(用于2.5个孔)
/>
添加至每个孔
体积(μl) 总DNA(μg)
200 1.00
>hTEL
ctgcgcgctcgctcgctcactgaggcctttagggttagggttagggttagggttggcctcagtgagcgagcgagcgcgcag
结果
在HepG2细胞培养物中,来自包含结构基序hTel的载体的SEAP表达显著高于缺乏结构基序的等同载体(无apt),图4。
实施例4
证明了结合基序在载体中是有功能的——链霉亲和素适体
为了确保用于合成载体的末端转换方法兼容于结构独立折叠以形成加帽末端,选择了链霉亲和素适体与链霉亲和素包被平板的结合。已将链霉亲和素适体序列用于表达盒下游,与哺乳动物报告盒一起。合成了结构基序的两种不同构型,包括在载体单个末端的加工:i)单个链霉亲和素适体,和ii)四个分支化链霉亲和素适体的阵列。
具有链霉亲和素适体的加工构象基序的序列
>strSQ(4个适体)
ctgctcacctgccagctacggacgcggccacgaacgcaccgatcgcaggtttcgtggcgcgcgtaacgcaccgatcgcaggtttacgcgcagcgagcaacgcaccgatcgcaggtttgctcgccgcccaaacgcaccgatcgcaggttttgggcgcgcgtccgtagctggcaggtgagcag
>strApt(单个适体)
ctgctcacctgccagctacggacgcggggaacgcaccgatcgcaggtttccccgcgtccgtagctggcaggtgagcag
>无Apt(无适体对照)
ctgctcacctgccagctacggacgcggaacgcgtccgtagctggcaggtgagcag
双链体序列
>SEAP-2A-eGFP
cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcctaggcgtttagtgaaccgtcagaatcgatcgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggatatcgattgatggctgtaagcttggaccgccaccatggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtataagggaagcggagctactaacttcagcctgctgaagcaggctggagacgtggaggagaaccctggacctatggttctggggccctgcatgctgctgctgctgctgctgctgggcctgaggctacagctctccctgggcatcatcccagttgaggaggagaacccggacttctggaaccgcgaggcagccgaggccctgggtgccgccaagaagctgcagcctgcacagacagccgccaagaacctcatcatcttcctgggcgatgggatgggggtgtctacggtgacagcagccaggatcctaaaagggcagaagaaggacaaactggggcctgagatacccctggctatggaccgcttcccatatgtggctctgtccaagacatacaatgtagacaaacatgtgccagacagtggagccacagccacggcctacctgtgcggggtcaagggcaacttccagaccattggcttgagtgcagccgcccgctttaaccagtgcaacacgacacgcggcaacgaggtcatctccgtgatgaatcgggccaagaaagcagggaagtcagtgggagtggtaaccaccacacgagtgcagcacgcctcgccagccggcacctacgcccacacggtgaaccgcaactggtactcggacgccgacgtgcctgcctcggcccgccaggaggggtgccaggacatcgctacgcagctcatctccaacatggacattgatgtgatcctgggtggaggccgaaagtacatgtttcgcatgggaaccccagaccctgagtacccagatgactacagccaaggtgggaccaggctggacgggaagaatctggtgcaggaatggctggcgaagcgccagggtgcccggtatgtgtggaaccgcactgagctcatgcaggcttccctggacccgtctgtgacccatctcatgggcctctttgagcctggagacatgaaatacgagatccaccgagactccacactggacccctccctgatggagatgacagaggctgccctgcgcctgctgagcaggaacccccgcggcttcttcctcttcgtggagggtggtcgcatcgaccacggtcatcacgaaagcagggcttaccgggcactgactgagacgatcatgttcgacgacgccattgagagggcgggccagctcaccagcgaggaggacacgctgagcctcgtcactgccgaccactcccacgttttctccttcggaggctaccccctgcgagggagctccatcttcgggctggcccctggcaaggcacgggacaggaaggcctacacggtcctcctatacggaaacggtccaggctatgtgctcaaggacggcgcccggccggatgttaccgagagcgagagcgggagccccgagtatcggcagcagtcagcagtgcccctggacgaagagacgcacgcaggcgaggacgtggcggtgttcgcgcgcggcccgcaggcgcacctggttcacggcgtgcaggagcagaccttcatagcgcacgtcatggccttcgccgcctgcctggagccctacaccgcctgcgacctggcgccccccgccggcaccaccgacgccgcgcacccagggcggtcccggtccaagcgtctggattgagaattccctttcggggcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagtt
测试获得的载体对链霉亲和素包被平板的结合。通过pico-green掺入测定检测保留在平板上的DNA量。
结合方案
在室温下,将DNA与链霉亲和素包被平板在结合缓冲液中混合2小时。用相同的结合缓冲液洗涤平板3次,并在平板中使用PicoGreen测定法检测结合至平板的DNA(在无DNA脱离)。
结合缓冲液(10x)
1M NaCl
20mM MgCl2
50mM KCl
10mM CaCl2
200mM Tris-HCl,pH 7.6
结果
包含四个链霉亲和素适体的本发明的载体(圆圈)结合(解离常数,KD=5.6nM)显著强于包含单个适体的载体(KD=17.4nM,正方形)。两端均无适体的对照DNA显示出与平板无特异性结合。该结果证明了功能性适体可以作为单个基序或基序阵列定位于载体末端。拟合曲线如图8所示。
实施例5:
生产具有自定义加帽末端的共价闭合的载体。
模板:模板A(图11)。
该模板包括切口位点、与构象基序毗邻的加工基序、感兴趣的序列、与第二加工基序毗邻的第二构象基序以及与感兴趣的序列大小相似的主链。主链中有额外的核酸内切酶靶位点,它将仅切割dsDNA。
20μl中的切口反应
·4μl模板(1μg/μl)
·13μl H2O
·2μl CutSmart缓冲液(NEB)
·1μl切口酶(Nb.BsrDI,NEB)
在37℃下孵育180分钟,然后80℃下孵育20分钟。
1000μl中的扩增反应
·4μl模板(0.2μg/μl)
·100μl缓冲液-10x
-300mM Tris pH 7.9
-300mM KCl
-50mM(NH4)2SO4
-100mM MgCl2
·837μl ddH2O
·20μl dNTPs(100mM)(Bioline)
·35μl SSB(5μg/μl)(大肠杆菌SSB,内部制备)
·2μl无机焦磷酸酶(2U/μl)(Enzymatics)
·2μl phi29 DNA聚合酶(100U/μl)(Enzymatics)
在30℃下孵育16小时。
加工反应
·1000μl扩增反应
·20μl MlyI(10U/μl)
在37℃下孵育180分钟。
纯化反应
将200μl经加工的反应物运行通过PCR清理柱(Macherey-Nagel)并以20μl洗脱。
50μl中的第二链合成反应
·10μl模板
·1μl T4 DNA聚合酶(exo-)(3U/μl)
·1μl T4 DNA连接酶(400,000U/μl)
·5μl T4 DNA连接酶缓冲液@10x
-50mM Tris-HCl
-10mM MgCl2
-1mM ATP
-10mM DTT
·0.5μl dNTPs(40mM)
·32.5μl ddH2O
在37℃下孵育180分钟。
核酸外切酶清理
·25μl第二链合成反应
·0.2μl T5核酸外切酶(10U/μl)
在37℃下孵育16小时。
结果:凝胶如图12所示。图12显示了用SafeView染色的0.8%琼脂糖凝胶证明,通过第二链合成和连接产生了闭合的线性DNA载体。泳道1和9是Thermo Scientific GeneRuler 1kb Plus DNA蛋白梯。泳道2缺乏所有酶;泳道3包括T4 DNA连接酶;泳道4包括T4DNA连接酶和T5核酸外切酶清理步骤;泳道5包括T4 DNA聚合酶;泳道6包括T4 DNA聚合酶和T5核酸外切酶清理步骤;泳道7包括T4聚合酶和T4连接酶;泳道8包括T4聚合酶和T4连接酶以及T5核酸外切酶步骤。
可以看出,在仅存在两种酶中的一种的情况下,不存在抗外切核酸酶(即闭合DNA)产物,但是包括聚合酶和连接酶两者导致形成抗外切核酸酶降解的闭合分子。
实施例6
在载体的3'端(帽)存在多个结合基序可增强核输入。
为了检查在一个结构基序中包含结合基序阵列的效果,使用靶向各种核元件如组蛋白和核仁素的结合基序,进行了多个核输入实验。
已生成具有哺乳动物表达盒[Ef1a-SEAP-SV40poly(A)]的线性双链DNA,以在其3'端包含不同版本的多种适体,以靶向:
i)人端粒G-四联体–组蛋白H4(hTel–H4_Gq)
ii)3x核仁素(3x nucl)
iii)组蛋白H4–核仁素(H4_Gq–nucl)
iv)4x EpCAM茎环(4x EpCAM)
使用PEI Pro转染试剂将DNA转染到HEK293T中。转染9小时后,使用AbCam商业试剂盒(AbCam,Cambridge,UK)测定分泌型碱性磷酸酶(SEAP)活性(表示为U/mL培养基)。为了确保整个实验过程中的转染效率相等,利用CMV-eGFP载体共转染(用于转染的DNA质量的10%是编码eGFP的线性DNA)。使用流式细胞术测量荧光中值,并确认其在整个实验过程中保持不变。
使用的序列:
>hTel–H4_Gq
ctgctcacctgccagctacggacgcggccacgtttagggttagggttagggttagggttcgtggcagcgcgttggtggggttcccgggagggcggctacgggttccgtaatcagatttgtgtacgcgccgcgtccgtagctggcaggtgagcag
>3x nucl
ctgctcacctgccagctacggacgcggccacgtggtggtggtggttgtggtggtggtgggcgtggcagcgcgttggtggtggtggttgtggtggtggtgggacgcgcagcgagctggtggtggtggttgtggtggtggtggggctcgccgcgtccgtagctggcaggtgagcag
>H4_Gq–nucl
ctgctcacctgccagctacggacgcggccacgtggtggggttcccgggagggcggctacgggttccgtaatcagatttgtgtcgtggcagcgcgttggtggtggtggttgtggtggtggtgggacgcgccgcgtccgtagctggcaggtgagcag
>4xEpCAM
ctgctcacctgccagctacggacgcggccacgACAGAGGTTGCGTCTGTcgtggcgcgcgtACAGAGGTTGCGTCTGTacgcgcagcgagcACAGAGGTTGCGTCTGTgctcgccgcccaACAGAGGTTGCGTCTGTtgggcgcgcgtccgtagctggcaggtgagcag
图13中示出了该实施例的结果,清楚地表明了包括结合基序阵列在核靶向过程中是有利的。与包括核靶向结合基序阵列的所有实验版本相比,对照DNA(“无Apt”)明显产生更少的SEAP。可以看到,多个适体聚集在单个结构基序中时报告基因表达增加了高达五倍。为了确保阵列的正确折叠,设计了独特序列的分支茎以强制每个基序的独立折叠并将阵列的折叠限制为单一的可能构象。
序列表
<110> 莱特生物有限公司(Lightbio Limited)
<120> 自靶向性表达载体
<130> P33403WO1
<160> 53
<170> PatentIn version 3.5
<210> 1
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 平行链DNA (通过Hoogsteen键或反向Watson-Crick键合而稳定)
<400> 1
cctattaaat cc 12
<210> 2
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 平行链DNA (通过Hoogsteen键或反向Watson-Crick键合而稳定)
<400> 2
aaaaaaaaaa taattttaaa tattt 25
<210> 3
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 发夹
<400> 3
tggggcccca 10
<210> 4
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 横臂
<400> 4
atggtcttgc atgcaaggcc atatatggca ccat 34
<210> 5
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 分子内三链体
<400> 5
aagaagaaga agaag 15
<210> 6
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 三链体
<400> 6
cctccccctc ctttttggag ggggaggttt ttggaggggg agg 43
<210> 7
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> i-基序双分子
<400> 7
cccctaaccc taa 13
<210> 8
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> i-基序单分子
<400> 8
ccctaacccc taaccctaac ccctaa 26
<210> 9
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 四链体二聚平行链
<400> 9
aggggggagg gagggtgg 18
<210> 10
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 四链体反平行单分子
<400> 10
ggttggtgtg gttgg 15
<210> 11
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 四链体反平行四聚体
<400> 11
ttagggttag gg 12
<210> 12
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> NIQI
<400> 12
Arg Gly Arg Gly Arg Gly Arg Gly Gly Gly Ser Gly Gly Ser Gly Gly
1 5 10 15
Arg Gly Arg Gly
20
<210> 13
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> FMR1 G-四链体结合蛋白富含RG的结构域
<400> 13
Arg Arg Gly Asp Gly Arg Arg Arg Gly Gly Gly Gly Arg Gly Gln Gly
1 5 10 15
Gly Arg Gly Arg Gly Gly Gly Phe Lys Gly
20 25
<210> 14
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 结合凝血酶的DNA适体
<400> 14
ggttggtgtg gttgg 15
<210> 15
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> Arahh001
<400> 15
acgtaccgac ttcgtatgcc aacagccctt tatccacctc 40
<210> 16
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> TEPP
<400> 16
gcgcggtacc gcgctaacgg aggttgcgtc cgt 33
<210> 17
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> MUC1
<400> 17
gcagttgatc ctttggatac cctgg 25
<210> 18
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> S1.3/2.2
<400> 18
gggagacaag aataaacgct caagcagttg atcctttgga taccctggtt cgacaggagg 60
ctcacaacag gc 72
<210> 19
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 5TR-1
<400> 19
gggagacaag aataaacgct caagaagtga aaatgacaga acacaacatt cgacaggagg 60
ctcacaacag gc 72
<210> 20
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> SGC8
<400> 20
atctaactgc tgcgccgccg ggaaaatact gtacggttag a 41
<210> 21
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> SGA16
<400> 21
tttaaaatac cagcttattc aattagtcac acttagagtt ctagctgctg cgccgccggg 60
aaaatactgt acggatagat agtaagtgca atct 94
<210> 22
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> SYL3C
<400> 22
cactacagag gttgcgtctg tcccacgttg tcatgggggg ttggcctg 48
<210> 23
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> SYL1
<400> 23
agcgtcgaat accactacag tttggctctg ggggatgtgg aggggggtat gggtgggagt 60
caatggagct cgtggtcag 79
<210> 24
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> SYL2
<400> 24
agcgtcgaat accactacag agctcggggt tttttggggt tttttggggt tttggtgggg 60
ctaatggagc tcgtggtcag 80
<210> 25
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> SYL3
<400> 25
agcgtcgaat accactacag aggttgcgtc tgtcccacgt tgtcatgggg ggttggcctg 60
ctaatggagc tcgtggtcag 80
<210> 26
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> SYL4
<400> 26
agcgtcgaat accactacag agctccgggg tttttggggg tttttctggg gttttttggg 60
gctaatggag ctcgtggtca g 81
<210> 27
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> TDO5
<400> 27
aacaccggga ggatagttcg gtggctgttc agggtctcct cccggtg 47
<210> 28
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> A1
<400> 28
ggttgcatgc cgtggggagg ggggtgggtt ttatagcgta ctcag 45
<210> 29
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> AS1411
<400> 29
ttggtggtgg tggttgtggt ggtggtgg 28
<210> 30
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> GMT4,8
<400> 30
tgacgagccc aagttacctt ggtgatggtt tttggtggta acgggggcgg gtgagtagaa 60
tctccgctgc ctaca 75
<210> 31
<211> 76
<212> DNA
<213> 人工序列
<220>
<223> CSC1
<400> 31
accttggctg tcgtgttgta ggtggtttgc tgcggtgggc tcaagaagaa agcgcaaagg 60
tcagtggtca gagcgt 76
<210> 32
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> CSC13
<400> 32
accttggctg tcgtgttgtg gggtgtcgta tctttcgtgt cttattattt tctaggggag 60
gtcagtggtc agagcgt 77
<210> 33
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> KDED2a-3
<400> 33
tgcccgcgaa aactgctatt acgtgtgaga ggaaagatca cgcgggttcg tggacacggt 60
tttttttttt 70
<210> 34
<211> 91
<212> DNA
<213> 人工序列
<220>
<223> KCHA10
<400> 34
atccagagtg acgcagcagg ggaggcgaga gcgcacaata acgatggttg ggacccaact 60
gtttggacac ggtggcttag tttttttttt t 91
<210> 35
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> R13
<400> 35
tctctagtta ttgagttttc ttttatgggt gggtgggggg ttttt 45
<210> 36
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> S6
<400> 36
tggatgggga gatccgttga gtaagcgggc gtgtctctct gccgccttgc tatgggg 57
<210> 37
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> GBI-10
<400> 37
ggctgttgtg agcctcctcc cagagggaag actttaggtt cggttcacgt cccgcttatt 60
cttactccc 69
<210> 38
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> A-1
<400> 38
taactcaata agctaggtgg gtgggggaca ctacccgggg ggtggttggg t 51
<210> 39
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 形成G-四链体结构的最小序列
<400> 39
ttagggttag ggttagggtt aggg 24
<210> 40
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 无适体(对照)
<400> 40
ctgctcacct gccagctacg gacgcggaac gcgtccgtag ctggcaggtg agcag 55
<210> 41
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> H4_Gq
<400> 41
ctgctcacct gccagctacg gacgcgtggt ggggttcccg ggagggcggc tacgggttcc 60
gtaatcagat ttgtgtcgcg tccgtagctg gcaggtgagc ag 102
<210> 42
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> H4_SL
<400> 42
ctgctcacct gccagctacg gacgcgcgca ggttaaatcc caaatggtcc gagggttgcg 60
cgcgtccgta gctggcaggt gagcag 86
<210> 43
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> nucl
<400> 43
ctgctcacct gccagctacg gacgcgtggt ggtggtggtt gtggtggtgg tgggcgcgtc 60
cgtagctggc aggtgagcag 80
<210> 44
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> hTEL
<400> 44
ctgcgcgctc gctcgctcac tgaggccttt agggttaggg ttagggttag ggttggcctc 60
agtgagcgag cgagcgcgca g 81
<210> 45
<211> 2995
<212> DNA
<213> 人工序列
<220>
<223> EF1a -SEAP-SV40pA盒的序列
<400> 45
ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60
ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120
gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180
gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240
gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300
acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720
ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 840
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140
gtggttcaaa gtttttttct tccatttcag gtgtcgtgac ctaggaagct tgccaccatg 1200
gttctggggc cctgcatgct gctgctgctg ctgctgctgg gcctgaggct acagctctcc 1260
ctgggcatca tcccagttga ggaggagaac ccggacttct ggaaccgcga ggcagccgag 1320
gccctgggtg ccgccaagaa gctgcagcct gcacagacag ccgccaagaa cctcatcatc 1380
ttcctgggcg atgggatggg ggtgtctacg gtgacagcag ccaggatcct aaaagggcag 1440
aagaaggaca aactggggcc tgagataccc ctggctatgg accgcttccc atatgtggct 1500
ctgtccaaga catacaatgt agacaaacat gtgccagaca gtggagccac agccacggcc 1560
tacctgtgcg gggtcaaggg caacttccag accattggct tgagtgcagc cgcccgcttt 1620
aaccagtgca acacgacacg cggcaacgag gtcatctccg tgatgaatcg ggccaagaaa 1680
gcagggaagt cagtgggagt ggtaaccacc acacgagtgc agcacgcctc gccagccggc 1740
acctacgccc acacggtgaa ccgcaactgg tactcggacg ccgacgtgcc tgcctcggcc 1800
cgccaggagg ggtgccagga catcgctacg cagctcatct ccaacatgga cattgatgtg 1860
atcctgggtg gaggccgaaa gtacatgttt cgcatgggaa ccccagaccc tgagtaccca 1920
gatgactaca gccaaggtgg gaccaggctg gacgggaaga atctggtgca ggaatggctg 1980
gcgaagcgcc agggtgcccg gtatgtgtgg aaccgcactg agctcatgca ggcttccctg 2040
gacccgtctg tgacccatct catgggcctc tttgagcctg gagacatgaa atacgagatc 2100
caccgagact ccacactgga cccctccctg atggagatga cagaggctgc cctgcgcctg 2160
ctgagcagga acccccgcgg cttcttcctc ttcgtggagg gtggtcgcat cgaccacggt 2220
catcacgaaa gcagggctta ccgggcactg actgagacga tcatgttcga cgacgccatt 2280
gagagggcgg gccagctcac cagcgaggag gacacgctga gcctcgtcac tgccgaccac 2340
tcccacgttt tctccttcgg aggctacccc ctgcgaggga gctccatctt cgggctggcc 2400
cctggcaagg cacgggacag gaaggcctac acggtcctcc tatacggaaa cggtccaggc 2460
tatgtgctca aggacggcgc ccggccggat gttaccgaga gcgagagcgg gagccccgag 2520
tatcggcagc agtcagcagt gcccctggac gaagagacgc acgcaggcga ggacgtggcg 2580
gtgttcgcgc gcggcccgca ggcgcacctg gttcacggcg tgcaggagca gaccttcata 2640
gcgcacgtca tggccttcgc cgcctgcctg gagccctaca ccgcctgcga cctggcgccc 2700
cccgccggca ccaccgacgc cgcgcaccca gggcggtccc ggtccaagcg tctggattga 2760
gaattcgccc gggcagacat gataagatac attgatgagt ttggacaaac cacaactaga 2820
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 2880
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 2940
cagggggagg tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggta 2995
<210> 46
<211> 181
<212> DNA
<213> 人工序列
<220>
<223> strSQ (4个适体)
<400> 46
ctgctcacct gccagctacg gacgcggcca cgaacgcacc gatcgcaggt ttcgtggcgc 60
gcgtaacgca ccgatcgcag gtttacgcgc agcgagcaac gcaccgatcg caggtttgct 120
cgccgcccaa acgcaccgat cgcaggtttt gggcgcgcgt ccgtagctgg caggtgagca 180
g 181
<210> 47
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> strApt
<400> 47
ctgctcacct gccagctacg gacgcgggga acgcaccgat cgcaggtttc cccgcgtccg 60
tagctggcag gtgagcag 78
<210> 48
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> noApt (无适体对照)
<400> 48
ctgctcacct gccagctacg gacgcggaac gcgtccgtag ctggcaggtg agcag 55
<210> 49
<211> 3558
<212> DNA
<213> 人工序列
<220>
<223> SEAP-2A-eGFP
<400> 49
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 360
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 420
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 480
acggtgggag gtctatataa gcagagctcc taggcgttta gtgaaccgtc agaatcgatc 540
gaatcccggc cgggaacggt gcattggaac gcggattccc cgtgccaaga gtgacgtaag 600
taccgcctat agagtctata ggcccacaaa aaatgctttc ttcttttaat atactttttt 660
gtttatctta tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat 720
gtatcatgcc tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggcaa 780
tagcaatatt tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt 840
catattgcta atagcagcta caatccagct accattctgc ttttatttta tggttgggat 900
aaggctggat tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta 960
tcttcctccc acagctcctg ggcaacgtgc tggtctgtgt gctggcccat cactttggca 1020
aagaattggg atatcgattg atggctgtaa gcttggaccg ccaccatggt gagcaagggc 1080
gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga cgtaaacggc 1140
cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa gctgaccctg 1200
aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt gaccaccctg 1260
acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca cgacttcttc 1320
aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa ggacgacggc 1380
aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa ccgcatcgag 1440
ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct ggagtacaac 1500
tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat caaggtgaac 1560
ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca ctaccagcag 1620
aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct gagcacccag 1680
tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct ggagttcgtg 1740
accgccgccg ggatcactct cggcatggac gagctgtata agggaagcgg agctactaac 1800
ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc ctggacctat ggttctgggg 1860
ccctgcatgc tgctgctgct gctgctgctg ggcctgaggc tacagctctc cctgggcatc 1920
atcccagttg aggaggagaa cccggacttc tggaaccgcg aggcagccga ggccctgggt 1980
gccgccaaga agctgcagcc tgcacagaca gccgccaaga acctcatcat cttcctgggc 2040
gatgggatgg gggtgtctac ggtgacagca gccaggatcc taaaagggca gaagaaggac 2100
aaactggggc ctgagatacc cctggctatg gaccgcttcc catatgtggc tctgtccaag 2160
acatacaatg tagacaaaca tgtgccagac agtggagcca cagccacggc ctacctgtgc 2220
ggggtcaagg gcaacttcca gaccattggc ttgagtgcag ccgcccgctt taaccagtgc 2280
aacacgacac gcggcaacga ggtcatctcc gtgatgaatc gggccaagaa agcagggaag 2340
tcagtgggag tggtaaccac cacacgagtg cagcacgcct cgccagccgg cacctacgcc 2400
cacacggtga accgcaactg gtactcggac gccgacgtgc ctgcctcggc ccgccaggag 2460
gggtgccagg acatcgctac gcagctcatc tccaacatgg acattgatgt gatcctgggt 2520
ggaggccgaa agtacatgtt tcgcatggga accccagacc ctgagtaccc agatgactac 2580
agccaaggtg ggaccaggct ggacgggaag aatctggtgc aggaatggct ggcgaagcgc 2640
cagggtgccc ggtatgtgtg gaaccgcact gagctcatgc aggcttccct ggacccgtct 2700
gtgacccatc tcatgggcct ctttgagcct ggagacatga aatacgagat ccaccgagac 2760
tccacactgg acccctccct gatggagatg acagaggctg ccctgcgcct gctgagcagg 2820
aacccccgcg gcttcttcct cttcgtggag ggtggtcgca tcgaccacgg tcatcacgaa 2880
agcagggctt accgggcact gactgagacg atcatgttcg acgacgccat tgagagggcg 2940
ggccagctca ccagcgagga ggacacgctg agcctcgtca ctgccgacca ctcccacgtt 3000
ttctccttcg gaggctaccc cctgcgaggg agctccatct tcgggctggc ccctggcaag 3060
gcacgggaca ggaaggccta cacggtcctc ctatacggaa acggtccagg ctatgtgctc 3120
aaggacggcg cccggccgga tgttaccgag agcgagagcg ggagccccga gtatcggcag 3180
cagtcagcag tgcccctgga cgaagagacg cacgcaggcg aggacgtggc ggtgttcgcg 3240
cgcggcccgc aggcgcacct ggttcacggc gtgcaggagc agaccttcat agcgcacgtc 3300
atggccttcg ccgcctgcct ggagccctac accgcctgcg acctggcgcc ccccgccggc 3360
accaccgacg ccgcgcaccc agggcggtcc cggtccaagc gtctggattg agaattccct 3420
ttcggggcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 3480
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 3540
agctgcaata aacaagtt 3558
<210> 50
<211> 154
<212> DNA
<213> 人工序列
<220>
<223> hTel - H4_Gq
<400> 50
ctgctcacct gccagctacg gacgcggcca cgtttagggt tagggttagg gttagggttc 60
gtggcagcgc gttggtgggg ttcccgggag ggcggctacg ggttccgtaa tcagatttgt 120
gtacgcgccg cgtccgtagc tggcaggtga gcag 154
<210> 51
<211> 174
<212> DNA
<213> 人工序列
<220>
<223> 3x nucl
<400> 51
ctgctcacct gccagctacg gacgcggcca cgtggtggtg gtggttgtgg tggtggtggg 60
cgtggcagcg cgttggtggt ggtggttgtg gtggtggtgg gacgcgcagc gagctggtgg 120
tggtggttgt ggtggtggtg gggctcgccg cgtccgtagc tggcaggtga gcag 174
<210> 52
<211> 155
<212> DNA
<213> 人工序列
<220>
<223> H4_Gq - nucl
<400> 52
ctgctcacct gccagctacg gacgcggcca cgtggtgggg ttcccgggag ggcggctacg 60
ggttccgtaa tcagatttgt gtcgtggcag cgcgttggtg gtggtggttg tggtggtggt 120
gggacgcgcc gcgtccgtag ctggcaggtg agcag 155
<210> 53
<211> 169
<212> DNA
<213> 人工序列
<220>
<223> 4xEpCAM
<400> 53
ctgctcacct gccagctacg gacgcggcca cgacagaggt tgcgtctgtc gtggcgcgcg 60
tacagaggtt gcgtctgtac gcgcagcgag cacagaggtt gcgtctgtgc tcgccgccca 120
acagaggttg cgtctgttgg gcgcgcgtcc gtagctggca ggtgagcag 169

Claims (22)

1.包括DNA双链部分的靶向性DNA表达载体,其特征在于,所述双链部分在两个末端加帽,其中双链体的至少一个末端用结构基序加帽,并且所述结构基序包括形成能够结合细胞靶标的构象的至少一个结合基序。
2.根据权利要求1所述的靶向性表达载体,其中双链体DNA的两个末端均用结构基序加帽,所述结构基序可以是相同的或不同的。
3.根据权利要求1所述的靶向性表达载体,其中双链体DNA的一个末端用结构基序加帽,另一个末端用发夹、T形发夹、横臂、茎环、环、凸起或十字形加帽。
4.根据前述权利要求中任一项所述的靶向性表达载体,其中所述结构基序包括结合基序的阵列,其可以是相同的或不同的。
5.根据前述权利要求中任一项所述的靶向性表达载体,其中所述结合基序能够结合以下任何一项或多项上的细胞靶标:
(i)细胞表面;
(ii)核膜;
(iii)核运输系统;
(iv)细胞区室
(v)核组分;
(vi)细胞质内含物;和/或
(vii)细胞质蛋白或肽
6.根据权利要求1至5中任一项所述的靶向性表达载体,其中所述载体还包括能够结合以下任何一项或多项的结合基序:
(i)肽或蛋白;
(ii)小分子;
(iii)抗体或其衍生物;
(iv)酶;
(v)免疫刺激剂
(vi)激动剂或拮抗剂;
(vii)佐剂和/或
(viii)核酸。
7.根据权利要求5所述的靶向性表达载体,其中所述靶标存在于真核细胞中或真核细胞上,所述真核细胞任选地是植物细胞、原生生物细胞、真菌细胞、人细胞或非人动物细胞。
8.根据权利要求5所述的靶向性表达载体,其中所述靶标存在于原核细胞上或原核细胞中,任选地,其中所述细胞是细菌细胞。
9.根据任一项前述权利要求所述的靶向性表达载体,其中所述线性双链体DNA包括基因序列或其片段和任选的启动子。
10.根据权利要求9所述的靶向性表达载体,其中所述基因或其片段编码功能性RNA分子。
11.根据任一项前述权利要求所述的靶向性表达载体,其中所述载体包括修饰的核苷酸,任选地,在加帽末端中的修饰的核苷酸。
12.根据任一项前述权利要求所述的靶向性表达载体,其中所述表达载体是基本上纯的DNA,任选地,95%DNA。
13.根据任一项前述权利要求所述的靶向性表达载体,其中所述结构基序允许在所述结构基序的序列中的核苷酸碱基之间形成氢键,任选地,其中所述核苷酸碱基之间的氢键涉及Watson-Crick碱基对、Hoogsteen碱基配对或非规范碱基配对。
14.根据任一项前述权利要求所述的靶向性表达载体,其中加帽末端的一个或两者是共价闭合的。
15.根据任一项前述权利要求所述的靶向性表达载体,其中所述结构基序形成非规范DNA结构,并且可以包括以下任意一项或多项:
a)发夹;
b)横臂;
c)三链体;
d)G-三链体;
e)G-四链体;
f)i-基序;
g)假结;
h)茎环;和/或
i)凸起或环。
16.根据任一项前述权利要求所述的靶向性表达载体,其中所述结合基序呈现的结构允许以结构和/或序列依赖性方式与靶标结合。
17.根据任一项前述权利要求所述的靶向性表达载体,其中所述结合基序是以下任意一项或多项:
a)适体;
b)四链体;
c)催化剂;
d)i-基序;和/或
e)三链DNA。
18.根据任一项前述权利要求所述的靶向性表达载体,其中所述结合基序是特异性的。
19.一种制造载体的方法,所述载体包括两端被结构基序加帽的双链部分,所述方法包括:
(a)提供包含编码以下的序列的核酸模板:
(vi)第一加工基序,其毗邻
(vii)第一结构基序,
(viii)所述双链体DNA的单链,
(ix)第二结构基序,其毗邻
(x)第二加工基序,
所述加工基序包括能够形成碱基配对部分的序列,其包含含有切割位点的内切核酸酶的识别位点,
所述结构基序包括至少一个能够形成分子内氢键并形成加帽末端的序列,
并且任选地,所述第一或第二加帽末端中的任一者包含结合基序;
(b)使用能够进行滚环扩增的聚合酶扩增所述模板,从而产生单链多联体;
(c)使所述多联体与核酸内切酶接触以释放单链DNA中间体,其中3'末端核苷酸在毗邻所述构建体的单链部分处碱基配对;和
(d)使所述单链DNA构建体与聚合酶接触,以使用所述单链DNA中间体作为模板延伸3'末端核苷酸,从而形成所述双链体部分。
20.根据权利要求19所述的方法,其中5'末端核苷酸在毗邻载体的单链部分处碱基配对,并且所述方法进一步包括使用连接酶以使载体共价闭合。
21.根据权利要求1所述的核酸,其中所述结合基序包括在构象内存在特定核苷酸残基,以允许结合细胞靶标。
22.根据权利要求1所述的核酸,其中所述结合基序结合选自以下的细胞靶标:蛋白;修饰的蛋白,包括糖蛋白、脂蛋白;肽;碳水化合物;脂质或修饰的脂质,包括糖脂或磷脂。
CN202180077166.1A 2020-09-18 2021-09-20 自靶向性表达载体 Pending CN116615546A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB2014751.8 2020-09-18
GBGB2014751.8A GB202014751D0 (en) 2020-09-18 2020-09-18 Targeting vector
PCT/GB2021/052439 WO2022058755A1 (en) 2020-09-18 2021-09-20 Self-targeting expression vector

Publications (1)

Publication Number Publication Date
CN116615546A true CN116615546A (zh) 2023-08-18

Family

ID=73139036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180077166.1A Pending CN116615546A (zh) 2020-09-18 2021-09-20 自靶向性表达载体

Country Status (11)

Country Link
US (1) US20230357790A1 (zh)
EP (1) EP4214321A1 (zh)
JP (1) JP2023542347A (zh)
KR (1) KR20230074507A (zh)
CN (1) CN116615546A (zh)
AU (1) AU2021344868A1 (zh)
CA (1) CA3195897A1 (zh)
GB (1) GB202014751D0 (zh)
IL (1) IL301407A (zh)
MX (1) MX2023003201A (zh)
WO (1) WO2022058755A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023220454A1 (en) * 2022-05-13 2023-11-16 Twister Biotech, Inc. Conjugated composition and method for delivering a therapeutic nucleic acid sequence to a living cell
TW202409283A (zh) * 2022-05-13 2024-03-01 美商旗艦先鋒創新有限責任(Vii)公司 雙股dna組合物及相關方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10119005A1 (de) * 2001-04-18 2002-10-24 Roche Diagnostics Gmbh Verfahren zur Proteinexpression ausgehend von stabilisierter linearer kurzer DNA in zellfreien in vitro-Transkription/Translations-Systemen mit Exonuklease-haltigen Lysaten oder in einem zellulären System enthaltend Exonukleasen
EP2048229B1 (en) * 2006-07-07 2016-02-17 Kyowa Hakko Kirin Co., Ltd. Human artificial chromosome (hac) vector, and human cell pharmaceutical comprising human artificial chromosome (hac) vector
GB201509578D0 (en) * 2015-06-03 2015-07-15 Univ Singapore Vectors
WO2017188898A1 (en) * 2016-04-29 2017-11-02 Nanyang Technological University G-quadruplex-containing antisense oligonucleotides
EP3763823A1 (en) * 2016-08-16 2021-01-13 Touchlight IP Limited Closed linear dna production
BR112020004151A2 (pt) * 2017-09-08 2020-09-08 Generation Bio Co. dna modificado de extremidade fechada (cedna)
KR20200051708A (ko) 2017-09-08 2020-05-13 제너레이션 바이오 컴퍼니 비-바이러스성 캡시드-비함유 dna 벡터의 지질 나노입자 제형
MX2020005790A (es) 2018-01-19 2020-10-28 Generation Bio Co Vectores de adn de extremo cerrado que pueden obtenerse de síntesis libre de células y un proceso para obtener vectores de ceadn.
EP3810782A2 (en) 2018-06-22 2021-04-28 Asklepios Biopharmaceutical, Inc. Vectors for gene delivery that persist within cells
GB201905651D0 (en) * 2019-04-24 2019-06-05 Lightbio Ltd Nucleic acid constructs and methods for their manufacture

Also Published As

Publication number Publication date
AU2021344868A1 (en) 2023-05-18
CA3195897A1 (en) 2022-03-24
EP4214321A1 (en) 2023-07-26
JP2023542347A (ja) 2023-10-06
WO2022058755A1 (en) 2022-03-24
GB202014751D0 (en) 2020-11-04
IL301407A (en) 2023-05-01
US20230357790A1 (en) 2023-11-09
MX2023003201A (es) 2023-07-07
AU2021344868A9 (en) 2023-07-06
KR20230074507A (ko) 2023-05-30

Similar Documents

Publication Publication Date Title
KR102418185B1 (ko) 단일 가닥 rna-편집 올리고뉴클레오타이드
JP7093728B2 (ja) 化学的に修飾されたガイドrnaを使用する高特異性ゲノム編集
KR102618864B1 (ko) 합성 가이드 분자, 그와 관련된 조성물 및 방법
KR102595683B1 (ko) 변형된 가이드 rna
AU2015355546B2 (en) Guide RNA with chemical modifications
WO2018134301A1 (en) Oligonucleotide complexes for use in rna editing
CN114269919A (zh) 采用工程化rna利用内源adar进行靶向的rna编辑
CN117487801A (zh) Dna合成的方法
CN113661242A (zh) 包含经修饰的环状多核糖核苷酸的组合物及其用途
CN113748206A (zh) 用于rna编辑的化学修饰寡核苷酸
WO2005056750A2 (en) Inversion-duplication of nucleic acids and libraries prepared thereby
CN116615546A (zh) 自靶向性表达载体
KR20220123398A (ko) 합성 가이드 rna, 이의 조성물, 방법 및 용도
JP2024518546A (ja) 修飾されたmRNA、修飾された非コードRNA、およびその使用
US6921816B2 (en) Chimerical peptide-nucleic acid fragment, process for producing the same and its for appropriately introducing nucleic acids into cell organelles and cells
KR20240004549A (ko) 엑소뉴클레아제에 대해 향상된 저항성이 있는 선형 dna
KR20220018410A (ko) 세포질에서 자가전사가 가능하고 유전체 편집을 제공하는 rna/dna 시스템
US20220333129A1 (en) A nucleic acid delivery vector comprising a circular single stranded polynucleotide
CN114616338A (zh) 生成哑铃形dna载体的方法
EP4219723A1 (en) Circular rna platforms, uses thereof, and their manufacturing processes from engineered dna
WO2024137392A1 (en) Method of preparing self-circularized rna
KR20220067468A (ko) 세포질에서 자가 전사가 가능하고 발현억제 rna를 제공하는 rna/dna 시스템
KR20230028860A (ko) 세포질에서 자가 전사가 가능하고 cDdRp mRNA를 제공하는 RNA/DNA 시스템
CN118076741A (zh) 修饰的mRNA、修饰的非编码RNA及其用途
WO2021148063A1 (en) Method of modifying a nucleic acid molecule to facilitate its transfer into host cells and the modified nucleic acid molecule

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination