CN115698268A - 基于转座的疗法 - Google Patents

基于转座的疗法 Download PDF

Info

Publication number
CN115698268A
CN115698268A CN202180033254.1A CN202180033254A CN115698268A CN 115698268 A CN115698268 A CN 115698268A CN 202180033254 A CN202180033254 A CN 202180033254A CN 115698268 A CN115698268 A CN 115698268A
Authority
CN
China
Prior art keywords
seq
composition
transposase
lys
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180033254.1A
Other languages
English (en)
Inventor
J·J·希金斯
S·麦克米兰
R·塔比比亚扎尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Saleo Gene Therapy
Original Assignee
Saleo Gene Therapy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Saleo Gene Therapy filed Critical Saleo Gene Therapy
Publication of CN115698268A publication Critical patent/CN115698268A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element

Abstract

提供了利用新颖转座酶和/或嵌合转座酶用于靶向转座的基因治疗组合物和方法。

Description

基于转座的疗法
发明领域
本发明部分地涉及使用能够转座的酶(例如,工程化转座酶和/或嵌合转座酶)的双重系统以及用于靶向人类基因组安全港位点(GSHS)的转座子。
优先权
本申请要求2020年5月4日提交的美国临时专利申请号63/019,709、2020年5月20日提交的美国临时专利申请号63/027,561、2020年7月29日提交的美国临时专利申请号63/058,200以及2021年4月15日提交的美国临时专利申请号63/175,345的优先权和权益,每篇专利申请的全部内容以引用的方式并入本文中。
以电子方式提交的文本文件的描述
本申请含有经由EFS-Web与之一起以电子方式提交的ASCII格式的序列表。2021年5月3日创建的ASCII副本命名为SAL-003PC_ST25.txt并且大小为182,990字节。序列表以全文引用的方式并入本文中。
背景技术
人类基因疗法是一种有前景的方法,它递送用于治疗和减轻各种疾病和疾患,包括遗传性和获得性疾病的基因。基因疗法涉及用健康的基因拷贝替换或补充突变基因(这种基因导致疾病),使功能不当的突变基因(或任何其它基因)灭活或沉默,或将新基因引入染色体中。安全有效地将基因整合至宿主基因组中的能力对于在人类中进行成功的基因疗法是至关重要的。
当前,在基因疗法试验中用于永久或瞬时基因转移的最常用载体是基于病毒的。尽管有可能使用病毒载体高效地达成稳定的基因组整合,但多项研究已经显示存在严重的缺点和安全问题。因此,已经显示腺病毒和腺相关病毒(AAV)引发宿主人类反应,这些反应会限制施用或再施用,而逆转录病毒/慢病毒优先将转基因整合至常染色质中,从而增加插入诱变或肿瘤发生的风险。病毒系统的货物大小也受限制,从而限制转基因及其调控元件的大小和数量。病毒载体-宿主相互作用可以包括免疫原性,并且病毒载体DNA在宿主基因组中的整合可能具有基因毒性作用。此外,由于AAV基因组主要以游离形式存在于受感染细胞的细胞核中,因此它可能在细胞增殖(诸如肝脏生长或其它器官生长)的条件下损失,从而限制治疗功效。因此,病毒载体的局限性,诸如致病性、昂贵的生产和系统不稳定性已经证明是使用基于病毒的系统的主要障碍。事实上,基于病毒的载体的再施用可以促进免疫反应,这些反应可能导致危及生命的全身效应并限制基因转移功效。参见Kay等,Proc NatlAcad Sci U S A 1997;94:4686-91;Hernandez等,J Virol 1999;73:8549-58。
非病毒载体(即,基于脂质、基于聚合物、基于脂质聚合物和聚赖氨酸)是用于封装转基因DNA或RNA直至它到达细胞靶标的合成工具。与病毒载体相比,非病毒载体的制备一般更安全,并且降低了致病和免疫并发症的风险。已经通过修饰非病毒载体的表面来设计非病毒载体以用于靶向疗法。参见例如Lestini等,J Control Release 2002;78:235-47。
用于非病毒人类基因疗法中的核酸酶也正在评价中。成簇规则间隔短回文重复(CRISPR)/CRISPR相关(Cas9)和转录激活子样效应子(TALE)核酸酶(TALEN)系统诱导双链DNA断裂(DSB)。DSB增强同源重组以在特定序列处插入转基因,但在未知远程位点处的脱靶DNA分裂会导致意外突变,这需要复杂的基因毒性筛选进行检测。CRISPR系统使用与用户定义的向导RNA(gRNA)复合的Cas9来识别和切割互补序列。TALEN和CRISPR都使用宿主同源定向修复以在所需序列处引入共同递送的供体模板。TALEN和CRISPR方法证明了有效的基因转移,但关于它们的细胞毒性和基因毒性作用的问题仍然是临床应用的重大障碍。此外,使用同源定向修复的基因添加需要复制,由此将核酸酶技术限于分裂组织(即,在诸如中枢神经系统的非分裂系统中无效)。其它基因编辑技术,诸如先导编辑和碱基对编辑,限于校正碱基对或小核苷酸延伸段。这些特征限制了这种技术在体内和体外应用于具有单一常见致病核苷酸变体的疾病。然而,大多数遗传病症在一个或多个基因中具有数百甚至数千个致病核苷酸变体。
重组酶识别并结合转座子末端的特定序列,介导末端之间的突触相互作用以将它们结合在一起,与靶标DNA相互作用,并且执行作为重组基础的DNA断裂和连接反应。整合酶是能够将DNA(例如,病毒的)整合至另一段DNA(通常是宿主染色体)中的重组酶。
DNA转座子是使用“剪切和粘贴”机制的移动元件。DNA通过双链分裂从供体分子切下并整合至接受体分子中。在转座酶存在下,转座子从DNA上的一个位置移动至DNA上的第二个位置,所述转座酶是一种结合至转座子末端并催化其移动至宿主中的特定基因组位置的酶。
基于转座酶的基因疗法的一个主要问题是由于随机整合所致的插入诱变,尽管主要在已知序列(例如,TTAA(SEQ ID NO:1)序列)处,靠近或处于激活癌基因、中断肿瘤抑制基因或破坏正常基因转录的基因座内。因此,虽然非病毒转座子基因治疗方法在治疗患有遗传病症的个体方面具有很大的前景,但挑战在于降低随机插入的风险。
因此,临床需要改善能够转座的酶,诸如转座酶的安全性,以降低插入诱变和肿瘤发生的风险。
发明内容
因此,本发明部分地提供了在疗法中具有特殊用途,但避免现有转座酶的限制的新颖转座酶组合物。
在一些方面,提供了一种适合用于基因疗法,并且有利地用于具有持久耐用的大有效载荷(例如,转座子)的基因疗法的哺乳动物转座酶。在一些方面,哺乳动物转座酶是已经被设计成具有N端氨基酸取代和C端氨基酸缺失的小棕蝠(Myotis lucifugus)转座酶(MLT转座酶)的工程化型式。在实施方案中,MLT转座酶具有SEQ ID NO:2的氨基酸序列或其变体。在实施方案中,MLT转座酶进一步工程化为具有氨基酸取代以改善活性,例如,在对应于SEQ ID NO:2的位置S8、C13和/或N125处。
在一些方面,提供了一种包含转座酶(例如,MLT转座酶)或编码转座酶的核酸的组合物,其中所述转座酶包含与SEQ ID NO:2具有至少约80%序列同一性的氨基酸序列,其中所述转座酶在对应于SEQ ID NO:2的位置S2的位置处包含氨基酸取代。
本发明提供了一种基因转移系统或构建体,所述基因转移系统或构建体包含如图1A-D中或图2中所示的能够通过转座进行基因组整合的单体或头对尾二聚体酶和由向导RNA(gRNA)编程的DNA结合结构域(DBD),诸如转录激活子样效应蛋白(TALE)DBD或非活性(dCas9)(称为dCas9/gRNA复合物)。具有融合至能够转座的酶(例如,重组酶、整合酶或转座酶)的DBD的这些嵌合系统引导酶结合至靠近转座酶识别位点的特定序列[例如,TALE重复可变二残基(RVD)或gRNA],以防止转座酶结合至随机识别位点。在一些实施方案中,基因转移系统的酶(例如,转座酶)结合至人类基因组安全港位点(GSHS)。本文所描述的TALE可以将酶物理隔离至GSHS并促进转座至与RVD TALE核苷酸序列非常接近的附近TTAA(SEQ IDNO:1)序列。基于转座酶插入开放染色质中的偏好,特异性地靶向开放染色质位点中的GSHS。另外,将dCas9(即,缺乏核酸酶活性)用经引导以在GSHS中所需的DNA序列处结合的gRNA编程。
在一些方面,提供了一种包含能够转座的酶的组合物,所述组合物包含(a)TALEDBD或dCas9/gRNA DBD;(b)能够通过转座进行靶向基因组整合的酶,所述酶能够在核酸分子中的GSHS序列中的TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点处插入转座子;以及(c)连接TALE或Cas/gRNA DBD和酶的连接子。
在一些实施方案中,酶,例如转座酶(transposase/transposase enzyme),呈二聚形式(例如,头对尾二聚体)。在一些实施方案中,酶呈四聚形式或呈另一种多聚形式。在一些实施方案中,酶呈单体形式。
在一些实施方案中,组合物适合于在与生物细胞接触时促成在GSHS中插入转座子。TALE DBD或dCas/gRNA复合物可以适合于将转座酶引导至GSHS序列。在实施方案中,组合物包含dCas/gRNA复合物。
在一些实施方案中,提供了一种包含能够转座的酶的组合物,所述组合物包含(a)dCas9/gRNA复合物;(b)能够通过转座进行靶向基因组整合的酶,所述酶能够在核酸分子中的GSHS序列中的TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点处插入转座子;以及(c)连接dCas/gRNA复合物和酶的连接子。
在实施方案中,GSHS处于染色体中的开放染色质位置。在一些实施方案中,GSHS选自腺相关病毒位点1(AAVS1)、趋化因子(C-C基序)受体5(CCR5)基因、HIV-1辅受体和人类Rosa26基因座。在一些实施方案中,GSHS位于人类染色体2、4、6、10、11或17上。
在一些实施方案中,GSHS选自图3和图4中所列的位点或其变体(例如,具有约1个、或约2个、或约3个、或约4个、或约5个独立地选自插入、取代或缺失的突变)。在一些实施方案中,TALE DBD包含图3的序列或其变体(例如,具有约1个、或约2个、或约3个、或约4个、或约5个独立地选自插入、取代或缺失的突变)。在一些实施方案中,dCas/gRNA DBD包含图4的序列或其变体(例如,具有约1个、或约2个、或约3个、或约4个、或约5个独立地选自插入、取代或缺失的突变)。
在一些实施方案中,GSHS处于TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点的约25个、或约50个、或约100个、或约150个、或约200个、或约300个、或约500个核苷酸内。在一些实施方案中,GSHS距TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点多于500个核苷酸。
在实施方案中,TALE DBD包含一个或多个重复序列。在一些实施方案中,TALE DBD或重复可变二残基(RVD)包含约14个、或约15个、或约16个、或约17个、或约18个、或约18.5个氨基酸重复序列。在一些实施方案中,RVD包括于包含33个或34个氨基酸的TALE氨基酸重复序列内。
在一些实施方案中,TALE DBD重复序列中的一者或多者在33个或34个氨基酸的残基12或13处包含RVD。RVD可以识别靶标DNA的某个(某些)碱基对或残基。在一些实施方案中,RVD识别核酸分子中的一个碱基对。在一些实施方案中,RVD识别核酸分子中的“C”残基并且RVD选自HD、N(间隙)、HA、ND和HI。在一些实施方案中,RVD识别核酸分子中的“G”残基并且RVD选自NN、NH、NK、HN和NA。在一些实施方案中,RVD识别核酸分子中的“A”残基并且RVD选自NI和NS。在一些实施方案中,RVD识别核酸分子中的“T”残基并且RVD选自NG、HG、H(间隙)和IG。在实施方案中,酶(例如但不限于转座酶)能够在TA二核苷酸位点处插入转座子。在一些实施方案中,酶能够在TTAA(SEQ ID NO:1)四核苷酸位点处插入转座子。
在实施方案中,编码能够通过转座进行靶向基因组整合的酶的核酸包含内含肽。在实施方案中,核酸以第一部分和第二部分的形式编码酶,在第一部分与第二部分之间编码内含肽,使得第一部分和第二部分在翻译后切除酶中的内含肽后融合至功能酶中。
在实施方案中,酶是重组酶或整合酶。在实施方案中,重组酶是整合酶。在实施方案中,整合酶是转座酶或重组酶是转座酶。
在实施方案中,转座酶具有一个或多个赋予高活性的突变。在实施方案中,转座酶是源自哺乳动物的转座酶,任选地由辅助体RNA编码。
在实施方案中,酶来源于家蚕(Bombyx mori)、热带爪蟾(Xenopus tropicalis)、粉纹夜蛾(Trichoplusia ni)或小棕蝠。在实施方案中,酶是工程化型式,包括但不限于单体、二聚体、四聚体(或另一种多聚体)、高活性或与非TTAA(SEQ ID NO:1)识别位点(Int-)的相互作用降低的酶,来源于家蚕、热带爪蟾、粉纹夜蛾或小棕蝠。在一些实施方案中,转座酶是小棕蝠转座酶(本文中称作MLT或MLT转座酶),所述转座酶可以是野生型、单体、二聚体、四聚体(或另一种多聚体)、高活性、Int-突变体或任何其它变体。
在实施方案中,MLT转座酶的高活性形式或Int-形式具有一个或多个选自L573X、E574X和S2X的突变,其中X是任何氨基酸或无氨基酸,任选地X是A、G或缺失,任选地突变是L573del、E574del和S2A。
在实施方案中,MLT转座酶,本文正称作校正的工程化MLT转座酶,具有L573del、E574del和S2A突变。此种MLT转座酶包含SEQ ID NO:2的氨基酸序列或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的变体。在实施方案中,MLT转座酶由SEQ ID NO:3的核苷酸序列或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的变体编码。
在实施方案中,MLT转座酶具有SEQ ID NO:4的氨基酸或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列。在一些实施方案中,MLT转座酶由SEQ ID NO:5的核苷酸序列或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列编码。
在实施方案中,MLT转座酶的高活性、Int-或其它形式包括来自图5A和5B的突变,例如但不限于约1个、或约2个、或约3个、或约4个、或约5个突变。在实施方案中,转座酶可以包括图5A和5B中所描绘的突变中的任一者,或其等同物。
在实施方案中,根据本公开的实施方案的MLT转座酶包含一个或多个赋予MLT转座酶高活性的高活性突变。在实施方案中,高活性突变体在S8、C13和N125处包含一个或多个取代。在实施方案中,高活性突变包括S8P、C13R和N125K突变中的一者或多者。
在实施方案中,MLT转座酶具有相对于SEQ ID NO:2的氨基酸序列在对应于S8P、C13R和N125K突变中的至少一者的位置处具有高活性突变的氨基酸序列。在实施方案中,MLT转座酶具有SEQ ID NO:7的氨基酸序列,所述氨基酸序列相对于SEQ ID NO:2的氨基酸序列在对应于高活性N125K突变的位置处具有突变。
在实施方案中,MLT转座酶具有SEQ ID NO:9的氨基酸序列,所述氨基酸序列相对于SEQ ID NO:2的氨基酸序列在对应于高活性S8P和C13R突变的位置处包含突变。
在实施方案中,MLT转座酶具有相对于SEQ ID NO:2的氨基酸序列在对应于S8P、C13R和N125K突变中的至少一者的位置处具有高活性突变的氨基酸序列。应了解,具有SEQID NO:2的氨基酸序列的MLT转座酶可以具有两个高活性突变(S8P和C13R),而没有N125K突变,或者具有SEQ ID NO:2的氨基酸序列的MLT转座酶可以具有任何其它突变(例如,图5A和5B中的任何一个或多个突变)。在实施方案中,MLT转座酶具有SEQ ID NO:340的氨基酸序列,所述氨基酸序列相对于SEQ ID NO:2的氨基酸序列在对应于S8P、C13R和N125K突变的位置处包含高活性突变。
在实施方案中,转座酶来源于家蚕、热带爪蟾、粉纹夜蛾、小棕蝠、马铁菊头蝠(Rhinolophus ferrumequinum)、埃及果蝠(Rousettus aegyptiacus)、苍白矛吻蝠(Phyllostomus discolor)、大鼠耳蝠(Myotis myotis)、马来大狐蝠(Pteropusvampyrus)、库氏伏翼(Pipistrellus kuhlii)、类人猿(troglodytes)、獒蝠(Molossusmolossus)或智人(Homo sapiens)。在实施方案中,转座酶来源于粉纹夜蛾、小棕蝠、大鼠耳蝠、黑猩猩(Pan troglodytes)或马来大狐蝠中的任一者(参见图7)。转座酶可以具有一个或多个选自图5A和5B的高活性和/或整合缺陷突变,或其等同物。参考图7,本领域技术人员可以将此类突变体对应于来自粉纹夜蛾、小棕蝠、大鼠耳蝠或马来大狐蝠中任一者的转座酶。此外,本领域技术人员可以将此类突变体对应于来自家蚕、热带爪蟾、粉纹夜蛾、小棕蝠、马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、马来大狐蝠、库氏伏翼、类人猿、獒蝠或智人的转座酶。
在一些实施方案中,酶(例如但不限于转座酶)具有与马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、马来大狐蝠、库氏伏翼和獒蝠中任一者的核苷酸序列具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列。在一些实施方案中,转座酶可以具有与马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、马来大狐蝠、库氏伏翼和獒蝠中任一者的氨基酸序列具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列。
在实施方案中,酶(例如但不限于转座酶)是工程化型式,包括但不限于单体、二聚体、四聚体、高活性或与非TTAA(SEQ ID NO:1)识别位点(Int-)的相互作用降低的转座酶,来源于家蚕、热带爪蟾、粉纹夜蛾、小棕蝠、马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、马来大狐蝠、库氏伏翼、黑猩猩、獒蝠和智人中的任一者。转座酶可以是野生型、单体、二聚体、四聚体或另一种多聚体、高活性或Int-突变体。
在一些实施方案中,连接TALE DBD和能够通过转座进行靶向基因组整合的酶的连接子是柔性连接子。在一些实施方案中,柔性连接子大体上由甘氨酸和丝氨酸残基组成,任选地其中所述柔性连接子包含(Gly4Ser)n,其中n为约1至约12。柔性连接子可以具有约20个、或约30个、或约40个、或约50个、或约60个氨基酸残基。
包含根据本公开的实施方案的能够转座的酶的组合物可以包含一种或多种非病毒载体。此外,与具有转基因的转座子相比,酶(例如,嵌合转座酶)可以安置在相同(顺式)或不同(反式)的载体上。因此,在一些实施方案中,嵌合转座酶和包含转基因的转座子呈顺式构型,使得它们包含在相同的载体中。在一些实施方案中,嵌合转座酶和包含转基因的转座子呈反式构型,使得它们包含在不同的载体中。载体是根据本公开的任何非病毒载体。
在一些方面,提供了一种编码根据本公开的实施方案的能够通过转座进行靶向基因组整合的酶(例如,嵌合转座酶)的核酸。核酸可以是DNA或RNA。在一些实施方案中,编码酶的核酸是DNA。在一些实施方案中,编码能够通过转座进行靶向基因组整合的酶(例如,嵌合转座酶)的核酸是RNA,诸如辅助体RNA。在实施方案中,将嵌合转座酶掺入载体中。在一些实施方案中,载体是非病毒载体。
在实施方案中,编码转座子的核酸是DNA,称作“供体DNA”。在实施方案中,编码能够通过转座进行靶向基因组整合的酶(例如,嵌合转座酶)的核酸是辅助体RNA。在实施方案中,将供体DNA掺入质粒中。在实施方案中,供体DNA是质粒。在一些方面,提供了一种包含根据本公开的实施方案的核酸的宿主细胞。
在一些实施方案中,提供了根据本公开的实施方案的组合物或核酸,其中所述组合物呈脂质纳米颗粒(LNP)的形式。
在实施方案中,编码酶的核酸和编码转座子的核酸包含在相同的脂质纳米颗粒(LNP)中。在一些实施方案中,编码酶的核酸和编码转座子的核酸是掺入相同LNP中或与相同LNP缔合的混合物。在一些实施方案中,编码酶的核酸和编码转座子的核酸呈掺入相同LNP中或与相同LNP缔合的共制剂的形式。
在实施方案中,LNP选自1,2-二油酰基-3-三甲基丙烷铵(DOTAP)、与二甲基氨基乙烷-氨基甲酰基混合的阳离子胆固醇衍生物(DC-Chol)、磷脂酰胆碱(PC)、三油精(三油酸甘油酯)和1,2-二硬脂酰基-sn-甘油-3-磷酰乙醇胺-N-[羧基(聚乙二醇)-2000](DSPE-PEG)、1,2-二肉豆蔻酰基-外消旋-甘油-3-甲氧基聚乙二醇-2000(DMG-PEG2K)和1,2-二硬脂醇-sn-甘油-3-磷酸胆碱(DSPC),和/或包含一种或多种选自聚乙烯亚胺(PEI)和聚(乳酸-共-乙醇酸)(PLGA)以及N-乙酰半乳糖胺(GalNAc)的分子。
在一些实施方案中,LNP可以如Patel等,J Control Release 2019;303:91-100中所描述。LNP可以包含结构脂质(例如,DSPC)、PEG缀合的脂质(CDM-PEG)、阳离子脂质(MC3)、胆固醇和靶向配体(例如,GalNAc)中的一者或多者。
在一些方面,提供了一种用于将基因插入细胞基因组中的方法,所述方法包括根据本公开的实施方案使细胞与酶(例如但不限于嵌合转座酶)接触。所述方法可以是体内或离体方法。
在一些实施方案中,使细胞与编码酶(例如但不限于嵌合转座酶)的核酸接触。在一些实施方案中,使细胞与编码嵌合转座酶的RNA接触和/或与包含转座子的构建体接触,所述转座子具有侧翼绝缘子,诸如HS4和D4Z4。在一些实施方案中,使细胞与编码嵌合转座酶的DNA接触。
在一些实施方案中,转座子的侧翼是一个或多个反向末端。转座子可以在组织特异性启动子的控制下。在一些实施方案中,转座子是ATP结合盒亚家族A成员4基因(ABC)转运体基因(ABCA4)或其功能片段。作为另一个实例,在一些实施方案中,转座子是极低密度脂蛋白受体基因(VLDLR)或低密度脂蛋白受体基因(LDLR)或其功能片段。
在实施方案中,酶是转座酶,诸如嵌合转座酶,并且与使用非嵌合转座酶的方法相比,所述方法提供减少的插入诱变或肿瘤发生。
在实施方案中,所述方法用于治疗有需要的患者的遗传性或获得性疾病。
举例来说,在一些实施方案中,所述方法用于治疗和/或减轻一类遗传性黄斑变性(IMD)(也称作黄斑营养不良(MD)),包括斯塔加特病(Stargardt disease,STGD)、贝斯特病(Best disease)、X连锁视网膜劈裂症、模式性营养不良、索斯比眼底营养不良(Sorsbyfundus dystrophy)和常染色体显性玻璃疣。STGD可以是1型STGD(STGD1)。在一些实施方案中,STGD可以是3型STGD(STGD3)或4型STGD(STGD4)疾病。IMD可以由ABCA4、ELOVL4、PROM1、BEST1和PRPH2中的一者或多者中的一个或多个突变来表征。基因疗法可以使用基于转座子的载体系统,在根据本公开的嵌合转座酶的帮助下进行,所述转座酶在与待转移基因相同的载体上(顺式)或不同的载体上(反式)或作为RNA提供。转座子可以包含ATP结合盒亚家族A成员4(ABCA4)或其功能片段,并且基于转座子的载体系统可以在视网膜特异性启动子的控制下操作。
在一些实施方案中,所述方法用于治疗和/或减轻家族性高胆固醇血症(FH),诸如纯合子FH(HoFH)或杂合子FH(HeFH)或与低密度脂蛋白胆固醇(LDL-C)水平升高相关的病症。基因疗法可以使用基于转座子的载体系统,在根据本公开的酶(例如但不限于嵌合转座酶)的帮助下进行,所述酶在与待转移基因相同的载体上(顺式)或不同的载体上(反式,例如供体DNA/辅助体RNA系统)提供。转座子可以包含极低密度脂蛋白受体基因(VLDLR)或低密度脂蛋白受体基因(LDLR)或其功能片段。基于转座子的载体系统可以在肝脏特异性启动子的控制下操作。在一些实施方案中,肝脏特异性启动子是LP1启动子。LP1启动子可以是人类LP1启动子,所述启动子可以如Nathwani等Blood第107(7)卷(2006):2653-61中所述来构建。
应了解,可以使用根据本公开的方法治疗和/或减轻任何其它遗传性或获得性疾病。
在以下附随描述中阐述了本发明的细节。尽管在本发明的实践或测试中可以使用与本文所描述的那些方法和材料类似或等同的方法和材料,但现在描述说明性方法和材料。本发明的其它特征、目的和优点从描述和权利要求书将显而易见。在说明书和所附权利要求书中,除非上下文另外清楚地指出,否则单数形式也包括复数。除非另有定义,否则本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。
附图说明
图1A-D描绘了嵌合、单体或头对尾二聚体转座酶的非限制性表示,所述转座酶被设计成使用TALE和Cas9/向导RNA DNA结合子靶向人类GSHS。图1A.TALE包括核定位信号(NLS)和激活结构域(AD),以用作转录激活子。DNA结合结构域具有约16.5个重复的33-34个氨基酸,在位置12-13处具有残留可变二残基(RVD)。图1B.示出了对一个或几个核苷酸具有特异性的RVD。仅示出了DNA前导链的碱基。图1C.包含通过长度大于23个氨基酸的连接子与其融合的TALE DNA结合蛋白的嵌合转座酶构建体(上)和包含连接至一个或多个向导RNA的dCas9的嵌合转座酶构建体(下)。图1D.示意图示出了嵌合转座酶在开放染色质处形成二聚体或四聚体,以在靠近TALE或dCas9/gRNA靶向的DNA结合区的TTAA(SEQ ID NO:1)识别位点处插入供体DNA。TALE或dCas9/gRNA与GSHS的结合将转座酶作为单体或二聚体物理隔离至相同位置并促进转座至靠近重复可变二残基(RVD)核苷酸序列的附近TTAA(SEQ ID NO:1)序列(图3和图4)。所有RVD前面都有胸腺嘧啶(T),以结合至图1A中所示的NTR。
图2是根据本公开的实施方案的系统的非限制性表示,所述系统包含编码能够通过转座进行靶向基因组整合的酶的核酸(例如,辅助体RNA)和编码转座酶的核酸(供体DNA)。辅助体RNA被翻译成生物工程化酶(例如,整合酶、重组酶或转座酶),所述酶识别特定末端并以位点特异性方式将供体DNA无缝插入人类基因组中,而没有足迹。所述酶可以在开放染色质处形成二聚体或四聚体,以在靠近dCas9/gRNA或TALE靶向的DNA结合区的TTAA(SEQ ID NO:1)识别位点处插入供体DNA。dCas9/gRNA与TALE GSHS的结合将酶物理隔离至相同位置并促进转座至附近的TTAA(SEQ ID NO:1)序列(参见图3和图4)。
图3和图4描绘了开放染色质区域中人类基因组安全港位点的DNA结合代码(图3)和在开放染色质区域中使用dCas靶向人类基因组安全港位点的向导RNA(图4)。染色体2、4、6和11的基因组位置改编自Pellenz等(Hum Gene Ther 2019;30:814-28)和来自Papapetrou等(Nat Biotechnol 2011;29:73-8)的染色体10和17。使用hg18或hg19从UCSC基因组浏览器下载序列,并且使用E-TALEN(一种设计和评价TALE DBD的软件工具)和WU-CRISPR(一种设计向导RNA的软件工具)进行评价。
图5A描绘了高活性MLT突变体。
图5B描绘了切除阳性和整合缺陷(Int-)MLT突变体。
图6A描绘了显示DNA结合结构域的具有100%置信度的三维MLT蛋白质结构。
图6B描绘了MLT转座酶的二级结构预测,所述转座酶包含由SEQ ID NO:5的核苷酸序列编码的SEQ ID NO:4的氨基酸序列。
图7描绘了piggyBac(“粉纹夜蛾”)转座酶与MLT(“蝙蝠”)转座酶和其它蝙蝠转座酶(粉纹夜蛾、小棕蝠、大鼠耳蝠和马来大狐蝠)的氨基酸序列比对。piggyBac(SEQ ID NO:10)与MLT和其它哺乳动物转座酶(SEQ ID NO:14(小棕蝠)、SEQ ID NO:12(大鼠耳蝠2a)、SEQ ID NO:13(大鼠耳蝠1)、SEQ ID NO:11(马来大狐蝠)、SEQ ID NO:14(小棕蝠2)、SEQ IDNO:15(大鼠耳蝠2)和SEQ ID NO:16(大鼠耳蝠2b)以下文在“共有”下所列的次序出现)的氨基酸序列比对。
图8A和8B描绘了构建体模板的非限制性实例。图8A描绘了转录转座酶RNA的质粒构建体模板,所述转座酶RNA稍后用5'-m7G cap1和假尿苷取代进行加工。图8B描绘了与任何转基因一起使用的通用MLT供体DNA构建体模板。
图9A是说明使用来自Yusa等(2010)的序列的高活性piggyBac转座酶对比高活性MLT变体(S8P/C13R双突变体;L573del E574del)的整合效率的条形图。
图9B是说明使用来自Yusa等(2010)的序列的工程化MLT(S8P/C13R双突变体;L573del E574del,S2A)与高活性piggyBac相比的整合效率的条形图。
图10描绘了MLT(针对RNA进行人类密码子优化)和Mitra等(Proc Natl Acad SciU S A.2013年1月2日;110(1):234-9)的公开序列的核苷酸序列比对(同一性77.67%,间隙1.44%)。
图11描绘了MLT和来自WO2010085699的序列的核苷酸序列比对(同一性73.68%,间隙1.16%)。
图12描绘了MLT(L573del/E574del/S2A,具有S8P、C13R和N125K突变)和Mitra等的公开序列的氨基酸序列比对。(Mitra在C端含有2个额外的氨基酸)。
图13描绘了工程化MLT(L573del/E574del/S2A,具有S8P和C13R突变,“MLT”)和来自WO2010085699的序列的氨基酸比较。
图14描绘了MLT的末端左端与公开序列(Ray等,piggyBac1_ML)的比较。
图15描绘了MLT的末端右端与公开序列(Ray等,piggyBac1_ML)的比较。
图16描绘了用于整合测定的DNA供体构建体模板,所述模板与小棕蝠转座酶(MLT)或piggyBac(PB)转座酶一起使用。DNA供体构建体模板具有驱动绿色荧光蛋白(GFP)表达的巨细胞病毒(CMV)启动子。
图17A和17B示出了HeLa细胞中高活性MLT转座酶突变体的功能评估结果。图17A示出了哺乳动物转座子(Ts)变体S8P、C13R、N125K和S8P/C13R具有比天然酶更高的切除频率。图17B示出了用供体新霉素转基因转染的HeLa细胞中的功能性转基因表达,以1:20连续稀释。哺乳动物MLT转座酶变体S8P/C13R显示出与HeLa细胞中的昆虫piggyBac相当的相对整合。
图18是说明对于无MLT、MLT、N125K突变体和S8P/C13R突变体来说,MLT转座酶高活性突变体在HEK293细胞中的整合效率百分比(%)的条形图。双突变体S8P/C13R显示在HEK293细胞中观察到最高的整合效率。MLT转座酶是包含SEQ ID NO:4的氨基酸序列并由SEQ ID NO:5的核苷酸序列编码的MLT转座酶。
图19A和19B示出了十二烷基硫酸钠-聚丙烯酰胺凝胶电泳的图像。图19A示出了通过直链淀粉树脂柱对纯化的MBP-MLT转座酶融合蛋白的分析。从直链淀粉树脂柱上的超声处理细菌的上清液中纯化表达的蛋白质(MBP-MLT转座酶)之后,通过SDS-PAGE鉴定出100+kDa的主要蛋白质条带。图19B中示出了通过TEV蛋白酶和肝素洗脱使MBP标签分裂过夜之后显示出67.5kDa MLT转座酶特异性条带。
图20示出了麦芽糖结合蛋白(MBP)-MLT转座酶融合蛋白的Superdex尺寸排阻色谱。
图21描绘了包含MLT转座子的供体质粒的实例。
图22A、22B、22C、22B和22D是说明高活性形式的piggyBac(hypPB)的变体与高活性MLT转座酶(hypMLT)相比的整合效率和切除活性的条形图,所述转座酶包含L573del/E574del/S2A并且具有S8P/C13R突变(由SEQ ID NO:8的核苷酸序列编码并具有SEQ ID NO:9的氨基酸序列的MLT转座酶)。图22A示出了无MLT、MLT-dCas9、MLT-dCas12j、高活性piggyBac-dCas12j、高活性piggyBac-dCas9、高活性piggyBac和MLT的整合活性%。图22B示出了无MLT、MLT-内含肽-N端、MLT1和MLT2的切除活性%。图22C示出了无MLT、MLT-内含肽-N端、MLT1和MLT2的整合活性%。图22D示出了无MLT、MLT-dCas12j、MLT-dCas9、MLT-内含肽-N端dCas9、MLT-内含肽-N端、MLT-内含肽-N端TALE、MLT-TALE10和MLT的切除活性%。来自hROSA29中的TTAA(SEQ ID NO:1)位点的27bp和49bp的MLT-TALE10。
图23A、23B、23C、23D和23E描绘了本研究中使用的靶向piggyBac质粒的结构的实例。
图23F是根据本发明的实施方案,通过破坏piggyBac转座酶DNA结合结构域DBD来改善特异性的模型的非限制性示意图。
图23G描绘了通过使用例如NpuN(内含肽-N)(SEQ ID NO:423)和NpuC(内含肽-C)(SEQ ID NO:424)内含肽蛋白质剪接而连接至dCas的MLT转座酶。可以取代其它dCas以靶向特定基因组位点。
图23H描绘了连接至TALE DNA结合子的嵌合MLT转座酶构建体。可以取代其它TALE和转座酶以靶向特定基因组位点。
图24A描绘了在本公开中鉴定,含有使用高活性piggyBac转座酶供体和具有Cas9/gRNA的辅助体向人类ROSA26的靶向插入的阳性克隆系。
图24B描绘了使用具有Cas9的MLT辅助体以及分别距TTAA(SEQ ID NO:1)靶向位点61bp和62bp的两组不同gRNA(第1组:AATCGAGAAGCGACTCGACA(SEQ ID NO:425),TGCCCTGCAGGGGAGTGAGC(SEQ ID NO:426);第2组:GAAGCGACTCGACATGGAGG(SEQ ID NO:427),CCTGCAGGGGAGTGAGCAGC(SEQ ID NO:428)),检测在人类ROSA26基因座中的特定TTAA(SEQ ID NO:1)位点处供体MLT的插入的嵌套PCR策略。
图24C描绘了在本公开中鉴定,当用具有Cas9/gRNA的MLT辅助体转染后在hROSA26处插入MLT供体时显示预期嵌套PCR片段的1.0%琼脂糖凝胶。
图24D描绘了在本公开中鉴定,当用具有Cas9/gRNA的MLT辅助体转染后在hROSA26处插入MLT供体时显示正确连接DNA序列的DNA测序色谱图。
图25示出了在不同条件下转染的初始Huh7细胞系以显示Huh7表达GFP。行示出了(从顶部)未处理的细胞、模拟物、用MLT处理的细胞和用pmaxGFP处理的细胞;列示出了第1天(D1)、第3天(D3)和第7天(D7)的对照。
图26示出了在转染后24小时,在不同比率下,与仅用CMV-GFP转染的细胞相比,用CMV-GFP+MLT转染的Huh7细胞。顶行示出了用2:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(2μg)转染的细胞。中间行示出了用1:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(1μg)转染的细胞。底行示出了用0.5:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(0.5μg)转染的细胞。
图27示出了在转染后72小时,在不同比率下,与仅用CMV-GFP转染的细胞相比,用CMV-GFP+MLT转染的Huh7细胞。顶行示出了用2:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(2μg)转染的细胞。中间行示出了用1:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(1μg)转染的细胞。底行示出了用0.5:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(0.5μg)转染的细胞。
图28示出了在转染后1周,在不同比率下,与仅用CMV-GFP转染的细胞相比,用CMV-GFP+MLT转染的Huh7细胞。顶行示出了用2:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(2μg)转染的细胞。中间行示出了用1:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(1μg)转染的细胞。底行示出了用0.5:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(0.5μg)转染的细胞。
图29A和29B示出了在转染后14天(图29A)和转染后21天(图29B),在96孔板中核转染、T25烧瓶中脂质转染和96孔板中脂质转染后HEK293细胞的活力。在转染后14天和21天,96孔板中的细胞活力略好。未处理的细胞与处理过的细胞之间的细胞活力没有显著差异。
图29C和29D示出了在转染后14天(图29C)和转染后21天(图29D),在96孔板中核转染、T25烧瓶中脂质转染和96孔板中脂质转染后GFP/mCherry阳性HEK293细胞的百分比。FAC门控策略应用于每个实验内的样品。获得GFP阳性和mCherry阳性细胞群体的选择。第14天检测不到mCherry RNA表达。在脂染胺(lipofectamine)T25格局中观察到最高%GFP阳性细胞。整合效率在14天时为35%并且在21天时为37%。
图29E示出了在T25烧瓶中核转染脂转染后GFP阳性HEK293细胞的百分比。与CMV-GFP MLT供体加MLT辅助体RNA相比,单独的CMV-GFP MLT供体中的%GFP阳性细胞是相同的。在单独用CMV-GFP MLT供体转染的HEK293细胞中%GFP阳性率迅速下降并且在第21天达到5%。在用CMV-GFP MLT供体加MLT辅助体RNA转染的HEK293细胞中%GFP阳性率稳定并且在第21天达到42%。整合效率计算为37%。顶部曲线是“CMV-GFP供体”。
图30A、30B、30C和30D示出了确定RNA或DNA均不影响HEK293细胞活力的FACS门控策略(图29A和29B),RNA表达在转染后迅速下降并且截至第14天检测不到(图29C和29D),并且DNA MLT供体/MLT RNA辅助体系统具有高整合效率(图29E)。图30A示出了所有细胞,图30B示出了单细胞,并且图30C示出了活细胞。图30D示出了GFP单阳性细胞、mCherry单阳性细胞、双阳性细胞和双阴性细胞。
图31示出了在HT1080细胞转染后24小时,CMV-GFP MLT供体加MLT辅助体DNA的转染。24小时的结果类似于DNA MLT供体/MLT RNA辅助体系统。
图32示出了在HT1080细胞转染后2周,CMV-GFP MLT供体加MLT辅助体DNA的转染。结果表明,DNA MLT供体/MLT DNA辅助体系统(约20% GFP+细胞)与DNA MLT供体/MLT DNA辅助体系统相比具有较低整合效率。
具体实施方式
本发明部分地基于发现能够用于例如疗法中的基因插入的工程化转座酶。在一些方面,提供了工程化MLT酶(有时称作“工程化的”、“校正的”、“本发明MLT”、“MLT1”或“MLT2”)。
本发明部分地基于以下发现:能够通过转座进行靶向基因组整合的酶(例如,重组酶、整合酶或转座酶)作为单体或二聚体可以与转录激活子样效应蛋白(TALE)DNA结合结构域(DBD)或dCas9/gRNA融合,从而产生能够进行位点或基因座特异性转座的嵌合酶。所述酶(例如但不限于嵌合转座酶)利用TALE DBD对宿主基因组内某些位点的特异性,这允许使用DBD靶向基因组中的任何所需位置。以这种方式,根据本公开的嵌合转座酶允许达成转基因的靶向整合。
在实施方案中,能够通过转座进行靶向基因组整合的酶是重组酶或整合酶。在实施方案中,重组酶是整合酶。在实施方案中,整合酶是转座酶或重组酶是转座酶。
在实施方案中,转座酶具有一个或多个赋予高活性的突变。在实施方案中,转座酶是源自哺乳动物的转座酶,任选地是辅助体RNA转座酶。因此,用于基因转移的本发明组合物和方法利用双重转座子/转座酶系统。转座元件是自然界中普遍发现的非病毒基因递送运载体。基于转座子的载体具有稳定基因组整合和转基因构建体在细胞中长期表达的能力。一般来说,双重转座子和转座酶系统经由剪切和粘贴机制工作,借此将含有所关注的一个或多个转基因的转座子DNA在重复序列位点处由转座酶整合至染色体DNA中。双重转座子/转座酶(或“供体/辅助体”)质粒系统插入侧翼为反向末端(“末端”)的转基因,诸如TTAA(SEQ ID NO:1)四核苷酸位点,而不会在人类基因组中留下DNA足迹。转座酶瞬时表达(在与编码转座子的载体相同或不同的载体上),并且它催化从供体质粒至宿主基因组的插入事件。基因组插入主要靶向内含子,但可能靶向其它TTAA(SEQ ID NO:1)位点并整合至约50%的人类基因中。
用于基因疗法的转座子系统的选择取决于系统的整合位点偏好。举例来说,piggyBac(PB)转座子对转录单位有偏好,其中插入主要靶向内含子。一些转座酶需要宿主DNA中的某些位点才能发挥催化活性,即使DNA-酶复合物被带到宿主-DNA附近。举例来说,Tcl/水手转座子整合至TA二核苷酸中(Fischer等,Proc Natl Acad Sci U S A 2001;98:6759-64),并且piggyBac(PB)转座子整合至TTAA(SEQ ID NO:1)四核苷酸中(Mitra等,EMBOJ 2008;27:1097-109)。使用基于转座酶的基因组靶向优于基于核酸酶的技术的一个益处在于通过测定转座子插入的拷贝数(例如,(nr)LAM-PCR),易于鉴定经由剪切和粘贴机制进行的整合。因此,预期单个插入克隆不具有额外的DNA修饰。相比之下,可靶向核酸酶能够在不引入可鉴定插入物的情况下使基因组突变。因此,确认修饰细胞的DNA完整性可能具有挑战性。用以鉴定脱靶核酸酶突变的基因组筛选是复杂的并且在序列覆盖率方面有限。
如上文所论述,病毒(例如,AAV、慢病毒等)和基于核酸酶的(例如,CRISPR/Cas,先导编辑碱基编辑)基因疗法通常受到诱变风险的限制,并且还具有诸如免疫原性、制造成本、货物大小和可逆性等缺点。与慢病毒或其它逆转录病毒相比,转座子不太可能激活原癌基因,但当将转基因插入宿主基因组中的一个或多个位置而不是预期位置时会引起插入诱变。特别地,转座酶识别的基因组位点,诸如TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点,可以在基因组的多个位置发现,从而可以在基因组内的非预期位置处插入转基因并且对宿主产生破坏性的,通常是严重的影响。举例来说,插入诱变可以影响代谢基因的功能。相应地,为了改善双重转座子/转座酶系统作为安全有效的基因治疗工具的功能,希望增加和控制转座酶结合和插入的特异性。
因此,在一些方面,提供了一种包含能够转座的酶的组合物,所述组合物包含(a)TALE DBD或dCas9/gRNA复合物;(b)能够通过转座进行靶向基因组整合的酶,所述酶能够在核酸分子中的GSHS中的TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点处插入转座子;以及(c)连接TALE DBD或dCas9/gRNA复合物和酶的连接子。在实施方案中,酶(例如,转座酶)是头对尾二聚体。在一些实施方案中,酶是四聚体。在一些实施方案中,酶是单体。
在实施方案中,TALE或dCas9/gRNA DBD使能够转座的酶(例如但不限于嵌合转座酶)特异性结合至人类GSHS。在实施方案中,TALE或dCas9/gRNA DBD将转座酶隔离至GSHS并促进转座至附近的TA二核苷酸或TTAA(SEQ ID NO:1)四核苷酸位点,这些位点可以位于重复可变二残基(RVD)TALE或gRNA核苷酸序列附近。GSHS区域位于对转座酶活性敏感的开放染色质位点。因此,转座酶不仅基于其识别TA或TTAA(SEQ ID NO:1)位点的能力起作用,而且还将转座子(具有转基因)引导至靠近TALE或dCas9/gRNA DBD的特定位置。根据本公开的实施方案的嵌合转座酶具有可忽略的基因毒性风险并且与现有基因疗法相比展现出优异的特征。
在实施方案中,例如与dCas9缔合的gRNA是AATCGAGAAGCGACTCGACA(SEQ ID NO:425)和/或TGCCCTGCAGGGGAGTGAGC(SEQ ID NO:426)。在实施方案中,例如与dCas9缔合的gRNA是GAAGCGACTCGACATGGAGG(SEQ ID NO:427)和/或CCTGCAGGGGAGTGAGCAGC(SEQ ID NO:428)。
在一些实施方案中,嵌合转座酶突变为以脱靶序列的结合减少或抑制为特征,并且因此依赖于与其融合的DBD,诸如TALE或dCas9/gRNA DBD,以用于转座。
所描述的组合物和方法允许减少随机载体和转基因插入,这增加了诱变风险。与病毒和核酸酶介导的基因疗法相比,所描述的组合物和方法利用了降低基因毒性的转座体系统。双重系统被设计成避免活性转座酶的持续存在并有效转染人类细胞系,而不会产生显著的细胞毒性。
在一些实施方案中,当与包含GSHS的细胞接触时,组合物适合于促成在GSHS中插入转座子。
在一些实施方案中,TALE或dCas9/gRNA DBD可以适合于将转座酶引导至GSHS序列。
在实施方案中,TALE或dCas9/gRNA DBD是可定制的,诸如TALE或dCas9/gRNA DBD可以选择用于靶向特定基因组位置。在一些实施方案中,基因组位置靠近TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点。
在实施方案中,CRISPR(成簇规则间隔短回文重复)相关蛋白9(Cas9)或其变体将酶靶向所关注的基因座。Cas9是通用核酸酶,并且向导RNA(gRNA)通过将相同的互补序列运载至所关注的基因组区域来赋予Cas9序列特异性。Jinek等(2012)Science 337:816-821。CRISPR/Cas9工具仅需要用于DNA分裂的Cas9核酸酶和用于靶标特异性的单向导RNA(sgRNA)。参见Jinek等(2012);Chylinski等(2014)Nucleic Acids Res 42,6091-6105。Cas9的失活形式是一种核酸酶缺陷(或无活性的,或“催化死亡的”)Cas9,通常表示为“dCas9”并且没有实质性的核酸酶活性。Qi,L.S.等(2013).Cell 152,1173-1183。CRISPR/dCas9通过靶向向导RNA(gRNA)序列精确结合至特定基因组序列。参见Dominguez等,NatRev Mol Cell Biol.2016;17:5-15;Wang等,Annu Rev Biochem.2016;85:227-64。当应用于所需位点的转录结合位点和/或基因组中的基因座时,dCas9用于编辑基因表达。当dCas9蛋白质偶联至向导RNA(gRNA)以产生dCas9向导RNA复合物时,dCas9会阻止可能对生物体基因组有害的重复密码子和DNA序列的增殖。本质上,当产生多个重复密码子时,它会引发反应,或募集大量的dCas9来对抗那些密码子的过度产生并导致转录关闭。因此,dCas9与gRNA协同工作并且直接影响DNA聚合酶II的持续转录。
在实施方案中,基因编辑系统包含核酸酶缺陷Cas酶向导RNA复合物。在一些实施方案中,基因编辑系统包含核酸酶缺陷(或无活性的,或“催化死亡的”Cas9,通常表示为“dCas9”)向导RNA复合物。
在实施方案中,dCas9/gRNA复合物包含选自以下的向导RNA:GTTTAGCTCACCCGTGAGCC(SEQ ID NO:91)、CCCAATATTATTGTTCTCTG(SEQ ID NO:92)、GGGGTGGGATAGGGGATACG(SEQ ID NO:93)、GGATCCCCCTCTACATTTAA(SEQ ID NO:94)、GTGATCTTGTACAAATCATT(SEQ ID NO:95)、CTACACAGAATCTGTTAGAA(SEQ ID NO:96)、TAAGCTAGAGAATAGATCTC(SEQ ID NO:97)和TCAATACACTTAATGATTTA(SEQ ID NO:98),其中所述向导RNA将酶引导至趋化因子(C-C基序)受体5(CCR5)基因。
在实施方案中,dCas9/gRNA复合物包含选自以下的向导RNA:
CACCGGGAGCCACGAAAACAGATCC(SEQ ID NO:99);CACCGCGAAAACAGATCCAGGGACA(SEQID NO:100);CACCGAGATCCAGGGACACGGTGCT(SEQ ID NO:101);CACCGGACACGGTGCTAGGACAGTG(SEQ ID NO:102);CACCGGAAAATGACCCAACAGCCTC(SEQ ID NO:103);CACCGGCCTGGCCGGCCTGACCACT(SEQ ID NO:104);CACCGCTGAGCACTGAAGGCCTGGC(SEQ ID NO:105);CACCGTGGTTTCCACTGAGCACTGA(SEQ ID NO:106);CACCGGATAGCCAGGAGTCCTTTCG(SEQID NO:107);CACCGGCGCTTCCAGTGCTCAGACT(SEQ ID NO:108);CACCGCAGTGCTCAGACTAGGGAAG(SEQ ID NO:109);CACCGGCCCCTCCTCCTTCAGAGCC(SEQ ID NO:110);CACCGTCCTTCAGAGCCAGGAGTCC(SEQ ID NO:111);CACCGTGGTTTCCGAGCTTGACCCT(SEQ ID NO:112);CACCGCTGCAGAGTATCTGCTGGGG(SEQ ID NO:113);CACCGCGTTCCTGCAGAGTATCTGC(SEQID NO:114);AAACGGATCTGTTTTCGTGGCTCCC(SEQ ID NO:115);AAACTGTCCCTGGATCTGTTTTCGC(SEQ ID NO:116);AAACAGCACCGTGTCCCTGGATCTC(SEQ ID NO:117);AAACCACTGTCCTAGCACCGTGTCC(SEQ ID NO:118);AAACGAGGCTGTTGGGTCATTTTCC(SEQ ID NO:119);AAACAGTGGTCAGGCCGGCCAGGCC(SEQ ID NO:120);AAACGCCAGGCCTTCAGTGCTCAGC(SEQID NO:121);AAACTCAGTGCTCAGTGGAAACCAC(SEQ ID NO:122);AAACCGAAAGGACTCCTGGCTATCC(SEQ ID NO:123);AAACAGTCTGAGCACTGGAAGCGCC(SEQ ID NO:124);AAACCTTCCCTAGTCTGAGCACTGC(SEQ ID NO:125);AAACGGCTCTGAAGGAGGAGGGGCC(SEQ ID NO:126);AAACGGACTCCTGGCTCTGAAGGAC(SEQ ID NO:127);AAACAGGGTCAAGCTCGGAAACCAC(SEQID NO:128);AAACCCCCAGCAGATACTCTGCAGC(SEQ ID NO:129);AAACGCAGATACTCTGCAGGAACGC(SEQ ID NO:130);TCCCCTCCCAGAAAGACCTG(SEQ ID NO:131);TGGGCTCCAAGCAATCCTGG(SEQID NO:132);GTGGCTCAGGAGGTACCTGG(SEQ ID NO:133);GAGCCACGAAAACAGATCCA(SEQ IDNO:134);AAGTGAACGGGGAAGGGAGG(SEQ ID NO:135);GACAAAAGCCGAAGTCCAGG(SEQ ID NO:136);GTGGTTGATAAACCCACGTG(SEQ ID NO:137);TGGGAACAGCCACAGCAGGG(SEQ ID NO:138);GCAGGGGAACGGGGATGCAG(SEQ ID NO:139);GAGATGGTGGACGAGGAAGG(SEQ ID NO:140);GAGATGGCTCCAGGAAATGG(SEQ ID NO:141);TAAGGAATCTGCCTAACAGG(SEQ ID NO:142);TCAGGAGACTAGGAAGGAGG(SEQ ID NO:143);TATAAGGTGGTCCCAGCTCG(SEQ ID NO:144);CTGGAAGATGCCATGACAGG(SEQ ID NO:145);GCACAGACTAGAGAGGTAAG(SEQ ID NO:146);ACAGACTAGAGAGGTAAGGG(SEQ ID NO:147);GAGAGGTGACCCGAATCCAC(SEQ ID NO:148);GCACAGGCCCCAGAAGGAGA(SEQ ID NO:149);CCGGAGAGGACCCAGACACG(SEQ ID NO:150);GAGAGGACCCAGACACGGGG(SEQ ID NO:151);GCAACACAGCAGAGAGCAAG(SEQ ID NO:152);GAAGAGGGAGTGGAGGAAGA(SEQ ID NO:153);AAGACGGAACCTGAAGGAGG(SEQ ID NO:154);AGAAAGCGGCACAGGCCCAG(SEQ ID NO:155);GGGAAACAGTGGGCCAGAGG(SEQ ID NO:156);GTCCGGACTCAGGAGAGAGA(SEQ ID NO:157);GGCACAGCAAGGGCACTCGG(SEQ ID NO:158);GAAGAGGGGAAGTCGAGGGA(SEQ ID NO:159);GGGAATGGTAAGGAGGCCTG(SEQ ID NO:160);GCAGAGTGGTCAGCACAGAG(SEQ ID NO:161);GCACAGAGTGGCTAAGCCCA(SEQ ID NO:162);GACGGGGTGTCAGCATAGGG(SEQ ID NO:163);GCCCAGGGCCAGGAACGACG(SEQ ID NO:164);GGTGGAGTCCAGCACGGCGC(SEQ ID NO:165);ACAGGCCGCCAGGAACTCGG(SEQ ID NO:166);ACTAGGAAGTGTGTAGCACC(SEQ ID NO:167);ATGAATAGCAGACTGCCCCG(SEQ ID NO:168);ACACCCCTAAAAGCACAGTG(SEQ ID NO:169);CAAGGAGTTCCAGCAGGTGG(SEQ ID NO:170);AAGGAGTTCCAGCAGGTGGG(SEQ ID NO:171);TGGAAAGAGGAGGGAAGAGG(SEQ ID NO:172);TCGAATTCCTAACTGCCCCG(SEQ ID NO:173);GACCTGCCCAGCACACCCTG(SEQ ID NO:174);GGAGCAGCTGCGGCAGTGGG(SEQ ID NO:175);GGGAGGGAGAGCTTGGCAGG(SEQ ID NO:176);GTTACGTGGCCAAGAAGCAG(SEQ ID NO:177);GCTGAACAGAGAAGAGCTGG(SEQ ID NO:178);TCTGAGGGTGGAGGGACTGG(SEQ ID NO:179);GGAGAGGTGAGGGACTTGGG(SEQ ID NO:180);GTGAACCAGGCAGACAACGA(SEQ ID NO:181);CAGGTACCTCCTGAGCCACG(SEQ ID NO:182);GGGGGAGTAGGGGCATGCAG(SEQ ID NO:183);GCAAATGGCCAGCAAGGGTG(SEQ ID NO:184);CAAATGGCCAGCAAGGGTGG(SEQ ID NO:309);GCAGAACCTGAGGATATGGA(SEQ ID NO:310);AATACACAGAATGAAAATAG(SEQ ID NO:311);CTGGTGACTAGAATAGGCAG(SEQ ID NO:312);TGGTGACTAGAATAGGCAGT(SEQ ID NO:313);TAAAAGAATGTGAAAAGATG(SEQ ID NO:314);TCAGGAGTTCAAGACCACCC(SEQ ID NO:315);TGTAGTCCCAGTTATGCAGG(SEQ ID NO:316);GGGTTCACACCACAAATGCA(SEQ ID NO:317);GGCAAATGGCCAGCAAGGGT(SEQ ID NO:318);AGAAACCAATCCCAAAGCAA(SEQ ID NO:319);GCCAAGGACACCAAAACCCA(SEQ ID NO:320);AGTGGTGATAAGGCAACAGT(SEQ ID NO:321);CCTGAGACAGAAGTATTAAG(SEQ ID NO:322);AAGGTCACACAATGAATAGG(SEQ ID NO:323);CACCATACTAGGGAAGAAGA(SEQ ID NO:324);CAATACCCTGCCCTTAGTGG(SEQ ID NO:327);AATACCCTGCCCTTAGTGGG(SEQ ID NO:325);TTAGTGGGGGGTGGAGTGGG(SEQ ID NO:326);GTGGGGGGTGGAGTGGGGGG(SEQ ID NO:328);GGGGGGTGGAGTGGGGGGTG(SEQ ID NO:329);GGGGTGGAGTGGGGGGTGGG(SEQ ID NO:330);GGGTGGAGTGGGGGGTGGGG(SEQ ID NO:331);GGGGGTGGGGAAAGACATCG(SEQ ID NO:332);GCAGCTGTGAATTCTGATAG(SEQ ID NO:333);GAGATCAGAGAAACCAGATG(SEQ ID NO:334);TCTATACTGATTGCAGCCAG(SEQ ID NO:335);CACCGAATCGAGAAGCGACTCGACA(SEQ ID NO:185);CACCGGTCCCTGGGCGTTGCCCTGC(SEQ ID NO:186);CACCGCCCTGGGCGTTGCCCTGCAG(SEQ ID NO:187);CACCGCCGTGGGAAGATAAACTAAT(SEQ ID NO:188);CACCGTCCCCTGCAGGGCAACGCCC(SEQID NO:189);CACCGGTCGAGTCGCTTCTCGATTA(SEQ ID NO:190);CACCGCTGCTGCCTCCCGTCTTGTA(SEQ ID NO:191);CACCGGAGTGCCGCAATACCTTTAT(SEQ ID NO:192);CACCGACACTTTGGTGGTGCAGCAA(SEQ ID NO:193);CACCGTCTCAAATGGTATAAAACTC(SEQ ID NO:194);CACCGAATCCCGCCCATAATCGAGA(SEQ ID NO:195);CACCGTCCCGCCCATAATCGAGAAG(SEQID NO:196);CACCGCCCATAATCGAGAAGCGACT(SEQ ID NO:197);CACCGGAGAAGCGACTCGACATGGA(SEQ ID NO:198);CACCGGAAGCGACTCGACATGGAGG(SEQ ID NO:199);CACCGGCGACTCGACATGGAGGCGA(SEQ ID NO:200);AAACTGTCGAGTCGCTTCTCGATTC(SEQ ID NO:201);AAACGCAGGGCAACGCCCAGGGACC(SEQ ID NO:202);AAACCTGCAGGGCAACGCCCAGGGC(SEQID NO:203);AAACATTAGTTTATCTTCCCACGGC(SEQ ID NO:204);AAACGGGCGTTGCCCTGCAGGGGAC(SEQ ID NO:205);AAACTAATCGAGAAGCGACTCGACC(SEQ ID NO:206);AAACTACAAGACGGGAGGCAGCAGC(SEQ ID NO:207);AAACATAAAGGTATTGCGGCACTCC(SEQ ID NO:208);AAACTTGCTGCACCACCAAAGTGTC(SEQ ID NO:209);AAACGAGTTTTATACCATTTGAGAC(SEQID NO:210);AAACTCTCGATTATGGGCGGGATTC(SEQ ID NO:211);AAACCTTCTCGATTATGGGCGGGAC(SEQ ID NO:212);AAACAGTCGCTTCTCGATTATGGGC(SEQ ID NO:213);AAACTCCATGTCGAGTCGCTTCTCC(SEQ ID NO:214);AAACCCTCCATGTCGAGTCGCTTCC(SEQ ID NO:215);AAACTCGCCTCCATGTCGAGTCGCC(SEQ ID NO:216);CACCGACAGGGTTAATGTGAAGTCC(SEQID NO:217);CACCGTCCCCCTCTACATTTAAAGT(SEQ ID NO:218);CACCGCATTTAAAGTTGGTTTAAGT(SEQ ID NO:219);CACCGTTAGAAAATATAAAGAATAA(SEQ ID NO:220);CACCGTAAATGCTTACTGGTTTGAA(SEQ ID NO:221);CACCGTCCTGGGTCCAGAAAAAGAT(SEQ ID NO:222);CACCGTTGGGTGGTGAGCATCTGTG(SEQ ID NO:223);CACCGCGGGGAGAGTGGAGAAAAAG(SEQID NO:224);CACCGGTTAAAACTCTTTAGACAAC(SEQ ID NO:225);CACCGGAAAATCCCCACTAAGATCC(SEQ ID NO:226);AAACGGACTTCACATTAACCCTGTC(SEQ ID NO:227);AAACACTTTAAATGTAGAGGGGGAC(SEQ ID NO:228);AAACACTTAAACCAACTTTAAATGC(SEQ ID NO:229);AAACTTATTCTTTATATTTTCTAAC(SEQ ID NO:230);AAACTTCAAACCAGTAAGCATTTAC(SEQID NO:231);AAACATCTTTTTCTGGACCCAGGAC(SEQ ID NO:232);AAACCACAGATGCTCACCACCCAAC(SEQ ID NO:233);AAACCTTTTTCTCCACTCTCCCCGC(SEQ ID NO:234);AAACGTTGTCTAAAGAGTTTTAACC(SEQ ID NO:235);AAACGGATCTTAGTGGGGATTTTCC(SEQ ID NO:236);AGTAGCAGTAATGAAGCTGG(SEQ ID NO:237);ATACCCAGACGAGAAAGCTG(SEQ ID NO:238);TACCCAGACGAGAAAGCTGA(SEQ ID NO:239);GGTGGTGAGCATCTGTGTGG(SEQ ID NO:240);AAATGAGAAGAAGAGGCACA(SEQ ID NO:241);CTTGTGGCCTGGGAGAGCTG(SEQ ID NO:242);GCTGTAGAAGGAGACAGAGC(SEQ ID NO:243);GAGCTGGTTGGGAAGACATG(SEQ ID NO:244);CTGGTTGGGAAGACATGGGG(SEQ ID NO:245);CGTGAGGATGGGAAGGAGGG(SEQ ID NO:246);ATGCAGAGTCAGCAGAACTG(SEQ ID NO:247);AAGACATCAAGCACAGAAGG(SEQ ID NO:248);TCAAGCACAGAAGGAGGAGG(SEQ ID NO:249);AACCGTCAATAGGCAAAGGG(SEQ ID NO:250);CCGTATTTCAGACTGAATGG(SEQ ID NO:251);GAGAGGACAGGTGCTACAGG(SEQ ID NO:252);AACCAAGGAAGGGCAGGAGG(SEQ ID NO:253);GACCTCTGGGTGGAGACAGA(SEQ ID NO:254);CAGATGACCATGACAAGCAG(SEQ ID NO:255);AACACCAGTGAGTAGAGCGG(SEQ ID NO:256);AGGACCTTGAAGCACAGAGA(SEQ ID NO:257);TACAGAGGCAGACTAACCCA(SEQ ID NO:258);ACAGAGGCAGACTAACCCAG(SEQ ID NO:259);TAAATGACGTGCTAGACCTG(SEQ ID NO:260);AGTAACCACTCAGGACAGGG(SEQ ID NO:261);ACCACAAAACAGAAACACCA(SEQ ID NO:262);GTTTGAAGACAAGCCTGAGG(SEQ ID NO:263);GCTGAACCCCAAAAGACAGG(SEQ ID NO:264);GCAGCTGAGACACACACCAG(SEQID NO:265);AGGACACCCCAAAGAAGCTG(SEQ ID NO:266);GGACACCCCAAAGAAGCTGA(SEQ ID NO:267);CCAGTGCAATGGACAGAAGA(SEQ ID NO:268);AGAAGAGGGAGCCTGCAAGT(SEQ ID NO:269);GTGTTTGGGCCCTAGAGCGA(SEQ ID NO:270);CATGTGCCTGGTGCAATGCA(SEQ ID NO:271);TACAAAGAGGAAGATAAGTG(SEQ ID NO:272);GTCACAGAATACACCACTAG(SEQ ID NO:273);GGGTTACCCTGGACATGGAA(SEQ ID NO:274);CATGGAAGGGTATTCACTCG(SEQ ID NO:275);AGAGTGGCCTAGACAGGCTG(SEQ ID NO:276);CATGCTGGACAGCTCGGCAG(SEQ ID NO:277);AGTGAAAGAAGAGAAAATTC(SEQ ID NO:278);TGGTAAGTCTAAGAAACCTA(SEQ ID NO:279);CCCACAGCCTAACCACCCTA(SEQ ID NO:280);AATATTTCAAAGCCCTAGGG(SEQ ID NO:281);GCACTCGGAACAGGGTCTGG(SEQ ID NO:282);AGATAGGAGCTCCAACAGTG(SEQ ID NO:283);AAGTTAGAGCAGCCAGGAAA(SEQ ID NO:284);TAGAGCAGCCAGGAAAGGGA(SEQ ID NO:285);TGAATACCCTTCCATGTCCA(SEQ ID NO:286);CCTGCATTGCACCAGGCACA(SEQ ID NO:287);TCTAGGGCCCAAACACACCT(SEQ ID NO:288);TCCCTCCATCTATCAAAAGG(SEQ ID NO:289);AGCCCTGAGACAGAAGCAGG(SEQ ID NO:290);GCCCTGAGACAGAAGCAGGT(SEQ ID NO:291);AGGAGATGCAGTGATACGCA(SEQ ID NO:292);ACAATACCAAGGGTATCCGG(SEQ ID NO:293);TGATAAAGAAAACAAAGTGA(SEQ ID NO:294);AAAGAAAACAAAGTGAGGGA(SEQ ID NO:295);GTGGCAAGTGGAGAAATTGA(SEQ ID NO:296);CAAGTGGAGAAATTGAGGGA(SEQ ID NO:297);GTGGTGATGATTGCAGCTGG(SEQ ID NO:298);CTATGTGCCTGACACACAGG(SEQ ID NO:299);GGGTTGGACCAGGAAAGAGG(SEQ ID NO:300);GATGCCTGGAAAAGGAAAGA(SEQ ID NO:301);TAGTATGCACCTGCAAGAGG(SEQ ID NO:302);TATGCACCTGCAAGAGGCGG(SEQ ID NO:303);AGGGGAAGAAGAGAAGCAGA(SEQ ID NO:304);GCTGAATCAAGAGACAAGCG(SEQ ID NO:305);AAGCAAATAAATCTCCTGGG(SEQ ID NO:306);AGATGAGTGCTAGAGACTGG(SEQ ID NO:307);和CTGATGGTTGAGCACAGCAG(SEQ ID NO:308)。参见图4。
本公开的实施方案利用了TALE或dCas9/gRNA DBD靶向宿主基因组中的特定位点的能力。TALE或dCas9/gRNA DBD的DNA靶向能力由连接在一起以识别侧翼DNA序列的TALE重复序列(例如,模块化阵列)或gRNA提供。每个TALE或gRNA都可以识别某个(某些)碱基对或残基。
TALE核酸酶(TALEN)是用于基因组编辑和引入靶向双链断裂的已知工具。TALEN包含融合至可定制DBD的内切核酸酶,诸如FokI核酸酶结构域。这种DBD由来源于TALE的高度保守重复组成,TALE是黄单胞菌分泌的蛋白质,以改变宿主植物细胞中基因的转录。DBD包括重复的高度保守的33-34个氨基酸序列,具有不同的第12个和第13个氨基酸。这两个位置(称作RVD)是高度可变的,并且显示出与特定碱基对或核苷酸识别的强相关性。氨基酸序列与DNA识别之间的这种直接关系允许通过选择含有适当RVD的重复区段组合来工程设计特定的DBD。Boch等Nature Biotechnology.2011;29(2):135-6。
因此,TALEN可以容易地使用“蛋白质-DNA代码”来设计,这种代码将模块化DNA结合TALE重复结构域与靶标结合位点中的个别碱基联系起来。参见Joung等Nat Rev MolCell Biol.2013;14(1):49-55.doi:10.1038/nrm3486。举例来说,图3示出了此种代码。
已经证明了TALEN可以用于靶向人类细胞中基本上任何所关注的DNA序列。Miller等Nat Biotechnol.2011;29:143-148。已经提出了用于选择潜在靶位点和使用特定TALE重复结构域(在高变位置具有NH残基)来识别G碱基的指南。参见Streubel等NatBiotechnol.2012;30:593-595。
因此,在一些实施方案中,TALE DBD包含一个或多个重复序列。在一些实施方案中,TALE DBD包含约15个、或约16个、或约17个、或约18个、或约18.5个重复序列。在一些实施方案中,TALE DBD重复序列包含33或34个氨基酸。
在一些实施方案中,TALE DBD重复序列中的一者或多者在33个或34个氨基酸的残基12或13处包含RVD。RVD可以识别某个(某些)碱基对或残基。在一些实施方案中,RVD识别核酸分子中的一个碱基对。在一些实施方案中,RVD识别核酸分子中的“C”残基并且选自HD、N(间隙)、HA、ND和HI。在一些实施方案中,RVD识别核酸分子中的“G”残基并且选自NN、NH、NK、HN和NA。在一些实施方案中,RVD识别核酸分子中的“A”残基并且选自NI和NS。在一些实施方案中,RVD识别核酸分子中的“T”残基并且选自NG、HG、H(间隙)和IG。
在实施方案中,GSHS处于染色体中的开放染色质位置。在一些实施方案中,GSHS选自腺相关病毒位点1(AAVS1)、趋化因子(C-C基序)受体5(CCR5)基因、HIV-1辅受体和人类Rosa26基因座。在一些实施方案中,GSHS位于人类染色体2、4、6、10、11或17上。
在一些实施方案中,GSHS选自TALC1、TALC2、TALC3、TALC4、TALC5、TALC7、TALC8、AVS1、AVS2、AVS3、ROSA1、ROSA2、TALER1、TALER2、TALER3、TALER4、TALER5、SHCHR2-1、SHCHR2-2、SHCHR2-3、SHCHR2-4、SHCHR4-1、SHCHR4-2、SHCHR4-3、SHCHR6-1、SHCHR6-2、SHCHR6-3、SHCHR6-4、SHCHR10-1、SHCHR10-2、SHCHR10-3、SHCHR10-4、SHCHR10-5、SHCHR11-1、SHCHR11-2、SHCHR11-3、SHCHR17-1、SHCHR17-2、SHCHR17-3和SHCHR17-4。
在一些实施方案中,GSHS包含以下一者或多者:TGGCCGGCCTGACCACTGG(SEQ IDNO:23)、TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)、TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)、TCCACTGAGCACTGAAGGC(SEQ ID NO:26)、TGGTTTCCACTGAGCACTG(SEQ ID NO:27)、TGGGGAAAATGACCCAACA(SEQ ID NO:28)、TAGGACAGTGGGGAAAATG(SEQ ID NO:29)、TCCAGGGACACGGTGCTAG(SEQ ID NO:30)、TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)、TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)、TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)、TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)、TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)、TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)、TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)、TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)、TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)、CCAATCCCCTCAGT(SEQ ID NO:40)、CAGTGCTCAGTGGAA(SEQ ID NO:41)、GAAACATCCGGCGACTCA(SEQ ID NO:42)、TCGCCCCTCAAATCTTACA(SEQ ID NO:43)、TCAAATCTTACAGCTGCTC(SEQ IDNO:44)、TCTTACAGCTGCTCACTCC(SEQ ID NO:45)、TACAGCTGCTCACTCCCCT(SEQ ID NO:46)、TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)、TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)、TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)、TCTCGATTATGGGCGGGAT(SEQ ID NO:50)、TCGCTTCTCGATTATGGGC(SEQ ID NO:51)、TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)、TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)、TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)、TCGTCATCGCCTCCATGTC(SEQ ID NO:55)、TGATCTCGTCATCGCCTCC(SEQ ID NO:56)、GCTTCAGCTTCCTA(SEQ ID NO:57)、CTGTGATCATGCCA(SEQ ID NO:58)、ACAGTGGTACACACCT(SEQ ID NO:59)、CCACCCCCCACTAAG(SEQ ID NO:60)、CATTGGCCGGGCAC(SEQ ID NO:61)、GCTTGAACCCAGGAGA(SEQ ID NO:62)、ACACCCGATCCACTGGG(SEQ ID NO:63)、GCTGCATCAACCCC(SEQ ID NO:64)、GCCACAAACAGAAATA(SEQ ID NO:65)、GGTGGCTCATGCCTG(SEQ ID NO:66)、GATTTGCACAGCTCAT(SEQ ID NO:67)、AAGCTCTGAGGAGCA(SEQ ID NO:68)、CCCTAGCTGTCCC(SEQ ID NO:69)、GCCTAGCATGCTAG(SEQ ID NO:70)、ATGGGCTTCACGGAT(SEQ ID NO:71)、GAAACTATGCCTGC(SEQ ID NO:72)、GCACCATTGCTCCC(SEQ ID NO:73)、GACATGCAACTCAG(SEQID NO:74)、ACACCACTAGGGGT(SEQ ID NO:75)、GTCTGCTAGACAGG(SEQ ID NO:76)、GGCCTAGACAGGCTG(SEQ ID NO:77)、GAGGCATTCTTATCG(SEQ ID NO:78)、GCCTGGAAACGTTCC(SEQ ID NO:79)、GTGCTCTGACAATA(SEQ ID NO:80)、GTTTTGCAGCCTCC(SEQ ID NO:81)、ACAGCTGTGGAACGT(SEQ ID NO:82)、GGCTCTCTTCCTCCT(SEQ ID NO:83)、CTATCCCAAAACTCT(SEQ ID NO:84)、GAAAAACTATGTAT(SEQ ID NO:85)、AGGCAGGCTGGTTGA(SEQ ID NO:86)、CAATACAACCACGC(SEQ ID NO:87)、ATGACGGACTCAACT(SEQ ID NO:88)、CACAACATTTGTAA(SEQID NO:89)和ATTTCCAGTGCACA(SEQ ID NO:90)。
在一些实施方案中,TALE DBD结合至以下一者:TGGCCGGCCTGACCACTGG(SEQ IDNO:23)、TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)、TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)、TCCACTGAGCACTGAAGGC(SEQ ID NO:26)、TGGTTTCCACTGAGCACTG(SEQ ID NO:27)、TGGGGAAAATGACCCAACA(SEQ ID NO:28)、TAGGACAGTGGGGAAAATG(SEQ ID NO:29)、TCCAGGGACACGGTGCTAG(SEQ ID NO:30)、TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)、TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)、TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)、TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)、TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)、TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)、TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)、TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)、TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)、CCAATCCCCTCAGT(SEQ ID NO:40)、CAGTGCTCAGTGGAA(SEQ ID NO:41)、GAAACATCCGGCGACTCA(SEQ ID NO:42)、TCGCCCCTCAAATCTTACA(SEQ ID NO:43)、TCAAATCTTACAGCTGCTC(SEQ IDNO:44)、TCTTACAGCTGCTCACTCC(SEQ ID NO:45)、TACAGCTGCTCACTCCCCT(SEQ ID NO:46)、TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)、TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)、TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)、TCTCGATTATGGGCGGGAT(SEQ ID NO:50)、TCGCTTCTCGATTATGGGC(SEQ ID NO:51)、TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)、TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)、TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)、TCGTCATCGCCTCCATGTC(SEQ ID NO:55)、TGATCTCGTCATCGCCTCC(SEQ ID NO:56)、GCTTCAGCTTCCTA(SEQ ID NO:57)、CTGTGATCATGCCA(SEQ ID NO:58)、ACAGTGGTACACACCT(SEQ ID NO:59)、CCACCCCCCACTAAG(SEQ ID NO:60)、CATTGGCCGGGCAC(SEQ ID NO:61)、GCTTGAACCCAGGAGA(SEQ ID NO:62)、ACACCCGATCCACTGGG(SEQ ID NO:63)、GCTGCATCAACCCC(SEQ ID NO:64)、GCCACAAACAGAAATA(SEQ ID NO:65)、GGTGGCTCATGCCTG(SEQ ID NO:66)、GATTTGCACAGCTCAT(SEQ ID NO:67)、AAGCTCTGAGGAGCA(SEQ ID NO:68)、CCCTAGCTGTCCC(SEQ ID NO:69)、GCCTAGCATGCTAG(SEQ ID NO:70)、ATGGGCTTCACGGAT(SEQ ID NO:71)、GAAACTATGCCTGC(SEQ ID NO:72)、GCACCATTGCTCCC(SEQ ID NO:73)、GACATGCAACTCAG(SEQID NO:74)、ACACCACTAGGGGT(SEQ ID NO:75)、GTCTGCTAGACAGG(SEQ ID NO:76)、GGCCTAGACAGGCTG(SEQ ID NO:77)、GAGGCATTCTTATCG(SEQ ID NO:78)、GCCTGGAAACGTTCC(SEQ ID NO:79)、GTGCTCTGACAATA(SEQ ID NO:80)、GTTTTGCAGCCTCC(SEQ ID NO:81)、ACAGCTGTGGAACGT(SEQ ID NO:82)、GGCTCTCTTCCTCCT(SEQ ID NO:83)、CTATCCCAAAACTCT(SEQ ID NO:84)、GAAAAACTATGTAT(SEQ ID NO:85)、AGGCAGGCTGGTTGA(SEQ ID NO:86)、CAATACAACCACGC(SEQ ID NO:87)、ATGACGGACTCAACT(SEQ ID NO:88)、CACAACATTTGTAA(SEQID NO:89)和ATTTCCAGTGCACA(SEQ ID NO:90)。
在一些实施方案中,TALE DBD包含以下一者或多者:
NH NH HD HD NH NH HD HD NG NH NI HD HD NI HD NG NH NH(SEQ ID NO:355),
NH NI NI NH NH HD HD NG NH NH HD HD NH NH HD HD NG NH(SEQ ID NO:356),
NH NI NH HD NI HD NG NH NI NI NH NH HD HD NG NH NH HD(SEQ ID NO:357),
HD HD NI HD NG NH NI NH HD NI HD NG NH NI NI NH NH HD(SEQ ID NO:358),
NH NH NG NG NG HD HD NI HD NG NH NI NH HD NI HD NG NH(SEQ ID NO:359),
NH NH NH NH NI NI NI NI NG NH NI HD HD HD NI NI HD NI(SEQ ID NO:360),
NI NH NH NI HD NI NH NG NH NH NH NH NI NI NI NI NG NH(SEQ ID NO:361),
HD HD NI NH NH NH NI HD NI HD NH NH NG NH HD NG NI NH(SEQ ID NO:362),
HD NI NH NI NH HD HD NI NH NH NI NH NG HD HD NG NH NH(SEQ ID NO:363),
HD HD NG NG HD NI NH NI NH HD HD NI NH NH NI NH NG HD(SEQ ID NO:364),
HD HD NG HD HD NG NG HD NI NH NI NH HD HD NI NH NH NI(SEQ ID NO:365),
HD HD NI NH HD HD HD HD NG HD HD NG HD HD NG NG HD NI(SEQ ID NO:366),
HD HD NH NI NH HD NG NG NH NI HD HD HD NG NG NH NH NI(SEQ ID NO:367),
NH NH NG NG NG HD HD NH NI NH HD NG NG NH NI HD HD HD(SEQ ID NO:368),
NH NH NH NH NG NH NH NG NG NG HD HD NH NI NH HD NG NG(SEQ ID NO:369),
HD NG NH HD NG NH NH NH NH NG NH NH NG NG NG HD HD NH(SEQ ID NO:370),
NH HD NI NH NI NH NG NI NG HD NG NH HD NG NH NH NH NH(SEQ ID NO:371),
HD HD NI NI NG HD HD HD HD NG HD NI NH NG(SEQ ID NO:372),
HD NI NH NG NH HD NG HD NI NH NG NH NH NI NI(SEQ ID NO:373),
NH NI NI NI HD NI NG HD HD NH NH HD NH NI HD NG HD NI(SEQ ID NO:374),
HD NH HD HD HD HD NG HD NI NI NI NG HD NG NG NI HD NI(SEQ ID NO:375),
HD NI NI NI NG HD NG NG NI HD NI NH HD NG NH HD NG HD(SEQ ID NO:376),
HD NG NG NI HD NI NH HD NG NH HD NG HD NI HD NG HD HD(SEQ ID NO:377),
NI HD NI NH HD NG NH HD NG HD NI HD NG HD HD HD HD NG(SEQ ID NO:378),
NH HD NG HD NI HD NG HD HD HD HD NG NH HD NI NH NH NH(SEQ ID NO:379),
HD HD HD HD NG NH HD NI NH NH NH HD NI NI HD NH HD HD(SEQ ID NO:380),
NH HD NI NH NH NH HD NI NI HD NH HD HD HD NI NH NH NH(SEQ ID NO:381),
HD NG HD NH NI NG NG NI NG NH NH NH HD NH NH NH NI NG(SEQ ID NO:382),
HD NH HD NG NG HD NG HD NH NI NG NG NI NG NH NH NH HD(SEQ ID NO:383),
NH NG HD NH NI NH NG HD NH HD NG NG HD NG HD NH NI NG(SEQ ID NO:384),
HD HD NI NG NH NG HD NH NI NH NG HD NH HD NG NG HD NG(SEQ ID NO:385),
HD NH HD HD NG HD HD NI NG NH NG HD NH NI NH NG HD NH(SEQ ID NO:386),
HD NH NG HD NI NG HD NH HD HD NG HD HD NI NG NH NG HD(SEQ ID NO:387),
NH NI NG HD NG HD NH NG HD NI NG HD NH HD HD NG HD HD(SEQ ID NO:388),
NH HD NG NG HD NI NH HD NG NG HD HD NG NI(SEQ ID NO:389),
HD NG NK NG NH NI NG HD NI NG NH HD HD NI(SEQ ID NO:390),
NI HD NI NN NG NN NN NG NI HD NI HD NI HD HD NG(SEQ ID NO:391),
HD HD NI HD HD HD HD HD HD NI HD NG NI NI NN(SEQ ID NO:392),
HD NI NG NG NN NN HD HD NN NN NN HD NI HD(SEQ ID NO:393),
NN HD NG NG NN NI NI HD HD HD NI NN NN NI NN NI(SEQ ID NO:394),
NI HD NI HD HD HD NN NI NG HD HD NI HD NG NN NN NN(SEQ ID NO:395),
NN HD NG NN HD NI NG HD NI NI HD HD HD HD(SEQ ID NO:396),
NN NN HD NI HD NN NI NI NI HD NI HD HD HD NG HD HD(SEQ ID NO:397),
NN NN NG NN NN HD NG HD NI NG NN HD HD NG NN(SEQ ID NO:398),
NN NI NG NG NG NN HD NI HD NI NN HD NG HD NI NG(SEQ ID NO:399),
NI NI NH HD NG HD NG NH NI NH NH NI NH HD(SEQ ID NO:400),
HD HD HD NG NI NK HD NG NH NG HD HD HD HD(SEQ ID NO:401),
NH HD HD NG NI NH HD NI NG NH HD NG NI NH(SEQ ID NO:402),
NI NG NH NH NH HD NG NG HD NI HD NH NH NI NG(SEQ ID NO:403),
NH NI NI NI HD NG NI NG NH HD HD NG NH HD(SEQ ID NO:404),
NH HD NI HD HD NI NG NG NH HD NG HD HD HD(SEQ ID NO:405),
NH NI HD NI NG NH HD NI NI HD NG HD NI NH(SEQ ID NO:406),
NI HD NI HD HD NI HD NG NI NH NH NH NH NG(SEQ ID NO:407),
NH NG HD NG NH HD NG NI NH NI HD NI NH NH(SEQ ID NO:408),
NH NH HD HD NG NI NH NI HD NI NH NH HD NG NH(SEQ ID NO:409),
NH NI NH NH HD NI NG NG HD NG NG NI NG HD NH(SEQ ID NO:410),
NN HD HD NG NN NN NI NI NI HD NN NG NG HD HD(SEQ ID NO:411),
NN NG NN HD NG HD NG NN NI HD NI NI NG NI(SEQ ID NO:412),
NN NG NG NG NG NN HD NI NN HD HD NG HD HD(SEQ ID NO:413),
NI HD NI NN HD NG NN NG NN NN NI NI HD NN NG(SEQ ID NO:414),
HD NI NI NN NI HD HD NN NI NN HD NI HD NG NN HD NG NN(SEQ ID NO:415),
HD NG NI NG HD HD HD NI NI NI NI HD NG HD NG(SEQ ID NO:416),
NH NI NI NI NI NI HD NG NI NG NH NG NI NG(SEQ ID NO:417),
NI NH NH HD NI NH NH HD NG NH NH NG NG NH NI(SEQ ID NO:418),
HD NI NI NG NI HD NI NI HD HD NI HD NN HD(SEQ ID NO:419),
NI NG NN NI HD NN NN NI HD NG HD NI NI HD NG(SEQ ID NO:420),
HD NI HD NI NI HD NI NG NG NG NN NG NI NI(SEQ ID NO:421),和
NI NG NG NG HD HD NI NN NG NN HD NI HD NI(SEQ ID NO:422)。
在一些实施方案中,GSHS选自图3中所列的位点并且TALE DBD包含图3的序列。
在一些实施方案中,TALE DBD包含图3的序列或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的序列中的一者或多者。
在一些实施方案中,GSHS和TALE DBD序列选自:
TGGCCGGCCTGACCACTGG(SEQ ID NO:23)和NH NH HD HD NH NH HD HD NG NH NIHD HD NI HD NG NH NH(SEQ ID NO:355);
TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)和NH NI NI NH NH HD HD NG NH NH HDHD NH NH HD HD NG NH(SEQ ID NO:356);
TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)和NH NI NH HD NI HD NG NH NI NI NHNH HD HD NG NH NH HD(SEQ ID NO:357);
TCCACTGAGCACTGAAGGC(SEQ ID NO:26)和HD HD NI HD NG NH NI NH HD NI HDNG NH NI NI NH NH HD(SEQ ID NO:358);
TGGTTTCCACTGAGCACTG(SEQ ID NO:27)和NH NH NG NG NG HD HD NI HD NG NHNI NH HD NI HD NG NH(SEQ ID NO:359);
TGGGGAAAATGACCCAACA(SEQ ID NO:28)和NH NH NH NH NI NI NI NI NG NH NIHD HD HD NI NI HD NI(SEQ ID NO:360);
TAGGACAGTGGGGAAAATG(SEQ ID NO:29)和NI NH NH NI HD NI NH NG NH NH NHNH NI NI NI NI NG NH(SEQ ID NO:361);
TCCAGGGACACGGTGCTAG(SEQ ID NO:30)和HD HD NI NH NH NH NI HD NI HD NHNH NG NH HD NG NI NH(SEQ ID NO:362);
TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)和HD NI NH NI NH HD HD NI NH NH NINH NG HD HD NG NH NH(SEQ ID NO:363);
TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)和HD HD NG NG HD NI NH NI NH HD HDNI NH NH NI NH NG HD(SEQ ID NO:364);
TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)和HD HD NG HD HD NG NG HD NI NH NINH HD HD NI NH NH NI(SEQ ID NO:365);
TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)和HD HD NI NH HD HD HD HD NG HD HDNG HD HD NG NG HD NI(SEQ ID NO:366);
TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)和HD HD NH NI NH HD NG NG NH NI HDHD HD NG NG NH NH NI(SEQ ID NO:367);
TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)和NH NH NG NG NG HD HD NH NI NH HDNG NG NH NI HD HD HD(SEQ ID NO:368);
TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)和NH NH NH NH NG NH NH NG NG NG HDHD NH NI NH HD NG NG(SEQ ID NO:369);
TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)和HD NG NH HD NG NH NH NH NH NG NHNH NG NG NG HD HD NH(SEQ ID NO:370);
TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)和NH HD NI NH NI NH NG NI NG HD NGNH HD NG NH NH NH NH(SEQ ID NO:371);
CCAATCCCCTCAGT(SEQ ID NO:40)和HD HD NI NI NG HD HD HD HD NG HD NI NHNG(SEQ ID NO:372);
CAGTGCTCAGTGGAA(SEQ ID NO:41)和HD NI NH NG NH HD NG HD NI NH NG NH NHNI NI(SEQ ID NO:373);
GAAACATCCGGCGACTCA(SEQ ID NO:42)和NH NI NI NI HD NI NG HD HD NH NH HDNH NI HD NG HD NI(SEQ ID NO:374);
TCGCCCCTCAAATCTTACA(SEQ ID NO:43)和HD NH HD HD HD HD NG HD NI NI NING HD NG NG NI HD NI(SEQ ID NO:375);
TCAAATCTTACAGCTGCTC(SEQ ID NO:44)和HD NI NI NI NG HD NG NG NI HD NINH HD NG NH HD NG HD(SEQ ID NO:376);
TCTTACAGCTGCTCACTCC(SEQ ID NO:45)和HD NG NG NI HD NI NH HD NG NH HDNG HD NI HD NG HD HD(SEQ ID NO:377);
TACAGCTGCTCACTCCCCT(SEQ ID NO:46)和NI HD NI NH HD NG NH HD NG HD NIHD NG HD HD HD HD NG(SEQ ID NO:378);
TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)和NH HD NG HD NI HD NG HD HD HD HDNG NH HD NI NH NH NH(SEQ ID NO:379);
TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)和HD HD HD HD NG NH HD NI NH NH NHHD NI NI HD NH HD HD(SEQ ID NO:380);
TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)和NH HD NI NH NH NH HD NI NI HD NHHD HD HD NI NH NH NH(SEQ ID NO:381);
TCTCGATTATGGGCGGGAT(SEQ ID NO:50)和HD NG HD NH NI NG NG NI NG NH NHNH HD NH NH NH NI NG(SEQ ID NO:382);
TCGCTTCTCGATTATGGGC(SEQ ID NO:51)和HD NH HD NG NG HD NG HD NH NI NGNG NI NG NH NH NH HD(SEQ ID NO:383);
TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)和NH NG HD NH NI NH NG HD NH HD NGNG HD NG HD NH NI NG(SEQ ID NO:384);
TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)和HD HD NI NG NH NG HD NH NI NH NGHD NH HD NG NG HD NG(SEQ ID NO:385);
TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)和HD NH HD HD NG HD HD NI NG NH NGHD NH NI NH NG HD NH(SEQ ID NO:386);
TCGTCATCGCCTCCATGTC(SEQ ID NO:55)和HD NH NG HD NI NG HD NH HD HD NGHD HD NI NG NH NG HD(SEQ ID NO:387);
TGATCTCGTCATCGCCTCC(SEQ ID NO:56)和NH NI NG HD NG HD NH NG HD NI NGHD NH HD HD NG HD HD(SEQ ID NO:388);
GCTTCAGCTTCCTA(SEQ ID NO:57)和NH HD NG NG HD NI NH HD NG NG HD HD NGNI(SEQ ID NO:389);
CTGTGATCATGCCA(SEQ ID NO:58)和HD NG NK NG NH NI NG HD NI NG NH HD HDNI(SEQ ID NO:390);
ACAGTGGTACACACCT(SEQ ID NO:59)和NI HD NI NN NG NN NN NG NI HD NI HDNI HD HD NG(SEQ ID NO:391);
CCACCCCCCACTAAG(SEQ ID NO:60)和HD HD NI HD HD HD HD HD HD NI HD NG NINI NN(SEQ ID NO:392);
CATTGGCCGGGCAC(SEQ ID NO:61)和HD NI NG NG NN NN HD HD NN NN NN HD NIHD(SEQ ID NO:393);
GCTTGAACCCAGGAGA(SEQ ID NO:62)和NN HD NG NG NN NI NI HD HD HD NI NNNN NI NN NI(SEQ ID NO:394);
ACACCCGATCCACTGGG(SEQ ID NO:63)和NI HD NI HD HD HD NN NI NG HD HD NIHD NG NN NN NN(SEQ ID NO:395);
GCTGCATCAACCCC(SEQ ID NO:64)和NN HD NG NN HD NI NG HD NI NI HD HD HDHD(SEQ ID NO:396);
GCCACAAACAGAAATA(SEQ ID NO:65)和NN NN HD NI HD NN NI NI NI HD NI HDHD HD NG HD HD(SEQ ID NO:397);
GGTGGCTCATGCCTG(SEQ ID NO:66)和NN NN NG NN NN HD NG HD NI NG NN HD HDNG NN(SEQ ID NO:398);
GATTTGCACAGCTCAT(SEQ ID NO:67)和NN NI NG NG NG NN HD NI HD NI NN HDNG HD NI NG(SEQ ID NO:399);
AAGCTCTGAGGAGCA(SEQ ID NO:68)和NI NI NH HD NG HD NG NH NI NH NH NI NHHD(SEQ ID NO:400);
CCCTAGCTGTCCC(SEQ ID NO:69)和HD HD HD NG NI NK HD NG NH NG HD HD HDHD(SEQ ID NO:401);
GCCTAGCATGCTAG(SEQ ID NO:70)和NH HD HD NG NI NH HD NI NG NH HD NG NINH(SEQ ID NO:402);
ATGGGCTTCACGGAT(SEQ ID NO:71)和NI NG NH NH NH HD NG NG HD NI HD NH NHNI NG(SEQ ID NO:403);
GAAACTATGCCTGC(SEQ ID NO:72)和NH NI NI NI HD NG NI NG NH HD HD NG NHHD(SEQ ID NO:404);
GCACCATTGCTCCC(SEQ ID NO:73)和NH HD NI HD HD NI NG NG NH HD NG HD HDHD(SEQ ID NO:405);
GACATGCAACTCAG(SEQ ID NO:74)和NH NI HD NI NG NH HD NI NI HD NG HD NINH(SEQ ID NO:406);
ACACCACTAGGGGT(SEQ ID NO:75)和NI HD NI HD HD NI HD NG NI NH NH NH NHNG(SEQ ID NO:407);
GTCTGCTAGACAGG(SEQ ID NO:76)和NH NG HD NG NH HD NG NI NH NI HD NI NHNH(SEQ ID NO:408);
GGCCTAGACAGGCTG(SEQ ID NO:77)和NH NH HD HD NG NI NH NI HD NI NH NH HDNG NH(SEQ ID NO:409);
GAGGCATTCTTATCG(SEQ ID NO:78)和NH NI NH NH HD NI NG NG HD NG NG NI NGHD NH(SEQ ID NO:410);
GCCTGGAAACGTTCC(SEQ ID NO:79)和NN HD HD NG NN NN NI NI NI HD NN NG NGHD HD(SEQ ID NO:411);
GTGCTCTGACAATA(SEQ ID NO:80)和NN NG NN HD NG HD NG NN NI HD NI NI NGNI(SEQ ID NO:412);
GTTTTGCAGCCTCC(SEQ ID NO:81)和NN NG NG NG NG NN HD NI NN HD HD NG HDHD(SEQ ID NO:413);
ACAGCTGTGGAACGT(SEQ ID NO:82)和NI HD NI NN HD NG NN NG NN NN NI NI HDNN NG(SEQ ID NO:414);
GGCTCTCTTCCTCCT(SEQ ID NO:83)和HD NI NI NN NI HD HD NN NI NN HD NI HDNG NN HD NG NN(SEQ ID NO:415);
CTATCCCAAAACTCT(SEQ ID NO:84)和HD NG NI NG HD HD HD NI NI NI NI HD NGHD NG(SEQ ID NO:416);
GAAAAACTATGTAT(SEQ ID NO:85)和NH NI NI NI NI NI HD NG NI NG NH NG NING(SEQ ID NO:417);
AGGCAGGCTGGTTGA(SEQ ID NO:86)和NI NH NH HD NI NH NH HD NG NH NH NG NGNH NI(SEQ ID NO:418);
CAATACAACCACGC(SEQ ID NO:87)和HD NI NI NG NI HD NI NI HD HD NI HD NNHD(SEQ ID NO:419);
ATGACGGACTCAACT(SEQ ID NO:88)和NI NG NN NI HD NN NN NI HD NG HD NI NIHD NG(SEQ ID NO:420);以及
CACAACATTTGTAA(SEQ ID NO:89)和HD NI HD NI NI HD NI NG NG NG NN NG NINI(SEQ ID NO:421)。
在一些实施方案中,GSHS处于TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点的约25个、或约50个、或约100个、或约150个、或约200个、或约300个、或约500个核苷酸内。
在一些实施方案中,用于在开放染色质区域中使用dCas靶向人类基因组安全港位点的向导RNA(gRNA)如图4中所示。
在实施方案中,酶(例如但不限于转座酶)能够在TA二核苷酸位点处插入转座子。在一些实施方案中,酶(例如但不限于转座酶)能够在TTAA(SEQ ID NO:1)四核苷酸位点处插入转座子。
在实施方案中,组合物包含具有分别编码酶和转座子的核酸的系统。图1A-1D示出了根据本公开的实施方案的系统的实例。举例来说,如图2中所示,在一些实施方案中,所述系统包含编码能够通过转座进行靶向基因组整合的酶的核酸(例如,辅助体RNA)和编码转座酶的核酸(例如,供体DNA)。辅助体RNA被翻译成生物工程化酶(例如,整合酶、重组酶或转座酶),所述酶识别特定末端并以位点特异性方式将供体DNA无缝插入人类基因组中,而没有足迹。
在实施方案中,能够通过转座进行靶向基因组整合的酶由第一核酸编码,并且转座子由第二非病毒核酸编码。转座子包含转基因并且侧翼是酶识别的末端,并且酶使转基因插入核酸分子的基因组安全港位点(GSHS)中的某个基因组基因座和/或位点处(例如,TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点处)。在一些实施方案中,第一核酸是RNA,例如,辅助体RNA;并且第二非病毒核酸是DNA。在实施方案中,内含肽(也称作剪接结构域)用于合成重组酶(例如但不限于MLT融合蛋白),所述酶包括靶向人类基因组内特定位点的所需内部DNA结合结构域(DNA结合子)以用于供体转基因的整合。
内含肽(INTervening protEINS)是可移动的遗传元件,所述遗传元件是在自然界中发现的蛋白质结构域,具有执行蛋白质剪接过程的能力。参见Sarmiento和Camarero(2019)Current protein&peptide science,20(5),408-424,以全文引用的方式并入本文中。蛋白质剪接是翻译后生物化学修饰,它使得在内含肽侧翼的前体多肽区段之间的肽键分裂和形成。同上。内含肽应用标准酶促策略以经由蛋白质剪接从前体蛋白翻译后切除自身。Nanda等,Microorganisms第8卷,122004.2020年12月16日,doi:10.3390/microorganisms8122004。内含肽可以剪接其侧翼的N端和C端结构域以变为成熟蛋白质并从序列中切除自身。举例来说,分裂内含肽已经用于控制异源基因向转基因生物体中的递送。参见Wood和Camarero(2014)J Biol Chem.289(21):14512-14519。这种方法依赖于将靶蛋白分裂成两个区段,然后通过蛋白质反式剪接(PTS)在体内进行翻译后重构。参见Aboye和Camarero(2012)J.Biol.Chem.287,27026-27032。最近,已经开发出内含肽介导的分裂Cas9系统,以将Cas9掺入细胞中并有效地重构核酸酶活性。Truong等,Nucleic AcidsRes.2015,43(13),6450-6458。蛋白质剪接切除前体蛋白的内部区域,然后继之以连接N-外显肽和C-外显肽片段,产生两种多肽-切除的内含肽和通过连接C-外显肽和N-外显肽而产生的新多肽。Sarmiento和Camarero(2019)。
在实施方案中,内含肽介导的DNA结合子(诸如但不限于dCas9、dCas12j或TALE)的掺入允许产生分裂MLT转座酶系统,所述系统允许从两个较小片段重构全长MLT转座酶。这可以避免在MLT转座酶的N端或C端表达DNA结合子的需要。在这种方法中,MLT转座酶的两个部分融合至内含肽,并且在共表达后,内含肽允许通过翻译后修饰产生全长MLT转座酶。因此,在实施方案中,编码能够通过转座进行靶向基因组整合的酶的核酸包含内含肽。在实施方案中,核酸以第一部分和第二部分的形式编码酶,在第一部分与第二部分之间编码内含肽,使得第一部分和第二部分在翻译后切除酶中的内含肽后融合至功能酶中。
在实施方案中,内含肽可以是适合的配体依赖性内含肽,例如,选自以下文献中所描述的那些的内含肽:美国专利号9,200,045;Mootz等,J.Am.Chem.Soc.2002;124,9044-9045;Mootz等,J.Am.Chem.Soc.2003;125,10561-10569;Buskirk等,Proc.Natl.Acad.Sci.USA.2004;101,10505-10510;Skretas和Wood.Protein Sci.2005;14,523-532;Schwartz等,Nat.Chem.Biol.2007;3,50-54;Peck等,Chem.Biol.2011;18(5),619-630;每篇文献的全部内容特此以引用的方式并入本文中。
在实施方案中,内含肽是NpuN(内含肽-N)(SEQ ID NO:423)和/或NpuC(内含肽-C)(SEQ ID NO:424)或其变体,例如,与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的序列。
在实施方案中,能够通过转座进行靶向基因组整合的酶是但不限于转座酶。在实施方案中,转座酶来源于家蚕、热带爪蟾或粉纹夜蛾。在实施方案中,酶(例如但不限于转座酶)是转座酶的工程化型式,包括但不限于来源于家蚕、热带爪蟾或粉纹夜蛾的单体、二聚体、四聚体、高活性或Int-形式。
在实施方案中,转座酶是工程化型式,包括但不限于单体、二聚体、四聚体、高活性或与非TTAA(SEQ ID NO:1)识别位点(Int-)的相互作用降低的转座酶,来源于家蚕、热带爪蟾、粉纹夜蛾、马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、小棕蝠、库氏伏翼、马来大狐蝠以及獒蝠、家蚕、热带爪蟾、粉纹夜蛾或小棕蝠中的任一者。转座酶可以是野生型、单体、二聚体、四聚体、高活性或Int-突变体。
在一些实施方案中,连接TALE DBD或dCas9/gRNA和转座酶的连接子是柔性连接子。在一些实施方案中,柔性连接子大体上由甘氨酸和丝氨酸残基组成,任选地其中所述柔性连接子包含(Gly4Ser)n,其中n为约1至约12。柔性连接子可以具有约20个、或约30个、或约40个、或约50个、或约60个氨基酸残基。
在一些方面,提供了编码根据本公开的实施方案的嵌合转座酶的核酸。核酸可以是DNA或RNA。在一些实施方案中,将嵌合转座酶掺入载体中。在一些实施方案中,载体是非病毒载体。
在一些方面,提供了一种包含根据本公开的实施方案的核酸的宿主细胞。
在一些实施方案中,提供了根据本公开的实施方案的组合物或核酸,其中所述组合物呈脂质纳米颗粒(LNP)的形式。组合物可以包含一种或多种选自以下的脂质:1,2-二油酰基-3-三甲基丙烷铵(DOTAP)、与二甲基氨基乙烷-氨基甲酰基混合的阳离子胆固醇衍生物(DC-Chol)、磷脂酰胆碱(PC)、三油精(三油酸甘油酯)和1,2-二硬脂酰基-sn-甘油-3-磷酰乙醇胺-N-[羧基(聚乙二醇)-2000](DSPE-PEG)、1,2-二肉豆蔻酰基-外消旋-甘油-3-甲氧基聚乙二醇-2000(DMG-PEG2K)和1,2-二硬脂醇-sn-甘油-3-磷酸胆碱(DSPC),和/或包含一种或多种选自聚乙烯亚胺(PEI)和聚(乳酸-共-乙醇酸)(PLGA)以及N-乙酰半乳糖胺(GalNAc)的分子。
在一些方面,提供了一种用于将基因插入细胞基因组中的方法,所述方法包括根据本公开的实施方案使细胞与嵌合转座酶接触。所述方法可以是体内或离体方法。
在一些实施方案中,使细胞与编码根据本公开的实施方案的嵌合转座酶的核酸接触。在一些实施方案中,使细胞与编码嵌合转座酶的RNA接触。在一些实施方案中,使细胞与包含转座子的构建体接触。在一些实施方案中,使细胞与编码嵌合转座酶的DNA接触。
在实施方案中,用于将基因插入细胞基因组中的本发明方法利用本发明MLT转座酶,例如,具有SEQ ID NO:2的氨基酸序列或其变体(和任选的一个或多个高活性突变),或所描述的其嵌合体,以约0.5:1的比率、或约1:1的比率、或约2:1的比率、或约1:0.5的比率、或约1:2的比率,所述比率是转座子(或有效载荷/转基因)的量比MLT转座酶或所描述的其嵌合体的量(例如,重量:重量、浓度:浓度)。
在实施方案中,用于将基因插入细胞基因组中的本发明方法利用永生化细胞系。在实施方案中,用于将基因插入细胞基因组中的本发明方法利用来源于人类受试者的细胞(例如,所述方法离体或体外进行)。在实施方案中,用于将基因插入细胞基因组中的本发明方法利用肾细胞、或卵巢细胞、或免疫细胞(例如,T细胞)。
在实施方案中,用于将基因插入基因组中的本发明方法允许表达插入的基因。在实施方案中,用于将基因插入基因组中的本发明方法提供了插入的基因持续至少7天、或至少8天、或至少9天、或至少10天、或至少14天、或至少21天、或至少约7-21天、或至少约7-14天、或至少约7-10天、或至少约10-14天的表达。
在实施方案中,用于将基因插入基因组中的本发明方法大体上不影响接受体细胞的活力(例如,至少约95%、或至少约90%、或至少约85%、或至少约80%、或至少约75%、或至少约50%的细胞在插入后仍然存活)。
如本领域中将了解,转座子通常包括在转座子中间编码转基因的开放阅读框和在转座子5'和3'末端的末端重复序列。翻译的转座酶结合至转座子的5'和3'序列并执行转座功能。
在实施方案中,转座子与转座元件可互换使用,所述转座元件用于指代能够将自身的拷贝插入其它多核苷酸中的多核苷酸。术语转座子对本领域技术人员来说是众所周知的并且包括可以基于序列组织来区分的转座子类别,例如,在每个末端的反向末端序列,和/或在末端的直接重复长末端重复(LTR)。在一些实施方案中,如本文所描述的转座子可以描述为piggyBac样元件,例如,以其无痕切除为特征的转座子元件,所述元件识别TTAA(SEQ ID NO:1)序列并且在去除转座子后将插入位点处的序列恢复为原始TTAA(SEQ IDNO:1)序列。
在实施方案中,转座子包括MLT转座酶。在实施方案中,MLT转座酶是具有SEQ IDNO:2的氨基酸或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列的转座酶。在实施方案中,MLT转座酶是具有SEQ ID NO:4的氨基酸或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列的转座酶。
在实施方案中,转座酶可以作用于MLT左末端,或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的序列,其中MLT左末端(5'至3')的核苷酸序列如下:
Figure BDA0003926853220000551
在实施方案中,转座酶可以作用于MLT右末端,或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的序列,其中MLT右末端(5'至3')的核苷酸序列如下:
Figure BDA0003926853220000561
在一些实施方案中,转座子的侧翼是一个或多个末端。在一些实施方案中,转座子是或包含编码竞争多肽的基因。在一些实施方案中,转座子是或包含在疾病状态中有缺陷或大体上不存在的基因。
在实施方案中,转座子可以编码各种基因。举例来说,在一些实施方案中,转座子是ATP结合盒亚家族A成员4基因(ABC)转运体基因(ABCA4)或其功能片段。作为另一个实例,在一些实施方案中,转座子是极低密度脂蛋白受体基因(VLDLR)或低密度脂蛋白受体基因(LDLR)或其功能片段。
在一些实施方案中,将治疗基因插入宿主基因组中的GSHS位置。GSHS可以定义为非常适于基因转移的基因座,因为这些位点内的整合与诸如原癌基因激活、肿瘤抑制子失活或插入诱变等不良作用无关。GSHS可以按以下标准定义:1)距离任何基因的5'末端至少50kb,(2)距离任何癌症相关基因至少300kb,(3)距离任何微小RNA(miRNA)至少300kb,(4)位于转录单位之外,以及(5)位于人类基因组的超保守区域(UCR)之外。参见Papapetrou等Nat Biotechnol 2011;29:73-8;Bejerano等Science 2004;304:1321-5。
此外,使用GSHS位置可以允许跨多种细胞类型的稳定转基因表达。已经鉴定出一个此类位点,趋化因子C-C基序受体5(CCR5)并且用于整合基因转移。CCR5是β趋化因子受体家族的成员并且是参与原发感染的R5嗜性病毒株进入所需的。CCR5基因中的纯合子32bp缺失赋予人类对HIV-1病毒感染的抗性。破坏的CCR5表达,在约1%的高加索人群中自然发生,似乎不会导致任何免疫力下降。Lobritz等,Viruses 2010;2:1069-105。临床试验已经证明了经由可靶向核酸酶破坏CCR5的安全性和功效。Tebas等,HIV.N Engl J Med 2014;370:901-10。
转座子可以在组织特异性启动子的控制下。组织特异性启动子可以是例如肝脏特异性启动子。在一些实施方案中,肝脏特异性启动子是LP1启动子,在一些实施方案中是人类LP1启动子。LP1启动子描述于例如Nathwani等Blood 2006;第107(7)卷:2653-61中,并且可以如Nathawani等所描述来构建。在一些实施方案中,组织特异性启动子是视网膜特异性启动子,诸如视网膜色素上皮(RPE)启动子,所述启动子可以是RPE65、IRBP或VMD2启动子。RPE65、IRBP和VMD2启动子描述于例如Aguirre.Invest Ophthalmol Vis Sci.2017;58(12):5399-5411.doi:10.1167/iovs.17-22978中。在一些实施方案中,视网膜特异性启动子是光受体启动子,任选地选自β-磷酸二酯酶(PDE)(参见例如Di Polo等,Nucleic AcidsRes.1997;25(19):3863-3867)、视紫红质激酶(GRK1)(参见例如Khani等,2007;McDougald等,Mol Ther Methods Clin Dev.2019;13:380-389.2019年3月28日公布)、CAR(锥体阻遏蛋白)(参见例如McDougald等,Mol Ther Methods Clin Dev.2019;13:380-389.2019年3月28日公布)、色素性视网膜炎1(RP1)和L-视蛋白(参见例如Kan等,Molecular Therapy,第15卷,增刊1,S258,2007年5月1日;Lee等,Vision Res.2008年2月;48(3):332-8)。
然而,应了解,可以使用多种启动子,包括其它组织特异性启动子、诱导型启动子、组成型启动子等。
可以将嵌合转座酶掺入载体,诸如非病毒载体中。嵌合转座酶可以在与编码转座子的载体相同的载体上编码,或者它可以在单独的载体质粒或RNA上编码。
此外,各种转座酶可以用于构建嵌合转座酶。
在一些实施方案中,转座酶来自Tc1/水手转座子系统。参见例如Plasterk等Trends in Genetics.1999;15(8):326-32。
在一些实施方案中,启动子是融合至鸡β-肌动蛋白(CAG)启动子的巨细胞病毒(CMV)增强子。参见Alexopoulou等,BMC Cell Biol.2008;9:2,2008年1月11日在线公布。
在一些实施方案中,转座酶来自睡美人转座子系统(参见例如Cell.1997;91:501-510),例如睡美人的高活性形式(hypSB),例如SB100X(参见Gene Therapy第18卷,第849-856页(2011)),或piggyBac(PB)转座子系统(参见例如Trends Biotechnol.2015年9月;33(9):525-33,以全文引用的方式并入本文中),例如PB转座酶的高活性形式(hypPB),例如具有七个氨基酸取代(例如,mPB上的I30V、S103P、G165S、M282V、S509G、N570S、N538K,或非mPB中的功能等同物,参见Mol Ther Nucleic Acids.2012年10月;1(10):e50,以全文引用的方式并入本文中);还参见Yusa等,PNAS 2011年1月25日108(4)1531-1536;Voigt等,NatureCommunications第7卷,文章编号:11126(2016)。
piggyBac转座酶属于IS4转座酶家族。De Palmenaer等,BMC EvolutionaryBiology.2008;8:18.doi:10.1186/1471-2148-8-18。piggyBac家族包括大量不同的转座子,并且这些转座子中的任一者可以用于本公开的实施方案中。参见例如Bouallègue等,Genome Biol Evol.2017;9(2):323-339。piggyBac(超)家族的创始成员,昆虫piggyBac,最初是在甘蓝蠖度尺蛾(粉纹夜蛾)中鉴定的,并且在体内和体外都进行了研究。昆虫piggyBac已知通过典型的剪切和粘贴机制进行转座,所述机制由元件编码的转座酶促进,所述转座酶具有类似于许多重组酶共享的RNase H折叠的催化位点。昆虫piggyBac转座子系统已经显示出在包括果蝇和小鼠在内的多种动物中具有高活性,所述系统在这些动物中已经被开发为基因标记和基因组工程的强大工具。归属于piggyBac超家族的其它转座子在包括爪蟾和家蚕在内的节肢动物和脊椎动物中是常见的。可以用于本公开的实施方案中的哺乳动物piggyBac转座子和转座酶,包括高活性哺乳动物piggyBac变体,描述于例如国际申请WO2010085699中,所述申请以全文引用的方式并入本文中。
在一些实施方案中,转座酶来自MLT转座子系统,所述系统基于从小型棕蝙蝠(小棕蝠)或其它蝙蝠转座酶,诸如马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、库氏伏翼和獒蝠获得的剪切和粘贴MLT元件。参见Mitra等,Proc Natl Acad Sci U S A.2013年1月2日;110(1):234-9;Jebb等,Nature,第583卷,第578-584页(2020),以全文引用的方式并入本文中。在一些实施方案中,使用蝙蝠转座酶的高活性形式。MLT转座酶已经显示出能够在蝙蝠、人类和酵母细胞中进行转座。MLT转座酶的高活性形式增强了转座过程。另外,嵌合MLT转座酶能够进行位点特异性切除而无需基因组整合。
此外,在实施方案中,使用相对于野生型MLT转座酶具有某些突变的工程化和/或校正的MLT转座酶。在实施方案中,使用校正的MLT转座酶的高活性形式。
在实施方案中,转座酶来源于家蚕、热带爪蟾、粉纹夜蛾、马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、小棕蝠、库氏伏翼、马来大狐蝠和獒蝠中的任一者。在实施方案中,转座酶来源于粉纹夜蛾、小棕蝠、大鼠耳蝠或马来大狐蝠中的任一者(参见图7)。转座酶可以具有一个或多个选自图5A和5B的高活性和/或整合缺陷突变,或其等同物。参考图7,本领域技术人员可以将此类突变体对应于来自粉纹夜蛾、小棕蝠、大鼠耳蝠或马来大狐蝠中任一者的转座酶。
图7的比对中所示的氨基酸序列如下(括号中的符号仅用于区分不同类型的序列):
粉纹夜蛾
Figure BDA0003926853220000601
马来大狐蝠
Figure BDA0003926853220000602
大鼠耳蝠(“2a”)
Figure BDA0003926853220000603
大鼠耳蝠(“1”)
Figure BDA0003926853220000604
小棕蝠(“2”)
Figure BDA0003926853220000611
大鼠耳蝠(“2”)
Figure BDA0003926853220000612
大鼠耳蝠(“2b”)
Figure BDA0003926853220000613
在实施方案中,本领域技术人员可以将此类突变体对应于来自家蚕、热带爪蟾、粉纹夜蛾、马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、小棕蝠、库氏伏翼、马来大狐蝠和獒蝠中的任一者的转座酶。
在一些实施方案中,转座酶可以具有与马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、小棕蝠、马来大狐蝠、库氏伏翼、黑猩猩、獒蝠或智人中任一者的核苷酸序列具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列。在一些实施方案中,转座酶可以具有与马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、小棕蝠、马来大狐蝠、库氏伏翼、黑猩猩、獒蝠或智人中任一者的氨基酸序列具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列。参见Jebb等,(2020)。
在一些实施方案中,野生型MLT转座酶由以下核苷酸序列编码:
Figure BDA0003926853220000621
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列。
在一些实施方案中,由SEQ ID NO:5(上文)的核苷酸序列编码的野生型MLT转座酶具有以下氨基酸序列:
Figure BDA0003926853220000622
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列。
在一些实施方案中,MLT转座酶具有紧接在上文的氨基酸序列(SEQ ID NO:4)并且包括选自图5A或图5B的高活性突变。举例来说,MLT转座酶可以包括约1个、或约2个、或约3个、或约4个、或约5个选自图5A或图5B的高活性突变,或它们的组合。
在实施方案中,MLT转座酶包含一个或多个选自L573X、E574X和S2X的突变,其中X是任何氨基酸或无氨基酸,任选地X是A、G或缺失,任选地突变是L573del、E574del和S2A。
在实施方案中,MLT转座酶包含L573del、E574del和S2A突变,并且包含SEQ ID NO:2的氨基酸序列:
Figure BDA0003926853220000631
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列。
包含SEQ ID NO:2的氨基酸序列或其变体的MLT转座酶经过工程化以改善Mitra等(Proc Natl Acad Sci U S A.2013年1月2日;110(1):234-9)和WO2010085699的酶,所述文献均以全文引用的方式并入本文中。包含SEQ ID NO:2的氨基酸序列或其变体(具有突变L573del、E574del和S2A)的MLT转座酶在本文中称作“工程化”和/或“校正”的MLT转座酶。
在一些实施方案中,包含SEQ ID NO:2的氨基酸序列的MLT转座酶由以下核苷酸序列编码:
Figure BDA0003926853220000641
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列。
在一些实施方案中,包含SEQ ID NO:2的氨基酸序列的MLT转座酶包括一个或多个选自图5A或图5B的高活性突变。举例来说,MLT转座酶可以包括约1个、或约2个、或约3个、或约4个、或约5个选自图5A或图5B的高活性突变,或它们的组合。
在一些实施方案中,包含SEQ ID NO:2的氨基酸序列的MLT转座酶包括一个或多个选自以下的高活性突变:在位置S5、S8、D9、D10、E11、C13、A14、S36、S54、N125、K130、G239、T294、T300、I345、R427、D475、M481、P491、A520和A561中的一者或多者处的取代或缺失。
在一些实施方案中,包含SEQ ID NO:2的氨基酸序列的MLT转座酶包括一个或多个选自以下的高活性突变:S5P、S8P、S8P/C13R、D9G、D10G、E11G、C13R、A14V、S36G、S54N、N125K、K130T、G239S、T294A、T300A、I345V、R427H、D475G、M481V、P491Q、A520T和A561T。
在实施方案中,MLT转座酶包含选自S8X1、C13X2和/或N125X3的高活性突变体中的一者或多者(例如,S8X1、C13X2和N125X3、S8X1和C13X2、S8X1和N125X3以及C13X2和N125X3的全部),其中X1、X2和X3各自独立地是任何氨基酸,或X1是选自G、A、V、L、I和P的非极性脂肪族氨基酸,X2是选自K、R和H的带正电荷的氨基酸,和/或X3是选自K、R和H的带正电荷的氨基酸。在实施方案中,X1是P,X2是R,和/或X3是K。
在一些实施方案中,MLT转座酶由对应于相对于SEQ ID NO:2的氨基酸序列具有N125K突变的氨基酸(SEQ ID NO:7)的核苷酸序列(SEQ ID NO:6)或其功能等同物编码:
Figure BDA0003926853220000651
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列(对应于N125K突变的密码子加下划线并加粗)。
Figure BDA0003926853220000661
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列(对应于N125K突变的氨基酸加下划线并加粗)。
在一些实施方案中,由SEQ ID NO:7的核苷酸序列编码并具有SEQ ID NO:7的氨基酸序列的MLT转座酶称作MLT转座酶1(或MLT1)。
在一些实施方案中,MLT转座酶由对应于相对于SEQ ID NO:2的氨基酸序列具有S8P和C13R突变的氨基酸(SEQ ID NO:9)的核苷酸序列(SEQ ID NO:8)或其功能等同物编码:
Figure BDA0003926853220000662
Figure BDA0003926853220000671
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列(对应于S8P和C13R突变的密码子加下划线并加粗)。
Figure BDA0003926853220000672
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列(对应于S8P和C13R突变的氨基酸加下划线并加粗)。
在一些实施方案中,由SEQ ID NO:8的核苷酸序列编码并具有SEQ ID NO:9的氨基酸序列的MLT转座酶称作MLT转座酶2(或MLT2)。
在一些方面,提供了一种组合物,所述组合物包含具有SEQ ID NO:2的氨基酸序列和在位置S2处的取代,或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的变体的转座酶(例如,MLT转座酶)。在实施方案中,取代是非极性脂肪族氨基酸,任选G、A、V、L、I和P之一,任选S2A。在实施方案中,酶在C端不具有额外的残基。在实施方案中,酶具有一个或多个赋予高活性的突变,例如,选自S8X1、C13X2和/或N125X3,例如并且其中X1选自G、A、V、L、I和P,X2选自K、R和H,并且X3选自K、R和H,例如,X1是P,X2是R,和/或X3是K。在实施方案中,提供了一种组合物,所述组合物包含编码本文所描述的转座酶(例如,MLT转座酶)的核酸,例如,具有SEQ ID NO:3的核苷酸序列,或与其具有至少约80%、至少约90%、或至少约93%、或至少约95%、或至少约98%同一性的核苷酸序列。在实施方案中,转座酶或核酸呈脂质纳米颗粒(LNP)的形式。在实施方案中,酶与编码转座子的核酸共同配制,例如,在相同的脂质纳米颗粒(LNP)中。在实施方案中,共制剂包含编码酶的核酸和编码转座子的核酸。
在实施方案中,提供了一种用于将基因插入细胞基因组中的方法,所述方法包括使细胞与包含转座酶(例如,MLT转座酶)的组合物接触,所述转座酶具有SEQ ID NO:2的氨基酸序列和在位置S2处的取代,或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的变体,或与其具有至少约80%、至少约90%、或至少约93%、或至少约95%、或至少约98%同一性的核苷酸序列。在实施方案中,取代是非极性脂肪族氨基酸,任选G、A、V、L、I和P之一,任选S2A。在实施方案中,酶在C端不具有额外的残基。在实施方案中,酶具有一个或多个赋予高活性的突变,例如,选自S8X1、C13X2和/或N125X3,例如并且其中X1选自G、A、V、L、I和P,X2选自K、R和H,并且X3选自K、R和H,例如,X1是P,X2是R,和/或X3是K。在实施方案中,所述方法还包括使细胞与包含转座子的构建体接触和/或所述酶与编码转座子的核酸共同配制(例如,在LNP中)。在实施方案中,共制剂包含编码酶的核酸和编码转座子的核酸。
在一些实施方案中,包含SEQ ID NO:2的氨基酸序列的MLT转座酶包含一个或多个选自以下的突变:S8P和/或C13R,以及R164N、W168V、M278A、K286A、R287A、R333A、K334A、N335A、K349A、K350A、K368A、K369A和D416N之一。
在一些实施方案中,包含SEQ ID NO:2的氨基酸序列的MLT转座酶包含一个或多个选自以下的突变:S8P和/或C13R,以及R164N、W168V、M278A、K286A、R287A、R333A、K334A、N335A、K349A、K350A、K368A、K369A和D416N之一,和/或E284A、K286A、R287A、N310A、R333A、K334A、R336A、K349A、K350A、K368A和K369A中的一者或多者。
在一些实施方案中,包含SEQ ID NO:2的氨基酸序列的MLT转座酶包含一个或多个选自以下的突变:S8P和/或C13R,以及R164N、W168V、M278A、K286A、R287A、R333A、K334A、N335A、K349A、K350A、K368A、K369A和D416N之一,和/或E284A、K286A、R287A、N310A、R333A、K334A、R336A、K349A、K350A、K368A和K369A中的一者或多者,和/或一个R336A。
在实施方案中,提供了一种用于离体治疗疾病或病症的方法,所述方法包括使细胞与包含转座酶(例如,MLT转座酶)的组合物接触,所述转座酶具有SEQ ID NO:2的氨基酸序列和在位置S2处的取代,或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的变体,或包含具有SEQ ID NO:3的核苷酸序列或与其具有至少约80%、至少约90%、或至少约93%、或至少约95%、或至少约98%同一性的核苷酸序列的转座酶(例如,MLT转座酶)。
在实施方案中,提供了一种用于体内治疗疾病或病症的方法,所述方法包括施用包含转座酶(例如,MLT转座酶)的组合物,所述转座酶具有SEQ ID NO:2的氨基酸序列和在位置S2处的取代,或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的变体,或包含具有SEQ ID NO:3的核苷酸序列或与其具有至少约80%、至少约90%、或至少约93%、或至少约95%、或至少约98%同一性的核苷酸序列的转座酶(例如,MLT转座酶);或包含含有转座酶(例如,MLT转座酶)的组合物的细胞,所述转座酶具有SEQ ID NO:2的氨基酸序列和在位置S2处的取代,或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的变体,或包含具有SEQ ID NO:2的核苷酸序列或与其具有至少约80%、至少约90%、或至少约93%、或至少约95%、或至少约98%同一性的核苷酸序列的转座酶(例如,MLT转座酶)。
在实施方案中,本发明MLT转座酶,例如具有SEQ ID NO:2的氨基酸序列或其变体(和任选的一个或多个高活性突变),证明了相对于piggyBac改善的整合效率。在实施方案中,具有SEQ ID NO:2的氨基酸序列和S8P、C13R和/或N125K的本发明MLT转座酶证明了相对于piggyBac改善的整合效率。
在实施方案中,本发明MLT转座酶,例如具有SEQ ID NO:2的氨基酸序列或其变体(和任选的一个或多个高活性突变),可以呈RNA或DNA的形式并且具有一个或两个N端核定位信号(NLS)以更有效地将蛋白质穿梭至细胞核中。举例来说,在实施方案中,本发明MLT转座酶还包含一个、两个、三个、四个、五个或更多个NLS。NLS的实例在Kosugi等(J.Biol.Chem.(2009)284:478-485;以引用的方式并入本文中)中提供。在特定实施方案中,NLS包含共有序列K(K/R)X(K/R)(SEQ ID NO:348)。在一个实施方案中,NLS包含共有序列(K/R)(K/R)X10-12(K/R)3/5(SEQ ID NO:349),其中(K/R)3/5表示五个氨基酸中的至少三者是赖氨酸或精氨酸。在一个实施方案中,NLS包含c-myc NLS。在特定实施方案中,c-myc NLS包含序列PAAKRVKLD(SEQ ID NO:350)。在特定实施方案中,NLS是核质蛋白NLS。在特定实施方案中,核质蛋白NLS包含序列KRPAATKKAGQAKKKK(SEQ ID NO:351)。在特定实施方案中,NLS包含SV40大T抗原NLS。在特定实施方案中,SV40大T抗原NLS包含序列PKKKRKV(SEQ IDNO:352)。在特定实施方案中,NLS包含三个SV40大T抗原NLS(例如,DPKKKRKVDPKKKRKVDPKKKRKV(SEQ ID NO:353))。在各种实施方案中,NLS可以包含上述序列中的突变/变异,使得它们含有1个或多个取代、添加或缺失(例如,约1个、或约2个、或约3个、或约4个、或约5个、或约10个取代、添加或缺失)。
在一些实施方案中,转座酶来自1型LEAP-IN或LEAP-IN转座子系统(BiotechnolJ.2018年10月;13(10):e1700748.doi:10.1002/biot.201700748.Epub 2018年6月11日)。
在一些实施方案中,非病毒载体包括1型LEAP-IN的LEAPIN转座酶(ATUM,Newark,CA)。LEAPIN转座酶系统包括转座酶(例如,转座酶mRNA)和含有一个或多个所关注的基因(转座子)、选择标志、调控元件、绝缘子等的载体,侧翼是转座子同源反向末端和转座识别基序(TTAT)。在共转染载体DNA和转座酶mRNA后,瞬时表达的酶催化转座子盒的单个拷贝(末端之间的所有序列)在跨宿主细胞基因组的一个或多个位点处的高效和精确整合。Hottentot等Genotyping:Methods and Protocols.White SJ,Cantsilieris S编:185-196。(New York,NY:Springer):2017.第185-196页。LEAPIN转座酶产生具有各种优势特征的稳定转基因整合体,包括在多个基因组基因座处的单个拷贝整合,主要在开放染色质区段中;没有有效载荷限制,因此可以从单个构建体中表达多个独立的转录单位;整合的转基因维持其结构和功能完整性;并且转基因完整性的维持确保了每个重组细胞中所需的链比率。
此外,LEAPIN转座酶具有自失活机制。位于转座酶构建体的内含子内的3'-TRE在空间上分隔启动子区域。因此,在转座期间从质粒中酶促切除位于TTAA(SEQ ID NO:1)位点之间的转座子引起启动子与LEAPIN转座酶构建体的5'末端分离。如果以非转座方式插入基因组中,那么处于剩余质粒骨架中的现在无启动子转座酶会失活,从而减少宿主细胞中的基因毒性作用。这可以阻止任何可能被错误合成的mRNA构建体的蛋白质合成。Urschitz等,Proc Natl Acad Sci U S A 2010;107:8117-22。
在一些实施方案中,本发明双重系统包含编码转基因的DNA质粒和编码转座酶(例如,LEAPIN转座酶)的RNA。在一些实施方案中,使用编码转座酶的mRNA可以具有优于递送编码转座酶的DNA分子的许多优点。参见例如Wilber等Mol Ther 2006;13:625-30。优点包括改善对转座酶表达持续时间的控制,最大限度地减少组织中的持久性,以及在初始转座事件后转基因再动员和再插入的潜力。此外,编码转座酶的RNA序列可能无法整合至宿主基因组中,从而消除了关于长期转座酶表达和对所关注基因的不稳定影响的问题。此外,在一些实施方案中,双重质粒DNA转座子/RNA转座酶系统呈脂质纳米颗粒(LNP)的形式,以防止细胞外RNA降解,这改善了体内使用。
在一些实施方案中,转基因可以与各种调控元件相关联,选择这些调控元件以确保具有转基因的构建体的稳定表达。因此,在一些实施方案中,转基因可以由非病毒载体(例如,DNA质粒)编码,所述载体可以包含一个或多个防止或减少附近的基因活化或失活的绝缘子序列。绝缘子位于转座子(转基因盒)的侧翼,以减少染色体序列赋予的转录沉默和位置效应。作为额外作用,绝缘子可以消除转基因增强子和启动子序列与相邻染色体序列的功能相互作用。在一些实施方案中,一个或多个绝缘子序列包含HS4绝缘子(1.2-kb 5'-HS4鸡β-珠蛋白(cHS4)绝缘子元件)和D4Z4绝缘子(与面肩胛肱骨营养不良(FSHD)有关的串联大卫星重复)。在一些实施方案中,HS4绝缘子和D4Z4绝缘子的序列如Rival-Gervier等Mol Ther.2013年8月;21(8):1536-50中所描述,所述文献以全文引用的方式并入本文中。
所描述的方法通过将能够通过转座进行靶向基因组整合的酶(例如但不限于转座酶)融合至DNA结合TALE或dCas9/gRNA来增强所述酶以将整合靶向GSHS,这可能在具有开放染色质的区域中。在实施方案中,编码酶的核酸(例如,DNA)以第一部分和第二部分的形式编码酶,在第一部分与第二部分之间编码内含肽,使得第一部分和第二部分在翻译后切除酶中的内含肽后融合至功能酶中。与使用非嵌合转座酶的方法相比,所描述的方法提供减少的插入诱变或肿瘤发生。此外,在一些实施方案中,所述方法用于治疗有需要的患者的遗传性或获得性疾病。
在实施方案中,提供了一种转基因生物体,所述生物体可以包含已经通过本公开的方法转化的细胞。在实施方案中,生物体可以是哺乳动物或昆虫。当生物体是哺乳动物时,生物体可以包括但不限于小鼠、大鼠、猴、狗、兔等。当生物体是昆虫时,生物体可以包括但不限于果蝇、蚊、棉铃虫等。
组合物可以与施用说明书一起包括于容器、试剂盒、包装或分配器中。
本文还提供了包含以下的试剂盒:i)本发明的前述基因转移构建体中的任一者,和/或本发明的前述细胞中的任一者,以及ii)容器。在某些实施方案中,所述试剂盒还包括其使用说明书。在某些实施方案中,前述试剂盒中的任一者还可以包括包含编码转座酶的核酸序列的重组DNA构建体。
在实施方案中,根据本公开的实施方案的组合物与药学上可接受的载体组合呈药物组合物的形式。“药学上可接受的载体”(也称作“赋形剂”或“载体”)是药学上可接受的溶剂、悬浮剂、稳定剂或用于将一种或多种治疗化合物递送至受试者(例如哺乳动物,诸如人类、非人类灵长类动物、狗、猫、绵羊、猪、马、牛、小鼠、大鼠或兔)的任何其它药理学惰性媒剂,所述载体在所采用的剂量和剂量下对暴露于其中的细胞或受试者是无毒的。药学上可接受的载体可以是液体或固体,并且可以按所考虑的计划施用方式进行选择,以在与一种或多种治疗化合物和给定药物组合物的任何其它组分组合时,提供所需的体积、一致性以及相关运输和化学特性。不会与氨基酸发生有害反应的典型药学上可接受的载体包括例如但不限于:水、盐水溶液、粘合剂(例如,聚乙烯吡咯烷酮或羟丙基甲基纤维素);填充剂(例如,乳糖和其它糖、明胶或硫酸钙)、润滑剂(例如,淀粉、聚乙二醇或乙酸钠)、崩解剂(例如,淀粉或羟基乙酸淀粉钠)和润湿剂(例如,月桂基硫酸钠)。药学上可接受的载体还包括水性pH缓冲溶液或脂质体(由可用于向哺乳动物递送药物的各种类型的脂质、磷脂和/或表面活性剂组成的小囊泡)。药学上可接受的载体的其它实例包括缓冲剂,诸如磷酸盐、柠檬酸盐和其它有机酸;抗氧化剂,诸如抗坏血酸;低分子量(少于约10个残基)多肽;蛋白质,诸如血清白蛋白、明胶或免疫球蛋白;亲水聚合物,诸如聚乙烯吡咯烷酮;氨基酸,诸如甘氨酸、谷氨酰胺、天冬酰胺、精氨酸或赖氨酸;单糖、二糖和其它碳水化合物,包括葡萄糖、甘露糖或糊精;螯合剂,诸如EDTA;糖醇,诸如甘露醇或山梨醇;成盐抗衡离子,诸如钠;和/或非离子表面活性剂,诸如TWEENTM、聚乙二醇(PEG)和PLURONICSTM
药物组合物可以通过将一种或多种活性剂与一种或多种生理上可接受的载体、稀释剂和/或佐剂以及任选的通常掺入制剂中以提供改善的转移、递送、耐受性等的其它剂混合来配制。药物组合物可以配制为例如冻干制剂、水溶液、分散体或固体制剂,诸如片剂、糖衣丸或胶囊。在所有药物化学家已知的处方集中可以找到大量的适当制剂:Remington'sPharmaceutical Sciences(第18版,Mack Publishing Company,Easton,PA(1990)),特别是其中的Block,Lawrence的第87章。这些制剂包括例如粉末、糊剂、软膏、凝胶剂、蜡、油、脂质、含有脂质(阳离子或阴离子)的囊泡(诸如LIPOFECTINTM)、DNA缀合物、无水吸收糊剂、水包油和油包水乳液、乳液碳蜡(各种分子量的聚乙二醇)、半固体凝胶和含有碳蜡的半固体混合物。前述混合物中的任一者可能适于如本文所描述的治疗和疗法,前提条件是制剂中的活性剂没有被制剂灭活并且制剂与施用途径生理相容并可耐受。还参见Baldrick,RegulToxicol Pharmacol 32:210-218,2000;Wang,Int J Pharm 203:1-60,2000;Charman JPharm Sci 89:967-978,2000;以及Powell等PDA J Pharm Sci Technol 52:238-311,1998,以及其中引用的与药物化学家熟知的制剂、赋形剂和载体有关的额外信息。
药物组合物包括但不限于溶液、乳液、水性悬浮液和含脂质体的制剂。这些组合物可以由多种组分产生,包括例如预制液体、自乳化固体和自乳化半固体。乳液通常是两相体系,由两种彼此紧密混合和分散的不混溶的液相组成;一般来说,乳液具有油包水(w/o)或水包油(o/w)种类。乳液制剂因其易于配制以及溶解、吸收和生物利用度的功效而已经广泛用于治疗剂的口服递送。
组合物和制剂可以含有无菌水溶液,还可以含有缓冲剂、稀释剂和其它适合的添加剂(例如,渗透增强剂、载体化合物和其它药学上可接受的载体)。组合物另外可以含有药物组合物中常规发现的其它辅助组分。因此,组合物还可以包含相容的药学活性物质,诸如止痒剂、收敛剂、局部麻醉剂或消炎剂,或可用于物理配制本文所提供的组合物的各种剂型的额外物质,诸如染料、调味剂、防腐剂、抗氧化剂、遮光剂、增稠剂和稳定剂。此外,组合物可以与助剂混合,例如,润滑剂、防腐剂、稳定剂、润湿剂、乳化剂、用于影响渗透压的盐、缓冲剂、着色剂、调味剂和芳香物质。然而,当添加时,此类物质不应过度干扰本文所提供的组合物内的多肽组分的生物活性。必要时,可以对制剂进行灭菌。
在一些实施方案中,包括如本文提供的组合物的药物组合物可以至少部分地呈溶液或粉末的形式,具有或不具有稀释剂以制备可注射悬浮液。组合物可以包括额外成分,包括但不限于药学上可接受的媒剂,诸如盐水、水、乳酸、甘露醇或它们的组合。
可以使用任何适当的方法向哺乳动物施用如本文所描述的组合物。举例来说,施用可以是肠胃外的(例如,通过皮下、鞘内、心室内、肌肉内或腹膜内注射,或通过静脉内滴注)。施用可以是快速的(例如,通过注射)或可以在一段时间内进行(例如,通过缓慢输注或施用缓释制剂)。在一些实施方案中,施用可以是局部的(例如,经皮、舌下、眼部或鼻内)、肺部(例如,通过吸入或吹入粉末或气雾剂)或口服。另外,含有如本文所描述的组合物的组合物可以在肿瘤的手术切除之前、之后或代替肿瘤的手术切除而施用。
通过以下非限制性实施例进一步说明本发明。
实施例
实施例1-设计靶向人类基因组安全港位点(GSHS)的具有转录激活子样效应子 (TALE)DNA结合结构域(DBD)或dCas9/gRNA的嵌合转座酶
在本实施例中,使用人类GSHS TALE或dCas9/gRNA DBD设计嵌合转座酶。图1A-1D和图2描绘了使用人类GSHS TALE或dCas9/gRNA DBD设计的嵌合转座酶的表示。图1A.TALE包括核定位信号(NLS)和激活结构域(AD),以用作转录激活子。中央串联重复结构域赋予特定的DNA结合和宿主特异性。易位信号(TD)以及启动DNA结合和识别5'-T0所需的四个神秘重复位于N端(方格矩形)。CRD中每个长度为34个氨基酸(aa)的重复结合至一个核苷酸,其特异性主要由位置13处的aa决定。一个样品重复示于蛋白质方案下方。数字12/13是指重复内的aa位置。参见Jankele等,Brief Funct Genomics 2014;13:409-19。图1B.示出了对一个或几个核苷酸具有特异性的重复类型。仅示出了DNA前导链的碱基。图1C.具有通过长度大于23个氨基酸的连接子与其融合的TALE DNA结合蛋白的嵌合转座酶(顶部)。参见Hew等,Synth Biol(Oxf)2019;4:ysz018。图1D.TALE与GSHS的结合将转座酶物理隔离至相同位置并促进转座至靠近重复可变二残基(RVD)核苷酸序列的附近TTAA(SEQ ID NO:1)序列。所有RVD前面都有胸腺嘧啶(T),以结合至图1A中所示的NTR。所有这些GSHS区域都处于开放染色质中并且对转座酶活性敏感。
图2是根据本公开的实施方案的系统的非限制性表示,所述系统包含编码能够通过转座进行靶向基因组整合的酶的核酸(例如,辅助体RNA)和编码转座酶的核酸(供体DNA)。辅助体RNA被翻译成生物工程化酶(例如,整合酶、重组酶或转座酶),所述酶识别特定末端并以位点特异性方式将供体DNA无缝插入人类基因组中,而没有足迹。所述酶可以在开放染色质处形成二聚体或四聚体,以在靠近dCas9/gRNA或TALE靶向的DNA结合区的TTAA(SEQ ID NO:1)识别位点处插入供体DNA。dCas9/gRNA与TALE GSHS的结合将酶物理隔离至相同位置并促进转座至附近的TTAA(SEQ ID NO:1)序列(参见图3和图4)。
图1C还说明了包含连接至一个或多个向导RNA的dCas9的(底部)嵌合转座酶构建体。工程化嵌合转座酶可以包括:向导RNA(gRNA)和失活的Cas蛋白质。gRNA是由Cas结合所必需的支架序列和用户定义的约20个核苷酸间隔子组成的短合成RNA,所述间隔子定义了有待修饰的基因组靶标。因此,Cas蛋白质的基因组靶标基于gRNA中存在的序列。图4示出了将转座酶物理隔离至GSHS并促进转座至附近的TTAA(SEQ ID NO:1)序列的gRNA序列。
图8A-8D描绘了构建体模板的实例。图8A描绘了转录转座酶RNA的质粒构建体模板,所述转座酶RNA稍后用5'-m7G cap1和假尿苷取代进行加工。可以取代其它转座酶。图8B描绘了可以用于转移任何转基因的(通用)MLT供体DNA构建体模板。可以取代其它dCas9/gRNA和转座酶。
实施例2-表征小棕蝠(M.lucifugus)MLT转座酶及其高活性形式的转座活性
本研究部分地旨在功能上表征小棕蝠(MLT)转座酶,包括MLT转座酶的单体、二聚体、四聚体、高活性和Int-形式的转座活性。在本公开中发现的具有L573del、E574del和S2A突变的MLT转座酶蛋白质可以称作根据本公开的工程化的、校正的MLT转座酶。
图5A和5B描绘了来自MLT转座酶DNA和MLT转座酶蛋白质的高活性、切除阳性和整合缺陷(Int-)MLT突变体。对于每个突变体,图5A示出了相对于未突变的野生型MLT转座酶的核苷酸变化和相应氨基酸变化,所述转座酶具有SEQ ID NO:4的氨基酸序列并且由SEQID NO:5的核苷酸序列编码。图5B示出了MLT转座酶骨架和各种MLT突变体(1、2和3)中的突变。
图6A描绘了显示DNA结合结构域的具有100%置信度的三维MLT蛋白质结构(红色)。三维MLT蛋白质结构使用Phyre2(Protein Homology/AnalogY Recognition Engine)产生,Kelley LA等Nature Protocols 10,845-858(2015)。图6B描绘了使用Phyre2对MLT的二级结构预测。
图7描绘了piggyBac(“粉纹夜蛾”)转座酶与MLT(“小棕蝠”)转座酶(两种不同序列)和蝙蝠转座酶大鼠耳蝠(四种不同序列)和马来大狐蝠的氨基酸序列比对。序列获自Jebb等,Nature,第583卷,第578-584页(2020),以全文引用的方式并入本文中。在图7中,使用
Figure BDA0003926853220000781
软件(来自GSL Biotech)生成的比对是与共有序列的比对。与参考(共有)匹配的氨基酸,即,高度保守的哺乳动物转座酶序列,用黄色突出标记。共有阈值大于50%。
在本实施例中,图3、图4和图7中所示的序列或任何其它序列用于测试MLT突变体的不同组合,以鉴定用于靶向具有位点特异性TALE或dCas9/gRNA的基因组安全港位点的候选者。高活性、切除阳性或Int-MLT突变体可以通过合成性DNA合成,通过取代图5A和5B中在本文所描述的MLT转座酶,例如核苷酸和氨基酸序列中的突变来产生。
在本实施例中,例如国际申请WO2010085699(以全文引用的方式并入本文中)的实施例8中所描述的基因测定可以用于筛选频率增加的Ura+回复。基因测定使用酵母URA3基因的修饰型式作为转座子供体,用于切除酵母(酿酒酵母(Saccharomyces cerevisiae))中的MLT。
实施例3-表征本公开的piggyBac、野生型MLT转座酶和工程化MLT转座酶的整合效
本研究的一个目的是评估已知的高活性piggyBac转座酶(包括来自公开来源的那些转座酶)和根据本公开的工程化MLT转座酶的整合效率。野生型小棕蝠转座酶(MLT)序列描述于WO2010/085699公布(PCT/US2010/021871)和Mitra等,PNAS 2013;110:234中。来自Mitra等(2013)的转座酶的核苷酸序列与具有SEQ ID NO:3的核苷酸序列的本公开的MLT转座酶(称作“MLT”)具有77%序列同一性。参见图10,描绘了高活性MLT(针对RNA进行人类密码子优化)和来自Mitra等(2013)的公开序列的核苷酸序列比对(同一性77.67%,间隙1.44%)。MLT的核苷酸序列和来自WO2010085699的核苷酸序列具有73.68%同一性(间隙1.16%),如图11中所示,包含它们的比对。
此外,本公开的工程化MLT转座酶的末端序列不同于Mitra等(2013)(参见Ray等,Genome Res 2008;18:717)提及的那些序列。图14和图15示出了与来自Ray等,2018的公开序列的左末端和右末端相比,工程化MLT转座酶的左末端和右末端。
图12说明了工程化高活性MLT转座酶(L573del/E574del/S2A,具有S8P、C13R和N125K突变,“MLT”)和Mitra等的公开序列的氨基酸比对。(氨基酸序列之间的差异加下划线并加粗)。如图12中所示,来自Mitra等的氨基酸序列相对于本公开的MLT转座酶含有两个额外的C端氨基酸。
图13说明了工程化高活性MLT转座酶(L573del/E574del/S2A,具有S8P和C13R突变,“MLT”)和来自WO2010085699的公开序列的氨基酸比对(氨基酸序列之间的差异加下划线并加粗)。与本公开的MLT转座酶的氨基酸序列相比,来自WO2010085699公布的序列具有多个氨基酸残基变化。WO2010085699描述了包含如图13中所示的序列的氨基酸变化的高活性转座酶,所述氨基酸变化选自A14V、D475G、P491Q、A561T、T546T、T300A、T294A、A520T、G239S、S5P、S8F、S54N、D9N、D9G、I345V、M481V、E11G、K130T、G9G、R427H、S8P、S36G、D10G、S36G和沉默的。
图9A和9B是说明本公开的工程化MLT转座酶和其它(已知)转座酶的整合效率的评估结果的条形图。图9A说明了来自Yusa等PNAS 2010;108:1531-1536的高活性piggyBac转座酶的整合效率(参见图16A、16B、16C和16D),与piggyBac供体(CMV-GFP,参见图15)一起使用,对比本公开的工程化MLT转座酶(S8P/C13R/S2A/L573del/E574del MLT),与MLT供体(CMV-GFP,参见图16,示出了DNA供体构建体模板的实例)一起使用。
研究中所用的高活性piggyBac氨基酸序列示于图9A和图9B中(来自Yusa等(2010),具有I30V、S103P、G165S、M282V、S509G、N538K和N571S突变,以粗体和下划线显示),如下:
Figure BDA0003926853220000801
研究中所用的高活性piggyBac核苷酸序列示于图9A和图9B中(突变密码子加下划线并加粗),如下:
Figure BDA0003926853220000811
研究中所用的高活性piggyBac左ITR核苷酸序列示于图9A和图9B中(205bp),如下:
Figure BDA0003926853220000812
研究中所用的高活性piggyBac右ITR核苷酸序列示于图9A和图9B中(310bp),如下:
Figure BDA0003926853220000813
如图9A中所示,本公开的MLT转座酶具有比来自Yusa等(2010)的转座酶更高的整合效率。发明人已经发现不存在最后两个氨基酸(L573del、E574del)的转座酶序列具有比存在那些末端氨基酸的转座酶更高的效率。
图9B说明了与piggyBac突变体的整合效率相比,本公开的工程化MLT的整合效率。图9B示出了以下的整合效率百分比:a)高活性piggyBac(来自Yusa等(2010),参见SEQ IDNO:17、18、19和20)+piggyBac供体(参见图16);b)仅高活性piggyBac供体(参见图16);c)仅MLT供体(参见图16);d)野生型MLT+MLT供体;e)MLT N125K+MLT供体;f)MLT S8P/C13R+MLT供体;g)本公开的工程化MLT(MLT S8P/C13R/L573del/E574del)+MLT供体;以及h)高活性piggyBac二聚体+piggyBac供体。高活性piggyBac供体(b)和MLT供体(c)用作对照。如图9A和图9B中所示,本公开的工程化MLT具有与高活性piggyBac+piggyBac供体系统相当的整合效率。
实施例4-HeLa和HEK293细胞中高活性MLT转座酶变体的体外分析
本研究示出了在根据本公开的哺乳动物转座酶(MLT转座酶)中发现新颖突变,以通过评价高活性突变体的相对整合效率而改善其切除能力(Exc+)。本研究详述了HeLa和HEK293细胞中高活性MLT转座酶突变体的分析。
用于哺乳动物细胞整合测定的DNA。
一种双质粒转座测定,使用包含携带GFP基因和杀稻瘟素抗性(BsdR)盒的转座子的供体质粒和在巨细胞病毒(CMV)启动子下表达转座酶的辅助体质粒来测量转座。昆虫piggyBac供体质粒含有由CMV启动子驱动的GFP和BsdR盒,侧翼是ZeoCassetteTM载体(pCMV/Zeo)(Thermo Fisher Scientific)骨架中的末端序列。昆虫piggyBac辅助体质粒含有克隆至pcDNA3.1 myc His A-His(Invitrogen)中的piggyBac ORF。对于MLT供体质粒,使用特异性引物对来自昆虫piggyBac哺乳动物供体pCMV/miniPB-GFP-Bsd的GFP-Bsd盒进行PCR扩增。将片段消化并克隆至MLT供体质粒中。在MLT哺乳动物辅助体质粒中,酶用HA标签作标记。使用来自基因5'末端的引物和来自基因3'末端的引物从质粒对MLT ORF进行PCR扩增。将PCR产物消化并克隆至质粒中。合成并评价假定的催化结构域中的各种突变。
哺乳动物细胞整合测定。
使HeLa细胞在DMEM+10% FBS+青霉素-链霉素中生长。根据制造商的方案,在OPTI-MEM培养基(Life Technologies)中用具有FuGENE-HD(Roche)的供体(294nM)和辅助体(42nM)质粒转染HeLa细胞(2×105)。用供体质粒和空pCDNA3.1/myc-His A转染的细胞是非转座酶对照。转染46小时后,使细胞胰蛋白酶化并且在如上文所描述的适当DMEM+杀稻瘟素(3.5μg/mL)中连续稀释。每24小时施用含抗生素的新鲜培养基并持续21天。21天后,将细胞用4%多聚甲醛固定并用0.2%亚甲蓝染色,并且对蓝色集落进行计数。
结果
图17A和17B示出了HeLa细胞中高活性MLT转座酶突变体的功能评估结果。图17A示出了哺乳动物转座酶(Ts)变体S8P、C13R、N125K和S8P/C13R具有比天然酶更高的切除和整合频率。图17B示出了用供体新霉素转基因转染的HeLa细胞中的功能性转基因表达,以1:20连续稀释。哺乳动物MLT转座酶变体S8P/C13R显示出与HeLa细胞中的昆虫piggyBac相当的相对整合。
图18示出了MLT转座酶高活性突变体在HEK293细胞中的相对整合频率。双突变体A/C显示在HEK293细胞中观察到最高的整合效率。
MLT转座酶在人类培养的HeLa和HEK293中成功转座。使用双质粒共转染测定,其中供体质粒携带包含抗生素抗性标志的转座子和表达转座酶的辅助体质粒,从而测量转座子抗生素标志的转座酶依赖性染色体整合。发现使用高活性MLT转座酶的相对整合频率与HeLa细胞中的昆虫野生型和高活性piggyBac相当(图17A和17B),但在HEK293细胞中约为50%(图18)。
在本研究中,哺乳动物MLT转座酶高活性变体D和A/C的相对整合效率与HeLa细胞中的昆虫piggyBac相当。这些变体在HEK293细胞中也显示出整合高活性。
实施例5-MLT转座酶蛋白质分离和纯化
本研究的一个目的是分离MLT转座酶蛋白质。
蛋白质表达和纯化
将本公开的全长MLT转座酶的基因针对哺乳动物表达进行密码子优化并克隆至pD2610表达载体中,介于BamHI与KpnI限制性位点之间,在N端麦芽糖结合蛋白(MBP)标签的下游,继之以TEV蛋白酶分裂位点。使用标准PEI转染方案将质粒pD2610-MPB-MLT转座酶转染至500ml EXPI293F细胞(Thermo Fisher Scientific)中用于瞬时蛋白质表达。24小时后,向转染的细胞提供1L Expi293表达培养基。转染后3天以300×g收获细胞并储存在-80℃下。将表达MBP标记的MLT转座酶的细胞再悬浮于含有25mM Tris-Cl(pH 7.5)、500mMNaCl、1mM TCEP和蛋白酶抑制剂混合液(Roche)的裂解缓冲液中。通过三个循环的超声处理使细胞裂解。在4℃下使细胞裂解物以约95,000×g离心30分钟(Beckman Coulter OptimaL-100XP超速离心机,45型Ti转子)。过滤上清液并且与用裂解缓冲液平衡的10ml直链淀粉树脂(New England BioLabs)混合。连续旋转一小时后,将混合物加载至重力流柱上并用100ml裂解缓冲液洗涤。用50ml洗脱缓冲液(25mM Tris-Cl(pH 7.5)、500mM NaCl、10mM麦芽糖、1mM TCEP和蛋白酶抑制剂混合液)洗脱蛋白质。将洗脱液与TEV蛋白酶一起孵育,并且在4℃下用透析缓冲液(50mM Tris-Cl(pH 7.5)、500mM NaCl和1mM TCEP)透析16-20小时。通过肝素洗脱分离分裂的MBP标签和MLT转座酶。将样品体积置于连接至AKTA系统的Superdex200柱上,所述系统配备有自动进样器并安装有UNICORN系统控制软件。在260nm和280nm下监测洗脱的蛋白质。对于数据分析,使用QtiPlot软件。将纯化的MLT转座酶储存在-80℃下。在2.2mg/mL或约1mg/L细胞培养下,产量为0.45mL。
结果
图19A和19B示出了十二烷基硫酸钠-聚丙烯酰胺凝胶电泳的图像。图19A示出了通过直链淀粉树脂柱对纯化的MBP-MLT转座酶融合蛋白的分析。从直链淀粉树脂柱上的超声处理细菌的上清液中纯化表达的蛋白质(MBP-MLT转座酶)之后,通过SDS-PAGE鉴定出100+kDa的主要蛋白质条带。图19B中示出了通过TEV蛋白酶和肝素洗脱使MBP标签分裂过夜之后显示出67.5kDa MLT转座酶特异性条带。
用直链淀粉琼脂糖树脂对MBP MLT转座酶融合蛋白进行亲和色谱法,继而进行逐步洗脱。通过SDS-PAGE分析加载的样品、流过物、洗涤物和洗脱的蛋白质以显示含有MBP-MLT转座酶纯化的蛋白质的池峰级分(图19A)。通过SDS PAGE以66-68kD大小的肝素洗脱将MLT转座酶与MBP标签分离(图19B)。
图20示出了Superdex尺寸排阻色谱。将样品体积的纯化的MLT转座酶加载至Superdex 200柱上。在260nm和280nm处洗脱的蛋白质峰表明了二聚体形成。因此,色谱型态指示MLT转座酶作为二聚体存在(图20)。
本研究证明DNA结合蛋白可以作为融合蛋白产生,以能够进行更特异性的纯化,但它们结合DNA的能力也能够使用肝素作为配体进行亲和纯化。本研究还显示本公开的MLT转座酶是分子量约为67.5kD并作为二聚体存在的DNA结合蛋白。
实施例6-评估MLT转座酶与PiggyBac转座酶之间的整合型态差异
本研究的一个目的是评估源自昆虫的PiggyBac(PB)转座酶与本公开的非特异性的源自哺乳动物的MLT转座酶之间的整合模式差异。比较涉及分子大小、蛋白质长度、识别末端、RefSeq基因中的整合、±5kb转录起始位点、距CpG岛±5kb和免疫原性的比较。DNAMLT辅助体构建体的实例示于图21中。
一般来说,MLT转座酶和PiggyBac转座酶当作为DNA递送时在整合和分子特征方面是相似的,如表1中所示。
表1.piggyBac和MLT DNA转座酶的某些特性的比较。
Figure BDA0003926853220000861
本文进行的比较显示MLT和piggyBac当作为DNA递送时具有相似的特征。表1中的比较还显示MLT转座酶比piggyBac转座酶更安全,并且因此在整合期间不太可能导致不希望的基因破坏或激活。
实施例7-高活性MLT转座酶和高活性piggyBac的整合效率的比较
本研究的一个目的是评估源自昆虫的转座酶PiggyBac(PB)(I30V/G165S、S103P、M282V、S509G/N570S、N538K)的最高活性形式和根据本公开的高活性的、非特异性的源自哺乳动物的转座酶MLT转座酶(具有S8P/C13R突变)(本文中称作hypMLT)的整合效率差异。
高活性piggyBac(hypPB)转座酶[含有七个突变-I30V/G165S、S103P、M282V、S509G/N570S、N538K-(7pB)]用于体外人类细胞中的基因转移和体内小鼠体细胞中的基因转移。尽管蛋白质水平表达与天然PB相似,但hypPB显著提高了HEK293和HeLa培养的人类细胞中新霉素抗性盒转座子的基因转移效率。天然PB和SB100X是睡美人转座子系统中最有活性的转座酶,在培养的人类细胞系中展现出相似的转座效率。与piggyBac和SB100X相比,当离体递送至原代人类T细胞时,hypPB将基因递送增加二至三倍。在小鼠体内使用流体动力学尾静脉注射有限剂量的转座酶DNA与荧光素酶报告转座子的组合,将hypPB与天然PB和SB100X进行比较。监测转基因表达长达6个月,并且与注射天然PB或SB100X的小鼠相比,观察到注射hypPB的小鼠中的长期基因表达约高10倍。
方法
·在转染前一天将HEK293细胞接种于12孔尺寸板中。
·转染当天,在进行转染前1小时30分钟更换培养基。
·根据制造商的方案(Sigma-Aldrich)使用X-tremeGENETM9DNA转染试剂。
·一式两份共转染含有GFP的供体质粒和辅助体质粒(各600ng)。对于每个一式两份转染将供体DNA混合,并且将1200ng辅助体RNA(转座酶)与1200ng供体DNA混合,总共2400ng。使用3:1比率的X-tremeGENETM9DNA转染试剂;因此,每个一式两份实验具有2400ngDNA并使用7.2ul X-tremeGENETM9DNA转染试剂。
·使用两种不同供体质粒,一种用于hypPB并且一种用于hypMLT。将所有PB转座酶与PB供体混合,但不与MLT供体混合。
·转染后48小时,通过流式细胞术分析细胞,并且对GFP表达细胞的百分比(%)进行计数,以测量瞬时转染效率。对细胞进行门控以将它们与碎片相区分,并且各自计数20,000个细胞。GFP门控是自由的,因此即使GFP-dim细胞也作为GFP阳性(GFP+)细胞进行计数。
·在没有抗生素的情况下培养细胞15-20天。细胞每周传代2/3次。
·流式细胞术用于GFP表达细胞的百分比(%),以测量2周时的整合效率(计数80,000个细胞)。门控是保守的,因此在明显明亮的群体周围绘制门并排除极暗淡的细胞。
·通过用2周%GFP细胞除以48小时来计算最终整合效率。
结果
图22A示出了无MLT、MLT-dCas9、MLT-dCas12j、高活性piggyBac-dCas12j、高活性piggyBac-dCas9、高活性piggyBac和MLT的整合活性%。图22B示出了无MLT、MLT-内含肽-N端、MLT1和MLT2的切除活性%。图22C示出了无MLT、MLT-内含肽-N端、MLT1和MLT2的整合活性%。图22D示出了无MLT、MLT-Cas12j、MLT-Cas9、MLT-内含肽-N端Cas9、MLT-内含肽-N端、MLT-内含肽-N端TALE、MLT-TALE10和MLT的切除活性%。
图22A示出了与MLT转座酶(MLT2)相比,高活性形式的piggyBac(hypPB)的整合效率。高活性MLT转座酶的整合效率(约28%)大于通常用于细胞和基因疗法的高活性形式的piggyBac的整合效率(约24%)。通过添加死亡的Cas(dCas)结合子来降低整合效率。添加使切除活性从30%降至18%(图22D)。向MLT中添加dCas使切除活性降至8%(图22D)。
实施例8-人类ROSA26基因组安全港位点靶向的体外分析
本研究的一个目的是评估RNA指导的转座将转座酶引导至人类安全港位点ROSA26的功效。
在本研究中,研究了一组含有天然piggyBac DBD中的突变的RNA指导的转座酶载体靶向人类ROSA26安全港位点的能力。
质粒开发
靶向piggyBac质粒的表示示于图23A、23B、23C、23D和23E中。图23A示出了dCas9-PB-4向导辅助体-催化失活的dCas9经由柔性连接子融合至转座酶(piggyBac)并置于CAG启动子的控制下,具有向导RNA。图23B示出了dCas9-PB-4向导辅助体,没有向导RNA。图23C示出了对照PB(piggyBac)辅助体,没有dCas9 DNA结合蛋白。图23D示出了非插入对照辅助体(dCas9在CAG启动子的控制下),没有转座酶(DPB)。图23E示出了包括在CMV启动子下的TurboGFP内部核糖体进入位点(IRES)新霉素转基因并且侧翼为转座子末端重复元件(TRE)的供体质粒。
图23F是通过破坏piggyBac转座酶DNA结合结构域DBD来改善特异性的模型的非限制性示意图。天然PB转座酶保留了完整的DNA结合能力并且可以在dCas9靶向(中靶)后整合,或在没有dCas9靶向(脱靶)的情况下结合至脱靶序列后整合。与PB类似,H2和H3突变体转座酶整合缺陷变体(Int-)可以在dCas9靶向(中靶)后整合。然而,由于DNA结合结构域的突变,转座酶的脱靶结合受到抑制。图23F说明了使用Int-转座酶突变体的基本原理。
图23H描绘了连接至TALE DNA结合子的嵌合MLT转座酶构建体。可以取代其它TALE和转座酶以靶向特定基因组位点。
图23G描绘了通过使用以下两者连接至dCas的MLT转座酶:NpuN:
ggcggatctggcggtagtgctgagtattgtctgagttacgaaacggaaatactcacggttgagtatgggcttcttccaattggcaaaatcgttgaaaagcgcatagagtgtacggtgtattccgtcgataacaacggtaatatctacacccagccggtagctcagtggcacgaccgaggcgaacaggaagtgttcgagtattgcttggaagatggctcccttatccgcgccactaaagaccataagtttatgacggttgacgggcagatgctgcctatagacgaaatatttgagagagagctggacttgatgagagtcgataatctgccaaat(SEQ ID NO:423)
和NpuC:
ggcggatctggcggtagtgggggttccggatccataaagatagctactaggaaatatcttggcaaacaaaacgtctatgacataggagttgagcgagatcacaattttgctttgaagaatgggttcatcgcgtctaattgcttcaacgctagcggcgggtcaggaggctctggtggaagc(SEQ ID NO:424)
内含肽蛋白剪接。可以取代其它dCas以靶向特定基因组位点。
SpCas9-HF1基因在D10A和H840A残基处发生突变,以使催化结构域失活并产生dCas9。使用Gibson组装,通过使用先前所描述的柔性连接子将转座酶基因(PB)融合至dCas9 DNA结合蛋白来产生dCas9-PB辅助体质粒。将融合蛋白置于CAG(巨细胞病毒(CMV)立即早期增强子、鸡b-肌动蛋白启动子和b-珠蛋白内含子)启动子下。使用Gibson组装产生在DBD中含有密码子变化的两个突变体转座酶辅助体质粒。首先,对转座酶进行人类密码子优化并由Genscript合成。接下来,引入突变R372A和D450N以产生dCas9-H2辅助体质粒,并且引入第三个K375A突变以产生dCas9-H3辅助体质粒。使用金门(Golden Gate)将四个gRNA附加至辅助体质粒骨架。简单地说,将含有向导序列的单链寡核苷酸退火并连接至含有hU6、mU6、H1或7SK启动子的BbsI线性化表达质粒中。将四个所得向导表达质粒中的每一者首先用BsmBI消化,然后在单个步骤中组装成单个BsmBI线性化辅助体质粒。对于需要八个向导的实验,将两个各自含有四个向导的质粒以等量共转染。阴性对照辅助体质粒缺乏gRNA。还使用Gibson组装产生含有PB、H2或H3转座酶但缺乏DBD的对照辅助体质粒。为了产生非整合DPB对照,使用Gibson组装从dCas9-PB辅助体质粒中去除整个piggyBac编码序列。为了产生供体质粒,使用Gateway克隆(Thermo Fisher)将具有CMV启动子驱动TurboGFP、内部核糖体进入位点(IRES)和新霉素(GIN)基因的pENTR质粒与含有在转基因侧翼的piggyBac末端重复元件(TRE)的pDONR质粒重组。
细胞转染
将人胚肾(HEK293)细胞维持于补充有10%热灭活胎牛血清的不完全达尔伯克改良伊格尔培养基(Dulbecco's modified Eagle's medium,DMEM)中。在转染前,将每孔4X105个细胞接种于6孔板中。使用X-tremeGENE 9(Sigma-Aldrich)用2ug质粒DNA转染约80%汇合度的细胞。在转染后24小时,将细胞再悬浮并取出10%细胞用于流式细胞术分析以测量转染效率。在转染后48小时,将90%细胞转移至T75烧瓶中并且在200mg/ml G418下培养3周,届时使细胞成团以用于裂解和基因组聚合酶链反应(PCR)分析。将6孔培养皿中剩余的10%细胞在没有抗生素的情况下培养3周,并且通过流式细胞术分析以测量稳定的插入效率。对于单细胞分离,重复两次dCas9-H2-8向导转染。将G418选择的多克隆群体各自接种至96孔多聚-D-赖氨酸涂层板(BD Biosciences)中,平均每孔产生50个集落。在孔变得大于40%汇合后,吸出培养基,并且将细胞手动再悬浮于30ml磷酸盐缓冲盐水中。取出20ml体积的再悬浮液并且与30ml DirectPCR裂解试剂(Viagen Biotech)混合用于分析。进一步培养剩余的细胞。扩充通过基因组PCR鉴定为含有靶向克隆体的两个孔,并且使用连续稀释对单细胞进行分选。目视监测孔直至获得157个单细胞扩充。随后通过手动移液再悬浮克隆扩充的细胞并裂解用于分析。扩充含有人类ROSA26的靶向插入的阳性克隆系(图24A)用于流式细胞术分析以检测转基因的潜在沉默。
流式细胞术
用dCas9-H2-8向导转染之后,在培养13周后使用FACSAria III细胞仪(BDBiosciences)分析来自ROSA26靶向的单细胞扩充的20,000个活细胞的绿色荧光蛋白(GFP)表达。
集落计数测定
为了确定人类ROSA26靶向的单克隆体中存在的转座子数量,通过TaqMan定量PCR进行拷贝数测定以估计基因组中存在的新霉素基因的数量。人类RNase P基因用于将每个样本的总基因组归一化。模板包括:来自克隆系的基因组DNA、阴性对照未转染的人类基因组DNA和来自具有单个新霉素基因插入的克隆细胞系的参考对照基因组DNA。根据制造商的说明书,使用TaqPath ProAmp主混合试剂(Thermo Fisher)进行使用QuantStudio 12KFlex热循环仪(Applied Biosystems)的定量PCR。引物和探针包括于用于人类RNase P的TaqMan拷贝数参考测定和TaqMan NeoR测定ID:Mr00299300_cn(Thermo Fisher)中。CopyCaller软体v2.1用于预测每个样本的插入数。
T7内切核酸酶I测定
在12孔板中,使用X-tremeGENE 9(Sigma-Aldrich),用500ng SpCas9-HF1表达质粒和500ng八种ROSA26定向gRNA之一或阴性对照gRNA表达质粒共转染在补充有10%热灭活胎牛血清的DMEM中的80%汇合度的HEK293细胞。72小时后,使用DirectPCR细胞裂解缓冲液(Viagen Biotech)使细胞成团并裂解。使用设计为在所有八个向导结合位点侧翼的引物进行使用KOD Xtreme热启动DNA聚合酶(Novagen)的基因组PCR。使用PureLink PCR微型试剂盒(Invitrogen)纯化产物,并且熔化并再退火以形成异源双链体。对于每个样品,在有或没有T7内切核酸酶I(T7E1)(New England Biolabs)的情况下进行相同的孵育,以切割含有错配序列的DNA。在2%凝胶上分离产物用于凝胶成像。使用2100生物分析仪(Agilent)测量通过T7E1测定获得的产物浓度。通过用两种预期分裂产物的总pg/ll除以两种预期分裂产物和未分裂产物的总pg/ll来计算分裂产物的分数。计算插入缺失发生的百分比。
嵌套PCR
在转染前一天将HEK293细胞接种于12孔尺寸板中。转染当天,在进行转染前1.5小时更换培养基。本实验使用X-tremeGENETM9DNA转染试剂和制造商的方案(Sigma-Aldrich)。
在一式三份转染中,共转染含有GFP和新霉素的供体质粒、具有融合至pB或MLT转座酶的DBD的辅助体质粒以及向导RNA表达质粒或质粒组合。对于每个一式三份转染将DNA混合,即,将1500ng辅助体质粒与1500ng供体质粒和600ng向导RNA混合,总共3600ng。使用3:1比率的XtremeGene9试剂,使得每个一式三份转染具有3600ng DNA并使用10.8ul试剂。转染后48小时,将细胞再悬浮并接种至T75烧瓶中。转染后72小时,将培养基从普通培养基更换为含G418的培养基。将含G418的培养基中的细胞培养3周,然后使细胞成团。
然后进行细胞裂解和蛋白酶K处理(DirectPCR裂解试剂,Viagen Biotech),以制备用于PCR的模板的基因组DNA。
使用从基因组延伸的一半引物和从转座子插入物延伸的一半引物进行初级PCR(图24B)。图24B描绘了使用具有Cas9的MLT辅助体以及分别距TTAA(SEQ ID NO:1)靶向位点61bp和62bp的两组不同gRNA(第1组:AATCGAGAAGCGACTCGACA(SEQ ID NO:425),TGCCCTGCAGGGGAGTGAGC(SEQ ID NO:426);第2组:GAAGCGACTCGACATGGAGG(SEQ ID NO:427),CCTGCAGGGGAGTGAGCAGC(SEQ ID NO:428)),检测在人类ROSA26基因座中的特定TTAA(SEQ ID NO:1)位点处供体MLT的插入的嵌套PCR策略。
KOD使用一种聚合酶:10ul反应,和1ul直接裂解作为模板。在水中以1:50稀释初级PCR产物。然后,1ul 1:50稀释用作嵌套PCR的模板,使用嵌套于初级产物内的引物。使用PrimeStar GXL聚合酶(20ul反应)。在1%琼脂糖凝胶上运行嵌套PCR产物(图24C),对预期大小的条带进行测序。比对序列并鉴定阳性插入-包括具有TTAA(SEQ ID NO:1)插入位点和转座子插入边缘的基因组序列的那些插入(图24D)。
靶向基因组整合位点恢复
使用DirectPCR细胞裂解缓冲液(Viagen Biotech)使来自稳定转染的HEK293细胞的团块裂解,以用作嵌套PCR的模板来鉴定靶向转座子插入。为了优化PCR,裂解物模板以三种稀释度使用,1:1、1:4和1:8。正向引物被设计为从转座子向外延伸,而反向引物被设计为从ROSA26靶序列延伸(图24B)。使用KOD Xtreme热启动DNA聚合酶(Novagen)进行10uL初级PCR,所述聚合酶在H2O中以1:50稀释并且用作使用PrimeSTAR GXL DNA聚合酶(Clontech)的20uL嵌套PCR的模板。用Zymoclean凝胶DNA恢复试剂盒(Zymo Research)对扩增产物进行凝胶纯化,并且直接测序或克隆至pJet1.2(Thermo Fisher)中以进行测序。使用BLAST将序列与转座子序列进行比对,并且使用BLAT将序列与人类参考基因组(hg38)进行比对以鉴定插入位点位置。
RNA指导的基因组转座
我们测试了我们的dCas9-piggyBac融合构建体向人类ROSA26安全港基因座递送转基因的能力。将供体质粒与dCas9-PB、dCas9-H2或dCas9 H3共转染,各自使用0、4或8个向导,一式两份。在抗生素选择3周后,使培养物裂解以用作基因组PCR的模板。为了提高恢复插入的机会,使用了三种稀释的裂解物模板。初级PCR引物被设计为从转座子的每一侧延伸出。四个额外的初级PCR引物被设计为向ROSA26中的靶位点延伸(每一侧两个)。使用所有成对引物组合(总共八个)进行个别的PCR反应。由初级PCR反应产生的产物用作嵌套PCR的模板。测序产物包括转座子的侧翼TRE、连接处的典型TTAA(SEQ ID NO:1)序列和插入位点侧翼的基因组序列。
结果
在本研究中,恢复了总共22个插入连接,示于图24A中。本研究在人类细胞中证明了RNA指导的ROSA26转座,并且为将整合缺陷(Int-)PB转座酶突变体引导至人类ROSA26以供基因疗法使用提供了概念验证。
本研究还证明,发明人能够使用通过内含肽剪接和gRNA融合至dCas9的MLT靶向ROSA26处的一个特定TTAA(SEQ ID NO:1)位点。
据观察,在特定TTAA(SEQ ID NO:1)位点处的辅助体MLT-TALE和MLT-Cas9/gRNA转座酶表达靶标hROSA26(图24B、图24C和图24D)使用基因组PCR以恢复对人类ROSA26的靶向插入。尽管有数百万个潜在的TTAA(SEQ ID NO:1)序列可用于插入整个基因组,但发现了许多与gRNA靶序列相邻的插入转座子。不存在gRNA的对照转染不会引起任何靶向插入。图24B、图24C和图24D中所示的结果证明转基因成功整合至基因组安全港位点hROSA26中,而没有足迹(如通过DNA测序所示)。这指示任何基因都可以置于那个TTAA(SEQ ID NO:1)位置。
实施例9-使用MLT转座酶(RNA辅助体)研究各种细胞系(FAC)的整合
本研究的一个目的是使用本公开的MLT转座酶和CMV-GFP整合至四种不同的细胞系(HEK293、Huh7、CHO-K1和T细胞)中,以比较各种细胞系的整合效率。另一个目的是仅整合CMV-GFP,以确定MLT转座酶是否对细胞活力有影响。一旦整合,这即通过使用FAC以测量每个细胞系中的GFP表达来定量。
使用以下方案:
·以三种不同的细胞密度接种CHO-K1、HEK293、HUH7和T细胞。
·使用细胞系4D-NucleofectorTM试剂盒和程序(Lonza Bioscience)测试三种细胞系的核转染效率,使用0.4μg pmaxGFPTM载体(按照供应商对每种特定细胞系的建议)作为阳性对照。
·使用高内涵分析(视觉)和流式细胞术(定量)在两个时间点(24小时和72小时)评估GFP表达的测量。用Hoechst33342活体染料对细胞核进行染色和定量。计算GFP阳性细胞的百分比。由于T细胞是悬浮细胞,因此只进行流式细胞术读出。
结果
所有研究的细胞系(CHO-K1、HEK293、HUH7和T细胞)的核转染率均超过80%。在核转染三天后,在存在或不存在MLT转座酶的情况下,所有细胞系均显示出85-95%的GFP表达,如图25至28中所示。
图25示出了在不同条件下转染的初始Huh7细胞系以显示Huh7表达GFP。行示出了(从顶部)未处理的细胞、模拟转染(没有核酸)、用MLT处理的细胞和用pmaxGFP处理的细胞;列示出了第1天(D1)、第3天(D3)和第7天(D7)的对照。
图26示出了在转染后24小时,在不同比率下,与仅用CMV-GFP转染的细胞相比,用CMV-GFP+MLT转染的Huh7细胞。顶行示出了用2:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(2μg)转染的细胞。中间行示出了用1:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(1μg)转染的细胞。底行示出了用0.5:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(0.5μg)转染的细胞。
图27示出了在转染后72小时,在不同比率下,与仅用CMV-GFP转染的细胞相比,用CMV-GFP+MLT转染的Huh7细胞。顶行示出了用2:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(2μg)转染的细胞。中间行示出了用1:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(1μg)转染的细胞。底行示出了用0.5:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(0.5μg)转染的细胞。
图28示出了在转染后1周,在不同比率下,与仅用CMV-GFP转染的细胞相比,用CMV-GFP+MLT转染的Huh7细胞。顶行示出了用2:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(2μg)转染的细胞。中间行示出了用1:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(1μg)转染的细胞。底行示出了用0.5:1μg的CMV-GFP:MLT比率转染的细胞和仅用CMV-GFP(0.5μg)转染的细胞。
图29A示出了使用CMV-GFP MLT DNA供体和MLT RNA辅助体转染后14天和21天HEK293细胞的活力。没有因脂染胺、DNA或RNA所致的明显毒性。14天和21天后,在超过40%的细胞中发现了稳固的GFP表达(图29B)。通过FAC分析整合效率并且显示37%的细胞与MLT供体DNA稳定整合(图29C和图29D)。图29E示出了在T25烧瓶中核转染脂转染后GFP阳性HEK293细胞的百分比。与CMV-GFP MLT供体加MLT辅助体RNA相比,单独的CMV-GFP MLT供体中的%GFP阳性细胞是相同的。在单独用CMV-GFP MLT供体转染的HEK293细胞中%GFP阳性率迅速下降并且在第21天达到5%。在用CMV-GFP MLT供体加MLT辅助体RNA转染的HEK293细胞中%GFP阳性率稳定并且在第21天达到42%。整合效率计算为37%。门控FAC能够选择GFP阳性和mnCHerry阳性细胞群体以评价RNA表达的影响(mCherry)(图30A-D)。
实施例10-使用CMV-GFP/MLT转座酶进行HT1080细胞的转座
本研究的一个目的是用CMV-GFP MLT DNA供体和MLT DNA辅助体转座酶1或MLTDNA辅助体转座酶2转染HT1080细胞,并且通过比较它们的GFP表达来定量它们的转座效率。HT1080是人类纤维肉瘤细胞系。
图31示出了转染HT1080细胞后24小时的CMV-GFP MLT DNA供体表达,并且图32示出了转染HT1080细胞后2周的CMV-GFP MLT DNA供体表达。
如图31中所示,当与CMV-GFP MLT供体DNA组合时,MLT DNA辅助体转座酶1和MLTDNA辅助体转座酶2均有效转染HT1080细胞。这两种转座酶表达极相似水平的GFP,而仅供体DNA(仅CMV-GFP)证明可以在这些细胞中表达GFP。未转染的细胞系没有GFP表达,因为这个细胞系中不存在任何GFP表达。
2周后,如图32中所示,从MLT DNA辅助体转座酶1和MLT DNA辅助体转座酶2观察到较少的GFP表达,而与MLT DNA辅助体转座酶1相比,MLT DNA辅助体转座酶2稍强地表达GFP。仅CMV-GFP(仅供体DNA)和未转染的细胞没有GFP表达,因为供体DNA未整合至细胞系中,而未转染的细胞从一开始就从未表达GFP。
在本研究中,当比较MLT DNA辅助体转座酶1和MLT DNA辅助体转座酶2在HT1080细胞中的转染效率时,MLT DNA辅助体转座酶2与CMV-GFP MLT DNA供体显示出更有效地转染HT1080细胞(图32,转染后2周)。尽管整合效率在MLT RNA辅助体转座酶2与MLT DNA辅助体转座酶2之间是相当的,但MLT DNA辅助体转座酶2更适合于细胞系的转染,包括离体实验。
定义
以下定义结合本文所公开的发明来使用。除非另有定义,否则本文使用的所有技术和科学术语都具有与本发明所属领域的技术人员通常理解的相同的含义。
术语“体内”是指发生在受试者体内的事件。
术语“离体”是指涉及对已经从受试者体内取出的细胞、组织和/或器官进行治疗或执行程序的事件。适当地,细胞、组织和/或器官可以通过治疗或手术方法返回受试者的身体。
如本文所用,术语“变体”涵盖但不限于包含核酸或氨基酸序列的核酸或蛋白质,所述核酸或氨基酸序列与参考的核酸或氨基酸序列因某些位置处的一个或多个取代、缺失和/或添加而不同。变体可以包含一个或多个保守取代。保守取代可以涉及例如类似带电荷或不带电荷的氨基酸的取代。
如本文所用,“载体”或“媒剂”是指适合于药物施用的载体材料。可用于本文的载体和媒剂包括本领域中已知的任何此类材料,例如,任何液体、凝胶、溶剂、液体稀释剂、增溶剂、表面活性剂、脂质等,它们是无毒的并且不以有害方式与组合物的其它组分相互作用。
短语“药学上可接受的”是指在合理医学判断的范围内适用于与人类和动物的组织接触而没有过度毒性、刺激性、过敏反应或其它问题或并发症,与合理的效益/风险比相称的那些化合物、材料、组合物和/或剂型。
术语“药学上可接受的载体”或“药学上可接受的赋形剂”旨在包括任何和所有溶剂、分散介质、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂以及惰性成分。将此类药学上可接受的载体或药学上可接受的赋形剂用于活性药物成分是本领域中众所周知的。除非任何常规的药学上可接受的载体或药学上可接受的赋形剂与活性药物成分不相容,否则考虑其在本发明的治疗组合物中的用途。额外的活性药物成分,诸如其它药物,也可以并入所描述的组合物和方法中。
如本文所用,“一个/种(a/an)”或“所述(the)”可以意指一个或多于一个。
此外,当与参考数字指示结合使用时,术语“约”意指参考数字指示加上或减去那个参考数字指示的至多10%。举例来说,语言“约50”涵盖45至55的范围。
如本文所用,词语“包括”及其变形旨在具有非限制性,使得清单中的项目的叙述不排除也可用于这项技术的组合物和方法的其它类似项目。类似地,术语“可以”和“可能”及其变形旨在具有非限制性,使得实施方案可以或可能包括某些要素或特征的叙述不排除不含那些要素或特征的本发明技术的其它实施方案。
尽管开放式术语“包含”作为诸如包括、含有或具有等术语的同义词,在本文中用于描述和要求保护本发明,但本发明或其实施方案可以替代地使用诸如“由……组成”或“基本上由……组成”等替代术语来描述。
如本文所用,词语“优选的”和“优选地”是指在某些情况下提供某些益处的技术实施方案。然而,在相同或其它情况下,其它实施方案也可能是优选的。此外,一个或多个优选实施方案的叙述并不意味着其它实施方案是没用的,并且不旨在将其它实施方案排除在技术的范围之外。
等同物
尽管已经结合特定实施方案描述本发明,但应了解,能够进行进一步修改并且本申请旨在涵盖大体上符合本发明的原理并包括属于本发明所属领域的公知或常用惯例的与本公开的偏离情况并且可以应用于本文阐述并属于所附权利要求书的范围的基本特征的本发明的任何变型、用途或变更。
本领域技术人员仅使用常规实验将认识到或能够确定本文特定描述的特定实施方案的众多等同物。此类等同物旨在涵盖于以下权利要求书的范围内。
援引并入
本文引用的所有专利和公布特此以全文引用的方式并入。
本文所论述的公布仅为其在本申请的提交日期之前的公开内容而提供。本文中的任何内容均不应解释为承认本发明无权凭借在先发明而早于此种公布。
如本文所用,所有标题仅用于组织并且不旨在以任何方式限制本公开。任何个别部分的内容可能同样适用于所有部分。
序列表
<110> 萨利欧基因治疗公司(Saliogen Therapeutics, Inc.)
J·J·希金斯 (HIGGINS, Joseph J)
S·麦克米兰(McMillan, Scott)
R·塔比比亚扎尔(TABIBIAZAR, Ray)
<120> 基于转座的疗法
<130> SAL-003PC/126933-5003
<150> US 63/019,709
<151> 2020-05-04
<150> US 63/027,561
<151> 2020-05-20
<150> US 63/058,200
<151> 2020-07-29
<150> US 63/175,345
<151> 2021-04-15
<160> 428
<170> PatentIn version 3.5
<210> 1
<211> 4
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 1
ttaa 4
<210> 2
<211> 572
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 2
Met Ala Gln His Ser Asp Tyr Ser Asp Asp Glu Phe Cys Ala Asp Lys
1 5 10 15
Leu Ser Asn Tyr Ser Cys Asp Ser Asp Leu Glu Asn Ala Ser Thr Ser
20 25 30
Asp Glu Asp Ser Ser Asp Asp Glu Val Met Val Arg Pro Arg Thr Leu
35 40 45
Arg Arg Arg Arg Ile Ser Ser Ser Ser Ser Asp Ser Glu Ser Asp Ile
50 55 60
Glu Gly Gly Arg Glu Glu Trp Ser His Val Asp Asn Pro Pro Val Leu
65 70 75 80
Glu Asp Phe Leu Gly His Gln Gly Leu Asn Thr Asp Ala Val Ile Asn
85 90 95
Asn Ile Glu Asp Ala Val Lys Leu Phe Ile Gly Asp Asp Phe Phe Glu
100 105 110
Phe Leu Val Glu Glu Ser Asn Arg Tyr Tyr Asn Gln Asn Arg Asn Asn
115 120 125
Phe Lys Leu Ser Lys Lys Ser Leu Lys Trp Lys Asp Ile Thr Pro Gln
130 135 140
Glu Met Lys Lys Phe Leu Gly Leu Ile Val Leu Met Gly Gln Val Arg
145 150 155 160
Lys Asp Arg Arg Asp Asp Tyr Trp Thr Thr Glu Pro Trp Thr Glu Thr
165 170 175
Pro Tyr Phe Gly Lys Thr Met Thr Arg Asp Arg Phe Arg Gln Ile Trp
180 185 190
Lys Ala Trp His Phe Asn Asn Asn Ala Asp Ile Val Asn Glu Ser Asp
195 200 205
Arg Leu Cys Lys Val Arg Pro Val Leu Asp Tyr Phe Val Pro Lys Phe
210 215 220
Ile Asn Ile Tyr Lys Pro His Gln Gln Leu Ser Leu Asp Glu Gly Ile
225 230 235 240
Val Pro Trp Arg Gly Arg Leu Phe Phe Arg Val Tyr Asn Ala Gly Lys
245 250 255
Ile Val Lys Tyr Gly Ile Leu Val Arg Leu Leu Cys Glu Ser Asp Thr
260 265 270
Gly Tyr Ile Cys Asn Met Glu Ile Tyr Cys Gly Glu Gly Lys Arg Leu
275 280 285
Leu Glu Thr Ile Gln Thr Val Val Ser Pro Tyr Thr Asp Ser Trp Tyr
290 295 300
His Ile Tyr Met Asp Asn Tyr Tyr Asn Ser Val Ala Asn Cys Glu Ala
305 310 315 320
Leu Met Lys Asn Lys Phe Arg Ile Cys Gly Thr Ile Arg Lys Asn Arg
325 330 335
Gly Ile Pro Lys Asp Phe Gln Thr Ile Ser Leu Lys Lys Gly Glu Thr
340 345 350
Lys Phe Ile Arg Lys Asn Asp Ile Leu Leu Gln Val Trp Gln Ser Lys
355 360 365
Lys Pro Val Tyr Leu Ile Ser Ser Ile His Ser Ala Glu Met Glu Glu
370 375 380
Ser Gln Asn Ile Asp Arg Thr Ser Lys Lys Lys Ile Val Lys Pro Asn
385 390 395 400
Ala Leu Ile Asp Tyr Asn Lys His Met Lys Gly Val Asp Arg Ala Asp
405 410 415
Gln Tyr Leu Ser Tyr Tyr Ser Ile Leu Arg Arg Thr Val Lys Trp Thr
420 425 430
Lys Arg Leu Ala Met Tyr Met Ile Asn Cys Ala Leu Phe Asn Ser Tyr
435 440 445
Ala Val Tyr Lys Ser Val Arg Gln Arg Lys Met Gly Phe Lys Met Phe
450 455 460
Leu Lys Gln Thr Ala Ile His Trp Leu Thr Asp Asp Ile Pro Glu Asp
465 470 475 480
Met Asp Ile Val Pro Asp Leu Gln Pro Val Pro Ser Thr Ser Gly Met
485 490 495
Arg Ala Lys Pro Pro Thr Ser Asp Pro Pro Cys Arg Leu Ser Met Asp
500 505 510
Met Arg Lys His Thr Leu Gln Ala Ile Val Gly Ser Gly Lys Lys Lys
515 520 525
Asn Ile Leu Arg Arg Cys Arg Val Cys Ser Val His Lys Leu Arg Ser
530 535 540
Glu Thr Arg Tyr Met Cys Lys Phe Cys Asn Ile Pro Leu His Lys Gly
545 550 555 560
Ala Cys Phe Glu Lys Tyr His Thr Leu Lys Asn Tyr
565 570
<210> 3
<211> 1719
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 3
atggcccagc acagcgacta cagcgacgac gagttctgtg ccgataagct gagtaactac 60
agctgcgaca gcgacctgga aaacgccagc acatccgacg aggacagctc tgacgacgag 120
gtgatggtgc ggcccagaac cctgagacgg agaagaatca gcagctctag cagcgactct 180
gaatccgaca tcgagggcgg ccgggaagag tggagccacg tggacaaccc tcctgttctg 240
gaagattttc tgggccatca gggcctgaac accgacgccg tgatcaacaa catcgaggat 300
gccgtgaagc tgttcatagg agatgatttc tttgagttcc tggtcgagga atccaaccgc 360
tattacaacc agaatagaaa caacttcaag ctgagcaaga aaagcctgaa gtggaaggac 420
atcacccctc aggagatgaa aaagttcctg ggactgatcg ttctgatggg acaggtgcgg 480
aaggacagaa gggatgatta ctggacaacc gaaccttgga ccgagacccc ttactttggc 540
aagaccatga ccagagacag attcagacag atctggaaag cctggcactt caacaacaat 600
gctgatatcg tgaacgagtc tgatagactg tgtaaagtgc ggccagtgtt ggattacttc 660
gtgcctaagt tcatcaacat ctataagcct caccagcagc tgagcctgga tgaaggcatc 720
gtgccctggc ggggcagact gttcttcaga gtgtacaatg ctggcaagat cgtcaaatac 780
ggcatcctgg tgcgccttct gtgcgagagc gatacaggct acatctgtaa tatggaaatc 840
tactgcggcg agggcaaaag actgctggaa accatccaga ccgtcgtttc cccttatacc 900
gacagctggt accacatcta catggacaac tactacaatt ctgtggccaa ctgcgaggcc 960
ctgatgaaga acaagtttag aatctgcggc acaatcagaa aaaacagagg catccctaag 1020
gacttccaga ccatctctct gaagaagggc gaaaccaagt tcatcagaaa gaacgacatc 1080
ctgctccaag tgtggcagtc caagaaaccc gtgtacctga tcagcagcat ccatagcgcc 1140
gagatggaag aaagccagaa catcgacaga acaagcaaga agaagatcgt gaagcccaat 1200
gctctgatcg actacaacaa gcacatgaaa ggcgtggacc gggccgacca gtacctgtct 1260
tattactcta tcctgagaag aacagtgaaa tggaccaaga gactggccat gtacatgatc 1320
aattgcgccc tgttcaacag ctacgccgtg tacaagtccg tgcgacaaag aaaaatggga 1380
ttcaagatgt tcctgaagca gacagccatc cactggctga cagacgacat tcctgaggac 1440
atggacattg tgccagatct gcaacctgtg cccagcacct ctggtatgag agctaagcct 1500
cccaccagcg atcctccatg tagactgagc atggacatgc ggaagcacac cctgcaggcc 1560
atcgtcggca gcggcaagaa gaagaacatc cttagacggt gcagggtgtg cagcgtgcac 1620
aagctgcgga gcgagactcg gtacatgtgc aagttttgca acattcccct gcacaaggga 1680
gcctgcttcg agaagtacca caccctgaag aattactag 1719
<210> 4
<211> 568
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 4
Met Ser Gln His Ser Asp Tyr Ser Asp Asp Glu Phe Cys Ala Asp Lys
1 5 10 15
Leu Ser Asn Tyr Ser Cys Asp Ser Asp Leu Glu Asn Ala Ser Thr Ser
20 25 30
Asp Glu Asp Ser Ser Asp Asp Glu Val Met Val Arg Pro Arg Thr Leu
35 40 45
Arg Arg Arg Arg Ile Ser Ser Ser Ser Ser Asp Ser Glu Ser Asp Ile
50 55 60
Glu Gly Gly Arg Glu Glu Trp Ser His Val Asp Asn Pro Pro Val Leu
65 70 75 80
Glu Asp Phe Leu Gly His Gln Gly Leu Asn Thr Asp Ala Val Ile Asn
85 90 95
Asn Ile Glu Asp Ala Val Lys Leu Phe Ile Gly Asp Asp Phe Phe Glu
100 105 110
Phe Leu Val Glu Glu Ser Asn Arg Tyr Tyr Asn Gln Asn Arg Asn Asn
115 120 125
Phe Lys Leu Ser Lys Lys Ser Leu Lys Trp Lys Asp Ile Thr Pro Gln
130 135 140
Glu Met Lys Lys Phe Leu Gly Leu Ile Val Leu Met Gly Gln Val Arg
145 150 155 160
Lys Asp Arg Arg Asp Asp Tyr Trp Thr Thr Glu Pro Trp Thr Glu Thr
165 170 175
Pro Tyr Phe Gly Lys Thr Met Thr Arg Asp Arg Phe Arg Gln Ile Trp
180 185 190
Lys Ala Trp His Phe Asn Asn Asn Ala Asp Ile Val Asn Glu Ser Asp
195 200 205
Arg Leu Cys Lys Val Arg Pro Val Leu Asp Tyr Phe Val Pro Lys Phe
210 215 220
Ile Asn Ile Tyr Lys Pro His Gln Gln Leu Ser Leu Asp Glu Gly Ile
225 230 235 240
Val Pro Trp Arg Gly Arg Leu Phe Phe Arg Val Tyr Asn Ala Gly Lys
245 250 255
Ile Val Lys Tyr Gly Ile Leu Val Arg Leu Leu Cys Glu Ser Asp Thr
260 265 270
Gly Tyr Ile Cys Asn Met Glu Ile Tyr Cys Gly Glu Gly Lys Arg Leu
275 280 285
Leu Glu Thr Ile Gln Thr Trp Ser Pro Tyr Thr Asp Ser Trp Tyr His
290 295 300
Ile Tyr Met Asp Asn Tyr Tyr Asn Ser Val Ala Asn Cys Glu Ala Leu
305 310 315 320
Met Lys Asn Lys Phe Arg Ile Cys Gly Thr Ile Arg Lys Asn Arg Gly
325 330 335
Ile Pro Lys Asp Phe Gln Thr Ile Ser Leu Lys Lys Gly Glu Thr Lys
340 345 350
Phe Ile Arg Lys Asn Asp Ile Leu Leu Gln Val Trp Gln Ser Lys Lys
355 360 365
Pro Val Tyr Leu Ile Ser Ser His Ser Ala Glu Met Glu Glu Ser Gln
370 375 380
Asn Ile Asp Arg Thr Ser Lys Lys Lys Ile Val Lys Pro Asn Ala Leu
385 390 395 400
Ile Asp Tyr Asn Lys His Met Lys Gly Val Asp Arg Ala Asp Gln Tyr
405 410 415
Leu Ser Tyr Tyr Ser Ile Leu Arg Arg Trp Lys Trp Thr Lys Arg Leu
420 425 430
Ala Met Tyr Met Ile Asn Cys Ala Leu Phe Asn Ser Tyr Ala Val Tyr
435 440 445
Lys Ser Val Arg Gln Arg Lys Met Gly Phe Lys Met Phe Leu Lys Gln
450 455 460
Thr Ala His Trp Leu Thr Asp Asp Ile Pro Glu Asp Met Asp Ile Val
465 470 475 480
Pro Asp Leu Gln Pro Val Pro Ser Thr Ser Gly Met Arg Ala Lys Pro
485 490 495
Pro Thr Ser Asp Pro Pro Cys Arg Leu Ser Met Asp Met Arg Lys His
500 505 510
Thr Leu Gln Ala Ile Val Gly Ser Gly Lys Lys Lys Asn Ile Leu Arg
515 520 525
Arg Cys Arg Val Cys Ser Val His Lys Leu Arg Ser Glu Thr Arg Tyr
530 535 540
Met Cys Lys Phe Cys Asn Ile Pro Leu His Lys Gly Ala Cys Phe Glu
545 550 555 560
Lys Tyr His Thr Leu Lys Asn Tyr
565
<210> 5
<211> 1716
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 5
atgtcgcagc attcagacta ttctcatgat gagttttgtg cagacaagtt gtccaattat 60
tcttgtgata gcgatcttga aaatgcgagt acaagtgatg aagattctag tgatgatgaa 120
gtaatggtgc gtcccaggac attgaggcga cgaagaattt cgagctccag ctctgactca 180
gagtcagata tagaaggcgg gagagaagaa tggtcgcatg ttgataatcc accggtctta 240
gaagattttt tagggcatca aggattaaac acagatgctg ttataaataa tatagaagat 300
gccgtgaaat tatttatcgg agatgatttt tttgaatttc ttgtagagga gtcaaacagg 360
tattataatc aaaataggaa taatttcaaa ctttcaaaaa aaagcctaaa gtggaaagat 420
ataacccctc aagagatgaa gaagttttta gggttaattg ttctcatggg acaggtgcgc 480
aaagatagaa gagatgacta ttggaccacg gagccatgga cggagacgcc atattttggt 540
aaaacgatga cgagagacag gttccgacag atatggaaag cttggcactt caataataat 600
gcggatatcg taaatgaatc agatagactt tgcaaagtga gaccagtact agattatttt 660
gtgcctaaat ttataaatat ttacaaacct catcagcaat tatcactaga tgaagggatc 720
gtaccttgga ggggaagatt attctttagg gtatataatg ctggcaagat cgttaaatat 780
ggaatattgg ttcgtttgtt gtgcgaaagt gatacaggat atatctgtaa catggaaatt 840
tattgcggcg aaggaaagcg attattggaa acgatacaaa cagtagtgtc tccatacact 900
gattcgtggt accatatata tatggacaat tattataata gcgtcgcaaa ttgtgaagca 960
cttatgaaaa acaaattcag aatatgtgga acaatccgga aaaatcgagg tatacctaaa 1020
gattttcaaa caatttcttt gaaaaaaggt gaaacaaaat ttataaggaa aaatgatata 1080
ttgttacaag tgtggcaatc aaaaaagcct gtatacctga tttcttcgat tcattctgcg 1140
gagatggaag aaagtcagaa tattgacaga acatcaaaaa agaaaattgt caaaccgaat 1200
gcactcattg actacaataa acatatgaaa ggtgttgacc gggccgacca atacctttca 1260
tattattcga tattgcggag gacggtcaaa tggacaaaaa ggttggcaat gtatatgata 1320
aattgcgcat tatttaattc ttatgcagtt tacaaatcag tgaggcaaag aaaaatgggt 1380
tttaaaatgt ttttgaaaca aacagctatc cactggttga cggatgatat tccagaggac 1440
atggacattg ttccagacct tcaaccagta ccgtctactt ctggaatgcg ggctaaacca 1500
cctacatctg atccaccatg caggctatcg atggacatga gaaagcatac gttacaggca 1560
attgtcggaa gtggaaaaaa gaaaaacatt ttgagaaggt gtcgcgtatg ttccgttcat 1620
aaattgcgca gtgagacacg ctacatgtgc aaattttgca atatacctct acataaaggg 1680
gcgtgttttg aaaaatatca tacgctaaaa aactat 1716
<210> 6
<211> 1719
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 6
atggcccagc acagcgacta cagcgacgac gagttctgtg ccgataagct gagtaactac 60
agctgcgaca gcgacctgga aaacgccagc acatccgacg aggacagctc tgacgacgag 120
gtgatggtgc ggcccagaac cctgagacgg agaagaatca gcagctctag cagcgactct 180
gaatccgaca tcgagggcgg ccgggaagag tggagccacg tggacaaccc tcctgttctg 240
gaagattttc tgggccatca gggcctgaac accgacgccg tgatcaacaa catcgaggat 300
gccgtgaagc tgttcatagg agatgatttc tttgagttcc tggtcgagga atccaaccgc 360
tattacaacc agaagagaaa caacttcaag ctgagcaaga aaagcctgaa gtggaaggac 420
atcacccctc aggagatgaa aaagttcctg ggactgatcg ttctgatggg acaggtgcgg 480
aaggacagaa gggatgatta ctggacaacc gaaccttgga ccgagacccc ttactttggc 540
aagaccatga ccagagacag attcagacag atctggaaag cctggcactt caacaacaat 600
gctgatatcg tgaacgagtc tgatagactg tgtaaagtgc ggccagtgtt ggattacttc 660
gtgcctaagt tcatcaacat ctataagcct caccagcagc tgagcctgga tgaaggcatc 720
gtgccctggc ggggcagact gttcttcaga gtgtacaatg ctggcaagat cgtcaaatac 780
ggcatcctgg tgcgccttct gtgcgagagc gatacaggct acatctgtaa tatggaaatc 840
tactgcggcg agggcaaaag actgctggaa accatccaga ccgtcgtttc cccttatacc 900
gacagctggt accacatcta catggacaac tactacaatt ctgtggccaa ctgcgaggcc 960
ctgatgaaga acaagtttag aatctgcggc acaatcagaa aaaacagagg catccctaag 1020
gacttccaga ccatctctct gaagaagggc gaaaccaagt tcatcagaaa gaacgacatc 1080
ctgctccaag tgtggcagtc caagaaaccc gtgtacctga tcagcagcat ccatagcgcc 1140
gagatggaag aaagccagaa catcgacaga acaagcaaga agaagatcgt gaagcccaat 1200
gctctgatcg actacaacaa gcacatgaaa ggcgtggacc gggccgacca gtacctgtct 1260
tattactcta tcctgagaag aacagtgaaa tggaccaaga gactggccat gtacatgatc 1320
aattgcgccc tgttcaacag ctacgccgtg tacaagtccg tgcgacaaag aaaaatggga 1380
ttcaagatgt tcctgaagca gacagccatc cactggctga cagacgacat tcctgaggac 1440
atggacattg tgccagatct gcaacctgtg cccagcacct ctggtatgag agctaagcct 1500
cccaccagcg atcctccatg tagactgagc atggacatgc ggaagcacac cctgcaggcc 1560
atcgtcggca gcggcaagaa gaagaacatc cttagacggt gcagggtgtg cagcgtgcac 1620
aagctgcgga gcgagactcg gtacatgtgc aagttttgca acattcccct gcacaaggga 1680
gcctgcttcg agaagtacca caccctgaag aattactag 1719
<210> 7
<211> 572
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 7
Met Ala Gln His Ser Asp Tyr Ser Asp Asp Glu Phe Cys Ala Asp Lys
1 5 10 15
Leu Ser Asn Tyr Ser Cys Asp Ser Asp Leu Glu Asn Ala Ser Thr Ser
20 25 30
Asp Glu Asp Ser Ser Asp Asp Glu Val Met Val Arg Pro Arg Thr Leu
35 40 45
Arg Arg Arg Arg Ile Ser Ser Ser Ser Ser Asp Ser Glu Ser Asp Ile
50 55 60
Glu Gly Gly Arg Glu Glu Trp Ser His Val Asp Asn Pro Pro Val Leu
65 70 75 80
Glu Asp Phe Leu Gly His Gln Gly Leu Asn Thr Asp Ala Val Ile Asn
85 90 95
Asn Ile Glu Asp Ala Val Lys Leu Phe Ile Gly Asp Asp Phe Phe Glu
100 105 110
Phe Leu Val Glu Glu Ser Asn Arg Tyr Tyr Asn Gln Lys Arg Asn Asn
115 120 125
Phe Lys Leu Ser Lys Lys Ser Leu Lys Trp Lys Asp Ile Thr Pro Gln
130 135 140
Glu Met Lys Lys Phe Leu Gly Leu Ile Val Leu Met Gly Gln Val Arg
145 150 155 160
Lys Asp Arg Arg Asp Asp Tyr Trp Thr Thr Glu Pro Trp Thr Glu Thr
165 170 175
Pro Tyr Phe Gly Lys Thr Met Thr Arg Asp Arg Phe Arg Gln Ile Trp
180 185 190
Lys Ala Trp His Phe Asn Asn Asn Ala Asp Ile Val Asn Glu Ser Asp
195 200 205
Arg Leu Cys Lys Val Arg Pro Val Leu Asp Tyr Phe Val Pro Lys Phe
210 215 220
Ile Asn Ile Tyr Lys Pro His Gln Gln Leu Ser Leu Asp Glu Gly Ile
225 230 235 240
Val Pro Trp Arg Gly Arg Leu Phe Phe Arg Val Tyr Asn Ala Gly Lys
245 250 255
Ile Val Lys Tyr Gly Ile Leu Val Arg Leu Leu Cys Glu Ser Asp Thr
260 265 270
Gly Tyr Ile Cys Asn Met Glu Ile Tyr Cys Gly Glu Gly Lys Arg Leu
275 280 285
Leu Glu Thr Ile Gln Thr Val Val Ser Pro Tyr Thr Asp Ser Trp Tyr
290 295 300
His Ile Tyr Met Asp Asn Tyr Tyr Asn Ser Val Ala Asn Cys Glu Ala
305 310 315 320
Leu Met Lys Asn Lys Phe Arg Ile Cys Gly Thr Ile Arg Lys Asn Arg
325 330 335
Gly Ile Pro Lys Asp Phe Gln Thr Ile Ser Leu Lys Lys Gly Glu Thr
340 345 350
Lys Phe Ile Arg Lys Asn Asp Ile Leu Leu Gln Val Trp Gln Ser Lys
355 360 365
Lys Pro Val Tyr Leu Ile Ser Ser Ile His Ser Ala Glu Met Glu Glu
370 375 380
Ser Gln Asn Ile Asp Arg Thr Ser Lys Lys Lys Ile Val Lys Pro Asn
385 390 395 400
Ala Leu Ile Asp Tyr Asn Lys His Met Lys Gly Val Asp Arg Ala Asp
405 410 415
Gln Tyr Leu Ser Tyr Tyr Ser Ile Leu Arg Arg Thr Val Lys Trp Thr
420 425 430
Lys Arg Leu Ala Met Tyr Met Ile Asn Cys Ala Leu Phe Asn Ser Tyr
435 440 445
Ala Val Tyr Lys Ser Val Arg Gln Arg Lys Met Gly Phe Lys Met Phe
450 455 460
Leu Lys Gln Thr Ala Ile His Trp Leu Thr Asp Asp Ile Pro Glu Asp
465 470 475 480
Met Asp Ile Val Pro Asp Leu Gln Pro Val Pro Ser Thr Ser Gly Met
485 490 495
Arg Ala Lys Pro Pro Thr Ser Asp Pro Pro Cys Arg Leu Ser Met Asp
500 505 510
Met Arg Lys His Thr Leu Gln Ala Ile Val Gly Ser Gly Lys Lys Lys
515 520 525
Asn Ile Leu Arg Arg Cys Arg Val Cys Ser Val His Lys Leu Arg Ser
530 535 540
Glu Thr Arg Tyr Met Cys Lys Phe Cys Asn Ile Pro Leu His Lys Gly
545 550 555 560
Ala Cys Phe Glu Lys Tyr His Thr Leu Lys Asn Tyr
565 570
<210> 8
<211> 1719
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 8
atggcccagc acagcgacta ccccgacgac gagttcagag ccgataagct gagtaactac 60
agctgcgaca gcgacctgga aaacgccagc acatccgacg aggacagctc tgacgacgag 120
gtgatggtgc ggcccagaac cctgagacgg agaagaatca gcagctctag cagcgactct 180
gaatccgaca tcgagggcgg ccgggaagag tggagccacg tggacaaccc tcctgttctg 240
gaagattttc tgggccatca gggcctgaac accgacgccg tgatcaacaa catcgaggat 300
gccgtgaagc tgttcatagg agatgatttc tttgagttcc tggtcgagga atccaaccgc 360
tattacaacc agaatagaaa caacttcaag ctgagcaaga aaagcctgaa gtggaaggac 420
atcacccctc aggagatgaa aaagttcctg ggactgatcg ttctgatggg acaggtgcgg 480
aaggacagaa gggatgatta ctggacaacc gaaccttgga ccgagacccc ttactttggc 540
aagaccatga ccagagacag attcagacag atctggaaag cctggcactt caacaacaat 600
gctgatatcg tgaacgagtc tgatagactg tgtaaagtgc ggccagtgtt ggattacttc 660
gtgcctaagt tcatcaacat ctataagcct caccagcagc tgagcctgga tgaaggcatc 720
gtgccctggc ggggcagact gttcttcaga gtgtacaatg ctggcaagat cgtcaaatac 780
ggcatcctgg tgcgccttct gtgcgagagc gatacaggct acatctgtaa tatggaaatc 840
tactgcggcg agggcaaaag actgctggaa accatccaga ccgtcgtttc cccttatacc 900
gacagctggt accacatcta catggacaac tactacaatt ctgtggccaa ctgcgaggcc 960
ctgatgaaga acaagtttag aatctgcggc acaatcagaa aaaacagagg catccctaag 1020
gacttccaga ccatctctct gaagaagggc gaaaccaagt tcatcagaaa gaacgacatc 1080
ctgctccaag tgtggcagtc caagaaaccc gtgtacctga tcagcagcat ccatagcgcc 1140
gagatggaag aaagccagaa catcgacaga acaagcaaga agaagatcgt gaagcccaat 1200
gctctgatcg actacaacaa gcacatgaaa ggcgtggacc gggccgacca gtacctgtct 1260
tattactcta tcctgagaag aacagtgaaa tggaccaaga gactggccat gtacatgatc 1320
aattgcgccc tgttcaacag ctacgccgtg tacaagtccg tgcgacaaag aaaaatggga 1380
ttcaagatgt tcctgaagca gacagccatc cactggctga cagacgacat tcctgaggac 1440
atggacattg tgccagatct gcaacctgtg cccagcacct ctggtatgag agctaagcct 1500
cccaccagcg atcctccatg tagactgagc atggacatgc ggaagcacac cctgcaggcc 1560
atcgtcggca gcggcaagaa gaagaacatc cttagacggt gcagggtgtg cagcgtgcac 1620
aagctgcgga gcgagactcg gtacatgtgc aagttttgca acattcccct gcacaaggga 1680
gcctgcttcg agaagtacca caccctgaag aattactag 1719
<210> 9
<211> 572
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 9
Met Ala Gln His Ser Asp Tyr Pro Asp Asp Glu Phe Arg Ala Asp Lys
1 5 10 15
Leu Ser Asn Tyr Ser Cys Asp Ser Asp Leu Glu Asn Ala Ser Thr Ser
20 25 30
Asp Glu Asp Ser Ser Asp Asp Glu Val Met Val Arg Pro Arg Thr Leu
35 40 45
Arg Arg Arg Arg Ile Ser Ser Ser Ser Ser Asp Ser Glu Ser Asp Ile
50 55 60
Glu Gly Gly Arg Glu Glu Trp Ser His Val Asp Asn Pro Pro Val Leu
65 70 75 80
Glu Asp Phe Leu Gly His Gln Gly Leu Asn Thr Asp Ala Val Ile Asn
85 90 95
Asn Ile Glu Asp Ala Val Lys Leu Phe Ile Gly Asp Asp Phe Phe Glu
100 105 110
Phe Leu Val Glu Glu Ser Asn Arg Tyr Tyr Asn Gln Asn Arg Asn Asn
115 120 125
Phe Lys Leu Ser Lys Lys Ser Leu Lys Trp Lys Asp Ile Thr Pro Gln
130 135 140
Glu Met Lys Lys Phe Leu Gly Leu Ile Val Leu Met Gly Gln Val Arg
145 150 155 160
Lys Asp Arg Arg Asp Asp Tyr Trp Thr Thr Glu Pro Trp Thr Glu Thr
165 170 175
Pro Tyr Phe Gly Lys Thr Met Thr Arg Asp Arg Phe Arg Gln Ile Trp
180 185 190
Lys Ala Trp His Phe Asn Asn Asn Ala Asp Ile Val Asn Glu Ser Asp
195 200 205
Arg Leu Cys Lys Val Arg Pro Val Leu Asp Tyr Phe Val Pro Lys Phe
210 215 220
Ile Asn Ile Tyr Lys Pro His Gln Gln Leu Ser Leu Asp Glu Gly Ile
225 230 235 240
Val Pro Trp Arg Gly Arg Leu Phe Phe Arg Val Tyr Asn Ala Gly Lys
245 250 255
Ile Val Lys Tyr Gly Ile Leu Val Arg Leu Leu Cys Glu Ser Asp Thr
260 265 270
Gly Tyr Ile Cys Asn Met Glu Ile Tyr Cys Gly Glu Gly Lys Arg Leu
275 280 285
Leu Glu Thr Ile Gln Thr Val Val Ser Pro Tyr Thr Asp Ser Trp Tyr
290 295 300
His Ile Tyr Met Asp Asn Tyr Tyr Asn Ser Val Ala Asn Cys Glu Ala
305 310 315 320
Leu Met Lys Asn Lys Phe Arg Ile Cys Gly Thr Ile Arg Lys Asn Arg
325 330 335
Gly Ile Pro Lys Asp Phe Gln Thr Ile Ser Leu Lys Lys Gly Glu Thr
340 345 350
Lys Phe Ile Arg Lys Asn Asp Ile Leu Leu Gln Val Trp Gln Ser Lys
355 360 365
Lys Pro Val Tyr Leu Ile Ser Ser Ile His Ser Ala Glu Met Glu Glu
370 375 380
Ser Gln Asn Ile Asp Arg Thr Ser Lys Lys Lys Ile Val Lys Pro Asn
385 390 395 400
Ala Leu Ile Asp Tyr Asn Lys His Met Lys Gly Val Asp Arg Ala Asp
405 410 415
Gln Tyr Leu Ser Tyr Tyr Ser Ile Leu Arg Arg Thr Val Lys Trp Thr
420 425 430
Lys Arg Leu Ala Met Tyr Met Ile Asn Cys Ala Leu Phe Asn Ser Tyr
435 440 445
Ala Val Tyr Lys Ser Val Arg Gln Arg Lys Met Gly Phe Lys Met Phe
450 455 460
Leu Lys Gln Thr Ala Ile His Trp Leu Thr Asp Asp Ile Pro Glu Asp
465 470 475 480
Met Asp Ile Val Pro Asp Leu Gln Pro Val Pro Ser Thr Ser Gly Met
485 490 495
Arg Ala Lys Pro Pro Thr Ser Asp Pro Pro Cys Arg Leu Ser Met Asp
500 505 510
Met Arg Lys His Thr Leu Gln Ala Ile Val Gly Ser Gly Lys Lys Lys
515 520 525
Asn Ile Leu Arg Arg Cys Arg Val Cys Ser Val His Lys Leu Arg Ser
530 535 540
Glu Thr Arg Tyr Met Cys Lys Phe Cys Asn Ile Pro Leu His Lys Gly
545 550 555 560
Ala Cys Phe Glu Lys Tyr His Thr Leu Lys Asn Tyr
565 570
<210> 10
<211> 594
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 10
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Lys Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
Arg Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Thr Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 11
<211> 280
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 11
Met Ser Asn Pro Arg Lys Arg Ser Ile Pro Thr Cys Asp Val Asn Phe
1 5 10 15
Val Leu Glu Gln Leu Leu Ala Glu Asp Ser Phe Asp Glu Ser Asp Phe
20 25 30
Ser Glu Ile Asp Asp Ser Asp Asp Phe Ser Asp Ser Ala Ser Glu Asp
35 40 45
Tyr Thr Val Arg Pro Pro Ser Asp Ser Glu Ser Asp Gly Asn Ser Pro
50 55 60
Thr Ser Ala Asp Ser Gly Arg Ala Leu Lys Trp Ser Thr Arg Val Met
65 70 75 80
Ile Pro Arg Gln Arg Tyr Asp Phe Thr Gly Thr Pro Gly Arg Lys Val
85 90 95
Asp Val Ser Asp Thr Thr Asp Pro Leu Gln Tyr Phe Glu Leu Phe Phe
100 105 110
Thr Glu Glu Leu Val Ser Lys Ile Thr Ser Glu Met Asn Ala Gln Ala
115 120 125
Ala Leu Leu Ala Ser Lys Pro Pro Gly Pro Lys Gly Phe Ser Arg Met
130 135 140
Asp Lys Trp Lys Asp Thr Asp Asn Asp Glu Leu Lys Val Phe Phe Ala
145 150 155 160
Val Met Leu Leu Gln Gly Ile Val Gln Lys Pro Glu Leu Glu Met Phe
165 170 175
Trp Ser Thr Arg Pro Leu Leu Asp Ile Pro Tyr Leu Arg Gln Ile Met
180 185 190
Thr Gly Glu Arg Phe Leu Leu Leu Leu Arg Cys Leu His Phe Val Asn
195 200 205
Asn Ser Ser Ile Ser Ala Gly Gln Ser Lys Ala Gln Ile Ser Leu Gln
210 215 220
Lys Ile Lys Pro Val Phe Asp Phe Leu Val Asn Lys Phe Ser Thr Val
225 230 235 240
Tyr Thr Pro Asn Arg Asn Ile Ala Val Asp Glu Ser Leu Met Leu Phe
245 250 255
Lys Gly Arg Leu Ala Met Lys Gln Tyr Ile Pro Thr Lys Met Asn Leu
260 265 270
Lys Asp Ser Ala Asp Gly Leu Lys
275 280
<210> 12
<211> 252
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 12
Met Asp Leu Arg Cys Gln His Thr Val Leu Ser Ile Arg Glu Ser Arg
1 5 10 15
Gly Leu Leu Pro Asn Leu Lys Met Lys Thr Ser Arg Met Lys Lys Gly
20 25 30
Asp Ile Ile Phe Ser Arg Lys Gly Asp Ile Leu Leu Leu Ala Trp Lys
35 40 45
Asp Lys Arg Val Val Arg Met Ile Ser Ile His Asp Thr Ser Val Ser
50 55 60
Thr Thr Gly Lys Lys Asn Arg Lys Thr Gly Glu Asn Ile Val Lys Pro
65 70 75 80
Ala Cys Ile Lys Glu Tyr Asn Ala His Met Lys Gly Val Asp Arg Ala
85 90 95
Asp Gln Phe Leu Ser Cys Cys Ser Ile Leu Arg Lys Met Met Lys Trp
100 105 110
Thr Lys Lys Val Val Leu Tyr Leu Ile Asn Cys Gly Leu Phe Asn Ser
115 120 125
Phe Arg Val Tyr Asn Val Leu Asn Pro Gln Ala Lys Met Lys Tyr Lys
130 135 140
Gln Phe Leu Leu Ser Val Ala Arg Asp Trp Ile Met Asp Asp Asn Asn
145 150 155 160
Glu Gly Ser Pro Glu Pro Glu Thr Asn Leu Ser Ser Pro Ser Pro Gly
165 170 175
Gly Ala Arg Arg Ala Pro Arg Lys Asp Pro Pro Lys Arg Leu Ser Gly
180 185 190
Asp Met Lys Gln His Glu Pro Thr Cys Ile Pro Ala Ser Gly Lys Lys
195 200 205
Lys Phe Pro Thr Arg Ala Cys Arg Val Cys Ala His Gly Lys Arg Ser
210 215 220
Glu Ser Arg Tyr Leu Cys Lys Phe Cys Leu Val Pro Leu His Arg Gly
225 230 235 240
Lys Cys Phe Thr Gln Tyr His Thr Leu Lys Lys Tyr
245 250
<210> 13
<211> 432
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 13
Met Lys Ala Phe Leu Gly Val Ile Leu Asn Met Gly Val Leu Asn His
1 5 10 15
Pro Asn Leu Gln Ser Tyr Trp Ser Met Asp Phe Glu Ser His Ile Pro
20 25 30
Phe Phe Arg Ser Val Phe Lys Arg Glu Arg Phe Leu Gln Ile Phe Trp
35 40 45
Met Leu His Leu Lys Asn Asp Gln Lys Ser Ser Lys Asp Leu Arg Thr
50 55 60
Arg Thr Glu Lys Val Asn Cys Phe Leu Ser Tyr Leu Glu Met Lys Phe
65 70 75 80
Arg Glu Arg Phe Cys Pro Gly Arg Glu Ile Ala Val Asp Glu Ala Val
85 90 95
Val Gly Phe Lys Gly Lys Ile His Phe Ile Thr Tyr Asn Pro Lys Lys
100 105 110
Pro Thr Lys Trp Gly Ile Arg Leu Tyr Val Leu Ser Asp Ser Lys Cys
115 120 125
Gly Tyr Val His Ser Phe Val Pro Tyr Tyr Gly Gly Ile Thr Ser Glu
130 135 140
Thr Leu Val Arg Pro Asp Leu Pro Phe Thr Ser Arg Ile Val Leu Glu
145 150 155 160
Leu His Glu Arg Leu Lys Asn Ser Val Pro Gly Ser Gln Gly Tyr His
165 170 175
Phe Phe Thr Asp Arg Tyr Tyr Thr Ser Val Thr Leu Ala Lys Glu Leu
180 185 190
Phe Lys Glu Lys Thr His Leu Thr Gly Thr Ile Met Pro Asn Arg Lys
195 200 205
Asp Asn Pro Pro Val Ile Lys His Gln Lys Leu Lys Lys Gly Glu Ile
210 215 220
Val Ala Phe Arg Asp Glu Asn Val Met Leu Leu Ala Trp Lys Asp Lys
225 230 235 240
Arg Ile Val Thr Leu Ser Thr Trp Asp Ser Glu Thr Glu Ser Val Glu
245 250 255
Arg Arg Val Gly Gly Gly Lys Glu Ile Val Leu Lys Pro Lys Val Val
260 265 270
Thr Asn Tyr Thr Lys Phe Met Gly Gly Val Asp Ile Ala Asp Tyr Thr
275 280 285
Ser Thr Tyr Cys Phe Met Arg Lys Thr Leu Lys Trp Trp Arg Thr Leu
290 295 300
Phe Phe Trp Gly Leu Glu Val Ser Val Val Asn Ser Tyr Ile Leu Tyr
305 310 315 320
Lys Glu Cys Gln Lys Arg Lys Asn Glu Lys Pro Ile Thr His Val Lys
325 330 335
Phe Ile Arg Lys Leu Val His Asp Leu Val Gly Glu Phe Arg Asp Gly
340 345 350
Thr Leu Thr Ser Arg Gly Arg Leu Leu Ser Thr Asn Leu Glu Gln Arg
355 360 365
Leu Asp Gly Lys Leu His Ile Ile Thr Pro His Pro Asn Lys Lys His
370 375 380
Lys Asp Cys Val Val Cys Ser Asn Arg Lys Ile Lys Gly Gly Arg Arg
385 390 395 400
Glu Thr Ile Tyr Ile Cys Glu Thr Cys Glu Cys Lys Pro Gly Leu His
405 410 415
Val Gly Glu Cys Phe Lys Lys Tyr His Thr Met Lys Asn Tyr Arg Asp
420 425 430
<210> 14
<211> 662
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 14
Met Pro Ser Leu Arg Lys Arg Lys Glu Thr Asn Glu Thr Asp Thr Leu
1 5 10 15
Pro Glu Val Phe Asn Asp Asn Leu Ser Asp Ile Pro Ser Glu Ile Glu
20 25 30
Asp Ala Asp Asp Cys Phe Asp Asp Ser Gly Asp Asp Ser Thr Asp Ser
35 40 45
Thr Asp Ser Glu Ile Ile Arg Pro Val Arg Lys Arg Lys Val Ala Val
50 55 60
Leu Ser Ser Asp Ser Asp Thr Asp Glu Ala Thr Asp Asn Cys Trp Ser
65 70 75 80
Glu Ile Asp Thr Pro Pro Arg Leu Gln Met Phe Glu Gly His Ala Gly
85 90 95
Val Thr Thr Phe Pro Ser Gln Cys Asp Ser Val Pro Ser Val Thr Asn
100 105 110
Leu Phe Phe Gly Asp Glu Leu Phe Glu Met Leu Cys Lys Glu Leu Ser
115 120 125
Asn Tyr His Asp Gln Thr Ala Met Lys Arg Lys Thr Pro Ser Arg Thr
130 135 140
Leu Lys Trp Ser Pro Val Thr Gln Lys Asp Ile Lys Lys Phe Leu Gly
145 150 155 160
Leu Ile Ile Leu Met Gly Gln Thr Arg Lys Asp Ser Leu Lys Asp Tyr
165 170 175
Trp Ser Thr Asp Pro Leu Ile Cys Thr Pro Ile Phe Pro Gln Thr Met
180 185 190
Ser Arg His Arg Phe Glu Gln Ile Trp Thr Phe Trp His Phe Asn Asp
195 200 205
Asn Ala Lys Met Asp Ser Arg Ser Gly Arg Leu Phe Lys Ile Gln Pro
210 215 220
Val Leu Asp Tyr Phe Leu His Lys Phe Arg Thr Ile Tyr Lys Pro Lys
225 230 235 240
Gln Gln Leu Ser Leu Asp Glu Gly Met Ile Pro Trp Arg Gly Arg Phe
245 250 255
Lys Phe Arg Thr Tyr Asn Pro Ala Lys Ile Thr Lys Tyr Gly Leu Leu
260 265 270
Val Arg Met Val Cys Glu Ser Asp Thr Gly Tyr Ile Cys Ser Met Glu
275 280 285
Ile Tyr Thr Ala Glu Gly Arg Lys Leu Gln Glu Thr Val Leu Ser Val
290 295 300
Leu Gly Pro Tyr Leu Gly Ile Trp His His Ile Tyr Gln Asp Asn Tyr
305 310 315 320
Tyr Asn Ala Thr Ser Thr Ala Glu Leu Leu Leu Gln Asn Lys Thr Arg
325 330 335
Val Cys Gly Thr Ile Arg Glu Ser Arg Gly Leu Pro Pro Asn Leu Glu
340 345 350
Met Lys Thr Ser Arg Met Lys Lys Gly Asp Ile Ile Phe Ser Arg Lys
355 360 365
Gly Asp Ile Leu Leu Leu Ala Trp Lys Asp Lys Arg Val Val Arg Met
370 375 380
Ile Ser Thr Ile His Asp Thr Ser Val Ser Thr Thr Gly Lys Lys Asn
385 390 395 400
Arg Lys Thr Gly Glu Asn Ile Val Lys Pro Thr Cys Ile Lys Glu Tyr
405 410 415
Asn Ala His Met Lys Gly Val Asp Arg Ala Asp Gln Phe Leu Ser Cys
420 425 430
Cys Ser Ile Leu Arg Lys Thr Met Lys Trp Thr Lys Lys Val Val Leu
435 440 445
Tyr Leu Ile Asn Cys Gly Leu Phe Asn Ser Phe Arg Val Tyr Asn Val
450 455 460
Leu Asn Pro Gln Ala Lys Met Lys Tyr Lys Gln Phe Leu Leu Ser Val
465 470 475 480
Ala Arg Asp Trp Ile Thr Asp Asp Asn Asn Glu Gly Ser Pro Glu Pro
485 490 495
Glu Thr Asn Leu Ser Ser Pro Ser Pro Gly Gly Ala Arg Arg Ala Pro
500 505 510
Arg Lys Asp Pro Pro Lys Arg Leu Ser Gly Asp Met Lys Gln His Glu
515 520 525
Pro Thr Cys Ile Pro Ala Ser Gly Lys Lys Lys Phe Pro Thr Arg Ala
530 535 540
Cys Arg Val Cys Ala Ala His Gly Lys Arg Ser Glu Ser Arg Tyr Leu
545 550 555 560
Cys Lys Phe Cys Leu Val Pro Leu His Arg Gly Lys Cys Phe Thr Gln
565 570 575
Tyr His Thr Leu Lys Lys Tyr Met Asp Leu Arg Cys Gln His Thr Val
580 585 590
Leu Ser Thr Val Gly Arg Gly Tyr Ser Val Leu Ala Arg Phe Lys Pro
595 600 605
Arg Thr Asn Glu Arg Thr Gly Ser Ser His Cys His Val Gln Val Pro
610 615 620
Ala Gly Gly Gln Gly Pro Pro Ser Thr Ile Ile Ala Asn Gly Cys Gly
625 630 635 640
Cys Lys Leu Glu Pro Met Val Arg Thr Arg Ser Pro Thr Cys Leu Val
645 650 655
Ile Glu Phe Gly Cys Met
660
<210> 15
<211> 673
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 15
Met Pro Ser Leu Arg Lys Arg Lys Glu Thr Asn Glu Thr Asp Thr Leu
1 5 10 15
Pro Glu Val Phe Asn Asp Asn Leu Ser Asp Ile Pro Ser Glu Ile Glu
20 25 30
Asp Ala Asp Asp Cys Phe Asp Asp Ser Gly Asp Asp Ser Thr Asp Ser
35 40 45
Thr Glu Ser Glu Ile Ile Arg Pro Val Arg Lys Arg Lys Val Ala Val
50 55 60
Leu Ser Ser Asp Ser Asn Thr Asp Glu Ala Thr Asp Asn Cys Trp Ser
65 70 75 80
Glu Ile Asp Thr Pro Pro Arg Leu Gln Met Phe Glu Gly His Ala Gly
85 90 95
Val Thr Thr Phe Pro Ser Gln Cys Asp Ser Val Pro Ser Val Thr Asn
100 105 110
Leu Phe Phe Gly Asp Glu Leu Phe Glu Met Leu Cys Lys Glu Leu Ser
115 120 125
Asn Tyr His Asp Gln Thr Ala Met Lys Arg Lys Thr Pro Ser Arg Thr
130 135 140
Leu Lys Trp Ser Pro Val Thr Gln Lys Asp Ile Lys Lys Phe Leu Gly
145 150 155 160
Leu Ile Ile Leu Met Gly Gln Thr Arg Lys Asp Ser Trp Lys Asp Tyr
165 170 175
Trp Ser Thr Asp Pro Leu Ile Cys Thr Pro Ile Phe Pro Gln Thr Met
180 185 190
Ser Arg His Arg Phe Glu Gln Ile Trp Thr Phe Trp His Phe Asn Asp
195 200 205
Asn Ala Lys Met Asp Ser Cys Ser Gly Arg Leu Phe Lys Ile Gln Pro
210 215 220
Val Leu Asp Tyr Phe Leu His Lys Phe Arg Thr Ile Tyr Lys Pro Lys
225 230 235 240
Gln Gln Leu Ser Leu Asp Glu Gly Met Ile Pro Trp Arg Gly Arg Leu
245 250 255
Lys Phe Thr Tyr Asn Pro Ala Ile Thr Lys Tyr Gly Leu Leu Val Arg
260 265 270
Met Val Cys Glu Ser Asp Thr Gly Tyr Ile Cys Asn Met Glu Ile Tyr
275 280 285
Thr Ala Glu Arg Lys Lys Leu Gln Glu Thr Val Leu Ser Val Leu Gly
290 295 300
Pro Tyr Leu Gly Ile Trp His His Ile Tyr Gln Asp Asn Tyr Tyr Asn
305 310 315 320
Ala Thr Ser Thr Ala Glu Leu Leu Leu Gln Asn Lys Thr Arg Val Cys
325 330 335
Gly Thr Ile Arg Glu Ser Arg Gly Leu Pro Pro Asn Leu Lys Met Lys
340 345 350
Thr Ser Arg Met Lys Lys Gly Asp Ile Ile Phe Ser Arg Lys Gly Asp
355 360 365
Ile Leu Leu Leu Ala Trp Lys Asp Lys Arg Val Val Arg Met Ile Ser
370 375 380
Thr Ile His Asp Thr Ser Val Ser Thr Thr Gly Lys Lys Asn Arg Lys
385 390 395 400
Thr Gly Glu Asn Ile Val Lys Pro Thr Cys Ile Lys Glu Tyr Asn Ala
405 410 415
His Met Lys Gly Val Asp Arg Ala Asp Gln Phe Leu Ser Cys Cys Ser
420 425 430
Ile Leu Arg Lys Thr Thr Lys Trp Thr Lys Lys Val Val Leu Tyr Leu
435 440 445
Ile Asn Cys Gly Leu Phe Asn Ser Phe Arg Val Tyr Asn Ile Leu Asn
450 455 460
Pro Gln Ala Lys Met Lys Tyr Lys Gln Phe Leu Leu Ser Val Ala Arg
465 470 475 480
Asp Trp Ile Thr Asp Asp Asn Asn Glu Gly Ser Pro Glu Pro Glu Thr
485 490 495
Asn Leu Ser Ser Pro Ser Ser Gly Gly Ala Arg Arg Ala Pro Arg Lys
500 505 510
Asp Gln Pro Lys Arg Leu Ser Gly Asp Met Lys Gln His Glu Pro Thr
515 520 525
Cys Ile Pro Ala Ser Gly Lys Lys Lys Phe Pro Thr Ala Cys Arg Val
530 535 540
Cys Ala Ala His Gly Lys Arg Ser Glu Ser Arg Tyr Leu Arg Lys Phe
545 550 555 560
Cys Phe Val Pro Leu Arg Gly Lys Cys Phe Met Tyr His Thr Leu Lys
565 570 575
Lys Tyr Ser Glu Leu Phe Ser Leu Ile Val Val Ser Lys Ile Gln Asn
580 585 590
Val Ile Ile Tyr Lys Thr Thr Lys Val Tyr Met Arg Tyr Val Met Arg
595 600 605
Ser His Cys Pro Leu Ser Phe Leu Val Phe Ala Pro Ser Val Lys Asp
610 615 620
Arg Ser Arg Val Phe Ser Phe Phe Thr Arg His Leu Leu Trp Thr Leu
625 630 635 640
Asp Val Asn Thr Leu Ser Cys Pro His Arg Met Lys Arg Ser His Trp
645 650 655
Trp Lys Pro Cys Arg Ser Ile Tyr Glu Lys Leu Tyr Asn Cys Thr Asn
660 665 670
Pro
<210> 16
<211> 254
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 16
Met Asp Leu Arg Cys Gln His Thr Val Leu Ser Ile Arg Glu Ser Arg
1 5 10 15
Gly Leu Pro Pro Asn Leu Lys Met Lys Thr Ser Arg Met Lys Lys Gly
20 25 30
Asp Ile Ile Phe Ser Arg Lys Gly Asp Ile Leu Leu Leu Ala Trp Lys
35 40 45
Asp Lys Arg Val Val Arg Met Ile Ser Thr Ile His Asp Thr Ser Val
50 55 60
Ser Thr Thr Gly Lys Lys Asn Arg Lys Thr Gly Glu Asn Ile Val Lys
65 70 75 80
Pro Ala Cys Ile Lys Glu Tyr Asn Ala His Met Lys Gly Val Asp Arg
85 90 95
Ala Asp Gln Phe Leu Ser Cys Cys Ser Ile Leu Arg Lys Thr Met Lys
100 105 110
Trp Thr Lys Lys Val Val Leu Tyr Leu Ile Asn Cys Gly Leu Phe Asn
115 120 125
Ser Phe Arg Val Tyr Asn Val Leu Asn Pro Gln Ala Lys Met Lys Tyr
130 135 140
Lys Gln Phe Leu Leu Ser Val Ala Arg Asp Trp Ile Thr Asp Asp Asn
145 150 155 160
Asn Glu Gly Ser Pro Glu Pro Glu Thr Asn Leu Ser Ser Pro Ser Pro
165 170 175
Gly Gly Ala Arg Arg Ala Pro Arg Lys Asp Pro Pro Lys Arg Leu Ser
180 185 190
Gly Asp Met Lys Gln His Glu Pro Thr Cys Ile Pro Ala Ser Gly Lys
195 200 205
Lys Lys Phe Pro Thr Arg Ala Cys Arg Val Cys Ala Ala His Gly Lys
210 215 220
Arg Ser Glu Ser Arg Tyr Leu Cys Lys Phe Cys Leu Val Pro Leu His
225 230 235 240
Arg Gly Lys Cys Phe Thr Gln Tyr His Thr Leu Lys Lys Tyr
245 250
<210> 17
<211> 594
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 17
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 18
<211> 1782
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 18
atgggcagca gcctggacga cgagcacatc ctgagcgccc tgctgcagag cgacgacgag 60
ctggtcggcg aggacagcga cagcgaggtg agcgaccacg tgagcgagga cgacgtgcag 120
tccgacaccg aggaggcctt catcgacgag gtgcacgagg tgcagcctac cagcagcggc 180
tccgagatcc tggacgagca gaacgtgatc gagcagcccg gcagctccct ggccagcaac 240
aggatcctga ccctgcccca gaggaccatc aggggcaaga acaagcactg ctggtccacc 300
tccaagccca ccaggcggag cagggtgtcc gccctgaaca tcgtgagaag ccagaggggc 360
cccaccagga tgtgcaggaa catctacgac cccctgctgt gcttcaagct gttcttcacc 420
gacgagatca tcagcgagat cgtgaagtgg accaacgccg agatcagcct gaagaggcgg 480
gagagcatga cctccgccac cttcagggac accaacgagg acgagatcta cgccttcttc 540
ggcatcctgg tgatgaccgc cgtgaggaag gacaaccaca tgagcaccga cgacctgttc 600
gacagatccc tgagcatggt gtacgtgagc gtgatgagca gggacagatt cgacttcctg 660
atcagatgcc tgaggatgga cgacaagagc atcaggccca ccctgcggga gaacgacgtg 720
ttcacccccg tgagaaagat ctgggacctg ttcatccacc agtgcatcca gaactacacc 780
cctggcgccc acctgaccat cgacgagcag ctgctgggct tcaggggcag gtgccccttc 840
agggtctata tccccaacaa gcccagcaag tacggcatca agatcctgat gatgtgcgac 900
agcggcacca agtacatgat caacggcatg ccctacctgg gcaggggcac ccagaccaac 960
ggcgtgcccc tgggcgagta ctacgtgaag gagctgtcca agcccgtcca cggcagctgc 1020
agaaacatca cctgcgacaa ctggttcacc agcatccccc tggccaagaa cctgctgcag 1080
gagccctaca agctgaccat cgtgggcacc gtgagaagca acaagagaga gatccccgag 1140
gtcctgaaga acagcaggtc caggcccgtg ggcaccagca tgttctgctt cgacggcccc 1200
ctgaccctgg tgtcctacaa gcccaagccc gccaagatgg tgtacctgct gtccagctgc 1260
gacgaggacg ccagcatcaa cgagagcacc ggcaagcccc agatggtgat gtactacaac 1320
cagaccaagg gcggcgtgga caccctggac cagatgtgca gcgtgatgac ctgcagcaga 1380
aagaccaaca ggtggcccat ggccctgctg tacggcatga tcaacatcgc ctgcatcaac 1440
agcttcatca tctacagcca caacgtgagc agcaagggcg agaaggtgca gagccggaaa 1500
aagttcatgc ggaacctgta catgggcctg acctccagct tcatgaggaa gaggctggag 1560
gcccccaccc tgaagagata cctgagggac aacatcagca acatcctgcc caaagaggtg 1620
cccggcacca gcgacgacag caccgaggag cccgtgatga agaagaggac ctactgcacc 1680
tactgtccca gcaagatcag aagaaaggcc agcgccagct gcaagaagtg taagaaggtc 1740
atctgccggg agcacaacat cgacatgtgc cagagctgtt tc 1782
<210> 19
<211> 205
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 19
ttaaccctag aaagataatc atattgtgac gtacgttaaa gataatcatg cgtaaaattg 60
acgcatgtgt tttatcggtc tgtatatcga ggtttattta ttaatttgaa tagatattaa 120
gttttattat atttacactt acatactaat aataaattca acaaacaatt tatttatgtt 180
tatttattta ttaaaaaaaa acaaa 205
<210> 20
<211> 310
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 20
atctataaca agaaaatata tatataataa gttatcacgt aagtagaaca tgaaataaca 60
atataattat cgtatgagtt aaatcttaaa agtcacgtaa aagataatca tgcgtcattt 120
tgactcacgc ggtcgttata gttcaaaatc agtgacactt accgcattga caagcacgcc 180
tcacgggagc tccaagcggc gactgagatg tcctaaatgc acagcgacgg attcgcgcta 240
tttagaaaga gagagcaata tttcaagaat gcatgcgtca attttacgca gactatcttt 300
ctagggttaa 310
<210> 21
<211> 157
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 21
ttaacacttg gattgcggga aacgagttaa gtcggctcgc gtgaattgcg cgtactccgc 60
gggagccgtc ttaactcggt tcatatagat ttgcggtgga gtgcgggaaa cgtgtaaact 120
cgggccgatt gtaactgcgt attaccaaat atttgtt 157
<210> 22
<211> 212
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 22
aattatttat gtactgaata gataaaaaaa tgtctgtgat tgaataaatt ttcatttttt 60
acacaagaaa ccgaaaattt catttcaatc gaacccatac ttcaaaagat ataggcattt 120
taaactaact ctgattttgc gcgggaaacc taaataattg cccgcgccat cttatatttt 180
ggcgggaaat tcacccgaca ccgtagtgtt aa 212
<210> 23
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 23
tggccggcct gaccactgg 19
<210> 24
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 24
tgaaggcctg gccggcctg 19
<210> 25
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 25
tgagcactga aggcctggc 19
<210> 26
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 26
tccactgagc actgaaggc 19
<210> 27
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 27
tggtttccac tgagcactg 19
<210> 28
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 28
tggggaaaat gacccaaca 19
<210> 29
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 29
taggacagtg gggaaaatg 19
<210> 30
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 30
tccagggaca cggtgctag 19
<210> 31
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 31
tcagagccag gagtcctgg 19
<210> 32
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 32
tccttcagag ccaggagtc 19
<210> 33
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 33
tcctccttca gagccagga 19
<210> 34
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 34
tccagcccct cctccttca 19
<210> 35
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 35
tccgagcttg acccttgga 19
<210> 36
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 36
tggtttccga gcttgaccc 19
<210> 37
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 37
tggggtggtt tccgagcttt ggggtggttt ccgagctt 38
<210> 38
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 38
tctgctgggg tggtttccg 19
<210> 39
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 39
tgcagagtat ctgctggggt gcagagtatc tgctgggg 38
<210> 40
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 40
ccaatcccct cagt 14
<210> 41
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 41
cagtgctcag tggaa 15
<210> 42
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 42
gaaacatccg gcgactca 18
<210> 43
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 43
tcgcccctca aatcttaca 19
<210> 44
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 44
tcaaatctta cagctgctc 19
<210> 45
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 45
tcttacagct gctcactcc 19
<210> 46
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 46
tacagctgct cactcccct 19
<210> 47
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 47
tgctcactcc cctgcaggg 19
<210> 48
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 48
tcccctgcag ggcaacgcc 19
<210> 49
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 49
tgcagggcaa cgcccaggg 19
<210> 50
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 50
tctcgattat gggcgggat 19
<210> 51
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 51
tcgcttctcg attatgggc 19
<210> 52
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 52
tgtcgagtcg cttctcgat 19
<210> 53
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 53
tccatgtcga gtcgcttct 19
<210> 54
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 54
tcgcctccat gtcgagtcg 19
<210> 55
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 55
tcgtcatcgc ctccatgtc 19
<210> 56
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 56
tgatctcgtc atcgcctcc 19
<210> 57
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 57
gcttcagctt ccta 14
<210> 58
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 58
ctgtgatcat gcca 14
<210> 59
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 59
acagtggtac acacct 16
<210> 60
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 60
ccacccccca ctaag 15
<210> 61
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 61
cattggccgg gcac 14
<210> 62
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 62
gcttgaaccc aggaga 16
<210> 63
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 63
acacccgatc cactggg 17
<210> 64
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 64
gctgcatcaa cccc 14
<210> 65
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 65
gccacaaaca gaaata 16
<210> 66
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 66
ggtggctcat gcctg 15
<210> 67
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 67
gatttgcaca gctcat 16
<210> 68
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 68
aagctctgag gagca 15
<210> 69
<211> 13
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 69
ccctagctgt ccc 13
<210> 70
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 70
gcctagcatg ctag 14
<210> 71
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 71
atgggcttca cggat 15
<210> 72
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 72
gaaactatgc ctgc 14
<210> 73
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 73
gcaccattgc tccc 14
<210> 74
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 74
gacatgcaac tcag 14
<210> 75
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 75
acaccactag gggt 14
<210> 76
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 76
gtctgctaga cagg 14
<210> 77
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 77
ggcctagaca ggctg 15
<210> 78
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 78
gaggcattct tatcg 15
<210> 79
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 79
gcctggaaac gttcc 15
<210> 80
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 80
gtgctctgac aata 14
<210> 81
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 81
gttttgcagc ctcc 14
<210> 82
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 82
acagctgtgg aacgt 15
<210> 83
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 83
ggctctcttc ctcct 15
<210> 84
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 84
ctatcccaaa actct 15
<210> 85
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 85
gaaaaactat gtat 14
<210> 86
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 86
aggcaggctg gttga 15
<210> 87
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 87
caatacaacc acgc 14
<210> 88
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 88
atgacggact caact 15
<210> 89
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 89
cacaacattt gtaa 14
<210> 90
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 90
atttccagtg caca 14
<210> 91
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 91
gtttagctca cccgtgagcc 20
<210> 92
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 92
cccaatatta ttgttctctg 20
<210> 93
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 93
ggggtgggat aggggatacg 20
<210> 94
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 94
ggatccccct ctacatttaa 20
<210> 95
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 95
gtgatcttgt acaaatcatt 20
<210> 96
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 96
ctacacagaa tctgttagaa 20
<210> 97
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 97
taagctagag aatagatctc 20
<210> 98
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 98
tcaatacact taatgattta 20
<210> 99
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 99
caccgggagc cacgaaaaca gatcc 25
<210> 100
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 100
caccgcgaaa acagatccag ggaca 25
<210> 101
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 101
caccgagatc cagggacacg gtgct 25
<210> 102
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 102
caccggacac ggtgctagga cagtg 25
<210> 103
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 103
caccggaaaa tgacccaaca gcctc 25
<210> 104
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 104
caccggcctg gccggcctga ccact 25
<210> 105
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 105
caccgctgag cactgaaggc ctggc 25
<210> 106
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 106
caccgtggtt tccactgagc actga 25
<210> 107
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 107
caccggatag ccaggagtcc tttcg 25
<210> 108
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 108
caccggcgct tccagtgctc agact 25
<210> 109
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 109
caccgcagtg ctcagactag ggaag 25
<210> 110
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 110
caccggcccc tcctccttca gagcc 25
<210> 111
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 111
caccgtcctt cagagccagg agtcc 25
<210> 112
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 112
caccgtggtt tccgagcttg accct 25
<210> 113
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 113
caccgctgca gagtatctgc tgggg 25
<210> 114
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 114
caccgcgttc ctgcagagta tctgc 25
<210> 115
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 115
aaacggatct gttttcgtgg ctccc 25
<210> 116
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 116
aaactgtccc tggatctgtt ttcgc 25
<210> 117
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 117
aaacagcacc gtgtccctgg atctc 25
<210> 118
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 118
aaaccactgt cctagcaccg tgtcc 25
<210> 119
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 119
aaacgaggct gttgggtcat tttcc 25
<210> 120
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 120
aaacagtggt caggccggcc aggcc 25
<210> 121
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 121
aaacgccagg ccttcagtgc tcagc 25
<210> 122
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 122
aaactcagtg ctcagtggaa accac 25
<210> 123
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 123
aaaccgaaag gactcctggc tatcc 25
<210> 124
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 124
aaacagtctg agcactggaa gcgcc 25
<210> 125
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 125
aaaccttccc tagtctgagc actgc 25
<210> 126
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 126
aaacggctct gaaggaggag gggcc 25
<210> 127
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 127
aaacggactc ctggctctga aggac 25
<210> 128
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 128
aaacagggtc aagctcggaa accac 25
<210> 129
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 129
aaacccccag cagatactct gcagc 25
<210> 130
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 130
aaacgcagat actctgcagg aacgc 25
<210> 131
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 131
tcccctccca gaaagacctg 20
<210> 132
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 132
tgggctccaa gcaatcctgg 20
<210> 133
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 133
gtggctcagg aggtacctgg 20
<210> 134
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 134
gagccacgaa aacagatcca 20
<210> 135
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 135
aagtgaacgg ggaagggagg 20
<210> 136
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 136
gacaaaagcc gaagtccagg 20
<210> 137
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 137
gtggttgata aacccacgtg 20
<210> 138
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 138
tgggaacagc cacagcaggg 20
<210> 139
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 139
gcaggggaac ggggatgcag 20
<210> 140
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 140
gagatggtgg acgaggaagg 20
<210> 141
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 141
gagatggctc caggaaatgg 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 142
taaggaatct gcctaacagg 20
<210> 143
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 143
tcaggagact aggaaggagg 20
<210> 144
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 144
tataaggtgg tcccagctcg 20
<210> 145
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 145
ctggaagatg ccatgacagg 20
<210> 146
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 146
gcacagacta gagaggtaag 20
<210> 147
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 147
acagactaga gaggtaaggg 20
<210> 148
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 148
gagaggtgac ccgaatccac 20
<210> 149
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 149
gcacaggccc cagaaggaga 20
<210> 150
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 150
ccggagagga cccagacacg 20
<210> 151
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 151
gagaggaccc agacacgggg 20
<210> 152
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 152
gcaacacagc agagagcaag 20
<210> 153
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 153
gaagagggag tggaggaaga 20
<210> 154
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 154
aagacggaac ctgaaggagg 20
<210> 155
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 155
agaaagcggc acaggcccag 20
<210> 156
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 156
gggaaacagt gggccagagg 20
<210> 157
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 157
gtccggactc aggagagaga 20
<210> 158
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 158
ggcacagcaa gggcactcgg 20
<210> 159
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 159
gaagagggga agtcgaggga 20
<210> 160
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 160
gggaatggta aggaggcctg 20
<210> 161
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 161
gcagagtggt cagcacagag 20
<210> 162
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 162
gcacagagtg gctaagccca 20
<210> 163
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 163
gacggggtgt cagcataggg 20
<210> 164
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 164
gcccagggcc aggaacgacg 20
<210> 165
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 165
ggtggagtcc agcacggcgc 20
<210> 166
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 166
acaggccgcc aggaactcgg 20
<210> 167
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 167
actaggaagt gtgtagcacc 20
<210> 168
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 168
atgaatagca gactgccccg 20
<210> 169
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 169
acacccctaa aagcacagtg 20
<210> 170
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 170
caaggagttc cagcaggtgg 20
<210> 171
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 171
aaggagttcc agcaggtggg 20
<210> 172
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 172
tggaaagagg agggaagagg 20
<210> 173
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 173
tcgaattcct aactgccccg 20
<210> 174
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 174
gacctgccca gcacaccctg 20
<210> 175
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 175
ggagcagctg cggcagtggg 20
<210> 176
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 176
gggagggaga gcttggcagg 20
<210> 177
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 177
gttacgtggc caagaagcag 20
<210> 178
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 178
gctgaacaga gaagagctgg 20
<210> 179
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 179
tctgagggtg gagggactgg 20
<210> 180
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 180
ggagaggtga gggacttggg 20
<210> 181
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 181
gtgaaccagg cagacaacga 20
<210> 182
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 182
caggtacctc ctgagccacg 20
<210> 183
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 183
gggggagtag gggcatgcag 20
<210> 184
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 184
gcaaatggcc agcaagggtg 20
<210> 185
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 185
caccgaatcg agaagcgact cgaca 25
<210> 186
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 186
caccggtccc tgggcgttgc cctgc 25
<210> 187
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 187
caccgccctg ggcgttgccc tgcag 25
<210> 188
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 188
caccgccgtg ggaagataaa ctaat 25
<210> 189
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 189
caccgtcccc tgcagggcaa cgccc 25
<210> 190
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 190
caccggtcga gtcgcttctc gatta 25
<210> 191
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 191
caccgctgct gcctcccgtc ttgta 25
<210> 192
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 192
caccggagtg ccgcaatacc tttat 25
<210> 193
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 193
caccgacact ttggtggtgc agcaa 25
<210> 194
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 194
caccgtctca aatggtataa aactc 25
<210> 195
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 195
caccgaatcc cgcccataat cgaga 25
<210> 196
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 196
caccgtcccg cccataatcg agaag 25
<210> 197
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 197
caccgcccat aatcgagaag cgact 25
<210> 198
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 198
caccggagaa gcgactcgac atgga 25
<210> 199
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 199
caccggaagc gactcgacat ggagg 25
<210> 200
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 200
caccggcgac tcgacatgga ggcga 25
<210> 201
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 201
aaactgtcga gtcgcttctc gattc 25
<210> 202
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 202
aaacgcaggg caacgcccag ggacc 25
<210> 203
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 203
aaacctgcag ggcaacgccc agggc 25
<210> 204
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 204
aaacattagt ttatcttccc acggc 25
<210> 205
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 205
aaacgggcgt tgccctgcag gggac 25
<210> 206
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 206
aaactaatcg agaagcgact cgacc 25
<210> 207
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 207
aaactacaag acgggaggca gcagc 25
<210> 208
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 208
aaacataaag gtattgcggc actcc 25
<210> 209
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 209
aaacttgctg caccaccaaa gtgtc 25
<210> 210
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 210
aaacgagttt tataccattt gagac 25
<210> 211
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 211
aaactctcga ttatgggcgg gattc 25
<210> 212
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 212
aaaccttctc gattatgggc gggac 25
<210> 213
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 213
aaacagtcgc ttctcgatta tgggc 25
<210> 214
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 214
aaactccatg tcgagtcgct tctcc 25
<210> 215
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 215
aaaccctcca tgtcgagtcg cttcc 25
<210> 216
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 216
aaactcgcct ccatgtcgag tcgcc 25
<210> 217
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 217
caccgacagg gttaatgtga agtcc 25
<210> 218
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 218
caccgtcccc ctctacattt aaagt 25
<210> 219
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 219
caccgcattt aaagttggtt taagt 25
<210> 220
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 220
caccgttaga aaatataaag aataa 25
<210> 221
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 221
caccgtaaat gcttactggt ttgaa 25
<210> 222
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 222
caccgtcctg ggtccagaaa aagat 25
<210> 223
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 223
caccgttggg tggtgagcat ctgtg 25
<210> 224
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 224
caccgcgggg agagtggaga aaaag 25
<210> 225
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 225
caccggttaa aactctttag acaac 25
<210> 226
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 226
caccggaaaa tccccactaa gatcc 25
<210> 227
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 227
aaacggactt cacattaacc ctgtc 25
<210> 228
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 228
aaacacttta aatgtagagg gggac 25
<210> 229
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 229
aaacacttaa accaacttta aatgc 25
<210> 230
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 230
aaacttattc tttatatttt ctaac 25
<210> 231
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 231
aaacttcaaa ccagtaagca tttac 25
<210> 232
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 232
aaacatcttt ttctggaccc aggac 25
<210> 233
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 233
aaaccacaga tgctcaccac ccaac 25
<210> 234
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 234
aaaccttttt ctccactctc cccgc 25
<210> 235
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 235
aaacgttgtc taaagagttt taacc 25
<210> 236
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 236
aaacggatct tagtggggat tttcc 25
<210> 237
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 237
agtagcagta atgaagctgg 20
<210> 238
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 238
atacccagac gagaaagctg 20
<210> 239
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 239
tacccagacg agaaagctga 20
<210> 240
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 240
ggtggtgagc atctgtgtgg 20
<210> 241
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 241
aaatgagaag aagaggcaca 20
<210> 242
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 242
cttgtggcct gggagagctg 20
<210> 243
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 243
gctgtagaag gagacagagc 20
<210> 244
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 244
gagctggttg ggaagacatg 20
<210> 245
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 245
ctggttggga agacatgggg 20
<210> 246
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 246
cgtgaggatg ggaaggaggg 20
<210> 247
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 247
atgcagagtc agcagaactg 20
<210> 248
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 248
aagacatcaa gcacagaagg 20
<210> 249
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 249
tcaagcacag aaggaggagg 20
<210> 250
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 250
aaccgtcaat aggcaaaggg 20
<210> 251
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 251
ccgtatttca gactgaatgg 20
<210> 252
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 252
gagaggacag gtgctacagg 20
<210> 253
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 253
aaccaaggaa gggcaggagg 20
<210> 254
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 254
gacctctggg tggagacaga 20
<210> 255
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 255
cagatgacca tgacaagcag 20
<210> 256
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 256
aacaccagtg agtagagcgg 20
<210> 257
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 257
aggaccttga agcacagaga 20
<210> 258
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 258
tacagaggca gactaaccca 20
<210> 259
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 259
acagaggcag actaacccag 20
<210> 260
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 260
taaatgacgt gctagacctg 20
<210> 261
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 261
agtaaccact caggacaggg 20
<210> 262
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 262
accacaaaac agaaacacca 20
<210> 263
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 263
gtttgaagac aagcctgagg 20
<210> 264
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 264
gctgaacccc aaaagacagg 20
<210> 265
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 265
gcagctgaga cacacaccag 20
<210> 266
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 266
aggacacccc aaagaagctg 20
<210> 267
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 267
ggacacccca aagaagctga 20
<210> 268
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 268
ccagtgcaat ggacagaaga 20
<210> 269
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 269
agaagaggga gcctgcaagt 20
<210> 270
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 270
gtgtttgggc cctagagcga 20
<210> 271
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 271
catgtgcctg gtgcaatgca 20
<210> 272
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 272
tacaaagagg aagataagtg 20
<210> 273
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 273
gtcacagaat acaccactag 20
<210> 274
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 274
gggttaccct ggacatggaa 20
<210> 275
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 275
catggaaggg tattcactcg 20
<210> 276
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 276
agagtggcct agacaggctg 20
<210> 277
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 277
catgctggac agctcggcag 20
<210> 278
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 278
agtgaaagaa gagaaaattc 20
<210> 279
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 279
tggtaagtct aagaaaccta 20
<210> 280
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 280
cccacagcct aaccacccta 20
<210> 281
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 281
aatatttcaa agccctaggg 20
<210> 282
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 282
gcactcggaa cagggtctgg 20
<210> 283
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 283
agataggagc tccaacagtg 20
<210> 284
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 284
aagttagagc agccaggaaa 20
<210> 285
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 285
tagagcagcc aggaaaggga 20
<210> 286
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 286
tgaataccct tccatgtcca 20
<210> 287
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 287
cctgcattgc accaggcaca 20
<210> 288
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 288
tctagggccc aaacacacct 20
<210> 289
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 289
tccctccatc tatcaaaagg 20
<210> 290
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 290
agccctgaga cagaagcagg 20
<210> 291
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 291
gccctgagac agaagcaggt 20
<210> 292
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 292
aggagatgca gtgatacgca 20
<210> 293
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 293
acaataccaa gggtatccgg 20
<210> 294
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 294
tgataaagaa aacaaagtga 20
<210> 295
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 295
aaagaaaaca aagtgaggga 20
<210> 296
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 296
gtggcaagtg gagaaattga 20
<210> 297
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 297
caagtggaga aattgaggga 20
<210> 298
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 298
gtggtgatga ttgcagctgg 20
<210> 299
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 299
ctatgtgcct gacacacagg 20
<210> 300
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 300
gggttggacc aggaaagagg 20
<210> 301
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 301
gatgcctgga aaaggaaaga 20
<210> 302
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 302
tagtatgcac ctgcaagagg 20
<210> 303
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 303
tatgcacctg caagaggcgg 20
<210> 304
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 304
aggggaagaa gagaagcaga 20
<210> 305
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 305
gctgaatcaa gagacaagcg 20
<210> 306
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 306
aagcaaataa atctcctggg 20
<210> 307
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 307
agatgagtgc tagagactgg 20
<210> 308
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 308
ctgatggttg agcacagcag 20
<210> 309
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 309
caaatggcca gcaagggtgg 20
<210> 310
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 310
gcagaacctg aggatatgga 20
<210> 311
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 311
aatacacaga atgaaaatag 20
<210> 312
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 312
ctggtgacta gaataggcag 20
<210> 313
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 313
tggtgactag aataggcagt 20
<210> 314
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 314
taaaagaatg tgaaaagatg 20
<210> 315
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 315
tcaggagttc aagaccaccc 20
<210> 316
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 316
tgtagtccca gttatgcagg 20
<210> 317
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 317
gggttcacac cacaaatgca 20
<210> 318
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 318
ggcaaatggc cagcaagggt 20
<210> 319
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 319
agaaaccaat cccaaagcaa 20
<210> 320
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 320
gccaaggaca ccaaaaccca 20
<210> 321
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 321
agtggtgata aggcaacagt 20
<210> 322
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 322
cctgagacag aagtattaag 20
<210> 323
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 323
aaggtcacac aatgaatagg 20
<210> 324
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 324
caccatacta gggaagaaga 20
<210> 325
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 325
aataccctgc ccttagtggg 20
<210> 326
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 326
ttagtggggg gtggagtggg 20
<210> 327
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 327
caataccctg cccttagtgg 20
<210> 328
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 328
gtggggggtg gagtgggggg 20
<210> 329
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 329
ggggggtgga gtggggggtg 20
<210> 330
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 330
ggggtggagt ggggggtggg 20
<210> 331
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 331
gggtggagtg gggggtgggg 20
<210> 332
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 332
gggggtgggg aaagacatcg 20
<210> 333
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 333
gcagctgtga attctgatag 20
<210> 334
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 334
gagatcagag aaaccagatg 20
<210> 335
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 335
tctatactga ttgcagccag 20
<210> 336
<211> 1722
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 336
atggcgcaac actcagatta ctccgacgat gaattttgtg ctgacaaact gtccaattat 60
tcatgcgata gcgacctcga aaacgcttcc acgtctgatg aagatagcag cgatgatgaa 120
gtaatggtga ggcctcgcac cctccgccgt cgccgcatca gctcttcgag ctctgattct 180
gaatccgata ttgagggtgg ccgcgaggag tggtcccacg tagacaatcc gccggtgctg 240
gaggacttcc taggccacca aggtctgaac actgacgcag taatcaacaa tatcgaagat 300
gcagttaaac tgtttatcgg tgacgatttc ttcgagtttc tggtggagga atctaaccgg 360
tactataacc agaatcgtaa taacttcaag ctctctaaaa agtctctgaa gtggaaggac 420
atcacccctc aggagatgaa aaagttcctc ggtctgatcg ttctgatggg ccaagttcgc 480
aaggatcgtc gtgacgacta ttggactacc gaaccgtgga cggaaactcc atactttggc 540
aagaccatga ctcgtgaccg tttccgtcag atctggaagg cctggcactt caataacaac 600
gctgacattg tcaacgagtc tgatcgtctg tgtaaggttc gccctgtgct ggattacttc 660
gttccaaaat tcattaacat ttacaaacca catcagcagc tgtccctgga tgagggcatc 720
gtgccgtggc gcggccgcct gttcttccgt gtctataatg ctggcaagat tgtgaagtac 780
ggtatcctgg ttcgcctgct gtgcgaaagc gacactggct acatctgtaa catggagatc 840
tactgcggcg agggcaaacg tctcctcgaa actatccaga ccgtcgtgtc tccatacacg 900
gattcctggt atcatattta catggataac tattataaca gcgtggctaa ctgtgaagct 960
ctgatgaaaa ataagttccg tatttgcggt actatccgta agaatcgtgg aattccgaaa 1020
gatttccaga ccatctccct gaaaaagggt gaaactaagt tcattcgcaa aaacgacatc 1080
ctcctgcaag tctggcagtc taaaaagcct gtatatctga tctcatctat tcacagcgct 1140
gaaatggaag aatctcagaa cattgatcgc acctccaaga aaaagatcgt caaaccgaat 1200
gcattgattg attacaacaa gcacatgaag ggcgttgatc gtgctgacca gtacctgtct 1260
tattactcta tcctgcgccg tactgtgaag tggactaaac gtctcgctat gtacatgatt 1320
aattgtgcgc tgttcaattc ttacgctgtg tataaaagcg tgcgtcagcg caaaatgggc 1380
tttaaaatgt tcctgaagca gacggctatt cactggctga ccgacgatat tccggaagat 1440
atggacattg tcccggatct ccagccggta ccgagcacca gcggtatgcg tgctaaacct 1500
ccgactagtg atccgccttg ccgtctgtct atggatatgc gtaagcatac cctgcaggca 1560
attgtgggct ctggcaaaaa gaaaaatatc ctgcgtcgtt gccgcgtatg ctctgtacac 1620
aaactgcgtt ctgagactcg ttatatgtgt aaattttgca atattccact ccacaagggt 1680
gcgtgcttcg agaagtacca tacgctgaag aactatctcg ag 1722
<210> 337
<211> 1719
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 337
atggcccagc acagcgacta ccccgacgac gagttcagag ccgataagct gagtaactac 60
agctgcgaca gcgacctgga aaacgccagc acatccgacg aggacagctc tgacgacgag 120
gtgatggtgc ggcccagaac cctgagacgg agaagaatca gcagctctag cagcgactct 180
gaatccgaca tcgagggcgg ccgggaagag tggagccacg tggacaaccc tcctgttctg 240
gaagattttc tgggccatca gggcctgaac accgacgccg tgatcaacaa catcgaggat 300
gccgtgaagc tgttcatagg agatgatttc tttgagttcc tggtcgagga atccaaccgc 360
tattacaacc agaatagaaa caacttcaag ctgagcaaga aaagcctgaa gtggaaggac 420
atcacccctc aggagatgaa aaagttcctg ggactgatcg ttctgatggg acaggtgcgg 480
aaggacagaa gggatgatta ctggacaacc gaaccttgga ccgagacccc ttactttggc 540
aagaccatga ccagagacag attcagacag atctggaaag cctggcactt caacaacaat 600
gctgatatcg tgaacgagtc tgatagactg tgtaaagtgc ggccagtgtt ggattacttc 660
gtgcctaagt tcatcaacat ctataagcct caccagcagc tgagcctgga tgaaggcatc 720
gtgccctggc ggggcagact gttcttcaga gtgtacaatg ctggcaagat cgtcaaatac 780
ggcatcctgg tgcgccttct gtgcgagagc gatacaggct acatctgtaa tatggaaatc 840
tactgcggcg agggcaaaag actgctggaa accatccaga ccgtcgtttc cccttatacc 900
gacagctggt accacatcta catggacaac tactacaatt ctgtggccaa ctgcgaggcc 960
ctgatgaaga acaagtttag aatctgcggc acaatcagaa aaaacagagg catccctaag 1020
gacttccaga ccatctctct gaagaagggc gaaaccaagt tcatcagaaa gaacgacatc 1080
ctgctccaag tgtggcagtc caagaaaccc gtgtacctga tcagcagcat ccatagcgcc 1140
gagatggaag aaagccagaa catcgacaga acaagcaaga agaagatcgt gaagcccaat 1200
gctctgatcg actacaacaa gcacatgaaa ggcgtggacc gggccgacca gtacctgtct 1260
tattactcta tcctgagaag aacagtgaaa tggaccaaga gactggccat gtacatgatc 1320
aattgcgccc tgttcaacag ctacgccgtg tacaagtccg tgcgacaaag aaaaatggga 1380
ttcaagatgt tcctgaagca gacagccatc cactggctga cagacgacat tcctgaggac 1440
atggacattg tgccagatct gcaacctgtg cccagcacct ctggtatgag agctaagcct 1500
cccaccagcg atcctccatg tagactgagc atggacatgc ggaagcacac cctgcaggcc 1560
atcgtcggca gcggcaagaa gaagaacatc cttagacggt gcagggtgtg cagcgtgcac 1620
aagctgcgga gcgagactcg gtacatgtgc aagttttgca acattcccct gcacaaggga 1680
gcctgcttcg agaagtacca caccctgaag aattactag 1719
<210> 338
<211> 1719
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 338
atggcccagc acagcgacta ccccgacgac gagttcagag ccgataagct gagtaactac 60
agctgcgaca gcgacctgga aaacgccagc acatccgacg aggacagctc tgacgacgag 120
gtgatggtgc ggcccagaac cctgagacgg agaagaatca gcagctctag cagcgactct 180
gaatccgaca tcgagggcgg ccgggaagag tggagccacg tggacaaccc tcctgttctg 240
gaagattttc tgggccatca gggcctgaac accgacgccg tgatcaacaa catcgaggat 300
gccgtgaagc tgttcatagg agatgatttc tttgagttcc tggtcgagga atccaaccgc 360
tattacaacc agaatagaaa caacttcaag ctgagcaaga aaagcctgaa gtggaaggac 420
atcacccctc aggagatgaa aaagttcctg ggactgatcg ttctgatggg acaggtgcgg 480
aaggacagaa gggatgatta ctggacaacc gaaccttgga ccgagacccc ttactttggc 540
aagaccatga ccagagacag attcagacag atctggaaag cctggcactt caacaacaat 600
gctgatatcg tgaacgagtc tgatagactg tgtaaagtgc ggccagtgtt ggattacttc 660
gtgcctaagt tcatcaacat ctataagcct caccagcagc tgagcctgga tgaaggcatc 720
gtgccctggc ggggcagact gttcttcaga gtgtacaatg ctggcaagat cgtcaaatac 780
ggcatcctgg tgcgccttct gtgcgagagc gatacaggct acatctgtaa tatggaaatc 840
tactgcggcg agggcaaaag actgctggaa accatccaga ccgtcgtttc cccttatacc 900
gacagctggt accacatcta catggacaac tactacaatt ctgtggccaa ctgcgaggcc 960
ctgatgaaga acaagtttag aatctgcggc acaatcagaa aaaacagagg catccctaag 1020
gacttccaga ccatctctct gaagaagggc gaaaccaagt tcatcagaaa gaacgacatc 1080
ctgctccaag tgtggcagtc caagaaaccc gtgtacctga tcagcagcat ccatagcgcc 1140
gagatggaag aaagccagaa catcgacaga acaagcaaga agaagatcgt gaagcccaat 1200
gctctgatcg actacaacaa gcacatgaaa ggcgtggacc gggccgacca gtacctgtct 1260
tattactcta tcctgagaag aacagtgaaa tggaccaaga gactggccat gtacatgatc 1320
aattgcgccc tgttcaacag ctacgccgtg tacaagtccg tgcgacaaag aaaaatggga 1380
ttcaagatgt tcctgaagca gacagccatc cactggctga cagacgacat tcctgaggac 1440
atggacattg tgccagatct gcaacctgtg cccagcacct ctggtatgag agctaagcct 1500
cccaccagcg atcctccatg tagactgagc atggacatgc ggaagcacac cctgcaggcc 1560
atcgtcggca gcggcaagaa gaagaacatc cttagacggt gcagggtgtg cagcgtgcac 1620
aagctgcgga gcgagactcg gtacatgtgc aagttttgca acattcccct gcacaaggga 1680
gcctgcttcg agaagtacca caccctgaag aattactag 1719
<210> 339
<211> 1716
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 339
atgtcgcagc attcagacta tactcatgat gagttttgtg cagacaagtt gtccaattat 60
tcttgtgata gcgatcttga aaatgcgagt acaagtgatg aagattctag tgatgatgaa 120
gtaatggtgc gtcccaggac attgaggcga cgaagaattt cgagctccag ctctgactca 180
gagtcagata tagaaggcgg gagagaagaa tggtcgcatg ttgataatcc accggtctta 240
gaagattttt tagggcatca aggattaaac acagatgctg ttataaataa tatagaagat 300
gccgtgaaat tatttatcgg agatgatttt tttgaatttc ttgtagagga gtcaaacagg 360
tattataatc aaaataggaa taatttcaaa ctttcaaaaa aaagcctaaa gtggaaagat 420
ataacccctc aagagatgaa gaagttttta gggttaattg ttctcatggg acaggtgcgc 480
aaagatagaa gagatgacta ttggaccacg gagccatgga cggagacgcc atattttggt 540
aaaacgatga cgagagacag gttccgacag atatggaaag cttggcactt caataataat 600
gcggatatcg taaatgaatc agatagactt tgcaaagtga gaccagtact agattatttt 660
gtgcctaaat ttataaatat ttacaaacct catcagcaat tatcactaga tgaagggatc 720
gtaccttgga ggggaagatt attctttagg gtatataatg ctggcaagat cgttaaatat 780
ggaatattgg ttcgtttgtt gtgcgaaagt gatacaggat atatctgtaa catggaaatt 840
tattgcggcg aaggaaagcg attattggaa acgatacaaa cagtagtgtc tccatacact 900
gattcgtggt accatatata tatggacaat tattataata gcgtcgcaaa ttgtgaagca 960
cttatgaaaa acaaattcag aatatgtgga acaatccgga aaaatcgagg tatacctaaa 1020
gattttcaaa caatttcttt gaaaaaaggt gaaacaaaat ttataaggaa aaatgatata 1080
ttgttacaag tgtggcaatc aaaaaagcct gtatacctga tttcttcgat tcattctgcg 1140
gagatggaag aaagtcagaa tattgacaga acatcaaaaa agaaaattgt caaaccgaat 1200
gcactcattg actacaataa acatatgaaa ggtgttgacc gggccgacca atacctttca 1260
tattattcga tattgcggag gacggtcaaa tggacaaaaa ggttggcaat gtatatgata 1320
aattgcgcat tatttaattc ttatgcagtt tacaaatcag tgaggcaaag aaaaatgggt 1380
tttaaaatgt ttttgaaaca aacagctatc cactggttga cggatgatat tccagaggac 1440
atggacattg ttccagacct tcaaccagta ccgtctactt ctggaatgcg ggctaaacca 1500
cctacatctg atccaccatg caggctatcg atggacatga gaaagcatac gttacaggca 1560
attgtcggaa gtggaaaaaa gaaaaacatt ttgagaaggt gtcgcgtatg ttccgttcat 1620
aaattgcgca gtgagacacg ctacatgtgc aaattttgca atatacctct acataaaggg 1680
gcgtgttttg aaaaatatca tacgctaaaa aactat 1716
<210> 340
<211> 572
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 340
Met Ala Gln His Ser Asp Tyr Pro Asp Asp Glu Phe Arg Ala Asp Lys
1 5 10 15
Leu Ser Asn Tyr Ser Cys Asp Ser Asp Leu Glu Asn Ala Ser Thr Ser
20 25 30
Asp Glu Asp Ser Ser Asp Asp Glu Val Met Val Arg Pro Arg Thr Leu
35 40 45
Arg Arg Arg Arg Ile Ser Ser Ser Ser Ser Asp Ser Glu Ser Asp Ile
50 55 60
Glu Gly Gly Arg Glu Glu Trp Ser His Val Asp Asn Pro Pro Val Leu
65 70 75 80
Glu Asp Phe Leu Gly His Gln Gly Leu Asn Thr Asp Ala Val Ile Asn
85 90 95
Asn Ile Glu Asp Ala Val Lys Leu Phe Ile Gly Asp Asp Phe Phe Glu
100 105 110
Phe Leu Val Glu Glu Ser Asn Arg Tyr Tyr Asn Gln Lys Arg Asn Asn
115 120 125
Phe Lys Leu Ser Lys Lys Ser Leu Lys Trp Lys Asp Ile Thr Pro Gln
130 135 140
Glu Met Lys Lys Phe Leu Gly Leu Ile Val Leu Met Gly Gln Val Arg
145 150 155 160
Lys Asp Arg Arg Asp Asp Tyr Trp Thr Thr Glu Pro Trp Thr Glu Thr
165 170 175
Pro Tyr Phe Gly Lys Thr Met Thr Arg Asp Arg Phe Arg Gln Ile Trp
180 185 190
Lys Ala Trp His Phe Asn Asn Asn Ala Asp Ile Val Asn Glu Ser Asp
195 200 205
Arg Leu Cys Lys Val Arg Pro Val Leu Asp Tyr Phe Val Pro Lys Phe
210 215 220
Ile Asn Ile Tyr Lys Pro His Gln Gln Leu Ser Leu Asp Glu Gly Ile
225 230 235 240
Val Pro Trp Arg Gly Arg Leu Phe Phe Arg Val Tyr Asn Ala Gly Lys
245 250 255
Ile Val Lys Tyr Gly Ile Leu Val Arg Leu Leu Cys Glu Ser Asp Thr
260 265 270
Gly Tyr Ile Cys Asn Met Glu Ile Tyr Cys Gly Glu Gly Lys Arg Leu
275 280 285
Leu Glu Thr Ile Gln Thr Val Val Ser Pro Tyr Thr Asp Ser Trp Tyr
290 295 300
His Ile Tyr Met Asp Asn Tyr Tyr Asn Ser Val Ala Asn Cys Glu Ala
305 310 315 320
Leu Met Lys Asn Lys Phe Arg Ile Cys Gly Thr Ile Arg Lys Asn Arg
325 330 335
Gly Ile Pro Lys Asp Phe Gln Thr Ile Ser Leu Lys Lys Gly Glu Thr
340 345 350
Lys Phe Ile Arg Lys Asn Asp Ile Leu Leu Gln Val Trp Gln Ser Lys
355 360 365
Lys Pro Val Tyr Leu Ile Ser Ser Ile His Ser Ala Glu Met Glu Glu
370 375 380
Ser Gln Asn Ile Asp Arg Thr Ser Lys Lys Lys Ile Val Lys Pro Asn
385 390 395 400
Ala Leu Ile Asp Tyr Asn Lys His Met Lys Gly Val Asp Arg Ala Asp
405 410 415
Gln Tyr Leu Ser Tyr Tyr Ser Ile Leu Arg Arg Thr Val Lys Trp Thr
420 425 430
Lys Arg Leu Ala Met Tyr Met Ile Asn Cys Ala Leu Phe Asn Ser Tyr
435 440 445
Ala Val Tyr Lys Ser Val Arg Gln Arg Lys Met Gly Phe Lys Met Phe
450 455 460
Leu Lys Gln Thr Ala Ile His Trp Leu Thr Asp Asp Ile Pro Glu Asp
465 470 475 480
Met Asp Ile Val Pro Asp Leu Gln Pro Val Pro Ser Thr Ser Gly Met
485 490 495
Arg Ala Lys Pro Pro Thr Ser Asp Pro Pro Cys Arg Leu Ser Met Asp
500 505 510
Met Arg Lys His Thr Leu Gln Ala Ile Val Gly Ser Gly Lys Lys Lys
515 520 525
Asn Ile Leu Arg Arg Cys Arg Val Cys Ser Val His Lys Leu Arg Ser
530 535 540
Glu Thr Arg Tyr Met Cys Lys Phe Cys Asn Ile Pro Leu His Lys Gly
545 550 555 560
Ala Cys Phe Glu Lys Tyr His Thr Leu Lys Asn Tyr
565 570
<210> 341
<211> 574
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 341
Met Ala Gln His Ser Asp Tyr Ser Asp Asp Glu Phe Cys Ala Asp Lys
1 5 10 15
Leu Ser Asn Tyr Ser Cys Asp Ser Asp Leu Glu Asn Ala Ser Thr Ser
20 25 30
Asp Glu Asp Ser Ser Asp Asp Glu Val Met Val Arg Pro Arg Thr Leu
35 40 45
Arg Arg Arg Arg Ile Ser Ser Ser Ser Ser Asp Ser Glu Ser Asp Ile
50 55 60
Glu Gly Gly Arg Glu Glu Trp Ser His Val Asp Asn Pro Pro Val Leu
65 70 75 80
Glu Asp Phe Leu Gly His Gln Gly Leu Asn Thr Asp Ala Val Ile Asn
85 90 95
Asn Ile Glu Asp Ala Val Lys Leu Phe Ile Gly Asp Asp Phe Phe Glu
100 105 110
Phe Leu Val Glu Glu Ser Asn Arg Tyr Tyr Asn Gln Asn Arg Asn Asn
115 120 125
Phe Lys Leu Ser Lys Lys Ser Leu Lys Trp Lys Asp Ile Thr Pro Gln
130 135 140
Glu Met Lys Lys Phe Leu Gly Leu Ile Val Leu Met Gly Gln Val Arg
145 150 155 160
Lys Asp Arg Arg Asp Asp Tyr Trp Thr Thr Glu Pro Trp Thr Glu Thr
165 170 175
Pro Tyr Phe Gly Lys Thr Met Thr Arg Asp Arg Phe Arg Gln Ile Trp
180 185 190
Lys Ala Trp His Phe Asn Asn Asn Ala Asp Ile Val Asn Glu Ser Asp
195 200 205
Arg Leu Cys Lys Val Arg Pro Val Leu Asp Tyr Phe Val Pro Lys Phe
210 215 220
Ile Asn Ile Tyr Lys Pro His Gln Gln Leu Ser Leu Asp Glu Gly Ile
225 230 235 240
Val Pro Trp Arg Gly Arg Leu Phe Phe Arg Val Tyr Asn Ala Gly Lys
245 250 255
Ile Val Lys Tyr Gly Ile Leu Val Arg Leu Leu Cys Glu Ser Asp Thr
260 265 270
Gly Tyr Ile Cys Asn Met Glu Ile Tyr Cys Gly Glu Gly Lys Arg Leu
275 280 285
Leu Glu Thr Ile Gln Thr Val Val Ser Pro Tyr Thr Asp Ser Trp Tyr
290 295 300
His Ile Tyr Met Asp Asn Tyr Tyr Asn Ser Val Ala Asn Cys Glu Ala
305 310 315 320
Leu Met Lys Asn Lys Phe Arg Ile Cys Gly Thr Ile Arg Lys Asn Arg
325 330 335
Gly Ile Pro Lys Asp Phe Gln Thr Ile Ser Leu Lys Lys Gly Glu Thr
340 345 350
Lys Phe Ile Arg Lys Asn Asp Ile Leu Leu Gln Val Trp Gln Ser Lys
355 360 365
Lys Pro Val Tyr Leu Ile Ser Ser Ile His Ser Ala Glu Met Glu Glu
370 375 380
Ser Gln Asn Ile Asp Arg Thr Ser Lys Lys Lys Ile Val Lys Pro Asn
385 390 395 400
Ala Leu Ile Asp Tyr Asn Lys His Met Lys Gly Val Asp Arg Ala Asp
405 410 415
Gln Tyr Leu Ser Tyr Tyr Ser Ile Leu Arg Arg Thr Val Lys Trp Thr
420 425 430
Lys Arg Leu Ala Met Tyr Met Ile Asn Cys Ala Leu Phe Asn Ser Tyr
435 440 445
Ala Val Tyr Lys Ser Val Arg Gln Arg Lys Met Gly Phe Lys Met Phe
450 455 460
Leu Lys Gln Thr Ala Ile His Trp Leu Thr Asp Asp Ile Pro Glu Asp
465 470 475 480
Met Asp Ile Val Pro Asp Leu Gln Pro Val Pro Ser Thr Ser Gly Met
485 490 495
Arg Ala Lys Pro Pro Thr Ser Asp Pro Pro Cys Arg Leu Ser Met Asp
500 505 510
Met Arg Lys His Thr Leu Gln Ala Ile Val Gly Ser Gly Lys Lys Lys
515 520 525
Asn Ile Leu Arg Arg Cys Arg Val Cys Ser Val His Lys Leu Arg Ser
530 535 540
Glu Thr Arg Tyr Met Cys Lys Phe Cys Asn Ile Pro Leu His Lys Gly
545 550 555 560
Ala Cys Phe Glu Lys Tyr His Thr Leu Lys Asn Tyr Leu Glu
565 570
<210> 342
<400> 342
000
<210> 343
<211> 507
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 343
Met Ser Gln His Ser Asp Tyr Ser Asp Asp Glu Phe Cys Ala Asp Lys
1 5 10 15
Leu Ser Asn Tyr Ser Cys Asp Ser Asp Leu Glu Asn Ala Ser Thr Ser
20 25 30
Asp Glu Asp Ser Ser Asp Asp Glu Val Met Val Arg Pro Arg Thr Leu
35 40 45
Arg Arg Arg Arg Ile Ser Ser Ser Ser Ser Asp Ser Glu Ser Asp Ile
50 55 60
Glu Gly Gly Arg Glu Glu Trp Ser His Val Asp Asn Pro Pro Val Leu
65 70 75 80
Glu Asp Phe Leu Gly His Gln Gly Leu Asn Thr Asp Ala Val Ile Asn
85 90 95
Asn Ile Glu Asp Ala Val Lys Leu Phe Ile Gly Asp Asp Phe Phe Glu
100 105 110
Phe Leu Val Glu Glu Ser Asn Arg Lys Thr Met Thr Arg Asp Arg Phe
115 120 125
Arg Gln Ile Trp Lys Ala Trp His Phe Asn Asn Asn Ala Asp Ile Val
130 135 140
Asn Glu Ser Asp Arg Leu Cys Lys Val Arg Pro Val Leu Asp Tyr Phe
145 150 155 160
Val Pro Lys Phe Ile Asn Ile Tyr Lys Pro His Gln Gln Leu Ser Leu
165 170 175
Asp Glu Gly Ile Val Pro Trp Arg Gly Arg Leu Phe Phe Arg Val Tyr
180 185 190
Asn Ala Gly Lys Ile Val Lys Tyr Gly Ile Leu Val Arg Leu Leu Cys
195 200 205
Glu Ser Asp Thr Gly Tyr Ile Cys Asn Met Glu Ile Tyr Cys Gly Glu
210 215 220
Gly Lys Arg Leu Leu Glu Thr Ile Gln Thr Trp Ser Pro Tyr Thr Asp
225 230 235 240
Ser Trp Tyr His Ile Tyr Met Asp Asn Tyr Tyr Asn Ser Val Ala Asn
245 250 255
Cys Glu Ala Leu Met Lys Asn Lys Phe Arg Ile Cys Gly Thr Ile Arg
260 265 270
Lys Asn Arg Gly Ile Pro Lys Asp Phe Gln Thr Ile Ser Leu Lys Lys
275 280 285
Gly Glu Thr Lys Phe Ile Arg Lys Asn Asp Ile Leu Leu Gln Val Trp
290 295 300
Gln Ser Lys Lys Pro Val Tyr Leu Ile Ser Ser His Ser Ala Glu Met
305 310 315 320
Glu Glu Ser Gln Asn Ile Asp Arg Thr Ser Lys Lys Lys Ile Val Lys
325 330 335
Pro Asn Ala Leu Ile Asp Tyr Asn Lys His Met Lys Gly Val Asp Arg
340 345 350
Ala Asp Gln Tyr Leu Ser Tyr Tyr Ser Ile Leu Arg Arg Trp Lys Trp
355 360 365
Thr Lys Arg Leu Ala Met Tyr Met Ile Asn Cys Ala Leu Phe Asn Ser
370 375 380
Tyr Ala Val Tyr Lys Ser Val Arg Gln Arg Lys Met Gly Phe Lys Met
385 390 395 400
Phe Leu Lys Gln Thr Ala His Trp Leu Thr Asp Asp Ile Pro Glu Asp
405 410 415
Met Asp Ile Val Pro Asp Leu Gln Pro Val Pro Ser Thr Ser Gly Met
420 425 430
Arg Ala Lys Pro Pro Thr Ser Asp Pro Pro Cys Arg Leu Ser Met Asp
435 440 445
Met Arg Lys His Thr Leu Gln Ala Ile Val Gly Ser Gly Lys Lys Lys
450 455 460
Asn Ile Leu Arg Arg Cys Arg Val Cys Ser Val His Lys Leu Arg Ser
465 470 475 480
Glu Thr Arg Tyr Met Cys Lys Phe Cys Asn Ile Pro Leu His Lys Gly
485 490 495
Ala Cys Phe Glu Lys Tyr His Thr Leu Lys Asn
500 505
<210> 344
<211> 153
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 344
cacttggatt gcgggaaacg agttaagtcg gctcgcgtga attgcgcgta ctccgcggga 60
gccgtcttaa ctcggttcat atagatttgc ggtggagtgc gggaaacgtg taaactcggg 120
ccgattgtaa ctgcgtatta ccaaatattt gtt 153
<210> 345
<211> 158
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 345
cacttgggtt gcgggaaacg agttaagtcg gctcgcgtga attgcgcgta ctccgcggga 60
gccgtcttaa actcggttca tatagatttg cggtggagtg cgggaaacgt tgtaaactcg 120
ggccgattgt aactgcgtat taccaaatat ttcatttc 158
<210> 346
<211> 181
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 346
aaatgtctgt gattgaataa attttcattt tttacacaag aaaccgaaaa tttcatttca 60
atcgaaccca tacttcaaaa gatataggca ttttaaacta actctgattt tgcgcgggaa 120
acctaaataa ttgcccgcgc catcttatat tttggcggga aattcacccg acaccgtagt 180
g 181
<210> 347
<211> 136
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 347
aaacgttgta aactcgggcc gattgtaact gcgtattacc aaatatttca tttcaatcga 60
acccatactt aaaagatata ggcattttaa cgcgccatct tatattttgg cgggaaattc 120
acccgacacc gtagtg 136
<210> 348
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> MISC_FEATURE
<222> (1)..(6)
<223> Xaa可以是任何天然存在的氨基酸;SEQ ID NO: 348对应于序列K(K/R)X(K/R)
<400> 348
Lys Lys Arg Xaa Lys Arg
1 5
<210> 349
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> MISC_FEATURE
<222> (1)..(7)
<223> Xaa可以是任何天然存在的氨基酸;SEQ ID NO: 349对应于序列(K/R)(K/R)X10-12(K/R)3/5
<400> 349
Lys Arg Lys Arg Xaa Lys Arg
1 5
<210> 350
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 350
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 351
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 351
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 352
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 352
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 353
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 353
Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val
1 5 10 15
Asp Pro Lys Lys Lys Arg Lys Val
20
<210> 354
<400> 354
000
<210> 355
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 355
Asn His Asn His His Asp His Asp Asn His Asn His His Asp His Asp
1 5 10 15
Asn Gly Asn His Asn Ile His Asp His Asp Asn Ile His Asp Asn Gly
20 25 30
Asn His Asn His
35
<210> 356
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 356
Asn His Asn Ile Asn Ile Asn His Asn His His Asp His Asp Asn Gly
1 5 10 15
Asn His Asn His His Asp His Asp Asn His Asn His His Asp His Asp
20 25 30
Asn Gly Asn His
35
<210> 357
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 357
Asn His Asn Ile Asn His His Asp Asn Ile His Asp Asn Gly Asn His
1 5 10 15
Asn Ile Asn Ile Asn His Asn His His Asp His Asp Asn Gly Asn His
20 25 30
Asn His His Asp
35
<210> 358
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 358
His Asp His Asp Asn Ile His Asp Asn Gly Asn His Asn Ile Asn His
1 5 10 15
His Asp Asn Ile His Asp Asn Gly Asn His Asn Ile Asn Ile Asn His
20 25 30
Asn His His Asp
35
<210> 359
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 359
Asn His Asn His Asn Gly Asn Gly Asn Gly His Asp His Asp Asn Ile
1 5 10 15
His Asp Asn Gly Asn His Asn Ile Asn His His Asp Asn Ile His Asp
20 25 30
Asn Gly Asn His
35
<210> 360
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 360
Asn His Asn His Asn His Asn His Asn Ile Asn Ile Asn Ile Asn Ile
1 5 10 15
Asn Gly Asn His Asn Ile His Asp His Asp His Asp Asn Ile Asn Ile
20 25 30
His Asp Asn Ile
35
<210> 361
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 361
Asn Ile Asn His Asn His Asn Ile His Asp Asn Ile Asn His Asn Gly
1 5 10 15
Asn His Asn His Asn His Asn His Asn Ile Asn Ile Asn Ile Asn Ile
20 25 30
Asn Gly Asn His
35
<210> 362
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 362
His Asp His Asp Asn Ile Asn His Asn His Asn His Asn Ile His Asp
1 5 10 15
Asn Ile His Asp Asn His Asn His Asn Gly Asn His His Asp Asn Gly
20 25 30
Asn Ile Asn His
35
<210> 363
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 363
His Asp Asn Ile Asn His Asn Ile Asn His His Asp His Asp Asn Ile
1 5 10 15
Asn His Asn His Asn Ile Asn His Asn Gly His Asp His Asp Asn Gly
20 25 30
Asn His Asn His
35
<210> 364
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 364
His Asp His Asp Asn Gly Asn Gly His Asp Asn Ile Asn His Asn Ile
1 5 10 15
Asn His His Asp His Asp Asn Ile Asn His Asn His Asn Ile Asn His
20 25 30
Asn Gly His Asp
35
<210> 365
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 365
His Asp His Asp Asn Gly His Asp His Asp Asn Gly Asn Gly His Asp
1 5 10 15
Asn Ile Asn His Asn Ile Asn His His Asp His Asp Asn Ile Asn His
20 25 30
Asn His Asn Ile
35
<210> 366
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 366
His Asp His Asp Asn Ile Asn His His Asp His Asp His Asp His Asp
1 5 10 15
Asn Gly His Asp His Asp Asn Gly His Asp His Asp Asn Gly Asn Gly
20 25 30
His Asp Asn Ile
35
<210> 367
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 367
His Asp His Asp Asn His Asn Ile Asn His His Asp Asn Gly Asn Gly
1 5 10 15
Asn His Asn Ile His Asp His Asp His Asp Asn Gly Asn Gly Asn His
20 25 30
Asn His Asn Ile
35
<210> 368
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 368
Asn His Asn His Asn Gly Asn Gly Asn Gly His Asp His Asp Asn His
1 5 10 15
Asn Ile Asn His His Asp Asn Gly Asn Gly Asn His Asn Ile His Asp
20 25 30
His Asp His Asp
35
<210> 369
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 369
Asn His Asn His Asn His Asn His Asn Gly Asn His Asn His Asn Gly
1 5 10 15
Asn Gly Asn Gly His Asp His Asp Asn His Asn Ile Asn His His Asp
20 25 30
Asn Gly Asn Gly
35
<210> 370
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 370
His Asp Asn Gly Asn His His Asp Asn Gly Asn His Asn His Asn His
1 5 10 15
Asn His Asn Gly Asn His Asn His Asn Gly Asn Gly Asn Gly His Asp
20 25 30
His Asp Asn His
35
<210> 371
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 371
Asn His His Asp Asn Ile Asn His Asn Ile Asn His Asn Gly Asn Ile
1 5 10 15
Asn Gly His Asp Asn Gly Asn His His Asp Asn Gly Asn His Asn His
20 25 30
Asn His Asn His
35
<210> 372
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 372
His Asp His Asp Asn Ile Asn Ile Asn Gly His Asp His Asp His Asp
1 5 10 15
His Asp Asn Gly His Asp Asn Ile Asn His Asn Gly
20 25
<210> 373
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 373
His Asp Asn Ile Asn His Asn Gly Asn His His Asp Asn Gly His Asp
1 5 10 15
Asn Ile Asn His Asn Gly Asn His Asn His Asn Ile Asn Ile
20 25 30
<210> 374
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 374
Asn His Asn Ile Asn Ile Asn Ile His Asp Asn Ile Asn Gly His Asp
1 5 10 15
His Asp Asn His Asn His His Asp Asn His Asn Ile His Asp Asn Gly
20 25 30
His Asp Asn Ile
35
<210> 375
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 375
His Asp Asn His His Asp His Asp His Asp His Asp Asn Gly His Asp
1 5 10 15
Asn Ile Asn Ile Asn Ile Asn Gly His Asp Asn Gly Asn Gly Asn Ile
20 25 30
His Asp Asn Ile
35
<210> 376
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 376
His Asp Asn Ile Asn Ile Asn Ile Asn Gly His Asp Asn Gly Asn Gly
1 5 10 15
Asn Ile His Asp Asn Ile Asn His His Asp Asn Gly Asn His His Asp
20 25 30
Asn Gly His Asp
35
<210> 377
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 377
His Asp Asn Gly Asn Gly Asn Ile His Asp Asn Ile Asn His His Asp
1 5 10 15
Asn Gly Asn His His Asp Asn Gly His Asp Asn Ile His Asp Asn Gly
20 25 30
His Asp His Asp
35
<210> 378
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 378
Asn Ile His Asp Asn Ile Asn His His Asp Asn Gly Asn His His Asp
1 5 10 15
Asn Gly His Asp Asn Ile His Asp Asn Gly His Asp His Asp His Asp
20 25 30
His Asp Asn Gly
35
<210> 379
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 379
Asn His His Asp Asn Gly His Asp Asn Ile His Asp Asn Gly His Asp
1 5 10 15
His Asp His Asp His Asp Asn Gly Asn His His Asp Asn Ile Asn His
20 25 30
Asn His Asn His
35
<210> 380
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 380
His Asp His Asp His Asp His Asp Asn Gly Asn His His Asp Asn Ile
1 5 10 15
Asn His Asn His Asn His His Asp Asn Ile Asn Ile His Asp Asn His
20 25 30
His Asp His Asp
35
<210> 381
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 381
Asn His His Asp Asn Ile Asn His Asn His Asn His His Asp Asn Ile
1 5 10 15
Asn Ile His Asp Asn His His Asp His Asp His Asp Asn Ile Asn His
20 25 30
Asn His Asn His
35
<210> 382
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 382
His Asp Asn Gly His Asp Asn His Asn Ile Asn Gly Asn Gly Asn Ile
1 5 10 15
Asn Gly Asn His Asn His Asn His His Asp Asn His Asn His Asn His
20 25 30
Asn Ile Asn Gly
35
<210> 383
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 383
His Asp Asn His His Asp Asn Gly Asn Gly His Asp Asn Gly His Asp
1 5 10 15
Asn His Asn Ile Asn Gly Asn Gly Asn Ile Asn Gly Asn His Asn His
20 25 30
Asn His His Asp
35
<210> 384
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 384
Asn His Asn Gly His Asp Asn His Asn Ile Asn His Asn Gly His Asp
1 5 10 15
Asn His His Asp Asn Gly Asn Gly His Asp Asn Gly His Asp Asn His
20 25 30
Asn Ile Asn Gly
35
<210> 385
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 385
His Asp His Asp Asn Ile Asn Gly Asn His Asn Gly His Asp Asn His
1 5 10 15
Asn Ile Asn His Asn Gly His Asp Asn His His Asp Asn Gly Asn Gly
20 25 30
His Asp Asn Gly
35
<210> 386
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 386
His Asp Asn His His Asp His Asp Asn Gly His Asp His Asp Asn Ile
1 5 10 15
Asn Gly Asn His Asn Gly His Asp Asn His Asn Ile Asn His Asn Gly
20 25 30
His Asp Asn His
35
<210> 387
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 387
His Asp Asn His Asn Gly His Asp Asn Ile Asn Gly His Asp Asn His
1 5 10 15
His Asp His Asp Asn Gly His Asp His Asp Asn Ile Asn Gly Asn His
20 25 30
Asn Gly His Asp
35
<210> 388
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 388
Asn His Asn Ile Asn Gly His Asp Asn Gly His Asp Asn His Asn Gly
1 5 10 15
His Asp Asn Ile Asn Gly His Asp Asn His His Asp His Asp Asn Gly
20 25 30
His Asp His Asp
35
<210> 389
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 389
Asn His His Asp Asn Gly Asn Gly His Asp Asn Ile Asn His His Asp
1 5 10 15
Asn Gly Asn Gly His Asp His Asp Asn Gly Asn Ile
20 25
<210> 390
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 390
His Asp Asn Gly Asn Lys Asn Gly Asn His Asn Ile Asn Gly His Asp
1 5 10 15
Asn Ile Asn Gly Asn His His Asp His Asp Asn Ile
20 25
<210> 391
<211> 32
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 391
Asn Ile His Asp Asn Ile Asn Asn Asn Gly Asn Asn Asn Asn Asn Gly
1 5 10 15
Asn Ile His Asp Asn Ile His Asp Asn Ile His Asp His Asp Asn Gly
20 25 30
<210> 392
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 392
His Asp His Asp Asn Ile His Asp His Asp His Asp His Asp His Asp
1 5 10 15
His Asp Asn Ile His Asp Asn Gly Asn Ile Asn Ile Asn Asn
20 25 30
<210> 393
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 393
His Asp Asn Ile Asn Gly Asn Gly Asn Asn Asn Asn His Asp His Asp
1 5 10 15
Asn Asn Asn Asn Asn Asn His Asp Asn Ile His Asp
20 25
<210> 394
<211> 32
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 394
Asn Asn His Asp Asn Gly Asn Gly Asn Asn Asn Ile Asn Ile His Asp
1 5 10 15
His Asp His Asp Asn Ile Asn Asn Asn Asn Asn Ile Asn Asn Asn Ile
20 25 30
<210> 395
<211> 34
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 395
Asn Ile His Asp Asn Ile His Asp His Asp His Asp Asn Asn Asn Ile
1 5 10 15
Asn Gly His Asp His Asp Asn Ile His Asp Asn Gly Asn Asn Asn Asn
20 25 30
Asn Asn
<210> 396
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 396
Asn Asn His Asp Asn Gly Asn Asn His Asp Asn Ile Asn Gly His Asp
1 5 10 15
Asn Ile Asn Ile His Asp His Asp His Asp His Asp
20 25
<210> 397
<211> 34
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 397
Asn Asn Asn Asn His Asp Asn Ile His Asp Asn Asn Asn Ile Asn Ile
1 5 10 15
Asn Ile His Asp Asn Ile His Asp His Asp His Asp Asn Gly His Asp
20 25 30
His Asp
<210> 398
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 398
Asn Asn Asn Asn Asn Gly Asn Asn Asn Asn His Asp Asn Gly His Asp
1 5 10 15
Asn Ile Asn Gly Asn Asn His Asp His Asp Asn Gly Asn Asn
20 25 30
<210> 399
<211> 32
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 399
Asn Asn Asn Ile Asn Gly Asn Gly Asn Gly Asn Asn His Asp Asn Ile
1 5 10 15
His Asp Asn Ile Asn Asn His Asp Asn Gly His Asp Asn Ile Asn Gly
20 25 30
<210> 400
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 400
Asn Ile Asn Ile Asn His His Asp Asn Gly His Asp Asn Gly Asn His
1 5 10 15
Asn Ile Asn His Asn His Asn Ile Asn His His Asp
20 25
<210> 401
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 401
His Asp His Asp His Asp Asn Gly Asn Ile Asn Lys His Asp Asn Gly
1 5 10 15
Asn His Asn Gly His Asp His Asp His Asp His Asp
20 25
<210> 402
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 402
Asn His His Asp His Asp Asn Gly Asn Ile Asn His His Asp Asn Ile
1 5 10 15
Asn Gly Asn His His Asp Asn Gly Asn Ile Asn His
20 25
<210> 403
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 403
Asn Ile Asn Gly Asn His Asn His Asn His His Asp Asn Gly Asn Gly
1 5 10 15
His Asp Asn Ile His Asp Asn His Asn His Asn Ile Asn Gly
20 25 30
<210> 404
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 404
Asn His Asn Ile Asn Ile Asn Ile His Asp Asn Gly Asn Ile Asn Gly
1 5 10 15
Asn His His Asp His Asp Asn Gly Asn His His Asp
20 25
<210> 405
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 405
Asn His His Asp Asn Ile His Asp His Asp Asn Ile Asn Gly Asn Gly
1 5 10 15
Asn His His Asp Asn Gly His Asp His Asp His Asp
20 25
<210> 406
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 406
Asn His Asn Ile His Asp Asn Ile Asn Gly Asn His His Asp Asn Ile
1 5 10 15
Asn Ile His Asp Asn Gly His Asp Asn Ile Asn His
20 25
<210> 407
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 407
Asn Ile His Asp Asn Ile His Asp His Asp Asn Ile His Asp Asn Gly
1 5 10 15
Asn Ile Asn His Asn His Asn His Asn His Asn Gly
20 25
<210> 408
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 408
Asn His Asn Gly His Asp Asn Gly Asn His His Asp Asn Gly Asn Ile
1 5 10 15
Asn His Asn Ile His Asp Asn Ile Asn His Asn His
20 25
<210> 409
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 409
Asn His Asn His His Asp His Asp Asn Gly Asn Ile Asn His Asn Ile
1 5 10 15
His Asp Asn Ile Asn His Asn His His Asp Asn Gly Asn His
20 25 30
<210> 410
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 410
Asn His Asn Ile Asn His Asn His His Asp Asn Ile Asn Gly Asn Gly
1 5 10 15
His Asp Asn Gly Asn Gly Asn Ile Asn Gly His Asp Asn His
20 25 30
<210> 411
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 411
Asn Asn His Asp His Asp Asn Gly Asn Asn Asn Asn Asn Ile Asn Ile
1 5 10 15
Asn Ile His Asp Asn Asn Asn Gly Asn Gly His Asp His Asp
20 25 30
<210> 412
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 412
Asn Asn Asn Gly Asn Asn His Asp Asn Gly His Asp Asn Gly Asn Asn
1 5 10 15
Asn Ile His Asp Asn Ile Asn Ile Asn Gly Asn Ile
20 25
<210> 413
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 413
Asn Asn Asn Gly Asn Gly Asn Gly Asn Gly Asn Asn His Asp Asn Ile
1 5 10 15
Asn Asn His Asp His Asp Asn Gly His Asp His Asp
20 25
<210> 414
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 414
Asn Ile His Asp Asn Ile Asn Asn His Asp Asn Gly Asn Asn Asn Gly
1 5 10 15
Asn Asn Asn Asn Asn Ile Asn Ile His Asp Asn Asn Asn Gly
20 25 30
<210> 415
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 415
His Asp Asn Ile Asn Ile Asn Asn Asn Ile His Asp His Asp Asn Asn
1 5 10 15
Asn Ile Asn Asn His Asp Asn Ile His Asp Asn Gly Asn Asn His Asp
20 25 30
Asn Gly Asn Asn
35
<210> 416
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 416
His Asp Asn Gly Asn Ile Asn Gly His Asp His Asp His Asp Asn Ile
1 5 10 15
Asn Ile Asn Ile Asn Ile His Asp Asn Gly His Asp Asn Gly
20 25 30
<210> 417
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 417
Asn His Asn Ile Asn Ile Asn Ile Asn Ile Asn Ile His Asp Asn Gly
1 5 10 15
Asn Ile Asn Gly Asn His Asn Gly Asn Ile Asn Gly
20 25
<210> 418
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 418
Asn Ile Asn His Asn His His Asp Asn Ile Asn His Asn His His Asp
1 5 10 15
Asn Gly Asn His Asn His Asn Gly Asn Gly Asn His Asn Ile
20 25 30
<210> 419
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 419
His Asp Asn Ile Asn Ile Asn Gly Asn Ile His Asp Asn Ile Asn Ile
1 5 10 15
His Asp His Asp Asn Ile His Asp Asn Asn His Asp
20 25
<210> 420
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 420
Asn Ile Asn Gly Asn Asn Asn Ile His Asp Asn Asn Asn Asn Asn Ile
1 5 10 15
His Asp Asn Gly His Asp Asn Ile Asn Ile His Asp Asn Gly
20 25 30
<210> 421
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 421
His Asp Asn Ile His Asp Asn Ile Asn Ile His Asp Asn Ile Asn Gly
1 5 10 15
Asn Gly Asn Gly Asn Asn Asn Gly Asn Ile Asn Ile
20 25
<210> 422
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 422
Asn Ile Asn Gly Asn Gly Asn Gly His Asp His Asp Asn Ile Asn Asn
1 5 10 15
Asn Gly Asn Asn His Asp Asn Ile His Asp Asn Ile
20 25
<210> 423
<211> 333
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 423
ggcggatctg gcggtagtgc tgagtattgt ctgagttacg aaacggaaat actcacggtt 60
gagtatgggc ttcttccaat tggcaaaatc gttgaaaagc gcatagagtg tacggtgtat 120
tccgtcgata acaacggtaa tatctacacc cagccggtag ctcagtggca cgaccgaggc 180
gaacaggaag tgttcgagta ttgcttggaa gatggctccc ttatccgcgc cactaaagac 240
cataagttta tgacggttga cgggcagatg ctgcctatag acgaaatatt tgagagagag 300
ctggacttga tgagagtcga taatctgcca aat 333
<210> 424
<211> 180
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 424
ggcggatctg gcggtagtgg gggttccgga tccataaaga tagctactag gaaatatctt 60
ggcaaacaaa acgtctatga cataggagtt gagcgagatc acaattttgc tttgaagaat 120
gggttcatcg cgtctaattg cttcaacgct agcggcgggt caggaggctc tggtggaagc 180
<210> 425
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 425
aatcgagaag cgactcgaca 20
<210> 426
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 426
tgccctgcag gggagtgagc 20
<210> 427
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 427
gaagcgactc gacatggagg 20
<210> 428
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 428
cctgcagggg agtgagcagc 20

Claims (151)

1.一种包含转座酶或编码所述转座酶的核酸的组合物,其中所述转座酶包含与SEQ IDNO:2具有至少约80%序列同一性的氨基酸序列,其中所述转座酶在对应于SEQ ID NO:2的位置S2的位置处包含氨基酸取代。
2.如权利要求1所述的组合物,其中所述酶包含与SEQ ID NO:2具有至少约90%同一性的氨基酸序列。
3.如权利要求1所述的组合物,其中所述酶包含与SEQ ID NO:2具有至少约93%同一性的氨基酸序列。
4.如权利要求1所述的组合物,其中所述酶包含与SEQ ID NO:2具有至少约95%同一性的氨基酸序列。
5.如权利要求1所述的组合物,其中所述酶包含与SEQ ID NO:2具有至少约98%同一性的氨基酸序列。
6.如权利要求1所述的组合物,其中所述取代是非极性脂肪族氨基酸。
7.如权利要求2至5中任一项所述的组合物,其中所述取代是用非极性脂肪族氨基酸进行的。
8.如权利要求6所述的组合物,其中所述取代选自G、A、V、L、I和P。
9.如权利要求8所述的组合物,其中所述取代是S2A。
10.如权利要求1-9中任一项所述的组合物,其中所述酶相对于SEQ ID NO:2在C端不具有额外的残基。
11.如权利要求1-10中任一项所述的组合物,其中所述酶具有一个或多个赋予高活性的突变。
12.如权利要求11所述的组合物,其中所述酶具有一个或多个选自S8X1、C13X2和/或N125X3的氨基酸取代。
13.如权利要求12所述的组合物,其中所述酶具有S8X1、C13X2和N125X3取代。
14.如权利要求12所述的组合物,其中所述酶具有S8X1和C13X2取代。
15.如权利要求12所述的组合物,其中所述酶具有S8X1和N125X3取代。
16.如权利要求12所述的组合物,其中所述酶具有C13X2和N125X3取代。
17.如权利要求12-16中任一项所述的组合物,其中X1选自G、A、V、L、I和P,X2选自K、R和H,并且X3选自K、R和H。
18.如权利要求17所述的组合物,其中:X1是P,X2是R,和/或X3是K。
19.如权利要求1至18中任一项所述的组合物,其中所述组合物包含所述转座酶。
20.如权利要求19所述的组合物,所述组合物还包含转录激活子样效应子(TALE)DNA结合结构域(DBD)或核酸酶缺陷Cas9(dCas9)/gRNA,其中
所述酶能够在核酸分子的基因组安全港位点(GSHS)中的TA二核苷酸位点或TTAA(SEQID NO:1)四核苷酸位点处插入转座子,并且
所述TALE DBD或dCas9/gRNA复合物适合于将所述嵌合酶引导至所述GSHS序列。
21.如权利要求20所述的组合物,其中所述酶能够在哺乳动物细胞中的核酸分子的基因组安全港位点(GSHS)中的TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点处插入转座子。
22.如权利要求19所述的组合物,其中所述TALE DBD包含一个或多个重复序列。
23.如权利要求22所述的组合物,其中所述TALE DBD包含约14个、或约15个、或约16个、或约17个、或约18个、或约18.5个重复序列。
24.如权利要求22或权利要求23所述的组合物,其中所述TALE DBD重复序列包含33或34个氨基酸。
25.如权利要求24所述的组合物,其中所述TALE DBD重复序列中的一者或多者在所述33或34个氨基酸的残基12和/或13处包含重复可变二残基(RVD)。
26.如权利要求25所述的组合物,其中所述RVD识别所述核酸分子中的一个碱基对。
27.如权利要求25所述的组合物,其中所述RVD识别所述核酸分子中的C残基并且选自HD、N(间隙)、HA、ND和HI。
28.如权利要求25所述的组合物,其中所述RVD识别所述核酸分子中的G残基并且选自NN、NH、NK、HN和NA。
29.如权利要求25所述的组合物,其中所述RVD识别所述核酸分子中的A残基并且选自NI和NS。
30.如权利要求25所述的组合物,其中所述RVD识别所述核酸分子中的T残基并且选自NG、HG、H(间隙)和IG。
31.如权利要求20至30中任一项所述的组合物,其中所述GSHS处于染色体中的开放染色质位置处。
32.如权利要求20至31中任一项所述的组合物,其中所述GSHS选自腺相关病毒位点1(AAVS1)、趋化因子(C-C基序)受体5(CCR5)基因、HIV-1辅受体和人类Rosa26基因座。
33.如权利要求20至32中任一项所述的组合物,其中所述GSHS位于人类染色体2、4、6、10、11或17上。
34.如权利要求32或权利要求33所述的组合物,其中所述GSHS选自TALC1、TALC2、TALC3、TALC4、TALC5、TALC7、TALC8、AVS1、AVS2、AVS3、ROSA1、ROSA2、TALER1、TALER2、TALER3、TALER4、TALER5、SHCHR2-1、SHCHR2-2、SHCHR2-3、SHCHR2-4、SHCHR4-1、SHCHR4-2、SHCHR4-3、SHCHR6-1、SHCHR6-2、SHCHR6-3、SHCHR6-4、SHCHR10-1、SHCHR10-2、SHCHR10-3、SHCHR10-4、SHCHR10-5、SHCHR11-1、SHCHR11-2、SHCHR11-3、SHCHR17-1、SHCHR17-2、SHCHR17-3和SHCHR17-4。
35.如权利要求19至34中任一项所述的组合物,其中所述GSHS包含以下一者或多者:TGGCCGGCCTGACCACTGG(SEQ ID NO:23)、TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)、TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)、TCCACTGAGCACTGAAGGC(SEQ ID NO:26)、TGGTTTCCACTGAGCACTG(SEQ ID NO:27)、TGGGGAAAATGACCCAACA(SEQ ID NO:28)、TAGGACAGTGGGGAAAATG(SEQ ID NO:29)、TCCAGGGACACGGTGCTAG(SEQ ID NO:30)、TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)、TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)、TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)、TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)、TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)、TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)、TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)、TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)、TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)、CCAATCCCCTCAGT(SEQ ID NO:40)、CAGTGCTCAGTGGAA(SEQ ID NO:41)、GAAACATCCGGCGACTCA(SEQ ID NO:42)、TCGCCCCTCAAATCTTACA(SEQ ID NO:43)、TCAAATCTTACAGCTGCTC(SEQ ID NO:44)、TCTTACAGCTGCTCACTCC(SEQ ID NO:45)、TACAGCTGCTCACTCCCCT(SEQ ID NO:46)、TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)、TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)、TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)、TCTCGATTATGGGCGGGAT(SEQ ID NO:50)、TCGCTTCTCGATTATGGGC(SEQ ID NO:51)、TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)、TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)、TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)、TCGTCATCGCCTCCATGTC(SEQ ID NO:55)、TGATCTCGTCATCGCCTCC(SEQ ID NO:56)、GCTTCAGCTTCCTA(SEQ ID NO:57)、CTGTGATCATGCCA(SEQ ID NO:58)、ACAGTGGTACACACCT(SEQ ID NO:59)、CCACCCCCCACTAAG(SEQ ID NO:60)、CATTGGCCGGGCAC(SEQ ID NO:61)、GCTTGAACCCAGGAGA(SEQ ID NO:62)、ACACCCGATCCACTGGG(SEQ ID NO:63)、GCTGCATCAACCCC(SEQ ID NO:64)、GCCACAAACAGAAATA(SEQ ID NO:65)、GGTGGCTCATGCCTG(SEQ ID NO:66)、GATTTGCACAGCTCAT(SEQ ID NO:67)、AAGCTCTGAGGAGCA(SEQ ID NO:68)、CCCTAGCTGTCCC(SEQ ID NO:69)、GCCTAGCATGCTAG(SEQ ID NO:70)、ATGGGCTTCACGGAT(SEQ ID NO:71)、GAAACTATGCCTGC(SEQ ID NO:72)、GCACCATTGCTCCC(SEQ ID NO:73)、GACATGCAACTCAG(SEQID NO:74)、ACACCACTAGGGGT(SEQ ID NO:75)、GTCTGCTAGACAGG(SEQ ID NO:76)、GGCCTAGACAGGCTG(SEQ ID NO:77)、GAGGCATTCTTATCG(SEQ ID NO:78)、GCCTGGAAACGTTCC(SEQ ID NO:79)、GTGCTCTGACAATA(SEQ ID NO:80)、GTTTTGCAGCCTCC(SEQ ID NO:81)、ACAGCTGTGGAACGT(SEQ ID NO:82)、GGCTCTCTTCCTCCT(SEQ ID NO:83)、CTATCCCAAAACTCT(SEQ ID NO:84)、GAAAAACTATGTAT(SEQ ID NO:85)、AGGCAGGCTGGTTGA(SEQ ID NO:86)、CAATACAACCACGC(SEQ ID NO:87)、ATGACGGACTCAACT(SEQ ID NO:88)、CACAACATTTGTAA(SEQID NO:89)和ATTTCCAGTGCACA(SEQ ID NO:90)。
36.如权利要求35所述的组合物,其中所述TALE DBD结合至以下一者:TGGCCGGCCTGACCACTGG(SEQ ID NO:23)、TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)、TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)、TCCACTGAGCACTGAAGGC(SEQ ID NO:26)、TGGTTTCCACTGAGCACTG(SEQ ID NO:27)、TGGGGAAAATGACCCAACA(SEQ ID NO:28)、TAGGACAGTGGGGAAAATG(SEQ ID NO:29)、TCCAGGGACACGGTGCTAG(SEQ ID NO:30)、TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)、TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)、TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)、TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)、TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)、TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)、TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)、TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)、TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)、CCAATCCCCTCAGT(SEQ ID NO:40)、CAGTGCTCAGTGGAA(SEQ ID NO:41)、GAAACATCCGGCGACTCA(SEQ ID NO:42)、TCGCCCCTCAAATCTTACA(SEQ ID NO:43)、TCAAATCTTACAGCTGCTC(SEQ ID NO:44)、TCTTACAGCTGCTCACTCC(SEQ ID NO:45)、TACAGCTGCTCACTCCCCT(SEQ ID NO:46)、TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)、TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)、TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)、TCTCGATTATGGGCGGGAT(SEQ ID NO:50)、TCGCTTCTCGATTATGGGC(SEQ ID NO:51)、TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)、TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)、TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)、TCGTCATCGCCTCCATGTC(SEQ ID NO:55)、TGATCTCGTCATCGCCTCC(SEQ ID NO:56)、GCTTCAGCTTCCTA(SEQ ID NO:57)、CTGTGATCATGCCA(SEQ ID NO:58)、ACAGTGGTACACACCT(SEQ ID NO:59)、CCACCCCCCACTAAG(SEQ ID NO:60)、CATTGGCCGGGCAC(SEQ ID NO:61)、GCTTGAACCCAGGAGA(SEQ ID NO:62)、ACACCCGATCCACTGGG(SEQ ID NO:63)、GCTGCATCAACCCC(SEQ ID NO:64)、GCCACAAACAGAAATA(SEQ ID NO:65)、GGTGGCTCATGCCTG(SEQ ID NO:66)、GATTTGCACAGCTCAT(SEQ ID NO:67)、AAGCTCTGAGGAGCA(SEQ ID NO:68)、CCCTAGCTGTCCC(SEQ ID NO:69)、GCCTAGCATGCTAG(SEQ ID NO:70)、ATGGGCTTCACGGAT(SEQ ID NO:71)、GAAACTATGCCTGC(SEQ ID NO:72)、GCACCATTGCTCCC(SEQ ID NO:73)、GACATGCAACTCAG(SEQID NO:74)、ACACCACTAGGGGT(SEQ ID NO:75)、GTCTGCTAGACAGG(SEQ ID NO:76)、GGCCTAGACAGGCTG(SEQ ID NO:77)、GAGGCATTCTTATCG(SEQ ID NO:78)、GCCTGGAAACGTTCC(SEQ ID NO:79)、GTGCTCTGACAATA(SEQ ID NO:80)、GTTTTGCAGCCTCC(SEQ ID NO:81)、ACAGCTGTGGAACGT(SEQ ID NO:82)、GGCTCTCTTCCTCCT(SEQ ID NO:83)、CTATCCCAAAACTCT(SEQ ID NO:84)、GAAAAACTATGTAT(SEQ ID NO:85)、AGGCAGGCTGGTTGA(SEQ ID NO:86)、CAATACAACCACGC(SEQ ID NO:87)、ATGACGGACTCAACT(SEQ ID NO:88)、CACAACATTTGTAA(SEQID NO:89)和ATTTCCAGTGCACA(SEQ ID NO:90)。
37.如权利要求20至36中任一项所述的组合物,其中所述TALEDBD包含以下一者或多者:
NH NH HD HD NH NH HD HD NG NH NI HD HD NI HD NG NH NH(SEQ ID NO:355),
NH NI NI NH NH HD HD NG NH NH HD HD NH NH HD HD NG NH(SEQ ID NO:356),
NH NI NH HD NI HD NG NH NI NI NH NH HD HD NG NH NH HD(SEQ ID NO:357),
HD HD NI HD NG NH NI NH HD NI HD NG NH NI NI NH NH HD(SEQ ID NO:358),
NH NH NG NG NG HD HD NI HD NG NH NI NH HD NI HD NG NH(SEQ ID NO:359),
NH NH NH NH NI NI NI NI NG NH NI HD HD HD NI NI HD NI (SEQ ID NO:360),
NI NH NH NI HD NI NH NG NH NH NH NH NI NI NI NI NG NH (SEQ ID NO:361),
HD HD NI NH NH NH NI HD NI HD NH NH NG NH HD NG NI NH(SEQ ID NO:362),
HD NI NH NI NH HD HD NI NH NH NI NH NG HD HD NG NH NH(SEQ ID NO:363),
HD HD NG NG HD NI NH NI NH HD HD NI NH NH NI NH NG HD(SEQ ID NO:364),
HD HD NG HD HD NG NG HD NI NH NI NH HD HD NI NH NH NI(SEQ ID NO:365),
HD HD NI NH HD HD HD HD NG HD HD NG HD HD NG NG HD NI(SEQ ID NO:366),
HD HD NH NI NH HD NG NG NH NI HD HD HD NG NG NH NH NI(SEQ ID NO:367),
NH NH NG NG NG HD HD NH NI NH HD NG NG NH NI HD HD HD(SEQ ID NO:368),
NH NH NH NH NG NH NH NG NG NG HD HD NH NI NH HD NG NG(SEQ ID NO:369),
HD NG NH HD NG NH NH NH NH NG NH NH NG NG NG HD HD NH(SEQ ID NO:370),
NH HD NI NH NI NH NG NI NG HD NG NH HD NG NH NH NH NH(SEQ ID NO:371),
HD HD NI NI NG HD HD HD HD NG HD NI NH NG(SEQ ID NO:372),
HD NI NH NG NH HD NG HD NI NH NG NH NH NI NI(SEQ ID NO:373),
NH NI NI NI HD NI NG HD HD NH NH HD NH NI HD NG HD NI(SEQ ID NO:374),
HD NH HD HD HD HD NG HD NI NI NI NG HD NG NG NI HD NI(SEQ ID NO:375),
HD NI NI NI NG HD NG NG NI HD NI NH HD NG NH HD NG HD(SEQ ID NO:376),
HD NG NG NI HD NI NH HD NG NH HD NG HD NI HD NG HD HD(SEQ ID NO:377),
NI HD NI NH HD NG NH HD NG HD NI HD NG HD HD HD HD NG(SEQ ID NO:378),
NH HD NG HD NI HD NG HD HD HD HD NG NH HD NI NH NH NH(SEQ ID NO:379),
HD HD HD HD NG NH HD NI NH NH NH HD NI NI HD NH HD HD(SEQ ID NO:380),
NH HD NI NH NH NH HD NI NI HD NH HD HD HD NI NH NH NH(SEQ ID NO:381),
HD NG HD NH NI NG NG NI NG NH NH NH HD NH NH NH NI NG(SEQ ID NO:382),
HD NH HD NG NG HD NG HD NH NI NG NG NI NG NH NH NH HD(SEQ ID NO:383),
NH NG HD NH NI NH NG HD NH HD NG NG HD NG HD NH NI NG(SEQ ID NO:384),
HD HD NI NG NH NG HD NH NI NH NG HD NH HD NG NG HD NG(SEQ ID NO:385),
HD NH HD HD NG HD HD NI NG NH NG HD NH NI NH NG HD NH(SEQ ID NO:386),
HD NH NG HD NI NG HD NH HD HD NG HD HD NI NG NH NG HD(SEQ ID NO:387),
NH NI NG HD NG HD NH NG HD NI NG HD NH HD HD NG HD HD(SEQ ID NO:388),
NH HD NG NG HD NI NH HD NG NG HD HD NG NI(SEQ ID NO:389),
HD NG NK NG NH NI NG HD NI NG NH HD HD NI(SEQ ID NO:390),
NI HD NI NN NG NN NN NG NI HD NI HD NI HD HD NG(SEQ ID NO:391),
HD HD NI HD HD HD HD HD HD NI HD NG NI NI NN(SEQ ID NO:392),
HD NI NG NG NN NN HD HD NN NN NN HD NI HD(SEQ ID NO:393),
NN HD NG NG NN NI NI HD HD HD NI NN NN NI NN NI(SEQ ID NO:394),
NI HD NI HD HD HD NN NI NG HD HD NI HD NG NN NN NN (SEQ ID NO:395),
NN HD NG NN HD NI NG HD NI NI HD HD HD HD(SEQ ID NO:396),
NN NN HD NI HD NN NI NI NI HD NI HD HD HD NG HD HD (SEQ ID NO:397),
NN NN NG NN NN HD NG HD NI NG NN HD HD NG NN(SEQ ID NO:398),
NN NI NG NG NG NN HD NI HD NI NN HD NG HD NI NG (SEQ ID NO:399),
NI NI NH HD NG HD NG NH NI NH NH NI NH HD(SEQ ID NO:400),
HD HD HD NG NI NK HD NG NH NG HD HD HD HD(SEQ ID NO:401),
NH HD HD NG NI NH HD NI NG NH HD NG NI NH(SEQ ID NO:402),
NI NG NH NH NH HD NG NG HD NI HD NH NH NI NG(SEQ ID NO:403),
NH NI NI NI HD NG NI NG NH HD HD NG NH HD(SEQ ID NO:404),
NH HD NI HD HD NI NG NG NH HD NG HD HD HD(SEQ ID NO:405),
NH NI HD NI NG NH HD NI NI HD NG HD NI NH(SEQ ID NO:406),
NI HD NI HD HD NI HD NG NI NH NH NH NH NG(SEQ ID NO:407),
NH NG HD NG NH HD NG NI NH NI HD NI NH NH(SEQ ID NO:408),
NH NH HD HD NG NI NH NI HD NI NH NH HD NG NH(SEQ ID NO:409),
NH NI NH NH HD NI NG NG HD NG NG NI NG HD NH(SEQ ID NO:410),
NN HD HD NG NN NN NI NI NI HD NN NG NG HD HD(SEQ ID NO:411),
NN NG NN HD NG HD NG NN NI HD NI NI NG NI(SEQ ID NO:412),
NN NG NG NG NG NN HD NI NN HD HD NG HD HD(SEQ ID NO:413),
NI HD NI NN HD NG NN NG NN NN NI NI HD NN NG(SEQ ID NO:414),
HD NI NI NN NI HD HD NN NI NN HD NI HD NG NN HD NG NN(SEQ ID NO:415),
HD NG NI NG HD HD HD NI NI NI NI HD NG HD NG(SEQ ID NO:416),
NH NI NI NI NI NI HD NG NI NG NH NG NI NG(SEQ ID NO:417),
NI NH NH HD NI NH NH HD NG NH NH NG NG NH NI(SEQ ID NO:418),
HD NI NI NG NI HD NI NI HD HD NI HD NN HD(SEQ ID NO:419),
NI NG NN NI HD NN NN NI HD NG HD NI NI HD NG(SEQ ID NO:420),
HD NI HD NI NI HD NI NG NG NG NN NG NI NI(SEQ ID NO:421),和
NI NG NG NG HD HD NI NN NG NN HD NI HD NI(SEQ ID NO:422)。
38.如权利要求20所述的组合物,其中所述dCas9/gRNA复合物包含选自以下的向导RNA:GTTTAGCTCACCCGTGAGCC(SEQ ID NO:91)、CCCAATATTATTGTTCTCTG(SEQ ID NO:92)、GGGGTGGGATAGGGGATACG(SEQ ID NO:93)、GGATCCCCCTCTACATTTAA(SEQ ID NO:94)、GTGATCTTGTACAAATCATT(SEQ ID NO:95)、CTACACAGAATCTGTTAGAA(SEQ ID NO:96)、TAAGCTAGAGAATAGATCTC(SEQ ID NO:97)和TCAATACACTTAATGATTTA(SEQ ID NO:98),其中所述向导RNA将所述酶引导至趋化因子(C-C基序)受体5(CCR5)基因。
39.如权利要求20所述的组合物,其中所述dCas9/gRNA复合物包含选自以下的向导RNA:
CACCGGGAGCCACGAAAACAGATCC(SEQ ID NO:99);CACCGCGAAAACAGATCCAGGGACA(SEQ IDNO:100);CACCGAGATCCAGGGACACGGTGCT(SEQ ID NO:101);CACCGGACACGGTGCTAGGACAGTG(SEQ ID NO:102);CACCGGAAAATGACCCAACAGCCTC(SEQ ID NO:103);CACCGGCCTGGCCGGCCTGACCACT(SEQ ID NO:104);CACCGCTGAGCACTGAAGGCCTGGC(SEQ ID NO:105);CACCGTGGTTTCCACTGAGCACTGA(SEQ ID NO:106);CACCGGATAGCCAGGAGTCCTTTCG(SEQID NO:107);CACCGGCGCTTCCAGTGCTCAGACT(SEQ ID NO:108);CACCGCAGTGCTCAGACTAGGGAAG(SEQ ID NO:109);CACCGGCCCCTCCTCCTTCAGAGCC(SEQ ID NO:110);CACCGTCCTTCAGAGCCAGGAGTCC(SEQ ID NO:111);CACCGTGGTTTCCGAGCTTGACCCT(SEQ ID NO:112);CACCGCTGCAGAGTATCTGCTGGGG(SEQ ID NO:113);CACCGCGTTCCTGCAGAGTATCTGC(SEQID NO:114);AAACGGATCTGTTTTCGTGGCTCCC(SEQ ID NO:115);AAACTGTCCCTGGATCTGTTTTCGC(SEQ ID NO:116);AAACAGCACCGTGTCCCTGGATCTC(SEQ ID NO:117);AAACCACTGTCCTAGCACCGTGTCC(SEQ ID NO:118);AAACGAGGCTGTTGGGTCATTTTCC(SEQ ID NO:119);AAACAGTGGTCAGGCCGGCCAGGCC(SEQ ID NO:120);AAACGCCAGGCCTTCAGTGCTCAGC(SEQID NO:121);AAACTCAGTGCTCAGTGGAAACCAC(SEQ ID NO:122);AAACCGAAAGGACTCCTGGCTATCC(SEQ ID NO:123);AAACAGTCTGAGCACTGGAAGCGCC(SEQ ID NO:124);AAACCTTCCCTAGTCTGAGCACTGC(SEQ ID NO:125);AAACGGCTCTGAAGGAGGAGGGGCC(SEQ ID NO:126);AAACGGACTCCTGGCTCTGAAGGAC(SEQ ID NO:127);AAACAGGGTCAAGCTCGGAAACCAC(SEQID NO:128);AAACCCCCAGCAGATACTCTGCAGC(SEQ ID NO:129);AAACGCAGATACTCTGCAGGAACGC(SEQ ID NO:130);TCCCCTCCCAGAAAGACCTG(SEQ ID NO:131);TGGGCTCCAAGCAATCCTGG(SEQID NO:132);GTGGCTCAGGAGGTACCTGG(SEQ ID NO:133);GAGCCACGAAAACAGATCCA(SEQ IDNO:134);AAGTGAACGGGGAAGGGAGG(SEQ ID NO:135);GACAAAAGCCGAAGTCCAGG(SEQ ID NO:136);GTGGTTGATAAACCCACGTG(SEQ ID NO:137);TGGGAACAGCCACAGCAGGG(SEQ ID NO:138);GCAGGGGAACGGGGATGCAG(SEQ ID NO:139);GAGATGGTGGACGAGGAAGG(SEQ ID NO:140);GAGATGGCTCCAGGAAATGG(SEQ ID NO:141);TAAGGAATCTGCCTAACAGG(SEQ ID NO:142);TCAGGAGACTAGGAAGGAGG(SEQ ID NO:143);TATAAGGTGGTCCCAGCTCG(SEQ ID NO:144);CTGGAAGATGCCATGACAGG(SEQ ID NO:145);GCACAGACTAGAGAGGTAAG(SEQ ID NO:146);ACAGACTAGAGAGGTAAGGG(SEQ ID NO:147);GAGAGGTGACCCGAATCCAC(SEQ ID NO:148);GCACAGGCCCCAGAAGGAGA(SEQ ID NO:149);CCGGAGAGGACCCAGACACG(SEQ ID NO:150);GAGAGGACCCAGACACGGGG(SEQ ID NO:151);GCAACACAGCAGAGAGCAAG(SEQ ID NO:152);GAAGAGGGAGTGGAGGAAGA(SEQ ID NO:153);AAGACGGAACCTGAAGGAGG(SEQ ID NO:154);AGAAAGCGGCACAGGCCCAG(SEQ ID NO:155);GGGAAACAGTGGGCCAGAGG(SEQ ID NO:156);GTCCGGACTCAGGAGAGAGA(SEQ ID NO:157);GGCACAGCAAGGGCACTCGG(SEQ ID NO:158);GAAGAGGGGAAGTCGAGGGA(SEQ ID NO:159);GGGAATGGTAAGGAGGCCTG(SEQ ID NO:160);GCAGAGTGGTCAGCACAGAG(SEQ ID NO:161);GCACAGAGTGGCTAAGCCCA(SEQ ID NO:162);GACGGGGTGTCAGCATAGGG(SEQ ID NO:163);GCCCAGGGCCAGGAACGACG(SEQ ID NO:164);GGTGGAGTCCAGCACGGCGC(SEQ ID NO:165);ACAGGCCGCCAGGAACTCGG(SEQ ID NO:166);ACTAGGAAGTGTGTAGCACC(SEQ ID NO:167);ATGAATAGCAGACTGCCCCG(SEQ ID NO:168);ACACCCCTAAAAGCACAGTG(SEQ ID NO:169);CAAGGAGTTCCAGCAGGTGG(SEQ ID NO:170);AAGGAGTTCCAGCAGGTGGG(SEQ ID NO:171);TGGAAAGAGGAGGGAAGAGG(SEQ ID NO:172);TCGAATTCCTAACTGCCCCG(SEQ ID NO:173);GACCTGCCCAGCACACCCTG(SEQ ID NO:174);GGAGCAGCTGCGGCAGTGGG(SEQ ID NO:175);GGGAGGGAGAGCTTGGCAGG(SEQ ID NO:176);GTTACGTGGCCAAGAAGCAG(SEQ ID NO:177);GCTGAACAGAGAAGAGCTGG(SEQ ID NO:178);TCTGAGGGTGGAGGGACTGG(SEQ ID NO:179);GGAGAGGTGAGGGACTTGGG(SEQ ID NO:180);GTGAACCAGGCAGACAACGA(SEQ ID NO:181);CAGGTACCTCCTGAGCCACG(SEQ ID NO:182);GGGGGAGTAGGGGCATGCAG(SEQ ID NO:183);GCAAATGGCCAGCAAGGGTG(SEQ ID NO:184);CAAATGGCCAGCAAGGGTGG(SEQ ID NO:309);GCAGAACCTGAGGATATGGA(SEQ ID NO:310);AATACACAGAATGAAAATAG(SEQ ID NO:311);CTGGTGACTAGAATAGGCAG(SEQ ID NO:312);TGGTGACTAGAATAGGCAGT(SEQ ID NO:313);TAAAAGAATGTGAAAAGATG(SEQ ID NO:314);TCAGGAGTTCAAGACCACCC(SEQ ID NO:315);TGTAGTCCCAGTTATGCAGG(SEQ ID NO:316);GGGTTCACACCACAAATGCA(SEQ ID NO:317);GGCAAATGGCCAGCAAGGGT(SEQ ID NO:318);AGAAACCAATCCCAAAGCAA(SEQ ID NO:319);GCCAAGGACACCAAAACCCA(SEQ ID NO:320);AGTGGTGATAAGGCAACAGT(SEQ ID NO:321);CCTGAGACAGAAGTATTAAG(SEQ ID NO:322);AAGGTCACACAATGAATAGG(SEQ ID NO:323);CACCATACTAGGGAAGAAGA(SEQ ID NO:324);CAATACCCTGCCCTTAGTGG(SEQ ID NO:327);AATACCCTGCCCTTAGTGGG(SEQ ID NO:325);TTAGTGGGGGGTGGAGTGGG(SEQ ID NO:326);GTGGGGGGTGGAGTGGGGGG(SEQ ID NO:328);GGGGGGTGGAGTGGGGGGTG(SEQ ID NO:329);GGGGTGGAGTGGGGGGTGGG(SEQ ID NO:330);GGGTGGAGTGGGGGGTGGGG(SEQ ID NO:331);GGGGGTGGGGAAAGACATCG(SEQ ID NO:332);GCAGCTGTGAATTCTGATAG(SEQ ID NO:333);GAGATCAGAGAAACCAGATG(SEQ ID NO:334);TCTATACTGATTGCAGCCAG(SEQ ID NO:335);CACCGAATCGAGAAGCGACTCGACA(SEQ ID NO:185);CACCGGTCCCTGGGCGTTGCCCTGC(SEQ ID NO:186);CACCGCCCTGGGCGTTGCCCTGCAG(SEQ ID NO:187);CACCGCCGTGGGAAGATAAACTAAT(SEQ ID NO:188);CACCGTCCCCTGCAGGGCAACGCCC(SEQID NO:189);CACCGGTCGAGTCGCTTCTCGATTA(SEQ ID NO:190);CACCGCTGCTGCCTCCCGTCTTGTA(SEQ ID NO:191);CACCGGAGTGCCGCAATACCTTTAT(SEQ ID NO:192);CACCGACACTTTGGTGGTGCAGCAA(SEQ ID NO:193);CACCGTCTCAAATGGTATAAAACTC(SEQ ID NO:194);CACCGAATCCCGCCCATAATCGAGA(SEQ ID NO:195);CACCGTCCCGCCCATAATCGAGAAG(SEQID NO:196);CACCGCCCATAATCGAGAAGCGACT(SEQ ID NO:197);CACCGGAGAAGCGACTCGACATGGA(SEQ ID NO:198);CACCGGAAGCGACTCGACATGGAGG(SEQ ID NO:199);CACCGGCGACTCGACATGGAGGCGA(SEQ ID NO:200);AAACTGTCGAGTCGCTTCTCGATTC(SEQ ID NO:201);AAACGCAGGGCAACGCCCAGGGACC(SEQ ID NO:202);AAACCTGCAGGGCAACGCCCAGGGC(SEQID NO:203);AAACATTAGTTTATCTTCCCACGGC(SEQ ID NO:204);AAACGGGCGTTGCCCTGCAGGGGAC(SEQ ID NO:205);AAACTAATCGAGAAGCGACTCGACC(SEQ ID NO:206);AAACTACAAGACGGGAGGCAGCAGC(SEQ ID NO:207);AAACATAAAGGTATTGCGGCACTCC(SEQ ID NO:208);AAACTTGCTGCACCACCAAAGTGTC(SEQ ID NO:209);AAACGAGTTTTATACCATTTGAGAC(SEQID NO:210);AAACTCTCGATTATGGGCGGGATTC(SEQ ID NO:211);AAACCTTCTCGATTATGGGCGGGAC(SEQ ID NO:212);AAACAGTCGCTTCTCGATTATGGGC(SEQ ID NO:213);AAACTCCATGTCGAGTCGCTTCTCC(SEQ ID NO:214);AAACCCTCCATGTCGAGTCGCTTCC(SEQ ID NO:215);AAACTCGCCTCCATGTCGAGTCGCC(SEQ ID NO:216);CACCGACAGGGTTAATGTGAAGTCC(SEQID NO:217);CACCGTCCCCCTCTACATTTAAAGT(SEQ ID NO:218);CACCGCATTTAAAGTTGGTTTAAGT(SEQ ID NO:219);CACCGTTAGAAAATATAAAGAATAA(SEQ ID NO:220);CACCGTAAATGCTTACTGGTTTGAA(SEQ ID NO:221);CACCGTCCTGGGTCCAGAAAAAGAT(SEQ ID NO:222);CACCGTTGGGTGGTGAGCATCTGTG(SEQ ID NO:223);CACCGCGGGGAGAGTGGAGAAAAAG(SEQID NO:224);CACCGGTTAAAACTCTTTAGACAAC(SEQ ID NO:225);CACCGGAAAATCCCCACTAAGATCC(SEQ ID NO:226);AAACGGACTTCACATTAACCCTGTC(SEQ ID NO:227);AAACACTTTAAATGTAGAGGGGGAC(SEQ ID NO:228);AAACACTTAAACCAACTTTAAATGC(SEQ ID NO:229);AAACTTATTCTTTATATTTTCTAAC(SEQ ID NO:230);AAACTTCAAACCAGTAAGCATTTAC(SEQID NO:231);AAACATCTTTTTCTGGACCCAGGAC(SEQ ID NO:232);AAACCACAGATGCTCACCACCCAAC(SEQ ID NO:233);AAACCTTTTTCTCCACTCTCCCCGC(SEQ ID NO:234);AAACGTTGTCTAAAGAGTTTTAACC(SEQ ID NO:235);AAACGGATCTTAGTGGGGATTTTCC(SEQ ID NO:236);AGTAGCAGTAATGAAGCTGG(SEQ ID NO:237);ATACCCAGACGAGAAAGCTG(SEQ ID NO:238);TACCCAGACGAGAAAGCTGA(SEQ ID NO:239);GGTGGTGAGCATCTGTGTGG(SEQ ID NO:240);AAATGAGAAGAAGAGGCACA(SEQ ID NO:241);CTTGTGGCCTGGGAGAGCTG(SEQ ID NO:242);GCTGTAGAAGGAGACAGAGC(SEQ ID NO:243);GAGCTGGTTGGGAAGACATG(SEQ ID NO:244);CTGGTTGGGAAGACATGGGG(SEQ ID NO:245);CGTGAGGATGGGAAGGAGGG(SEQ ID NO:246);ATGCAGAGTCAGCAGAACTG(SEQ ID NO:247);AAGACATCAAGCACAGAAGG(SEQ ID NO:248);TCAAGCACAGAAGGAGGAGG(SEQ ID NO:249);AACCGTCAATAGGCAAAGGG(SEQ ID NO:250);CCGTATTTCAGACTGAATGG(SEQ ID NO:251);GAGAGGACAGGTGCTACAGG(SEQ ID NO:252);AACCAAGGAAGGGCAGGAGG(SEQ ID NO:253);GACCTCTGGGTGGAGACAGA(SEQ ID NO:254);CAGATGACCATGACAAGCAG(SEQ ID NO:255);AACACCAGTGAGTAGAGCGG(SEQ ID NO:256);AGGACCTTGAAGCACAGAGA(SEQ ID NO:257);TACAGAGGCAGACTAACCCA(SEQ ID NO:258);ACAGAGGCAGACTAACCCAG(SEQ ID NO:259);TAAATGACGTGCTAGACCTG(SEQ ID NO:260);AGTAACCACTCAGGACAGGG(SEQ ID NO:261);ACCACAAAACAGAAACACCA(SEQ ID NO:262);GTTTGAAGACAAGCCTGAGG(SEQ ID NO:263);GCTGAACCCCAAAAGACAGG(SEQ ID NO:264);GCAGCTGAGACACACACCAG(SEQ ID NO:265);AGGACACCCCAAAGAAGCTG(SEQ ID NO:266);GGACACCCCAAAGAAGCTGA(SEQ ID NO:267);CCAGTGCAATGGACAGAAGA(SEQ ID NO:268);AGAAGAGGGAGCCTGCAAGT(SEQ ID NO:269);GTGTTTGGGCCCTAGAGCGA(SEQ ID NO:270);CATGTGCCTGGTGCAATGCA(SEQ ID NO:271);TACAAAGAGGAAGATAAGTG(SEQ ID NO:272);GTCACAGAATACACCACTAG(SEQ ID NO:273);GGGTTACCCTGGACATGGAA(SEQ ID NO:274);CATGGAAGGGTATTCACTCG(SEQ ID NO:275);AGAGTGGCCTAGACAGGCTG(SEQ ID NO:276);CATGCTGGACAGCTCGGCAG(SEQ ID NO:277);AGTGAAAGAAGAGAAAATTC(SEQ ID NO:278);TGGTAAGTCTAAGAAACCTA(SEQ ID NO:279);CCCACAGCCTAACCACCCTA(SEQ ID NO:280);AATATTTCAAAGCCCTAGGG(SEQ ID NO:281);GCACTCGGAACAGGGTCTGG(SEQ ID NO:282);AGATAGGAGCTCCAACAGTG(SEQ ID NO:283);AAGTTAGAGCAGCCAGGAAA(SEQ ID NO:284);TAGAGCAGCCAGGAAAGGGA(SEQ ID NO:285);TGAATACCCTTCCATGTCCA(SEQ ID NO:286);CCTGCATTGCACCAGGCACA(SEQ ID NO:287);TCTAGGGCCCAAACACACCT(SEQ ID NO:288);TCCCTCCATCTATCAAAAGG(SEQ ID NO:289);AGCCCTGAGACAGAAGCAGG(SEQ ID NO:290);GCCCTGAGACAGAAGCAGGT(SEQ ID NO:291);AGGAGATGCAGTGATACGCA(SEQ ID NO:292);ACAATACCAAGGGTATCCGG(SEQ ID NO:293);TGATAAAGAAAACAAAGTGA(SEQ ID NO:294);AAAGAAAACAAAGTGAGGGA(SEQ ID NO:295);GTGGCAAGTGGAGAAATTGA(SEQ ID NO:296);CAAGTGGAGAAATTGAGGGA(SEQ ID NO:297);GTGGTGATGATTGCAGCTGG(SEQ ID NO:298);CTATGTGCCTGACACACAGG(SEQ ID NO:299);GGGTTGGACCAGGAAAGAGG(SEQ ID NO:300);GATGCCTGGAAAAGGAAAGA(SEQ ID NO:301);TAGTATGCACCTGCAAGAGG(SEQ ID NO:302);TATGCACCTGCAAGAGGCGG(SEQ ID NO:303);AGGGGAAGAAGAGAAGCAGA(SEQ ID NO:304);GCTGAATCAAGAGACAAGCG(SEQ ID NO:305);AAGCAAATAAATCTCCTGGG(SEQ ID NO:306);AGATGAGTGCTAGAGACTGG(SEQ ID NO:307);和CTGATGGTTGAGCACAGCAG(SEQ ID NO:308)。
40.如权利要求20至39中任一项所述的组合物,其中所述GSHS选自图3并且所述TALEDBD包含图3的序列或其变体(例如,具有约1个、或约2个、或约3个、或约4个、或约5个突变,任选地是插入、取代或缺失)。
41.如权利要求20至40中任一项所述的组合物,其中所述GSHS和所述TALE DBD序列选自:
TGGCCGGCCTGACCACTGG(SEQ ID NO:23)和NH NH HD HD NH NH HD HD NG NH NI HD HDNI HD NG NH NH(SEQ IDNO:355);
TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)和NH NI NI NH NH HD HD NG NH NH HD HD NHNH HD HD NG NH(SEQ ID NO:356);
TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)和NH NI NH HD NI HD NG NH NI NI NH NH HDHD NG NH NH HD(SEQ ID NO:357);
TCCACTGAGCACTGAAGGC(SEQ ID NO:26)和HD HD NI HD NG NH NI NH HD NI HD NG NHNI NI NH NH HD(SEQ ID NO:358);
TGGTTTCCACTGAGCACTG(SEQ ID NO:27)和NH NH NG NG NG HD HD NI HD NG NH NI NHHD NI HD NG NH(SEQ ID NO:359);
TGGGGAAAATGACCCAACA(SEQ ID NO:28)和NH NH NH NH NI NI NI NI NG NH NI HD HDHD NI NI HD NI(SEQ ID NO:360);
TAGGACAGTGGGGAAAATG(SEQ ID NO:29)和NI NH NH NI HD NI NH NG NH NH NH NH NINI NI NI NG NH(SEQ ID NO:361);
TCCAGGGACACGGTGCTAG(SEQ ID NO:30)和HD HD NI NH NH NH NI HD NI HD NH NH NGNH HD NG NI NH(SEQ ID NO:362);
TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)和HD NI NH NI NH HD HD NI NH NH NI NH NGHD HD NG NH NH(SEQ ID NO:363);
TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)和HD HD NG NG HD NI NH NI NH HD HD NI NHNH NI NH NG HD(SEQ ID NO:364);
TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)和HD HD NG HD HD NG NG HD NI NH NI NH HDHD NI NH NH NI(SEQ ID NO:365);
TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)和HD HD NI NH HD HD HD HD NG HD HD NG HDHD NG NG HD NI(SEQ ID NO:366);
TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)和HD HD NH NI NH HD NG NG NH NI HD HD HDNG NG NH NH NI(SEQ ID NO:367);
TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)和NH NH NG NG NG HD HD NH NI NH HD NG NGNH NI HD HD HD(SEQ IDNO:368);
TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)和NH NH NH NH NG NH NH NG NG NG HD HD NHNI NH HD NG NG(SEQ IDNO:369);
TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)和HD NG NH HD NG NH NH NH NH NG NH NH NGNG NG HD HD NH(SEQ IDNO:370);
TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)和NH HD NI NH NI NH NG NI NG HD NG NH HDNG NH NH NH NH(SEQ ID NO:371);
CCAATCCCCTCAGT(SEQ ID NO:40)和HD HD NI NI NG HD HD HD HD NG HD NI NH NG(SEQ ID NO:372);
CAGTGCTCAGTGGAA(SEQ ID NO:41)和HD NI NH NG NH HD NG HD NI NH NG NH NH NINI(SEQ ID NO:373);
GAAACATCCGGCGACTCA(SEQ ID NO:42)和NH NI NI NI HD NI NG HD HD NH NH HD NHNI HD NG HD NI(SEQ ID NO:374);
TCGCCCCTCAAATCTTACA(SEQ ID NO:43)和HD NH HD HD HD HD NG HD NI NI NI NG HDNG NG NI HD NI(SEQ ID NO:375);
TCAAATCTTACAGCTGCTC(SEQ ID NO:44)和HD NI NI NI NG HD NG NG NI HD NI NH HDNG NH HD NG HD(SEQ ID NO:376);
TCTTACAGCTGCTCACTCC(SEQ ID NO:45)和HD NG NG NI HD NI NH HD NG NH HD NG HDNI HD NG HD HD(SEQ ID NO:377);
TACAGCTGCTCACTCCCCT(SEQ ID NO:46)和NI HD NI NH HD NG NH HD NG HD NI HD NGHD HD HD HD NG(SEQ ID NO:378);
TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)和NH HD NG HD NI HD NG HD HD HD HD NG NHHD NI NH NH NH(SEQ IDNO:379);
TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)和HD HD HD HD NG NH HD NI NH NH NH HD NINI HD NH HD HD(SEQ ID NO:380);
TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)和NH HD NI NH NH NH HD NI NI HD NH HD HDHD NI NH NH NH(SEQ ID NO:381);
TCTCGATTATGGGCGGGAT(SEQ ID NO:50)和HD NG HD NH NI NG NG NI NG NH NH NH HDNH NH NH NI NG(SEQ ID NO:382);
TCGCTTCTCGATTATGGGC(SEQ ID NO:51)和HD NH HD NG NG HD NG HD NH NI NG NG NING NH NH NH HD(SEQ ID NO:383);
TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)和NH NG HD NH NI NH NG HD NH HD NG NG HDNG HD NH NI NG(SEQ ID NO:384);
TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)和HD HD NI NG NH NG HD NH NI NH NG HD NHHD NG NG HD NG(SEQ ID NO:385);
TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)和HD NH HD HD NG HD HD NI NG NH NG HD NHNI NH NG HD NH(SEQ IDNO:386);
TCGTCATCGCCTCCATGTC(SEQ ID NO:55)和HD NH NG HD NI NG HD NH HD HD NG HD HDNI NG NH NG HD(SEQ ID NO:387);
TGATCTCGTCATCGCCTCC(SEQ ID NO:56)和NH NI NG HD NG HD NH NG HD NI NG HD NHHD HD NG HD HD(SEQ ID NO:388);
GCTTCAGCTTCCTA(SEQ ID NO:57)和NH HD NG NG HD NI NH HD NG NG HD HD NG NI(SEQ ID NO:389);
CTGTGATCATGCCA(SEQ ID NO:58)和HD NG NK NG NH NI NG HD NI NG NH HD HD NI(SEQ ID NO:390);
ACAGTGGTACACACCT(SEQ ID NO:59)和NI HD NI NN NG NN NN NG NI HD NI HD NI HDHD NG(SEQ ID NO:391);
CCACCCCCCACTAAG(SEQ ID NO:60)和HD HD NI HD HD HD HD HD HD NI HD NG NI NINN(SEQ ID NO:392);
CATTGGCCGGGCAC(SEQ ID NO:61)和HD NI NG NG NN NN HD HD NN NN NN HD NI HD(SEQ ID NO:393);
GCTTGAACCCAGGAGA(SEQ ID NO:62)和NN HD NG NG NN NI NI HD HD HD NI NN NN NINN NI(SEQ ID NO:394);
ACACCCGATCCACTGGG(SEQ ID NO:63)和NI HD NI HD HD HD NN NI NG HD HD NI HDNG NN NN NN(SEQ ID NO:395);
GCTGCATCAACCCC(SEQ ID NO:64)和NN HD NG NN HD NI NG HD NI NI HD HD HD HD(SEQ ID NO:396);
GCCACAAACAGAAATA(SEQ ID NO:65)和NN NN HD NI HD NN NI NI NI HD NI HD HD HDNG HD HD(SEQ ID NO:397);
GGTGGCTCATGCCTG(SEQ ID NO:66)和NN NN NG NN NN HD NG HD NI NG NN HD HD NGNN(SEQ ID NO:398);
GATTTGCACAGCTCAT(SEQ ID NO:67)和NN NI NG NG NG NN HD NI HD NI NN HD NG HDNI NG(SEQ ID NO:399);
AAGCTCTGAGGAGCA(SEQ ID NO:68)和NI NI NH HD NG HD NG NH NI NH NH NI NH HD(SEQ ID NO:400);
CCCTAGCTGTCCC(SEQ ID NO:69)和HD HD HD NG NI NK HD NG NH NG HD HD HD HD(SEQ ID NO:401);
GCCTAGCATGCTAG(SEQ ID NO:70)和NH HD HD NG NI NH HD NI NG NH HD NG NI NH(SEQ ID NO:402);
ATGGGCTTCACGGAT(SEQ ID NO:71)和NI NG NH NH NH HD NG NG HD NI HD NH NH NING(SEQ ID NO:403);
GAAACTATGCCTGC(SEQ ID NO:72)和NH NI NI NI HD NG NI NG NH HD HD NG NH HD(SEQ ID NO:404);
GCACCATTGCTCCC(SEQ ID NO:73)和NH HD NI HD HD NI NG NG NH HD NG HD HD HD(SEQ ID NO:405);
GACATGCAACTCAG(SEQ ID NO:74)和NH NI HD NI NG NH HD NI NI HD NG HD NI NH(SEQ ID NO:406);
ACACCACTAGGGGT(SEQ ID NO:75)和NI HD NI HD HD NI HD NG NI NH NH NH NH NG(SEQ ID NO:407);
GTCTGCTAGACAGG(SEQ ID NO:76)和NH NG HD NG NH HD NG NI NH NI HD NI NH NH(SEQ ID NO:408);
GGCCTAGACAGGCTG(SEQ ID NO:77)和NH NH HD HD NG NI NH NI HD NI NH NH HD NGNH(SEQ ID NO:409);
GAGGCATTCTTATCG(SEQ ID NO:78)和NH NI NH NH HD NI NG NG HD NG NG NI NG HDNH(SEQ ID NO:410);
GCCTGGAAACGTTCC(SEQ ID NO:79)和NN HD HD NG NN NN NI NI NI HD NN NG NG HDHD(SEQ ID NO:411);
GTGCTCTGACAATA(SEQ ID NO:80)和NN NG NN HD NG HD NG NN NI HD NI NI NG NI(SEQ ID NO:412);
GTTTTGCAGCCTCC(SEQ ID NO:81)和NN NG NG NG NG NN HD NI NN HD HD NG HD HD(SEQ ID NO:413);
ACAGCTGTGGAACGT(SEQ ID NO:82)和NI HD NI NN HD NG NN NG NN NN NI NI HD NNNG(SEQ ID NO:414);
GGCTCTCTTCCTCCT(SEQ ID NO:83)和HD NI NI NN NI HD HD NN NI NN HD NI HD NGNN HD NG NN(SEQ ID NO:415);
CTATCCCAAAACTCT(SEQ ID NO:84)和HD NG NI NG HD HD HD NI NI NI NI HD NG HDNG(SEQ ID NO:416);
GAAAAACTATGTAT(SEQ ID NO:85)和NH NI NI NI NI NI HD NG NI NG NH NG NI NG(SEQ ID NO:417);
AGGCAGGCTGGTTGA(SEQ ID NO:86)和NI NH NH HD NI NH NH HD NG NH NH NG NG NHNI(SEQ ID NO:418);
CAATACAACCACGC(SEQ ID NO:87)和HD NI NI NG NI HD NI NI HD HD NI HD NN HD(SEQ ID NO:419);
ATGACGGACTCAACT(SEQ ID NO:88)和NI NG NN NI HD NN NN NI HD NG HD NI NI HDNG(SEQ ID NO:420);以及CACAACATTTGTAA(SEQ ID NO:89)和HD NI HD NI NI HD NI NGNG NG NN NG NI NI(SEQ ID NO:421)。
42.如权利要求20至41中任一项所述的组合物,其中所述GSHS处于所述TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点的约25个、或约50个、或约100个、或约150个、或约200个、或约300个、或约500个核苷酸内。
43.如权利要求1至42中任一项所述的组合物,其中所述酶具有一个或多个赋予高活性的突变。
44.如权利要求43所述的组合物,所述酶相对于SEQ ID NO:2的氨基酸序列在对应于S8P、C13R和N125K突变中的至少一者的位置处具有突变。
45.如权利要求1至18中任一项所述的组合物,其中所述组合物包含所述编码转座酶的核酸。
46.如权利要求45所述的组合物,其中所述核酸包含SEQ ID NO:3的核苷酸序列或与其具有至少约80%同一性的核苷酸序列。
47.如权利要求45所述的组合物,其中所述核酸包含SEQ ID NO:3的核苷酸序列或与其具有至少约90%同一性的核苷酸序列。
48.如权利要求45所述的组合物,其中所述核酸包含SEQ ID NO:3的核苷酸序列或与其具有至少约93%同一性的核苷酸序列。
49.如权利要求45所述的组合物,其中所述核酸包含SEQ ID NO:3的核苷酸序列或与其具有至少约95%同一性的核苷酸序列。
50.如权利要求45所述的组合物,其中所述核酸包含SEQ ID NO:3的核苷酸序列或与其具有至少约98%同一性的核苷酸序列。
51.如权利要求45所述的组合物,其中所述核酸包含用于在人类细胞中表达的SEQ IDNO:2的密码子优化型式。
52.如权利要求45至51中任一项所述的组合物,其中所述核酸掺入载体中。
53.如权利要求52所述的组合物,其中所述载体是非病毒载体。
54.一种包含宿主细胞的组合物,所述宿主细胞包含权利要求45至53中任一项所述的核酸。
55.如权利要求1至54中任一项所述的组合物,其中所述组合物呈脂质纳米颗粒(LNP)的形式。
56.如权利要求55所述的组合物,其中所述LNP包含一种或多种选自以下的脂质:1,2-二油酰基-3-三甲基丙烷铵(DOTAP)、与二甲基氨基乙烷-氨基甲酰基混合的阳离子胆固醇衍生物(DC-Chol)、磷脂酰胆碱(PC)、三油精(三油酸甘油酯)和1,2-二硬脂酰基-sn-甘油-3-磷酰乙醇胺-N-[羧基(聚乙二醇)-2000](DSPE-PEG)、1,2-二肉豆蔻酰基-外消旋-甘油-3-甲氧基聚乙二醇-2000(DMG-PEG 2K)和1,2-二硬脂醇-sn-甘油-3-磷酸胆碱(DSPC),和/或包含一种或多种选自聚乙烯亚胺(PEI)和聚(乳酸-共-乙醇酸)(PLGA)以及N-乙酰半乳糖胺(GalNAc)的分子。
57.如权利要求55或权利要求56所述的组合物,其中所述转座酶或编码所述转座酶的核酸与编码转座子的核酸共同配制。
58.如权利要求57所述的组合物,其中所述共制剂呈脂质纳米颗粒(LNP)的形式,所述脂质纳米颗粒(LNP)封装所述酶或编码所述酶的核酸和所述编码转座子的核酸。
59.如权利要求58所述的组合物,其中所述共制剂包含编码所述酶的所述核酸和编码所述转座子的所述核酸。
60.如权利要求1至18中任一项所述的组合物,其中所述酶呈单体或二聚形式。
61.如权利要求1至18中任一项所述的组合物,其中所述酶具有
(a)基因切割(Exc+)活性,和/或
(b)基因整合(Int+)或缺乏整合(Int-)活性。
62.一种用于将基因插入细胞基因组中的方法,所述方法包括使细胞与权利要求1至61中任一项所述的组合物接触。
63.如权利要求62所述的方法,所述方法还包括使所述细胞与编码转座子的核酸接触。
64.如权利要求62所述的方法,其中所述酶与编码所述转座子的所述核酸共同配制。
65.如权利要求62所述的方法,其中所述共制剂呈相同脂质纳米颗粒(LNP)的形式。
66.如权利要求65所述的方法,其中所述共制剂包含编码所述酶的所述核酸和编码所述转座子的所述核酸。
67.如权利要求63至66中任一项所述的方法,其中所述转座子的侧翼是一个或多个反向末端,任选地选自SEQ ID NO:21和22或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的序列。
68.如权利要求63至67中任一项所述的方法,其中所述转座子在组织特异性启动子的控制下。
69.如权利要求63至68中任一项所述的方法,其中所述转座子包含编码竞争多肽的基因。
70.如权利要求63至69中任一项所述的方法,其中所述转座子包含在疾病状态中有缺陷或大体上不存在的基因。
71.一种用于离体治疗疾病或病症的方法,所述方法包括使细胞与权利要求1至61中任一项所述的组合物接触。
72.一种用于体内治疗疾病或病症的方法,所述方法包括施用权利要求1至61中任一项所述的组合物或包含权利要求1至61中任一项所述的组合物的细胞。
73.一种包含能够转座的嵌合酶的组合物,所述组合物包含:
(a)转录激活子样效应子(TALE)DNA结合结构域(DBD)或核酸酶缺陷Cas9(dCas9)/gRNA复合物;
(b)能够通过转座进行靶向基因组整合的酶,所述酶能够在核酸分子的基因组安全港位点(GSHS)中的TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点处插入转座子;以及
(c)连接(a)和(b)的连接子。
74.如权利要求73所述的组合物,其中所述组合物适合于在与生物细胞接触时促成在所述GSHS中插入所述转座子。
75.如权利要求73所述的组合物,其中所述TALE DBD或dCas9/gRNA复合物适合于将所述嵌合酶引导至所述GSHS序列。
76.如权利要求73所述的组合物,其中所述TALE DBD包含一个或多个重复序列。
77.如权利要求76所述的组合物,其中所述TALE DBD包含约14个、或约15个、或约16个、或约17个、或约18个、或约18.5个重复序列。
78.如权利要求76或权利要求77所述的组合物,其中所述TALE DBD重复序列包含33或34个氨基酸。
79.如权利要求78所述的组合物,其中所述TALE DBD重复序列中的一者或多者在所述33或34个氨基酸的残基12和/或13处包含重复可变二残基(RVD)。
80.如权利要求79所述的组合物,其中所述RVD识别所述核酸分子中的一个碱基对。
81.如权利要求79所述的组合物,其中所述RVD识别所述核酸分子中的C残基并且选自HD、N(间隙)、HA、ND和HI。
82.如权利要求79所述的组合物,其中所述RVD识别所述核酸分子中的G残基并且选自NN、NH、NK、HN和NA。
83.如权利要求79所述的组合物,其中所述RVD识别所述核酸分子中的A残基并且选自NI和NS。
84.如权利要求79所述的组合物,其中所述RVD识别所述核酸分子中的T残基并且选自NG、HG、H(间隙)和IG。
85.如权利要求73至84中任一项所述的组合物,其中所述GSHS处于染色体中的开放染色质位置处。
86.如权利要求73至85中任一项所述的组合物,其中所述GSHS选自腺相关病毒位点1(AAVS1)、趋化因子(C-C基序)受体5(CCR5)基因、HIV-1辅受体和人类Rosa26基因座。
87.如权利要求73至86中任一项所述的组合物,其中所述GSHS位于人类染色体2、4、6、10、11或17上。
88.如权利要求86或权利要求87所述的组合物,其中所述GSHS选自TALC1、TALC2、TALC3、TALC4、TALC5、TALC7、TALC8、AVS1、AVS2、AVS3、ROSA1、ROSA2、TALER1、TALER2、TALER3、TALER4、TALER5、SHCHR2-1、SHCHR2-2、SHCHR2-3、SHCHR2-4、SHCHR4-1、SHCHR4-2、SHCHR4-3、SHCHR6-1、SHCHR6-2、SHCHR6-3、SHCHR6-4、SHCHR10-1、SHCHR10-2、SHCHR10-3、SHCHR10-4、SHCHR10-5、SHCHR11-1、SHCHR11-2、SHCHR11-3、SHCHR17-1、SHCHR17-2、SHCHR17-3和SHCHR17-4。
89.如权利要求73至88中任一项所述的组合物,其中所述GSHS包含以下一者或多者:TGGCCGGCCTGACCACTGG(SEQ ID NO:23)、TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)、TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)、TCCACTGAGCACTGAAGGC(SEQ ID NO:26)、TGGTTTCCACTGAGCACTG(SEQ ID NO:27)、TGGGGAAAATGACCCAACA(SEQ ID NO:28)、TAGGACAGTGGGGAAAATG(SEQ ID NO:29)、TCCAGGGACACGGTGCTAG(SEQ ID NO:30)、TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)、TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)、TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)、TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)、TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)、TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)、TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)、TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)、TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)、CCAATCCCCTCAGT(SEQ ID NO:40)、CAGTGCTCAGTGGAA(SEQ ID NO:41)、GAAACATCCGGCGACTCA(SEQ ID NO:42)、TCGCCCCTCAAATCTTACA(SEQ ID NO:43)、TCAAATCTTACAGCTGCTC(SEQ ID NO:44)、TCTTACAGCTGCTCACTCC(SEQ ID NO:45)、TACAGCTGCTCACTCCCCT(SEQ ID NO:46)、TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)、TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)、TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)、TCTCGATTATGGGCGGGAT(SEQ ID NO:50)、TCGCTTCTCGATTATGGGC(SEQ ID NO:51)、TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)、TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)、TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)、TCGTCATCGCCTCCATGTC(SEQ ID NO:55)、TGATCTCGTCATCGCCTCC(SEQ ID NO:56)、GCTTCAGCTTCCTA(SEQ ID NO:57)、CTGTGATCATGCCA(SEQ ID NO:58)、ACAGTGGTACACACCT(SEQ ID NO:59)、CCACCCCCCACTAAG(SEQ ID NO:60)、CATTGGCCGGGCAC(SEQ ID NO:61)、GCTTGAACCCAGGAGA(SEQ ID NO:62)、ACACCCGATCCACTGGG(SEQ ID NO:63)、GCTGCATCAACCCC(SEQ ID NO:64)、GCCACAAACAGAAATA(SEQ ID NO:65)、GGTGGCTCATGCCTG(SEQ ID NO:66)、GATTTGCACAGCTCAT(SEQ ID NO:67)、AAGCTCTGAGGAGCA(SEQ ID NO:68)、CCCTAGCTGTCCC(SEQ ID NO:69)、GCCTAGCATGCTAG(SEQ ID NO:70)、ATGGGCTTCACGGAT(SEQ ID NO:71)、GAAACTATGCCTGC(SEQ ID NO:72)、GCACCATTGCTCCC(SEQ ID NO:73)、GACATGCAACTCAG(SEQID NO:74)、ACACCACTAGGGGT(SEQ ID NO:75)、GTCTGCTAGACAGG(SEQ ID NO:76)、GGCCTAGACAGGCTG(SEQ ID NO:77)、GAGGCATTCTTATCG(SEQ ID NO:78)、GCCTGGAAACGTTCC(SEQ ID NO:79)、GTGCTCTGACAATA(SEQ ID NO:80)、GTTTTGCAGCCTCC(SEQ ID NO:81)、ACAGCTGTGGAACGT(SEQ ID NO:82)、GGCTCTCTTCCTCCT(SEQ ID NO:83)、CTATCCCAAAACTCT(SEQ ID NO:84)、GAAAAACTATGTAT(SEQ ID NO:85)、AGGCAGGCTGGTTGA(SEQ ID NO:86)、CAATACAACCACGC(SEQ ID NO:87)、ATGACGGACTCAACT(SEQ ID NO:88)、CACAACATTTGTAA(SEQID NO:89)和ATTTCCAGTGCACA(SEQ ID NO:90)。
90.如权利要求89所述的组合物,其中所述TALE DBD结合至以下一者:TGGCCGGCCTGACCACTGG(SEQ ID NO:23)、TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)、TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)、TCCACTGAGCACTGAAGGC(SEQ ID NO:26)、TGGTTTCCACTGAGCACTG(SEQ ID NO:27)、TGGGGAAAATGACCCAACA(SEQ ID NO:28)、TAGGACAGTGGGGAAAATG(SEQ ID NO:29)、TCCAGGGACACGGTGCTAG(SEQ ID NO:30)、TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)、TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)、TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)、TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)、TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)、TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)、TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)、TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)、TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)、CCAATCCCCTCAGT(SEQ ID NO:40)、CAGTGCTCAGTGGAA(SEQ ID NO:41)、GAAACATCCGGCGACTCA(SEQ ID NO:42)、TCGCCCCTCAAATCTTACA(SEQ ID NO:43)、TCAAATCTTACAGCTGCTC(SEQ ID NO:44)、TCTTACAGCTGCTCACTCC(SEQ ID NO:45)、TACAGCTGCTCACTCCCCT(SEQ ID NO:46)、TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)、TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)、TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)、TCTCGATTATGGGCGGGAT(SEQ ID NO:50)、TCGCTTCTCGATTATGGGC(SEQ ID NO:51)、TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)、TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)、TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)、TCGTCATCGCCTCCATGTC(SEQ ID NO:55)、TGATCTCGTCATCGCCTCC(SEQ ID NO:56)、GCTTCAGCTTCCTA(SEQ ID NO:57)、CTGTGATCATGCCA(SEQ ID NO:58)、ACAGTGGTACACACCT(SEQ ID NO:59)、CCACCCCCCACTAAG(SEQ ID NO:60)、CATTGGCCGGGCAC(SEQ ID NO:61)、GCTTGAACCCAGGAGA(SEQ ID NO:62)、ACACCCGATCCACTGGG(SEQ ID NO:63)、GCTGCATCAACCCC(SEQ ID NO:64)、GCCACAAACAGAAATA(SEQ ID NO:65)、GGTGGCTCATGCCTG(SEQ ID NO:66)、GATTTGCACAGCTCAT(SEQ ID NO:67)、AAGCTCTGAGGAGCA(SEQ ID NO:68)、CCCTAGCTGTCCC(SEQ ID NO:69)、GCCTAGCATGCTAG(SEQ ID NO:70)、ATGGGCTTCACGGAT(SEQ ID NO:71)、GAAACTATGCCTGC(SEQ ID NO:72)、GCACCATTGCTCCC(SEQ ID NO:73)、GACATGCAACTCAG(SEQID NO:74)、ACACCACTAGGGGT(SEQ ID NO:75)、GTCTGCTAGACAGG(SEQ ID NO:76)、GGCCTAGACAGGCTG(SEQ ID NO:77)、GAGGCATTCTTATCG(SEQ ID NO:78)、GCCTGGAAACGTTCC(SEQ ID NO:79)、GTGCTCTGACAATA(SEQ ID NO:80)、GTTTTGCAGCCTCC(SEQ ID NO:81)、ACAGCTGTGGAACGT(SEQ ID NO:82)、GGCTCTCTTCCTCCT(SEQ ID NO:83)、CTATCCCAAAACTCT(SEQ ID NO:84)、GAAAAACTATGTAT(SEQ ID NO:85)、AGGCAGGCTGGTTGA(SEQ ID NO:86)、CAATACAACCACGC(SEQ ID NO:87)、ATGACGGACTCAACT(SEQ ID NO:88)、CACAACATTTGTAA(SEQID NO:89)和ATTTCCAGTGCACA(SEQ ID NO:90)。
91.如权利要求73至90中任一项所述的组合物,其中所述TALEDBD包含以下一者或多者:
NH NH HD HD NH NH HD HD NG NH NI HD HD NI HD NG NH NH(SEQ ID NO:355),
NH NI NI NH NH HD HD NG NH NH HD HD NH NH HD HD NG NH(SEQ ID NO:356),
NH NI NH HD NI HD NG NH NI NI NH NH HD HD NG NH NH HD(SEQ ID NO:357),
HD HD NI HD NG NH NI NH HD NI HD NG NH NI NI NH NH HD(SEQ ID NO:358),
NH NH NG NG NG HD HD NI HD NG NH NI NH HD NI HD NG NH(SEQ ID NO:359),
NH NH NH NH NI NI NI NI NG NH NI HD HD HD NI NI HD NI (SEQ ID NO:360),
NI NH NH NI HD NI NH NG NH NH NH NH NI NI NI NI NG NH (SEQ ID NO:361),
HD HD NI NH NH NH NI HD NI HD NH NH NG NH HD NG NI NH(SEQ ID NO:362),
HD NI NH NI NH HD HD NI NH NH NI NH NG HD HD NG NH NH(SEQ ID NO:363),
HD HD NG NG HD NI NH NI NH HD HD NI NH NH NI NH NG HD(SEQ ID NO:364),
HD HD NG HD HD NG NG HD NI NH NI NH HD HD NI NH NH NI(SEQ ID NO:365),
HD HD NI NH HD HD HD HD NG HD HD NG HD HD NG NG HD NI(SEQ ID NO:366),
HD HD NH NI NH HD NG NG NH NI HD HD HD NG NG NH NH NI(SEQ ID NO:367),
NH NH NG NG NG HD HD NH NI NH HD NG NG NH NI HD HD HD(SEQ ID NO:368),
NH NH NH NH NG NH NH NG NG NG HD HD NH NI NH HD NG NG(SEQ ID NO:369),
HD NG NH HD NG NH NH NH NH NG NH NH NG NG NG HD HD NH(SEQ ID NO:370),
NH HD NI NH NI NH NG NI NG HD NG NH HD NG NH NH NH NH(SEQ ID NO:371),
HD HD NI NI NG HD HD HD HD NG HD NI NH NG(SEQ ID NO:372),
HD NI NH NG NH HD NG HD NI NH NG NH NH NI NI(SEQ ID NO:373),
NH NI NI NI HD NI NG HD HD NH NH HD NH NI HD NG HD NI(SEQ ID NO:374),
HD NH HD HD HD HD NG HD NI NI NI NG HD NG NG NI HD NI(SEQ ID NO:375),
HD NI NI NI NG HD NG NG NI HD NI NH HD NG NH HD NG HD(SEQ ID NO:376),
HD NG NG NI HD NI NH HD NG NH HD NG HD NI HD NG HD HD(SEQ ID NO:377),
NI HD NI NH HD NG NH HD NG HD NI HD NG HD HD HD HD NG(SEQ ID NO:378),
NH HD NG HD NI HD NG HD HD HD HD NG NH HD NI NH NH NH(SEQ ID NO:379),
HD HD HD HD NG NH HD NI NH NH NH HD NI NI HD NH HD HD(SEQ ID NO:380),
NH HD NI NH NH NH HD NI NI HD NH HD HD HD NI NH NH NH(SEQ ID NO:381),
HD NG HD NH NI NG NG NI NG NH NH NH HD NH NH NH NI NG(SEQ ID NO:382),
HD NH HD NG NG HD NG HD NH NI NG NG NI NG NH NH NH HD(SEQ ID NO:383),
NH NG HD NH NI NH NG HD NH HD NG NG HD NG HD NH NI NG(SEQ ID NO:384),
HD HD NI NG NH NG HD NH NI NH NG HD NH HD NG NG HD NG(SEQ ID NO:385),
HD NH HD HD NG HD HD NI NG NH NG HD NH NI NH NG HD NH(SEQ ID NO:386),
HD NH NG HD NI NG HD NH HD HD NG HD HD NI NG NH NG HD(SEQ ID NO:387),
NH NI NG HD NG HD NH NG HD NI NG HD NH HD HD NG HD HD(SEQ ID NO:388),
NH HD NG NG HD NI NH HD NG NG HD HD NG NI(SEQ ID NO:389),
HD NG NK NG NH NI NG HD NI NG NH HD HD NI(SEQ ID NO:390),
NI HD NI NN NG NN NN NG NI HD NI HD NI HD HD NG(SEQ ID NO:391),
HD HD NI HD HD HD HD HD HD NI HD NG NI NI NN(SEQ ID NO:392),
HD NI NG NG NN NN HD HD NN NN NN HD NI HD(SEQ ID NO:393),
NN HD NG NG NN NI NI HD HD HD NI NN NN NI NN NI(SEQ ID NO:394),
NI HD NI HD HD HD NN NI NG HD HD NI HD NG NN NN NN (SEQ ID NO:395),
NN HD NG NN HD NI NG HD NI NI HD HD HD HD(SEQ ID NO:396),
NN NN HD NI HD NN NI NI NI HD NI HD HD HD NG HD HD (SEQ ID NO:397),
NN NN NG NN NN HD NG HD NI NG NN HD HD NG NN(SEQ ID NO:398),
NN NI NG NG NG NN HD NI HD NI NN HD NG HD NI NG (SEQ ID NO:399),
NI NI NH HD NG HD NG NH NI NH NH NI NH HD(SEQ ID NO:400),
HD HD HD NG NI NK HD NG NH NG HD HD HD HD(SEQ ID NO:401),
NH HD HD NG NI NH HD NI NG NH HD NG NI NH(SEQ ID NO:402),
NI NG NH NH NH HD NG NG HD NI HD NH NH NI NG(SEQ ID NO:403),
NH NI NI NI HD NG NI NG NH HD HD NG NH HD(SEQ ID NO:404),
NH HD NI HD HD NI NG NG NH HD NG HD HD HD(SEQ ID NO:405),
NH NI HD NI NG NH HD NI NI HD NG HD NI NH(SEQ ID NO:406),
NI HD NI HD HD NI HD NG NI NH NH NH NH NG(SEQ ID NO:407),
NH NG HD NG NH HD NG NI NH NI HD NI NH NH(SEQ ID NO:408),
NH NH HD HD NG NI NH NI HD NI NH NH HD NG NH(SEQ ID NO:409),
NH NI NH NH HD NI NG NG HD NG NG NI NG HD NH(SEQ ID NO:410),
NN HD HD NG NN NN NI NI NI HD NN NG NG HD HD(SEQ ID NO:411),
NN NG NN HD NG HD NG NN NI HD NI NI NG NI(SEQ ID NO:412),
NN NG NG NG NG NN HD NI NN HD HD NG HD HD(SEQ IDNO:413),
NI HD NI NN HD NG NN NG NN NN NI NI HD NN NG(SEQ IDNO:414),
HD NI NI NN NI HD HD NN NI NN HD NI HD NG NN HD NG NN(SEQ ID NO:415),
HD NG NI NG HD HD HD NI NI NI NI HD NG HD NG(SEQ ID NO:416),
NH NI NI NI NI NI HD NG NI NG NH NG NI NG(SEQ ID NO:417),
NI NH NH HD NI NH NH HD NG NH NH NG NG NH NI(SEQ ID NO:418),
HD NI NI NG NI HD NI NI HD HD NI HD NN HD(SEQ ID NO:419),
NI NG NN NI HD NN NN NI HD NG HD NI NI HD NG(SEQ ID NO:420),
HD NI HD NI NI HD NI NG NG NG NN NG NI NI(SEQ ID NO:421),和
NI NG NG NG HD HD NI NN NG NN HD NI HD NI(SEQ ID NO:422)。
92.如权利要求73所述的组合物,其中所述dCas9/gRNA复合物包含选自以下的向导RNA:GTTTAGCTCACCCGTGAGCC(SEQ ID NO:91)、CCCAATATTATTGTTCTCTG(SEQ ID NO:92)、GGGGTGGGATAGGGGATACG(SEQ ID NO:93)、GGATCCCCCTCTACATTTAA(SEQ ID NO:94)、GTGATCTTGTACAAATCATT(SEQ ID NO:95)、CTACACAGAATCTGTTAGAA(SEQ ID NO:96)、TAAGCTAGAGAATAGATCTC(SEQ ID NO:97)和TCAATACACTTAATGATTTA(SEQ ID NO:98),其中所述向导RNA将所述酶引导至趋化因子(C-C基序)受体5(CCR5)基因。
93.如权利要求73所述的组合物,其中所述dCas9/gRNA复合物包含选自以下的向导RNA:
CACCGGGAGCCACGAAAACAGATCC(SEQ ID NO:99);CACCGCGAAAACAGATCCAGGGACA(SEQ IDNO:100);CACCGAGATCCAGGGACACGGTGCT(SEQ ID NO:101);CACCGGACACGGTGCTAGGACAGTG(SEQ ID NO:102);CACCGGAAAATGACCCAACAGCCTC(SEQ ID NO:103);CACCGGCCTGGCCGGCCTGACCACT(SEQ ID NO:104);CACCGCTGAGCACTGAAGGCCTGGC(SEQ ID NO:105);CACCGTGGTTTCCACTGAGCACTGA(SEQ ID NO:106);CACCGGATAGCCAGGAGTCCTTTCG(SEQID NO:107);CACCGGCGCTTCCAGTGCTCAGACT(SEQ ID NO:108);CACCGCAGTGCTCAGACTAGGGAAG(SEQ ID NO:109);CACCGGCCCCTCCTCCTTCAGAGCC(SEQ ID NO:110);CACCGTCCTTCAGAGCCAGGAGTCC(SEQ ID NO:111);CACCGTGGTTTCCGAGCTTGACCCT(SEQ ID NO:112);CACCGCTGCAGAGTATCTGCTGGGG(SEQ ID NO:113);CACCGCGTTCCTGCAGAGTATCTGC(SEQID NO:114);AAACGGATCTGTTTTCGTGGCTCCC(SEQ ID NO:115);AAACTGTCCCTGGATCTGTTTTCGC(SEQ ID NO:116);AAACAGCACCGTGTCCCTGGATCTC(SEQ ID NO:117);AAACCACTGTCCTAGCACCGTGTCC(SEQ ID NO:118);AAACGAGGCTGTTGGGTCATTTTCC(SEQ ID NO:119);AAACAGTGGTCAGGCCGGCCAGGCC(SEQ ID NO:120);AAACGCCAGGCCTTCAGTGCTCAGC(SEQID NO:121);AAACTCAGTGCTCAGTGGAAACCAC(SEQ ID NO:122);AAACCGAAAGGACTCCTGGCTATCC(SEQ ID NO:123);AAACAGTCTGAGCACTGGAAGCGCC(SEQ ID NO:124);AAACCTTCCCTAGTCTGAGCACTGC(SEQ ID NO:125);AAACGGCTCTGAAGGAGGAGGGGCC(SEQ ID NO:126);AAACGGACTCCTGGCTCTGAAGGAC(SEQ ID NO:127);AAACAGGGTCAAGCTCGGAAACCAC(SEQID NO:128);AAACCCCCAGCAGATACTCTGCAGC(SEQ ID NO:129);AAACGCAGATACTCTGCAGGAACGC(SEQ ID NO:130);TCCCCTCCCAGAAAGACCTG(SEQ ID NO:131);TGGGCTCCAAGCAATCCTGG(SEQID NO:132);GTGGCTCAGGAGGTACCTGG(SEQ ID NO:133);GAGCCACGAAAACAGATCCA(SEQ IDNO:134);AAGTGAACGGGGAAGGGAGG(SEQ ID NO:135);GACAAAAGCCGAAGTCCAGG(SEQ ID NO:136);GTGGTTGATAAACCCACGTG(SEQ ID NO:137);TGGGAACAGCCACAGCAGGG(SEQ ID NO:138);GCAGGGGAACGGGGATGCAG(SEQ ID NO:139);GAGATGGTGGACGAGGAAGG(SEQ ID NO:140);GAGATGGCTCCAGGAAATGG(SEQ ID NO:141);TAAGGAATCTGCCTAACAGG(SEQ ID NO:142);TCAGGAGACTAGGAAGGAGG(SEQ ID NO:143);TATAAGGTGGTCCCAGCTCG(SEQ ID NO:144);CTGGAAGATGCCATGACAGG(SEQ ID NO:145);GCACAGACTAGAGAGGTAAG(SEQ ID NO:146);ACAGACTAGAGAGGTAAGGG(SEQ ID NO:147);GAGAGGTGACCCGAATCCAC(SEQ ID NO:148);GCACAGGCCCCAGAAGGAGA(SEQ ID NO:149);CCGGAGAGGACCCAGACACG(SEQ ID NO:150);GAGAGGACCCAGACACGGGG(SEQ ID NO:151);GCAACACAGCAGAGAGCAAG(SEQ ID NO:152);GAAGAGGGAGTGGAGGAAGA(SEQ ID NO:153);AAGACGGAACCTGAAGGAGG(SEQ ID NO:154);AGAAAGCGGCACAGGCCCAG(SEQ ID NO:155);GGGAAACAGTGGGCCAGAGG(SEQ ID NO:156);GTCCGGACTCAGGAGAGAGA(SEQ ID NO:157);GGCACAGCAAGGGCACTCGG(SEQ ID NO:158);GAAGAGGGGAAGTCGAGGGA(SEQ ID NO:159);GGGAATGGTAAGGAGGCCTG(SEQ ID NO:160);GCAGAGTGGTCAGCACAGAG(SEQ ID NO:161);GCACAGAGTGGCTAAGCCCA(SEQ ID NO:162);GACGGGGTGTCAGCATAGGG(SEQ ID NO:163);GCCCAGGGCCAGGAACGACG(SEQ ID NO:164);GGTGGAGTCCAGCACGGCGC(SEQ ID NO:165);ACAGGCCGCCAGGAACTCGG(SEQ ID NO:166);ACTAGGAAGTGTGTAGCACC(SEQ ID NO:167);ATGAATAGCAGACTGCCCCG(SEQ ID NO:168);ACACCCCTAAAAGCACAGTG(SEQ ID NO:169);CAAGGAGTTCCAGCAGGTGG(SEQ ID NO:170);AAGGAGTTCCAGCAGGTGGG(SEQ ID NO:171);TGGAAAGAGGAGGGAAGAGG(SEQ ID NO:172);TCGAATTCCTAACTGCCCCG(SEQ ID NO:173);GACCTGCCCAGCACACCCTG(SEQ ID NO:174);GGAGCAGCTGCGGCAGTGGG(SEQ ID NO:175);GGGAGGGAGAGCTTGGCAGG(SEQ ID NO:176);GTTACGTGGCCAAGAAGCAG(SEQ ID NO:177);GCTGAACAGAGAAGAGCTGG(SEQ ID NO:178);TCTGAGGGTGGAGGGACTGG(SEQ ID NO:179);GGAGAGGTGAGGGACTTGGG(SEQ ID NO:180);GTGAACCAGGCAGACAACGA(SEQ ID NO:181);CAGGTACCTCCTGAGCCACG(SEQ ID NO:182);GGGGGAGTAGGGGCATGCAG(SEQ ID NO:183);GCAAATGGCCAGCAAGGGTG(SEQ ID NO:184);CAAATGGCCAGCAAGGGTGG(SEQ ID NO:309);GCAGAACCTGAGGATATGGA(SEQ ID NO:310);AATACACAGAATGAAAATAG(SEQ ID NO:311);CTGGTGACTAGAATAGGCAG(SEQ ID NO:312);TGGTGACTAGAATAGGCAGT(SEQ ID NO:313);TAAAAGAATGTGAAAAGATG(SEQ ID NO:314);TCAGGAGTTCAAGACCACCC(SEQ ID NO:315);TGTAGTCCCAGTTATGCAGG(SEQ ID NO:316);GGGTTCACACCACAAATGCA(SEQ ID NO:317);GGCAAATGGCCAGCAAGGGT(SEQ ID NO:318);AGAAACCAATCCCAAAGCAA(SEQ ID NO:319);GCCAAGGACACCAAAACCCA(SEQ ID NO:320);AGTGGTGATAAGGCAACAGT(SEQ ID NO:321);CCTGAGACAGAAGTATTAAG(SEQ ID NO:322);AAGGTCACACAATGAATAGG(SEQ ID NO:323);CACCATACTAGGGAAGAAGA(SEQ ID NO:324);CAATACCCTGCCCTTAGTGG(SEQ ID NO:327);AATACCCTGCCCTTAGTGGG(SEQ ID NO:325);TTAGTGGGGGGTGGAGTGGG(SEQ ID NO:326);GTGGGGGGTGGAGTGGGGGG(SEQ ID NO:328);GGGGGGTGGAGTGGGGGGTG(SEQ ID NO:329);GGGGTGGAGTGGGGGGTGGG(SEQ ID NO:330);GGGTGGAGTGGGGGGTGGGG(SEQ ID NO:331);GGGGGTGGGGAAAGACATCG(SEQ ID NO:332);GCAGCTGTGAATTCTGATAG(SEQ ID NO:333);GAGATCAGAGAAACCAGATG(SEQ ID NO:334);TCTATACTGATTGCAGCCAG(SEQ ID NO:335);CACCGAATCGAGAAGCGACTCGACA(SEQ ID NO:185);CACCGGTCCCTGGGCGTTGCCCTGC(SEQ ID NO:186);CACCGCCCTGGGCGTTGCCCTGCAG(SEQ ID NO:187);CACCGCCGTGGGAAGATAAACTAAT(SEQ ID NO:188);CACCGTCCCCTGCAGGGCAACGCCC(SEQID NO:189);CACCGGTCGAGTCGCTTCTCGATTA(SEQ ID NO:190);CACCGCTGCTGCCTCCCGTCTTGTA(SEQ ID NO:191);CACCGGAGTGCCGCAATACCTTTAT(SEQ ID NO:192);CACCGACACTTTGGTGGTGCAGCAA(SEQ ID NO:193);CACCGTCTCAAATGGTATAAAACTC(SEQ ID NO:194);CACCGAATCCCGCCCATAATCGAGA(SEQ ID NO:195);CACCGTCCCGCCCATAATCGAGAAG(SEQID NO:196);CACCGCCCATAATCGAGAAGCGACT(SEQ ID NO:197);CACCGGAGAAGCGACTCGACATGGA(SEQ ID NO:198);CACCGGAAGCGACTCGACATGGAGG(SEQ ID NO:199);CACCGGCGACTCGACATGGAGGCGA(SEQ ID NO:200);AAACTGTCGAGTCGCTTCTCGATTC(SEQ ID NO:201);AAACGCAGGGCAACGCCCAGGGACC(SEQ ID NO:202);AAACCTGCAGGGCAACGCCCAGGGC(SEQID NO:203);AAACATTAGTTTATCTTCCCACGGC(SEQ ID NO:204);AAACGGGCGTTGCCCTGCAGGGGAC(SEQ ID NO:205);AAACTAATCGAGAAGCGACTCGACC(SEQ ID NO:206);AAACTACAAGACGGGAGGCAGCAGC(SEQ ID NO:207);AAACATAAAGGTATTGCGGCACTCC(SEQ ID NO:208);AAACTTGCTGCACCACCAAAGTGTC(SEQ ID NO:209);AAACGAGTTTTATACCATTTGAGAC(SEQID NO:210);AAACTCTCGATTATGGGCGGGATTC(SEQ ID NO:211);AAACCTTCTCGATTATGGGCGGGAC(SEQ ID NO:212);AAACAGTCGCTTCTCGATTATGGGC(SEQ ID NO:213);AAACTCCATGTCGAGTCGCTTCTCC(SEQ ID NO:214);AAACCCTCCATGTCGAGTCGCTTCC(SEQ ID NO:215);AAACTCGCCTCCATGTCGAGTCGCC(SEQ ID NO:216);CACCGACAGGGTTAATGTGAAGTCC(SEQID NO:217);CACCGTCCCCCTCTACATTTAAAGT(SEQ ID NO:218);CACCGCATTTAAAGTTGGTTTAAGT(SEQ ID NO:219);CACCGTTAGAAAATATAAAGAATAA(SEQ ID NO:220);CACCGTAAATGCTTACTGGTTTGAA(SEQ ID NO:221);CACCGTCCTGGGTCCAGAAAAAGAT(SEQ ID NO:222);CACCGTTGGGTGGTGAGCATCTGTG(SEQ ID NO:223);CACCGCGGGGAGAGTGGAGAAAAAG(SEQID NO:224);CACCGGTTAAAACTCTTTAGACAAC(SEQ ID NO:225);CACCGGAAAATCCCCACTAAGATCC(SEQ ID NO:226);AAACGGACTTCACATTAACCCTGTC(SEQ ID NO:227);AAACACTTTAAATGTAGAGGGGGAC(SEQ ID NO:228);AAACACTTAAACCAACTTTAAATGC(SEQ ID NO:229);AAACTTATTCTTTATATTTTCTAAC(SEQ ID NO:230);AAACTTCAAACCAGTAAGCATTTAC(SEQID NO:231);AAACATCTTTTTCTGGACCCAGGAC(SEQ ID NO:232);AAACCACAGATGCTCACCACCCAAC(SEQ ID NO:233);AAACCTTTTTCTCCACTCTCCCCGC(SEQ ID NO:234);AAACGTTGTCTAAAGAGTTTTAACC(SEQ ID NO:235);AAACGGATCTTAGTGGGGATTTTCC(SEQ ID NO:236);AGTAGCAGTAATGAAGCTGG(SEQ ID NO:237);ATACCCAGACGAGAAAGCTG(SEQ ID NO:238);TACCCAGACGAGAAAGCTGA(SEQ ID NO:239);GGTGGTGAGCATCTGTGTGG(SEQ ID NO:240);AAATGAGAAGAAGAGGCACA(SEQ ID NO:241);CTTGTGGCCTGGGAGAGCTG(SEQ ID NO:242);GCTGTAGAAGGAGACAGAGC(SEQ ID NO:243);GAGCTGGTTGGGAAGACATG(SEQ ID NO:244);CTGGTTGGGAAGACATGGGG(SEQ ID NO:245);CGTGAGGATGGGAAGGAGGG(SEQ ID NO:246);ATGCAGAGTCAGCAGAACTG(SEQ ID NO:247);AAGACATCAAGCACAGAAGG(SEQ ID NO:248);TCAAGCACAGAAGGAGGAGG(SEQ ID NO:249);AACCGTCAATAGGCAAAGGG(SEQ ID NO:250);CCGTATTTCAGACTGAATGG(SEQ ID NO:251);GAGAGGACAGGTGCTACAGG(SEQ ID NO:252);AACCAAGGAAGGGCAGGAGG(SEQ ID NO:253);GACCTCTGGGTGGAGACAGA(SEQ ID NO:254);CAGATGACCATGACAAGCAG(SEQ ID NO:255);AACACCAGTGAGTAGAGCGG(SEQ ID NO:256);AGGACCTTGAAGCACAGAGA(SEQ ID NO:257);TACAGAGGCAGACTAACCCA(SEQ ID NO:258);ACAGAGGCAGACTAACCCAG(SEQ ID NO:259);TAAATGACGTGCTAGACCTG(SEQ ID NO:260);AGTAACCACTCAGGACAGGG(SEQ ID NO:261);ACCACAAAACAGAAACACCA(SEQ ID NO:262);GTTTGAAGACAAGCCTGAGG(SEQ ID NO:263);GCTGAACCCCAAAAGACAGG(SEQ ID NO:264);GCAGCTGAGACACACACCAG(SEQ ID NO:265);AGGACACCCCAAAGAAGCTG(SEQ ID NO:266);GGACACCCCAAAGAAGCTGA(SEQ ID NO:267);CCAGTGCAATGGACAGAAGA(SEQ ID NO:268);AGAAGAGGGAGCCTGCAAGT(SEQ ID NO:269);GTGTTTGGGCCCTAGAGCGA(SEQ ID NO:270);CATGTGCCTGGTGCAATGCA(SEQ ID NO:271);TACAAAGAGGAAGATAAGTG(SEQ ID NO:272);GTCACAGAATACACCACTAG(SEQ ID NO:273);GGGTTACCCTGGACATGGAA(SEQ ID NO:274);CATGGAAGGGTATTCACTCG(SEQ ID NO:275);AGAGTGGCCTAGACAGGCTG(SEQ ID NO:276);CATGCTGGACAGCTCGGCAG(SEQ ID NO:277);AGTGAAAGAAGAGAAAATTC(SEQ ID NO:278);TGGTAAGTCTAAGAAACCTA(SEQ ID NO:279);CCCACAGCCTAACCACCCTA(SEQ IDNO:280);AATATTTCAAAGCCCTAGGG(SEQ ID NO:281);GC ACTCGGAACAGGGTCTGG(SEQ ID NO:282);AGATAGGAGCTCCAACAGTG(SEQ ID NO:283);AAGTTAGAGCAGCCAGGAAA(SEQ ID NO:284);TAGAGCAGCCAGGAAAGGGA(SEQ ID NO:285);TGAATACCCTTCCATGTCCA(SEQ ID NO:286);CCTGCATTGCACCAGGCACA(SEQ ID NO:287);TCTAGGGCCCAAACACACCT(SEQ ID NO:288);TCCCTCCATCTATCAAAAGG(SEQ ID NO:289);AGCCCTGAGACAGAAGCAGG(SEQ ID NO:290);GCCCTGAGACAGAAGCAGGT(SEQ ID NO:291);AGGAGATGCAGTGATACGCA(SEQ ID NO:292);ACAATACCAAGGGTATCCGG(SEQ ID NO:293);TGATAAAGAAAACAAAGTGA(SEQ ID NO:294);AAAGAAAACAAAGTGAGGGA(SEQ ID NO:295);GTGGCAAGTGGAGAAATTGA(SEQ ID NO:296);CAAGTGGAGAAATTGAGGGA(SEQ ID NO:297);GTGGTGATGATTGCAGCTGG(SEQ ID NO:298);CTATGTGCCTGACACACAGG(SEQ ID NO:299);GGGTTGGACCAGGAAAGAGG(SEQ ID NO:300);GATGCCTGGAAAAGGAAAGA(SEQ ID NO:301);TAGTATGCACCTGCAAGAGG(SEQ ID NO:302);TATGCACCTGCAAGAGGCGG(SEQ ID NO:303);AGGGGAAGAAGAGAAGCAGA(SEQ ID NO:304);GCTGAATCAAGAGACAAGCG(SEQ ID NO:305);AAGCAAATAAATCTCCTGGG(SEQ ID NO:306);AGATGAGTGCTAGAGACTGG(SEQ ID NO:307);和CTGATGGTTGAGCACAGCAG(SEQ ID NO:308)。
94.如权利要求73至92中任一项所述的组合物,其中所述GSHS选自图3并且所述TALEDBD包含图3的序列或其变体(例如,具有约1个、或约2个、或约3个、或约4个、或约5个突变,任选地是插入、取代或缺失)。
95.如权利要求73至94中任一项所述的组合物,其中所述GSHS和所述TALE DBD序列选自:
TGGCCGGCCTGACCACTGG(SEQ ID NO:23)和NH NH HD HD NH NH HD HD NG NH NI HD HDNI HD NG NH NH(SEQ ID NO:355);
TGGCCGGCCTGACCACTGG(SEQ ID NO:23)和NH NH HD HD NH NH HD HD NG NH NI HD HDNI HD NG NH NH(SEQ ID NO:355);
TGAAGGCCTGGCCGGCCTG(SEQ ID NO:24)和NH NI NI NH NH HD HD NG NH NH HD HD NHNH HD HD NG NH(SEQ ID NO:356);
TGAGCACTGAAGGCCTGGC(SEQ ID NO:25)和NH NI NH HD NI HD NG NH NI NI NH NH HDHD NG NH NH HD(SEQ ID NO:357);
TCCACTGAGCACTGAAGGC(SEQ ID NO:26)和HD HD NI HD NG NH NI NH HD NI HD NG NHNI NI NH NH HD(SEQ ID NO:358);
TGGTTTCCACTGAGCACTG(SEQ ID NO:27)和NH NH NG NG NG HD HD NI HD NG NH NI NHHD NI HD NG NH(SEQ ID NO:359);
TGGGGAAAATGACCCAACA(SEQ ID NO:28)和NH NH NH NH NI NI NI NI NG NH NI HD HDHD NI NI HD NI(SEQ ID NO:360);
TAGGACAGTGGGGAAAATG(SEQ ID NO:29)和NI NH NH NI HD NI NH NG NH NH NH NH NINI NI NI NG NH(SEQ ID NO:361);
TCCAGGGACACGGTGCTAG(SEQ ID NO:30)和HD HD NI NH NH NH NI HD NI HD NH NH NGNH HD NG NI NH(SEQ ID NO:362);
TCAGAGCCAGGAGTCCTGG(SEQ ID NO:31)和HD NI NH NI NH HD HD NI NH NH NI NH NGHD HD NG NH NH(SEQ ID NO:363);
TCCTTCAGAGCCAGGAGTC(SEQ ID NO:32)和HD HD NG NG HD NI NH NI NH HD HD NI NHNH NI NH NG HD(SEQ ID NO:364);
TCCTCCTTCAGAGCCAGGA(SEQ ID NO:33)和HD HD NG HD HD NG NG HD NI NH NI NH HDHD NI NH NH NI(SEQ ID NO:365);
TCCAGCCCCTCCTCCTTCA(SEQ ID NO:34)和HD HD NI NH HD HD HD HD NG HD HD NG HDHD NG NG HD NI(SEQ ID NO:366);
TCCGAGCTTGACCCTTGGA(SEQ ID NO:35)和HD HD NH NI NH HD NG NG NH NI HD HD HDNG NG NH NH NI(SEQ ID NO:367);
TGGTTTCCGAGCTTGACCC(SEQ ID NO:36)和NH NH NG NG NG HD HD NH NI NH HD NG NGNH NI HD HD HD(SEQ ID NO:368);
TGGGGTGGTTTCCGAGCTT(SEQ ID NO:37)和NH NH NH NH NG NH NH NG NG NG HD HD NHNI NH HD NG NG(SEQ ID NO:369);
TCTGCTGGGGTGGTTTCCG(SEQ ID NO:38)和HD NG NH HD NG NH NH NH NH NG NH NH NGNG NG HD HD NH(SEQ ID NO:370);
TGCAGAGTATCTGCTGGGG(SEQ ID NO:39)和NH HD NI NH NI NH NG NI NG HD NG NH HDNG NH NH NH NH(SEQ ID NO:371);
CCAATCCCCTCAGT(SEQ ID NO:40)和HD HD NI NI NG HD HD HD HD NG HD NI NH NG(SEQ ID NO:372);
CAGTGCTCAGTGGAA(SEQ ID NO:41)和HD NI NH NG NH HD NG HD NI NH NG NH NH NINI(SEQ ID NO:373);
GAAACATCCGGCGACTCA(SEQ ID NO:42)和NH NI NI NI HD NI NG HD HD NH NH HD NHNI HD NG HD NI(SEQ ID NO:374);
TCGCCCCTCAAATCTTACA(SEQ ID NO:43)和HD NH HD HD HD HD NG HD NI NI NI NG HDNG NG NI HD NI(SEQ ID NO:375);
TCAAATCTTACAGCTGCTC(SEQ ID NO:44)和HD NI NI NI NG HD NG NG NI HD NI NH HDNG NH HD NG HD(SEQ ID NO:376);
TCTTACAGCTGCTCACTCC(SEQ ID NO:45)和HD NG NG NI HD NI NH HD NG NH HD NG HDNI HD NG HD HD(SEQ ID NO:377);
TACAGCTGCTCACTCCCCT(SEQ ID NO:46)和NI HD NI NH HD NG NH HD NG HD NI HD NGHD HD HD HD NG(SEQ ID NO:378);
TGCTCACTCCCCTGCAGGG(SEQ ID NO:47)和NH HD NG HD NI HD NG HD HD HD HD NG NHHD NI NH NH NH(SEQ ID NO:379);
TCCCCTGCAGGGCAACGCC(SEQ ID NO:48)和HD HD HD HD NG NH HD NI NH NH NH HD NINI HD NH HD HD(SEQ ID NO:380);
TGCAGGGCAACGCCCAGGG(SEQ ID NO:49)和NH HD NI NH NH NH HD NI NI HD NH HD HDHD NI NH NH NH(SEQ ID NO:381);
TCTCGATTATGGGCGGGAT(SEQ ID NO:50)和HD NG HD NH NI NG NG NI NG NH NH NH HDNH NH NH NI NG(SEQ ID NO:382);
TCGCTTCTCGATTATGGGC(SEQ ID NO:51)和HD NH HD NG NG HD NG HD NH NI NG NG NING NH NH NH HD(SEQ ID NO:383);
TGTCGAGTCGCTTCTCGAT(SEQ ID NO:52)和NH NG HD NH NI NH NG HD NH HD NG NG HDNG HD NH NI NG(SEQ ID NO:384);
TCCATGTCGAGTCGCTTCT(SEQ ID NO:53)和HD HD NI NG NH NG HD NH NI NH NG HD NHHD NG NG HD NG(SEQ ID NO:385);
TCGCCTCCATGTCGAGTCG(SEQ ID NO:54)和HD NH HD HD NG HD HD NI NG NH NG HD NHNI NH NG HD NH(SEQ ID NO:386);
TCGTCATCGCCTCCATGTC(SEQ ID NO:55)和HD NH NG HD NI NG HD NH HD HD NG HD HDNI NG NH NG HD(SEQ ID NO:387);
TGATCTCGTCATCGCCTCC(SEQ ID NO:56)和NH NI NG HD NG HD NH NG HD NI NG HD NHHD HD NG HD HD(SEQ ID NO:388);
GCTTCAGCTTCCTA(SEQ ID NO:57)和NH HD NG NG HD NI NH HD NG NG HD HD NG NI(SEQ ID NO:389);
CTGTGATCATGCCA(SEQ ID NO:58)和HD NG NK NG NH NI NG HD NI NG NH HD HD NI(SEQ ID NO:390);
ACAGTGGTACACACCT(SEQ ID NO:59)和NI HD NI NN NG NN NN NG NI HD NI HD NI HDHD NG(SEQ ID NO:391);
CCACCCCCCACTAAG(SEQ ID NO:60)和HD HD NI HD HD HD HD HD HD NI HD NG NI NINN(SEQ ID NO:392);
CATTGGCCGGGCAC(SEQ ID NO:61)和HD NI NG NG NN NN HD HD NN NN NN HD NI HD(SEQ ID NO:393);
GCTTGAACCCAGGAGA(SEQ ID NO:62)和NN HD NG NG NN NI NI HD HD HD NI NN NN NINN NI(SEQ ID NO:394);
ACACCCGATCCACTGGG(SEQ ID NO:63)和NI HD NI HD HD HD NN NI NG HD HD NI HDNG NN NN NN(SEQ ID NO:395);
GCTGCATCAACCCC(SEQ ID NO:64)和NN HD NG NN HD NI NG HD NI NI HD HD HD HD(SEQ ID NO:396);
GCCACAAACAGAAATA(SEQ ID NO:65)和NN NN HD NI HD NN NI NI NI HD NI HD HD HDNG HD HD(SEQ ID NO:397);
GGTGGCTCATGCCTG(SEQ ID NO:66)和NN NN NG NN NN HD NG HD NI NG NN HD HD NGNN(SEQ ID NO:398);
GATTTGCACAGCTCAT(SEQ ID NO:67)和NN NI NG NG NG NN HD NI HD NI NN HD NG HDNI NG(SEQ ID NO:399);
AAGCTCTGAGGAGCA(SEQ ID NO:68)和NI NI NH HD NG HD NG NH NI NH NH NI NH HD(SEQ ID NO:400);
CCCTAGCTGTCCC(SEQ ID NO:69)和HD HD HD NG NI NK HD NG NH NG HD HD HD HD(SEQ ID NO:401);
GCCTAGCATGCTAG(SEQ ID NO:70)和NH HD HD NG NI NH HD NI NG NH HD NG NI NH(SEQ ID NO:402);
ATGGGCTTCACGGAT(SEQ ID NO:71)和NI NG NH NH NH HD NG NG HD NI HD NH NH NING(SEQ ID NO:403);
GAAACTATGCCTGC(SEQ ID NO:72)和NH NI NI NI HD NG NI NG NH HD HD NG NH HD(SEQ ID NO:404);
GCACCATTGCTCCC(SEQ ID NO:73)和NH HD NI HD HD NI NG NG NH HD NG HD HD HD(SEQ ID NO:405);
GACATGCAACTCAG(SEQ ID NO:74)和NH NI HD NI NG NH HD NI NI HD NG HD NI NH(SEQ ID NO:406);
ACACCACTAGGGGT(SEQ ID NO:75)和NI HD NI HD HD NI HD NG NI NH NH NH NH NG(SEQ ID NO:407);
GTCTGCTAGACAGG(SEQ ID NO:76)和NH NG HD NG NH HD NG NI NH NI HD NI NH NH(SEQ ID NO:408);
GGCCTAGACAGGCTG(SEQ ID NO:77)和NH NH HD HD NG NI NH NI HD NI NH NH HD NGNH(SEQ ID NO:409);
GAGGCATTCTTATCG(SEQ ID NO:78)和NH NI NH NH HD NI NG NG HD NG NG NI NG HDNH(SEQ ID NO:410);
GCCTGGAAACGTTCC(SEQ ID NO:79)和NN HD HD NG NN NN NI NI NI HD NN NG NG HDHD(SEQ ID NO:411);
GTGCTCTGACAATA(SEQ ID NO:80)和NN NG NN HD NG HD NG NN NI HD NI NI NG NI(SEQ ID NO:412);
GTTTTGCAGCCTCC(SEQ ID NO:81)和NN NG NG NG NG NN HD NI NN HD HD NG HD HD(SEQ ID NO:413);
ACAGCTGTGGAACGT(SEQ ID NO:82)和NI HD NI NN HD NG NN NG NN NN NI NI HD NNNG(SEQ ID NO:414);
GGCTCTCTTCCTCCT(SEQ ID NO:83)和HD NI NI NN NI HD HD NN NI NN HD NI HD NGNN HD NG NN(SEQ ID NO:415);
CTATCCCAAAACTCT(SEQ ID NO:84)和HD NG NI NG HD HD HD NI NI NI NI HD NG HDNG(SEQ ID NO:416);
GAAAAACTATGTAT(SEQ ID NO:85)和NH NI NI NI NI NI HD NG NI NG NH NG NI NG(SEQ ID NO:417);
AGGCAGGCTGGTTGA(SEQ ID NO:86)和NI NH NH HD NI NH NH HD NG NH NH NG NG NHNI(SEQ ID NO:418);
CAATACAACCACGC(SEQ ID NO:87)和HD NI NI NG NI HD NI NI HD HD NI HD NN HD(SEQ ID NO:419);
ATGACGGACTCAACT(SEQ ID NO:88)和NI NG NN NI HD NN NN NI HD NG HD NI NI HDNG(SEQ ID NO:420);以及
CACAACATTTGTAA(SEQ ID NO:89)和HD NI HD NI NI HD NI NG NG NG NN NG NI NI(SEQ ID NO:421)。
96.如权利要求73至94中任一项所述的组合物,其中所述GSHS处于所述TA二核苷酸位点或TTAA(SEQ ID NO:1)四核苷酸位点的约25个、或约50个、或约100个、或约150个、或约200个、或约300个、或约500个核苷酸内。
97.如权利要求73至96中任一项所述的组合物,其中所述酶能够在TA二核苷酸位点处插入转座子。
98.如权利要求73至96中任一项所述的组合物,其中所述酶能够在TTAA(SEQ ID NO:1)四核苷酸位点处插入转座子。
99.如前述权利要求中任一项所述的组合物,其中编码所述能够通过转座进行靶向基因组整合的酶的核酸包含内含肽,任选地是NpuN(内含肽-N)(SEQ ID NO:423)和/或NpuC(内含肽-C)(SEQ ID NO:424)或其变体。
100.如权利要求99所述的组合物,其中所述核酸以第一部分和第二部分的形式编码所述酶,在所述第一部分与所述第二部分之间编码所述内含肽,使得所述第一部分和所述第二部分在翻译后切除所述酶中的所述内含肽后融合至功能酶中。
101.如前述权利要求中任一项所述的组合物,其中所述酶是重组酶。
102.如权利要求101所述的组合物,其中所述重组酶是整合酶或转座酶。
103.如权利要求102所述的组合物,其中所述整合酶是转座酶。
104.如权利要求103所述的组合物,其中所述转座酶具有一个或多个赋予高活性的突变。
105.如权利要求104所述的组合物,其中所述转座酶是源自哺乳动物的转座酶,任选地是辅助体RNA转座酶。
106.如权利要求102至105中任一项所述的组合物,其中所述转座酶来源于家蚕、热带爪蟾、粉纹夜蛾、小棕蝠、马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、马来大狐蝠、库氏伏翼、类人猿、獒蝠或智人。
107.如权利要求101至106中任一项所述的组合物,其中所述转座酶是来源于家蚕、热带爪蟾、粉纹夜蛾、小棕蝠、马铁菊头蝠、埃及果蝠、苍白矛吻蝠、大鼠耳蝠、马来大狐蝠、库氏伏翼、黑猩猩、獒蝠或智人的转座酶的工程化型式,包括但不限于高活性形式。
108.如权利要求73至107中任一项所述的组合物,其中所述酶呈单体或二聚形式。
109.如权利要求73至108中任一项所述的组合物,其中所述酶具有基因切割(Exc+)和/或基因整合(Int+)或缺乏整合(Int-)活性。
110.如权利要求101至109中任一项所述的组合物,其中所述转座酶是小棕蝠(MLT)转座酶。
111.如权利要求110所述的组合物,其中所述野生型MLT转座酶具有以下核苷酸序列:
Figure FDA0003926853210000591
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列。
112.如权利要求111所述的组合物,其中所述野生型MLT转座酶具有以下氨基酸序列:
Figure FDA0003926853210000592
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列。
113.如权利要求110所述的组合物,其中所述MLT转座酶具有以下核苷酸序列:
Figure FDA0003926853210000601
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的核苷酸序列。
114.如权利要求113所述的组合物,其中所述MLT转座酶具有以下氨基酸序列:
Figure FDA0003926853210000611
或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的氨基酸序列。
115.如权利要求110至114中任一项所述的组合物,其中所述MLT转座酶具有一个或多个赋予高活性的突变。
116.如权利要求115所述的组合物,其中所述MLT转座酶具有相对于SEQ ID NO:2的氨基酸序列在对应于S8P、C13R和N125K突变中的至少一者的位置处具有突变的氨基酸序列。
117.如权利要求115所述的组合物,其中所述MLT转座酶具有相对于SEQ ID NO:2的氨基酸序列在对应于N125K突变的位置处具有突变的SEQ ID NO:7的氨基酸序列,或所述MLT转座酶具有相对于SEQ ID NO:2的氨基酸序列在对应于S8P和C13R突变的位置处具有突变的SEQ ID NO:9的氨基酸序列。
118.如权利要求110或114所述的组合物,其中所述MLT转座酶:
在对应于SEQ ID NO:2的位置S2的位置处包含氨基酸取代,其中所述取代任选地是非极性脂肪族氨基酸,任选地选自G、A、V、L、I,任选地是S2A,和/或所述酶在C端不具有额外的残基,或者
在对应于L573X、E574X和S2X的位置处具有一个或多个突变,其中X是任何氨基酸或无氨基酸,任选地X是A、G或缺失,任选地所述突变是L573del、E574del和S2A。
119.如权利要求101至103中任一项所述的组合物,其中所述转座酶来源于粉纹夜蛾、小棕蝠、鼠耳蝠或马来大狐蝠,任选地具有图7的序列。
120.如权利要求110至119中任一项所述的组合物,其中所述MLT转座酶包含选自图5A或图5B的高活性突变,例如,约1个、或约2个、或约3个、或约4个、或约5个选自图5A或图5B的高活性突变,或它们的组合。
121.如权利要求73至120中任一项所述的组合物,其中所述连接子是柔性连接子。
122.如权利要求121所述的组合物,其中所述柔性连接子大体上由甘氨酸和丝氨酸残基组成,任选地其中所述柔性连接子包含(Gly4Ser)n,其中n为约1至约12。
123.如权利要求121所述的组合物,其中所述柔性连接子具有约20个、或约30个、或约40个、或约50个、或约60个氨基酸残基。
124.如权利要求73至123中任一项所述的组合物,其中所述转座子包含编码竞争多肽的基因。
125.如权利要求73至123中任一项所述的组合物,其中所述转座子包含在疾病状态中有缺陷或大体上不存在的基因。
126.如权利要求73至125中任一项所述的组合物,其中所述转座子的侧翼是一个或多个反向末端或末端序列,任选地选自SEQ IDNO:21和22或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的序列。
127.一种核酸,所述核酸编码权利要求73至126中任一项所述的嵌合酶。
128.如权利要求127所述的核酸,其中所述核酸是DNA。
129.如权利要求127所述的核酸,其中所述核酸是RNA。
130.如权利要求127至129中任一项所述的核酸,其中所述嵌合酶掺入载体中。
131.如权利要求130所述的核酸,其中所述载体是非病毒载体。
132.一种宿主细胞,所述宿主细胞包含权利要求127至131中任一项所述的核酸。
133.如权利要求73至126中任一项所述的组合物,或如权利要求81至85中任一项所述的核酸,其中所述组合物呈脂质纳米颗粒(LNP)的形式。
134.如权利要求73至133中任一项所述的组合物,其中编码所述酶的核酸和编码所述转座子的核酸呈相同脂质纳米颗粒(LNP)的形式,任选地呈包含编码所述酶的所述核酸和编码所述转座子的所述核酸的混合物的形式。
135.如权利要求133或权利要求134所述的组合物或核酸,其中所述LNP包含一种或多种选自以下的脂质:1,2-二油酰基-3-三甲基丙烷铵(DOTAP)、与二甲基氨基乙烷-氨基甲酰基混合的阳离子胆固醇衍生物(DC-Chol)、磷脂酰胆碱(PC)、三油精(三油酸甘油酯)和1,2-二硬脂酰基-sn-甘油-3-磷酰乙醇胺-N-[羧基(聚乙二醇)-2000](DSPE-PEG)、1,2-二肉豆蔻酰基-外消旋-甘油-3-甲氧基聚乙二醇-2000(DMG-PEG 2K)和1,2-二硬脂醇-sn-甘油-3-磷酸胆碱(DSPC),和/或包含一种或多种选自聚乙烯亚胺(PEI)和聚(乳酸-共-乙醇酸)(PLGA)以及N-乙酰半乳糖胺(GalNAc)的分子。
136.一种用于将基因插入细胞基因组中的方法,所述方法包括使细胞与权利要求73至135中任一项所述的组合物接触。
137.如权利要求89所述的方法,其中使所述细胞与编码权利要求73至135中任一项所述的嵌合酶的核酸接触。
138.如权利要求90所述的方法,其中使所述细胞与编码权利要求73至135中任一项所述的嵌合酶的RNA接触。
139.如权利要求138所述的方法,所述方法还包括使所述细胞与包含转座子的构建体接触。
140.如权利要求114所述的方法,其中使所述细胞与编码权利要求73至131中任一项所述的嵌合转座酶的核酸接触。
141.如权利要求136所述的方法,其中使所述细胞与编码权利要求73至131中任一项所述的嵌合酶的DNA接触。
142.如权利要求136至141中任一项所述的方法,其中所述转座子的侧翼是一个或多个反向末端或末端序列,任选地选自SEQ IDNO:21和22或与其具有至少约90%、或至少约93%、或至少约95%、或至少约97%、或至少约98%、或至少约99%同一性的序列。
143.如权利要求136至142中任一项所述的方法,其中所述转座子在组织特异性启动子的控制下。
144.如权利要求136至143中任一项所述的方法,其中所述转座子是编码竞争多肽的基因。
145.如权利要求136至143中任一项所述的方法,其中所述转座子是在疾病状态中有缺陷或大体上不存在的基因。
146.如权利要求136至145中任一项所述的方法,其中所述转座子是ATP结合盒亚家族A成员4基因(ABC)转运体基因(ABCA4)或其功能片段。
147.如权利要求136至145中任一项所述的方法,其中所述转座子是极低密度脂蛋白受体基因(VLDLR)或低密度脂蛋白受体基因(LDLR)或其功能片段。
148.如权利要求136至147中任一项所述的方法,其中所述方法是体内的。
149.如权利要求136至147中任一项所述的方法,其中所述方法是离体的。
150.如权利要求136至149中任一项所述的方法,其中与使用非嵌合转座酶的方法相比,所述方法提供减少的插入诱变或肿瘤发生。
151.如权利要求136至149中任一项所述的方法,其中所述方法用于治疗有需要的患者的遗传性或获得性疾病。
CN202180033254.1A 2020-05-04 2021-05-04 基于转座的疗法 Pending CN115698268A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202063019709P 2020-05-04 2020-05-04
US63/019,709 2020-05-04
US202063027561P 2020-05-20 2020-05-20
US63/027,561 2020-05-20
US202063058200P 2020-07-29 2020-07-29
US63/058,200 2020-07-29
US202163175345P 2021-04-15 2021-04-15
US63/175,345 2021-04-15
PCT/US2021/030729 WO2021226141A1 (en) 2020-05-04 2021-05-04 Transposition-based therapies

Publications (1)

Publication Number Publication Date
CN115698268A true CN115698268A (zh) 2023-02-03

Family

ID=78468370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180033254.1A Pending CN115698268A (zh) 2020-05-04 2021-05-04 基于转座的疗法

Country Status (10)

Country Link
US (3) US11542528B2 (zh)
EP (1) EP4146798A1 (zh)
JP (1) JP2023525007A (zh)
KR (1) KR20230005865A (zh)
CN (1) CN115698268A (zh)
AU (1) AU2021268649A1 (zh)
CA (1) CA3173889A1 (zh)
IL (1) IL297851A (zh)
WO (1) WO2021226141A1 (zh)
ZA (1) ZA202212919B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113439121A (zh) * 2019-02-13 2021-09-24 普罗拜奥根股份公司 具有增强的插入位点选择特性的转座酶

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023081814A2 (en) * 2021-11-04 2023-05-11 Saliogen Therapeutics, Inc. Mobile elements and chimeric constructs thereof

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2358994T3 (es) 2002-07-24 2011-05-17 Manoa Biosciences Inc. Vectores basados en transposones y métodos para la integración de ácidos nucleicos.
US20110047635A1 (en) 2006-08-28 2011-02-24 University of Hawail Methods and compositions for transposon-mediated transgenesis
WO2008100424A2 (en) 2007-02-09 2008-08-21 University Of Hawaii Animals and cells with genomic target sites for transposase-mediated transgenesis
US20090042297A1 (en) 2007-06-01 2009-02-12 George Jr Alfred L Piggybac transposon-based vectors and methods of nucleic acid integration
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
WO2010085699A2 (en) * 2009-01-23 2010-07-29 The Johns Hopkins University Mammalian piggybac transposon and methods of use
EP2401376A4 (en) 2009-02-25 2012-11-28 Univ Johns Hopkins TRANSPOSON PIGGYBAC VARIANTS AND METHODS OF USE
WO2010099296A1 (en) 2009-02-26 2010-09-02 Transposagen Biopharmaceuticals, Inc. Hyperactive piggybac transposases
CN103025344B (zh) 2010-05-17 2016-06-29 桑格摩生物科学股份有限公司 新型dna-结合蛋白及其用途
WO2012125445A2 (en) 2011-03-11 2012-09-20 President And Fellows Of Harvard College Small molecule-dependent inteins and uses thereof
WO2013012824A2 (en) 2011-07-15 2013-01-24 The Johns Hopkins University Trichoplusia ni piggybac transposases with reduced integration activity
DK3241902T3 (en) 2012-05-25 2018-05-07 Univ California METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
ES2835673T3 (es) 2014-04-09 2021-06-22 Dna Twopointo Inc Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas
US10344285B2 (en) 2014-04-09 2019-07-09 Dna2.0, Inc. DNA vectors, transposons and transposases for eukaryotic genome modification
WO2015157611A2 (en) 2014-04-11 2015-10-15 The Johns Hopkins University Improvements to eukaryotic transposase mutants and transposon end compositions for modifying nucleic acids and methods for production and use in the generation of sequencing libraries
WO2016172703A2 (en) 2015-04-23 2016-10-27 Haemalogix Pty. Ltd. Kappa myeloma antigen chimeric antigen receptors and uses thereof
EP3974524A1 (en) 2015-10-08 2022-03-30 Dna Twopointo Inc. Dna vectors, transposons and transposases for eukaryotic genome modification
CA3047313A1 (en) * 2016-12-16 2018-06-21 B-Mogen Biotechnologies, Inc. Enhanced hat family transposon-mediated gene transfer and associated compositions, systems, and methods
WO2019108932A1 (en) 2017-11-30 2019-06-06 Haemalogix Pty. Ltd. Methods for expanding kappa myeloma antigen chimeric antigen receptors expressing cells
WO2020077357A1 (en) * 2018-10-12 2020-04-16 Poseida Therapeutics, Inc. Compositions and methods for increasing transposition frequency
WO2020077360A1 (en) * 2018-10-12 2020-04-16 Poseida Therapeutics, Inc. Hematopoietic stem cell compositions, methods of making and method of use
SG11202108665PA (en) * 2019-02-08 2021-09-29 Dna Twopointo Inc Transposon-based modifications of immune cells
US11060109B2 (en) 2019-04-08 2021-07-13 Dna Twopointo Inc. Transposition of nucleic acid constructs into eukaryotic genomes with a transposase from amyelois
IL301620A (en) 2019-04-08 2023-05-01 Dna Twopointo Inc Integration of nucleic acid constructs in eukaryotic cells with Oryzas transposases
EP3953480A4 (en) 2019-04-08 2023-01-11 Dna Twopointo Inc. TRANSPOSITION OF NUCLEIC ACIDS INTO EUKARYOTIC GENOMES WITH A TRANSPOSASE FROM HELIOTHIS
CA3136470A1 (en) 2019-05-13 2020-11-19 Dna Twopointo Inc. Modifications of mammalian cells using artificial micro-rna to alter their properties and the compositions of their products
US20230193319A1 (en) 2020-04-29 2023-06-22 Saliogen Therapeutics, Inc. Compositions and methods for treatment of inherited macular degeneration
CA3175196A1 (en) 2020-04-29 2021-11-04 Joseph J. HIGGINS Compositions and methods for treatment of familial hypercholesterolemia and elevated low-density lipoprotein cholesterol

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113439121A (zh) * 2019-02-13 2021-09-24 普罗拜奥根股份公司 具有增强的插入位点选择特性的转座酶

Also Published As

Publication number Publication date
KR20230005865A (ko) 2023-01-10
ZA202212919B (en) 2023-07-26
US11542528B2 (en) 2023-01-03
AU2021268649A1 (en) 2022-10-20
EP4146798A1 (en) 2023-03-15
IL297851A (en) 2023-01-01
US20220243227A1 (en) 2022-08-04
WO2021226141A1 (en) 2021-11-11
US20230250453A1 (en) 2023-08-10
CA3173889A1 (en) 2021-11-11
JP2023525007A (ja) 2023-06-14
US20230250454A1 (en) 2023-08-10

Similar Documents

Publication Publication Date Title
US20230203540A1 (en) Methods and compositions for nuclease-mediated targeted integration of transgenes into mammalian liver cells
JP7108307B2 (ja) 遺伝子編集によるヒトジストロフィン遺伝子の修正用の治療標的および使用方法
KR102544051B1 (ko) 인간화된 ttr 유전자좌를 포함하는 비인간 동물 및 사용 방법
US7985739B2 (en) Enhanced sleeping beauty transposon system and methods for using the same
JP2024023294A (ja) 遺伝子編集のためのcpf1関連方法及び組成物
WO2017136520A1 (en) Mitochondrial genome editing and regulation
US20230250454A1 (en) Transposition-based therapies
KR20090031938A (ko) 방향성 진화로 촉매 작용을 최적화시킨 키메라 징크 핑거 리컴비나제
WO2005081632A2 (en) Enzymes, cells and methods for site specific recombination at asymmetric sites
KR20210125560A (ko) 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용한 질환-관련 유전자의 스플라이스 수용체 부위 파괴
JP2023522788A (ja) 標的化されたゲノム組込みによってデュシェンヌ型筋ジストロフィーを矯正するためのcrispr/cas9療法
CN113874510A (zh) 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法
US11622547B2 (en) Genetically modified mouse that expresses human albumin
EP4349979A1 (en) Engineered cas12i nuclease, effector protein and use thereof
JP2022528722A (ja) 改善された遺伝子編集のための組成物及び方法
RU2784927C1 (ru) Отличные от человека животные, включающие в себя гуманизированный ttr локус, и способы применения
KR20230125806A (ko) 선천성 근이영양증의 치료를 위한 치료용 lama2 페이로드

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination