CN109153994A - 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物 - Google Patents

用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物 Download PDF

Info

Publication number
CN109153994A
CN109153994A CN201780029929.9A CN201780029929A CN109153994A CN 109153994 A CN109153994 A CN 109153994A CN 201780029929 A CN201780029929 A CN 201780029929A CN 109153994 A CN109153994 A CN 109153994A
Authority
CN
China
Prior art keywords
nucleic acid
nucleotide
domain
molecule
grna molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780029929.9A
Other languages
English (en)
Inventor
J·L·戈里
L·A·巴雷拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eddie Tasmania Pharmaceutical Co
Editas Medicine Inc
Original Assignee
Eddie Tasmania Pharmaceutical Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eddie Tasmania Pharmaceutical Co filed Critical Eddie Tasmania Pharmaceutical Co
Priority to CN202311860300.2A priority Critical patent/CN118127006A/zh
Priority to CN202311860310.6A priority patent/CN117802102A/zh
Priority to CN202311860322.9A priority patent/CN117821458A/zh
Publication of CN109153994A publication Critical patent/CN109153994A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/713Double-stranded nucleic acids or oligonucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/06Antianaemics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3222'-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Hematology (AREA)
  • Epidemiology (AREA)
  • Diabetes (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)

Abstract

披露了用于治疗β血红蛋白病的CRISPR/CAS相关组合物和方法。

Description

用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
相关申请的引用
本申请要求2016年3月14日提交的美国临时申请号62/308,190和2017年2月8日提交的美国临时申请号62/456,615的权益,将其各自内容通过引用以其全文结合在此。
序列表
本申请含有以ASCII格式经由EFS-Web提交的序列表,并且通过引用以其全文结合在此。在2017年3月14日创建的所述ASCII副本被命名为8009WO00_SequenceListing.txt,并且大小为335KB。
技术领域
本发明涉及用于编辑靶核酸序列或调控靶核酸序列表达的CRISPR/Cas相关方法和组分,及其与包括镰状细胞病和β-地中海贫血的β-血红蛋白病的结合应用。
背景技术
血红蛋白(Hb)将氧气从肺部携带到红细胞或红血细胞(RBC)中的组织。在胚胎发育期间和出生后不久,血红蛋白以胎儿血红蛋白(HbF)的形式存在,胎儿血红蛋白是由两个α-珠蛋白链和两个γ-珠蛋白链组成的四聚体蛋白质。HbF在很大程度上被成人血红蛋白(HbA)替换,成人血红蛋白是一种四聚体蛋白质,其中HbF的γ-珠蛋白链通过称为珠蛋白转换的过程被β-珠蛋白链替换。HbF在携带氧气方面比HbA更有效。普通成人的总血红蛋白小于1%的HbF(Thein 2009)。α-血红蛋白基因位于16号染色体上,而β-血红蛋白基因(HBB)、γ(γA)-珠蛋白链(HBG1,也称为γ珠蛋白A)和Gγ(γG)-珠蛋白链(HBG2,也称为γ珠蛋白G)位于珠蛋白基因簇内的11号染色体上(即,珠蛋白基因座)。
HBB的突变可引起血红蛋白障碍(即,血红蛋白病),包括镰状细胞病(SCD)和β-地中海贫血(β-Thal)。美国大约93,000人被诊断患有血红蛋白病。全球每年有300,000儿童出生患有血红蛋白病(Angastiniotis 1998)。因为这些病症与HBB突变有关,所以他们的症状典型地直到珠蛋白从HbF转换为HbA后才表现。
SCD是美国最常见的遗传性血液病,影响大约80,000人(Brousseau 2010)。SCD在非洲血统的人中最常见,SCD的流行率为500人中有1人。在非洲,SCD的流行率为1500万(Aliyu,2008)。SCD在印度人,沙特阿拉伯人和地中海人后裔中也更常见。在西班牙裔美国人后裔中,镰状细胞病的流行率为1000人中有1人(Lewis2014)。
SCD由HBB基因中的单个纯合突变引起,c.17A>T(HbS突变)。镰状突变是HBB上的点突变(GAG→GTG),其导致缬氨酸取代外显子1中氨基酸位置6的谷氨酸。β-血红蛋白链位置6的缬氨酸是疏水性的,并且当β-珠蛋白不与氧气结合时,引起β-珠蛋白构象的变化。这种构象变化引起HbS蛋白在没有氧的情况下聚合,导致RBC变形(即,镰状)。SCD以常染色体隐性方式遗传,因此只有具有两个HbS等位基因的患者才患有所述疾病。杂合的受试者具有镰状细胞性状,如果他们严重脱水或缺氧,可能患有贫血和/或痛性危象。
镰状形状的RBC引起多种症状,包括贫血、镰状细胞危象、血管阻塞性危象,再生障碍性危象和急性胸部综合征。镰状形状的RBC比野生型RBC弹性小,因此不能容易地通过毛细血管床并导致阻塞和缺血(即,血管阻塞)。当镰状细胞阻塞器官毛细血管床中的血流导致疼痛、缺血和坏死时,就会发生血管阻塞性危象。这些发作典型地持续5天至7天。脾脏在清除功能失调的RBC中起作用,因此典型地在儿童早期期间扩大并且频繁发生血管阻塞性危象。到儿童期结束时,SCD患者的脾经常梗塞,导致自体脾切除。溶血是SCD的一个恒定特征并引起贫血。镰状细胞在循环中存活10天至20天,而健康的RBC存活90天至120天。必要时输血SCD受试者以维持足够的血红蛋白水平。频繁的输血使受试者有感染HIV、乙型肝炎、和丙型肝炎的风险。受试者还可能患有急性胸部危象和四肢、终末器官、和中枢神经系统的梗塞。
患有SCD的受试者的生命期望降低。通过对危象和贫血进行认真的,终身的管理,SCD患者的预后正在稳定地改进。在2001年,患有镰状细胞病的受试者的平均生命期望是50岁中后期。目前对SCD的治疗涉及危象期间的水合和疼痛管理,以及根据需要进行输血以校正贫血。
地中海贫血(例如,β-Thal、δ-Thal、和β/δ-Thal)引起慢性贫血。估计β-Thal影响全球大约100,000人中有1人。它在某些群体中的流行率较高,包括欧洲后裔的群体,其流行率大约为10,000人中有1人。除非通过终身输血和螯合疗法治疗,否则重型β-Thal是疾病的更严重形式,是危及生命的。在美国,大约有3,000名患有重型β-Thal的受试者。中间型β-Thal不需要输血,但可能引起生长延迟和显著的全身异常,并且频繁地需要终身螯合疗法。尽管HbA构成成人RBC中大多数血红蛋白,但大约3%的成人血红蛋白是HbA2形式,HbA变体是两个γ-珠蛋白链被两个δ(Δ)-珠蛋白链替换。δ-Thal与引起HBD表达损失的Δ血红蛋白基因(HBD)突变有关。HBD突变的共遗传可以通过将HbA2水平降低至正常范围来掩盖β-Thal(即,β/δ-Thal)的诊断(Bouva 2006)。β/δ-Thal通常由两个等位基因中HBB和HBD序列的缺失引起。在纯合的(δ°/δ°β°/β°)患者中,表达HBG,导致单独产生HbF。
与SCD一样,β-Thal是由HBB基因突变引起的。导致β-Thal的最常见的HBB突变是:c.-136C>G、c.92+1G>A、c.92+6T>C、c.93-21G>A、c.118C>T、c.316-106C>G、c.25_26delAA、c.27_28insG、c.92+5G>C、c.118C>T、c.135delC、c.315+1G>A、c.-78A>G、c.52A>T、c.59A>G、c.92+5G>C、c.124_127delTTCT、c.316-197C>T、c.-78A>G、c.52A>T、c.124_127delTTCT、c.316-197C>T、c.-138C>T、c.-79A>G、c.92+5G>C、c.75T>A、c.316-2A>G、和c.316-2A>C。与β-Thal有关的这些和其他突变引起β-珠蛋白链的突变或缺失,这导致正常Hbα-血红蛋白与β-血红蛋白比率的破坏。过量的α-珠蛋白链在骨髓中的红系前体中沉淀。
在重型β-Thal中,HBB的两个等位基因都含有无意义突变、移码突变、或剪接突变,导致完全不存在β-珠蛋白产生(表示为β°/β°)。重型β-Thal导致β-珠蛋白链的严重减少,导致红系细胞中α-珠蛋白链的显著沉淀和更严重的贫血。
中间型β-Thal由HBB的5'或3'非翻译区域突变、启动子区域突变、或HBB多聚腺苷酸化信号或HBB基因内的剪接突变导致。患者基因型表示为β°/β+或β++。β°代表不存在β-珠蛋白链的表达;β+代表功能失调但存在的β-珠蛋白链。表型表达因患者而异。由于存在一些β-珠蛋白的产生,中间型β-Thal导致红系前体中α-珠蛋白链的沉淀较少,并且与重型β-Thal相比导致较少的严重贫血。然而,继发于慢性贫血的红系谱系扩增有更显著的后果。
具有重型β-Thal的受试者存在于6个月和2岁之间,并且患有未能茁壮成长、发热、肝脾大和腹泻。足够的治疗包括定期输血。重型β-Thal疗法还包括脾切除术和羟基脲治疗。如果患者定期输血,他们将正常发育,直到第二个十年开始。那时,他们需要螯合疗法(除了继续输血)以防止铁超过载的并发症。铁过载可能表现为生长延迟或性成熟延迟。在成人期,不充分的螯合疗法可能导致心肌病、心律失常、肝纤维化和/或肝硬化、糖尿病、甲状腺和甲状旁腺异常、血栓症和骨质疏松症。频繁的输血还使受试者有感染HIV、乙型肝炎、和丙型肝炎的风险。
中间型β-Thal受试者通常存在于2岁至6岁之间。他们通常不需要输血。然而,由于红系谱系的慢性肥大而发生骨异常以补偿慢性贫血。由于骨质疏松症,受试者可能有长骨骨折。髓外红细胞生成是常见的并且导致脾,肝和淋巴结的扩大。它还可能引起脊髓压缩和神经系统问题。受试者还患有下肢溃疡并且血栓形成事件的风险增加,包括中风、肺栓塞和深静脉血栓形成。中间型β-Thal的治疗包括脾切除术、叶酸补充、羟基脲疗法和髓外肿块的放射治疗。螯合疗法用于发生铁过载的受试者。
β-Thal患者的生命期望通常会降低。患有重型β-Thal且未接收输血疗法的受试者通常在其第二或第三个十年死亡。接收常规输血和足够螯合疗法的重型β-Thal受试者可以活到第五个十年甚至更长时间。继发于铁毒性的心脏衰竭是由于铁毒性导致的重型β-Thal受试者死亡的主要原因。
目前正在发育SCD和β-Thal的各种新治疗。目前正在临床试验中研究经由基因疗法递送校正的HBB基因。然而,这种途径的长期功效和安全性尚不清楚。已经证明用来自HLA匹配的异基因干细胞供体的造血干细胞移植治疗SCD和β-Thal,但是所述方法涉及风险,包括与切除疗法有关的风险,以准备移植受试者和移植后移植物抗宿主疾病的风险。另外,通常无法识别匹配的异基因供体。因此,需要改进的管理这些和其他血红蛋白病的方法。
发明内容
本文在某些实施例中提供了使用基因组编辑系统(例如,CRISPR/Cas介导的基因组编辑系统)增加受试者或细胞中一种或多种γ-珠蛋白基因(例如,HBG1、HBG2、或HBG1和HBG2)的表达(即,转录活性)的方法。在某些实施例中,这些方法可利用任何修复机制来改变(例如,删除、破坏或修饰)一种或多种γ-珠蛋白基因调控元件的全部或部分。在某些实施例中,这些方法可利用DNA修复机制,例如,NHEJ或HDR来删除或破坏一种或多种γ-珠蛋白基因调控元件(例如,沉默子,增强子,启动子或隔离子)。在某些实施例中,这些方法利用DNA修复机制,例如,HDR,来改变,包括突变、插入、删除或破坏γ-珠蛋白基因调控元件中的一个或多个核苷酸的序列(例如,沉默子、增强子、启动子、或隔离子)。在某些实施例中,这些方法利用一种或多种DNA修复机制的组合,例如,NHEJ和HDR。在某些实施例中,这些方法导致与天然存在的HPFH变体有关的γ-珠蛋白调控元件的突变或变异,包括,例如,HBG113bp del c.-114至-102、4bp del c.-225至-222、c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A、或HBG2 13bp del c.-114至-102、c.-109G>T、c.-114C>A、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G。
本文在某些实施例中提供了使用CRISPR/Cas介导的基因组编辑来治疗有需要的受试者中的β-血红蛋白病以增加一种或多种γ-珠蛋白基因(例如,HBG1、HBG2、或HBG1和HBG2)的表达(即,转录活性)的方法。在某些实施例中,这些方法利用DNA修复机制,例如,NHEJ或HDR来删除或破坏一种或多种γ-珠蛋白基因调控元件(例如,沉默子,增强子,启动子或隔离子)。在某些实施例中,这些方法利用DNA修复机制,例如,HDR,来改变,包括突变、插入、删除或破坏γ-珠蛋白基因调控元件中的一个或多个核苷酸的序列(例如,沉默子、增强子、启动子、或隔离子)。在某些实施例中,这些方法利用一种或多种DNA修复机制的组合,例如,NHEJ和HDR。在某些实施例中,这些方法导致与天然存在的HPFH变体有关的γ-珠蛋白调控元件的突变或变异,包括,例如HBG1 13bp del c.-114至-102、4bp del c.-225至-222、c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A、或HBG2 13bp delc.-114至-102、c.-109G>T、c.-114C>A、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G。在某些实施例中,β-血红蛋白病是SCD或β-Thal。
本文在某些实施例中提供了用于CRISPR/Cas介导的增加一种或多种γ-珠蛋白基因(例如HBG1、HBG2、或HBG1和HBG2)的表达(即,转录活性)的方法的gRNA。在某些实施例中,这些gRNA包含靶向结构域,所述结构域包含SEQ ID NO:251-901所示的核苷酸序列。在某些实施例中,这些gRNA进一步包含第一互补结构域、第二互补结构域、连接结构域、5'延伸结构域,近端结构域或尾部结构域中的一个或多个。在另一个实施例中,gRNA是模块化gRNA。在其他实施例中,所述gRNA是单分子(或嵌合的)gRNA。
附图说明
图1A-1I是若干示例性gRNA的表示。
图1A描绘了部分来源于(或部分地在序列上建模)化脓链球菌(S.pyogenes)呈双链体结构的模块化gRNA分子(按照出现次序分别是SEQ ID NO:39和40);
图1B描绘了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:41);
图1C描绘了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:42);
图1D描绘了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:43);
图1E描绘了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:44);
图1F描绘了部分来源于嗜热链球菌(S.thermophilus)呈双链体结构的模块化gRNA分子(按照出现次序分别是SEQ ID NO:45和46);
图1G描绘了化脓链球菌和嗜热链球菌的模块化gRNA分子(按照出现次序分别是SEQ ID NO:39、45、47和46)的比对。
图1H-1I描绘了单分子gRNA分子的另外示例性结构。
图1H示出了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:42)的示例性结构。
图1I示出了部分来源于金黄色葡萄球菌(S.aureus)呈双链体结构的单分子gRNA分子(SEQ ID NO:38)的示例性结构。
图2A-2G描绘了Cas9序列的比对(Chylinski 2013)。N-末端RuvC样结构域加框并且以“Y”指示。其他两个RuvC样结构域加框并且以“B”指示。HNH样结构域被加框并以“G”指示。Sm:变形链球菌(SEQ ID NO:1)、Sp:化脓链球菌(SEQ ID NO:2)、St:嗜热链球菌(SEQ IDNO:4)、和Li:无害利斯特菌(SEQ ID NO:5)。“基序”(SEQ ID NO:14)是基于四个序列的共有序列。所有四个序列中保守的残基用单字母氨基酸缩写指示;“*”指示在四个序列的任一者的相应位置中发现的任何氨基酸;并且“-”指示不存在。
图3A-3B示出了来自披露于Chylinski 2013中的Cas9分子(SEQ ID NO:52-95、120-123)的N-末端RuvC样结构域的比对。图3B的最后一行识别了4个高度保守的残基。
图4A-4B示出了来自披露于Chylinski 2013中的除去序列异常值的Cas9分子(SEQID NO:52-123)的N-末端RuvC样结构域的比对。图4B的最后一行识别了3个高度保守的残基。
图5A-5C示出了来自披露于Chylinski 2013中的Cas9分子(SEQ ID NO:124-198)的HNH样结构域的比对。图5C的最后一行识别了保守残基。
图6A-6B示出了来自披露于Chylinski 2013中的除去序列异常值的Cas9分子(SEQID NO:124-141、148、149、151-153、162、163、166-174、177-187、194-198)的HNH样结构域的比对。图6B的最后一行识别了3个高度保守的残基。
图7示出了使用示例性gRNA序列(SEQ ID NO:42)的gRNA结构域命名法。
图8A和8B提供了化脓链球菌Cas9的结构域组织的示意性表示。图8A参照Cas9的两种叶片(识别(REC)叶片和核酸酶(NUC)叶片)示出了Cas9结构域的组织,包括氨基酸位置。图8B示出了83个Cas9直向同源物中每个结构域的百分比同源性。
图9A至9C提供了在珠蛋白基因座的背景下HBG1和HBG2基因的示意图。指示了编码序列(CDS)、mRNA区域和基因。(A)示出了靶向gRNA设计的区域(虚线和括号,指示HBG1和HBG2基因的近端遗传区域)。(B)指示核心启动子元件。(C)指示转录激活因子和转录阻遏蛋白可以结合以调控基因表达的基因调控区域中的基序。注意基序和靶向gRNA设计的基因组区域之间的重叠。指示了引起HPFH的HBG1和HBG2基因调控区域中的缺失的实例,以及与每种有关的%HbF。
图10A至10F示出了来自gRNA筛选的数据,所述数据用于在人类K562红白血病细胞中掺入13bp的del c.-114至-102HPFH突变。(A)通过T7E1核酸内切酶测定分析确定的用编码化脓链球菌特异性gRNA的DNA和编码化脓链球菌Cas9的质粒DNA电穿孔后从K562细胞提取的基因组DNA扩增的HBG1和HBG2基因座特异性PCR产物的基因编辑。(B)通过用编码指示的gRNA和Cas9质粒的DNA电穿孔后从K562细胞中提取的基因组DNA中的HBG1基因座扩增的PCR产物的DNA序列分析确定的基因编辑。(C)通过用编码指示的gRNA和Cas9质粒的DNA电穿孔后从K562细胞中提取的基因组DNA中的HBG2基因座扩增的PCR产物的DNA序列分析确定的基因编辑。对于(B)和(C),缺失的编辑事件(插入,缺失)和亚型的类型(13nt靶向部分[12ntHPFH]或完全[13nt至26nt HPFH]缺失,其他序列缺失[其他缺失])由不同的阴影/图案条指示。(D)-(F)HBG1基因调控区域缺失的实例。
图11A至11C描绘了电穿孔后人类脐血(CB)和人类成人CD34+细胞中基因编辑的结果,其中复合的RNP体外转录的化脓链球菌gRNA靶向特异性的13nt序列进行缺失(HBGgRNAs Sp35(包含SEQ ID NO:339)和Sp37(包含SEQ ID NO:333))。图11A描绘了从用指示的RNP或供体匹配的未处理的对照细胞(n=3CB CD34+细胞,3个独立的实验)处理的CB CD34+细胞提取的gDNA扩增的HBG1和HBG2特异性PCR产物的T7E1分析检测到的indel百分比。示出的数据代表平均值,误差条相应于三个独立供体/实验的标准差。图11B描绘了从用指示的RNP或供体匹配的未处理的对照细胞(n=3CB CD34+细胞,n=3mPB CD34+细胞,3个独立的实验)处理的CB CD34+细胞或成人CD34+细胞提取的gDNA扩增的HBG2特异性PCR产物的T7E1分析检测到的indel百分比。示出的数据代表平均值,误差条相应于三个独立供体/实验的标准差。图11C(顶部组)描绘了通过T7E1分析对用HBG Sp35 RNP或HBG Sp37 RNP+/-ssODN1(SEQ ID NO:906)或PhTx ssODN1(SEQ ID NO:909)电穿孔的人类CB CD34+细胞中提取的gDNA扩增的HBG2PCR产物进行检测的编辑。图11C(左下部组)示出了通过Sanger DNA序列分析从用HBG Sp37 RNP和ssODN1和PhTx ssODN1编辑的细胞的gDNA确定的基因编辑水平。图11C(右下部组)示出了从左下部组中存在的数据中检测到的总缺失中检测到的特定类型的缺失。
图12A至12C描绘了K562红白血病细胞中HBG1和HBG2的基因编辑。图12A描绘了通过T7E1分析检测到的NHEJ(indel),其中HBG1和HBG2 PCR产物在核转染后三天从用K562细胞提取的gDNA扩增,其中RNP与指示的gRNA复合。图12B描绘了从HBG1基因座扩增的PCR产物的Sanger DNA序列分析,所述PCR产物用于与靶向13nt HPFH序列(Sp35(包含SEQ ID NO:339)、Sp36(包含SEQ ID NO:338)、Sp37(包含SEQ ID NO:333)的gRNA复合的Cas9蛋白进行核转染的细胞。图12C描绘了从HBG2基因座扩增的PCR产物的Sanger DNA序列分析,所述PCR产物用于与靶向13bp HPFH序列(Sp35、Sp36、Sp37)的gRNA复合的Cas9蛋白进行核转染的细胞。对于图12B和图12C将缺失细分为含有13bp靶向缺失(HPFH缺失、18nt-26nt缺失、>26nt缺失)和不含有13bp缺失(<12nt缺失、其他缺失、插入)的缺失。
图13描绘了用编码13bp缺失的HBG Sp37 RNP+/-ssODN电穿孔mPB CD34+细胞后成人人类动员的外周血(mPB)CD34+细胞中HBG的基因编辑和RNP处理的细胞的红系后裔中胎儿血红蛋白的诱导。图13A描绘了从用RNP或供体匹配的未处理对照细胞处理的mPB CD34+细胞提取的gDNA扩增的HBG2 PCR产物的T7E1分析检测到的编辑百分比。图13B描绘了在与RNP处理的和未处理的供体匹配的对照mPB CD34+细胞分化的第7天成红细胞中HBG mRNA表达的倍数变化。将mRNA水平归一化为GAPDH并校准至在相应的分化天数中未处理对照中检测到的水平。
图14描绘了来自相同供体的RNP处理和未处理的mPB CD34+细胞的离体分化潜能。图14A示出了造血骨髓/红系集落形成细胞(CFC)潜能,其中指示了集落的数量和亚型(GEMM:粒细胞-红系-单核细胞-巨噬细胞集落、E:红系集落、GM:粒细胞-巨噬细胞集落、M:巨噬细胞集落、G:粒细胞集落)。图14B描绘了在指示的时间点和指示的样品通过流式细胞术分析确定的红系分化时间过程中表达的血型糖蛋白A的百分比。
具体实施方式
定义
如本文所用的“结构域”是用于描述蛋白质或核酸的区段。除非另外指明,结构域不需要具有任何特定功能特性。
如下进行两个序列之间的同源性或序列一致性(这些术语在本文可互换地使用)的计算。将这些序列进行比对用于最优比较的目的(例如,用于最优比对,可以在第一和第二氨基酸或核酸序列中的一个或两个中引入空位,并且出于比较的目的,可以不考虑非同源序列)。使用具有Blossum 62打分矩阵(其中空位罚分为12,空位延伸罚分为4,并且移码空位罚分为5)的GCG软件包中的GAP程序,将最优比对确定为最佳评分。然后比较相应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与在第二序列中的相应位置相同的氨基酸残基或核苷酸占据时,则所述分子在那个位置是一致的。两个序列之间的百分比一致性是由所述序列共享的相同位置的数量的函数。
如本文所用的“多肽”是指具有少于100个氨基酸残基的氨基酸的聚合物。在实施例中,它具有少于50、20、或10个氨基酸残基。
如本文所用的“alt-HDR”、“替代性同源定向修复”或“替代性HDR”是指使用同源核酸(例如,内源性同源序列(例如姐妹染色单体)或外源核酸(例如模板核酸))修复DNA损伤的过程。alt-HDR与典型HDR的不同之处在于,所述过程利用与典型HDR不同的途径,并且可以被典型HDR介体RAD51和BRCA2抑制。此外,alt-HDR使用单链或有切口的同源核酸来修复断裂。
如本文所用的“典型HDR”或典型同源定向修复是指使用同源核酸(例如,内源性同源序列(例如,姐妹染色单体)或外源核酸(例如,模板核酸))修复DNA损伤的过程。当在双链断裂处已有显著切除时,典型HDR通常起作用,形成DNA的至少一个单链部分。在正常细胞中,HDR通常涉及一系列步骤,诸如断裂的识别、断裂的稳定、切除、单链DNA的稳定、DNA交叉中间体的形成、交叉中间体的拆分以及连接。所述过程需要RAD51和BRCA2,并且同源核酸通常是双链的。
除非另有说明,如本文所用的术语“HDR”涵盖典型HDR和alt-HDR两者。
如本文所用的“非同源末端连接”或“NHEJ”是指连接介导的修复和/或非模板介导的修复,包括典型NHEJ(cNHEJ)、替代性NHEJ(altNHEJ)、微同源性介导的末端连接(MMEJ)、单链退火(SSA)以及合成依赖性微同源性介导的末端连接(SD-MMEJ)。
如本文所用的“参考分子”是指经修饰或候选分子与其作比较的分子。例如,参考Cas9分子是指经修饰或候选Cas9分子与其作比较的Cas9分子。同样地,参考gRNA是指经修饰或候选gRNA分子与其作比较的gRNA分子。经修饰或候选分子可以基于序列(例如,经修饰或候选分子可以与参考分子具有X%序列一致性或同源性)、或活性(例如,经修饰或候选分子可以具有参考分子的X%的活性)与参考分子进行比较。例如,在参考分子是Cas9分子的情况下,经修饰或候选分子可以表征为具有不多于参考Cas9分子的核酸酶活性的10%。参考Cas9分子的实例包括天然存在的未经修饰的Cas9分子,例如来自化脓链球菌、金黄色葡萄球菌、嗜热链球菌或脑膜炎奈瑟氏菌的天然存在的Cas9分子。在某些实施例中,参考Cas9分子是具有和与其进行比较的经修饰或候选Cas9分子最接近序列一致性或同源性的天然存在的Cas9分子。在某些实施例中,参考Cas9分子是具有天然存在或已知的序列的亲本分子,其上已经进行突变以得到经修饰或候选Cas9分子。
术语“基因组编辑系统”是指具有RNA指导的DNA编辑活性的任何系统。本披露内容的基因组编辑系统包括至少两种适应天然存在的CRISPR系统的组分:指导RNA(gRNA)和RNA指导的核酸酶。这两种组分形成复合物,所述复合物能够与特定核酸序列结合并在所述核酸序列中或其周围编辑DNA,例如通过制备一条或多条单链断裂(SSB或切口)、双链断裂(DSB)和/或点突变。
如本文关于分子的修饰所用的“替换”或“替换的”不需要方法限制,但仅表明替换实体是存在的。
如本文所用的“受试者”可以意指人或人类、小鼠、或非人类灵长动物。
如本文所使用的,“治疗(treat、treating和treatment)”意指治疗受试者中(例如,在人类中)的疾病,包括(a)抑制所述疾病,即抑制或防止其发育或进展;(b)缓解所述疾病,即,导致疾病状态的消退;(c)缓解一种或多种疾病症状;以及(d)治愈所述疾病。例如,“治疗”SCD或β-Thal可以指除了其他可能性之外,防止SCD或β-Thal的发育或进展,缓解SCD或β-Thal的一种或多种症状(例如,贫血、镰状细胞危象、血管阻塞性危象),或治愈SCD或β-Thal。
如本文所用的“防止”(prevent、preventing和prevention)意指预防受试者(例如,人类)的疾病,包括(a)避免或排除疾病;(b)影响对疾病的诱因;以及(c)防止或延迟疾病的至少一种症状的发作。
如本文所用的在氨基酸序列的语境下的“X”是指任何氨基酸(例如,二十种天然氨基酸中的任何一种),除非另外说明。
如本文所用的“调控区域”是指包含一种或多种控制或调控基因表达的调控元件(例如,沉默子,增强子,启动子或隔离子)的DNA序列。例如,γ-珠蛋白基因调控区域包含一个或多个控制或调控γ-珠蛋白基因表达的调控元件。在某些实施例中,调控区域与控制的或调控的基因相邻。例如,γ-珠蛋白基因调控区域可以与γ-珠蛋白基因相邻或有关。在其他实施例中,调控区域可以与另一基因相邻或有关,其表达可以导致控制的或调控的基因的上调或下调。例如,γ-珠蛋白基因调控区域可以与表达γ-珠蛋白基因表达的阻遏物的基因相邻。对于HBG1,调控区域至少包含SEQ ID NO:902中的核苷酸1-2990。对于HBG2,调控区域至少包含SEQ ID NO:903中的核苷酸1-2914。
如本文所用,“HBG靶位置”是指HBG1或HBG2调控区域中的位置(分别为“HBG1靶位置”和“HBG2靶位置”),其含有靶位点(例如,待删除或突变的靶序列),当被改变的(例如,通过引入DNA修复机制介导的(例如,NHEJ或HDR介导的)破坏或缺失)插入或缺失,通过DNA修复机制介导的(例如,HDR介导的)序列改变进行修饰))导致HBG1或HBG2基因产物(即,γ-珠蛋白)的表达增加(例如,去阻遏)。在某些实施例中,HBG靶位置在与HBG1或HBG2相邻的调控区域中的HBG1或HBG2调控元件(例如,沉默子,增强子,启动子或隔离子)中。在某些这些实施例中,HBG靶位置的改变导致阻遏物结合降低,即,去阻遏,导致HBG1或HBG2的表达增加。在其他实施例中,HBG靶位置在HBG1或HBG2以外的基因的调控元件中,其编码参与控制HBG1或HBG2基因表达的基因产物(例如,HBG1或HBG2基因表达的阻遏物)。在某些实施例中,HBG靶位置是HBG1或HBG2调控区域的区域,其具有最大密度的结合基序,所述基序参与HBG1或HBG2表达的调控。在某些实施例中,本文提供的方法同时或顺序地靶向多个HBG靶位置。
如本文所用的“靶序列”是指包含HBG靶位置的核酸序列。
如本文所用的“Cas9分子”或“Cas9多肽”分别是指可以与gRNA分子相互作用,并且与gRNA分子一起定位至包含靶结构域(并且在某些实施例中,是PAM序列)的位点的分子或多肽。Cas9分子和Cas9多肽包括天然存在的Cas9分子和Cas9多肽,以及工程化的、改变的或经修饰的Cas9分子或Cas9多肽,它们与参考序列(例如最相似的天然存在的Cas9分子)相差例如至少一个氨基酸残基。
概述
本文提供了使用基因组编辑系统(例如,CRISPR/Cas介导的基因组编辑)增加一种或多种γ-珠蛋白基因(例如,HBG1、HBG2、或HBG1和HBG2)的表达(即,转录活性)的方法。这些方法利用基因组编辑系统(例如,CRISPR/Cas介导的基因组编辑)来改变(例如,缺失、破坏或修饰)一个或多个γ-珠蛋白基因调控区域以增加(例如,去阻遏、增强)γ-珠蛋白基因表达。在某些这些实施例中,所述方法改变与γ-珠蛋白靶向的基因有关的一种或多种调控元件(例如,沉默子,增强子,启动子或隔离子)。在其他实施例中,所述方法改变除靶向的γ-珠蛋白基因之外的基因中的一种或多种调控元件(例如,编码γ-珠蛋白基因阻遏物的基因)。在某些实施例中,基因组编辑系统(例如,CRISPR/Cas介导的基因组编辑)用于改变HBG1、HBG2、或HBG1和HBG2两者的调控元件(例如,沉默子、增强子、启动子或隔离子)。在某些实施例中,基因组编辑系统(例如,CRISPR/Cas介导的基因组编辑)导致与天然存在的HPFH变体有关的γ-珠蛋白调控元件的突变或变异,包括,例如,HBG1 13bp del c.-114至-102、4bp del c.-225至-222、c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A、或HBG2 13bp del c.-114至-102、c.-109G>T、c.-114C>A、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G。
在一些实施例中,使用本文所述的基因组编辑系统(例如,CRISPR/Cas介导的基因组编辑)的方法可利用任何修复机制来改变(例如,缺失、破坏、或修饰)一种或多种γ-珠蛋白基因调控元件的全部或部分。在某些实施例中,所述方法利用DNA修复机制介导的(例如,NHEJ或HDR介导的)插入或缺失来破坏一种或多种γ-珠蛋白基因调控元件的全部或部分。例如,所述方法可以利用DNA修复机制(例如,NHEJ或HDR)来缺失γ-珠蛋白基因负调控元件(例如,沉默子)的全部或部分,导致负调控元件的失活(例如,沉默子和阻遏物之间的结合丧失)和γ-珠蛋白基因的表达增加。在其他实施例中,所述方法利用DNA修复机制介导的(例如,NHEJ或HDR介导的)插入或缺失来破坏与编码γ-珠蛋白基因阻遏物的基因有关的一种或多种调控元件的全部或部分。例如,所述方法可利用DNA修复机制(例如,NHEJ或HDR)来缺失γ-珠蛋白阻遏物基因的正调控元件(例如,启动子)的全部或部分,导致阻遏物的表达降低、阻遏物与γ-珠蛋白基因沉默子的结合降低、γ-珠蛋白基因的表达增加。在其他实施例中,所述方法利用DNA修复机制(例如,HDR)来修饰一种或多种γ-珠蛋白基因调控元件的序列(例如,在对应于天然存在的HPFH突变的HBG1和/或HBG2调控元件或缺失全部或部分的HBG1和/或HBG2调控元件中插入突变)。在一些实施例中,所述方法可使用一种或多种DNA修复机制的组合,例如,NHEJ和HDR。在某些实施例中,所述方法在受试者中产生HbF的持久性。本文还提供了用于这些方法的组合物(例如,gRNA、Cas9多肽和分子、模板核酸、载体)和试剂盒。
从γ-珠蛋白基因(即,HBG1,HBG2)的表达到HBB的表达(即,珠蛋白转换)的转变与β-血红蛋白病(包括SCD和β-Thal)的症状的发作有关。因此,在某些实施例中,本文提供了用于治疗或防止包括SCD和β-Thal的β-血红蛋白病的方法、组合物、和试剂盒,其使用CRISPR/Cas介导的基因组编辑来增加一种或多种γ-珠蛋白基因的表达(例如,HBG1、HBG2、或HBG1和HBG2)。在某些这些实施例中,所述方法改变与γ-珠蛋白靶向的基因有关的一种或多种调控元件(例如,沉默子,增强子,启动子或隔离子)。在其他实施例中,所述方法改变除靶向的γ-珠蛋白基因之外的基因中的一种或多种调控元件(例如,编码γ-珠蛋白基因阻遏物的基因)。在某些实施例中,CRISPR/Cas介导的基因组编辑用于改变HBG1、HBG2、或HBG1和HBG2两者的调控元件(例如,沉默子、增强子、启动子或隔离子)。在一些实施例中,所述方法利用DNA修复机制介导的(例如,NHEJ或HDR介导的)插入或缺失来破坏一种或多种γ-珠蛋白基因调控元件的全部或部分。例如,所述方法可以利用DNA修复机制(例如,NHEJ或HDR)来缺失γ-珠蛋白基因负调控元件(例如,沉默子)的全部或部分,导致负调控元件的失活(例如,沉默子和阻遏物之间的结合丧失)和γ-珠蛋白基因的表达增加。在其他实施例中,所述方法利用DNA修复机制介导的(例如,NHEJ或HDR介导的)插入或缺失来破坏与编码γ-珠蛋白基因阻遏物的基因有关的一种或多种调控元件的全部或部分。例如,所述方法可利用DNA修复机制(例如,NHEJ或HDR)来缺失γ-珠蛋白阻遏物基因的正调控元件(例如,启动子)的全部或部分,导致阻遏物的表达降低、阻遏物与γ-珠蛋白基因沉默子的结合降低、γ-珠蛋白基因的表达增加。在其他实施例中,所述方法利用DNA修复机制(例如,HDR)来修饰一种或多种γ-珠蛋白基因调控元件的序列(例如,在对应于天然存在的HPFH突变的HBG1和/或HBG2调控元件或缺失全部或部分的HBG1和/或HBG2调控元件中插入突变)。在一些实施例中,所述方法可使用一种或多种DNA修复机制的组合(例如,NHEJ和HDR)。在某些实施例中,所述方法在受试者中产生HbF的持久性。
在某些实施例中,使用本文提供的方法增加的一种或多种γ-珠蛋白基因(例如,HBG1、HBG2)的表达导致优先形成HbF而不是HbA和/或增加的HbF水平作为总血红蛋白的百分比。因此,本文进一步提供了使用CRISPR/Cas介导的基因组编辑来增加总HbF水平,以总血红蛋白水平的百分比增加HbF水平,或通过增加一个或多个γ-珠蛋白基因(例如,HBG1,HBG2或HBG1和HBG2)的表达来增加受试者中HbF与HbA的比率的方法。类似地,在某些实施例中,一种或多种γ-珠蛋白基因的表达增加导致HbF相对于HbS的优先形成和/或降低的HbS百分比作为总血红蛋白的百分比。因此,本文进一步提供了使用CRISPR/Cas介导的基因组编辑来降低总HbS水平、以总血红蛋白水平的百分比降低HbS水平、或通过增加一个或多个γ-珠蛋白基因(例如,HBG1、HBG2、或HBG1和HBG2)的表达来增加受试者中HbF与HbS的比率的方法。
本文在某些实施例中提供了用于本文披露的方法的gRNA。在某些实施例中,这些gRNA包含与HBG靶位置中或附近的靶结构域互补或部分互补的靶向结构域。在某些实施例中,靶向结构域包含SEQ ID NO:251-901之一所示的核苷酸序列、由其组成、或基本上由其组成。
基因组研究已经识别了几种调控珠蛋白转换的基因,包括BCL11A、Kruppel样因子1(KLF1)、MYB和β珠蛋白基因座内的基因。某些这些基因的突变可能导致抑制或不完全的珠蛋白转换,也称为遗传性胎儿血红蛋白持续存在症(HPFH)。HPFH突变可以是缺失的或非缺失的(例如,点突变)。患有HPFH的受试者展现出HbF的终身表达,即,他们不经历或仅经历部分珠蛋白转换,没有贫血症状。杂合的受试者展现出20%-40%的全细胞型HbF,并且共遗传导致β血红蛋白病的缓解(Thein 2009;Akinbami 2016)。血红蛋白病和HPFH的复合杂合子,例如,作为SCD和HPFH、β-Thal和HPFH、镰状细胞性状和HPFH、或Δ-β-Thal和HPFH的复合杂合子的受试者,相对于没有HPFH突变的受试者具有更轻度的疾病和症状。共遗传HPFH突变的HbS纯合子患者,例如,通过去阻遏HBG1或HBG2诱导HbF表达的突变,不会发育SCD症状或β-Thal症状(Steinberg等人,Disorders of Hemoglobin[血红蛋白障碍],剑桥大学出版社(Cambridge Univ.Press),2009年,第570页)。HPFH临床上是良性的(Chassanidis 2009)。
虽然HPFH的发生在全球人群中很稀有,但在血红蛋白病流行率较高的人群中更为常见,包括南欧、南美、和非洲后裔。在这些人群中,HPFH的流行率在1,000人中可以达到1-2人(Costa 2002;Ahern 1973)。从理论上讲,HPFH突变在这些人群中持续存在,因为他们改善了患有血红蛋白病的受试者的疾病。
最常见的天然存在的HPFH突变是β珠蛋白基因座内的缺失。缺失HPFH突变的常见实例包括法国HPFH(23kb缺失)、高加索HPFH(19kb缺失)、HPFH-1(84kb缺失)、HPFH-2(84kb缺失)、和HPFH-3(50kb缺失)。在具有这些突变的受试者中,β-珠蛋白合成减少,并且γ-珠蛋白合成第二次地增加。
其他HPFH突变位于γ-珠蛋白基因调控区域。一个这样的突变是13个核苷酸缺失(13个碱基对(bp)del c.-114至-102;CAATAGCCTTGAC del,基于HBG1/HBG2的反向互补序列)位于HBG1和HBG2基因的上游。所述缺失破坏了通常防止HBG1/HBG2表达的沉默子元件,并且所述缺失杂合的成人受试者展现出大约30%的HbF。另一个HPFH突变是4个核苷酸缺失(4个碱基对(bp)del c.-225至-222(AGCA del))。在HBG1和HBG2调控元件中发现的其他HPFH突变包括,例如,非缺失点突变(非del HPFH),例如c.-114C>T、c.-158C>T、c.-167C>T、和c.-175T>C。
与HBG1调控元件有关的非del HPFH突变包括,例如,c.-117G>A、c.-170G>A、c.-175T>G、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、和c.-499T>A。
与HBG2调控元件有关的非del HPFH突变包括,例如,c.-109G>T、c.-114C>A、c.-157C>T、c.-167C>A、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、和c.-567T>G。
HBG1和HBG2启动子区域的另外的多态性已在一组巴西SCD患者中识别,其校正HbF水平>5%(Barbosa 2010)。这些包括HBG2启动子中的c.-309A>G和c.-369C>G。
可以改变以重建HPFH突变的HBG1和HBG2启动子元件,包括,例如,红系Kruppel样因子(EKLF-2)和胎儿Kruppel样因子(FKLF)转录因子结合基序(CTCCACCCA)、CP1/CoupTFII结合基序(CCAATAGC)、GATA1结合基序(CTATCT、ATATCT)、或阶段选择元件(SSE)结合基序。可以改变以重建HPFH突变的HBG1和HBG2增强子元件包括,例如,SOX结合基序,例如SOX14、SOX2、或SOX1(CCAATAGCCTTGA)。
在本文提供的方法的某些实施例中,CRISPR/Cas介导的改变用于改变γ-珠蛋白基因调控区域中的一个调控元件或基序,例如,HBG1或HBG2调控区域中的沉默子序列、或启动子或与编码HBG1或HBG2阻遏物的基因有关的增强子序列。在其他实施例中,CRISPR/Cas介导的改变用于改变γ-珠蛋白基因调控区域中的两个或更多个(例如,三个、四个、或五个或更多个)调控元件或基序,例如,HBG1或HBG2沉默子序列和HBG1或HBG2增强子序列;HBG1或HBG2沉默子序列和与编码HBG1或HBG2阻遏物的基因有关的启动子或增强子序列;或HBG1或HBG2沉默子序列和与编码HBG1或HBG2阻遏物的基因有关的启动子或增强子序列。将多个变体引入单个基因的调控区域或将一个变体引入两个或更多个基因的调控区域中在本文中是指“复合”。因此,复合构成了(a)在相同一个细胞或多个细胞中一个基因调控区域的多于一个位置的修饰或(b)多于一个基因调控区域中一个位置的修饰。
在本文提供的方法的某些实施例中,CRISPR/Cas介导的一种或多种γ-珠蛋白基因调控元件的改变产生与天然存在的HPFH突变有关的相同或相似的表型。在某些实施例中,CRISPR/Cas介导的改变导致包含相应于天然存在的HPFH突变的γ-珠蛋白基因调控元件的改变。在其他实施例中,一种或多种γ-珠蛋白基因调控元件的改变导致在天然存在的HPFH突变(即,非天然存在的变体)中未观察到的改变。
在本文提供的方法的某些实施例中,CRISPR/Cas介导的一种或多种γ-珠蛋白基因调控元件的改变产生与天然存在的HPFH变体有关的γ-珠蛋白调控元件的突变或变异,包括,例如,HBG1 13bp del c.-114至-102、4bp del c.-225至-222、c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A、或HBG2 13bp del c.-114至-102、c.-109G>T、c.-114C>A、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G。
在某些实施例中,本文提供的方法包括改变γ-珠蛋白基因调控元件中的一个或多个转录因子结合基序(例如,基因调控基序)。这些转录因子结合基序包括,例如,在HBG1和/或HBG2的启动子区域内被转录因子(TF)、TF复合物、和转录阻遏物占据的结合基序。在本文提供的方法的某些实施例中,在一个或多个γ-珠蛋白基因调控元件中引入CRISPR/Cas介导的改变来改变转录因子(例如,阻遏物)在1个、2个、3个、或多于三个基序的结合。在某些实施例中,在一个或多个γ-珠蛋白基因调控元件中引入CRISPR/Cas介导的改变导致RNA聚合酶II在γ-珠蛋白基因启动子区域附近或在γ-珠蛋白基因启动子区域处的转录起始增加,例如,通过增加转录因子结合增强子区域,例如通过减少阻遏物在沉默子区域的结合。
在某些实施例中,本文提供的方法利用DNA修复机制介导的(例如,NHEJ-或HDR-介导的)缺失来缺失HBG1、HBG2、或HBG1和HBG2的一个或两个等位基因中的全部或部分核苷酸-114至-102,导致与天然存在的13bp del c.-114至-102突变有关的相同或相似的HPFH表型。在其他实施例中,利用DNA修复机制介导的(例如,NHEJ-或HDR-介导的)缺失来缺失HBG1的一个或两个等位基因中的全部或部分核苷酸-225至-222,导致与天然存在的HBG14bp del-225至-222突变有关的相同或相似的HPFH表型。在其他实施例中,利用DNA修复机制介导的(例如,NHEJ-或HDR-介导的)缺失来缺失HBG2的一个或两个等位基因的全部或部分核苷酸-225至-222。
在某些实施例中,本文提供的方法利用DNA修复机制介导的(例如,NHEJ-或HDR-介导的)缺失来缺失HBG1的一个或两个等位基因和HBG2的一个或两个等位基因的全部或部分核苷酸-114至-102。
在某些实施例中,本文提供的方法利用DNA修复机制介导的(例如,NHEJ或HDR-介导的)缺失来缺失HBG1的一个或两个等位基因的全部或部分核苷酸-225至-222和HBG2的一个或两个等位基因的全部或部分核苷酸-114至-102。在其他实施例中,利用DNA修复机制介导的(例如,NHEJ-或HDR-介导的)缺失来缺失HBG1的一个或两个等位基因的全部或部分核苷酸-225至-222和HBG1的一个或两个等位基因的全部或部分核苷酸-114至-102。
在其中DNA修复机制介导的(例如,NHEJ-或HDR-介导的)缺失用于从HBG1、HBG2、或HBG1和HBG2调控元件中缺失一个或多个核苷酸的那些实施例中,缺失可以与那些在天然存在的HPFH突变中观察到的一致,即,缺失可以由HBG1或HBG2的核苷酸-114至-102或HBG1的核苷酸-225至-222组成。在其他实施例中,DNA修复机制介导的(例如,NHEJ-或HDR-介导的)缺失导致仅去除这些核苷酸的一部分,例如,缺失落入HBG1或HBG2的-114至-102内的12个或更少的核苷酸,或HBG1的-225至-222内的三个或更少的核苷酸。在某些实施例中,除了在天然存在的缺失边界内的全部或部分核苷酸之外,还可以在天然存在的HPFH突变缺失边界的任一侧(即,在-114至-102或-225至-222之外)敲除一个或多个核苷酸。
在某些实施例中,本文提供的方法利用DNA修复机制介导的(例如,NHEJ-或HDR-介导的)插入将一个或多个核苷酸插入跨越HBG1调控区域的核苷酸-114至-102的区域、HBG2调控区域、或HBG1和HBG2调控区域、或跨越HBG1调控区域的核苷酸-225至-222的区域,以破坏阻遏物结合位点。
在某些实施例中,本文提供的方法利用DNA修复机制(例如,HDR)产生相应于与HPFH有关的天然存在的突变的单核苷酸改变(即,非缺失突变体)。例如,在某些实施例中,所述方法利用DNA修复机制(例如,HDR)在HBG1调控区域中产生相应于与HPFH有关的天然存在的突变的单核苷酸改变,包括,例如,c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A。例如,在其他实施例中,利用DNA修复机制(例如,HDR)在HBG2调控区域中产生相应于与HPFH有关的天然存在的突变的单核苷酸改变,包括,例如,c.-109G>T、c.-114C>A、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、c.-567。
在某些实施例中,利用DNA修复机制(例如,HDR)在HBG1调控区域中产生相应于在HBG2调控区域但不是HBG1调控区域中发现的天然存在的HPFH突变的单核苷酸改变。这种改变包括,例如,c.-109G>T、c.-114C>A、c.-157C>T、c.-167C>A、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G。
同样地,在某些实施例中,利用DNA修复机制(例如,HDR)在HBG2调控区域中产生相应于在HBG1调控区域但不是HBG2调控区域中发现的天然存在的HPFH突变的单核苷酸改变。这种改变包括,例如,c.-117G>A、c.-170G>A、c.-175T>G、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-114C>T插入HBG1和/或HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-158C>T(即,rs7482144或XmnI-HBG2变体)插入HBG1和/或HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-167C>T插入HBG1和/或HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-175T>C(即,在保守的八核苷酸[ATGCAAAT]序列中的c.-175位置的T→C取代)插入HBG1调控区域。这种与40%HbF有关的变体已显示可以消除普遍存在的八核苷酸结合核蛋白以结合HBG启动子片段的能力,同时增加3-5倍两种红系特异性蛋白质结合相同片段的能力(Mantovani 1988)。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-175T>C插入HBG2调控区域。所述变体与20%-30%HbF表达有关。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-117G>A插入HBG1调控区域。这种变体,是指“希腊类型”,是最常见的非缺失HPFH突变体,并在远端CCAAT盒上游映射两个核苷酸(Waber1986)。HBG1 c.-117G>A极大地降低了红系特异性因子的结合,但不是普遍存在的蛋白质与CCAAT盒区域片段的结合,并且与10%-20%HbF有关(Mantovani 1988)。所述突变被认为干扰核因子E(NF-E)的结合,其可能在成人红系细胞中阻遏γ-珠蛋白转录中起作用(Superti-Furga 1988)。在其他实施例中,本文提供的方法包括将非缺失HPFH变体c.-117G>A插入HBG2调控区域,产生非天然存在的HPFH变体。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-170G>A插入HBG1调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-175T>G插入HBG1调控区域。
在某些实施例中,本文提供的方法包括将非缺失HPFH变体c.-195C>G插入HBG1调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-196C>T插入HBG1调控区域。所述变体与10%-20%HbF有关。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-198T>C插入HBG1调控区域。所述变体与18%-21%HbF有关。
在某些实施例中,本文提供的方法包括将非缺失HPFH变体c.-201C>T插入HBG1调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-251T>C插入HBG1调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-499T>A插入HBG1调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-109G>T(“希腊突变”)插入HBG2调控区域。所述突变位于启动子区域的HBG2CCAAT盒的3'端(Chassanidis 2009)。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-114C>A插入HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-157C>T插入HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-167C>A插入HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-202C>G插入HBG2调控区域。所述变体与15%-25%HbF表达有关。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-211C>T插入HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-228T>C插入HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-255C>G插入HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-309A>G插入HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-369C>G插入HBG2调控区域。
在某些实施例中,本文提供的方法包括通过DNA修复机制(例如,HDR)将非缺失HPFH变体c.-567T>G插入HBG2调控区域。
在某些实施例中,本文提供的方法包括位于相对于HBG1和/或HBG2的位置c.-56和/或γ-珠蛋白基因调控区域中的另一位置的BCL11a核心结合基序(即,GGCCGG)的缺失、破坏或突变。
在某些实施例中,本文提供的方法包括改变GATA(例如,GATA1)基序中的一个或多个核苷酸。在某些这些实施例中,使用DNA修复机制(例如,HDR)将T>C突变插入序列AAATATCTGT内的HBG1GATA结合基序中,导致序列AAACATCTGT的改变。这种天然存在的T>CHPFH突变与40%HbF有关。
在某些实施例中,本文提供的方法利用一种或多种DNA修复机制(例如,NHEJ和HDR)途径。例如,在某些实施例中,所述方法利用NHEJ介导的缺失,例如,将13bp del c.-114至-102引入HBG1和/或HBG2的一个或两个等位基因中,和/或将4bp del c.-225至-222引入HBG1的一个或两个等位基因中,结合HDR介导的单核苷酸改变,例如引入一个或多个c.-109G>T、c.-114C>A、c.-114C>T、c.-117G>A、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-170G>A、c.-175T>C、c.-175T>G、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-202C>G、c.-211C>T、c.-228T>C、c.-251T>C、c.-255C>G、c.-309A>G、c.-369C>G、c.-499T>A、或c.-567T>G进入HBG1和/或HBG2的一个或两个等位基因。
在某些实施例中,所述方法利用HDR介导的缺失,例如,将13bp del c.-114至-102引入HBG1和/或HBG2的一个或两个等位基因中,和/或将4bp del c.-225至-222引入HBG1的一个或两个等位基因中,结合HDR介导的单核苷酸改变,例如引入一个或多个c.-109G>T、c.-114C>A、c.-114C>T、c.-117G>A、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-170G>A、c.-175T>C、c.-175T>G、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-202C>G、c.-211C>T、c.-228T>C、c.-251T>C、c.-255C>G、c.-309A>G、c.-369C>G、c.-499T>A、或c.-567T>G进入HBG1和/或HBG2的一个或两个等位基因。
虽然不希望受理论束缚,但将4bp del c.-225至-222引入HBG1基因调控区域可逆转70%γA-珠蛋白(HBG1基因的γ-珠蛋白产物)与30%γG-珠蛋白(HBG2基因的γ-珠蛋白产物)的正常比例,使γ-珠蛋白产生大约30%的γA-珠蛋白和70%的γG-珠蛋白。虽然不希望受理论束缚,但γG-珠蛋白和γA-珠蛋白比率的逆转导致受试者中γG-珠蛋白的产生增加。虽然不希望受理论束缚,但将4bp del c.-225至-222引入HBG1基因调控区域并将13bpdel c.-114至-102伴随引入HBG2基因调控区域导致HBG2转录活性的增加、γG-珠蛋白产生的增加、和受试者中HbF的增加。虽然不希望受理论束缚,但将(a)4bp del c.-225至-222伴随引入HBG1基因调控区域,例如,通过NHEJ-或HDR介导的缺失,和(b)非缺失HPFH变体,例如,通过HDR,例如,c.-109G>T、c.-114C>T、c.-114C>A、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、c.-567T>G,引入HBG2基因调控区域导致受试者中HBG2的转录活性增加、γG-珠蛋白的产生增加和HbF增加。
虽然不希望受理论束缚,但是相对于γA-珠蛋白(HBG1基因的γ-珠蛋白产物)的产生,将4bp del c.-225至-222引入HBG2基因调控区域可以减少γG-珠蛋白(HBG2基因的γ-珠蛋白产物)的产生,产生的γA-珠蛋白比γG-珠蛋白更多。虽然不希望受理论束缚,但将4bp del c.-225至-222引入HBG2基因调控区域并将13bp del c.-114至-102伴随引入HBG1基因调控区域可导致HBG1转录活性的增加、γA-珠蛋白产生的增加和受试者中HbF的增加。虽然不希望受理论束缚,但将(a)4bp del c.-225至-222伴随引入HBG2基因调控区域,例如,通过NHEJ-或HDR介导的缺失,和(b)非缺失HPFH变体,例如,通过HDR,例如,c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A,引入HBG1基因调控区域可导致受试者中HBG1的转录活性增加、γA-珠蛋白的产生增加和HbF增加。
虽然不希望受理论束缚,但将(a)13bp del c.-114至-102伴随引入HBG1基因调控区域,例如,通过NHEJ-或HDR介导的缺失,和(b)非缺失HPFH变体,例如,通过HDR,例如,c.-109G>T、c.-114C>T、c.-114C>A、c.-157C>T、c.-158C>T、c.-167C>A、c.-167C>T、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G,引入HBG2基因调控区域导致受试者中HBG2的转录活性增加、γG-珠蛋白的产生增加和HbF增加。
虽然不希望受理论束缚,但将(a)13bp del c.-114至-102伴随引入HBG2基因调控区域,例如,通过NHEJ-或HDR介导的缺失,和(b)非缺失HPFH变体,例如,通过HDR,例如,c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A,引入HBG1基因调控区域导致受试者中HBG1的转录活性增加、γA-珠蛋白的产生增加和HbF增加。
伴随的(a)通过siRNA敲低BCL11A和(b)通过siRNA敲低SOX6导致HBG1和HBG2的表达增加(Xu 2010)。在某些实施例中,本文提供的方法包括使用HBG1的DNA修复机制(例如,HDR、NHEJ、或NHEJ和HDR)修饰和HBG2启动子区域和BCL11A的红系特异性增强子,单独或平行破坏BCL11A、SOX6、或BCL11A和SOX6对HBG1和HBG2表达的作用。在某些实施例中,本文提供的方法包括通过NHEJ和HDR破坏其内含子红系特异性增强子的功能来降低BCL11A表达,并同时诱导HPFH突变以对HbF产生的协同效应。
本文描述的实施例可用于所有类别的脊椎动物,包括但不限于灵长类动物、小鼠、大鼠、兔、猪、狗和猫。
时间和受试者选择
使用本文披露的方法起始治疗可以在疾病发作之前发生,例如在基于遗传测试、家族史或者其他因素,例如被认为有发育β-血红蛋白病(例如,SCD,β-Thal)的风险的但尚未显示出疾病的任何表现或症状的受试者中。在某些这些实施例中,可以在天然存在的珠蛋白转换之前,即,在从主要是HbF转变为主要是HbA之前起始治疗。在其他实施例中,可以在发生天然存在的珠蛋白转换后起始治疗。
在某些实施例中,在疾病发作后起始治疗,例如SCD或β-Thal或与其有关的一种或多种症状发作后的1、2、3、4、5、6、7、8、9、10、12、16、24、36、或48个月或更多个月。在某些这些实施例中,治疗在疾病进展的早期阶段起始,例如,当受试者仅显示轻微症状或仅显示一部分症状时。示例性症状包括但不限于贫血、腹泻、发热、未能茁壮成长、镰状细胞危象、血管阻塞性危象、再生障碍性危象、急性胸部综合征性贫血、血管阻塞、肝肿大、血栓症、肺栓塞、中风、腿部溃疡、心肌病、贲门心律失常、脾肿大、骨质生长延迟和/或青春期、以及髓外红细胞生成的证据。在其他实施例中,在SCD或β-Thal发作后治疗在疾病发作后或在疾病进展的更晚期阶段开始,例如,1、2、3、4、5、6、7、8、9、10、12、16、24、36或48个月或更长时间。虽然不希望受理论束缚,但据信如果受试者很好地存在于疾病过程中,这种治疗将是有效的。
在某些实施例中,本文提供的方法防止或减缓与所治疗疾病有关的一种或多种症状的发育。在某些实施例中,与未接受疗法的受试者相比,本文提供的方法导致疾病进展的防止或延迟。在某些实施例中,本文提供的方法导致疾病完全治愈。
在某些实施例中,本文提供的方法是基于一次性进行的。在其他实施例中,本文提供的方法利用多剂量疗法。
在某些实施例中,使用本文提供的方法治疗的受试者是输血依赖性的。
在某些实施例中,本文提供的方法包括在体内细胞中使用CRISPR/Cas介导的基因组编辑改变一种或多种γ-珠蛋白基因(例如,HBG1、HBG2)的表达。在其他实施例中,本文提供的方法包括在离体细胞中使用CRISPR/Cas介导的基因组编辑改变一种或多种γ-珠蛋白基因的表达。在某些这些实施例中,细胞最初来自受试者。在某些实施例中,经历改变的细胞是成人红系细胞。在其他实施例中,细胞是造血干细胞(HSC)。
在某些实施例中,本文提供的方法包括向细胞递送一种或多种gRNA分子和一种或多种Cas9多肽或编码Cas9多肽的核酸序列。在某些实施例中,所述方法进一步包括递送一种或多种核酸,例如,HDR供体模板。
在某些实施例中,使用一种或多种AAV载体、慢病毒载体、纳米颗粒或其组合递送这些组分中的一种或多种(即,一种或多种gRNA分子、一种或多种Cas9多肽或编码Cas9多肽的核酸序列、和一种或多种核酸,例如,HDR供体模板)。
在某些实施例中,本文提供的方法在具有HBB基因中的一个或多个突变的受试者上进行,包括一种或多种与β-血红蛋白病有关的突变,例如SCD或β-Thal。这种突变的实例包括,但不限于,c.17A>T、c.-136C>G、c.92+1G>A、c.92+6T>C、c.93-21G>A、c.118C>T、c.316-106C>G、c.25_26delAA、c.27_28insG、c.92+5G>C、c.118C>T、c.135delC、c.315+1G>A、c.-78A>G、c.52A>T、c.59A>G、c.92+5G>C、c.124_127delTTCT、c.316-197C>T、c.-78A>G、c.52A>T、c.124_127delTTCT、c.316-197C>T、c.-138C>T、c.-79A>G、c.92+5G>C、c.75T>A、c.316-2A>G、和c.316-2A>C。
NHEJ介导的γ-珠蛋白基因调控元件中indel的引入
在某些实施例中,本文提供的方法利用NHEJ介导的插入或缺失来破坏γ-珠蛋白基因调控元件的全部或部分,以增加γ-珠蛋白基因(例如,HBG1、HBG2、或HBG1和HBG2)的表达。
在某些实施例中,本文提供的利用NHEJ的方法包括经由NHEJ缺失或破坏HBG1或HBG2沉默子元件的全部或部分,导致沉默子的失活和随后HBG1和/或HBG2表达的增加。在某些实施例中,NHEJ介导的缺失导致在HBG1的一个或两个等位基因中去除c.-114至-102或-225至-222的全部或部分,和/或去除在HBG2的一个或两个等位基因中c.-114至-102的全部或部分。在某些这些实施例中,这些区域的一个或多个核苷酸5'或3'也被缺失。
在某些实施例中,本文提供的利用NHEJ的方法包括在γ-珠蛋白基因调控区域内引入一个或多个断裂(例如,单链断裂或双链断裂),并且在这些实施例的某些中,所述一个或多个断裂位于足够接近HBG靶位置,可以合理地预期断裂诱导的indel跨越全部或部分HBG靶位置。
在某些实施例中,第一gRNA分子的靶向结构域被配置为提供切割事件,例如,双链断裂或单链断裂,足够接近HBG靶位置以允许NHEJ介导的插入或在HBG靶位置的缺失。在某些实施例中,所述gRNA靶向结构域被配置成使得切割事件(例如,双链或单链断裂)被定位在HBG靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。断裂,例如双链或单链断裂可以位于HBG靶位置的上游或下游。
在某些实施例中,包含第二靶向结构域的第二gRNA分子被配置为提供切割事件,例如双链断裂或单链断裂,足够接近HBG靶位置以允许在HBG靶位置的NHEJ介导的插入或缺失,单独或与由所述第一gRNA分子位置的断裂组合。在某些实施例中,所述第一和第二gRNA分子的靶向结构域被配置成使得切割事件(例如,双链或单链断裂)对于所述gRNA分子中的每者而言独立地被定位在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。在某些实施例中,断裂(例如,双链或单链断裂)位于HBG靶位置的核苷酸的任一侧。在其他实施例中,断裂(例如,双链或单链断裂)均位于HBG靶位置的核苷酸的一侧,例如,上游或下游。
在某些实施例中,单链断裂伴随有由第二gRNA分子位置的另外的单链断裂,如下文所讨论的。例如,所述gRNA靶向结构域可被配置成使得切割事件(例如,两个单链断裂)被定位在HBG靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。在某些实施例中,所述第一和第二gRNA分子被配置成使得在指导Cas9切口酶时,单链断裂将伴随有由第二gRNA定位的彼此足够接近的另外的单链断裂,以引起HBG靶位置的改变。在某些实施例中,所述第一和第二gRNA分子被配置成使得例如,当Cas9是切口酶时,由所述第二gRNA定位的单链断裂在由所述第一gRNA分子定位的断裂的10、20、30、40或50个核苷酸内。在某些实施例中,所述两个gRNA分子被配置成将切口定位在相同位置、或彼此相距在几个核苷酸之内、在不同链上,例如,基本上模拟了双链断裂。
在某些实施例中,双链断裂可以伴随有由第二gRNA分子定位的另外的双链断裂,如下文所讨论的。例如,第一gRNA分子的靶向结构域被配置成使得双链断裂被定位在HBG靶位置的上游,例如,在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内;并且第二gRNA分子的靶向结构域被配置成使得双链断裂被定位在HBG靶位置的下游,例如在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。
在某些实施例中,双链断裂可以伴随有由第二gRNA分子和第三gRNA分子定位的两个另外的单链断裂。例如,第一gRNA分子的靶向结构域被配置成使得双链断裂被定位在HBG靶位置的上游,例如,在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内;并且第二和第三gRNA分子的靶向结构域被配置成使得两个单链断裂被定位在HBG靶位置的下游,例如在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。在某些实施例中,所述第一、第二和第三gRNA分子的靶向结构域被配置成使得切割事件(例如,双链或单链断裂)对于所述gRNA分子中的每者而言独立地被定位。
在某些实施例中,第一和第二单链断裂可以伴随有由第三和第四gRNA分子定位的两个另外的单链断裂。例如,第一gRNA分子和第二gRNA分子的靶向结构域被配置成使得两个单链断裂被定位在HBG靶位置的上游,例如在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内;并且第三和第四gRNA分子的靶向结构域被配置成使得两个单链断裂被定位在HBG靶位置的下游,例如在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。
在某些实施例中,本文提供的方法包括引入NHEJ介导的包括HBG靶位置的基因组序列的缺失。在某些实施例中,所述方法包括引入两个双链断裂,一个5'至另一个3'至(即侧翼)HBG靶位置。两种gRNA,例如单分子(或嵌合)或模块化gRNA分子,被配置成将两个双链断裂定位在HBG靶位置的相对侧。在某些实施例中,第一双链断裂位于突变的上游,第二双链断裂位于突变的下游。在某些实施例中,定位两个双链断裂以去除HBG1 c.-114至-102、HBG1 4bp del-225至-222的全部或部分。在一个实施例中,定位断裂(即,两个双链断裂)以避免不想要的靶向染色体元件,例如重复元件,例如Alu重复,或内源剪接位点。
在其他实施例中,所述方法包括引入两组断裂,一条双链断裂和一对单链断裂。两组位于HBG靶位置的侧翼,即,一组是5'到另一组是HBG靶位置的3'。两种gRNA,例如,单分子(或嵌合)或模块化gRNA分子,被配置成在HBG靶位置的相对侧定位两组断裂(双链断裂或一对单链断裂)。在一个实施例中,定位断裂(即,两组断裂(双链断裂或一对单链断裂)以避免不想要的靶向染色体元件,例如重复元件,例如Alu重复,或内源剪接位点。
在其他实施例中,所述方法包括引入两对单链断裂,一个5'至另一个3'至(即,侧翼)HBG靶位置。两种gRNA,例如单分子(或嵌合)或模块化gRNA分子,被配置成将两组断裂定位在HBG靶位置的相对侧。在某些实施例中,定位断裂(即,两对单链断裂)以避免不想要的靶向染色体元件,例如重复元件,例如Alu重复,或内源剪接位点。
HDR介导的γ-珠蛋白基因调控元件中序列改变的引入
在某些实施例中,本文提供的方法利用HDR以修饰在γ-珠蛋白基因调控元件中的一个或多个核苷酸,以增加γ-珠蛋白基因(例如,HBG1、HBG2、或HBG1和HBG2)的表达。在某些这些实施例中,利用HDR掺入相应于与HPFH有关的天然存在的突变的一个或多个核苷酸修饰。例如,在某些实施例中,HDR用于将一种或多种下列单核苷酸改变掺入HBG1调控区域:c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>C、c.-175T>G、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A。在其他实施例中,HDR用于将一种或多种下列单核苷酸改变掺入HBG2调控区域:c.-109G>T、c.-114C>A、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、c.-567T>G。
在某些实施例中,本文提供的方法利用HDR-介导的改变(例如,插入或缺失)以破坏γ-珠蛋白基因调控元件的全部或部分,以增加γ-珠蛋白基因(例如,HBG1、HBG2、或HBG1和HBG2)的表达。
在某些实施例中,本文提供的利用HDR的方法包括经由HDR缺失或破坏HBG1或HBG2沉默子元件的全部或部分,导致沉默子的失活和随后HBG1和/或HBG2表达的增加。在某些实施例中,HDR-介导的缺失导致在HBG1的一个或两个等位基因中去除c.-114至-102或-225至-222的全部或部分,和/或去除在HBG2的一个或两个等位基因中c.-114至-102的全部或部分。在某些这些实施例中,这些区域的一个或多个核苷酸5'或3'也被缺失。
在某些实施例中,本文提供的利用HDR的方法包括在γ-珠蛋白基因调控区域内引入一个或多个断裂(例如,单链断裂或双链断裂),并且在这些实施例的某些中,所述一个或多个断裂位于足够接近HBG靶位置,可以合理地预期断裂诱导的改变跨越全部或部分HBG靶位置。
在某些实施例中,HDR介导的改变可包括使用模板核酸。
在某些实施例中,将HDR介导的遗传改变掺入一个γ-珠蛋白基因等位基因(例如,HBG1和/或HBG2的一个等位基因)中。在另一个实施例中,遗传改变掺入两个等位基因(例如,HBG1和/或HBG2的两个等位基因)。在任一情况下,经处理的受试者展现出增加的γ-珠蛋白基因表达(例如,HBG1、HBG2、或HBG1和HBG2表达)。
在某些实施例中,本文提供的利用HDR的方法包括引入足够接近(例如,5'或3'至)HBG靶位置的一个或多个断裂(例如,单链断裂或双链断裂)以允许与目标位置的HDR有关的更改。
在某些实施例中,第一gRNA分子的靶向结构域被配置为提供切割事件,例如,双链断裂或单链断裂,足够接近HBG靶位置以允许与目标位置的HDR有关的更改。在某些实施例中,所述gRNA靶向结构域被配置成使得切割事件(例如,双链或单链断裂)被定位在HBG靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。断裂,例如双链或单链断裂可以位于HBG靶位置的上游或下游。
在某些实施例中,第二、第三、和/或第四gRNA分子被配置为提供切割事件,例如,双链断裂或单链断裂,足够接近(例如,5'或3'至)HBG靶位置以允许与目标位置的HDR有关的更改。在某些实施例中,所述gRNA靶向结构域被配置成使得切割事件(例如,双链或单链断裂)被定位在HBG靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。断裂,例如双链或单链断裂可以位于靶位置的上游或下游。
在某些实施例中,单链断裂伴随有由第二、第三和/或第四gRNA分子定位的另外的单链断裂。例如,所述gRNA靶向结构域可被配置成使得切割事件(例如,两个单链断裂)被定位在HBG靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。在某些实施例中,所述第一和第二gRNA分子被配置成使得在指导Cas9切口酶时,单链断裂将伴随有由第二gRNA定位的足够接近第一条链断裂的另外的单链断裂,以导致HBG靶位置的改变。在某些实施例中,所述第一和第二gRNA分子被配置成使得例如,当Cas9是切口酶时,由所述第二gRNA定位的单链断裂在由所述第一gRNA分子定位的断裂的10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个核苷酸内。在某些实施例中,所述两个gRNA分子被配置成将切口定位在相同位置、或彼此相距在几个核苷酸之内、在不同链上,例如,基本上模拟了双链断裂。
在某些实施例中,双链断裂可伴随有由第二、第三和/或第四gRNA分子定位的另外的双链断裂。例如,第一gRNA分子的靶向结构域可被配置成使得双链断裂被定位在HBG靶位置的上游,例如,在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内;并且第二gRNA分子的靶向结构域可被配置成使得双链断裂被定位在HBG靶位置的下游,例如在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。
在某些实施例中,双链断裂可以伴随有由第二和第三gRNA分子定位的两个另外的单链断裂。例如,第一gRNA分子的靶向结构域可被配置成使得双链断裂被定位在HBG靶位置的上游,例如,在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内;并且第二和第三gRNA分子的靶向结构域可被配置成使得两个单链断裂被定位在靶位置的下游,例如,在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。在某些实施例中,所述第一、第二和第三gRNA分子的靶向结构域被配置成使得切割事件(例如,双链或单链断裂)对于所述gRNA分子中的每者而言独立地被定位。
在某些实施例中,第一和第二单链断裂可以伴随有由第三gRNA分子和第四gRNA分子定位的两个另外的单链断裂。例如,第一gRNA分子和第二gRNA分子的靶向结构域可被配置成使得两个单链断裂被定位在HBG靶位置的上游,例如在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内;并且第三和第四gRNA分子的靶向结构域可被配置成使得两个单链断裂被定位在HBG靶位置的下游,例如,在靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450或500个核苷酸内。
指导RNA(gRNA)分子
如该术语在本文使用的,gRNA分子是指促进gRNA分子/Cas9分子复合物向靶核酸特异性靶向或归巢的核酸。gRNA分子可以是单分子的(具有单RNA分子)(例如,嵌合的)、或模块化的(包含多于一种并且典型地两种分开的RNA分子)。本文提供的gRNA分子包含靶向结构域,所述靶向结构域包含与靶结构域完全或部分互补的核酸序列,由其组成或基本上由其组成。在某些实施例中,所述gRNA分子进一步包含一个或多个另外的结构域,包括例如第一互补结构域、连接结构域、第二互补结构域、近端结构域、尾部结构域和5'延伸结构域。下面详细讨论了这些结构域中的每一者。在某些实施例中,gRNA分子中的一个或多个结构域包含与例如来自化脓链球菌、金黄色葡萄球菌或嗜热链球菌的天然存在的序列相同或与其共享序列同源性的核苷酸序列。
图1A-1I中提供了若干示例性gRNA结构。关于gRNA的三维形式、或活化形式的链内或链间相互作用,高度互补的区域在图1A-1I和本文提供的其他描绘中有时显示为双链体。图7说明了使用SEQ ID NO:42的gRNA序列的gRNA结构域命名法,所述gRNA序列在tracrRNA衍生区域中含有一个发夹环。在某些实施例中,gRNA可以在该区域中含有多于一个(例如,两个、三个或更多个)发夹环(参见例如,图1H-1I)。
在某些实施例中,单分子或嵌合gRNA包含,优选地从5’到3':
与γ-珠蛋白基因调控区域中的靶结构域互补的靶向结构域,例如来自SEQ IDNO:251-SEQ ID NO:901中任一个的靶向结构域;
第一互补结构域;
连接结构域;
第二互补结构域(其与所述第一互补结构域互补);
近端结构域;以及
任选地,尾部结构域。
在某些实施例中,模块化gRNA包含:
第一链,其包含,优选地从5’到3’:
与γ-珠蛋白基因调控区域中的靶结构域互补的靶向结构域,例如来自SEQ IDNO:251-SEQ ID NO:901中任一个的靶向结构域;和
第一互补结构域;以及
第二条链,其包含,优选地从5'到3':
任选地,5’延伸结构域;
第二互补结构域;
近端结构域;以及
任选地,尾部结构域。
靶向结构域
靶向结构域(有时可替代地称为指导序列或互补区域)包含γ-珠蛋白基因调控区域中与靶核酸互补或部分互补的核酸序列,由其组成或基本上由其组成。γ-珠蛋白基因调控区域中全部或部分靶向结构域与其互补或部分互补的核酸序列在本文中称为靶结构域。在某些实施例中,靶结构域包含HBG靶位置。在其他实施例中,HBG靶位置位于靶结构域的外部(即,上游或下游)。在某些实施例中,靶结构域完全位于γ-珠蛋白基因调控区域内,例如,在与γ-珠蛋白基因有关的调控元件中或与编码γ-珠蛋白基因表达阻遏物的基因有关的调控元件中。在其他实施例中,靶结构域的全部或部分位于γ-珠蛋白基因调控区域之外,例如,在HBG1或HBG2编码区域、外显子、或内含子中。
用于选择靶向结构域的方法本领域是已知的(参见例如,Fu 2014;Sternberg2014)。用于本文所述的方法、组合物和试剂盒中的合适的靶向结构域的实例包括SEQ ID No:251-901中示出的那些。
包含靶结构域的靶核酸的链在本文中称为互补链,因为其与靶向结构域序列互补。由于靶向结构域是gRNA分子的一部分,所以它包含碱基尿嘧啶(U)而非胸腺嘧啶(T);相反,编码gRNA分子的任何DNA分子将包含胸腺嘧啶而非尿嘧啶。在靶向结构域/靶结构域对中,靶向结构域中的尿嘧啶碱基将与靶结构域中的腺嘌呤碱基配对。在某些实施例中,靶向结构域与靶结构域之间的互补程度足以允许Cas9分子靶向靶核酸。
在某些实施例中,靶向结构域包括核心结构域和任选的第二结构域。在这些实施例的某些中,核心结构域位于第二结构域的3'处,并且在这些实施例的某些中,核心结构域位于靶向结构域的3'端或其附近。在这些实施例的某些中,核心结构域由靶向结构域的3'端处的约8至约13个核苷酸组成或基本上由其组成。在某些实施例中,只有核心结构域与靶结构域的相应部分互补或部分互补,并且在这些实施例的某些中,核心结构域与靶结构域的相应部分完全互补。在其他实施例中,第二结构域也与靶结构域的一部分互补或部分互补。在某些实施例中,核心结构域与靶结构域中的核心结构域靶互补或部分互补,而第二结构域与靶结构域中的第二结构域靶互补或部分互补。在某些实施例中,核心结构域和第二结构域与靶结构的它们各自对应的部分域具有相同的互补程度。在其他实施例中,核心结构域与其靶之间的互补程度和第二结构域与其靶之间的互补程度可以不同。在这些实施例的某些中,核心结构域可以对其靶具有比第二结构域更高的互补程度,而在其他实施例中,第二结构域可以具有比核心结构域更高的互补程度。
在某些实施例中,靶向结构域和/或靶向结构域内的核心结构域的长度为3至100、5至100、10至100或20至100个核苷酸,并且在这些实施例的某些中,靶向结构域或核心结构域的长度为3至15、3至20、5至20、10至20、15至20、5至50、10至50或20至50个核苷酸。在某些实施例中,靶向结构域和/或靶向结构域内的核心结构域的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个核苷酸。在某些实施例中,靶向结构域和/或靶向结构域内的核心结构域的长度为6+/-2、7+/-2、8+/-2、9+/-2、10+/-2、10+/-4、10+/-5、11+/-2、12+/-2、13+/-2、14+/-2、15+/-2、或16+-2、20+/-5、30+/-5、40+/-5、50+/-5、60+/-5、70+/-5、80+/-5、90+/-5、或100+/-5个核苷酸。
在靶向结构域包括核心结构域的某些实施例中,核心结构域的长度为3至20个核苷酸,并且在这些实施例的某些中,核心结构域的长度为5至15或8至13个核苷酸。在靶向结构域包括第二结构域的某些实施例中,第二结构域的长度为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸。在靶向结构域包含长度为8至13个核苷酸的核心结构域的某些实施例中,各自地,靶向结构域的长度为26、25、24、23、22、21、20、19、18、17、或16个核苷酸,并且第二结构域的长度为13至18、12至17、11至16、10至15、9至14、8至13、7至12、6至11、5至10、4至9、或3至8个核苷酸。
在某些实施例中,靶向结构域与靶结构域完全互补。同样地,在靶向结构域包含核心结构域和/或第二结构域的情况下,在某些实施例中,核心结构域和第二结构域中的一个或两个与靶结构域的相应部分完全互补。在其他实施例中,靶向结构域与靶结构域部分互补,并且在靶向结构域包含核心结构域和/或第二结构域的这些实施例的某些中,核心结构域和第二结构域中的一个或两个与靶结构域的相应部分部分地互补。在这些实施例的某些中,靶向结构域或靶向结构域内的核心结构域或第二结构域的核酸序列与靶结构域或靶结构域的相应部分至少80%、85%、90%或95%互补。在某些实施例中,靶向结构域和/或靶向结构域内的核心或第二结构域包括与靶结构域或其部分不互补的一个或多个核苷酸,并且在这些实施例的某些中,靶向结构域和/或靶向结构域内的核心或第二结构域包括与靶结构域不互补的1、2、3、4、5、6、7或8个核苷酸。在某些实施例中,核心结构域包括与靶结构域的相应部分不互补的1、2、3、4或5个核苷酸。在靶向结构域包括与靶结构域不互补的一个或多个核苷酸的某些实施例中,所述非互补核苷酸中的一个或多个位于靶向结构域的5'或3'端的五个核苷酸内。在这些实施例的某些中,靶向结构域包括在其5'端、3'端或其5'和3'端的五个核苷酸内的与靶结构域不互补的1、2、3、4或5个核苷酸。在靶向结构域包括与靶结构域不互补的两个或更多个核苷酸的某些实施例中,所述非互补核苷酸中的两个或更多个彼此相邻,并且在这些实施例的某些中,所述两个或更多个连续的非互补核苷酸位于靶向结构域的5'或3'端的五个核苷酸内。在其他实施例中,所述两个或更多个连续的非互补核苷酸都位于离靶向结构域的5'和3'端超过五个核苷酸处。
在某些实施例中,靶向结构域、核心结构域和/或第二结构域不包含任何修饰。在其他实施例中,靶向结构域、核心结构域和/或第二结构域或其中的一个或多个核苷酸具有修饰,包括但不限于以下阐述的修饰。在某些实施例中,靶向结构域、核心结构域和/或第二结构域的一个或多个核苷酸可以包含2'修饰(例如,在核糖上2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰靶向结构域的骨架。在某些实施例中,对靶向结构域、核心结构域和/或第二结构域的一个或多个核苷酸的修饰使得靶向结构域和/或包含靶向结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,靶向结构域和/或核心或第二结构域包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,靶向结构域和/或核心或第二结构域包括它们各自5'端的五个核苷酸内的1、2、3或4个修饰,和/或它们各自3'端的五个核苷酸内的1、2、3或4个修饰。在某些实施例中,靶向结构域和/或核心或第二结构域包括在两个或更多个连续核苷酸处的修饰。
在靶向结构域包括核心和第二结构域的某些实施例中,核心和第二结构域含有相同数量的修饰。在这些实施例的某些中,这两个结构域都不含修饰。在其他实施例中,核心结构域包括比第二结构域更多的修饰,或反之亦然。
在某些实施例中,选择对靶向结构域(包括核心或第二结构域)中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过使用如下阐述的系统测试候选修饰来评价。具有候选靶向结构域的gRNA可以使用如下阐述的系统进行评价,所述候选靶向结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选靶向结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,全部的修饰核苷酸互补于并且能够杂交到靶结构域中存在的相应核苷酸上。在另一个实施例中,1、2、3、4、5、6、7或8个或更多个修饰核苷酸不互补于或不能够杂交到靶结构域中存在的相应核苷酸上。
图1A-1I提供了靶向结构域在gRNA分子内的放置的实例。
第一和第二互补结构域
第一和第二互补(有时可替代地分别称为crRNA衍生的发夹序列和tracrRNA衍生的发夹序列)结构域互相完全或部分互补。在某些实施例中,互补程度足以使所述两个结构域在至少一些生理条件下形成双链体区域。在某些实施例中,第一与第二互补结构域之间的互补程度与gRNA的其他特性一起足以允许Cas9分子靶向靶核酸。第一和第二互补结构域的实例在图1A-1G中进行了阐述。
在某些实施例中(参见例如,图1A-1B),第一和/或第二互补结构域包括与相应互补结构域缺乏互补性的一个或多个核苷酸。在某些实施例中,第一和/或第二互补结构域包括不与相应互补结构域互补的1、2、3、4、5或6个核苷酸。例如,第二互补结构域可以含有与第一互补结构域中的相应核苷酸不配对的1、2、3、4、5或6个核苷酸。在某些实施例中,第一或第二互补结构域上不与相应互补结构域互补的核苷酸从在第一与第二互补结构域之间形成的双链体环出。在这些实施例的某些中,未配对环出位于第二互补结构域上,并且在这些实施例的某些中,未配对区域从离第二互补结构域的5'端1、2、3、4、5或6个核苷酸处开始。
在某些实施例中,第一互补结构域的长度为5至30、5至25、7至25、5至24、5至23、7至22、5至22、5至21、5至20、7至18、7至15、9至16、或10至14个核苷酸,并且在这些实施例的某些中,第一互补结构域的长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或25个核苷酸。在某些实施例中,第二互补结构域的长度为5至27、7至27、7至25、5至24、5至23、5至22、5至21、7至20、5至20、7至18、7至17、9至16、或10至14个核苷酸,并且在这些实施例的某些中,第二互补结构域的长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个核苷酸。在某些实施例中,第一和第二互补结构域的长度各自独立地为6+/-2、7+/-2、8+/-2、9+/-2、10+/-2、11+/-2、12+/-2、13+/-2、14+/-2、15+/-2、16+/-2、17+/-2、18+/-2、19+/-2、或20+/-2、21+/-2、22+/-2、23+/-2、或24+/-2个核苷酸。在某些实施例中,第二互补结构域长于第一互补结构域(例如,长出2、3、4、5、或6个核苷酸)。
在某些实施例中,第一和/或第二互补结构域各自独立地包含三个亚结构域,其按5'到3'方向是:5'亚结构域、中央亚结构域、和3'亚结构域。在某些实施例中,第一互补结构域的5’亚结构域和3’亚结构域分别与第二互补结构域的3’亚结构域和5’亚结构域完全或部分互补。
在某些实施例中,第一互补结构域的5'亚结构域的长度为4至9个核苷酸,并且在这些实施例的某些中,5'结构域的长度为4、5、6、7、8或9个核苷酸。在某些实施例中,第二互补结构域的5'亚结构域的长度为3至25、4至22、4至18、或4至10个核苷酸,并且在这些实施例的某些中,5'结构域的长度为3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。在某些实施例中,第一互补结构域的中央亚结构域的长度为1、2或3个核苷酸。在某些实施例中,第二互补结构域的中央亚结构域的长度为1、2、3、4或5个核苷酸。在某些实施例中,第一互补结构域的3'亚结构域的长度为3至25、4至22、4至18、或4至10个核苷酸,并且在这些实施例的某些中,3'亚结构域的长度为3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。在某些实施例中,第二互补结构域的3'亚结构域的长度为4至9个(例如4、5、6、7、8或9个)核苷酸。
第一和/或第二互补结构域可以与天然存在的或参考的第一和/或第二互补结构域共享同源性,或者从其衍生。在这些实施例的某些中,第一和/或第二互补结构域与天然存在的或参考的第一和/或第二互补结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性或与其相差不多于1、2、3、4、5或6个核苷酸。在这些实施例的某些中,第一和/或第二互补结构域可以与来自化脓链球菌或金黄色葡萄球菌的第一和/或第二互补结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性。
在某些实施例中,第一和/或第二互补结构域不包含任何修饰。在其他实施例中,第一和/或第二互补结构域或其中的一个或多个核苷酸具有修饰,包括但不限于以下阐述的修饰。在某些实施例中,第一和/或第二互补结构域的一个或多个核苷酸可以包含2'修饰(例如在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰靶向结构域的骨架。在某些实施例中,对第一和/或第二互补结构域的一个或多个核苷酸的修饰使得第一和/或第二互补结构域和/或包含第一和/或第二互补结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,第一和/或第二互补结构域各自独立地包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,第一和/或第二互补结构域各自独立地包括它们各自的5'端、3'端或它们的5'和3'端的五个核苷酸内的1、2、3或4个修饰。在其他实施例中,第一和/或第二互补结构域各自独立地在它们各自的5'端、3'端或它们的5'和3'端的五个核苷酸内不含修饰。在某些实施例中,第一和第二互补结构域中的一个或两个包含在两个或更多个连续核苷酸处的修饰。
在某些实施例中,选择对第一和/或第二互补结构域中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过在如下面阐述的系统中测试候选修饰来评价。具有候选第一或第二互补结构域的gRNA可以在如下阐述的系统中进行评价,所述第一或第二互补结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选互补结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,由第一和第二互补结构域形成的双链体区域的长度为例如6bp、7bp、8bp、9bp、10bp、11bp、12bp、13bp、14bp、15bp、16bp、17bp、18bp、19bp、20bp、21bp或22bp,排除任何环出的或未配对的核苷酸。
在某些实施例中,当成双链体时,第一和第二互补结构域包含11个配对的核苷酸(参见例如,SEQ ID NO:48的gRNA)。在某些实施例中,当成双链体时,第一和第二互补结构域包含15个配对的核苷酸(参见例如,SEQ ID NO:50的gRNA)。在某些实施例中,当成双链体时,第一和第二互补结构域包含16个配对的核苷酸(参见例如,SEQ ID NO:51的gRNA)。在某些实施例中,当成双链体时,第一和第二互补结构域包含21个配对的核苷酸(参见例如,SEQID NO:29的gRNA)。
在某些实施例中,在第一与第二互补结构域之间交换一个或多个核苷酸以去除聚-U束。例如,可以交换SEQ ID NO:48的gRNA的核苷酸23和48或核苷酸26和45,以分别产生SEQ ID NO:49或31的gRNA。类似地,SEQ ID NO:29的gRNA的核苷酸23和39可以与核苷酸50和68交换以产生SEQ ID NO:30的gRNA。
连接结构域
连接结构域被布置在单分子gRNA或嵌合gRNA中的第一和第二互补结构域之间并用于连接第一和第二互补结构域。图1B-1E提供了连接结构域的实例。在某些实施例中,连接结构域的一部分来自crRNA衍生区域,并且另一部分来自tracrRNA衍生区域。
在某些实施例中,连接结构域共价连接第一和第二互补结构域。在这些实施例的某些中,连接结构域由共价键组成或包含共价键。在其他实施例中,连接结构域非共价连接第一和第二互补结构域。在某些实施例中,连接结构域的长度为十个或更少的核苷酸,例如1、2、3、4、5、6、7、8、9或10个核苷酸。在其他实施例中,连接结构域的长度为大于10个核苷酸,例如11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个或更多个核苷酸。在某些实施例中,连接结构域的长度为2至50、2至40、2至30、2至20、2至10、2至5、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、10至15、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30或20至25个核苷酸。在某些实施例中,连接结构域的长度为10+/-5、20+/-5、20+/-10、30+/-5、30+/-10、40+/-5、40+/-10、50+/-5、50+/-10、60+/-5、60+/-10、70+/-5、70+/-10、80+/-5、80+/-10、90+/-5、90+/-10、100+/-5或100+/-10个核苷酸。
在某些实施例中,连接结构域与天然存在的序列(例如,对所述第二互补结构域是5’的tracrRNA的序列)共享同源性,或从其衍生。在某些实施例中,连接结构域与本文所披露的连接结构域(例如,图1B-1E的连接结构域)具有至少50%、60%、70%、80%、90%或95%的同源性或与其相差不多于1、2、3、4、5或6个核苷酸。
在某些实施例中,连接结构域不包含任何修饰。在其他实施例中,连接结构域或其中的一个或多个核苷酸具有修饰,包括但不限于以下阐述的修饰。在某些实施例中,连接结构域的一个或多个核苷酸可以包含2'修饰(例如在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰连接结构域的骨架。在某些实施例中,对连接结构域的一个或多个核苷酸的修饰使得连接结构域和/或包含连接结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,连接结构域包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,连接结构域包括其5'和/或3'端的五个核苷酸内的1、2、3或4个修饰。在某些实施例中,连接结构域包含在两个或更多个连续核苷酸处的修饰。
在某些实施例中,选择对连接结构域中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过在如下阐述的系统中测试候选修饰来评价。具有候选连接结构域的gRNA可以在如下阐述的系统中进行评价,所述候选连接结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选连接结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,连接结构域包含典型地邻近于第一互补结构域的3’端和/或第二互补结构域的5’端或在其1、2或3个核苷酸内的双链体区域。在这些实施例的某些中,连接区域的双链体区域的长度为10+/-5、15+/-5、20+/-5、20+/-10或30+/-5bp。在某些实施例中,连接结构域的双链体区域的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14或15bp。在某些实施例中,形成连接结构域的双链体区域的序列是完全互补的。在其他实施例中,形成双链体区域的一个或两个序列含有与其他双链体序列不互补的一个或多个核苷酸(例如,1、2、3、4、5、6、7或8个核苷酸)。
5'延伸结构域
在某些实施例中,如本文所披露的模块化gRNA包含5'延伸结构域,即第二互补结构域的5'的一个或多个另外的核苷酸(参见例如,图1A)。在某些实施例中,5'延伸结构域的长度为2至10或更多、2至9、2至8、2至7、2至6、2至5或2至4个核苷酸,并且在这些实施例的某些中,5'延伸结构域的长度为2、3、4、5、6、7、8、9或10个或更多个核苷酸。
在某些实施例中,5’延伸结构域核苷酸不包含修饰,例如以下提供的类型的修饰。然而,在某些实施例中,5’延伸结构域包含一个或多个修饰,例如,使其较不易降解或更生物相容(例如,更低的免疫原性)的修饰。作为举例,5’延伸结构域的骨架可以用硫代磷酸酯、或如下阐述的其他一个或多个修饰来修饰。在某些实施例中,5’延伸结构域的核苷酸可以包含2’修饰(例如,在核糖上的2’位置处的修饰),例如2-乙酰化,例如2’甲基化,或如下阐述的其他一个或多个修饰。
在某些实施例中,5’延伸结构域可以包含多达1、2、3、4、5、6、7或8个修饰。在某些实施例中,5’延伸结构域包含其5’端的5个核苷酸内的多达1、2、3或4个修饰,例如在模块化gRNA分子中。在某些实施例中,5’延伸结构域包含其3’端的5个核苷酸内的多达1、2、3或4个修饰,例如在模块化gRNA分子中。
在某些实施例中,5’延伸结构域包含在两个连续核苷酸处的修饰,例如5’延伸结构域的5’端的5个核苷酸内、5’延伸结构域的3’端的5个核苷酸内、或远离5’延伸结构域的一端或两端超过5个核苷酸的两个连续核苷酸。在某些实施例中,在5’延伸结构域的5’端的5个核苷酸内、5’延伸结构域的3’端的5个核苷酸内、或在远离5’延伸结构域的一端或两端超过5个核苷酸的区域内没有两个连续核苷酸被修饰。在某些实施例中,在5’延伸结构域的5’端的5个核苷酸内、5’延伸结构域的3’端的5个核苷酸内、或在远离5’延伸结构域的一端或两端超过5个核苷酸的区域内没有核苷酸被修饰。
可以选择5’延伸结构域中的修饰以便不干扰gRNA分子功效,这可以通过在如下阐述的系统中测试候选修饰来评价。具有候选5’延伸结构域的gRNA可以在如下阐述的系统中进行评价,所述候选5’延伸结构域具有选定的长度、序列、互补程度、或修饰程度。候选5’延伸结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,5'延伸结构域与参考5'延伸结构域(例如天然存在的(例如,化脓链球菌、金黄色葡萄球菌或嗜热链球菌)5'延伸结构域)、或本文所述的5'延伸结构域(例如,来自图1A-1G))具有至少60%、70%、80%、85%、90%或95%的同源性,或与其相差不多于1、2、3、4、5、或6个核苷酸。
近端结构域
图1A-1G提供了近端结构域的实例。
在某些实施例中,近端结构域的长度为5至20个或更多个核苷酸,例如长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个核苷酸。在这些实施例的某些中,近端结构域的长度为6+/-2、7+/-2、8+/-2、9+/-2、10+/-2、11+/-2、12+/-2、13+/-2、14+/-2、14+/-2、16+/-2、17+/-2、18+/-2、19+/-2、或20+/-2个核苷酸。在某些实施例中,近端结构域的长度为5至20、7至18、9至16、或10至14个核苷酸。
在某些实施例中,近端结构域可以与天然存在的近端结构域共享同源性,或从其衍生。在这些实施例的某些中,近端结构域与本文所披露的近端结构域(例如化脓链球菌、金黄色葡萄球菌或嗜热链球菌)近端结构域,包括图1A-1G所阐述的那些)具有至少50%、60%、70%、80%、85%、90%或95%的同源性,或与其相差不多于1、2、3、4、5或6个核苷酸。
在某些实施例中,近端结构域不包含任何修饰。在其他实施例中,近端结构域或其中的一个或多个核苷酸具有修饰,包括但不限于本文所阐述的修饰。在某些实施例中,近端结构域的一个或多个核苷酸可以包含2'修饰(例如在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰近端结构域的骨架。在某些实施例中,对近端结构域的一个或多个核苷酸的修饰使得近端结构域和/或包含近端结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,近端结构域包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,近端结构域包括其5'和/或3'端的五个核苷酸内的1、2、3或4个修饰。在某些实施例中,近端结构域包含在两个或更多个连续核苷酸处的修饰。
在某些实施例中,选择对近端结构域中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过在如下阐述的系统中测试候选修饰来评价。具有候选近端结构域的gRNA可以在如下阐述的系统中进行评价,所述候选近端结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选近端结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
尾部结构域
广谱的尾部结构域适于在本文所披露的gRNA分子中使用。图1A和1C-1G提供了这种尾部结构域的实例。
在某些实施例中,不存在尾部结构域。在其他实施例中,尾部结构域的长度为1至100个或更多个核苷酸,例如长度为1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个核苷酸。在某些实施例中,尾部结构域的长度为1至5、1至10、1至15、1至20、1至50、10至100、20至100、10至90、20至90、10至80、20至80、10至70、20至70、10至60、20至60、10至50、20至50、10至40、20至40、10至30、20至30、20至25、10至20或10至15个核苷酸。在某些实施例中,尾部结构域的长度为5+/-5、10+/-5、20+/-10、20+/-5、25+/-10、30+/-10、30+/-5、40+/-10、40+/-5、50+/-10、50+/-5、60+/-10、60+/-5、70+/-10、70+/-5、80+/-10、80+/-5、90+/-10、90+/-5、100+/-10或100+/-5个核苷酸。
在某些实施例中,尾部结构域可以与天然存在的尾部结构域或天然存在的尾部结构域的5'端共享同源性,或从其衍生。在这些实施例的某些中,尾部结构域与本文所披露的天然存在的尾部结构域(例如化脓链球菌、金黄色葡萄球菌或嗜热链球菌尾部结构域,包括图1A和1C-1G所阐述的那些)具有至少50%、60%、70%、80%、85%、90%或95%的同源性,或与其相差不多于1、2、3、4、5或6个核苷酸。
在某些实施例中,尾部结构域包括彼此互补,并且在至少一些生理条件下形成双链体区域的序列。在这些实施例的某些中,尾部结构域包含尾部双链体结构域,其可以形成尾部双链体区域。在某些实施例中,尾部双链体区域的长度为3、4、5、6、7、8、9、10、11或12bp。在某些实施例中,尾部结构域包含不形成双链体的尾部双链体结构域的3'的单链结构域。在这些实施例的某些中,单链结构域的长度为3至10个核苷酸(例如3、4、5、6、7、8、9、10个)或长度为4至6个核苷酸。
在某些实施例中,尾部结构域不包含任何修饰。在其他实施例中,尾部结构域或其中的一个或多个核苷酸具有修饰,包括但不限于本文所阐述的修饰。在某些实施例中,尾部结构域的一个或多个核苷酸可以包含2'修饰(例如在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰尾部结构域的骨架。在某些实施例中,对尾部结构域的一个或多个核苷酸的修饰使得尾部结构域和/或包含尾部结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,尾部结构域包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,尾部结构域包括其5'和/或3'端的五个核苷酸内的1、2、3或4个修饰。在某些实施例中,尾部结构域包含在两个或更多个连续核苷酸处的修饰。
在某些实施例中,选择对尾部结构域中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过测试如下阐述的候选修饰来评价。具有候选尾部结构域的gRNA可以使用如下阐述的系统进行评价,所述候选尾部结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选尾部结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,尾部结构域包括在3’端与体外或体内转录方法相关的核苷酸。当将T7启动子用于gRNA的体外转录时,这些核苷酸可以是DNA模板的3’端前存在的任何核苷酸。当将U6启动子用于体内转录时,这些核苷酸可以是序列UUUUUU。当将H1启动子用于转录时,这些核苷酸可以是序列UUUU。当使用替代的pol-III启动子时,这些核苷酸可以是各种数量的尿嘧啶碱基,这取决于例如pol-III启动子的终止信号,或者它们可以包括替代碱基。
在某些实施例中,所述近端结构域和尾部结构域一起包含SEQ ID NO:32、33、34、35、36或37所示的序列,由其组成或基本上由其组成。
示例性单分子/嵌合gRNA
在某些实施例中,如本文所披露的单分子或嵌合gRNA具有结构:5'[靶向结构域]-[第一互补结构域]-[连接结构域]-[第二互补结构域]-[近端结构域]-[尾部结构域]-3',其中:
靶向结构域包含核心结构域和任选地第二结构域,并且长度为10至50个核苷酸;
第一互补结构域的长度为5至25个核苷酸,并且在某些实施例中,与本文所披露的参考第一互补结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性;
连接结构域的长度为1至5个核苷酸;
第二互补结构域的长度为5至27个核苷酸,并且在某些实施例中,与本文所披露的参考第二互补结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性;
近端结构域的长度为5至20个核苷酸,并且在某些实施例中,与本文所披露的参考近端结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性;并且
尾部结构域是不存在的或是长度为1至50个核苷酸的核苷酸序列,并且在某些实施例中,与本文所披露的参考尾部结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性。
在某些实施例中,如本文所披露的单分子gRNA包含,优选地从5’到3':
靶向结构域,其例如包含10-50个核苷酸;
第一互补结构域,其例如包含15、16、17、18、19、20、21、22、23、24、25、或26个核苷酸;
连接结构域;
第二互补结构域;
近端结构域;以及
尾部结构域,
其中,
(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;
(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;或
(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,来自(a)、(b)、和/或(c)的序列与天然存在的gRNA的相应序列或与本文所述的gRNA具有至少50%、60%、70%、75%、80%、85%、90%、95%或99%的同源性。
在某些实施例中,当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸。
在某些实施例中,所述第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸。
在某些实施例中,第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域由16、17、18、19、20、21、22、23、24、25或26个与靶结构域或其部分互补或部分互补的核苷酸(例如,16、17、18、19、20、21、22、23、24、25或26个连续核苷酸)组成,基本上由其组成或包含其,例如,靶向结构域的长度为16、17、18、19、20、21、22、23、24、25或26个核苷酸。在这些实施例的某些中,靶向结构域在靶向结构域的整个长度、靶结构域的整个长度或两者上与靶结构域互补。
在某些实施例中,本文所披露的单分子或嵌合gRNA分子(包含靶向结构域、第一互补结构域、连接结构域、第二互补结构域、近端结构域以及任选地尾部结构域)包含SEQ IDNO:42所示的核苷酸序列,其中靶向结构域被列为20个N(残基1-20)但长度范围可以从16至26个核苷酸,并且其中最后的六个残基(残基97-102)表示U6启动子的终止信号,但可以不存在或数目更少。在某些实施例中,所述单分子或嵌合gRNA分子是化脓链球菌gRNA分子。
在某些实施例中,本文所披露的单分子或嵌合gRNA分子(包含靶向结构域、第一互补结构域、连接结构域、第二互补结构域、近端结构域以及任选地尾部结构域)包含SEQ IDNO:38所示的核苷酸序列,其中靶向结构域被列为20个N(残基1-20)但长度范围可以从16至26个核苷酸,并且其中最后的六个残基(残基97-102)表示U6启动子的终止信号,但可以不存在或数目更少。在某些实施例中,所述单分子或嵌合gRNA分子是金黄色葡萄球菌gRNA分子。
示例性嵌合gRNA的序列和结构也示于图1H-1I中。
示例性模块化gRNA
在某些实施例中,本文所披露的模块化gRNA包含:
第一链,其包含,优选地从5’到3’:
靶向结构域,其例如包含15、16、17、18、19、20、21、22、23、24、25、或26个核苷酸;
第一互补结构域;以及
第二条链,其包含,优选地从5'到3':
任选地,5’延伸结构域;
第二互补结构域;
近端结构域;以及
尾部结构域,
其中:
(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;
(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;或
(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,来自(a)、(b)、或(c)的序列与天然存在的gRNA的相应序列或与本文所述的gRNA具有至少60%、75%、80%、85%、90%、95%或99%的同源性。
在某些实施例中,当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸。
在某些实施例中,所述第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸。
在某些实施例中,第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含、具有、或由16、17、18、19、20、21、22、23、24、25或26个与靶结构域具有互补性的核苷酸(例如,16、17、18、19、20、21、22、23、24、25或26个连续核苷酸)组成,例如,靶向结构域的长度为16、17、18、19、20、21、22、23、24、25或26个核苷酸。
在某些实施例中,靶向结构域由16、17、18、19、20、21、22、23、24、25或26个与靶结构域或其部分互补的核苷酸(例如,16、17、18、19、20、21、22、23、24、25或26个连续核苷酸)组成,基本上由其组成或包含其。在这些实施例的某些中,靶向结构域在靶向结构域的整个长度、靶结构域的整个长度或两者上与靶结构域互补。
在某些实施例中,靶向结构域包含16个与靶结构域具有互补性的核苷酸(例如,16个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为16个核苷酸。在这些实施例的某些实施例中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含17个与靶结构域具有互补性的核苷酸(例如,17个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为17个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含18个与靶结构域具有互补性的核苷酸(例如,18个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为18个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含19个与靶结构域具有互补性的核苷酸(例如,19个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为19个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含20个与靶结构域具有互补性的核苷酸(例如,20个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为20个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含21个与靶结构域具有互补性的核苷酸(例如,21个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为21个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含22个与靶结构域具有互补性的核苷酸(例如,22个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为22个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含23个与靶结构域具有互补性的核苷酸(例如,23个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为23个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含24个与靶结构域具有互补性的核苷酸(例如,24个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为24个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含25个与靶结构域具有互补性的核苷酸(例如,25个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为25个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含26个与靶结构域具有互补性的核苷酸(例如,26个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为26个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3’存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3’存在至少16、19、21、26、31、32、36、41、46、50、51或54个核苷酸,所述核苷酸与该第一互补结构域的相应核苷酸互补。
gRNA递送
在本文提供的方法的某些实施例中,所述方法包括递送如本文所述的一种或多种(例如,两种、三种或四种)gRNA分子。在某些这些实施例中,通过静脉内注射、肌内注射、皮下注射或吸入递送gRNA分子。
用于设计gRNA的方法
提供了用于选择、设计和验证用于如本文所述的gRNA的靶向结构域的方法。本文还提供了用于掺入gRNA的示例性靶向结构域。
先前已经描述了用于靶序列的选择和验证以及脱靶分析的方法(参见例如,Mali2013;Hsu 2013;Fu 2014;Heigwer 2014;Bae 2014;Xiao 2014)。例如,软件工具可以用来优化与使用者的靶序列对应的潜在靶向结构域的选择,例如,以跨基因组最小化总脱靶活性。脱靶活性可以不同于切割。对于使用化脓链球菌Cas9的每个可能的靶向结构域选择,所述工具可以鉴别跨基因组所有脱靶序列(以上的NAG或NGG PAM),所述脱靶序列含有高达一定数量(例如,1、2、3、4、5、6、7、8、9或10)的错配碱基对。在每个脱靶序列处的切割效率是可以预测的,例如,使用实验衍生的加权方案。然后将每个可能的靶向结构域进行排序,根据其总的预测的脱靶切割;最高排名的靶向结构域表示可能具有最大中靶切割和最少脱靶切割的那些。其他功能(例如,用于CRISPR构建的自动化试剂设计、用于中靶Surveyor测定的引物设计、和用于高通量检测以及经由下一代测序对脱靶切割进行定量的引物设计)也可以被包括在所述工具中。可以使用本领域已知和/或本文所阐述的方法对候选靶向结构域和包含那些靶向结构域的gRNA进行功能评价。
作为非限制性实例,使用DNA序列检索算法鉴定用于与化脓链球菌Cas9和金黄色葡萄球菌Cas9一起使用的gRNA中使用的靶向结构域。针对化脓链球菌靶向,设计了17-mer和20-mer靶向结构域,同时针对金黄色葡萄球菌靶向,设计了18-mer、19-mer、20-mer、21-mer、22-mer、23-mer、和24-mer靶向结构域。使用基于公共工具cas-offinder(Bae 2014)的定制gRNA设计软件进行gRNA设计。该软件在计算指导物的全基因组脱靶倾向之后为指导物打分。典型地,针对长度范围从17至24的指导物考虑范围从完美匹配至7个错配的匹配。一旦经计算确定了脱靶位点,便计算每种指导物的总分并且使用web界面以表格输出总结。除鉴定与PAM序列邻近的潜在靶位点之外,所述软件还鉴定与所选靶位点相差1、2、3个或多于3个核苷酸的所有PAM邻近序列。从UCSC基因组浏览器获得HBG1和HBG2调控区域基因组DNA序列,并且使用可公开获得的RepeatMasker程序针对重复元件对序列进行筛选。RepeatMasker针对重复元件和具有低复杂性的区域对输入DNA序列进行检索。输出是存在于给定查询序列中的重复的详细注释。
识别后,基于他们到靶位点的距离、他们的正交性、和5'G的存在(基于在人类基因组中含有相关PAM的靠近匹配的识别,例如在化脓链球菌的情况下是NGG PAM,在金黄色葡萄球菌的情况下是NNGRRT(SEQ ID NO:204)或NNGRRV(SEQ ID NO:205)PAM),将靶向结构域排成等级。正交性是指在人类基因组中含有与靶序列最小数量的错配的序列的数量。“高水平的正交性”或“良好的正交性”可以例如是指20-mer靶向结构域,其除预期靶之外在人类基因组中既没有一致序列,又没有含有靶序列中的一个或两个错配的任何序列。具有良好正交性的靶向结构域被选择用于最小化脱靶DNA切割。
针对单-gRNA核酸酶切割并且针对双-gRNA成对的“切口酶”策略两者对靶向结构域进行鉴定。用于选择靶向结构域并且确定哪些靶向结构域可以用于双-gRNA成对的“切口酶”策略的标准是基于两个考虑:
(1)靶向结构域对应该在DNA上定向成使得PAM朝外并且用D10A Cas9切口酶切割将产生5’突出端;和
(2)假设用双切口酶对切割将以合理频率导致整个插入序列的缺失。然而,用双切口酶对切割还可以仅在所述gRNA之一的位点处导致indel突变。可以针对它们如何有效地去除整个序列对比引起一个靶向结构域的靶位点处的indel突变对候选对成员进行测试。
靶向结构域用于缺失HBG1 c.-114至-102
识别了结合本文披露的方法用于在gRNA中用于缺失HBG1的c.-114至-102的靶向结构域并将其针对化脓链球菌和金黄色葡萄球菌排序成4个等级。
对于化脓链球菌,基于(1)从靶位点任一末端上游或下游的距离(即,HBG1 c.-114至-102),特异地是在靶位点任一末端的400bp内,(2)高水平的正交性,和(3)5'G的存在来选择等级1靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG1 c.-114至-102),特异地是在靶位点任一末端的400bp内,和(2)高水平的正交性来选择等级2靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG1 c.-114至-102),特异地是在靶位点任一末端的400bp内,和(2)5'G的存在来选择等级3靶向结构域。基于从靶位点任一末端上游或下游的距离(即,HBG1 c.-114至-102),特异地是在靶位点任一末端的400bp内来选择等级4靶向结构域。
对于金黄色葡萄球菌,基于(1)从靶位点任一末端上游或下游的距离(即,HBG1c.-114至-102),特异地是在靶位点任一末端的400bp内,(2)高水平的正交性,(3)5'G的存在,和(4)具有序列NNGRRT(SEQ ID NO:204)的PAM来选择等级1靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG1 c.-114至-102),特异地是在靶位点任一末端的400bp内,(2)高水平的正交性,和(3)具有序列NNGRRT(SEQ ID NO:204)的PAM来选择等级2靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG1 c.-114至-102),特异地是在靶位点任一末端的400bp内,和(2)具有序列NNGRRT(SEQ ID NO:204)的PAM来选择等级3靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG1 c.-114至-102),特异地是在靶位点任一末端的400bp内,和(2)具有序列NNGRRV(SEQ ID NO:205)的PAM来选择等级4靶向结构域。
需注意等级是非包容性的(对于所述策略,每种靶向结构域仅被列出一次)。在某些情况下,基于具体等级的标准未识别出靶向结构域。识别的靶向结构域总结在表6中。
表6:化脓链球菌和金黄色葡萄球菌靶向结构域的核苷酸序列
靶向结构域用于缺失HBG2 c.-114至-102
识别了结合本文披露的方法用于在gRNA中用于缺失HBG2的c.-114至-102的靶向结构域并将其针对化脓链球菌和金黄色葡萄球菌排序成4个等级。
对于化脓链球菌,基于(1)从靶位点任一末端上游或下游的距离(即,HBG2 c.-114至-102),特异地是在靶位点任一末端的400bp内,(2)高水平的正交性,和(3)5'G的存在来选择等级1靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG2 c.-114至-102),特异地是在靶位点任一末端的400bp内,和(2)高水平的正交性来选择等级2靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG2 c.-114至-102),特异地是在靶位点任一末端的400bp内,和(2)5'G的存在来选择等级3靶向结构域。基于从靶位点任一末端上游或下游的距离(即,HBG2 c.-114至-102),特异地是在靶位点任一末端的400bp内来选择等级4靶向结构域。
对于金黄色葡萄球菌,基于(1)从靶位点任一末端上游或下游的距离(即,HBG2c.-114至-102),特异地是在靶位点任一末端的400bp内,(2)高水平的正交性,(3)5'G的存在,和(4)具有序列NNGRRT(SEQ ID NO:204)的PAM来选择等级1靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG2 c.-114至-102),特异地是在靶位点任一末端的400bp内,(2)高水平的正交性,和(3)具有序列NNGRRT(SEQ ID NO:204)的PAM来选择等级2靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG2 c.-114至-102),特异地是在靶位点任一末端的400bp内,和(2)具有序列NNGRRT(SEQ ID NO:204)的PAM来选择等级3靶向结构域。基于(1)从靶位点任一末端上游或下游的距离(即,HBG2 c.-114至-102),特异地是在靶位点任一末端的400bp内,和(2)具有序列NNGRRV(SEQ ID NO:205)的PAM来选择等级4靶向结构域。
需注意等级是非包容性的(对于所述策略,每种靶向结构域仅被列出一次)。在某些情况下,基于具体等级的标准未识别出靶向结构域。识别的靶向结构域总结在表7中。
表7:化脓链球菌和金黄色葡萄球菌靶向结构域的核苷酸序列
在某些实施例中,两种或更多种(例如,三种或四种)gRNA分子与一种Cas9分子一起使用。在另一个实施例中,当两种或更多种(例如,三种或四种)gRNA与两种或更多种Cas9分子一起使用时,至少一种Cas9分子来自与其他一种或多种Cas9分子不同的物种。例如,当两个gRNA分子与两个Cas9分子一起使用时,一个Cas9分子可以来自一种物种并且另一个Cas9分子可以来自不同的物种。根据需要,两种Cas9种类均用于产生单链或双链断裂。
本文所述表格中的任何靶向结构域可与产生单链断裂的Cas9分子(即,化脓链球菌或金黄色葡萄球菌Cas9切口酶)或产生双链断裂的Cas9分子一起使用(即,化脓链球菌或金黄色葡萄球菌Cas9核酸酶)。
当两个gRNA设计用于两个Cas9分子时,两个Cas9分子可能是不同的物种。根据希望,两种Cas9种类均可用于产生单链或双链断裂。
本文中考虑了任何上游gRNA可与本文所述的任何下游gRNA配对。当设计用于一种Cas9的上游gRNA与设计用于不同种类的Cas9的下游gRNA配对时,根据希望,两种Cas9种都用于产生单链或双链断裂。
RNA指导的核酸酶
根据本披露内容的RNA指导的核酸酶包括但不限于天然存在的2类CRISPR核酸酶,例如Cas9和Cpf1,以及由其衍生或获得的其他核酸酶。在功能上,RNA指导的核酸酶定义为以下核酸酶:(a)与gRNA相互作用(例如,复合);和(b)与gRNA一起,与DNA的靶向区域有关,并任选地切割或修饰,所述DNA靶向区域包括(i)与gRNA的靶向结构域互补的序列,和任选地,(ii)PAM。RNA指导的核酸酶可以在广义上定义为他们的PAM特异性和切割活性,即使在具有相同PAM特异性或切割活性的各个RNA指导的核酸酶之间可能存在变异。技术人员可以理解,本披露内容的一些方面涉及可以使用具有某些PAM特异性和/或切割活性的任何合适的RNA指导的核酸酶实施的系统、方法和组合物。因此,除非另有说明,术语RNA指导的核酸酶应理解为通用术语,并不限于任何特定类型(例如,Cas9与Cpf1),物种(例如,化脓链球菌与金黄色葡萄球菌)或RNA指导的核酸酶的变异(例如,全长与截短的或分裂;天然存在的PAM特异性与工程化PAM特异性等)。
PAM序列的名称来源于与gRNA靶向结构域(或“间隔子”)互补的“原型间隔区域”序列的顺序关系。与原型间隔子序列一起,PAM序列定义特定RNA指导的核酸酶/gRNA组合的靶向结构域或序列。
各种RNA指导的核酸酶可能需要PAM和原型间隔子之间的不同顺序关系。通常,Cas9s识别相对于顶部或互补链可视化的原型间隔子3'的PAM序列:
5'-------------------[原型间隔子]----------------------------3’
3'-----------------------------------[PAM]-------------------5’
另一方面,Cpf1通常识别原型间隔子5'的PAM序列:
5'-----------------------------[原型间隔子]------------------3’
3'--------------------[PAM]-----------------------------------5’
除了识别PAM和原型间隔子的特异顺序定向外,RNA指导的核酸酶还可以识别特异的PAM序列。例如,金黄色葡萄球菌Cas9识别NNGRRT或NNGRRV的PAM序列,其中N个残基紧邻gRNA靶向结构域识别的结构域的3'。化脓链球菌Cas9识别NGG PAM序列。并且新凶手弗朗西斯菌(F.novicida)Cpf1识别TTN PAM序列。已经识别了多种RNA指导的核酸酶的PAM序列,并且Shmakov 2015描述了用于识别新的PAM序列的策略。还应该注意的是,工程化的RNA指导的核酸酶可具有不同于参考分子的PAM特异性的PAM特异性(例如,在工程化的RNA指导的核酸酶的情况下,参考分子可以是天然存在的变体,其中RNA指导的核酸酶是衍生的,或与工程化的RNA指导的核酸酶具有最大的氨基酸序列同源性的天然存在的变体)。
除了他们的PAM特异性外,RNA指导的核酸酶还可以通过他们的DNA切割活性来表征:天然存在的RNA指导的核酸酶典型地在靶核标酸中形成DSB,但是已经产生仅产生SSB的工程化的变体(如上所讨论的)Ran 2013年,通过引用结合在此),或完全不切割的那些。
Cas9分子
多个物种的Cas9分子可以用于本文所述的方法和组合物中。尽管化脓链球菌和金黄色葡萄球菌Cas9分子是本披露的大部分的主题,也可以使用在此列出的其他物种的Cas9蛋白质的、从中衍生的、或基于其的Cas9分子。这些包括例如来自以下项的Cas9分子:燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)、琥珀酸放线杆菌(Actinobacillus succinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属(Actinomyces sp.)、cycliphilus denitrificans、Aminomonas paucivorans、蜡样芽孢杆菌(Bacillus cereus)、史氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌(Bacillus thuringiensis)、拟杆菌属(Bacteroides sp.)、Blastopirellula marina、慢生根瘤菌属(Bradyrhizobium sp.)、侧孢短芽孢杆菌(Brevibacillus laterosporus)、结肠弯曲菌(Campylobacter coli)、空肠弯曲菌(Campylobacter jejuni)、红嘴鸥弯曲杆菌(Campylobacter lari)、Candidatus puniceispirillum、解纤维梭菌(Clostridiumcellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒杆菌(Corynebacterium accolens)、白喉棒状杆菌(Corynebacterium diphtheria)、Corynebacterium matruchotii、恒雄芝氏沟鞭藻玫瑰杆菌(Dinoroseobacter shibae)、细长真杆菌(Eubacterium dolichum)、γ-变形菌纲(gamma proteobacterium)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、副流感嗜血杆菌(Haemophilusparainfluenzae)、嗜血弯曲杆菌(Haemophilus sputorum)、Helicobacter canadensis、同性恋螺杆菌(Helicobacter cinaedi)、鼬鼠螺杆菌(Helicobacter mustelae)、Ilyobacterpolytropus、金氏金氏菌(Kingella kingae)、卷曲乳酸杆菌(Lactobacillus crispatus)、伊氏李斯特菌(Listeria ivanovii)、单核细胞增生李斯特菌(Listeria monocytogenes)、李斯特氏菌科菌(Listeriaceae bacterium)、甲基孢囊菌属(Methylocystis sp.)、甲烷氧化菌(Methylosinus trichosporium)、羞怯动弯杆菌(Mobiluncus mulieris)、奈瑟氏杆菌(Neisseria bacilliformis)、灰色奈瑟球菌(Neisseria cinerea)、浅黄色奈瑟氏菌(Neisseria flavescens)、乳糖奈瑟氏菌(Neisseria lactamica)、奈瑟氏菌属(Neisseriasp.)、瓦茨瓦尔西奈瑟氏菌(Neisseria wadsworthii)、亚硝化单胞菌属(Nitrosomonassp.)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、出血败血性巴士杆菌(Pasteurella multocida)、Phascolarctobacterium succinatutens、Ralstoniasyzygii、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属(Rhodovulumsp.)、米氏西蒙斯氏菌(Simonsiella muelleri)、鞘氨醇单胞菌属(Sphingomonas sp.)、Sporolactobacillus vineae、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属(Streptococcus sp.)、Subdoligranulum sp.、运动替斯崔纳菌(Tistrella mobilis)、密螺旋体属(Treponema sp.)或Verminephrobacter eiseniae。
Cas9结构域
已经确定了两种不同的天然存在的细菌Cas9分子(Jinek 2014)和具有指导RNA(例如,crRNA和tracrRNA的合成融合体)的化脓链球菌Cas9(Nishimasu 2014;Anders2014)的晶体结构。
天然存在的Cas9分子包含两种叶片:识别(REC)叶片和核酸酶(NUC)叶片;其各自进一步包含本文所述的结构域。图8A-8B提供了重要的Cas9结构域的一级结构的组织的示意图。贯穿本披露使用的由每个结构域所涵盖的结构域命名和氨基酸残基编号是如先前(Nishimasu 2014)所描述的。氨基酸残基的编号是参照来自化脓链球菌的Cas9。
REC叶片包含富精氨酸的桥螺旋(BH)、REC1结构域、和REC2结构域。REC叶片与其他已知蛋白不享有结构相似性,指示它是Cas9特异性功能结构域。BH结构域是长的α螺旋且富精氨酸的区域并且包含化脓链球菌Cas9(SEQ ID NO:2)的氨基酸60-93。REC1结构域对于例如gRNA或tracrRNA的重复:抗重复双链体的识别而言是重要的,并且因此对于识别靶序列的Cas9活性而言是关键的。REC1结构域在化脓链球菌Cas9(SEQ ID NO:2)的氨基酸94至179和308至717处包含两个REC1基序。尽管在线性一级结构中被REC2结构域分开,这两个REC1结构域在三级结构中组装以形成REC1结构域。REC2结构域、或其部分在重复:抗重复双链体的识别中也可以发挥作用。REC2结构域包含化脓链球菌Cas9(SEQ ID NO:2)的氨基酸180-307。
NUC叶片包含RuvC结构域、HNH结构域和PAM相互作用(PI)结构域。RuvC结构域与逆转录病毒整合酶超家族成员享有结构相似性,并且切割靶核酸分子的单链(例如,非互补链)。RuvC结构域由化脓链球菌Cas9(SEQ ID NO:2)的分别在氨基酸1-59、718-769和909-1098处的三个分割RuvC基序(RuvCI、RuvCII和RuvCIII,在本领域其通常分别称为RuvCI结构域或N-末端RuvC结构域、RuvCII结构域和RuvCIII结构域)组装而来。与REC1结构域类似,这三个RuvC基序被一级结构中的其他结构域线性分开。然而,在三级结构中,这三个RuvC基序组装并形成RuvC结构域。HNH结构域与HNH内切核酸酶享有结构相似性,并且切割靶核酸分子的单链(例如,非互补链)。HNH结构域位于RuvC II-III基序之间并且包含化脓链球菌Cas9(SEQ ID NO:2)的氨基酸775-908。PI结构域与靶核酸分子的PAM相互作用,并且包含化脓链球菌Cas9(SEQ ID NO:2)的氨基酸1099-1368。
RuvC样结构域和HNH样结构域
在某些实施例中,Cas9分子或Cas9多肽包含HNH样结构域和RuvC样结构域,并且在这些实施例的某些中,切割活性取决于RuvC样结构域和HNH样结构域。Cas9分子或Cas9多肽可以包含RuvC样结构域和HNH样结构域中的一者或多者。在某些实施例中,Cas9分子或Cas9多肽包含RuvC样结构域(例如,如下所述的RuvC样结构域)和/或HNH样结构域(例如,如下所述的HNH样结构域)。
RuvC样结构域
在某些实施例中,RuvC样结构域切割靶核酸分子的单链(例如,非互补链)。Cas9分子或Cas9多肽可以包括多于一个RuvC样结构域(例如,一个、两个、三个或更多个RuvC样结构域)。在某些实施例中,RuvC样结构域的长度为至少5、6、7、8个氨基酸但长度不多于20、19、18、17、16或15个氨基酸。在某些实施例中,Cas9分子或Cas9多肽包含长度为约10至20个氨基酸(例如,约15个氨基酸)的N-末端RuvC样结构域。
N-末端RuvC样结构域
一些天然存在的Cas9分子包含多于一个RuvC样结构域,其中切割取决于N-末端RuvC样结构域。因此,Cas9分子或Cas9多肽可以包含N-末端RuvC样结构域。示例性N-末端RuvC样结构域如下所述。
在某些实施例中,Cas9分子或Cas9多肽包含N-末端RuvC样结构域,所述N-末端RuvC样结构域包含具有化学式I的氨基酸序列:
D-X1-G-X2-X3-X4-X5-G-X6-X7-X8-X9(SEQ ID NO:20),
其中
X1选自I、V、M、L和T(例如,选自I、V和L);
X2选自T、I、V、S、N、Y、E和L(例如,选自T、V和I);
X3选自N、S、G、A、D、T、R、M和F(例如,A或N);
X4选自S、Y、N和F(例如,S);
X5选自V、I、L、C、T和F(例如,选自V、I和L);
X6选自W、F、V、Y、S和L(例如,W);
X7选自A、S、C、V和G(例如,选自A和S);
X8选自V、I、L、A、M和H(例如,选自V、I、M和L);并且
X9选自任何氨基酸或是不存在的(例如,选自T、V、I、L、Δ、F、S、A、Y、M和R,或例如,选自T、V、I、L和Δ)。
在某些实施例中,N-末端RuvC样结构域与SEQ ID NO:20的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域是有切割能力的。在其他实施例中,N-末端RuvC样结构域是无切割能力的。
在某些实施例中,Cas9分子或Cas9多肽包含N-末端RuvC样结构域,所述N-末端RuvC样结构域包含具有化学式II的氨基酸序列:
D-X1-G-X2-X3-S-X5-G-X6-X7-X8-X9(SEQ ID NO:21),
其中
X1选自I、V、M、L和T(例如,选自I、V和L);
X2选自T、I、V、S、N、Y、E和L(例如,选自T、V和I);
X3选自N、S、G、A、D、T、R、M和F(例如,A或N);
X5选自V、I、L、C、T和F(例如,选自V、I和L);
X6选自W、F、V、Y、S和L(例如,W);
X7选自A、S、C、V和G(例如,选自A和S);
X8选自V、I、L、A、M和H(例如,选自V、I、M和L);并且
X9选自任何氨基酸或是不存在的(例如,选自T、V、I、L、Δ、F、S、A、Y、M和R,或选自例如,T、V、I、L和Δ)。
在某些实施例中,N-末端RuvC样结构域与SEQ ID NO:21的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域包含具有化学式III的氨基酸序列:
D-I-G-X2-X3-S-V-G-W-A-X8-X9(SEQ ID NO:22),
其中
X2选自T、I、V、S、N、Y、E和L(例如,选自T、V和I);
X3选自N、S、G、A、D、T、R、M和F(例如,A或N);
X8选自V、I、L、A、M和H(例如,选自V、I、M和L);并且
X9选自任何氨基酸或是不存在的(例如,选自T、V、I、L、Δ、F、S、A、Y、M和R,或选自例如,T、V、I、L和Δ)。
在某些实施例中,N-末端RuvC样结构域与SEQ ID NO:22的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域包含具有化学式IV的氨基酸序列:
D-I-G-T-N-S-V-G-W-A-V-X(SEQ ID NO:23),
其中
X是非极性烷基氨基酸或羟基氨基酸,例如,X选自V、I、L和T(例如,Cas9分子可以包含示于图2A-2G中的N-末端RuvC样结构域(描绘为Y))。
在某些实施例中,N-末端RuvC样结构域与SEQ ID NO:23的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域与本文(例如,在图3A-3B中)所披露的N-末端RuvC样结构域的序列相差多达1个但不多于2、3、4或5个残基。在一个实施例中,在图3A-3B中鉴定出的高度保守残基中的1个、2个、3个或全部是存在的。
在某些实施例中,N-末端RuvC样结构域与本文(例如,在图4A-4B中)所披露的N-末端RuvC样结构域的序列相差多达1个但不多于2、3、4或5个残基。在一个实施例中,在图4A-4B中识别出的高度保守残基中的1个、2个或全部是存在的。另外的RuvC样结构域
除了N-末端RuvC样结构域之外,Cas9分子或Cas9多肽可以包含一个或多个另外的RuvC样结构域。在某些实施例中,Cas9分子或Cas9多肽可以包含两个另外的RuvC样结构域。优选地,另外的RuvC样结构域的长度为至少5个氨基酸,并且例如长度为小于15个氨基酸,例如长度为5至10个氨基酸,例如长度为8个氨基酸。
另外的RuvC样结构域可以包含具有化学式V的氨基酸序列:
I-X1-X2-E-X3-A-R-E(SEQ ID NO:15),
其中
X1是V或H;
X2是I、L或V(例如,I或V);并且
X3是M或T。
在某些实施例中,另外的RuvC样结构域包含具有化学式VI的氨基酸序列:
I-V-X2-E-M-A-R-E(SEQ ID NO:16),
其中
X2是I、L或V(例如,I或V)(例如,Cas9分子或Cas9多肽可以包含示于图2A-2G中的另外的RuvC样结构域(描绘为B))。
另外的RuvC样结构域可以包含具有化学式VII的氨基酸序列:
H-H-A-X1-D-A-X2-X3(SEQ ID NO:17),
其中
X1是H或L;
X2是R或V;并且
X3是E或V。
在某些实施例中,另外的RuvC样结构域包含如下氨基酸序列:H-H-A-H-D-A-Y-L(SEQ ID NO:18)。
在某些实施例中,另外的RuvC样结构域与SEQ ID NO:15-18的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域侧翼的序列具有化学式VIII的氨基酸序列:
K-X1’-Y-X2’-X3’-X4’-Z-T-D-X9’-Y(SEQ ID NO:19),
其中
X1’选自K和P;
X2’选自V、L、I和F(例如,V、I和L);
X3’选自G、A和S(例如,G);
X4’选自L、I、V和F(例如,L);
X9’选自D、E、N和Q;并且
Z是N末端RuvC样结构域,例如,如上所述,例如具有5至20个氨基酸。
HNH样结构域
在某些实施例中,HNH样结构域切割双链核酸分子的单链互补结构域(例如,互补链)。在某些实施例中,HNH样结构域的长度为至少15、20或25个氨基酸但长度为不多于40、35或30个氨基酸,例如长度为20至35个氨基酸,例如长度为25至30个氨基酸。示例性的HNH样结构域如下所述。
在一个实施例中,Cas9分子或Cas9多肽包含HNH样结构域,所述HNH样结构域具有化学式IX的氨基酸序列:
X1-X2-X3-H-X4-X5-P-X6-X7-X8-X9-X10-X11-X12-X13-X14-X15-N-X16-X17-X18-X19-X20-X21-X22-X23-N(SEQ ID NO:25),
其中
X1选自D、E、Q和N(例如,D和E);
X2选自L、I、R、Q、V、M和K;
X3选自D和E;
X4选自I、V、T、A和L(例如,A、I和V);
X5选自V、Y、I、L、F和W(例如,V、I和L);
X6选自Q、H、R、K、Y、I、L、F和W;
X7选自S、A、D、T和K(例如,S和A);
X8选自F、L、V、K、Y、M、I、R、A、E、D和Q(例如,F);
X9选自L、R、T、I、V、S、C、Y、K、F和G;
X10选自K、Q、Y、T、F、L、W、M、A、E、G和S;
X11选自D、S、N、R、L和T(例如,D);
X12选自D、N和S;
X13选自S、A、T、G和R(例如,S);
X14选自I、L、F、S、R、Y、Q、W、D,K和H(例如,I、L和F);
X15选自D、S、I、N、E、A、H、F、L、Q、M、G、Y和V;
X16选自K、L、R、M、T和F(例如,L、R和K);
X17选自V、L、I、A和T;
X18选自L、I、V和A(例如,L和I);
X19选自T、V、C、E、S和A(例如,T和V);
X20选自R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H和A;
X21选自S、P、R、K、N、A、H、Q、G和L;
X22选自D、G、T、N、S、K、A、I、E、L、Q、R和Y;并且
X23选自K、V、A、E、Y、I、C、L、S、T、G、K、M、D和F。
在某些实施例中,HNH样结构域与SEQ ID NO:25的序列相差至少一个但不多于2、3、4、或5个残基。
在某些实施例中,HNH样结构域是有切割能力的。在某些实施例中,HNH样结构域是无切割能力的。
在某些实施例中,Cas9分子或Cas9多肽包含HNH样结构域,所述HNH样结构域包括具有化学式X的氨基酸序列:
X1-X2-X3-H-X4-X5-P-X6-S-X8-X9-X10-D-D-S-X14-X15-N-K-V-L-X19-X20-X21-X22-X23-N(SEQ ID NO:26),
其中
X1选自D和E;
X2选自L、I、R、Q、V、M和K;
X3选自D和E;
X4选自I、V、T、A和L(例如,A、I和V);
X5选自V、Y、I、L、F和W(例如,V、I和L);
X6选自Q、H、R、K、Y、I、L、F和W;
X8选自F、L、V、K、Y、M、I、R、A、E、D和Q(例如,F);
X9选自L、R、T、I、V、S、C、Y、K、F和G;
X10选自K、Q、Y、T、F、L、W、M、A、E、G和S;
X14选自I、L、F、S、R、Y、Q、W、D,K和H(例如,I、L和F);
X15选自D、S、I、N、E、A、H、F、L、Q、M、G、Y和V;
X19选自T、V、C、E、S和A(例如,T和V);
X20选自R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H和A;
X21选自S、P、R、K、N、A、H、Q、G和L;
X22选自D、G、T、N、S、K、A、I、E、L、Q、R和Y;并且
X23选自K、V、A、E、Y、I、C、L、S、T、G、K、M、D和F。
在某些实施例中,HNH样结构域与SEQ ID NO:26的序列相差1、2、3、4或5个残基。
在某些实施例中,Cas9分子或Cas9多肽包含HNH样结构域,所述HNH样结构域包括具有化学式XI的氨基酸序列:
X1-V-X3-H-I-V-P-X6-S-X8-X9-X10-D-D-S-X14-X15-N-K-V-L-T-X20-X21-X22-X23-N(SEQ ID NO:27),
其中
X1选自D和E;
X3选自D和E;
X6选自Q、H、R、K、Y、I、L和W;
X8选自F、L、V、K、Y、M、I、R、A、E、D和Q(例如,F);
X9选自L、R、T、I、V、S、C、Y、K、F和G;
X10选自K、Q、Y、T、F、L、W、M、A、E、G和S;
X14选自I、L、F、S、R、Y、Q、W、D,K和H(例如,I、L和F);
X15选自D、S、I、N、E、A、H、F、L、Q、M、G、Y和V;
X20选自R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H和A;
X21选自S、P、R、K、N、A、H、Q、G和L;
X22选自D、G、T、N、S、K、A、I、E、L、Q、R和Y;并且
X23选自K、V、A、E、Y、I、C、L、S、T、G、K、M、D和F。
在某些实施例中,HNH样结构域与SEQ ID NO:27的序列相差1、2、3、4或5个残基。
在某些实施例中,Cas9分子或Cas9多肽包含HNH样结构域,所述HNH样结构域具有化学式XII的氨基酸序列:
D-X2-D-H-I-X5-P-Q-X7-F-X9-X10-D-X12-S-I-D-N-X16-V-L-X19-X20-S-X22-X23-N(SEQID NO:28),
其中
X2选自I和V;
X5选自I和V;
X7选自A和S;
X9选自I和L;
X10选自K和T;
X12选自D和N;
X16选自R、K和L;
X19选自T和V;
X20选自S和R;
X22选自K、D和A;并且
X23选自E、K、G和N(例如,Cas9分子或Cas9多肽可以包含如本文所描述的HNH样结构域)。
在一个实施例中,HNH样结构域与SEQ ID NO:28的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,Cas9分子或Cas9多肽包含具有化学式XIII的氨基酸序列:
L-Y-Y-L-Q-N-G-X1’-D-M-Y-X2’-X3’-X4’-X5’-L-D-I-X6’-X7’-L-S-X8’-Y-Z-N-R-X9’-K-X10’-D-X11’-V-P(SEQ ID NO:24),
其中
X1’选自K和R;
X2’选自V和T;
X3’选自G和D;
X4’选自E、Q和D;
X5’选自E和D;
X6’选自D、N和H;
X7’选自Y、R和N;
X8’选自Q、D和N;
X9’选自G和E;
X10’选自S和G;
X11’选自D和N;并且
Z是HNH样结构域,例如,如以上所描述的。
在某些实施例中,Cas9分子或Cas9多肽包含与SEQ ID NO:24的序列相差多达1个但不多于2、3、4或5个残基的氨基酸序列。
在某些实施例中,HNH样结构域与本文(例如,在图5A-5C中)所披露的HNH样结构域的序列相差多达1个但不多于2、3、4或5个残基。在某些实施例中,在图5A-5C中识别出的高度保守残基中的1个或两者是存在的。
在某些实施例中,HNH样结构域与本文(例如,在图6A-6B中)所披露的HNH样结构域的序列相差多达1个但不多于2、3、4或5个残基。在一个实施例中,在图6A-6B中识别出的高度保守残基中的1个、2个或所有3个是存在的。
Cas9活性
在某些实施例中,Cas9分子或Cas9多肽能够切割靶核酸分子。典型地,野生型Cas9分子切割靶核酸分子的两条链。Cas9分子和Cas9多肽可以被工程化以改变核酸酶切割(或其他特性),例如以提供作为切口酶、或缺乏切割靶核酸能力的Cas9分子或Cas9多肽。能够切割靶核酸分子的Cas9分子或Cas9多肽在本文中称为eaCas9(酶促活性Cas9)分子或eaCas9多肽。
在某些实施例中,eaCas9分子或eaCas9多肽包括以下酶活性中的一种或多种:
(1)切口酶活性,即切割核酸分子的单链(例如,非互补链或互补链)的能力;
(2)双链核酸酶活性,即切割双链核酸的两条链并且产生双链断裂的能力,其在一个实施例中是在两种切口酶活性的存在下;
(3)内切核酸酶活性;
(4)外切核酸酶活性;以及
(5)解旋酶活性,即解旋双链核酸的螺旋结构的能力。
在某些实施例中,eaCas9分子或eaCas9多肽切割两条DNA链,并且产生双链断裂。在某些实施例中,eaCas9分子或eaCas9多肽仅切割一条链,例如,gRNA杂交到的链、或互补于与gRNA杂交的链的链。在一个实施例中,eaCas9分子或eaCas9多肽包含与HNH结构域相关的切割活性。在一个实施例中,eaCas9分子或eaCas9多肽包含与RuvC结构域相关的切割活性。在一个实施例中,eaCas9分子或eaCas9多肽包含与HNH结构域相关的切割活性以及与RuvC结构域相关的切割活性。在一个实施例中,eaCas9分子或eaCas9多肽包含有活性、或有切割能力的HNH结构域以及无活性、或无切割能力的RuvC结构域。在一个实施例中,eaCas9分子或eaCas9多肽包含无活性、或无切割能力的HNH结构域和有活性、或有切割能力的RuvC结构域。
靶向和PAM
Cas9分子或Cas9多肽可以与gRNA分子相互作用并且与所述gRNA分子一起定位至包含靶结构域(并且在某些实施例中,是PAM序列)的位点。
在某些实施例中,eaCas9分子或eaCas9多肽与靶核酸相互作用并且切割靶核酸的能力是PAM序列依赖性的。PAM序列是在靶核酸中的序列。在一个实施例中,靶核酸的切割发生在PAM序列的上游。来自不同细菌物种的eaCas9分子可以识别不同序列基序(例如,PAM序列)。在一个实施例中,化脓链球菌的eaCas9分子识别序列基序NGG并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp(参见例如,Mali 2013)。在一个实施例中,嗜热链球菌的eaCas9分子识别序列基序NGGNG(SEQ ID NO:199)和/或NNAGAAW(W=A或T)(SEQID NO:200)并且指导切割靶核酸序列的在这些序列上游的1至10(例如,3至5)bp(参见例如,Horvath 2010;Deveau 2008)。在一个实施例中,变形链球菌的eaCas9分子识别序列基序NGG和/或NAAR(R=A或G)(SEQ ID NO:201)并且指导切割靶核酸序列的在该序列上游的1至10(例如,3至5)bp(参见例如,Deveau 2008)。在一个实施例中,金黄色葡萄球菌的eaCas9分子识别序列基序NNGRR(R=A或G)(SEQ ID NO:202)并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp。在一个实施例中,金黄色葡萄球菌的eaCas9分子识别序列基序NNGRRN(R=A或G)(SEQ ID NO:203)并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp。在一个实施例中,金黄色葡萄球菌的eaCas9分子识别序列基序NNGRRT(R=A或G)(SEQ ID NO:204)并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp。在一个实施例中,金黄色葡萄球菌的eaCas9分子识别序列基序NNGRRV(R=A或G,V=A、G或C)(SEQ ID NO:205)并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp。Cas9分子识别PAM序列的能力可以例如使用如先前所述的转化测定(Jinek 2012)来确定。在上述实施例(即SEQ ID NO:199-205)中的每一个中,N可以是任何核苷酸残基,例如A、G、C或T中的任一项。
如本文所讨论的,Cas9分子可以被工程化以改变Cas9分子的PAM特异性。
先前已经描述了示例性的天然存在的Cas9分子(参见例如,Chylinski 2013)。此类Cas9分子包括以下项的Cas9分子:簇1细菌家族、簇2细菌家族、簇3细菌家族、簇4细菌家族、簇5细菌家族、簇6细菌家族、簇7细菌家族、簇8细菌家族、簇9细菌家族、簇10细菌家族、簇11细菌家族、簇12细菌家族、簇13细菌家族、簇14细菌家族、簇15细菌家族、簇16细菌家族、簇17细菌家族、簇18细菌家族、簇19细菌家族、簇20细菌家族、簇21细菌家族、簇22细菌家族、簇23细菌家族、簇24细菌家族、簇25细菌家族、簇26细菌家族、簇27细菌家族、簇28细菌家族、簇29细菌家族、簇30细菌家族、簇31细菌家族、簇32细菌家族、簇33细菌家族、簇34细菌家族、簇35细菌家族、簇36细菌家族、簇37细菌家族、簇38细菌家族、簇39细菌家族、簇40细菌家族、簇41细菌家族、簇42细菌家族、簇43细菌家族、簇44细菌家族、簇45细菌家族、簇46细菌家族、簇47细菌家族、簇48细菌家族、簇49细菌家族、簇50细菌家族、簇51细菌家族、簇52细菌家族、簇53细菌家族、簇54细菌家族、簇55细菌家族、簇56细菌家族、簇57细菌家族、簇58细菌家族、簇59细菌家族、簇60细菌家族、簇61细菌家族、簇62细菌家族、簇63细菌家族、簇64细菌家族、簇65细菌家族、簇66细菌家族、簇67细菌家族、簇68细菌家族、簇69细菌家族、簇70细菌家族、簇71细菌家族、簇72细菌家族、簇73细菌家族、簇74细菌家族、簇75细菌家族、簇76细菌家族、簇77细菌家族、或簇78细菌家族。
示例性的天然存在的Cas9分子包括簇1细菌家族的Cas9分子。实例包括以下项的Cas9分子:金黄色葡萄球菌、化脓链球菌(例如,菌株SF370、MGAS10270、MGAS10750、MGAS2096、MGAS315、MGAS5005、MGAS6180、MGAS9429、NZ131、SSI-1)、嗜热链球菌(例如,菌株LMD-9)、假豕链球菌(S.pseudoporcinus)(例如,菌株SPIN 20026)、变形链球菌(例如,菌株UA159、NN2025)、猕猴链环菌(S.macacae)(例如,菌株NCTC11558)、解没食子酸链球菌(S.gallolyticus)(例如,菌株UCN34、ATCC BAA-2069)、马链球菌(S.equinus)(例如,菌株ATCC 9812、MGCS 124)、停乳链球菌(S.dysdalactiae)(例如,菌株GGS 124)、牛链球菌(S.bovis)(例如,菌株ATCC 700338)、咽峡炎链球菌(S.anginosus)(例如,菌株F0211)、无乳链球菌(S.agalactiae)(例如,菌株NEM316、A909)、单核细胞增生李斯特菌(Listeriamonocytogenes)(例如,菌株F6854)、无害利斯特菌(Listeria innocua)(无害利斯特菌(L.innocua)(例如,菌株Clip11262))、意大利肠道球菌(Enterococcus italicus)(例如,菌株DSM 15952)、或屎肠球菌(Enterococcus faecium)(例如,菌株1,231,408)。
在某些实施例中,Cas9分子或Cas9多肽包含以下氨基酸序列:
与本文所述的任何Cas9分子序列或天然存在的Cas9分子序列(例如,来自本文列出的(例如,SEQ ID NO:1、2、4-6或12)或描述于Chylinski 2013中的物种的Cas9分子)具有60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%的同源性;
当与其相比时,与其相差不多于2%、5%、10%、15%、20%、30%或40%的氨基酸残基;
与其相差至少1、2、5、10或20个氨基酸但相差不多于100、80、70、60、50、40或30个氨基酸;或
与其相同。在一个实施例中,Cas9分子或Cas9多肽包含以下一种或多种活性:切口酶活性;双链切割活性(例如,内切核酸酶和/或外切核酸酶活性);解旋酶活性;或连同gRNA分子定位至靶核酸的能力。
在某些实施例中,Cas9分子或Cas9多肽包含图2A-2G的共有序列的任何氨基酸序列,其中“*”指示在化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9分子的氨基酸序列中的相应位置中发现的任何氨基酸,并且“-”指示不存在。在一个实施例中,Cas9分子或Cas9多肽与披露于图2A-2G中的共有序列的序列相差至少1个但不多于2、3、4、5、6、7、8、9或10个氨基酸残基。在某些实施例中,Cas9分子或Cas9多肽包含SEQ ID NO:2的氨基酸序列。在其他实施例中,Cas9分子或Cas9多肽与SEQ ID NO:2的序列相差至少1个但不多于2、3、4、5、6、7、8、9或10个氨基酸残基。
多个Cas9分子的序列的比较表明某些区域是保守的。将这些进行识别如下:
区域1(残基1至180,或在区域1’的情况下,残基120至180);
区域2(残基360至480);
区域3(残基660至720);
区域4(残基817至900);以及
区域5(残基900至960)。
在某些实施例中,Cas9分子或Cas9多肽包含区域1-5,连同足够的另外的Cas9分子序列以提供生物活性分子(例如,具有至少一种本文所述的活性的Cas9分子)。在某些实施例中,区域1-5各自独立地与本文所述的Cas9分子或Cas9多肽(例如,来自图2A-2G的序列(SEQ ID NO:1、2、4、5、14))的相应残基具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%的同源性。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域1的氨基酸序列:
与化脓链球菌的Cas9的氨基酸序列(SEQ ID NO:2)的氨基酸1-180具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(编号是根据图2中的基序序列;图2A-2G中的四个Cas9序列中的52%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸1-180相差至少1、2、5、10或20个氨基酸但相差不多于90、80、70、60、50、40或30个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸1-180相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域1’的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸120-180具有55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2中的四个Cas9序列中的55%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸120-180相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸120-180相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域2的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸360-480具有50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2中的四个Cas9序列中的52%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸360-480相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸360-480相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域3的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸660-720具有55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2中的四个Cas9序列中的56%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸660-720相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸660-720相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域4的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸817-900具有50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2A-2G中的四个Cas9序列中的55%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸817-900相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸817-900相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域5的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸900-960具有50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2A-2G中的四个Cas9序列中的60%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸900-960相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸900-960相同。
工程化的或改变的Cas9
本文所述的Cas9分子和Cas9多肽(可以具有多种特性中的任一种,包括:核酸酶活性(例如,内切核酸酶和/或外切核酸酶活性);解旋酶活性;在功能上与gRNA分子相关联的能力;以及靶向(或定位至)核酸上的位点的能力(例如,PAM识别和特异性)。在某些实施例中,Cas9分子或Cas9多肽可以包括这些特性的全部或子集。在一个典型的实施例中,Cas9分子或Cas9多肽具有与gRNA分子相互作用,并且与所述gRNA分子一起定位至核酸中的位点的能力。其他活性(例如,PAM特异性、切割活性、或解旋酶活性)在Cas9分子和Cas9多肽中可以更广泛地变化。
Cas9分子包括工程化的Cas9分子和工程化的Cas9多肽(如在此背景下使用的,工程化的仅仅意指所述Cas9分子或Cas9多肽不同于参考序列,并且没有暗示过程或来源限制)。工程化的Cas9分子或Cas9多肽可以包含改变的酶特性,例如改变的核酸酶活性(与天然存在的或其他参考Cas9分子相比)或改变的解旋酶活性。如本文所讨论的,工程化的Cas9分子或Cas9多肽可以具有切口酶活性(与双链核酸酶活性相反)。在某些实施例中,工程化的Cas9分子或Cas9多肽可以具有改变其尺寸的改变,例如减小其尺寸的氨基酸序列缺失,例如对一种或多种Cas9活性没有显著影响。在某些实施例中,工程化的Cas9分子或Cas9多肽可以包含影响PAM识别的改变,例如,工程化的Cas9分子可被改变以识别不同于由内源性野生型PI结构域识别的PAM序列的PAM序列。在某些实施例中,Cas9分子或Cas9多肽在序列上可以不同于天然存在的Cas9分子,但是在一种或多种Cas9活性上没有显著改变。
具有所希望特性的Cas9分子或Cas9多肽可以通过多种方式制成,例如,通过改变亲本(例如天然存在的)Cas9分子或Cas9多肽,以提供具有所希望特性的改变的Cas9分子或Cas9多肽。例如,可以相对于亲本Cas9分子(例如,天然存在的或工程化的Cas9分子)引入一个或多个突变或差异。此类突变和差异包括:取代(例如,保守取代或非必需氨基酸的取代);插入;或缺失。在一个实施例中,Cas9分子或Cas9多肽相对于参考(例如,亲本)Cas9分子可以包含一个或多个突变或差异,例如,至少1、2、3、4、5、10、15、20、30、40或50个突变但少于200、100或80个突变。
在某些实施例中,一个突变或多个突变对Cas9活性(例如,本文所述的Cas9活性)不具有实质影响。在其他实施例中,一个突变或多个突变对Cas9活性(例如,本文所述的Cas9活性)具有实质影响。
非切割和经修饰的切割Cas9
在一个实施例中,Cas9分子或Cas9多肽包含不同于天然存在的Cas9分子(例如,不同于具有最接近同源性的天然存在的Cas9分子)的切割特性。例如,Cas9分子或Cas9多肽可以与天然存在的Cas9分子(例如,化脓链球菌的Cas9分子)有如下区域别:例如,相比于天然存在的Cas9分子(例如,化脓链球菌的Cas9分子),它调控(例如,降低或增加)对双链核酸切割的能力(内切核酸酶和/或外切核酸酶活性);例如,相比于天然存在的Cas9分子(例如,化脓链球菌的Cas9分子),它调节(例如,降低或增加)对核酸的单链(例如,核酸分子的非互补链或核酸分子的互补链)切割的能力(切口酶活性);或切割核酸分子(例如,双链或单链核酸分子)的能力可以被消除。
在某些实施例中,eaCas9分子或eaCas9多肽包含以下活性中的一种或多种:与N-末端RuvC-样结构域有关的切割活性;与HNH样结构域相关的切割活性;与HNH样结构域相关的切割活性和与N-末端RuvC样结构域相关的切割活性。
在某些实施例中,eaCas9分子或eaCas9多肽包含有活性、或有切割能力的HNH样结构域(例如,本文所述的HNH样结构域,例如,SEQ ID NO:24-28)和无活性、或无切割能力的N-末端RuvC样结构域。示例性的无活性、或无切割能力的N-末端RuvC样结构域可以在N-末端RuvC样结构域中具有天冬氨酸的突变(例如,披露于图2A-2G中的共有序列的位置9处的天冬氨酸或SEQ ID NO:2的位置10处的天冬氨酸例如可以被丙氨酸取代)。在一个实施例中,eaCas9分子或eaCas9多肽与野生型的区别在于N-末端RuvC样结构域并且不切割靶核酸、或以显著低于参考Cas9分子的切割活性(例如,低于20%、10%、5%、1%或0.1%)的效率进行切割,如通过本文所述的测定所测量的。参比Cas9分子可以是天然存在的未经修饰的Cas9分子,例如,天然存在的Cas9分子,如化脓链球菌、金黄色葡萄球菌或嗜热链球菌的Cas9分子。在一个实施例中,参考Cas9分子是具有最接近序列一致性或同源性的天然存在的Cas9分子。
在一个实施例中,eaCas9分子或eaCas9多肽包含无活性、或无切割能力的HNH结构域和有活性、或有切割能力的N-末端RuvC样结构域(例如,本文所述的N-末端RuvC样结构域,例如SEQ ID NO:15-23)。示例性的无活性、或无切割能力的HNH样结构域可以具有在以下一处或多处的突变:HNH样结构域中的组氨酸(例如,在披露于图2A-2G中的共有序列的位置856处所示的组氨酸例如可以被丙氨酸取代);以及HNH样结构域中的一个或多个天冬酰胺(例如,在披露于图2A-2G中的共有序列的位置870处和/或披露于图2A-2G中的共有序列的位置879处所示的天冬酰胺例如可以被丙氨酸取代)。在一个实施例中,eaCas9与野生型的区别在于HNH样结构域并且不切割靶核酸、或以显著低于参考Cas9分子的切割活性(例如,低于20%、10%、5%、1%或0.1%)的效率进行切割,如通过本文所述的测定所测量的。参比Cas9分子可以是天然存在的未经修饰的Cas9分子,例如天然存在的Cas9分子,如化脓链球菌、金黄色葡萄球菌或嗜热链球菌的Cas9分子。在一个实施例中,参考Cas9分子是具有最接近序列一致性或同源性的天然存在的Cas9分子。
在某些实施例中,示例性Cas9活性包括PAM特异性、切割活性、和解旋酶活性中的一项或多项。一个或多个突变可以存在于,例如:一个或多个RuvC样结构域(例如,N-末端RuvC样结构域);HNH结构域;RuvC结构域和HNH结构域之外的区域中。在一个实施例中,一个或多个突变存在于RuvC结构域中。在一个实施例中,一个或多个突变存在于HNH结构域中。在一个实施例中,突变存在于RuvC结构域和HNH结构域二者中。
可以参照化脓链球菌Cas9序列在RuvC结构域或HNH结构域中进行的示例性突变包括:D10A、E762A、H840A、N854A、N863A和/或D986A。可参考金黄色葡萄球菌Cas9序列在RuvC结构域中进行的示例性突变包括N580A(参见例如,SEQ ID NO:11)。
无论具体序列(例如,取代)是否可以影响一种或多种活性(如靶向活性、切割活性等),例如可以通过评价所述突变是否是保守的来评价或预测。在一个实施例中,“非必需”氨基酸残基,如在Cas9分子的背景下所使用的,是可以改变自Cas9分子的野生型序列(例如,天然存在的Cas9分子(例如,eaCas9分子))的残基,不会消除或更优选地不会实质上改变Cas9活性(例如,裂解活性),而改变“必需”氨基酸残基导致活性(例如,裂解活性)的实质性损失。
在一个实施例中,Cas9分子包含不同于天然存在的Cas9分子(例如,不同于具有最接近同源性的天然存在的Cas9分子)的切割特性。例如,Cas9分子可以与天然存在的Cas9分子(例如,金黄色葡萄球菌或化脓链球菌的Cas9分子)有如下区域别:例如,相比于天然存在的Cas9分子(例如,金黄色葡萄球菌或化脓链球菌的Cas9分子),它调控(例如,降低或增加)对双链断裂切割的能力(内切核酸酶和/或外切核酸酶活性);例如,相比于天然存在的Cas9分子(例如,金黄色葡萄球菌或化脓链球菌的Cas9分子),它调控(例如,降低或增加)对核酸的单链(例如,核酸分子的非互补链或核酸分子的互补链)切割的能力(切口酶活性);或切割核酸分子(例如,双链或单链核酸分子)的能力可以被消除。在某些实施例中,切口酶是包含SEQ ID NO:10(D10A)或SEQ ID NO:11(N580A)(Friedland 2015)的序列的金黄色葡萄球菌Cas9衍生的切口酶。
在一个实施例中,改变的Cas9分子是包含以下一种或多种活性的eaCas9分子:与RuvC结构域有关的切割活性;与HNH结构域相关的切割活性;与HNH结构域相关的切割活性和与RuvC结构域相关的切割活性。
在某些实施例中,改变的Cas9分子或Cas9多肽包含如下序列,其中:
对应于披露于图2A-2G中的共有序列的固定序列的序列与披露于图2A-2G中的共有序列中的固定残基的不多于1%、2%、3%、4%、5%、10%、15%或20%有区别;并且
相应于披露于图2A-2G中的共有序列中由“*”识别的残基的序列与来自天然存在的Cas9分子(例如,化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌Cas9分子)的相应序列的“*”残基的不多于1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%或40%有区域别。
在一个实施例中,改变的Cas9分子或Cas9多肽是包含披露于图2A-2G中的化脓链球菌Cas9的氨基酸序列(SEQ ID NO:2)的eaCas9分子或eaCas9多肽,其中在由披露于图2A-2G中的共有序列(SEQ ID NO:14)中的“*”表示的一个或多个残基(例如,2、3、5、10、15、20、30、50、70、80、90、100、200个氨基酸残基)处具有不同于化脓链球菌的序列的一个或多个氨基酸(例如,取代)。
在一个实施例中,改变的Cas9分子或Cas9多肽是包含披露于图2A-2G中的嗜热链球菌Cas9的氨基酸序列(SEQ ID NO:4)的eaCas9分子或eaCas9多肽,其中在由披露于图2A-2G中的共有序列(SEQ ID NO:14)中的“*”表示的一个或多个残基(例如,2、3、5、10、15、20、30、50、70、80、90、100、200个氨基酸残基)处具有不同于嗜热链球菌的序列的一个或多个氨基酸(例如,取代)。
在一个实施例中,改变的Cas9分子或Cas9多肽是包含披露于图2A-2G中的变形链球菌Cas9的氨基酸序列(SEQ ID NO:1)的eaCas9分子或eaCas9多肽,其中在由披露于图2A-2G中的共有序列(SEQ ID NO:14)中的“*”表示的一个或多个残基(例如,2、3、5、10、15、20、30、50、70、80、90、100、200个氨基酸残基)处具有不同于变形链球菌的序列的一个或多个氨基酸(例如,取代)。
在一个实施例中,改变的Cas9分子或Cas9多肽是包含披露于图2A-2G中的无害利斯特菌Cas9的氨基酸序列(SEQ ID NO:5)的eaCas9分子或eaCas9多肽,其中在由披露于图2A-2G中的共有序列(SEQ ID NO:14)中的“*”表示的一个或多个残基(例如,2、3、5、10、15、20、30、50、70、80、90、100、200个氨基酸残基)处具有不同于无害利斯特菌的序列的一个或多个氨基酸(例如,取代)。
在某些实施例中,改变的Cas9分子或Cas9多肽(例如,eaCas9分子或eaCas9多肽)可以是例如多种不同Cas9分子(例如,不同物种的两种或更多种天然存在的Cas9分子)中的两种的融合体。例如,可以将一个物种的天然存在的Cas9分子的片段融合到第二物种的Cas9分子的片段上。作为实例,可以将包含N-末端RuvC样结构域的化脓链球菌的Cas9分子的片段融合到包含HNH样结构域的不同于化脓链球菌的物种(例如,嗜热链球菌)的Cas9分子的片段上。
具有改变的PAM识别或无PAM识别的Cas9
天然存在的Cas9分子可以识别特异性PAM序列,例如如上针对例如化脓链球菌、嗜热链球菌、变形链球菌和金黄色葡萄球菌描述的PAM识别序列。
在某些实施例中,Cas9分子或Cas9多肽具有与天然存在的Cas9分子相同的PAM特异性。在其他实施例中,Cas9分子或Cas9多肽具有与天然存在的Cas9分子不相关的PAM特异性、或与它与之具有最接近序列同源性的天然存在的Cas9分子不相关的PAM特异性。例如,可以改变天然存在的Cas9分子,例如,以改变PAM识别,例如以改变Cas9分子或Cas9多肽识别的PAM序列以减少脱靶位点和/或改进特异性;或消除PAM识别需要的PAM序列。在某些实施例中,可以改变Cas9分子或Cas9多肽,例如以增加PAM识别序列的长度和/或提高Cas9对高水平一致性(例如,gRNA与PAM序列之间的98%、99%或100%匹配)的特异性,例如以减少脱靶位点和/或增加特异性。在某些实施例中,PAM识别序列的长度在长度上是至少4、5、6、7、8、9、10或15个氨基酸。在一个实施例中,Cas9特异性需要gRNA与PAM序列之间的至少90%、95%、96%、97%、98%、99%或更多的同源性。可以使用定向进化产生识别不同PAM序列和/或具有降低的脱靶活性的Cas9分子或Cas9多肽。描述了可以用于Cas9分子定向进化的示例性方法和系统(参见例如,Esvelt 2011)。可以例如通过下文所述的方法对候选Cas9分子进行评价。
尺寸优化的Cas9
本文所描述的工程化的Cas9分子和工程化的Cas9多肽包括包含减小分子的尺寸但仍保留所希望Cas9特性(例如,基本上天然的构象、Cas9核酸酶活性、和/或靶核酸分子识别)的缺失的Cas9分子或Cas9多肽。本文提供了包含一个或多个缺失和任选地一个或多个接头的Cas9分子或Cas9多肽,其中接头被布置于在所述缺失的侧翼的氨基酸残基之间。用于识别参考Cas9分子中的适合缺失的方法、用于产生具有缺失和接头的Cas9分子的方法、以及使用此类Cas9分子的方法在审查本文献后对于本领域的普通技术人员应是清楚的。
具有缺失的Cas9分子(例如,金黄色葡萄球菌或化脓链球菌Cas9分子)比相应的天然存在的Cas9分子小,例如,具有减少数量的氨基酸。Cas9分子的较小尺寸允许提高递送方法的灵活性,并且由此增加基因组编辑的实用性。Cas9分子可以包含一个或多个不会实质上影响或降低本文所描述的所得Cas9分子的活性的缺失。包含如本文所描述的缺失的Cas9分子中所保留的活性包括以下项中的一种或多种:
切口酶活性,即切割核酸分子的单链(例如,非互补链或互补链)的能力;双链核酸酶活性,即切割双链核酸的两条链并且产生双链断裂的能力,其在一个实施例中是在两种切口酶活性的存在下;
内切核酸酶活性;
外切核酸酶活性;
解旋酶活性,即,解旋双链核酸的螺旋结构的能力;
以及核酸分子(例如,靶核酸或gRNA)的识别活性。
可以使用本文所述的或本领域的活性测定来评估本文所述的Cas9分子的活性。识别适于缺失的区域
可以通过多种方法识别Cas9分子的适于缺失的区域。可以在化脓链球菌Cas9的晶体结构上建模来自不同细菌物种的天然存在的直向同源Cas9分子(例如,在表1中所列出的那些中的任一种)(Nishimasu 2014),以便相对于所述蛋白的三维构象跨所选的Cas9直向同源物检查保守水平。在空间定位上远离在Cas9活性中所涉及的区域(例如,与靶核酸分子和/或gRNA相互作用)的较不保守的或不保守的区域代表作为用于缺失而不实质上影响或降低Cas9活性的候选物的区域或结构域。
编码Cas9分子的核酸
本文提供了编码Cas9分子或Cas9多肽(例如,eaCas9分子或eaCas9多肽)的核酸。先前已经描述了编码Cas9分子或Cas9多肽的示例性核酸(参见例如,Cong 2013;Wang2013;Mali 2013;Jinek 2012)。
在一个实施例中,编码Cas9分子或Cas9多肽的核酸可以是合成核酸序列。例如,合成核酸分子可以进行化学修饰,例如如本文所述。在一个实施例中,Cas9 mRNA具有以下一种或多种(例如,所有)特性:它被5-甲基胞苷和/或假尿苷加帽、聚腺苷酸化、取代。
另外或可替代地,可以对合成核酸序列进行密码子优化,例如至少一个非常见密码子或低不常见密码子已经被常见密码子取代。例如,合成的核酸可以指导优化的信使mRNA的合成(例如,针对在哺乳动物表达系统(例如,本文描述的)中的表达进行优化)。
另外或可替代地,编码Cas9分子或Cas9多肽的核酸可以包含核定位序列(NLS)。核定位序列在本领域是已知的。
编码化脓链球菌的Cas9分子的示例性密码子优化的核酸序列示于SEQ ID NO:3中。化脓链球菌Cas9分子的相应氨基酸序列示于SEQ ID NO:2中。
编码金黄色葡萄球菌的Cas9分子的示例性密码子优化的核酸序列示于SEQ IDNO:7-9中。金黄色葡萄球菌Cas9分子的氨基酸序列示于SEQ ID NO:6中。
如果任何上述Cas9序列与肽或多肽在C-末端处融合,则应理解的是终止密码子将被去除。
其他Cas分子和Cas多肽
不同类型的Cas分子或Cas多肽可以用来实践本文所披露的发明。在一些实施例中,使用II型Cas系统的Cas分子。在其他实施例中,使用其他Cas系统的Cas分子。例如,可以使用I型或III型Cas分子。先前已经描述了示例性Cas分子(和Cas系统)(参见例如,Haft2005和Makarova 2011)。示例性Cas分子(和Cas系统)也示于表2中。
表2:Cas系统
Cpf1分子
与crRNA复合的氨基酸球菌属物种(Acidaminococcus sp.)Cpf1和包括TTTN PAM序列的双链(ds)DNA靶向的晶体结构已由Yamano 2016解决,通过引用结合在此。与Cas9一样,Cpf1具有两个叶片:REC(识别)叶片和NUC(核酸酶)叶片。REC叶片包括REC1和REC2结构域,其与任何已知的蛋白质结构缺乏相似性。同时,NUC叶片包括三个RuvC结构域(RuvC-I、-II和-III)和BH结构域。然而,与Cas9相反,Cpf1 REC叶片缺乏HNH结构域,并且包括与已知蛋白质结构缺乏相似性的其他结构域:结构上独特的PI结构域/三个Wedge(WED)结构域(WED-I、-II和-III)、和核酸酶(Nuc)结构域。
虽然Cas9和Cpf1在结构和功能上具有相似性,但应当理解,某些Cpf1活性是由与任何Cas9结构域不类似的结构域介导的。例如,靶DNA的互补链的切割似乎由Nuc结构域介导,其在顺序上和空间上与Cas9的HNH结构域不同。另外,Cpf1 gRNA的非靶向部分(柄)采用假结结构,而不是由Cas9 gRNA中的重复:抗重复双链体形成的茎环结构。
RNA指导的核酸酶的修饰
上述RNA指导的核酸酶具有可用于多种应用的活性和特性,但技术人员将理解,RNA指导的核酸酶也可在某些情况下被修饰,以改变切割活性,PAM特异性或其他结构或功能特征。
首先转向改变切割活性的修饰,上面已经描述了降低或消除NUC叶片内结构域活性的突变。可以在RuvC结构域、Cas9 HNH结构域、或Cpf1 Nuc结构域中进行的示例性突变描述于Ran 2013和Yamano 2016,以及Cotta-Ramusino 2016中。通常,降低或消除两个核酸酶结构域之一中活性的突变导致具有切口酶活性的RNA指导的核酸酶,但应注意,切口酶活性的类型根据哪个结构域失活而变化。作为一个实例,Cas9的RuvC结构域的失活将导致切割互补链或顶链的切口酶,如下示出(其中C表示切割位点):
5'-------------------[原型间隔子]--[C]---------------------3'
3'--------------------------------------------------------------5'
另一方面,Cas9HNH结构域的失活导致切割底部或非互补链的切口酶:
5'-------------------[原型间隔子]---------------------------3'
3'-------------------------------------[C]---------------------5'
Kleinstiver 2015a已经描述了对于化脓链球菌和金黄色葡萄球菌(Kleinstiver2015b)的相对于天然存在的Cas9参考分子的PAM特异性的修饰。Kleinstiver等人还描述了改进Cas9的靶向保真性的修改(Kleinstiver 2016)。这些参考中的每一篇都通过引用结合在此。
RNA指导的核酸酶已被分成两个或更多个部分,如Zetsche 2015(通过引用结合)和Fine 2015(通过引用结合)所述。
在某些实施例中,RNA指导的核酸酶可以是尺寸优化的或截短的,例如经由一种或多种缺失,其减少核酸酶的尺寸,同时仍保留gRNA关联、靶向和PAM识别以及切割活性。在某些实施例中,RNA指导的核酸酶任选地通过接头与另一种多肽、核苷酸或其他结构共价或非共价结合。示例性结合的核酸酶和接头由Guilinger 2014描述,其通过引用结合在此用于所有目的。
RNA指导的核酸酶还任选地包括标签,例如,但不限于核定位信号,以促进RNA指导的核酸酶蛋白质迁移入细胞核。在某些实施例中,RNA指导的核酸酶可以掺入C-和/或N-末端核定位信号。核定位序列是本领域已知的并且在Maeder 2015和其他地方描述。
前述修改列表本质上是示例性的,并且鉴于本披露内容,技术人员将理解,在某些应用中可能或希望其他修饰。因此,为简洁起见,参考特定的RNA指导的核酸酶表示本披露内容的示例性系统、方法和组合物,但应理解所使用的RNA指导的核酸酶可以以不改变其操作原理的方式进行修饰。这些修饰在本披露内容的范围内。
编码RNA指导的核酸酶的核酸
本文提供了编码RNA指导的核酸酶的核酸,例如Cas9、Cpf1或其功能片段。先前已经描述了编码RNA指导的核酸酶的示例性核酸(参见例如,Cong 2013;Wang 2013;Mali2013;Jinek 2012)。
在一些情况下,编码RNA指导的核酸酶的核酸可以是合成的核酸序列。例如,合成核酸分子可以进行化学修饰。在某些实施例中,编码RNA指导的核酸酶的mRNA将具有一种或多种(例如,所有)以下特性:它可以被5-甲基胞苷和/或假尿苷加帽、聚腺苷酸化、取代。
合成核酸序列也可以是密码子优化的,例如,至少一个非常见密码子或较不常见的密码子已被共同密码子替换。例如,合成的核酸可以指导优化的信使mRNA的合成(例如,针对在哺乳动物表达系统(例如,本文描述的)中的表达进行优化)。密码子优化的Cas9编码序列的实例存在于Cotta-Ramusino 2016中。
另外,或可替代地,编码RNA指导的核酸可以包含核定位序列(NLS)。核定位序列在本领域是已知的。
候选分子的功能分析
可以通过本领域已知或如在此描述的方法来评价候选Cas9分子、候选gRNA分子,候选Cas9分子/gRNA分子复合物。例如,先前已经描述了用于评价Cas9分子的内切核酸酶活性的示例性方法(Jinek 2012)。
结合和切割测定:测试Cas9分子的核酸内切酶活性
可以在质粒切割测定中对Cas9分子/gRNA分子复合物结合至并且切割靶核酸的能力进行评价。在这个测定中,在反应之前通过加热至95℃并且缓慢冷却至室温,将合成或体外转录的gRNA分子预退火。在37℃,将天然或限制酶切消化-线性化的质粒DNA(300ng(约8nM))用纯化的Cas9蛋白分子(50nM-500nM)和gRNA(50nM-500nM,1:1)在具有或不具有10mMMgCl2的Cas9质粒切割缓冲液(20mM HEPES pH 7.5、150mM KCl、0.5mM DTT、0.1mM EDTA)中孵育60分钟。用5X DNA加样缓冲液(30%甘油、1.2%SDS、250mM EDTA)终止反应,通过0.8%或1%琼脂糖凝胶电泳进行解析并且通过溴化乙锭染色进行可视化。所得切割产物指示Cas9分子是否切割两条DNA链、或仅切割两条链中的一条。例如,线性DNA产物指示两条DNA链的切割,而有缺口的开放圆形产物指示两条链中只有一条被切割。
可替代地,可以在寡核苷酸DNA切割测定中对Cas9分子/gRNA分子复合物结合至并且切割靶核酸的能力进行评价。在这个测定中,在37℃,在50μL反应中,通过用在1X T4多核苷酸激酶反应缓冲液中的5单位T4多核苷酸激酶以及约3-6pmol(约20mCi-40mCi)[γ-32P]-ATP孵育30分钟,对DNA寡核苷酸(10pmol)进行放射性标记。在热灭活后(65℃持续20min),通过柱对反应进行纯化以去除未结合的标记。通过在95℃用等摩尔量的未标记的互补寡核苷酸退火标记的寡核苷酸持续3分钟,随后缓慢冷却至室温而生成双链体底物(100nM)。对于切割测定,通过加热至95℃持续30秒,随后缓慢冷却至室温对gRNA分子进行退火。在9μL的总体积中,将Cas9(500nM终浓度)与退火的gRNA分子(500nM)在切割测定缓冲液(20mM HEPES pH 7.5、100mM KCl、5mM MgCl2、1mM DTT、5%甘油)中进行预孵育。通过添加1μL靶DNA(10nM)开始反应并在37℃孵育1小时。将反应通过添加20μL的加样染料(5mMEDTA、0.025%SDS、5%甘油,在甲酰胺中)淬灭并加热至95℃持续5分钟。将切割产物在含有7M尿素的12%变性聚丙烯酰胺凝胶上进行解析,并且通过磷成像进行可视化。所得切割产物指示互补链、非互补链、或两者是否被切割。
这些测定中的一个或两个可以用于评价候选gRNA分子或候选Cas9分子的适合性。
结合测定:测试Cas9分子与靶DNA的结合
先前已经描述了用于评价Cas9分子与靶DNA的结合的示例性方法(Jinek 2012)。
例如,在电泳迁移率变动测定中,通过在去离子水中混合每条链(10nmol),加热至95℃持续3分钟并且缓慢冷却至室温而形成靶DNA双链体。将所有DNA在含有1X TBE的8%非变性凝胶上进行纯化。将DNA条带通过UV遮蔽进行可视化,切除,并且通过将凝胶片浸泡在DEPC处理的H2O中进行洗脱。将洗脱的DNA进行乙醇沉淀并且溶解在DEPC处理的H2O中。在37℃,使用T4多核苷酸激酶将DNA样品用[γ-32P]-ATP进行5'端标记持续30分钟。将多核苷酸激酶在65℃热变性持续20分钟,并且使用柱去除未结合的放射性标记。在10μL的总体积中,在含有20mM HEPES pH 7.5、100mM KCl、5mM MgCl2、1mM DTT以及10%甘油的缓冲液中进行结合测定。用等摩尔量的预退火的gRNA分子对Cas9蛋白分子进行程序化,并且从100pM滴定至1μM。将放射性标记的DNA添加至20pM的终浓度。将样品在37℃孵育1小时并且在4℃下在含有1X TBE和5mM MgCl2的8%天然聚丙烯酰胺凝胶上进行解析。将凝胶干燥并且通过感光成像进行DNA可视化。
差示扫描荧光测定法(DSF)
可以经由DSF测量Cas9-gRNA核糖核蛋白(RNP)复合物的热稳定性。这种技术测量蛋白质的热稳定性,其可以在有利条件下(如添加结合型RNA分子,例如,gRNA)增加。
可以使用两种不同的方案进行测定,一种方案用于测试gRNA:Cas9蛋白的最佳化学计量比,并且另一种方案用于确定RNP形成的最佳溶液条件。
为了确定形成RNP复合物的最好的的溶液条件,将Cas9的2μM溶液置于水与10xSYPRO(生命技术公司(Life Techonologies)目录#S-6650)中并分配到384孔板中。然后添加稀释于溶液中的具有不同pH和盐的等摩尔量的gRNA。在室温,孵育10分钟并短暂离心以去除任何气泡之后,使用带有Bio-Rad CFX Manager软件的Bio-RadCFX384TMReal-Time System C1000 TouchTM热循环仪运行从20℃至90℃的梯度,其中温度每10秒增加1℃。
第二个测定由在来自上述测定1的缓冲液中混合不同浓度的gRNA分子与2μM Cas9并在384孔板中于室温孵育10分钟组成。添加等体积的最适缓冲液和10x SYPRO(生命技术公司目录#S-6650)并且将板用B粘合剂(MSB-1001)密封。短暂离心以去除任何气泡后,使用带有Bio-Rad CFX Manager软件的Bio-Rad CFX384TMReal-TimeSystem C1000 TouchTM热循环仪运行从20℃至90℃的梯度,其中温度每10秒增加1℃。
用于基因靶向的NHEJ方法
在本文提供的方法的某些实施例中,NHEJ介导的缺失用于缺失γ-珠蛋白基因(例如HBG1,HBG2)负调控元件(例如,沉默子)的全部或部分。如本文所述,核酸酶诱导的NHEJ可用于以靶向特异性方式敲除全部或部分调控元件。在其他实施例中,NHEJ介导的插入用于将序列插入γ-珠蛋白基因负调控元件中,导致调控元件的失活。
虽然不希望受理论束缚,但认为在某些实施例中,与本文所描述的方法相关的基因组改变依赖于核酸酶诱导的NHEJ以及NHEJ修复途径的易错性质。NHEJ通过将两端连接在一起修复DNA中的双链断裂;然而,通常,只有两个相容末端(完全如他们通过双链断裂所形成的)是完全连接的,原始序列才被恢复。在末端重新连接之前,双链断裂的DNA末端常常是酶加工的受试者,在一条或两条链处产生核苷酸的添加或去除。这使得NHEJ修复位点处的DNA序列中存在插入和/或缺失(indel)突变。典型地,这些突变中的三分之二改变阅读框并且因此产生非功能蛋白。另外,维持阅读框但插入或缺失大量的序列的突变可以破坏蛋白质的功能性。这是基因座依赖性的,因为关键功能结构域中的突变可能比蛋白质的非关键区域中的突变耐受性低。
由NHEJ产生的indel突变在性质上是不可预测的;然而,在给定的断裂位点处,某些indel序列是有利的并且在群体中过度表达,这可能归因于微同源性的小区域。缺失的长度可以广泛变化;它们最常见地在1bp-50bp范围内,但是可以达到大于100bp-200bp。插入往往是较短的并且常常包括紧密围绕断裂位点的序列的短的重复。然而,有可能获得大插入,并且在这些情况中,插入序列通常已经被追溯至基因组的其他区域或至存在于细胞中的质粒DNA。
因为NHEJ是诱变的过程,所以它还可以用于缺失小序列基序(例如,长度上小于或等于50个核苷酸的基序),只要不需要产生特异性最终序列。如果双链断裂被靶向靶序列附近,则由NHEJ修复导致的缺失突变常常跨越并且因此去除不想要的核苷酸。对于较大的DNA区段的缺失,引入两个双链断裂(序列的每侧上一个双链断裂)可以在末端之间产生NHEJ,其中去除了整个间插序列。以这种方式,可以缺失大至几百千碱基的DNA区段。这两种方法都可以用于缺失特异性DNA序列;然而,NHEJ的易出错性质仍可能在修复位点产生indel突变。
双链切割性eaCas9分子和单链、或切口酶,eaCas9分子均可以用于本文所描述的方法和组合物以产生NHEJ介导的indel。NHEJ介导的indel靶向感兴趣的调控区域可用于破坏或缺失靶向调控元件。
双链或单链断裂相对于靶位置的布置
在某些实施例中,为了诱导NHEJ介导的indel的目的,其中gRNA和Cas9核酸酶生成双链断裂,gRNA(例如,单分子(或嵌合)或模块化gRNA分子)被配置成将一个双链断裂定位在极接近于靶位置的核苷酸之处。在一个实施例中,切割位点在远离靶位置0-30bp之间处(例如,离靶位置小于30bp、25bp、20bp、15bp、10bp、9bp、8bp、7bp、6bp、5bp、4bp、3bp、2bp或1bp)。
在某些实施例中,为了诱导NHEJ介导的indel的目的,其中与Cas9切口酶复合的两个gRNA诱导两个单链断裂,两个gRNA(例如,独立地为单分子(或嵌合)或模块化gRNA)被配置成将两个单链断裂定位以提供NHEJ修复靶位置的核苷酸。在某些实施例中,所述gRNA被配置成将切口定位在相同位置、或彼此相距在几个核苷酸之内、在不同链上,实质上模拟了双链断裂。在某些实施例中,较近的切口在远离靶位置0-30bp(例如,离靶位置小于30bp、25bp、20bp、15bp、10bp、9bp、8bp、7bp、6bp、5bp、4bp、3bp、2bp或1bp)之间处,并且这两个切口彼此在25bp-55bp之内(例如,在25bp至50bp、25bp至45bp、25bp至40bp、25bp至35bp、25bp至30bp、50bp至55bp、45bp至55bp、40bp至55bp、35bp至55bp、30bp至55bp、30bp至50bp、35bp至50bp、40bp至50bp、45bp至50bp、35bp至45bp、或40bp至45bp之间)并且彼此远离不超过100bp(例如,不超过90bp、80bp、70bp、60bp、50bp、40bp、30bp、20bp或10bp)。在某些实施例中,所述gRNA被配置成将单链断裂布置在靶位置的核苷酸的任一侧上。
双链切割性eaCas9分子和单链、或切口酶,eaCas9分子均可以用于在此所描述的方法和组合物中以在靶位置的两侧均产生断裂。可以在靶位置的两侧产生双链的或成对的单链断裂,以去除两个切口之间的核酸序列(例如,两个断裂之间的区域被缺失)。在某些实施例中,两个gRNA(例如,独立地为单分子(或嵌合)或模块化gRNA)被配置成将双链断裂定位在靶位置的两侧。在其他实施例中,三个gRNA(例如,独立地为单分子(或嵌合)或模块化gRNA)被配置成将双链断裂(即,一个gRNA与cas9核酸酶复合)和两个单链断裂或成对单链断裂(即,两个gRNA与Cas9切口酶复合)定位在靶位置的任一侧。在又其他实施例中,四个gRNA(例如,独立地为单分子(或嵌合)或模块化gRNA)被配置成在靶位置的任一侧产生两对单链断裂(即,两对的两个gRNA与Cas9切口酶复合物)。理想地,一个或多个双链断裂或成对的两个单链切口中更近者将在靶位置的0-500bp之内(例如,离靶位置不超过450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp或25bp)。当使用切口酶时,成对的两个切口彼此在25bp-55bp(例如,在25bp至50bp、25bp至45bp、25bp至40bp、25bp至35bp、25bp至30bp、50bp至55bp、45bp至55bp、40bp至55bp、35bp至55bp、30bp至55bp、30bp至50bp、35bp至50bp、40bp至50bp、45bp至50bp、35bp至45bp、或40bp至45bp之间)之内并且彼此远离不超过100bp(例如、不超过90bp、80bp、70bp、60bp、50bp、40bp、30bp、20bp或10bp)。
HDR修复、HDR介导的敲入、敲除、或缺失,以及模板核酸
在本文提供的方法的某些实施例中,HDR介导的序列改变用于使用外源提供的模板核酸(在本文中也称为供体构建体)改变(例如,缺失、破坏或修饰)γ-珠蛋白基因(例如,HBG1,HBG2)调控区域中的一个或多个核苷酸的序列。虽然希望不受理论束缚,但据信HDR-介导的γ-珠蛋白基因调控区域内HBG靶位置的改变通过HDR与外源提供的供体模板或模板核酸发生。例如,供体构建体或模板核酸提供了HBG靶位置的改变。在此考虑了可以将质粒供体用作用于同源重组的模版。在此进一步考虑了可以通过在靶序列和供体模板之间的HDR(例如,单链退火)的替代方法,将单链供体模板用作用于改变HBG靶位置的模板。通过供体模板实现的HBG靶位置的改变取决于Cas9分子的切割。经由Cas9切割可以包括双链断裂或两个单链断裂。
在本文提供的方法的某些实施例中,HDR介导的改变用于敲除或缺失γ-珠蛋白基因(例如HBG1,HBG2)负调控元件(例如,沉默子)的全部或部分。如本文所述,HDR可用于以靶向特异性方式敲除或缺失全部或部分调控元件。
在其他实施例中,HDR介导的序列改变用于不使用外源提供的模板核酸改变γ-珠蛋白基因(例如,HBG1,HBG2)调控区域中的一个或多个核苷酸的序列。虽然不希望受理论束缚,但认为HBG靶位置的改变通过用内源基因组供体序列进行HDR而发生。例如,内源性基因组供体序列提供了HBG靶位置的改变。考虑了在一个实施例中,内源基因组供体序列位于与靶序列相同的染色体上。进一步考虑了,在其他的实施例中,内源基因组供体序列位于与靶序列不同的染色体上。通过内源基因组供体序列改变HBG靶位置取决于Cas9分子的切割。经由Cas9切割可以包括双链断裂或两个单链断裂。
在本文提供的方法的某些实施例中,HDR介导的改变用于改变γ-珠蛋白基因调控区域中的单个核苷酸。这些实施例可以利用一个双链断裂或两个单链断裂。在某些实施例中,单个核苷酸改变可以通过以下项来掺入:(1)一个双链断裂,(2)两个单链断裂,(3)两个双链断裂,其中断裂发生在靶位置的每一侧,(4)一个双链断裂和两个单链断裂,其中双链断裂和两个单链断裂发生在靶位置的每一侧,(5)四个单链断裂,其中一对单链断裂发生在靶位置的每一侧,或(6)一个单链断裂。
在使用单链模板核酸的某些实施例中,靶位置可以通过替代的HDR来改变。
在本文提供的方法的某些实施例中,HDR介导的改变用于引入γ-珠蛋白基因调控区域中的一个或多个核苷酸的改变(例如,缺失)。在某些实施例中,γ-珠蛋白基因调控区域可以是HBG靶位置。在某些实施例中,可以在HBG靶位置内的靶位点处引入改变(例如,缺失)。在某些实施例中,改变(例如,缺失)可选自HBG1 13bp del c.-114至-102、HBG1 4bpdel c.-225至-222、和HBG1 13bp del c.-114至-102中的一种或多种。在某些实施例中,靶位点可选自HBG1 c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2 c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)中的一种或多种。
通过供体模板实现的HBG靶位置的改变取决于Cas9分子的切割。经由Cas9切割可以包括切口、双链断裂或两个单链断裂(例如靶核酸的每条链上的一个断裂)。在靶核酸上引入断裂之后,在断裂端发生切除,产生单链的突出DNA区域。
在典型HDR中,引入包含与靶核酸同源的序列的双链供体模板,其将会直接掺入靶核酸中或用作模板以改变靶核酸序列。在断裂处切除后,修复可以通过不同的途径进行,例如通过双霍利迪连接模型(或双链断裂修复(DSBR)途径)或合成依赖性链退火(SDSA)途径。在双霍利迪连接模型中,发生由靶核酸的两个单链突出端进行链入侵到供体模板中的同源序列,导致形成具有两个霍利迪连结的中间体。当从入侵链的末端合成新的DNA以填充由切除产生的空位时,结点迁移。将新合成的DNA的末端连接到切除的末端,并且结点被分解,导致靶核酸的改变,例如将供体模板的HPFH突变体序列掺入相应的HBG靶位置。与供体模板的交叉可能会在结点分解时发生。在SDSA途径中,只有一个单链突出端侵入供体模板,并从入侵链的末端合成新的DNA以填补由切除产生的空位。然后新合成的DNA与剩余的单链突出端退火,合成新的DNA以填补空位,并将链连接以产生改变的DNA双链体。
在可替代的HDR中,引入单链供体模板,例如模板核酸。用于改变所希望的HBG靶位置的靶核酸处的切口、单链断裂或双链断裂由例如本文所述的Cas9分子介导,并且在断裂处发生切除以显示单链突出端。掺入模板核酸序列以校正或改变HBG靶位置典型地通过如上所述的SDSA途径而发生。
在国际申请PCT/US 2014/057905中的标题为“模板核酸”的第IV节中提供了关于模板核酸的另外的细节。
在某些实施例中,双链切割是由具有与HNH样结构域有关的切割活性以及与RuvC样结构域(例如,N端RuvC样结构域)有关的切割活性的Cas9分子(例如,野生型Cas9)实现的。这样的实施例仅需要单一的gRNA。
在某些实施例中,一个单链断裂或切口由具有切口酶活性的Cas9分子例如,本文所述的Cas9切口酶实现。带切口的靶核酸可以是alt-HDR的底物。
在其他实施例中,两个单链断裂或切口是由具有切口酶活性(例如,与HNH样结构域有关的切割活性或与N端RuvC样结构域有关的切割活性)的Cas9分子实现的。这样的实施例通常需要两个gRNA,各用于布置每个单链断裂。在实施例中,具有切口酶活性的Cas9分子切割gRNA所杂交的链,但不是互补于与gRNA杂交的链的链。在实施例中,具有切口酶活性的Cas9分子不切割gRNA所杂交的链,而是切割互补于与gRNA杂交的链的链。
在某些实施例中,所述切口酶具有HNH活性,例如,具有RuvC活性失活的Cas9分子(例如,在D10处具有突变(例如,D10A突变)的Cas9分子)(参见,例如,SEQ ID NO:10)。D10A使RuvC失活;因此,Cas9切口酶(仅)具有HNH活性并且将切割gRNA所杂交的链(例如,互补链,其上并不具有NGG PAM)。在其他的实施例中,具有H840(例如,H840A)突变的Cas9分子可以用作切口酶。H840A使HNH失活;因此,Cas9切口酶(仅)具有RuvC活性并且切割非互补链(例如,具有NGG PAM并且其序列与gRNA相同的链)。在其他的实施例中,具有N863突变(例如,N863A)突变的Cas9分子可以用作切口酶。N863A灭活HNH,因此Cas9切口酶(仅)具有RuvC活性并且切割非互补链(具有NGG PAM并且其序列与gRNA相同的链)。
在某些实施例中,其中将一种切口酶和两种gRNA用于定位两个单链切口,一个切口在靶核酸的+链上而一个切口在-链上。PAM可以面向外部。可以选择gRNA,这样使得通过从约0-50、0-100、或0-200个核苷酸中分离gRNA。在实施例中,互补于两个gRNA的靶向结构域的靶序列之间没有重叠。在实施例中,这些gRNA不重叠并且是通过多至50、100、或200个核苷酸分离的。在一个实施例中,使用两个gRNA可以增加特异性,例如,通过降低脱靶结合(Ran 2013)。
在某些实施例中,单一切口可以用于诱导HDR,例如alt-HDR。在此考虑了可以将单一切口用于增加HR与NHEJ在给定切割位点的比率。在一个实施例中,单链断裂形成于所述靶核酸的与所述gRNA的靶向结构域互补的链中。在其他实施例中,单链断裂形成于所述靶核酸的不同于与所述gRNA的靶向结构域互补的链的链中。
双链或单链断裂相对于靶位置的布置
其中一条链中的双链断裂或单链断裂应足够接近HBG靶位置,即在所希望区域产生改变,例如,掺入HPFH突变。在某些实施例中,所述距离不超过HBG靶位置的50、100、200、300、350或400个核苷酸。虽然希望不受理论束缚,在某些实施例中,认为断裂应当足够接近于HBG靶位置,以使得靶位置在末端切除过程中在经受外切核酸酶介导的去除的区域内。如果HBG靶位置与断裂之间的距离太大,则所希望被改变的序列可能不包括在末端切除中,并且因此可能不会被改变为供体序列,外源提供的供体序列或内源基因组供体序列,在一些实施例中,仅用于在末端切除区域内改变序列。
在某些实施例中,本文所述的方法在HGB1和/或HGB2基因的γ-珠蛋白基因调控区域(例如,增强子区域,例如,沉默子区域,例如,启动子区域)附近引入一个或多个断裂。在某些这些实施例中,引入位于调控区域的至少一部分的侧翼的两个或更多个断裂,例如,HGB1和/或HGB2基因的增强子区域,例如,HGB1和/或HGB2基因的沉默子区域。两个或更多个断裂去除(例如,缺失)包括至少一部分γ-珠蛋白基因调控区域的基因组序列,例如,HGB1和/或HGB2基因的增强子区域,例如,HGB1和/或HGB2基因的沉默子区域。本文描述的所有方法导致调控区域的改变,例如,HGB1和/或HGB2基因的增强子区域,例如,HGB1和/或HGB2基因的沉默子区域。
在某些实施例中,靶向结构域被配置为使得切割事件(例如双链或单链断裂)位于所希望被改变(例如,突变)的区域的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150或200个核苷酸中。断裂,例如双链或单链断裂可以位于所希望被改变(例如,突变)的区域的上游或下游。在一些实施例中,断裂位于所希望被改变的区域内,例如,位于由至少两个突变体核苷酸限定的区域内。在一些实施例中,断裂被定位在紧邻所希望被改变的区域,例如,直接位于突变的上游或下游。
在某些实施例中,单链断裂伴随有由第二gRNA分子位置的另外的单链断裂,如下文所讨论的。例如,靶向结构域被配置成,使得切割事件(例如两条单链断裂)位于HBG靶位置的1、2、3、4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150或200个核苷酸中。在一个实施例中,所述第一和第二gRNA分子被配置成使得在指导Cas9切口酶时,单链断裂将伴随有由第二gRNA定位的彼此足够接近的另外的单链断裂,以引起希望的区域的改变。在一个实施例中,所述第一和第二gRNA分子被配置成使得例如,当Cas9是切口酶时,由所述第二gRNA定位的单链断裂在由所述第一gRNA分子定位的断裂的10、20、30、40、或50个核苷酸内。在一个实施例中,所述两个gRNA分子被配置成将切口定位在相同位置、或彼此相距在几个核苷酸之内、在不同链上,例如,基本上模拟了双链断裂。
在某些实施例中,为了诱导HDR介导的序列改变的目的,其中gRNA(单分子(或嵌合)或模块化gRNA)和Cas9核酸酶诱导双链断裂,切割位点在远离HBG靶位置0-200bp(例如,0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、75至100bp)处。在某些实施例中,切割位点在远离HBG靶位置0-100bp(例如,0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)处。
在HBG靶位置实施例中,可以通过使用切口酶来产生与突出端的断裂来促进HDR。虽然不希望受理论束缚,突出端的单链本质可以通过HDR增强细胞修复破坏的可能性,与例如,NHEJ相反。具体而言,在一些实施例中,通过选择将第一切口酶靶向第一靶序列的第一gRNA和将第二切口酶靶向第二靶序列的第二gRNA来促进HDR,所述第二靶序列位于与第一靶序列相对的DNA链上并且从第一个切口处偏移。
在某些实施例中,gRNA分子的靶向结构域被配置成将切割事件定位为离预选择的核苷酸足够远,所述核苷酸不被改变。在某些实施例中,gRNA分子的靶向结构域被配置成将内含子切割事件定位为离内含子/外显子边界、或天然存在的剪接信号足够远,以避免所述外显子序列的改变或不想要的剪接事件。所述gRNA分子可以是如在此所描述的第一、第二、第三和/或第四gRNA分子。
第一断裂和第二断裂的彼此相对布置
在某些实施例中,双链断裂可以伴随有由第二gRNA分子定位的另外的双链断裂,如下文所讨论的。
在某些实施例中,双链断裂可以伴随有由第二gRNA分子和第三gRNA分子定位的两个另外的单链断裂。
在某些实施例中,第一和第二单链断裂可以伴随有由第三gRNA分子和第四gRNA分子定位的两个另外的单链断裂。
当两种或更多种gRNA用于在靶核酸中定位两个或更多个切割事件(例如,双链或单链断裂)时,考虑了所述两个或更多个切割事件可以由相同或不同Cas9蛋白产生。例如,当两个gRNA用于定位两个双链断裂时,单Cas9核酸酶可以用于产生两个双链断裂。当两种或更多种gRNA用于定位两个或更多个单链断裂(切口)时,单Cas9切口酶可以用于产生所述两个或更多个切口。当两种或更多种gRNA用于定位至少一个双链断裂和至少一个单链断裂时,可以使用两种Cas9蛋白,例如,一种Cas9核酸酶和一种Cas9切口酶。考虑了当使用两种或更多种Cas9蛋白时,可以顺序地递送所述两种或更多种Cas9蛋白,以控制靶核酸中的希望位置处的双链断裂对比单链断裂的特异性。
在一些实施例中,所述第一gRNA分子的靶向结构域和所述第二gRNA分子的靶向结构域与靶核酸分子的相对链互补。在一些实施例中,所述gRNA分子和所述第二gRNA分子被配置成使得PAM朝外定向。
在某些实施例中,选择两个gRNA以指导在距离彼此预选距离的两个位置处的Cas9介导的切割。在某些实施例中,两个切割点位于靶核酸的相反链上。在一些实施例中,两个切割点形成平端的断裂,并且在其他实施例中,他们被偏移以使得DNA末端包含一个或两个突出端(例如,一个或多个5'突出端和/或一个或多个3'突出端)。在一些实施例中,每个断裂事件是一个切口。在一个实施例中,切口足够接近以致他们形成由双链断裂机器识别的断裂(而不是被例如,SSBr机器识别)。在某些实施例中,切口足够分开,使得他们产生作为HDR底物的突出端,即,断裂的布置模仿经历了一些切除的DNA底物。例如,在一些实施例中,切口被间隔开以产生作为用于进行性切除的底物的突出端。在一些实施例中,两个断裂彼此间隔着25-65个核苷酸。两个断裂可以是例如,彼此的约25、30、35、40、45、50、55、60或65个核苷酸。两个断裂可以是例如,彼此的至少约25、30、35、40、45、50、55、60或65个核苷酸。两个断裂可以是例如,彼此的至多约30、35、40、45、50、55、60或65个核苷酸。在某些实施例中,两个断裂是彼此的约25-30、30-35、35-40、40-45、45-50、50-55、55-60、或60-65个核苷酸。
在一些实施例中,模拟切除的断裂的断裂包括3'突出端(例如,由DSB和切口产生,其中切口留下了3'突出端)、5'突出端(例如,由DSB和缺口产生,其中切口留下了5'突出端)、3'和5'突出端(例如,由三个切割产生)、两个3'突出端(例如,由彼此偏移的两个切口产生)或两个5'突出端(例如,由彼此偏移的两个切口产生)。
在某些实施例中,为了诱导HDR介导的改变的目的,其中与Cas9切口酶复合的两个gRNA(独立地为单分子(或嵌合)或模块化gRNA)诱导两个单链断裂,较近的切口在远离HBG靶位置0-200bp(例如,0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、或75至100bp)之间处,并且理想地这两个切口彼此将在25-65bp之内(例如,25至50、25至45、25至40、25至35、25至30、30至55、30至50、30至45、30至40、30至35、35至55、35至50、35至45、35至40、40至55、40至50、40至45bp、45至50bp、50至55bp、55至60bp、或60至65bp)并且彼此远离不超过100bp(例如,彼此远离不超过90、80、70、60、50、40、30、20、10或5bp)。在某些实施例中,切割位点在远离HBG靶位置0-100bp(例如,0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)之间处。
在一些实施例中,两个gRNA(例如,独立地为单分子(或嵌合)或模块化gRNA)被配置成将双链断裂定位在靶位置的两侧。在其他实施例中,三个gRNA(例如,独立地为单分子(或嵌合)或模块化gRNA)被配置成将双链断裂(即,一个gRNA与cas9核酸酶复合)和两个单链断裂或成对单链断裂(即,两个gRNA与Cas9切口酶复合)定位在靶位置的任一侧。在其他实施例中,四个gRNA(例如,独立地为单分子(或嵌合)或模块化gRNA)被配置成在靶位置的任一侧产生两对单链断裂(即,两对的两个gRNA与Cas9切口酶复合物)。理想地,一个或多个双链断裂或成对的两个单链切口中更近者将在HBG靶位置的0-500bp之内(例如,离靶位置不超过450、400、350、300、250、200、150、100、50或25bp)。当使用切口酶时,成对的两个切口在某些实施例中彼此在25-65bp(例如,在25-55、25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、40至45bp、45至50bp、50至55bp、55至60bp、或60至65bp之间)之内并且彼此远离不超过100bp(例如,不超过90、80、70、60、50、40、30、或20或10bp)。
当使用两个gRNA靶向Cas9分子至断裂时,可以设想Cas9分子的不同组合。在一些实施例中,使用第一gRNA将第一Cas9分子靶向第一靶位置,并且使用第二gRNA将第二Cas9分子靶向第二靶位置。在一些实施例中,第一Cas9分子在靶核酸的第一条链上产生切口,并且第二Cas9分子在相对链上产生切口,导致双链断裂(例如,平端的切割或突出端的切割)。
可以选择切口酶的不同组合来将一条单链断裂靶向一条链,并且将第二条单链断裂靶向相反链。当选择组合时,可以考虑到具有一个活性RuvC样结构域的切口酶和具有一个活性HNH结构域的切口酶。在某些实施例中,RuvC样结构域切割靶核酸分子的非互补链。在某些实施例中,HNH样结构域切割双链核酸分子的单链互补结构域(例如,互补链)。一般而言,如果两个Cas9分子具有相同的活性结构域(例如,两者均具有活性RuvC结构域或两者都具有活性HNH结构域),则将选择两个与靶的相反链结合的gRNA。更详细地,在一些实施例中,第一gRNA与靶核酸的第一条链互补并结合具有活性RuvC样结构域的切口酶并引起切口酶切割与第一gRNA不互补的链,即,靶核酸的第二条链;并且第二gRNA与靶核酸的第二条链互补并结合具有活性RuvC样结构域的切口酶并引起切口酶切割与第二gRNA不互补的链,即,靶核酸的第一条链。相反地,在一些实施例中,第一gRNA与靶核酸的第一条链互补并结合具有活性HNH结构域的切口酶并引起切口酶切割与第一gRNA互补的链,即,靶核酸的第一条链;并且第二gRNA与靶核酸的第二条链互补并结合具有活性HNH结构域的切口酶并引起切口酶切割与第二gRNA互补的链,即,靶核酸的第二条链。在另一种排列中,如果一个Cas9分子具有活性RuvC样结构域并且另一个Cas9分子具有活性HNH结构域,则两个Cas9分子的gRNA可以与靶核酸的相同链互补,使得具有活性的RuvC样结构域的Cas9分子将切割非互补链并且具有HNH结构域的Cas9分子将切割互补链,导致双链断裂。
供体模板的同源臂
同源臂应该至少延伸远至可发生末端切除的区域,例如,以便允许所切除的单链突出端在供体模板内找到互补区域。总长度可由如质粒大小或病毒包装限制之类的参数进行限制。在一个实施例中,同源臂不延伸到重复元件(例如,Alu重复或LINE重复)中。
示例性同源臂长度包括至少50、100、250、500、750、1000、2000、3000、4000、或5000个核苷酸。在一些实施例中,同源臂长度是50-100、100-250、250-500、500-750、750-1000、1000-2000、2000-3000、3000-4000、或4000-5000个核苷酸。
模板核酸,如该术语在此使用的,是指可以与Cas9分子和gRNA分子结合用于改变(例如,缺失、破坏、或修饰)HBG靶位置的结构的核酸序列。在某些实施例中,HBG靶位置可以是在其中添加进一个或多个核苷酸的靶核酸上两个核苷酸(例如,相邻的核苷酸)之间的位点。可替代地,HBG靶位置可以包含一个或多个通过模板核酸改变的核苷酸。在某些实施例中,可以在HBG靶位置内的靶位点处引入改变(例如,缺失)。在某些实施例中,改变(例如,缺失)可选自HBG1 13bp del c.-114至-102、HBG1 4bp del c.-225至-222、和HBG1 13bp delc.-114至-102中的一种或多种。在某些实施例中,靶位点可选自HBG1 c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1 c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2 c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)中的一种或多种。
在某些实施例中,对靶核酸进行修饰以具有模板核酸的一些或全部序列,典型地在一个或多个切割位点处或附近。在某些实施例中,模板核酸是单链的。在其他实施例中,模板核酸是双链的。在某些实施例中,模板核酸是DNA(例如,双链DNA)。在其他实施例中,模板核酸是单链DNA。在一个实施例中,模板核酸如Cas9和gRNA在相同的载体骨架例如,AAV基因组,质粒DNA上编码。在某些实施例中,模板核酸在体内从载体骨架上切除,例如,其侧翼为gRNA识别序列。在某些实施例中,模板核酸包含内源基因组序列。
在某些实施例中,模板核酸通过参与HDR事件来改变靶位置的结构。在某些实施例中,模板核酸改变靶位置的序列。在某些实施例中,模板核酸导致修饰的或非天然存在的碱基掺入靶核酸中。
在某些实施例中,模板核酸导致靶核酸的一个或多个核苷酸的缺失。在某些实施例中,模板核酸导致HBG靶位置的一个或多个核苷酸的缺失。在某些实施例中,可以在HBG靶位置内的靶位点处引入改变(例如,缺失)。在某些实施例中,改变(例如,缺失)可选自HBG113bp del c.-114至-102、HBG1 4bp del c.-225至-222、和HBG1 13bp del c.-114至-102中的一种或多种。在某些实施例中,靶位点可选自HBG1 c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1 c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2 c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)中的一种或多种。
典型地,模板序列经历断裂介导或催化的与靶序列的重组。在某些实施例中,模板核酸包括与通过eaCas9介导的切割事件切割的靶序列上的位点相相应的序列。在某些实施例中,模板核酸包括与在第一Cas9介导的事件中被切割的靶序列上的第一位点、以及在第二Cas9介导的事件中被切割的靶序列上的第二位点二者相相应的序列。
与γ-珠蛋白基因调控区域中的HBG靶位置具有同源性的模板核酸可用于改变调控区域的结构。例如,与γ-珠蛋白基因调控区域中HBG靶位置的5'和3'区域具有同源性的模板核酸可用于缺失HBG靶位置的一个或多个核苷酸。
模板核酸典型地包括以下组分:
[5’同源臂]-[替换序列]-[3’同源臂]。
同源臂提供用于重组到染色体中,因此用替换序列替换了不希望的元件(例如,突变或标签)。同源臂是与待切割的靶核酸内或附近(例如,侧翼或邻接)的DNA区域同源的区域。在某些实施例中,同源臂侧翼于最远端切割位点。
在某些实施例中,模板核酸可用于去除(例如,缺失)包括至少一部分γ-珠蛋白基因调控区域的基因组序列,例如,HGB1和/或HGB2基因的增强子区域,例如,HGB1和/或HGB2基因的沉默子区域。在某些实施例中,模板核酸可用于缺失HBG靶位置的一个或多个核苷酸,即,将改变(例如,缺失)引入HBG靶位置。在某些实施例中,可以在HBG靶位置内的靶位点处引入改变(例如,缺失)。在某些实施例中,改变(例如,缺失)可选自HBG1 13bp del c.-114至-102、HBG1 4bp del c.-225至-222、和HBG1 13bp del c.-114至-102中的一种或多种。在某些实施例中,靶位点可选自HBG1 c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1 c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)中的一种或多种。
供体模板中的替换序列已在别处描述,包括在Cotta-Ramusino 2016中,其通过引用结合在此。替换序列可以是任何合适的长度。在某些实施例中,替换序列可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20或相对于希望编辑的细胞内的天然存在的序列进行更多的序列修饰。
在某些实施例中,当希望的修复结果是靶核酸的缺失时,替换序列可以是0个核苷酸或0bp。在某些实施例中,模板核酸省略了与待缺失的靶核酸序列同源的序列。如果替换序列是0个核苷酸或0bp,那么位于5'同源臂和3'同源臂与模板核酸退火的位置之间的靶核酸序列将被缺失。
在某些实施例中,5'同源臂的3'端是紧邻替换序列的5'端的位置。在某些实施例中,5'同源臂可以从替换序列的5'端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个核苷酸5'。在某些实施例中,当替换序列是0个核苷酸或0bp时,5'同源臂的3'端是紧邻3'同源臂的5'端的位置。在某些实施例中,当替换序列是0个核苷酸或0bp时,5'同源臂可以从3'同源臂的5'端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个核苷酸5'。
在某些实施例中,3'同源臂的5'端是紧邻替换序列的3'端的位置。在一个实施例中,3’同源臂可以从替换序列的3’端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个核苷酸3’。在某些实施例中,当替换序列是0个核苷酸或0bp时,3'同源臂的5'端是紧邻5'同源臂的3'端的位置。在一个实施例中,3'同源臂可以从5'同源臂的3'端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000或5000个核苷酸3'。
在某些实施例中,为了改变HBG靶位置处的一个或多个核苷酸,同源臂(例如5'和3'同源臂)可各自包含位于最远端gRNA侧翼的约1000bp序列(例如,HBG靶位置任一侧的1000bp序列)。
在此考虑了可以将一个或两个同源臂缩短以避免包括某些序列重复元件(例如,Alu重复或LINE元件)。例如,可以将5’同源臂缩短以避免序列重复元件。在其他的实施例中,可以将3’同源臂缩短以避免序列重复元件。在一些实施例中,可以将5’和3’同源臂均缩短以避免包括某些序列重复元件。
本文中考虑了可以将用于改变HBG靶位置的序列设计成用作单链寡核苷酸,例如单链,寡脱氧核苷酸(ssODN)。当使用ssODN时,5'和3'同源臂在长度上范围可以高达约200个核苷酸(例如,在长度上至少25、50、75、100、125、150、175、或200bp)。针对ssODN还考虑了更长的同源臂作为继续有待完成的寡核苷酸合成中的改进。在一些实施例中,通过化学合成以外的方法制备较长的同源臂,例如,通过变性长双链核酸并纯化一条链,例如,通过对锚定于固体底物的链特异性序列的亲和力。
虽然不希望受理论束缚,但在某些实施例中,当模板核酸与切口(即,带切口的链的5'方向)或靶位点(即,靶位点的5'方向)具有延伸的同源性5'时alt-HDR更有效地进行。相应地,在一些实施例中,模板核酸具有较长的同源臂和较短的同源臂,其中较长的同源臂可以使切口或靶位点的5'退火。在一些实施例中,可以与切口或靶位点5'退火的臂是距离切口或靶位点或替换序列的5'或3'端至少25、50、75、100、125、150、175、或200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、或5000个核苷酸。在一些实施例中,可以与切口或靶位点5'退火的臂比可以使切口或靶位点3'退火的臂长至少10%、20%、30%、40%、或50%。在一些实施例中,可以与切口或靶位点5'退火的臂比可以使切口或靶位点3'退火的臂长至少2倍、3倍、4倍或5倍。取决于ssDNA模板是否可以与完整链或带切口或靶位点的链退火,与缺口5'退火的同源臂可以分别位于ssDNA模板的5'端或ssDNA模板的3'端。
类似地,在一些实施例中,模板核酸具有5'同源臂、替换序列和3'同源臂,使得模板核酸与切口的5'具有延伸的同源性。例如,5'同源臂和3'同源臂可以具有基本上相同的长度,但是替换序列比切口的3'可以更远地延伸切口的5'。在一些实施例中,替换序列比切口的3'端至少10%、20%、30%、40%、50%、2倍、3倍、4倍、或5倍更远地延伸至切口的5'端。
虽然不希望受理论束缚,但在一些实施例中,当模板核酸以切口或靶位点为中心时,alt-HDR更有效地进行。因此,在一些实施例中,模板核酸具有两个基本上相同大小的同源臂。例如,模板核酸的第一同源臂可以具有在模板核酸的第二同源臂的10%、9%、8%、7%、6%、5%、4%、3%、2%或1%之内的长度。
类似地,在一些实施例中,模板核酸具有5'同源臂、替换序列和3'同源臂,使得模板核酸在切口或靶位点的任一侧上延伸基本上相同的距离。例如,同源臂可以具有不同的长度,但是可以选择替换序列以补偿这一点。例如,替换序列比切口的3'可以从切口的5'延伸更远,但是切口的同源臂5'比切口的同源臂3'更短,以补偿。相反的也是可能的,例如,替换序列比切口的5'可以从切口的3'延伸更远,但是切口的同源臂3'比切口的同源臂5'更短,以补偿。
示例性模板核酸
在某些实施例中,模板核酸是双链的。在其他实施例中,模板核酸是单链的。在某些实施例中,模板核酸包含单链部分和双链部分。在某些实施例中,模板核酸包含在切口、靶位点、和/或替换序列的任一侧上的约50至100bp,例如,55至95、60至90、65至85、或70至80bp的同源性。在某些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的约50、55、60、65、70、75、80、85、90、95、或100bp同源性。
在某些实施例中,模板核酸包含在切口、靶位点、和/或替换序列3'的约150至200bp,例如155至195、160至190、165至185、或170至180bp的同源性。在某些实施例中,模板核酸包含切口、靶位点、或替换序列3'的约150、155、160、165、170、175、180、185、190、195、或200bp同源性。在某些实施例中,模板核酸包含切口、靶位点、或替换序列5'的小于约100、90、80、70、60、50、40、30、20、15、或10bp同源性。
在某些实施例中,模板核酸包含在切口、靶位点、和/或替换序列5'的约150至200bp,例如,155至195、160至190、165至185、或170至180bp的同源性。在某些实施例中,模板核酸包含切口、靶位点、或替换序列5'的约150、155、160、165、170、175、180、185、190、195、或200bp同源性。在某些实施例中,模板核酸包含切口、靶位点、或替换序列3'的小于约100、90、80、70、60、50、40、30、20、15、或10bp同源性。
在某些实施例中,模板核酸包含例如,一个或多个核苷酸的核苷酸序列,其将被添加到或将模拟靶核酸中的变化。在其他实施例中,模板核酸包含可用于修饰靶位置的核苷酸序列。在其他实施例中,模板核酸包含可用于缺失HBG靶位置的一个或多个核苷酸的核苷酸序列。
该模板核酸可以包含替代序列。在一些实施例中,模板核酸包含5'同源臂。在其他的实施例中,该模板核酸包含3'同源臂。
模板核酸可包含5'同源臂,0个核苷酸或0bp的替换序列,和3'同源臂。
在某些实施例中,模板核酸是线性双链DNA。长度可以是例如约150bp-200bp,例如,约150bp、160bp、170bp、180bp、190bp或200bp。长度可以是例如,至少150bp、160bp、170bp、180bp、190bp或200bp。在一些实施例中,长度不大于150bp、160bp、170bp、180bp、190bp或200bp。在一些实施例中,双链模板核酸具有约160bp的长度,例如,约155bp-165bp、150bp-170bp、140bp-180bp、130bp-190bp、120bp-200bp、110bp-210bp、100bp-220bp、90bp-230bp或80bp-240bp。
该模板核酸可以是线性单链DNA。在某些实施例中,模板核酸是(i)可退火至靶核酸的带切口的链的线性单链DNA,(ii)可退火至靶核酸的完整链的线性单链DNA,(iii)可退火至靶核酸的正链的线性单链DNA,(iv)可退火至靶核酸的负链的线性单链DNA,或多于一种前述的线性单链DNA。长度可以是例如,约150-200个核苷酸,例如,约150、160、170、180、190或200个核苷酸。长度可以是例如,至少150、160、170、180、190或200个核苷酸。在一些实施例中,长度不大于150、160、170、180、190或200个核苷酸。在一些实施例中,单链模板核酸具有约160个核苷酸的长度,例如,约155-165、150-170、140-180、130-190、120-200、110-210、100-220、90-230或80-240个核苷酸。
在一些实施例中,模板核酸是环状双链DNA,例如,质粒。在一些实施例中,模板核酸在替换序列、靶位点、和/或切口的任一侧上包含约500至1000bp的同源性。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的约300、400、500、600、700、800、900、1000、1500、或2000bp同源性。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的至少300、400、500、600、700、800、900、1000、1500、或2000bp同源性。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的不超过300、400、500、600、700、800、900、1000、1500、或2000bp同源性。
在某些实施例中,可以将一个或两个同源臂缩短以避免包括某些序列重复元件(例如,Alu重复、LINE元件)。例如,可以缩短5'同源臂以避免序列重复元件,而可以缩短3'同源臂以避免序列重复元件。在一些实施例中,可以将5’和3’同源臂均缩短以避免包括某些序列重复元件。
在一些实施例中,模板核酸是腺病毒载体,例如,AAV载体,例如,长度和序列允许其包装在AAV衣壳中的ssDNA分子。载体可以是例如,小于5kb,并且可以含有促进包装到衣壳中的ITR序列。载体可能是整合缺陷的。在一些实施例中,模板核酸在替换序列、靶位点、和/或切口的任一侧上包含约150至1000个核苷酸的同源性。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的约100、150、200、300、400、500、600、700、800、900、1000、1500、或2000个核苷酸。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的至少100、150、200、300、400、500、600、700、800、900、1000、1500、或2000个核苷酸。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的至多100、150、200、300、400、500、600、700、800、900、1000、1500、或2000个核苷酸。
在一些实施例中,模板核酸是慢病毒载体,例如,IDLV(整合缺陷型慢病毒)。在一些实施例中,模板核酸在替换序列、靶位点、和/或切口的任一侧上包含约500至1000bp的同源性。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的约300、400、500、600、700、800、900、1000、1500、或2000bp同源性。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口或替换序列的5'和3'的至少300、400、500、600、700、800、900、1000、1500、或2000bp同源性。在一些实施例中,模板核酸包含切口、靶位点、或替换序列的5'、切口、靶位点、或替换序列的3'、或切口、靶位点、或替换序列的5'和3'的不超过300、400、500、600、700、800、900、1000、1500、或2000bp同源性。
在一个实施例中,模板核酸包含阻止Cas9识别和切割模板核酸的一个或多个突变,例如,沉默突变。相对于待改变的细胞基因组中的相应序列,模板核酸可包含例如,至少1、2、3、4、5、10、20或30个沉默突变。在某些实施例中,模板核酸相对于要改变的细胞的基因组中的相应序列包含至多2、3、4、5、10、20、30或50个沉默突变。在一个实施例中,cDNA包含阻止Cas9识别和切割模板核酸的一个或多个突变,例如,沉默突变。相对于待改变的细胞基因组中的相应序列,模板核酸可包含例如,至少1、2、3、4、5、10、20或30个沉默突变。在某些实施例中,模板核酸相对于要改变的细胞的基因组中的相应序列包含至多2、3、4、5、10、20、30或50个沉默突变。
在本文提供的方法的某些实施例中,HDR介导的改变用于引入γ-珠蛋白基因调控区域中的一个或多个核苷酸的改变(例如,缺失)。在某些实施例中,γ-珠蛋白基因调控区域可以是HBG靶位置。在某些实施例中,可以在HBG靶位置内的靶位点处引入改变(例如,缺失)。在某些实施例中,改变(例如,缺失)可选自HBG1 13bp del c.-114至-102、HBG1 4bpdel c.-225至-222、和HBG1 13bp del c.-114至-102中的一种或多种。在某些实施例中,靶位点可选自HBG1 c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2 c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)中的一种或多种。
在某些实施例中,用于在HBG靶位置内的靶位点(即,HBG1或HBG2调控区域)引入改变(例如,缺失)的模板核酸包含从5'到3'方向的5同源臂、替换序列、和3'同源臂,其中替换序列是0个核苷酸或0bp。在某些实施例中,所述模板核酸可以是单链寡脱氧核苷酸(ssODN)。在某些实施例中,5'同源臂可以是任何本文所述的5'同源臂。在某些实施例中,3'同源臂可以是任何本文所述的3'同源臂。在某些实施例中,可以在HBG靶位置内的靶位点处引入改变(例如,缺失)。在某些实施例中,改变(例如,缺失)可选自HBG1 13bp del c.-114至-102、HBG1 4bp del c.-225至-222、和HBG1 13bp del c.-114至-102中的一种或多种。在某些实施例中,靶位点可选自HBG1 c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1 c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2 c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)中的一种或多种。
例如,用于在靶位点HBG1 c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)处引入改变HBG1 13bp del c.-114至-102的模板核酸可以包含5'同源臂、替换序列、和3'同源臂,其中替换序列是0个核苷酸或0bp。在某些实施例中,5'同源臂的长度为包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。在某些实施例中,5'同源臂包含约50至100bp,例如55至95、60至90、70至90、或80至90bp,靶位点HBG1 c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)的同源性5'。在某些实施例中,5'同源臂包含SEQ ID NO:904(ssODN1 5'同源臂),基本上由其组成或由其组成。在某些实施例中,5'同源臂包含SEQ ID NO:907(PhTx ssODN1 5'同源臂),基本上由其组成或由其组成。在某些实施例中,3'同源臂的长度为包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。在某些实施例中,3'同源臂包含约50至100bp,例如55至95、60至90、70至90、或80至90bp,靶位点HBG1 c.-114至-102(例如,SEQ IDNO:902(HBG1)的核苷酸2824-2836)的同源性3'。在某些实施例中,3'同源臂包含SEQ IDNO:905(ssODN1 3'同源臂),基本上由其组成或由其组成。在某些实施例中,3'同源臂包含SEQ ID NO:908(PhTx ssODN1 3'同源臂),基本上由其组成或由其组成。在某些实施例中,模板核酸包含SEQ ID NO:906,基本上由其组成或由其组成。在某些实施例中,模板核酸包含SEQ ID NO:909(PhTx ssODN1),基本上由其组成或由其组成。
在另一个实例中,用于在靶位点HBG2 c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)处引入改变HBG2 13bp del c.-114至-102的模板核酸可以包含5'同源臂、替换序列、和3'同源臂,其中替换序列是0个核苷酸或0bp。在某些实施例中,5'同源臂的长度为包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。在某些实施例中,5'同源臂包含约50至100bp,例如55至95、60至90、70至90、或80至90bp,靶位点HBG2 c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)的同源性5'。在某些实施例中,5'同源臂包含SEQ ID NO:904(ssODN1 5'同源臂),基本上由其组成或由其组成。在某些实施例中,5'同源臂包含SEQ ID NO:907(PhTx ssODN1 5'同源臂),基本上由其组成或由其组成。在某些实施例中,3'同源臂的长度为包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。在某些实施例中,3'同源臂包含约50至100bp,例如55至95、60至90、70至90、或80至90bp,靶位点HBG2 c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)的同源性3'。在某些实施例中,3'同源臂包含SEQ ID NO:905(ssODN1 3'同源臂),基本上由其组成或由其组成。在某些实施例中,3'同源臂包含SEQ ID NO:908(PhTx ssODN1 3'同源臂),基本上由其组成或由其组成。在某些实施例中,模板核酸包含SEQ ID NO:906,基本上由其组成或由其组成。在某些实施例中,模板核酸包含SEQ ID NO:909(PhTx ssODN1),基本上由其组成或由其组成。
在另一个实例中,用于在靶位点HBG1 c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)处引入改变HBG1 4bp del c.-225至-222的模板核酸可以包含5'同源臂、替换序列、和3'同源臂,其中替换序列是0个核苷酸或0bp。在某些实施例中,5'同源臂的长度为包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175或200个核苷酸。在某些实施例中,5'同源臂包含约50至100bp,例如55至95、60至90、70至90、或80至90bp,靶位点HBG1 c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)的同源性5'。在某些实施例中,3'同源臂的长度为包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175或200个核苷酸。在某些实施例中,3'同源臂包含约50至100bp,例如55至95、60至90、70至90、或80至90bp,靶位点HBG1 c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)的同源性3'。
在某些实施例中,5'同源臂包含5'硫代磷酸酯(PhTx)修饰。在某些实施例中,3'同源臂包含3'PhTx修饰。在某些实施例中,模板核酸包含5'和3'PhTx修饰。
在某些实施例中,用于改变γ-珠蛋白基因(例如,HBG1,HBG2)调控区域中的单个核苷酸的模板核酸包含5'至3'方向的5'同源臂、替换序列、和3'同源臂,其中替换被设计成掺入单核苷酸改变。例如,其中掺入的改变是HBG1 c.-114C>T、c.-158C>T、c.-167C>T、c.-196C>T、或c.-201C>T或HBG2 c.-109G>T、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-211C>T,替换序列可以包含单个核苷酸T,并且任选地在所述T的一侧或两侧包含一个或多个核苷酸。类似地,如果掺入的改变是HBG1 c.-117G>A、c.-170G>A、或c.-499T>A或HBG2c.-114C>A或c.-167C>A,替换序列可以包含单个核苷酸A,并且任选地在所述A的一侧或两侧包含一个或多个核苷酸;其中掺入的改变是HBG1 c.-175T>G或c.-195C>G或HBG2 c.-202C>G、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G,替换序列可以包含单个核苷酸G,并且任选地在所述G的一侧或两侧包含一个或多个核苷酸;并且其中掺入的改变是HBG1c.-175T>C、c.-198T>C、或c.-251T>C或HBG2 c.-175T>C或c.-228T>C,替换序列可以包含单个核苷酸C,并且任选地在所述C的一侧或两侧包含一个或多个核苷酸。
在某些实施例中,5'和3'同源臂各自包含与替换序列相应的核苷酸侧翼的一段序列长度。在某些实施例中,模板核酸包含侧翼为5'同源臂和3'同源臂的替换序列,所述臂各自独立地包含10个或更多、20个或更多、50个或更多、100个或更多、150个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、450个或更多、500个或更多、550个或更多、600个或更多、650个或更多、700个或更多、750个或更多、800个或更多、850个或更多、900个或更多、1000个或更多、1100个或更多、1200个或更多、1300个或更多、1400个或更多、1500个或更多、1600个或更多、1700个或更多、1800个或更多、1900个或更多、或2000个或更多核苷酸。在某些实施例中,模板核酸包含侧翼为5'同源臂和3'同源臂的替换序列,所述臂各自独立地包含至少50个、100个、或150个核苷酸,但不足以长到包括重复元件。在某些实施例中,模板核酸包含侧翼为5'同源臂和3'同源臂的替换序列,所述臂各自独立地包含5至100个、10至150个、或20至150个核苷酸。在某些实施例中,替换序列任选地包含启动子和/或polyA信号。
单链退火
单链退火(SSA)是另一种修复存在于靶核酸中的两个重复序列之间的双链断裂的DNA修复过程。由SSA途径所利用的重复序列的长度通常大于30个核苷酸。在断裂端处发生切除,以显示靶核酸的两条链上的重复序列。切除之后,将含有重复序列的单链突出端用RPA蛋白涂覆,以防止重复序列不适当地退火,例如退火至自身。RAD52结合至突出端上的重复序列中的每者上并且将所述序列对齐以使得互补的重复序列能够退火。退火之后,切割突出端的单链翼。新的DNA合成填充任何空位,并且连接恢复DNA双链体。作为所述处理的结果,两个重复之间的DNA序列被缺失。缺失的长度可以取决于很多因素,包括所利用的两个重复的位置、以及切除的途径或持续进行能力。
与HDR途径相反,SSA不需要模板核酸来改变靶核酸序列。而是利用互补的重复序列。
其他DNA修复途径
SSBR(单链断裂修复)
基因组中的单链断裂(SSB)由SSBR途径来修复,所述SSBR途径是不同于上文讨论的DSB修复机制的机制。SSBR途径具有四个主要阶段:SSB检测、DNA末端处理、DNA空位填充、以及DNA连接。更详细的解释给出于Caldecott 2008中,并且这里给出概述。
在第一阶段中,当形成SSB时,PARP1和/或PARP2识别断裂并募集修复机器。DNA断裂处的PARP1结合和活性是瞬时的,并且它似乎通过促进损伤处的SSBr蛋白复合物的病灶积累或稳定性而加速SSBr。可论证地,这些SSBr蛋白中最重要的是XRCC1,它作为分子支架起作用,所述分子支架与SSBr过程的多种酶组分(包括负责清除DNA 3’和5’端的蛋白质)相互作用,使所述酶组分稳定化,并且刺激所述酶组分。例如,XRCC1与促进末端处理的若干蛋白质(DNA聚合酶β、PNK、和三种核酸酶APE1、APTX和APLF)相互作用。APE1具有内切核酸酶活性。APLF展示出内切核酸酶和3’到5’外切核酸酶活性。APTX具有内切核酸酶和3’到5’外切核酸酶活性。
这种末端处理是SSBR的重要阶段,因为大部分(若非全部)SSB的3’-和/或5’-末端是‘被损伤的’。末端处理通常涉及将被损伤的3’-端恢复到羟基化状态和/或将被损伤的5’端恢复成磷酸酯部分,这样使得所述末端变得有连接能力。可以处理被损伤的3’末端的酶包括PNKP、APE1、和TDP1。可以处理被损伤的5’末端的酶包括PNKP、DNA聚合酶β、和APTX。LIG3(DNA连接酶III)也可以参与末端处理。一旦将末端清除,便可发生空位填充。
在DNA空位填充阶段,典型存在的蛋白质是PARP1、DNA聚合酶β、XRCC1、FEN1(翼内切核酸酶1)、DNA聚合酶δ/ε、PCNA、以及LIG1。存在两种空位填充方式,短补丁修复(shortpatch repair)和长补丁修复(long patch repair)。短补丁修复涉及插入丢失的单核苷酸。在一些SSB处,“空位填充”可能继续取代两个或更多个核苷酸(已经报道了多达12个碱基的取代)。FEN1是去除被取代的5’-残基的内切核酸酶。多种DNA聚合酶(包括Polβ)涉及在SSB的修复中,其中DNA聚合酶的选择受SSB的来源和类型的影响。
在第四阶段中,DNA连接酶如LIG1(连接酶I)或LIG3(连接酶III)催化末端连接。短补丁修复使用连接酶III,并且长补丁修复使用连接酶I。
有时,SSBR是与复制偶联的。这条途径可以涉及CtIP、MRN、ERCC1、和FEN1中的一者或多者。可以促进SSBR的另外的因子包括:aPARP、PARP1、PARP2、PARG、XRCC1、DNA聚合酶b、DNA聚合酶d、DNA聚合酶e、PCNA、LIG1、PNK、PNKP、APE1、APTX、APLF、TDP1、LIG3、FEN1、CtIP、MRN、以及ERCC1。
MMR(错配修复)
细胞含有三条切除修复途径:MMR、BER、和NER。所述切除修复途径具有的共同特点在于它们典型地识别DNA一条链上的损伤,然后外切/内切核酸酶去除所述损伤并且留下随后被DNA聚合酶填充的1-30个核苷酸的空位并且最终用连接酶密封。更完整的图片给出于Li 2008中,并且这里提供了概述。
错配修复(MMR)在错配的DNA碱基上运行。
MSH2/6或MSH2/3两种复合物都具有在错配识别和修复启动中发挥重要作用的ATP酶活性。MSH2/6优先识别碱基-碱基错配并且识别1或2个核苷酸的错配,而MSH2/3优先识别较大的ID错配。
hMLH1与hPMS2杂二聚化,以形成hMutLα,其具有ATP酶活性并且对于MMR的多个步骤而言是重要的。它具有PCNA/复制因子C(RFC)依赖性内切核酸酶活性,所述活性在涉及EXO1(EXO1是HR和MMR两者中的参与者)的3′切口指导的MMR中发挥重要作用。它调节错配引起的切除的终止。连接酶I是这条途径的相关连接酶。可以促进MMR的另外的因子包括:EXO1、MSH2、MSH3、MSH6、MLH1、PMS2、MLH3、DNA Pol d、RPA、HMGB1、RFC、以及DNA连接酶I。
碱基切除修复(BER)
碱基切除修复(BER)途径贯穿细胞周期是激活的;它主要负责从基因组中去除小的、非螺旋扭曲碱基损伤。相比之下,相关的核苷酸切除修复途径(在下一部分中讨论)修复庞大的螺旋扭曲损伤。更详细的解释给出于Caldecott 2008中,并且这里给出概述。
DNA碱基损伤后,碱基切除修复(BER)启动并且所述过程可以被简化为五个主要步骤:(a)去除被损伤的DNA碱基;(b)切开后续碱基位点;(c)清理DNA末端;(d)将希望的核苷酸(例如,HPFH突变体)插入修复空位;以及(e)连接DNA骨架中的剩余切口。这些最后的步骤类似于SSBR。
在第一步中,损伤特异性DNA糖基化酶通过切割将碱基连接至糖磷酸骨架上的N-糖苷键而切除被损伤的碱基。然后具有相关裂解酶活性的AP内切核酸酶-1(APE1)或双功能DNA糖基化酶切开磷酸二酯骨架以产生DNA单链断裂(SSB)。BER的第三步涉及清理DNA末端。BER中的第四步由Polβ进行,它将新的互补核苷酸添加到修复空位中,并且在最终步骤中,XRCC1/连接酶III密封DNA骨架中的剩余切口。这完成了短补丁BER途径,其中大多数(约80%)的被损伤的DNA碱基得到修复。然而,如果在步骤3中在通过Polβ插入一个核苷酸后5'-端对末端处理活性有抗性,则将聚合酶换为复制型DNA聚合酶Polδ/ε,所述复制型DNA聚合酶然后再将约2-8个核苷酸添加到DNA修复空位中。这产生了5′翼结构,其被与持续合成能力因子增殖细胞核抗原(PCNA)相关的翼内切核酸酶-1(FEN-1)识别并切除。DNA连接酶I然后密封DNA骨架中的剩余切口并完成长补丁BER。可以促进BER途径的另外的因子包括:DNA糖基化酶、APE1、Polb、Pold、Pole、XRCC1、连接酶III、FEN-1、PCNA、RECQL4、WRN、MYH、PNKP、以及APTX。
核苷酸切除修复(NER)
核苷酸切除修复(NER)是从DNA中去除庞大的螺旋扭曲损伤的重要切除机制。关于NER的另外的细节在Marteijn 2014中给出,并且这里给出概述。NER是涵盖两条更小途径的宽途径:全基因组NER(GG-NER)和转录偶联修复NER(TC-NER)。GG-NER和TC-NER使用不同的因子来识别DNA损伤。然而,它们利用相同的机器进行损伤切开、修复、和连接。
一旦识别出损伤,细胞去除含有所述损伤的短的单链DNA区段。内切核酸酶XPF/ERCC1和XPG(由ERCC5编码)通过切割损伤任一侧上的被损伤的链而去除损伤,产生22-30个核苷酸的单链空位。接着,细胞进行DNA空位填充合成和连接。在这个过程中涉及的是:PCNA、RFC、DNA Polδ、DNA Polε或DNA Polκ、以及DNA连接酶I或XRCC1/连接酶III。复制型细胞倾向于使用DNA polε和DNA连接酶I进行连接步骤,而非复制型细胞倾向于使用DNA Polδ、DNA Polκ、和XRCC1/连接酶III复合物进行连接步骤。
NER可以涉及以下因子:XPA-G、POLH、XPF、ERCC1、XPA-G、以及LIG1。转录偶联NER(TC-NER)可以涉及以下因子:CSA、CSB、XPB、XPD、XPG、ERCC1、以及TTDA。可以促进NER修复途径的另外的因子包括XPA-G、POLH、XPF、ERCC1、XPA-G、LIG1、CSA、CSB、XPA、XPB、XPC、XPD、XPF、XPG、TTDA、UVSSA、USP7、CETN2、RAD23B、UV-DDB、CAK子复合物、RPA、以及PCNA。
链间交联(ICL)
称为ICL修复途径的专用途径修复链间交联。可以在复制或转录期间在不同DNA链中的碱基之间发生链间交联、或共价交联。ICL修复涉及多个修复过程的协作,具体地溶核活性、跨损伤合成(TLS)、和HDR。核酸酶被募集以切除被交联的碱基的任一侧上的ICL,同时TLS和HDR协作以修复被切割的链。ICL修复可以涉及以下因子:内切核酸酶(例如,XPF和RAD51C)、内切核酸酶(例如RAD51)、跨损伤聚合酶(例如,DNA聚合酶ζ和Rev1)、以及范科尼贫血(FA)蛋白(例如,FancJ)。
其他途径
在哺乳动物体内存在若干其他DNA修复途径。
跨损伤合成(TLS)是用于修复有缺陷复制事件之后留下的单链断裂的途径,并且涉及跨损伤聚合酶(例如,DNA polβ和Rev1)。
无误复制后修复(PRR)是另一条用于修复有缺陷复制事件之后留下的单链断裂的途径。
基因组编辑方法中gRNA的实例
如在此描述的gRNA分子可以与产生双链断裂或单链断裂的Cas9分子一起使用,以改变靶核酸的序列,例如靶位置或靶基因标签。下文描述了在这些方法中有用的gRNA分子。
在某些实施例中,所述gRNA(例如,一种嵌合gRNA)被配置成使得它包含以下特性中的一种或多种:
(a)它可以将双链断裂(例如,当靶向产生双链断裂的Cas9分子时)定位(i)在靶位置的50、100、150、200、250、300、350、400、450、或500个核苷酸内、或(ii)足够接近使得所述靶位置在末端切除的区域内;
(b)它具有至少16个核苷酸的靶向结构域,例如(i)16、(ii)17、(iii)18、(iv)19、(v)20、(vi)21、(vii)22、(viii)23、(ix)24、(x)25、或(xi)26个核苷酸的靶向结构域;以及
(c)(i)当一起考虑时,所述近端和尾部结构域包含来自以下项的至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸,例如至少15、18、20、25、30、31、35、40、45、49、50,或53个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌尾部和近端结构域、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(ii)所述第二互补结构域的最后一个核苷酸的3’存在来自以下项的至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸,例如至少15、18、20、25、30、31、35、40、45、49、50,或53个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌gRNA的相应序列、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(iii)所述第二互补结构域的最后一个核苷酸的3’存在来自以下项的至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸(这些核苷酸与所述第一互补结构域的相应核苷酸互补)例如至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌gRNA的相应序列、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(iv)所述尾部结构域在长度上是至少10、15、20、25、30、35或40个核苷酸,例如,它包含来自以下项的至少10、15、20、25、30、35或40个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌尾部结构域、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;或
(c)(v)所述尾部结构域包含天然存在的尾部结构域(例如,天然存在的化脓链球菌或金黄色葡萄球菌尾部结构域)的相应部分的15、20、25、30、35、40个核苷酸或全部。
在某些实施例中,所述gRNA被配置成使得它包含特性:a和b(i);a和b(ii);a和b(iii);a和b(iv);a和b(v);a和b(vi);a和b(vii);a和b(viii);a和b(ix);a和b(x);a和b(xi);a和c;a、b和c;a(i)、b(i)和c(i);a(i)、b(i)和c(ii);a(i)、b(ii)和c(i);a(i)、b(ii)和c(ii);a(i)、b(iii)和c(i);a(i)、b(iii)和c(ii);a(i)、b(iv)和c(i);a(i)、b(iv)和c(ii);a(i)、b(v)和c(i);a(i)、b(v)和c(ii);a(i)、b(vi)和c(i);a(i)、b(vi)和c(ii);a(i)、b(vii)和c(i);a(i)、b(vii)和c(ii);a(i)、b(viii)和c(i);a(i)、b(viii)和c(ii);a(i)、b(ix)和c(i);a(i)、b(ix)和c(ii);a(i)、b(x)和c(i);a(i)、b(x)和c(ii);a(i)、b(xi)或c(i);a(i)、b(xi)和c(ii)。
在某些实施例中,所述gRNA(例如,一种嵌合gRNA)被配置成使得它包含以下特性中的一种或多种:
(a)gRNA中的一者或两者可以将单链断裂(例如,当靶向产生单链断裂的Cas9分子时)定位(i)在靶位置的50、100、150、200、250、300、350、400、450、或500个核苷酸内、或(ii)足够接近使得所述靶位置在末端切除的区域内;
(b)一者或两者具有至少16个核苷酸的靶向结构域,例如(i)16、(ii)17、(iii)18、(iv)19、(v)20、(vi)21、(vii)22、(viii)23、(ix)24、(x)25、或(xi)26个核苷酸的靶向结构域;以及
(c)(i)当一起考虑时,所述近端和尾部结构域包含来自以下项的至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸,例如,至少15、18、20、25、30、31、35、40、45、49、50,或53个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌尾部和近端结构域、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(ii)所述第二互补结构域的最后一个核苷酸的3'存在来自以下项的至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸,例如,至少15、18、20、25、30、31、35、40、45、49、50,或53个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌gRNA的相应序列、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(iii)所述第二互补结构域的最后一个核苷酸的3'存在来自以下项的至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸(这些核苷酸与所述第一互补结构域的相应核苷酸互补)例如,至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌gRNA的相应序列、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(iv)所述尾部结构域在长度上是至少10、15、20、25、30、35或40个核苷酸,例如,它包含来自以下项的至少10、15、20、25、30、35或40个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌尾部结构域、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;或
(c)(v)所述尾部结构域包含天然存在的尾部结构域(例如,天然存在的化脓链球菌或金黄色葡萄球菌尾部结构域)的相应部分的15、20、25、30、35、或40个核苷酸或全部。
在某些实施例中,所述gRNA被配置成使得它包含特性:a和b(i);a和b(ii);a和b(iii);a和b(iv);a和b(v);a和b(vi);a和b(vii);a和b(viii);a和b(ix);a和b(x);a和b(xi);a和c;a、b和c;a(i)、b(i)和c(i);a(i)、b(i)和c(ii);a(i)、b(ii)和c(i);a(i)、b(ii)和c(ii);a(i)、b(iii)和c(i);a(i)、b(iii)和c(ii);a(i)、b(iv)和c(i);a(i)、b(iv)和c(ii);a(i)、b(v)和c(i);a(i)、b(v)和c(ii);a(i)、b(vi)和c(i);a(i)、b(vi)和c(ii);a(i)、b(vii)和c(i);a(i)、b(vii)和c(ii);a(i)、b(viii)和c(i);a(i)、b(viii)和c(ii);a(i)、b(ix)和c(i);a(i)、b(ix)和c(ii);a(i)、b(x)和c(i);a(i)、b(x)和c(ii);a(i)、b(xi)和c(i);a(i)、b(xi)和c(ii)。
在某些实施例中,所述gRNA与具有HNH活性的Cas9切口酶分子一起使用,例如,具有RuvC活性失活的Cas9分子(例如,在D10处具有突变(例如,D10A突变)的Cas9分子)。
在一个实施例中,所述gRNA与具有RuvC活性的Cas9切口酶分子一起使用,例如,具有HNH活性失活的Cas9分子(例如,在840处具有突变(例如,H840A)的Cas9分子)。
在一个实施例中,所述gRNA与具有RuvC活性的Cas9切口酶分子一起使用,例如HNH活性失活的Cas9分子(例如,在N863处具有突变(例如,N863A突变)的Cas9分子)。
在一个实施例中,一对gRNA(例如,一对嵌合gRNA),其包含第一和第二gRNA,被配置成使得他们包含以下特性中的一种或多种:
(a)gRNA中的一者或两者可以将单链断裂(例如,当靶向产生单链断裂的Cas9分子时)定位(i)在靶位置的50、100、150、200、250、300、350、400、450、或500个核苷酸内、或(ii)足够接近使得所述靶位置在末端切除的区域内;
(b)一者或两者具有至少16个核苷酸的靶向结构域,例如(i)16、(ii)17、(iii)18、(iv)19、(v)20、(vi)21、(vii)22、(viii)23、(ix)24、(x)25、或(xi)26个核苷酸的靶向结构域;
(c)(i)当一起考虑时,所述近端和尾部结构域包含来自以下项的至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸,例如至少15、18、20、25、30、31、35、40、45、49、50,或53个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌尾部和近端结构域、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(ii)所述第二互补结构域的最后一个核苷酸的3'存在来自以下项的至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸,例如,至少15、18、20、25、30、31、35、40、45、49、50,或53个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌gRNA的相应序列、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(iii)所述第二互补结构域的最后一个核苷酸的3’存在来自以下项的至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸(这些核苷酸与所述第一互补结构域的相应核苷酸互补)例如,至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌gRNA的相应序列、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;
(c)(iv)所述尾部结构域在长度上是至少10、15、20、25、30、35或40个核苷酸,例如,它包含来自以下项的至少10、15、20、25、30、35或40个核苷酸:天然存在的化脓链球菌或金黄色葡萄球菌尾部结构域、或一个与之相差不多于1、2、3、4、5、6、7、8、9或10个核苷酸的序列;或
(c)(v)所述尾部结构域包含天然存在的尾部结构域(例如,天然存在的化脓链球菌或金黄色葡萄球菌尾部结构域)的相应部分的15、20、25、30、35、或40个核苷酸或全部;
(d)所述gRNA被配置成使得,当杂交到靶核酸上时,他们被0-50、0-100、0-200、至少10、至少20、至少30或至少50个核苷酸分开;
(e)由所述第一gRNA和第二gRNA产生的断裂在不同的链上;以及
(f)这些PAM面向外部。
在某些实施例中,所述gRNA中的一者或两者被配置成使得它包含特性:a和b(i);a和b(ii);a和b(iii);a和b(iv);a和b(v);a和b(vi);a和b(vii);a和b(viii);a和b(ix);a和b(x);a和b(xi);a和c;a、b和c;a(i)、b(i)和c(i);a(i)、b(i)和c(ii);a(i)、b(i)c和d;a(i)、b(i)、c和e;a(i)、b(i)、c、d和e;a(i)、b(ii)和c(i);a(i)、b(ii)和c(ii);a(i)、b(ii)、c和d;a(i)、b(ii)、c和e;a(i)、b(ii)、c、d和e;a(i)、b(iii)和c(i);a(i)、b(iii)和c(ii);a(i)、b(iii)、c和d;a(i)、b(iii)、c和e;a(i)、b(iii)、c、d和e;a(i)、b(iv)和c(i);a(i)、b(iv)和c(ii);a(i)、b(iv)、c和d;a(i)、b(iv)、c和e;a(i)、b(iv)、c、d和e;a(i)、b(v)和c(i);a(i)、b(v)和c(ii);a(i)、b(v)、c和d;a(i)、b(v)、c和e;a(i)、b(v)、c、d和e;a(i)、b(vi)和c(i);a(i)、b(vi)和c(ii);a(i)、b(vi)、c和d;a(i)、b(vi)、c和e;a(i)、b(vi)、c、d和e;a(i)、b(vii)和c(i);a(i)、b(vii)和c(ii);a(i)、b(vii)、c和d;a(i)、b(vii)、c和e;a(i)、b(vii)、c、d和e;a(i)、b(viii)和c(i);a(i)、b(viii)和c(ii);a(i)、b(viii)、c和d;a(i)、b(viii)、c和e;a(i)、b(viii)、c、d和e;a(i)、b(ix)和c(i);a(i)、b(ix)和c(ii);a(i)、b(ix)、c和d;a(i)、b(ix)、c和e;a(i)、b(ix)、c、d和e;a(i)、b(x)和c(i);a(i)、b(x)和c(ii);a(i)、b(x)、c和d;a(i)、b(x)、c和e;a(i)、b(x)、c、d和e;a(i)、b(xi)和c(i);a(i)、b(xi)和c(ii);a(i)、b(xi)、c和d;a(i)、b(xi)、c和e;a(i)、b(xi)、c、d和e。
在某些实施例中,所述gRNA与具有HNH活性的Cas9切口酶分子一起使用,例如,具有RuvC活性失活的Cas9分子(例如,在D10处具有突变(例如,D10A突变)的Cas9分子)。
在某些实施例中,所述gRNA与具有RuvC活性的Cas9切口酶分子一起使用,例如,HNH活性失活的Cas9分子(例如,在H840处具有突变(例如,H840突变)的Cas9分子)。
在某些实施例中,所述gRNA与具有RuvC活性的Cas9切口酶分子一起使用,例如,HNH活性失活的Cas9分子(例如,在N863处具有突变(例如,N863A突变)的Cas9分子)。
靶细胞
在多种细胞中,可以将Cas9分子和gRNA分子(例如,Cas9分子/gRNA分子复合物)用于改变(例如,引入突变或缺失)靶核酸,例如,γ-珠蛋白基因(例如,HBG1,HBG2)调控区域)。在某些实施例中,靶向细胞中靶核酸的改变可以在体外、离体或体内进行。
可以将本文描述的Cas9和gRNA分子递送至靶细胞。在某些实施例中,靶向细胞是红系细胞,例如,成红细胞。在某些实施例中,优先靶向红系细胞,例如,至少约90%、95%、96%、97%、98%、99%或100%的靶细胞是红系细胞。例如,在体内递送的情况下,优先靶向红系细胞,并且如果细胞离体处理并返回受试者,则优先修饰红系细胞。
在某些实施例中,靶向细胞是循环血细胞,例如,网织红细胞、巨核细胞红系祖细胞(MEP)、髓样祖细胞(CMP/GMP)、淋巴样祖细胞(LP)、造血干细胞/祖细胞(HSC)、或内皮细胞(EC)。在某些实施例中,靶向细胞是骨髓细胞(例如,网织红细胞、红系细胞(例如,成红细胞)、MEP细胞、髓样祖细胞(CMP/GMP)、LP细胞、红系祖细胞(EP)、HSC、多能祖细胞(MPP)、内皮细胞(EC)、造血内皮细胞(HE)、或间充质干细胞)。在某些实施例中,靶向细胞是髓样祖细胞(例如,普通髓样祖细胞(CMP)或粒细胞巨噬细胞集落刺激因子祖细胞(GMP))。在某些实施例中,靶向细胞是淋巴样祖细胞,例如,淋巴共同祖细胞(CLP)。在某些实施例中,靶向细胞是红系祖细胞(例如,MEP细胞)。在某些实施例中,靶向细胞是造血干细胞/祖细胞(例如,长期HSC(LT-HSC)、短期HSC(ST-HSC)、MPP细胞、或谱系限制性祖细胞(LRP))。在某些实施例中,靶向细胞是CD34+细胞、CD34+CD90+细胞、CD34+CD38-细胞、CD34+CD90+CD49f+CD38-CD45RA-细胞、CD105+细胞、CD31+、或CD133+细胞、或CD34+CD90+CD133+细胞。在某些实施例中,靶向细胞是脐血CD34+HSPC、脐带静脉内皮细胞、脐带动脉内皮细胞、羊水CD34+细胞、羊水内皮细胞、胎盘内皮细胞或胎盘造血CD34+细胞。在某些实施例中,靶向细胞是动员的外周血造血CD34+细胞(在患者用动员剂例如,G-CSF或普乐沙福(Plerixafor)治疗之后)。在某些实施例中,靶向细胞是外周血内皮细胞。
在某些实施例中,通过编辑γ-珠蛋白基因调控区域离体操纵靶向细胞,然后将靶细胞施用于受试者。用于离体操纵的靶向细胞的来源可以包括,例如,受试者的血液、骨髓或脐血。其他用于离体操纵的靶向细胞的来源可以包括,例如,异源供体血液、脐血、或骨髓。在某些实施例中,从受试者中去除红细胞,将其如上所述离体操纵,并返回至受试者中。在某些实施例中,从受试者中去除造血干细胞,将其如上所述离体操纵,并返回至受试者中。在某些实施例中,从受试者中去除红系祖细胞,将其如上所述离体操纵,并返回至受试者中。在某些实施例中,从受试者中去除髓样祖细胞,将其如上所述离体操纵,并返回至受试者中。在某些实施例中,从受试者中去除多能祖细胞(MPP),将其如上所述离体操纵,并返回至受试者中。在某些实施例中,从受试者中去除造血干细胞/祖细胞(HSC),将其如上所述离体操纵,并返回至受试者中。在某些实施例中,从受试者中去除CD34+HSC,将其如上所述离体操纵,并返回至受试者中。
在某些实施例中,离体产生的修饰的HSC在没有清髓性预调理的情况下施用于受试者。在其他实施例中,在轻度清髓性调理后施用修饰的HSC,使得在植入后,一些造血细胞衍生自修饰的HSC。在又其他实施例中,在完全清髓性调理后施用修饰的HSC,使得在植入后,100%造血细胞衍生自修饰的HSC。
合适的细胞还可包括干细胞,例如,胚胎干细胞、诱导性多能干细胞,造血干细胞、或造血内皮细胞(HE)(造血干细胞和内皮细胞的前体)。在某些实施例中,细胞是诱导的多能干细胞(iPS)或衍生自iPS细胞的细胞,例如,使用本文公开的方法修饰的受试者产生的iPS细胞,并分化成临床相关细胞,例如,红细胞。在某些实施例中,将AAV用于转导靶细胞。
在某些实施例中,可以制备用于如本文所述的基因编辑的干细胞,用于根据Gori2016中的实例中描述的方法,例如,第219-223页、第223-224页、第227-231页、第231-236页、第235-238页、第240-241页、第242-244页,其通过引用结合在此。干细胞可以以本领域技术人员合适和已知的任何方式培养和扩增。
可以即刻使用由本文所述方法产生的细胞。可替代地,细胞可以被冷冻(例如在液氮中)并储存以备后用。通常细胞将被冷冻在10%二甲基亚砜(DMSO)、50%血清、40%缓冲介质或本领域常用的一些其他此类溶液中,以在这样的冷冻温度下保存细胞,并以本领域通常已知用于解冻冷冻的培养细胞的方式解冻。细胞也可以进行热稳定化,以便在4℃下长期存储。
递送、配制品和给予途径
基因组编辑系统组分,例如,RNA指导的核酸酶分子,例如,Cas9分子、gRNA分子(例如,Cas9分子/gRNA分子复合物)、和供体模板核酸或全部三种,能以各种形式被递送、配制或施用,参见例如,表3和表4。
在某些实施例中,例如通过AAV载体递送一种Cas9分子和两种或更多种(例如,2、3、4种或更多种)不同的gRNA分子。在某些实施例中,编码Cas9分子的序列和编码两种或更多种(例如,2、3、4种或更多种)不同的gRNA分子的一个或多个序列存在于相同的核酸分子上,例如,AAV载体。当递送一种Cas9或gRNA组分被编码在DNA中时,所述DNA将典型地包括控制区域(例如,包含启动子)以实现表达。对于Cas9分子序列有用的启动子包括CMV、SFFV、EFS、EF-1a、PGK、CAG和CBH启动子或血细胞特异性启动子。在实施例中,启动子是组成型启动子。在另一个实施例中,启动子是组织特异性启动子。对于gRNA有用的启动子包括T7.H1、EF-1a、U6、U1和tRNA启动子。可以选择具有类似或不同强度的启动子来调谐组分的表达。编码Cas9分子的序列可以包括核定位信号(NLS),例如,SV40NLS。在一个实施例中,编码Cas9分子的序列包含至少两个核定位信号。在实施例中,用于Cas9分子或gRNA分子的启动子可以独立地是诱导型、组织特异性、或细胞特异性的。
表3提供了可以如何配制、递送、或施用所述组分的实例。
表3
表4概括了Cas系统的组分(例如,如本文所述的Cas9分子组分和gRNA分子组分)的各种递送方法。
表4
基于DNA的RNA指导的核酸酶和或一个或多个gRNA分子的递送
编码RNA指导的核酸酶,例如,Cas9分子(例如,eaCas9分子)、gRNA分子的核酸、供体模板核酸或其任何组合(例如,两种或全部)可以通过本领域已知的方法或如在本文中所述施用于受试者或递送至细胞中。例如,编码Cas9和/或编码gRNA的DNA、以及供体模板核酸可以通过,例如,载体(例如,病毒或非病毒载体)、非基于载体的方法(例如,使用裸DNA或DNA复合物)、或其组合进行递送。
编码Cas9分子(例如,eaCas9分子)和/或gRNA分子的核酸可以与促进靶细胞(例如,红细胞,HSC)的摄取的分子(例如,N-乙酰半乳糖胺)进行缀合。供体模板分子同样可以与促进靶细胞(例如,红细胞,HSC)摄取的分子(例如,N-乙酰半乳糖胺)偶联。
在一些实施例中,编码Cas9和/或gRNA的DNA是通过载体(例如,病毒载体/病毒或质粒)进行递送的。
载体可包含编码Cas9分子和/或gRNA分子的序列和/或与靶向区域(例如,靶向序列)具有高度同源性的供体模板。在某些实施例中,供体模板包含靶序列的全部或部分。示例性供体模板是修复模板,例如基因校正模板或基因突变模板,例如点突变(例如单核苷酸(nt)取代)模板。载体还可以包括编码融合到例如Cas9分子序列上的信号肽(例如,用于核定位、核仁定位、线粒体定位)的序列。例如,载体可以包括融合到编码Cas9分子的序列上的核定位序列(例如,来自SV40)。
可以在载体中包括一个或多个调控/控制元件,例如启动子、增强子、内含子、多聚腺苷酸化信号、Kozak共有序列或内部核糖体进入位点(IRES)。在一些实施例中,启动子由RNA聚合酶II识别(例如,CMV启动子)。在其他实施例中,启动子被RNA聚合酶III识别(例如,U6启动子)。在一些实施例中,启动子是受调控的启动子(例如,诱导型启动子)。在其他的实施例中,启动子是组成型启动子。在一些实施例中,启动子是组织特异性启动子。在一些实施例中,启动子是病毒启动子。在其他的实施例中,启动子是非病毒启动子。
在一些实施例中,载体是病毒载体(例如,用于产生重组病毒)。在一些实施例中,病毒是DNA病毒(例如,dsDNA或ssDNA病毒)。在其他实施例中,所述病毒是RNA病毒(例如,ssRNA病毒)。在一些实施例中,病毒感染分裂细胞。在其他的实施例中,病毒感染非分裂细胞。示例性病毒载体/病毒包括,例如,逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒、以及单纯疱疹病毒。
在一些实施例中,病毒感染分裂和非分裂细胞两者。在一些实施例中,病毒可以整合到宿主基因组中。在一些实施例中,病毒被工程化以具有降低的免疫性(例如,在人类中)。在一些实施例中,病毒是有复制能力的。在其他的实施例中,病毒是复制缺陷型的(例如,另外多轮的病毒粒子复制和/或包装所需的基因的一个或多个编码区域被其他基因替换或缺失)。在一些实施例中,病毒引起Cas9分子和/或gRNA分子的瞬时表达。在其他的实施例中,病毒引起Cas9分子和/或gRNA分子的持久(例如,至少1周、2周、1个月、2个月、3个月、6个月、9个月、1年、2年、或永久)表达。病毒的包装能力可以在,例如,至少约4kb到至少约30kb(例如,至少约5kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb或50kb)之间变化。
在一个实施例中,病毒载体识别特定的细胞类型或组织。例如,病毒载体可以用不同/替代的病毒包膜糖蛋白进行假型包装;用细胞类型特异性受体进行工程化(例如,对一种或多种病毒包膜糖蛋白进行一个或多个遗传修饰以结合靶向配体(例如肽配体、单链抗体或生长因子));和/或进行工程化以具有双重特异性的分子桥,其中一端识别病毒糖蛋白而另一端识别靶细胞表面的部分(例如,配体-受体、单克隆抗体、亲和素-生物素和化学缀合)。
在一些实施例中,通过重组逆转录病毒递送编码Cas9和/或gRNA的核酸序列。在一些实施例中,逆转录病毒(例如,莫洛尼鼠白血病病毒)包括(例如,允许整合进宿主基因组中的)逆转录酶。在一些实施例中,逆转录病毒是有复制能力的。在其他的实施例中,逆转录病毒是复制缺陷型的(例如,另外多轮的病毒粒子复制和包装所需的基因的一个或多个编码区域被其他基因替换或缺失)。
在一些实施例中,编码Cas9和/或gRNA的核酸序列是通过重组慢病毒进行递送的。在一个实施例中,供体模板核酸通过重组逆转录病毒递送。例如,慢病毒是复制缺陷型的(例如,不包含一种或多种病毒复制所需的基因)。
在一个实施例中,通过重组慢病毒递送编码Cas9和/或gRNA的核酸序列。在一个实施例中,供体模板核酸通过重组慢病毒递送。例如,慢病毒是复制缺陷型的(例如,不包含一种或多种病毒复制所需的基因)。
在一些实施例中,编码Cas9和/或gRNA的核酸序列是通过重组腺病毒进行递送的。在一个实施例中,供体模板核酸通过重组腺病毒递送。在一些实施例中,腺病毒被工程化以在人类中具有减少的免疫性。
在一些实施例中,编码Cas9和/或gRNA的核酸序列是通过重组AAV进行递送的。在一个实施例中,供体模板核酸通过重组AAV递送。在一些实施例中,AAV不将其基因组整合到宿主细胞,例如,本文所述的靶细胞的基因组中。在一些实施例中,AAV可以将其基因组结合到宿主细胞的基因组中。在一些实施例中,AAV是自我互补腺有关病毒(scAAV)(例如,对一起退火以形成双链DNA的两条链进行包装的scAAV)。
在一个实施例中,可用于本文所述方法的AAV衣壳是来自血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV.rh8、AAV.rh10、AAV.rh32/33、AAV.rh43、AAV.rh64R1、或AAV7m8的衣壳序列。
在一个实施例中,编码Cas9和/或gRNA的DNA以再工程化的AAV衣壳递送,其例如,与来自血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV.rh8、AAV.rh10、AAV.rh32/33、AAV.rh43、或AAV.rh64R1的衣壳序列具有50%或更大,例如,60%或更大、70%或更大、80%或更大、90%或更大、或95%或更大的序列同源性。
在一个实施例中,编码Cas9和/或gRNA的DNA通过嵌合AAV衣壳递送。在一个实施例中,供体模板核酸通过嵌合AAV衣壳递送。示例性的嵌合AAV衣壳包括但不限于AAV9i1、AAV2i8、AAV-DJ、AAV2G9、AAV2i8G9、或AAV8G9。
在实施例中,AAV是自我互补腺相关病毒(scAAV)(例如,对一起退火以形成双链DNA的两条链进行包装的scAAV)。
在一些实施例中,编码Cas9和/或gRNA的DNA是通过混合病毒(例如,在此描述的一种或多种病毒的混合物)进行递送的。在一个实施例中,杂合病毒是AAV(例如,任何AAV血清型)与人类博卡病毒、B19病毒、猪AAV、鹅AAV、猫AAV、犬AAV或MVM的杂合体。
使用包装细胞形成能够感染靶细胞的病毒粒子。示例性包装细胞包括293细胞,其可以包装腺病毒,和ψ2或PA317细胞,其可以包装逆转录病毒。在基因治疗中使用的病毒载体通常由将核酸载体包装进病毒粒子的生产者细胞系产生。载体典型地含有包装以及随后整合进宿主或靶细胞(如果适用的话)所需的最低量病毒序列,而其他病毒序列由编码有待表达的蛋白质(例如,Cas9)的表达盒替换。例如,在基因治疗中使用的AAV载体典型地仅具有来自AAV基因组的反向末端重复(ITR)序列,所述序列为包装并在宿主或靶细胞中基因表达所需。如在“三重转染方案”中所述,缺失的病毒功能可以通过包装细胞系和/或含有来自腺病毒的E2A、E4和VA基因的质粒以及编码来自AAV的Rep和Cap基因的质粒来反式地提供。此后,将病毒DNA包装进以下细胞系中,所述细胞系包含编码辅助性质粒的其他AAV基因,即rep和cap,但缺少ITR序列。在某些实施例中,将病毒DNA包装在含有来自腺病毒的E1A和/或E1B基因的生产者细胞系中。所述细胞系还被作为辅助者的腺病毒感染。辅助性病毒(例如,腺病毒或HSV)或辅助性质粒促进AAV载体的复制和从有ITR的辅助质粒表达AAV基因。由于缺少ITR序列,未以显著的量包装所述辅助性质粒。可以通过例如与AAV相比腺病毒更加敏感的热处理减少腺病毒的污染。
在某些实施例中,病毒载体能够进行细胞类型和/或组织类型识别。例如,病毒载体可以用不同/替代的病毒包膜糖蛋白进行假型包装;用细胞类型特异性受体进行工程化(例如,对病毒包膜糖蛋白进行遗传修饰以结合靶向配体(例如,肽配体、单链抗体、或生长因子));和/或进行工程化以具有双重特异性的分子桥,其中一端识别病毒糖蛋白而另一端识别靶细胞表面的部分(例如,配体-受体、单克隆抗体、亲和素-生物素和化学缀合)。
在某些实施例中,病毒载体实现细胞类型特异性表达。例如,可以构建组织特异性启动子以仅在靶细胞中限制转基因(Cas9和gRNA)的表达。载体的特异性也可以由转基因表达的微小RNA依赖性控制所介导。在实施例中,病毒载体具有增加的病毒载体和靶细胞膜的融合效率。例如,可以结合融合蛋白(例如,融合感受态血球凝集素(HA))以增加病毒摄取进入细胞中。在实施例中,病毒载体具有核定位的能力。例如,可以将需要分解核膜(在细胞分裂期间)并且因此将不感染非分裂细胞的病毒改变成结合病毒的基质蛋白中的核定位肽,由此能够实现非增殖细胞的转导。
在一些实施例中,编码Cas9和/或gRNA的DNA是通过非基于载体的方法(例如,使用裸DNA或DNA复合物)进行递送的。例如,DNA可以例如,通过有机改性的二氧化硅或硅酸盐(Ormosil)、电穿孔、瞬时细胞压缩或挤压(参见例如,Lee2012)、基因枪、声致穿孔、磁转染、脂质介导的转染、树枝状聚合物、无机纳米粒子、磷酸钙、或其组合进行递送。
在实施例中,经由电穿孔递送包括将细胞与编码Cas9和/或gRNA的DNA在盒、室或比色皿中混合并且施加一个或多个限定持续时间和幅度的电脉冲。在一个实施例中,使用如下系统进行经由电穿孔的递送,在所述系统中将细胞与编码Cas9和/或gRNA的DNA在连接至装置(例如,泵)的容器中混合,所述装置向盒、室或比色皿中给料混合物,在所述盒、室或比色皿中施加一个或多个限定持续时间和幅度的电脉冲,之后将细胞递送至第二容器。
在一些实施例中,编码Cas9和/或gRNA的DNA是通过载体和非基于载体的方法的组合进行递送的。在一个实施例中,供体模板核酸通过基于载体和非载体的方法的组合来递送。例如,病毒体将脂质体与灭活的病毒(例如,HIV或流感病毒)结合,其可导致比单独的病毒或脂质体方法更有效的基因转移,例如,在呼吸道上皮细胞中。
在某些实施例中,递送载体是非病毒载体,并且在某些这些实施例中,非病毒载体是无机纳米颗粒。示例性无机纳米颗粒包括,例如,磁性纳米颗粒(例如,Fe3MnO2)、或二氧化硅。可以将纳米颗粒的外表面与带正电荷的聚合物(例如,聚乙烯亚胺、聚赖氨酸、聚丝氨酸)缀合,这允许有效载荷的附接(例如,缀合或截留)。在实施例中,非病毒载体是有机纳米颗粒(例如,截留纳米颗粒内的有效载荷)。示例性有机纳米颗粒包括,例如,包含阳离子脂质连同中性辅助脂质的SNALP脂质体,其涂覆有聚乙二醇(PEG)和鱼精蛋白以及涂覆有脂质包衣的核酸复合物。
用于基因转移的示例性脂质示于下表1中。
表1:用于基因转移的脂质
用于基因转移的示例性聚合物示于下表5。
表5:用于基因转移的聚合物
在一个实施例中,载体具有靶向修饰以增加靶细胞摄入纳米粒子和脂质体(例如,细胞特异性抗原、单克隆抗体、单链抗体、适配体、聚合物、糖(例如,N-乙酰半乳糖胺(GalNAc))和细胞穿透肽)。在实施例中,载体使用融合肽和内体去稳定肽/聚合物。在实施例中,载体经历酸触发的构象变化(例如,以加速负荷物的内体逃逸)。在实施例中,使用刺激可切割的聚合物,例如,用于在细胞区室中释放。例如,可以使用在还原性细胞环境中被切割的基于二硫化物的阳离子型聚合物。
在实施例中,递送运载体是生物非病毒递送运载体。在实施例中,运载体是减毒细菌(例如,天然或人工工程化成待侵入性的,但减毒以防止发病原和表达转基因(例如,单核细胞增生李斯特菌、某些沙门氏菌菌株、长双歧杆菌、和修饰的大肠杆菌)、具有营养和组织特异性向性以靶向特定组织的细菌、具有修饰的表面蛋白以改变靶组织特异性的细菌)。在实施例中,运载体是转基因噬菌体(例如,具有大包装能力、较少免疫原性、含有哺乳动物质粒维持序列并且具有结合的靶向配体的工程化噬菌体)。在实施例中,运载体是哺乳动物病毒样颗粒。例如,可以产生修饰的病毒颗粒(例如,通过纯化“空心”颗粒,随后用希望的负荷物离体组装病毒)。运载体也可以被工程化以结合靶向配体从而改变靶组织特异性。在实施例中,运载体是生物脂质体。例如,生物脂质体是衍生自人类细胞的基于磷脂的颗粒(例如,红细胞血影,其是所述红血细胞分解成衍生自受试者的球状结构(例如,可以通过附接不同组织或细胞特异性配体来实现组织靶向)、或分泌外泌体-受试者(即,患者)衍生的内吞起源的膜结合纳米运载体(30nm-100nm)(例如,可以产生自不同细胞类型并且因此可以被细胞吸收,而不需要靶向配体)。
在一个实施例中,递送除了Cas系统的所述组分(例如,Cas9分子组分和/或在此描述的gRNA分子组分)外的一种或多种核酸分子(例如,DNA分子)。在实施例中,该核酸分子是在递送Cas系统一个或多个组分的同时进行递送的。在实施例中,该核酸分子是在递送Cas系统一个或多个组分之前或之后(例如,小于约30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周、或4周)进行递送的。在实施例中,该核酸分子是通过不同于递送Cas系统的一个或多个组分(例如,Cas9分子组分和/或gRNA分子组分)的方式进行递送的。该核酸分子可以通过任何在此描述的递送方法进行递送。例如,该核酸分子可以通过病毒载体(例如,整合缺陷型慢病毒)进行递送,并且Cas9分子组分和/或gRNA分子组分可以通过电穿孔(例如,这样可以降低由核酸(例如,DNA)引起的毒性)进行递送。在实施例中,该核酸分子编码治疗性蛋白质(例如,在此描述的蛋白质)。在实施例中,该核酸分子编码RNA分子(例如,在此描述的RNA分子)。
编码RNA指导的核酸酶的RNA的递送
编码RNA指导的核酸酶(例如,Cas9分子)和/或gRNA分子的RNA可以通过本领域已知的方法或如本文所述递送到细胞中,例如,本文所述的靶向细胞。例如,Cas9编码和/或gRNA编码RNA可以例如,通过显微注射、电穿孔、瞬时细胞压缩或挤压(参见例如,Lee2012)、脂质介导的转染、肽介导的递送或其组合进行递送。编码Cas9的和/或编码gRNA的RNA可以与分子偶联,从而促进靶细胞(例如,本文所述的靶细胞)的摄取。
在一个实施例中,经由电穿孔递送包括将细胞与编码Cas9分子和/或gRNA分子(具有或不具有供体模板核酸分子)在盒、室或比色皿中混合并且施加一个或多个限定持续时间和幅度的电脉冲。在一个实施例中,使用如下系统进行经由电穿孔的递送,在所述系统中将细胞与RNA编码Cas9分子和/或gRNA分子、与或不与供体模板核酸分子在连接至装置(例如,泵)的容器中混合,所述装置向盒、室或比色皿中供给混合物,在所述盒、室或比色皿中施加一个或多个限定持续时间和幅度的电脉冲,之后将细胞递送至第二容器。编码Cas9和/或编码gRNA的RNA可以与分子偶联以促进靶细胞(例如,本文所述的靶细胞)的摄取。
RNA指导的核酸酶的递送
RNA指导的核酸酶,例如,Cas9分子可以通过领域已知的方法或如本文所述的递送到细胞中。例如,Cas9蛋白分子可以例如通过显微注射、电穿孔、瞬时细胞压缩或挤压(参见例如,Lee 2012)、脂质介导的转染、肽介导的递送或其组合进行递送。递送可以与编码gRNA的DNA或与gRNA相伴。Cas9蛋白可以与促进靶细胞(例如本文所述的靶细胞)摄取的分子进行缀合。
在一个实施例中,经由电穿孔递送包括将细胞与Cas9分子和/或gRNA分子,与或不与供体核酸在盒、室或比色皿中混合并且施加一个或多个限定持续时间和幅度的电脉冲。在一个实施例中,使用如下系统进行经由电穿孔的递送,在所述系统中将细胞与Cas9分子和/或gRNA分子、与或不与供体核酸在连接至装置(例如,泵)的容器中混合,所述装置向盒、室或比色皿中供给混合物,在所述盒、室或比色皿中施加一个或多个限定持续时间和幅度的电脉冲,之后将细胞递送至第二容器。编码Cas9和/或编码gRNA的RNA可以与分子偶联以促进靶细胞(例如,本文所述的靶细胞)的摄取。
基因组编辑系统组分的施用途径
全身施用模式包括口服和肠胃外途径。肠胃外途径包括,举例来说,静脉内、骨髓内、动脉内、肌内、皮内、皮下、鼻内以及腹膜内途径。可以修饰或配制全身施用的组分以靶向例如,HSC,造血干细胞/祖细胞或红系祖细胞或前体细胞。
举例来说,局部施用模式包括,骨髓内注射到骨小梁中或股骨内注射到髓隙中,以及输注到门静脉中。在一个实施例中,与当全身施用(例如,静脉内)相比时,显著较少量的组分(与全身途径相比)可以在局部施用(例如,直接进入骨髓)时发挥作用。局部施用模式可以降低或消除潜在毒副作用的发生率,当全身性施用治疗有效量的组分时可能发生毒副作用。
可以以周期性推注(例如静脉内)的形式,或者从内部储库或外部储库(例如从静脉注射袋或可植入泵)持续输注提供施用。组分可以局部施用,例如,通过从持续释放药物递送装置中持续释放。
此外,可以将组分配制成允许在延长时段内释放。释放系统可以包括生物降解材料或通过扩散释放所掺入的组分的材料的基质。所述组分可以在释放系统中均匀或者非均匀分配。各种释放系统可能是有用的,可根据特定应用所需的释放速率选择合适的系统。不可降解和可降解的释放系统均可以被使用。适合的释放系统包括聚合物和聚合物基质、非聚合物基质、或无机和有机赋形剂和稀释剂(如,但不局限于,碳酸钙和糖(例如,海藻糖))。释放系统可以是天然的或合成的。然而,合成的释放系统是优选的,因为它们通常更可靠、更具可重现性并且产生更多定义的释放曲线。可以选择释放系统材料以使得具有不同分子量的组分是通过扩散或通过材料的降解而释放的。
代表性合成的、可生物降解的聚合物包括,例如:聚酰胺(例如,聚(氨基酸)和聚(肽));聚酯(如聚(乳酸)、聚(乙醇酸)、聚(乳酸-共-乙醇酸)、以及聚(己内酯));聚(酸酐);聚原酸酯;聚碳酸酯;及其化学衍生物(化学基团的取代、添加,例如,烷基、亚烷基、羟化、氧化、以及其他由本领域的技术人员常规做出的修饰)、共聚物及其混合物。代表性合成的,不可降解聚合物包括,例如:聚醚(例如,聚(氧化乙烯)、聚(乙二醇)、以及聚(四氢呋喃));乙烯基聚合物-聚丙烯酸酯和聚甲基丙烯酸酯(如甲基、乙基、其他烷基、甲基丙烯酸羟基乙酯、丙烯酸和甲基丙烯酸、以及其他例如聚(乙烯醇)、聚(乙烯基吡咯烷酮)、以及聚(乙酸乙烯酯);聚(氨酯);纤维素及其衍生物(如烷基、羟烷基、醚、酯、硝化纤维素、以及不同的醋酸纤维素);聚硅氧烷;及其任何化学衍生物(化学基团的取代、添加,例如,烷基、亚烷基、羟化、氧化、以及其他由本领域的技术人员常规做出的修饰)、共聚物及其混合物。
也可使用聚丙交酯乙交酯共聚物微球。典型地,微球是由乳酸和乙醇酸的聚合物构成的,其被结构化形成空心球体。球体的直径可以是大约15-30微米并且可以加载在此描述的组分。
基因组编辑系统组分的双模或差别递送
Cas系统组分的分别递送,例如,Cas9分子组分和gRNA分子组分,并且更具体地,通过不同模式递送这些组分,可以通过,例如,改进组织特异性和安全性来增强性能。
在某些实施例中,Cas9分子和gRNA分子是通过不同模式(或有时在此称为差别模式)进行递送的。如在此使用的,不同或差别模式是指递送的模式,所述递送模式赋予受试组分分子,例如,Cas9分子、gRNA分子、模板核酸或有效负载不同的药效动力学或药物代谢动力学特性。例如,递送的模式可以导致不同的组织分布,不同的半衰期、或不同的时间分布(例如,在选定的区室、组织、或器官中)。
一些递送的模式(例如,通过例如通过自主复制或插入进细胞核酸中而持续存在于细胞、或细胞子代中的核酸载体的递送)导致组分更为持续的表达和存在。实例包括病毒,例如,AAV或慢病毒递送。
通过举例,这些组分,例如,Cas9分子和gRNA分子,可以在所递送组分在体内、或在特定区域室、组织、或器官中的所得半衰期或持续性方面不同的模式进行递送。在实施例中,gRNA分子可以通过此类模式进行递送。Cas9分子组分可以通过这样一种模式进行递送,所述模式导致更少持久性或更少暴露于身体或特定区域室或组织或器官。
更一般地说,在实施例中,第一递送模式被用于递送第一组分并且第二递送模式被用于递送第二组分。第一递送模式赋予第一药效动力学或药物代谢动力学特性。第一药效动力学特性可以是,例如,组分或编码该组分的核酸在体内、区室、组织、或器官中的分布、持久性、或暴露。第二递送模式赋予第二药效动力学或药物代谢动力学特性。第二药效动力学特性可以是,例如,组分或编码该组分的核酸在体内、区室、组织、或器官中的分布、持久性、或暴露。
在某些实施例中,第一药效动力学或药物代谢动力学特性(例如,分布、持久性或暴露)比第二药效动力学或药物代谢动力学特性更为有限。
在某些实施例中,选择第一递送模式以优化(例如,最小化)药效动力学或药物代谢动力学特性(例如,分布、持久性或暴露)。
在某些实施例中,选择第二递送模式以优化(例如,最大化)药效动力学或药物代谢动力学特性(例如,分布、持久性或暴露)。
在某些实施例中,第一递送模式包括使用较为持久的元件(例如,核酸(例如,质粒或病毒载体(例如,AAV或慢病毒)))。由于此类载体是较为持久的,从它们中转录的产物将是较为持久的。
在某些实施例中,第二递送模式包括较为短暂的元件(例如,RNA或蛋白)。
在某些实施例中,第一组分包含gRNA,并且所述递送模式是较为持久的(例如,gRNA转录自质粒或病毒载体(例如,AAV或慢病毒))。这些基因的转录将具有很小的生理学意义,因为基因并不编码蛋白产物,并且这些gRNA不能够单独起作用。第二组分(Cas9分子)是以瞬时方式进行递送的(例如,作为mRNA或作为蛋白),从而确保完全Cas9分子/gRNA分子复合物仅在短时段内存在和有活性。
此外,这些组分可以不同的分子形式或用不同的互为补充以增强安全性和组织特异性的递送载体进行递送。
差别递送模式的使用可以增强性能、安全性和/或功效,例如,可以减少最终脱靶修饰的可能性。通过较不持久的模式递送免疫原性组分(例如,Cas9分子)可以降低免疫原性,因为来自细菌衍生的Cas酶的肽通过MHC分子被展示在细胞表面上。两部分式递送系统可以改善这些缺点。
差别递送模式可以用于将组分递送至不同,但是重叠的靶区域。在靶区域的重叠之外形成活性复合物被最小化。因此,在实施例中,第一组分(例如,gRNA分子)通过第一递送模式进行递送,其导致第一空间(例如,组织)分布。第二组分(例如,Cas9分子)通过第二递送模式进行递送,其导致第二空间(例如,组织)分布。在一个实施例中,第一模式包括选自脂质体、纳米颗粒(例如,聚合物纳米颗粒)、以及核酸(例如,病毒载体)的第一元件。第二模式包括选自下组的第二元件。在实施例中,第一递送模式包括第一靶向元件(例如,细胞特异性受体或抗体),并且第二递送模式不包括该元件。在某些实施例中,第二递送模式包括第二靶向元件(例如,第二细胞特异性受体或第二抗体)。
当Cas9分子在病毒递送载体、脂质体、或聚合物纳米颗粒中进行递送时,存在递送至多个组织并且在多个组织具有治疗活性的可能性,这是当可能希望仅靶向单个组织时。两部分式递送系统可以解决这一挑战并且增强组织特异性。如果gRNA分子和Cas9分子被包装在具有不同但重叠的组织嗜性的分离的递送运载体中,完全功能性复合物仅在被两种载体靶向的组织中形成。
Cas系统组分的离体递送
在某些实施例中,将表3中描述的Cas系统组分引入细胞中,然后将其引入受试者中。引入组分的方法可以包括例如表4中所述的任何递送方法。
修饰的核苷、核苷酸和核酸
修饰的核苷和修饰的核苷酸可以存在于核酸中,例如特别是gRNA,但是还有其他形式的RNA,例如mRNA、RNAi或siRNA。如本文所描述的,“核苷”被定义为包含五碳糖分子(戊糖或核糖)或其衍生物以及有机碱(嘌呤或嘧啶)或其衍生物的化合物。如本文所描述的,“核苷酸”被定义为进一步包含磷酸基团的核苷。
修饰的核苷和核苷酸可以包括以下项中的一项或多项:
(i)磷酸二酯骨架键联中的一个或两个非连接磷酸氧和/或一个或多个连接磷酸氧的改变,例如置换;
(ii)核糖的组分(例如,核糖上的2’羟基)的改变,例如置换;
(iii)“脱磷酸”接头对磷酸部分的完全置换;
(iv)天然存在的核碱基的修饰或置换;
(v)核糖-磷酸骨架的置换或修饰;
(vi)寡核苷酸的3’端或5’端的修饰,例如,末端磷酸基团的去除、修饰或置换或部分的结合;以及
(vii)糖的修饰。
以上列出的修饰可以组合,以提供可以具有两个、三个、四个或更多个修饰的修饰的核苷和核苷酸。例如,修饰的核苷或核苷酸可以具有修饰的糖和修饰的核碱基。在一个实施例中,修饰gRNA的每个碱基,例如,所有碱基都具有修饰的磷酸酯基团,例如,所有修饰的磷酸酯基团都是硫代磷酸酯基团。在一个实施例中,单分子(或嵌合)或模块化gRNA分子的所有或基本上所有磷酸酯基团被硫代磷酸酯基团替换。
在一个实施例中,可以将修饰的核苷酸(例如,具有如本文描述的修饰的核苷酸)掺入核酸中,例如“修饰的核酸”。在一个实施例中,修饰的核酸包含一个、两个、三个或更多个修饰的核苷酸。在一个实施例中,修饰的核酸中的至少5%(例如,至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%)的位置是修饰的核苷酸。
未修饰的核酸可以易于被例如细胞核酸酶降解。例如,核酸酶可以水解核酸磷酸二酯键。因此,在一个方面中,本文描述的修饰的核酸可以含有一个或多个修饰的核苷或核苷酸,例如,以引入对核酸酶的稳定性。
在一个实施例中,本文描述的修饰的核苷、修饰的核苷酸和修饰的核酸当被在体内和离体地引入细胞群体中时都可以展现出减少的先天性免疫应答。术语“先天性免疫应答”包括对外源核酸的细胞应答,外源核酸包括通常是病毒或细菌来源的单链核酸,所述细胞应答涉及细胞因子(特别是干扰素)表达与释放以及细胞死亡的诱导。在一个实施例中,本文描述的修饰的核苷、修饰的核苷酸和修饰的核酸可以破坏大沟相互作用配偶体与核酸的结合。在一个实施例中,本文描述的修饰的核苷、修饰的核苷酸和修饰的核酸当被在体内和离体地引入细胞群体中时都可以展现出减少的先天性免疫应答,并且还破坏大沟相互作用配偶体与核酸的结合。
化学基团的定义
如本文所用的,“烷基”意在指直链的或支链的饱和烃基。示例性烷基基团包括甲基(Me)、乙基(Et)、丙基(例如,正丙基和异丙基)、丁基(例如,正丁基、异丁基、叔丁基)、戊基(例如,正戊基、异戊基、新戊基)等。烷基基团可以包含从1至约20、从2至约20、从1至约12、从1至约8、从1至约6、从1至约4或从1至约3个碳原子。
如在此所使用的,“芳基”是指单环或多环(例如,具有2、3或4个稠环)的芳香烃,例如像苯基、萘基、蒽基、菲基、茚满基、茚基等。在一个实施例中,芳基基团具有从6至约20个碳原子。
如本文所用的,“烯基”是指包含至少一个双键的脂肪族基团。
如本文所用的,“炔基”是指含有2-12个碳原子并且特征在于具有一个或多个三键的直链的或支链的烃链。炔基基团的实例包括但不限于乙炔基、炔丙基和3-己炔基。
如本文所用的,“芳基烷基”或“芳烷基”是指烷基氢原子被芳基基团替换的烷基部分。芳烷基包括一个以上氢原子已经被芳基基团置换的基团。“芳基烷基”或“芳烷基”的实例包括苄基、2-苯基乙基、3-苯基丙基、9-芴基、二苯甲基以及三苯甲基基团。
如本文所用的,“环烷基”是指具有3至12个碳的环状的、二环的、三环的或多环的非芳香烃基团。环烷基部分的实例包括但不限于环丙基、环戊基和环己基。
如本文所用的,“杂环基”是指杂环系统的单价基。代表性杂环基包括但不限于四氢呋喃基、四氢噻吩基、吡咯烷基、吡咯烷酮基、哌啶基、吡咯啉基、哌嗪基、二噁烷基、二氧戊环基、二氮杂卓基、氧氮杂卓基、硫氮杂卓基以及吗啉基。
如本文所用的,“杂芳基”是指杂芳香环系统的单价基。杂芳基部分的实例包括但不限于咪唑基、噁唑基、噻唑基、三唑基、吡咯基、呋喃基、吲哚基、苯硫基、吡唑基、吡啶基、吡嗪基、哒嗪基、嘧啶基、吲嗪基、嘌呤基、萘啶基、喹啉基以及蝶啶基。
磷酸骨架修饰
磷酸酯基团
在一个实施例中,可以通过用不同取代基置换一个或多个氧来修饰经修饰的核苷酸的磷酸酯基团。此外,修饰的核苷酸(例如,存在于修饰的核酸中的修饰的核苷酸)可以包括如本文描述的修饰的磷酸酯对未修饰的磷酸酯部分的完全置换。在一个实施例中,磷酸骨架的修饰可以包括产生不带电接头或具有不对称电荷分布的带电接头的改变。
修饰的磷酸酯基团的实例包括硫代磷酸酯、硒代磷酸酯(phosphoroselenate)、硼磷酸酯(borano phosphate)、硼磷酸酯(borano phosphate ester)、氢膦酸酯、磷酰胺酯(phosphoroamidate)、烷基或芳基膦酸酯和磷酸三酯。在一个实施例中,磷酸骨架部分中的非桥连磷酸氧原子之一可以被以下基团中的任一项替换:硫(S)、硒(Se)、BR3(其中R可以是例如氢、烷基或芳基)、C(例如,烷基基团、芳基基团等)、H、NR2(其中R可以是例如氢、烷基或芳基)或OR(其中R可以是例如烷基或芳基)。未修饰的磷酸酯基团中的磷原子是非手性的。然而,以上原子或原子的基团之一对非桥连磷酸氧之一的置换可以使得磷原子是手性的;也就是说以这种方式修饰的磷酸酯基团中的磷原子是立构中心。立构磷原子可以具有“R”构型(本文是Rp)或“S”构型(本文是Sp)。
二硫代磷酸酯具有两个被硫置换的非桥连氧。二硫代磷酸酯中的磷中心是非手性的,这阻止寡核糖核苷酸非对映异构体的形成。在一个实施例中,对一个或两个非桥连氧的修饰还可以包括用以下基团替换非桥连氧,所述基团独立地选自S、Se、B、C、H、N以及OR(R可以是,例如,烷基或芳基)。
还可以通过用氮(桥连的磷酰胺酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)置换桥连氧(即,将磷酸连接至核苷的氧)来修饰磷酸酯接头。置换可以发生在连接氧或发生在两个连接氧处。
磷酸酯基团的置换
磷酸酯基团可以被不含磷连接物置换。在一个实施例中,带电磷酸酯基团可以被中性部分替换。
可以替换磷酸酯基团的部分的实例可以包括但不限于例如甲基膦酸酯、羟氨基、硅氧烷、碳酸酯、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸酯、磺酰胺、硫代甲缩醛(thioformacetal)、甲缩醛(formacetal)、肟、亚甲亚氨基、亚甲甲基亚氨基、亚甲肼基、亚甲二甲基肼基以及亚甲氧基甲基亚氨基。
核糖磷酸骨架的置换
还可以构建可以模拟核酸的支架,其中磷酸酯接头和核糖被核酸酶抗性核苷或核苷酸替代物置换。在一个实施例中,可以通过替代骨架拴住核碱基。实例可以包括但不限于吗啉代、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。
糖修饰
修饰的核苷和修饰的核苷酸可以包括对糖基的一种或多种修饰。例如,2’羟基基团(OH)可以被多种不同的“氧基”或“脱氧”取代基修饰或替换。在一个实施例中,对2’羟基基团的修饰可以增强核酸的稳定性,因为羟基不再可以被去质子化以形成2’-醇盐离子。2’-醇盐可以通过接头磷原子上的分子内亲核攻击而催化降解。
“氧基”-2'羟基基团修饰的实例可以包括烷氧基或芳氧基(OR,其中“R”可以是,例如,烷基、环烷基、芳基、芳烷基、杂芳基或糖);聚乙二醇(PEG),O(CH2CH2O)nCH2CH2OR,其中R可以是例如H或任选取代的烷基,并且n可以是从0至20的整数(例如,从0至4、从0至8、从0至10、从0至16、从1至4、从1至8、从1至10、从1至16、从1至20、从2至4、从2至8、从2至10、从2至16、从2至20、从4至8、从4至10、从4至16以及从4至20)。在一个实施例中,“氧基”-2’羟基基团修饰可以包括“锁”核酸(LNA),其中2’羟基可以,例如,通过C1-6亚烷基或C1-6杂亚烷基桥连接至同一核糖的4’碳,其中示例性桥可以包括亚甲基、亚丙基、醚或氨基桥;O-氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基或二杂芳氨基、乙二胺或聚氨基)和氨基烷氧基O(CH2)n-氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基或二杂芳氨基、乙二胺或聚氨基)。在一个实施例中,“氧基”-2'羟基基团修饰可以包括甲氧基乙基基团(MOE)(OCH2CH2OCH3,例如,PEG衍生物)。
“脱氧”修饰可以包括氢(即脱氧核糖,例如在部分ds RNA的突出端部分);卤素(例如,溴、氯、氟或碘);氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基、二杂芳氨基或氨基酸);NH(CH2CH2NH)nCH2CH2-氨基(其中氨基可以是,例如,如本文描述的),-NHC(O)R(其中R可以是,例如,烷基、环烷基、芳基、芳烷基、杂芳基或糖),氰基;巯基;烷基-硫代-烷基;硫代烷氧基;以及烷基、环烷基、芳基、烯基和炔基,其可以任选地被例如,如本文描述的氨基取代。
糖基还可以包含一个或多个具有与核糖中的对应碳相反的立体化学构型的碳。因此,修饰的核酸可以包括含有例如阿拉伯糖作为糖的核苷酸。核苷酸“单体”可以在糖的1’位置处具有α键联,例如α-核苷。修饰的核酸还可以包括“无碱基”糖,其在C-1’处缺乏核碱基。这些无碱基糖还可以在一个或多个构成性糖原子处被进一步修饰。修饰的核酸还可以包括一种或多种处于L型的糖,例如L-核苷。
通常,RNA包括糖基核糖,它是具有氧的5元环。示例性修饰的核苷和修饰的核苷酸可以包括但不限于核糖中氧的置换(例如,用硫(S)、硒(Se)或亚烷基,例如像亚甲基或亚乙基);双键的添加(例如,以用环戊烯基或环己烯基置换核糖);核糖的缩环(例如,以形成环丁烷或氧杂环丁烷的4元环);核糖的扩环(例如,以形成具有另外的碳或杂原子的6元或7元环,例如像脱水己糖醇、阿卓糖醇、甘露醇、环己烷基、环己烯基以及吗啉代,其也具有氨基磷酸酯骨架)。在一个实施例中,修饰的核苷酸可以包括多环形式(例如,三环;和“解锁”形式,如二醇核酸(GNA)(例如,R-GNA或S-GNA,其中核糖被附接至磷酸二酯键的二醇单元替换),或苏糖核酸(TNA,其中核糖被α-L-苏呋喃糖基-(3'→2')替换)。
核碱基上的修饰
能够被掺入修饰的核酸中的本文描述的修饰的核苷和修饰的核苷酸可以包括修饰的核碱基。核碱基的实例包括但不限于腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)以及尿嘧啶(U)。这些核碱基可以被修饰或全部替换,以提供可以被掺入修饰的核酸中的修饰的核苷和修饰的核苷酸。核苷酸的核碱基可以独立地选自嘌呤、嘧啶、嘌呤或嘧啶类似物。在一个实施例中,核碱基可以包括,例如,天然存在的碱基及其合成的衍生物。
尿嘧啶
在一个实施例中,修饰的核碱基是修饰的尿嘧啶。具有修饰的尿嘧啶的示例性核碱基和核苷包括但不限于假尿苷(ψ)、吡啶-4-酮核糖核苷、5-氮杂-尿苷、6-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代-尿苷(s2U)、4-硫代-尿苷(s4U)、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基-尿苷(ho5U)、5-氨基烯丙基-尿苷、5-卤代-尿苷(例如,5-碘代-尿苷或5-溴代-尿苷)、3-甲基-尿苷(m3U)、5-甲氧基-尿苷(mo5U)、尿苷5-氧基乙酸(cmo5U)、尿苷5-氧基乙酸甲酯(mcmo5U)、5-羧甲基-尿苷(cm5U)、1-羧甲基-假尿苷、5-羧基羟甲基-尿苷(chm5U)、5-羧基羟甲基-尿苷甲酯(mchm5U)、5-甲氧羰基甲基-尿苷(mcm5U)、5-甲氧羰基甲基-2-硫代-尿苷(mcm5s2U)、5-氨甲基-2-硫代-尿苷(nm5s2U)、5-甲基氨甲基-尿苷(mnm5U)、5-甲基氨甲基-2-硫代-尿苷(mnm5s2U)、5-甲基氨甲基-2-硒代-尿苷(mnm5se2U)、5-氨甲酰基甲基-尿苷(ncm5U)、5-羧甲基氨基甲基-尿苷(cmnm5U)、5-羧甲基氨基甲基-2-硫代-尿苷(cmnm 5s2U)、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷(τcm5U)、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷(τm5s2U)、1-牛磺酸甲基-4-硫代-假尿苷、5-甲基-尿苷(m5U,即具有核碱基脱氧胸腺嘧啶)、1-甲基-假尿苷(m1ψ)、5-甲基-2-硫代-尿苷(m5s2U)、1-甲基-4-硫代-假尿苷(m1s4ψ)、4-硫代-1-甲基-假尿苷、3-甲基-假尿苷(m3ψ)、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮杂-假尿苷、2-硫代-1-甲基-1-去氮杂-假尿苷、二氢尿苷(D)、二氢假尿苷、5,6-二氢尿苷、5-甲基-二氢尿苷(m5D)、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫代-假尿苷、N1-甲基-假尿苷、3-(3-氨基-3-羧丙基)尿苷(acp3U)、1-甲基-3-(3-氨基-3-羧丙基)假尿苷(acp3ψ)、5-(异戊烯基氨甲基)尿苷(inm5U)、5-(异戊烯基氨甲基)-2-硫代-尿苷(inm5s2U)、α-硫代-尿苷、2'-O-甲基-尿苷(Um)、5,2'-O-二甲基-尿苷(m5Um)、2'-O-甲基-假尿苷(ψm)、2-硫代-2'-O-甲基-尿苷(s2Um)、5-甲氧基羰甲基-2'-O-甲基-尿苷(mcm 5Um)、5-氨甲酰基甲基-2'-O-甲基-尿苷(ncm 5Um)、5-羧甲基氨甲基-2'-O-甲基-尿苷(cmnm 5Um)、3,2'-O-二甲基-尿苷(m3Um)、5-(异戊烯基氨甲基)-2'-O-甲基-尿苷(inm 5Um)、1-硫代-尿苷、脱氧胸苷、2'-F-阿糖(ara)-尿苷、2'-F-尿苷、2'-OH-阿糖-尿苷、5-(2-甲氧甲酰基乙烯基)尿苷、5-[3-(1-E-丙烯基氨基)尿苷、吡唑并[3,4-d]嘧啶、黄嘌呤以及次黄嘌呤。
胞嘧啶
在一个实施例中,修饰的核碱基是修饰的胞嘧啶。具有修饰的胞嘧啶的示例性核碱基和核苷包括但不限于5-氮杂-胞苷、6-氮杂-胞苷、假异胞苷、3-甲基-胞苷(m3C)、N4-乙酰基-胞苷(act)、5-甲酰基-胞苷(f5C)、N4-甲基-胞苷(m4C)、5-甲基-胞苷(m5C)、5-卤代-胞苷(例如,5-碘代-胞苷)、5-羟甲基-胞苷(hm5C)、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷(s2C)、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮杂-假异胞苷、1-甲基-1-去氮杂-假异胞苷、泽布拉林(zebularine)、5-氮杂-泽布拉林、5-甲基-泽布拉林、5-氮杂-2-硫代-泽布拉林、2-硫代-泽布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷、4-甲氧基-1-甲基-假异胞苷、赖西丁(k2C)、α-硫代-胞苷、2'-O-甲基-胞苷(Cm)、5,2'-O-二甲基-胞苷(m5Cm)、N4-乙酰基-2'-O-甲基-胞苷(ac4Cm)、N4,2'-O-二甲基-胞苷(m4Cm)、5-甲酰基-2'-O-甲基-胞苷(f5Cm)、N4,N4,2'-O-三甲基-胞苷(m4 2Cm)、1-硫代-胞苷、2'-F-阿糖-胞苷、2'-F-胞苷以及2'-OH-阿糖-胞苷。
腺嘌呤
在一个实施例中,修饰的核碱基是修饰的腺嘌呤。具有修饰的腺嘌呤的示例性核碱基和核苷包括但不限于2-氨基-嘌呤、2,6-二氨基嘌呤、2-氨基-6-卤代-嘌呤(例如,2-氨基-6-氯代-嘌呤)、6-卤代-嘌呤(例如,6-氯代-嘌呤)、2-氨基-6-甲基-嘌呤、8-叠氮基-腺苷、7-去氮杂-腺苷、7-去氮杂-8-氮杂-腺苷、7-去氮杂-2-氨基-嘌呤、7-去氮杂-8-氮杂-2-氨基-嘌呤、7-去氮杂-2,6-二氨基嘌呤、7-去氮杂-8-氮杂-2,6-二氨基嘌呤、1-甲基-腺苷(m1A)、2-甲基-腺苷(m2A)、N6-甲基-腺苷(m6A)、2-甲硫基-N6-甲基-腺苷(ms2m6A)、N6-异戊烯基-腺苷(i6A)、2-甲硫基-N6-异戊烯基-腺苷(ms2i6A)、N6-(顺羟基异戊烯基)腺苷(io6A)、2-甲硫基-N6-(顺羟基异戊烯基)腺苷(ms2io6A)、N6-缩水甘油基氨甲酰基-腺苷(g6A)、N6-苏氨酰基氨甲酰基-腺苷(t6A)、N6-甲基-N6-苏氨酰基氨甲酰基-腺苷(m6t6A)、2-甲硫基-N6-苏氨酰基氨甲酰基-腺苷(ms2g6A)、N6,N6-二甲基-腺苷(m6 2A)、N6-羟基正缬氨酰基氨甲酰基-腺苷(hn6A)、2-甲硫基-N6-羟基正缬氨酰基氨甲酰基-腺苷(ms2hn6A)、N6-乙酰基-腺苷(ac6A)、7-甲基-腺苷、2-甲硫基-腺苷、2-甲氧基-腺苷、α-硫代-腺苷、2'-O-甲基-腺苷(Am)、N6,2'-O-二甲基-腺苷(m6Am)、N6-甲基-2'-脱氧腺苷、N6,N6,2'-O-三甲基-腺苷(m6 2Am)、1,2'-O-二甲基-腺苷(m1Am)、2'-O-核糖基腺苷(磷酸盐)(Ar(p))、2-氨基-N6-甲基-嘌呤、1-硫代-腺苷、8-叠氮基-腺苷、2'-F-阿糖-腺苷、2'-F-腺苷、2'-Oh-阿糖-腺苷以及N6-(19-氨基-五氧杂十九烷基)-腺苷。
鸟嘌呤
在一个实施例中,修饰的核碱基是修饰的鸟嘌呤。具有修饰的鸟嘌呤的示例性核碱基和核苷包括但不限于肌苷(I)、1-甲基-肌苷(m1I)、怀俄苷(imG)、甲基怀俄苷(mimG)、4-去甲基-怀俄苷(imG-14)、异怀俄苷(imG2)、怀丁苷(yW)、过氧怀丁苷(o2yW)、羟基怀丁苷(OHyW)、修饰不足的羟基怀丁苷(OHyW*)、7-去氮杂-鸟苷、辫苷(Q)、环氧辫苷(oQ)、半乳糖基-辫苷(galQ)、甘露糖基-辫苷(manQ)、7-氰基-7-去氮杂-鸟苷(preQ0)、7-氨基甲基-7-去氮杂-鸟苷(preQ1)、古嘌苷(G+)、7-去氮杂-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮杂-鸟苷、6-硫代-7-去氮杂-8-氮杂-鸟苷、7-甲基-鸟苷(m7G)、6-硫代-7-甲基-鸟苷、7-甲基-肌苷、6-甲氧基-鸟苷、1-甲基-鸟苷(m'G)、N2-甲基-鸟苷(m2G)、N2,N2-二甲基-鸟苷(m2 2G)、N2,7-二甲基-鸟苷(m2,7G)、N2,N2,7-二甲基-鸟苷(m2,2,7G)、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、N2,N2-二甲基-6-硫代-鸟苷、α-硫代-鸟苷、2'-O-甲基-鸟苷(Gm)、N2-甲基-2'-O-甲基-鸟苷(m2Gm)、N2,N2-二甲基-2'-O-甲基-鸟苷(m2 2Gm)、1-甲基-2'-O-甲基-鸟苷(m'Gm)、N2,7-二甲基-2'-O-甲基-鸟苷(m2,7Gm)、2'-O-甲基-肌苷(Im)、1,2'-O-二甲基-肌苷(m'Im)、O6-苯基-2’-脱氧肌苷、2'-O-核糖基鸟苷(磷酸盐)(Gr(p))、1-硫代-鸟苷、O6-甲基-鸟苷、O6-甲基-2’-脱氧鸟苷、2'-F-阿糖-鸟苷以及2'-F-鸟苷。
示例性修饰的gRNA
在一些实施例中,修饰的核酸可以是修饰的gRNA。应理解,本文所述的任何gRNA可根据本节进行修饰,包括包含来自SEQ ID NO:251-SEQ ID NO:901的靶向结构域的任何gRNA。
如以上所讨论的,瞬时表达的或递送的核酸可以易于被例如,细胞核酸酶降解。因此,在一个方面中,在此所描述的修饰的gRNA可以含有一个或多个修饰的核苷或核苷酸,其引入对核酸酶的稳定性。虽然不希望受理论束缚,但还据信当引入细胞群,特别是本发明的细胞时,本文所述的某些修饰的gRNA可展现出减少的先天性免疫应答。如上所述的,术语“先天性免疫应答”包括对外源核酸的细胞应答,外源核酸包括通常是病毒或细菌来源的单链核酸,所述细胞应答涉及细胞因子(特别是干扰素)表达与释放以及细胞死亡的诱导。
虽然本部分中讨论的一些示例性修饰可以包括在gRNA序列内的任何位置,但是在一些实施例中,gRNA在其5'端或其附近包含修饰(例如,在其5'端的1-10、1-5或1-2个核苷酸内)。在一些实施例中,gRNA在其3’端处或附近(例如,在其3’端的1-10、1-5或1-2个核苷酸内)包含修饰。在一些实施例中,gRNA既在其5’端处或附近包含修饰又在其3’端处或附近包含修饰。
在一个实施例中,gRNA的5'端通过包含真核mRNA帽结构或帽类似物(例如,G(5')ppp(5')G帽类似物、m7G(5')ppp(5')G帽类似物、或3'-O-Me-m7G(5’)ppp(5')G抗反向帽类似物(ARCA))进行修饰。所述帽或帽类似物可以在gRNA的化学合成或体外转录期间被包括。
在实施例中,体外转录的gRNA通过用磷酸酶(例如,牛小肠碱性磷酸酶)处理进行修饰,以去除5’三磷酸酯基团。
在一个实施例中,gRNA的3’端通过添加一个或多个(例如,25-200个)腺嘌呤(A)残基进行修饰。聚A束可以被包含在编码gRNA的核酸(例如,质粒、PCR产物、病毒基因组)中,或者可以在化学合成期间、或在使用聚腺苷聚合酶(例如,大肠杆菌聚(A)聚合酶)体外转录后被添加到gRNA上。
在实施例中,体外转录的gRNA既含有5’帽结构或帽类似物又含有3’聚A束。在实施例中,体外转录的gRNA通过用磷酸酶(例如,牛小肠碱性磷酸酶)处理进行修饰以去除5’三磷酸酯基团,并且包含3’聚A束。
在一些实施例中,gRNA可以在3’末端U核糖处被修饰。例如,U核糖的两个末端羟基基团可以被氧化为醛基基团和核糖环的伴随开口,以提供如下所示的修饰的核苷:
其中“U”可以是未修饰的或修饰的尿苷。
在另一个实施例中,可以用如下所示的2’3’环状磷酸酯修饰3’末端U:
其中“U”可以是未修饰的或修饰的尿苷。
在一些实施例中,gRNA分子可以含有3'核苷酸,其可以例如,通过掺入本文描述的一个或多个修饰的核苷酸而相对于降解进行稳定化。在这个实施例中,例如,尿苷可以被修饰的尿苷(例如,5-(2-氨基)丙基尿苷和5-溴代尿苷)或被本文描述的任何修饰的尿苷置换;腺苷和鸟苷可以被修饰的腺苷和鸟苷(例如,在8-位具有修饰,例如8-溴代鸟苷)或被本文描述的任何修饰的腺苷和鸟苷置换。
在一些实施例中,可以向gRNA中掺入糖-修饰的核糖核苷酸,例如,其中2'OH-基团被选自以下项的基团替换:H、-OR、-R(其中R可以是,例如,烷基、环烷基、芳基、芳烷基、杂芳基或糖)、卤素、-SH、-SR(其中R可以是,例如,烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氨基(其中氨基可以是,例如,NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基、二杂芳氨基或氨基酸);或氰基(-CN)。在一些实施例中,可以例如,用硫代磷酸酯基团如本文描述的修饰磷酸骨架。在一些实施例中,gRNA的一个或多个核苷酸可以各自独立地是修饰的或未修饰的核苷酸,包括但不限于2’-糖修饰的如2’-O-甲基、2’-O-甲氧基乙基,或2’-氟修饰的,包括例如,2’-F或2’-O-甲基腺苷(A)、2’-F或2’-O-甲基胞苷(C)、2’-F或2’-O-甲基尿苷(U)、2’-F或2’-O-甲基胸苷(T)、2’-F或2’-O-甲基鸟苷(G)、2’-O-甲氧基乙基-5-甲基尿苷(Teo)、2’-O-甲氧基乙基腺苷(Aeo)、2’-O-甲氧基乙基-5-甲基胞苷(m5Ceo)、及其任何组合。
在一些实施例中,gRNA可以包括“锁”核酸(LNA),其中2’OH-基团可以例如通过C1-6亚烷基或C1-6杂亚烷基桥连接至同一核糖的4’碳,其中示例性桥可以包括亚甲基、亚丙基、醚或氨基桥;O-氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基或二杂芳氨基、乙二胺或聚氨基)和氨基烷氧基或O(CH2)n-氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基或二杂芳氨基、乙二胺或聚氨基)。
在一些实施例中,gRNA可以包括修饰的核苷酸,其是多环的(例如,三环;和“解锁”形式,如二醇核酸(GNA)(例如,R-GNA或S-GNA,其中核糖被附接至磷酸二酯键的二醇单元替换),或苏糖核酸(TNA,其中核糖被α-L-苏呋喃糖基-(3'→2')替换)。
通常,gRNA分子包括糖基核糖,它是具有氧的5元环。示例性修饰的gRNA可以包括但不限于核糖中氧的置换(例如,用硫(S)、硒(Se)或亚烷基,例如像亚甲基或亚乙基);双键的添加(例如,以用环戊烯基或环己烯基置换核糖);核糖的缩环(例如,以形成环丁烷或氧杂环丁烷的4元环);核糖的扩环(例如,以形成具有另外的碳或杂原子的6元环或7元环,例如像脱水己糖醇、阿卓糖醇、甘露醇、环己烷基、环己烯基以及吗啉代,其也具有氨基磷酸酯骨架)。尽管大多数的糖类似物改变被定位至2’位,其他位点也适于修饰,包括4’位。在一个实施例中,gRNA包含4'-S、4'-Se或4'-C-氨基甲基-2'-O-Me修饰。
在一些实施例中,可以将去氮杂核苷酸(例如,7-去氮杂-腺苷)掺入gRNA中。在一些实施例中,可以将O-和N-烷基化的核苷酸(例如,N6-甲基腺苷)掺入gRNA中。在一些实施例中,gRNA分子中的一个或多个或所有核苷酸是脱氧核苷酸。
miRNA结合位点
微小RNA(或miRNA)是天然存在的19-25个核苷酸长的细胞非编码RNA。它们结合至例如在mRNA的3’UTR中具有适当miRNA结合位点的核酸分子,并且下调基因表达。虽然不希望受理论束缚,但认为该下调是通过降低核酸分子稳定性或通过抑制翻译而发生。本文所披露的RNA种类(例如,编码Cas9的mRNA)可以例如在其3’UTR中包含miRNA结合位点。miRNA结合位点可以被选择为促进所选细胞类型中的表达下调。
实例
以下实例仅仅是说明性的,并不旨在以任何方式限制本发明的范围或内容。
实例1:用于将13bp del c.-114至-102插入HBG1和HBG2调控区域的化脓链球菌 gRNA的筛选
如本文所阐述的设计的化脓链球菌gRNA靶向跨越并包括HBG1的c.-114至-102处的13个核苷酸的26nt片段(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836,导致HBG113bp del c.-114至-102的改变)和HBG2(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760,导致HBG1 13bp del c.-114至-102的改变)。在电脑模拟和分级后设计gRNA后,选择一部分gRNA并筛选人类K562细胞的活性和特异性。选择用于筛选的gRNA含有表8中阐述的靶向结构域序列。将编码U6启动子和每种化脓链球菌gRNA的DNA与编码化脓链球菌Cas9的质粒DNA共电穿孔(Amaxa核转染仪)到人类K562细胞中。实验条件通常与本领域已知的那些条件一致(例如,Gori 2016,其通过引用结合在此)。电穿孔后3天,从K562细胞中提取gDNA,然后从gDNA中PCR扩增HBG1和HBG2基因座。通过T7E1内切核酸酶测定分析在PCR产物中评估基因编辑。在筛选的10个sgRNA中,8个切割启动子序列中的HBG1和HBG2靶向区域(图10A)。
然后通过DNA测序分析来分析用8种活性sgRNA靶向的K562细胞的HBG1和HBG2 PCR产物,并对检测到的插入和缺失进行打分。缺失被细分为HPFH位点的精确的13nt缺失、HPFH包容性的和近端小缺失(18-26nt)、HPFH靶位点12nt缺失(即,部分缺失)、跨越部分HPFH靶位点的>26nt缺失、和其他缺失,例如,邻近HPFH靶位点但在HPFH靶位点外的缺失。八个sgRNA中的七个HBG1的13nt靶向缺失(HPFH突变诱导)(图10B)。八个sgRNA中的至少五个也支持HBG2启动子区域中13nt(HPFH突变诱导)靶向缺失(图10C)。需注意,用HBG Sp34sgRNA处理的细胞中HBG2的DNA序列结果不可用。这些数据表明Cas9和sgRNA支持精确诱导13bpdel c.-114至-102HPFH突变。图10D-10F描绘了在HBG1中靶向序列中观察到的缺失类型的实例。在每个具体实例中使用的gRNA以黑色示出,并且在每个组的实例中未靶向的其他gRNA以白色示出。
表8:选择用于在K562细胞中筛选的gRNA列表
实例2:含有靶向HPFH突变的gRNA的Cas9RNP支持人类造血干/祖细胞中的基因编
用人类细胞因子(干细胞因子(SCF)、血小板生成素(TPO)、Flt3配体(FL))和小分子(前列腺素E2(PGE2)、StemRegenin 1(SR1))预刺激人类脐带血(CB)CD34+细胞两天。实验条件通常根据提供于Gori 2016第240-241页中的方法,其通过引入结合在此。将CB CD34+细胞用含有(例如,5'ARCA加帽和3'polyA(20A)尾部)靶向HBG1和HBG2调控区域的sgRNA(表8)的化脓链球菌Cas9RNP电穿孔(Amaxa核转染仪)。电穿孔后3天,从RNP处理的CB CD34+细胞中提取gDNA,并通过T7E1测定和DNA测序分析基因编辑。
在CB CD34+细胞中测试的含有不同gRNA的RNP中,只有Sp37 gRNA(包含SEQ IDNO:333)在HBG1和HBG2启动子的靶位点处导致可检测的编辑,如通过HBG1和HBG2特异性PCR产物(从三个脐带血供体的电穿孔CB CD34+细胞中提取的gDNA扩增产物)中的indel的T7E1分析所确定的(图11A)。在用与Sp37复合的Cas9蛋白电穿孔的细胞中检测到的平均编辑水平在HBG1处为5%±2%indel,在HBG2处检测为3%±1%indel(三个独立的实验和CB供体)。
接下来,将三个化脓链球菌gRNA(其靶位点在HBG启动子内)(Sp35(包含SEQ IDNO:339)、Sp36(包含SEQ ID NO:338)、Sp37(包含SEQ ID NO:333))与野生型化脓链球菌Cas9蛋白复合以形成核糖核蛋白复合物。将这些HBG靶向的RNPS电穿孔到CB CD34+细胞(n=3供体)和成人动员的外周血(mPB)CD34+细胞供体(n=3供体)中。根据上述方法和Gori2016第240-241页制备CB CD34+细胞。除了不添加SR1之外,以与CB CD34+细胞基本相同的方式制备成人mPB CD34+细胞。在Cas9RNP递送后大约三天,通过从样品中提取的基因组DNA扩增的HBG2PCR产物的T7E1内切核酸酶分析来分析靶位点处的插入/缺失水平。这些RNP中的每一个仅在三个供体和三个独立的实验的CB和成人CD34+细胞中支持低水平基因编辑(图11B)。
为了增加靶位点的基因编辑并增加靶位点13bp缺失的发生,单链脱氧核苷酸供体修复模板(ssODNs)在5'编码87bp和89bp的同源性并产生HBG1和HBG2的靶向缺失位点的3'侧。构建体ssODN1(SEQ ID NO:906,表9),包括5'和3'同源臂,被设计为“编码”13bp缺失,其中序列同源臂工程化侧接所述不存在的序列以产生完美缺失。5'同源臂(SEQ ID NO:904,表9)包括与HBG1和HBG2的c.-114至-102的序列5'同源的核苷酸(即,与SEQ ID NO:902(HBG1)的核苷酸2824-2836的序列5'同源的核苷酸,和与SEQ ID NO:903(HBG2)的核苷酸2748-2760的序列5'同源的核苷酸)。3'同源臂(SEQ ID NO:905,表9)包括与HBG1和HBG2的c.-114至-102的3'区域同源的核苷酸(即,与SEQ ID NO:902(HBG1)的核苷酸2824-2836的序列3'同源的核苷酸,和与SEQ ID NO:903(HBG2)的核苷酸2748-2760的序列3'同源的核苷酸)。在末端修饰ssODN1构建体以在5'和3'端含有硫代磷酸酯(PhTx)(SEQ ID NO:909,表9)以形成PhTx ssODN1。
表9:单链脱氧核苷酸供体修复模板(ssODN)
根据上述方法和Gori 2016第240-241页制备CB CD34+细胞。ssODN(即,ssODN1和PhTx ssODN1)与靶向HBG的RNP共递送至CB CD34+细胞,所述HBG含有Sp37 gRNA(HBG Sp37RNP)或HBG Sp35(HBG Sp35 RNP)。
通过HBG2 PCR产物的T7E1分析确定,编码13bp缺失的ssODN1和PhTx ssODN1供体模板与含有Sp35 gRNA的RNP(即,HBG Sp35 RNP)或含有Sp37 gRNA的RNP(即,HBG Sp37RNP)的共递送导致分别在靶位点的基因编辑中有6倍和5倍的增加(图11C)。HBG2 PCR产物的DNA测序分析(Sanger测序)指示了在用HBG Sp37 RNP和PhTx ssODN1处理的细胞中20%的基因编辑,具有15%的缺失和5%的插入(图11C,左下部组)。对靶位点缺失的特异性类型和尺寸的进一步分析揭示,检测到的总缺失的75%中有3/4含有HPFH 13bp缺失(其中包括缺失近端启动子中的CAAT盒),所述缺失与HbF表达的升高有关(图11C,右下部组)。剩余的1/4缺失是部分缺失,没有跨越完全的13bp缺失。这些数据指示,工程化具有缺失的同源ssODN的共递送支持在人类CD34+细胞中HBG的精确基因编辑(缺失)。
实例3:筛选作为核糖核蛋白复合物递送至K562细胞的化脓链球菌gRNA,用于引起 13bp del c.-114至-102进入HBG1和HBG2调控区域
如实例1(图10)所述,通过将Cas9和gRNA DNA电穿孔进入K562细胞中筛选的指导RNA进行体外转录,然后与化脓链球菌Wt Cas9蛋白复合形成核糖核蛋白复合物(RNP)。为了比较这些RNP的活性与通过将Cas9和gRNA DNA递送至K562细胞(即,实例1)和通过RNP递送至人类CD34+细胞(即,实例2)所观察到的活性,此处通过电穿孔(Amaxa核转染仪)将RNP递送至K562细胞。与化脓链球菌Cas9蛋白复合的gRNA是修饰的gRNA((例如,5'ARCA加帽和3'polyA(20A)尾部;表8)并靶向HBG1和HBG2调控区域。
电穿孔后3天,从K562细胞中提取gDNA,然后通过PCR扩增HBG1和HBG2启动子区域,随后对PCR产物进行T7E1分析。(图12A)。九个RNP中有八个支持高百分比的NHEJ。Sp37 RNP是唯一示出于人类CD34+细胞中有活性的gRNA(在CD34+细胞中<10%编辑),在K562细胞中具有高活性,在HBG1和HBG2处均检测到>60%的indel(图12A)。靶向HPFH缺失突变位点Sp35的其他gRNA支持HBG1和HBG2的43%的编辑(图12A)。
对来自用Cas9处理复合的细胞的gDNA的一部分PCR产物进行DNA测序分析,所述Cas9复合至最接近靶向HPFH位点的gRNA。对DNA序列进行打分以检测插入和缺失。缺失被细分为HPFH位点的精确的13nt缺失、HPFH包容性的和近端小缺失(18-26nt)、HPFH靶位点12nt缺失(即,部分缺失)、跨越部分HPFH靶位点的>26nt缺失、和其他缺失,例如,邻近HPFH靶位点但在HPFH靶位点外的缺失。在用与HBG1/HBG2的gRNA Sp35和37(HPFH突变诱导)(图12B)复合的RNP处理的细胞中检测到13nt缺失,这些数据指示Cas9和sgRNA(Sp35和Sp37)作为核糖核蛋白复合物递送至造血细胞引起c.-114至-102HPFH突变。
实例4:靶向HPFH突变的Cas9 RNP支持人类成人动员的具有成红细胞后裔中HBG表 达增加的外周血造血干细胞/祖细胞中的基因编辑
为了确定在HBG启动子中编辑HBG与Cas9 RNP复合到Sp37 gRNA或Sp35gRNA(即,靶向与HPFH有关的13bp缺失的gRNA)的HBG支持编辑的CD34+细胞的红系后裔中HBG表达的增加,用RNP电穿孔来自动员外周血(mPB)的人类成人CD34+细胞。简而言之,在StemSpan无血清扩增培养基(SFEM)中用人类细胞因子和PGE2预刺激mPB CD34+细胞2天,然后分别用预复合到Sp35和Sp37的Cas9蛋白电穿孔。参见Gori 2016。HBG PCR产物的T7E1分析指示,用与Sp37复合的RNP处理的mPB CD34+细胞检测到约3%的indel,而未检测到用与Sp35复合的RNP处理的细胞的编辑(图13A)。
为了增加靶位点的基因编辑并增加靶位点处13bp缺失的发生,将PhTx ssODN1与靶向含有Sp37 gRNA的HBG的预复合RNP共递送。编码13bp缺失的PhTx ssODN1供体的共递送导致靶位点的基因编辑增加近2倍(图13A)。
为了确定编辑HBG是否增加编辑的成人CD34+细胞的红系后裔中胎儿血红蛋白的产生,在人类细胞因子(促红细胞生成素,SCF,IL3)、人类血浆(Octoplas)、和其他补充剂(氢化可的松、肝素、转铁蛋白)存在下,通过培养持续长达18天将细胞分化成成红细胞。在分化的时间过程中,收集mRNA以评估RNP处理的mPB CD34+细胞和供体匹配的阴性(未处理的)对照的红系后裔中的HBG基因表达。到分化的第7天,用HBG Sp37 RNP处理的人类CD34+细胞的成红细胞后裔和编码ssODN1的13bp HPFH缺失(通过T7E1分析在来自大量细胞群的gDNA中检测到约5%的indel)展现出HBG mRNA的产生增加2倍(图13B)。此外,通过用于获得红系表型(%血型糖蛋白A+细胞)的流式分析确定,从RNP处理的CD34+细胞分化的成红细胞维持观察到供体匹配的未处理对照细胞的分化动力学(图14A)。重要的是,用HBG Sp37RNP和ssODN1电穿孔的CD34+细胞维持其离体造血活性(即,与未处理的供体匹配的CD34+细胞阴性对照相比,红系和骨髓集落的量或多样性没有差异),如在造血集落形成细胞(CFC)测定中确定的(图14B)。这些数据指示HBG1/HBG2近端启动子区域的靶向破坏支持RNP处理的成人造血干细胞/祖细胞的红系后裔中HBG表达的增加而不改变分化潜能。
序列
根据本披露内容的基因组编辑系统组件(包括但不限于,RNA指导的核酸酶、指导RNA、供体模板核酸、编码核酸酶或指导RNA的核酸、以及任何前述的部分或片段),用序列表中表示的核苷酸和氨基酸序列例示。序列表中表示的序列不旨在是限制性的,而是说明性的基因组编辑系统及其组分部分的某些原理,组合本披露内容,将通知本领域技术人员另外的本披露内容范围内的实施和修饰。表示序列的列表在以下表10中提供。
表10:序列表中表示的序列:
通过引用结合
本文提及的所有出版物、专利和专利申请都通过引用以其全文而特此结合,如同每一单独的出版物、专利或专利申请具体且单独地指明通过引用而结合一样。在有冲突的情况下,以本申请(包括本文的任何定义)为准。
等效物
本领域的普通技术人员仅使用常规实验就应认识到或能够确定本文描述的本发明的具体实施例的许多等效物。此类等效物旨在由以下权利要求书涵盖。
参考文献
Ahern等人,Br J Haematol[英国血液学杂志]25(4):437-444(1973)
Akinbami,Hemoglobin[血红蛋白]40:64-65(2016)
Aliyu等人,Am J Hematol[美国血液学杂志]83:63-70(2008)
Anders等人,Nature[自然]513(7519):569-573(2014)
Angastiniotis和Modell,Ann N Y Acad Sci[纽约科学院年报]850:251-269(1998)
Bae等人,Bioinformatics[生物信息学]30(10):1473-1475(2014)
Barbosa等人,Braz J Med Bio Res[巴西医学和生物研究杂志]43(8):705-711(2010)
Bouva,Hematologica[血液学]91(1):129-132(2006)
Brousseau,Am J Hematol[美国血液学杂志]85(1):77-78(2010)
Caldecott,Nat Rev Genet[自然遗传学评论]9(8):619-631(2008)
Chassanidis,Ann Hematol[血液学年鉴]88(6):549-555(2009)
Chylinski等人,RNA Biol[RNA生物学]10(5):726-737(2013)
Cong等人,Science[科学]399(6121):819-823(2013)
Costa等人,Cad Saude Publica 18(5):1469-1471(2002)
Cotta-Ramusino等人,国际专利公开号WO 2016/073990(2016)
Fine等人,Sci Rep.[科学报告]5:10777(2015)
Friedland等人,Genome Biol[基因组生物学]16:257(2015)
Fu等人,Nat Biotechnol[自然生物技术]32:279-284(2014)
Gori等人,国际专利公开号WO 2016/182959 A1(2016)
Guilinger等人,Nat Biotechnol[自然生物技术]32:577-582(2014)
Jinek等人,Science[科学]337(6096):816-821(2012)
Jinek等人,Science[科学]343(6176):1247997(2014)
Kleinstiver等人,Nature[自然]523(7561):481-485(2015a)
Kleinstiver等人,Nat Biotechnol[自然生物技术]33(12):1293-1298(2015b)
Kleinstiver等人,Nature[自然]529(7587):490-495(2016)
Lee等人,Nano Lett[纳米快报]12(12):6322-6327(2012)
Lewis,"Medical-Surgical Nursing:Assessment and Management of ClinicalProblems"[医学外科护理:临床问题的评估与管理](2014)
Li,Cell Res[细胞研究]18(1):85-98(2008)
Maeder等人,国际专利公开号WO 2015/138510(2015)
Mali等人,Science[科学]339(6121):823-826(2013)
Mantovani等人,Nucleic Acids Res[核酸研究]16(16):7783-7797(1988)
Marteijn等人,Nat Rev Mol Cell Biol[自然分子细胞生物学评论]15(7):465-481(2014)
Nishimasu等人,Cell[细胞]156(5):935-949(2014)
Ran等人,Cell[细胞]154(6):1380-1389(2013)
Shmakov等人,Molecular Cell[分子细胞]60(3):385-397(2015)
Sternberg等人,Nature[自然]507(7490):62-67(2014)
Superti-Furga等人,EMBO J[欧洲分子生物学杂志]7(10):3099-3107(1988)
Thein,Hum Mol Genet[人类分子遗传学]18(R2):R216-223(2009)
Waber等人,Blood[血液]67(2):551-554(1986)
Wang等人,Cell[细胞]153(4):910-918(2013)
Xu等人,Genes Dev[基因与发育]24(8):783-798(2010)
Yamano等人,Cell[细胞]165(4):949-962(2016)
Zetsche等人,Nat Biotechnol[自然生物技术]33(2):139-42(2015)
序列表
<110> 爱迪塔斯医药公司(Editas Medicine)
J·L·戈里
L·A·巴雷拉
<120> 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
<130> 118945.8009.WO00 (EM076PCT)
<150> US 62/308,190
<151> 2016-03-14
<150> US 62/456,615
<151> 2017-02-08
<160> 939
<170> PatentIn 版本 3.5
<210> 1
<211> 1345
<212> PRT
<213> 变形链球菌
<220>
<221> 尚未归类的特征
<222> (10)..(21)
<223> N端 RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (759)..(766)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (837)..(863)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (982)..(989)
<223> RuvC样结构域
<400> 1
Met Lys Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Asp Lys Ser His Ile Glu Lys Asn Leu Leu
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Asn Thr Ala Glu Asp Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Glu Glu Met Gly Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Asp Ser Phe Leu Val Thr Glu Asp Lys Arg
100 105 110
Gly Glu Arg His Pro Ile Phe Gly Asn Leu Glu Glu Glu Val Lys Tyr
115 120 125
His Glu Asn Phe Pro Thr Ile Tyr His Leu Arg Gln Tyr Leu Ala Asp
130 135 140
Asn Pro Glu Lys Val Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Lys Phe Asp Thr
165 170 175
Arg Asn Asn Asp Val Gln Arg Leu Phe Gln Glu Phe Leu Ala Val Tyr
180 185 190
Asp Asn Thr Phe Glu Asn Ser Ser Leu Gln Glu Gln Asn Val Gln Val
195 200 205
Glu Glu Ile Leu Thr Asp Lys Ile Ser Lys Ser Ala Lys Lys Asp Arg
210 215 220
Val Leu Lys Leu Phe Pro Asn Glu Lys Ser Asn Gly Arg Phe Ala Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys His Phe
245 250 255
Glu Leu Glu Glu Lys Ala Pro Leu Gln Phe Ser Lys Asp Thr Tyr Glu
260 265 270
Glu Glu Leu Glu Val Leu Leu Ala Gln Ile Gly Asp Asn Tyr Ala Glu
275 280 285
Leu Phe Leu Ser Ala Lys Lys Leu Tyr Asp Ser Ile Leu Leu Ser Gly
290 295 300
Ile Leu Thr Val Thr Asp Val Gly Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Gln Arg Tyr Asn Glu His Gln Met Asp Leu Ala Gln Leu Lys
325 330 335
Gln Phe Ile Arg Gln Lys Leu Ser Asp Lys Tyr Asn Glu Val Phe Ser
340 345 350
Asp Val Ser Lys Asp Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Ala Phe Tyr Lys Tyr Leu Lys Gly Leu Leu Asn Lys Ile Glu
370 375 380
Gly Ser Gly Tyr Phe Leu Asp Lys Ile Glu Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Ile Arg Arg Gln Ala Glu Phe Tyr Pro Phe
420 425 430
Leu Ala Asp Asn Gln Asp Arg Ile Glu Lys Leu Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Lys Ser Asp Phe Ala Trp
450 455 460
Leu Ser Arg Lys Ser Ala Asp Lys Ile Thr Pro Trp Asn Phe Asp Glu
465 470 475 480
Ile Val Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Asn Tyr Asp Leu Tyr Leu Pro Asn Gln Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Lys Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Lys Thr Glu Gln Gly Lys Thr Ala Phe Phe Asp Ala Asn Met Lys
530 535 540
Gln Glu Ile Phe Asp Gly Val Phe Lys Val Tyr Arg Lys Val Thr Lys
545 550 555 560
Asp Lys Leu Met Asp Phe Leu Glu Lys Glu Phe Asp Glu Phe Arg Ile
565 570 575
Val Asp Leu Thr Gly Leu Asp Lys Glu Asn Lys Val Phe Asn Ala Ser
580 585 590
Tyr Gly Thr Tyr His Asp Leu Cys Lys Ile Leu Asp Lys Asp Phe Leu
595 600 605
Asp Asn Ser Lys Asn Glu Lys Ile Leu Glu Asp Ile Val Leu Thr Leu
610 615 620
Thr Leu Phe Glu Asp Arg Glu Met Ile Arg Lys Arg Leu Glu Asn Tyr
625 630 635 640
Ser Asp Leu Leu Thr Lys Glu Gln Val Lys Lys Leu Glu Arg Arg His
645 650 655
Tyr Thr Gly Trp Gly Arg Leu Ser Ala Glu Leu Ile His Gly Ile Arg
660 665 670
Asn Lys Glu Ser Arg Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly
675 680 685
Asn Ser Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser
690 695 700
Phe Lys Glu Glu Ile Ala Lys Ala Gln Val Ile Gly Glu Thr Asp Asn
705 710 715 720
Leu Asn Gln Val Val Ser Asp Ile Ala Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val Lys Ile Met
740 745 750
Gly His Gln Pro Glu Asn Ile Val Val Glu Met Ala Arg Glu Asn Gln
755 760 765
Phe Thr Asn Gln Gly Arg Arg Asn Ser Gln Gln Arg Leu Lys Gly Leu
770 775 780
Thr Asp Ser Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Ser Gln Leu Gln Asn Asp Arg Leu Phe Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Thr Gly Glu Glu Leu Asp Ile Asp Tyr
820 825 830
Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys
835 840 845
Asp Asn Ser Ile Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn Arg
850 855 860
Gly Lys Ser Asp Asp Val Pro Ser Lys Asp Val Val Arg Lys Met Lys
865 870 875 880
Ser Tyr Trp Ser Lys Leu Leu Ser Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Asp Asp Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Arg Ile Leu Asp Glu Arg Phe Asn Thr Glu Thr Asp
930 935 940
Glu Asn Asn Lys Lys Ile Arg Gln Val Lys Ile Val Thr Leu Lys Ser
945 950 955 960
Asn Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Ile Gly Lys Ala Leu Leu Gly Val Tyr Pro Gln Leu Glu Pro Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Pro His Phe His Gly His Lys Glu Asn Lys
1010 1015 1020
Ala Thr Ala Lys Lys Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1025 1030 1035
Lys Lys Asp Asp Val Arg Thr Asp Lys Asn Gly Glu Ile Ile Trp
1040 1045 1050
Lys Lys Asp Glu His Ile Ser Asn Ile Lys Lys Val Leu Ser Tyr
1055 1060 1065
Pro Gln Val Asn Ile Val Lys Lys Val Glu Glu Gln Thr Gly Gly
1070 1075 1080
Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Asn Ser Asp Lys Leu
1085 1090 1095
Ile Pro Arg Lys Thr Lys Lys Phe Tyr Trp Asp Thr Lys Lys Tyr
1100 1105 1110
Gly Gly Phe Asp Ser Pro Ile Val Ala Tyr Ser Ile Leu Val Ile
1115 1120 1125
Ala Asp Ile Glu Lys Gly Lys Ser Lys Lys Leu Lys Thr Val Lys
1130 1135 1140
Ala Leu Val Gly Val Thr Ile Met Glu Lys Met Thr Phe Glu Arg
1145 1150 1155
Asp Pro Val Ala Phe Leu Glu Arg Lys Gly Tyr Arg Asn Val Gln
1160 1165 1170
Glu Glu Asn Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Lys Leu
1175 1180 1185
Glu Asn Gly Arg Lys Arg Leu Leu Ala Ser Ala Arg Glu Leu Gln
1190 1195 1200
Lys Gly Asn Glu Ile Val Leu Pro Asn His Leu Gly Thr Leu Leu
1205 1210 1215
Tyr His Ala Lys Asn Ile His Lys Val Asp Glu Pro Lys His Leu
1220 1225 1230
Asp Tyr Val Asp Lys His Lys Asp Glu Phe Lys Glu Leu Leu Asp
1235 1240 1245
Val Val Ser Asn Phe Ser Lys Lys Tyr Thr Leu Ala Glu Gly Asn
1250 1255 1260
Leu Glu Lys Ile Lys Glu Leu Tyr Ala Gln Asn Asn Gly Glu Asp
1265 1270 1275
Leu Lys Glu Leu Ala Ser Ser Phe Ile Asn Leu Leu Thr Phe Thr
1280 1285 1290
Ala Ile Gly Ala Pro Ala Thr Phe Lys Phe Phe Asp Lys Asn Ile
1295 1300 1305
Asp Arg Lys Arg Tyr Thr Ser Thr Thr Glu Ile Leu Asn Ala Thr
1310 1315 1320
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1325 1330 1335
Leu Asn Lys Leu Gly Gly Asp
1340 1345
<210> 2
<211> 1368
<212> PRT
<213> 酿脓链球菌
<220>
<221> 尚未归类的特征
<222> (10)..(21)
<223> N端 RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (759)..(766)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (837)..(863)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (982)..(989)
<223> RuvC样结构域
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 3
<211> 4107
<212> DNA
<213> 酿脓链球菌
<400> 3
atggataaaa agtacagcat cgggctggac atcggtacaa actcagtggg gtgggccgtg 60
attacggacg agtacaaggt accctccaaa aaatttaaag tgctgggtaa cacggacaga 120
cactctataa agaaaaatct tattggagcc ttgctgttcg actcaggcga gacagccgaa 180
gccacaaggt tgaagcggac cgccaggagg cggtatacca ggagaaagaa ccgcatatgc 240
tacctgcaag aaatcttcag taacgagatg gcaaaggttg acgatagctt tttccatcgc 300
ctggaagaat cctttcttgt tgaggaagac aagaagcacg aacggcaccc catctttggc 360
aatattgtcg acgaagtggc atatcacgaa aagtacccga ctatctacca cctcaggaag 420
aagctggtgg actctaccga taaggcggac ctcagactta tttatttggc actcgcccac 480
atgattaaat ttagaggaca tttcttgatc gagggcgacc tgaacccgga caacagtgac 540
gtcgataagc tgttcatcca acttgtgcag acctacaatc aactgttcga agaaaaccct 600
ataaatgctt caggagtcga cgctaaagca atcctgtccg cgcgcctctc aaaatctaga 660
agacttgaga atctgattgc tcagttgccc ggggaaaaga aaaatggatt gtttggcaac 720
ctgatcgccc tcagtctcgg actgacccca aatttcaaaa gtaacttcga cctggccgaa 780
gacgctaagc tccagctgtc caaggacaca tacgatgacg acctcgacaa tctgctggcc 840
cagattgggg atcagtacgc cgatctcttt ttggcagcaa agaacctgtc cgacgccatc 900
ctgttgagcg atatcttgag agtgaacacc gaaattacta aagcacccct tagcgcatct 960
atgatcaagc ggtacgacga gcatcatcag gatctgaccc tgctgaaggc tcttgtgagg 1020
caacagctcc ccgaaaaata caaggaaatc ttctttgacc agagcaaaaa cggctacgct 1080
ggctatatag atggtggggc cagtcaggag gaattctata aattcatcaa gcccattctc 1140
gagaaaatgg acggcacaga ggagttgctg gtcaaactta acagggagga cctgctgcgg 1200
aagcagcgga cctttgacaa cgggtctatc ccccaccaga ttcatctggg cgaactgcac 1260
gcaatcctga ggaggcagga ggatttttat ccttttctta aagataaccg cgagaaaata 1320
gaaaagattc ttacattcag gatcccgtac tacgtgggac ctctcgcccg gggcaattca 1380
cggtttgcct ggatgacaag gaagtcagag gagactatta caccttggaa cttcgaagaa 1440
gtggtggaca agggtgcatc tgcccagtct ttcatcgagc ggatgacaaa ttttgacaag 1500
aacctcccta atgagaaggt gctgcccaaa cattctctgc tctacgagta ctttaccgtc 1560
tacaatgaac tgactaaagt caagtacgtc accgagggaa tgaggaagcc ggcattcctt 1620
agtggagaac agaagaaggc gattgtagac ctgttgttca agaccaacag gaaggtgact 1680
gtgaagcaac ttaaagaaga ctactttaag aagatcgaat gttttgacag tgtggaaatt 1740
tcaggggttg aagaccgctt caatgcgtca ttggggactt accatgatct tctcaagatc 1800
ataaaggaca aagacttcct ggacaacgaa gaaaatgagg atattctcga agacatcgtc 1860
ctcaccctga ccctgttcga agacagggaa atgatagaag agcgcttgaa aacctatgcc 1920
cacctcttcg acgataaagt tatgaagcag ctgaagcgca ggagatacac aggatgggga 1980
agattgtcaa ggaagctgat caatggaatt agggataaac agagtggcaa gaccatactg 2040
gatttcctca aatctgatgg cttcgccaat aggaacttca tgcaactgat tcacgatgac 2100
tctcttacct tcaaggagga cattcaaaag gctcaggtga gcgggcaggg agactccctt 2160
catgaacaca tcgcgaattt ggcaggttcc cccgctatta aaaagggcat ccttcaaact 2220
gtcaaggtgg tggatgaatt ggtcaaggta atgggcagac ataagccaga aaatattgtg 2280
atcgagatgg cccgcgaaaa ccagaccaca cagaagggcc agaaaaatag tagagagcgg 2340
atgaagagga tcgaggaggg catcaaagag ctgggatctc agattctcaa agaacacccc 2400
gtagaaaaca cacagctgca gaacgaaaaa ttgtacttgt actatctgca gaacggcaga 2460
gacatgtacg tcgaccaaga acttgatatt aatagactgt ccgactatga cgtagaccat 2520
atcgtgcccc agtccttcct gaaggacgac tccattgata acaaagtctt gacaagaagc 2580
gacaagaaca ggggtaaaag tgataatgtg cctagcgagg aggtggtgaa aaaaatgaag 2640
aactactggc gacagctgct taatgcaaag ctcattacac aacggaagtt cgataatctg 2700
acgaaagcag agagaggtgg cttgtctgag ttggacaagg cagggtttat taagcggcag 2760
ctggtggaaa ctaggcagat cacaaagcac gtggcgcaga ttttggacag ccggatgaac 2820
acaaaatacg acgaaaatga taaactgata cgagaggtca aagttatcac gctgaaaagc 2880
aagctggtgt ccgattttcg gaaagacttc cagttctaca aagttcgcga gattaataac 2940
taccatcatg ctcacgatgc gtacctgaac gctgttgtcg ggaccgcctt gataaagaag 3000
tacccaaagc tggaatccga gttcgtatac ggggattaca aagtgtacga tgtgaggaaa 3060
atgatagcca agtccgagca ggagattgga aaggccacag ctaagtactt cttttattct 3120
aacatcatga atttttttaa gacggaaatt accctggcca acggagagat cagaaagcgg 3180
ccccttatag agacaaatgg tgaaacaggt gaaatcgtct gggataaggg cagggatttc 3240
gctactgtga ggaaggtgct gagtatgcca caggtaaata tcgtgaaaaa aaccgaagta 3300
cagaccggag gattttccaa ggaaagcatt ttgcctaaaa gaaactcaga caagctcatc 3360
gcccgcaaga aagattggga ccctaagaaa tacgggggat ttgactcacc caccgtagcc 3420
tattctgtgc tggtggtagc taaggtggaa aaaggaaagt ctaagaagct gaagtccgtg 3480
aaggaactct tgggaatcac tatcatggaa agatcatcct ttgaaaagaa ccctatcgat 3540
ttcctggagg ctaagggtta caaggaggtc aagaaagacc tcatcattaa actgccaaaa 3600
tactctctct tcgagctgga aaatggcagg aagagaatgt tggccagcgc cggagagctg 3660
caaaagggaa acgagcttgc tctgccctcc aaatatgtta attttctcta tctcgcttcc 3720
cactatgaaa agctgaaagg gtctcccgaa gataacgagc agaagcagct gttcgtcgaa 3780
cagcacaagc actatctgga tgaaataatc gaacaaataa gcgagttcag caaaagggtt 3840
atcctggcgg atgctaattt ggacaaagta ctgtctgctt ataacaagca ccgggataag 3900
cctattaggg aacaagccga gaatataatt cacctcttta cactcacgaa tctcggagcc 3960
cccgccgcct tcaaatactt tgatacgact atcgaccgga aacggtatac cagtaccaaa 4020
gaggtcctcg atgccaccct catccaccag tcaattactg gcctgtacga aacacggatc 4080
gacctctctc aactgggcgg cgactag 4107
<210> 4
<211> 1388
<212> PRT
<213> 嗜热链球菌
<220>
<221> 尚未归类的特征
<222> (10)..(21)
<223> N端RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (760)..(767)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (844)..(870)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (989)..(996)
<223> RuvC样结构域
<400> 4
Met Thr Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Thr Thr Asp Asn Tyr Lys Val Pro Ser Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Ser Lys Lys Tyr Ile Lys Lys Asn Leu Leu
35 40 45
Gly Val Leu Leu Phe Asp Ser Gly Ile Thr Ala Glu Gly Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Thr Glu Met Ala Thr Leu Asp Asp Ala
85 90 95
Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Pro Asp Asp Lys Arg
100 105 110
Asp Ser Lys Tyr Pro Ile Phe Gly Asn Leu Val Glu Glu Lys Ala Tyr
115 120 125
His Asp Glu Phe Pro Thr Ile Tyr His Leu Arg Lys Tyr Leu Ala Asp
130 135 140
Ser Thr Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Glu Phe Asn Ser
165 170 175
Lys Asn Asn Asp Ile Gln Lys Asn Phe Gln Asp Phe Leu Asp Thr Tyr
180 185 190
Asn Ala Ile Phe Glu Ser Asp Leu Ser Leu Glu Asn Ser Lys Gln Leu
195 200 205
Glu Glu Ile Val Lys Asp Lys Ile Ser Lys Leu Glu Lys Lys Asp Arg
210 215 220
Ile Leu Lys Leu Phe Pro Gly Glu Lys Asn Ser Gly Ile Phe Ser Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Arg Lys Cys Phe
245 250 255
Asn Leu Asp Glu Lys Ala Ser Leu His Phe Ser Lys Glu Ser Tyr Asp
260 265 270
Glu Asp Leu Glu Thr Leu Leu Gly Tyr Ile Gly Asp Asp Tyr Ser Asp
275 280 285
Val Phe Leu Lys Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly
290 295 300
Phe Leu Thr Val Thr Asp Asn Glu Thr Glu Ala Pro Leu Ser Ser Ala
305 310 315 320
Met Ile Lys Arg Tyr Asn Glu His Lys Glu Asp Leu Ala Leu Leu Lys
325 330 335
Glu Tyr Ile Arg Asn Ile Ser Leu Lys Thr Tyr Asn Glu Val Phe Lys
340 345 350
Asp Asp Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Asp Phe Tyr Val Tyr Leu Lys Lys Leu Leu Ala Glu Phe Glu
370 375 380
Gly Ala Asp Tyr Phe Leu Glu Lys Ile Asp Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro Tyr Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Leu Asp Lys Gln Ala Lys Phe Tyr Pro Phe
420 425 430
Leu Ala Lys Asn Lys Glu Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Asp Phe Ala Trp
450 455 460
Ser Ile Arg Lys Arg Asn Glu Lys Ile Thr Pro Trp Asn Phe Glu Asp
465 470 475 480
Val Ile Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Ser Phe Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Thr Phe Asn Val Tyr Asn Glu Leu Thr Lys Val Arg
515 520 525
Phe Ile Ala Glu Ser Met Arg Asp Tyr Gln Phe Leu Asp Ser Lys Gln
530 535 540
Lys Lys Asp Ile Val Arg Leu Tyr Phe Lys Asp Lys Arg Lys Val Thr
545 550 555 560
Asp Lys Asp Ile Ile Glu Tyr Leu His Ala Ile Tyr Gly Tyr Asp Gly
565 570 575
Ile Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ser Ser Leu Ser Thr
580 585 590
Tyr His Asp Leu Leu Asn Ile Ile Asn Asp Lys Glu Phe Leu Asp Asp
595 600 605
Ser Ser Asn Glu Ala Ile Ile Glu Glu Ile Ile His Thr Leu Thr Ile
610 615 620
Phe Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ser Lys Phe Glu Asn
625 630 635 640
Ile Phe Asp Lys Ser Val Leu Lys Lys Leu Ser Arg Arg His Tyr Thr
645 650 655
Gly Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asp Glu
660 665 670
Lys Ser Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ile Ser
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ala Leu Ser Phe Lys
690 695 700
Lys Lys Ile Gln Lys Ala Gln Ile Ile Gly Asp Glu Asp Lys Gly Asn
705 710 715 720
Ile Lys Glu Val Val Lys Ser Leu Pro Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met
740 745 750
Gly Gly Arg Lys Pro Glu Ser Ile Val Val Glu Met Ala Arg Glu Asn
755 760 765
Gln Tyr Thr Asn Gln Gly Lys Ser Asn Ser Gln Gln Arg Leu Lys Arg
770 775 780
Leu Glu Lys Ser Leu Lys Glu Leu Gly Ser Lys Ile Leu Lys Glu Asn
785 790 795 800
Ile Pro Ala Lys Leu Ser Lys Ile Asp Asn Asn Ala Leu Gln Asn Asp
805 810 815
Arg Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly
820 825 830
Asp Asp Leu Asp Ile Asp Arg Leu Ser Asn Tyr Asp Ile Asp His Ile
835 840 845
Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile Asp Asn Lys Val Leu
850 855 860
Val Ser Ser Ala Ser Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Leu
865 870 875 880
Glu Val Val Lys Lys Arg Lys Thr Phe Trp Tyr Gln Leu Leu Lys Ser
885 890 895
Lys Leu Ile Ser Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Pro Glu Asp Lys Ala Gly Phe Ile Gln Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Leu Leu Asp Glu
930 935 940
Lys Phe Asn Asn Lys Lys Asp Glu Asn Asn Arg Ala Val Arg Thr Val
945 950 955 960
Lys Ile Ile Thr Leu Lys Ser Thr Leu Val Ser Gln Phe Arg Lys Asp
965 970 975
Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Phe His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Ala Ser Ala Leu Leu Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr
1010 1015 1020
Asn Ser Phe Arg Glu Arg Lys Ser Ala Thr Glu Lys Val Tyr Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Ile Phe Lys Lys Ser Ile Ser Leu Ala
1040 1045 1050
Asp Gly Arg Val Ile Glu Arg Pro Leu Ile Glu Val Asn Glu Glu
1055 1060 1065
Thr Gly Glu Ser Val Trp Asn Lys Glu Ser Asp Leu Ala Thr Val
1070 1075 1080
Arg Arg Val Leu Ser Tyr Pro Gln Val Asn Val Val Lys Lys Val
1085 1090 1095
Glu Glu Gln Asn His Gly Leu Asp Arg Gly Lys Pro Lys Gly Leu
1100 1105 1110
Phe Asn Ala Asn Leu Ser Ser Lys Pro Lys Pro Asn Ser Asn Glu
1115 1120 1125
Asn Leu Val Gly Ala Lys Glu Tyr Leu Asp Pro Lys Lys Tyr Gly
1130 1135 1140
Gly Tyr Ala Gly Ile Ser Asn Ser Phe Thr Val Leu Val Lys Gly
1145 1150 1155
Thr Ile Glu Lys Gly Ala Lys Lys Lys Ile Thr Asn Val Leu Glu
1160 1165 1170
Phe Gln Gly Ile Ser Ile Leu Asp Arg Ile Asn Tyr Arg Lys Asp
1175 1180 1185
Lys Leu Asn Phe Leu Leu Glu Lys Gly Tyr Lys Asp Ile Glu Leu
1190 1195 1200
Ile Ile Glu Leu Pro Lys Tyr Ser Leu Phe Glu Leu Ser Asp Gly
1205 1210 1215
Ser Arg Arg Met Leu Ala Ser Ile Leu Ser Thr Asn Asn Lys Arg
1220 1225 1230
Gly Glu Ile His Lys Gly Asn Gln Ile Phe Leu Ser Gln Lys Phe
1235 1240 1245
Val Lys Leu Leu Tyr His Ala Lys Arg Ile Ser Asn Thr Ile Asn
1250 1255 1260
Glu Asn His Arg Lys Tyr Val Glu Asn His Lys Lys Glu Phe Glu
1265 1270 1275
Glu Leu Phe Tyr Tyr Ile Leu Glu Phe Asn Glu Asn Tyr Val Gly
1280 1285 1290
Ala Lys Lys Asn Gly Lys Leu Leu Asn Ser Ala Phe Gln Ser Trp
1295 1300 1305
Gln Asn His Ser Ile Asp Glu Leu Cys Ser Ser Phe Ile Gly Pro
1310 1315 1320
Thr Gly Ser Glu Arg Lys Gly Leu Phe Glu Leu Thr Ser Arg Gly
1325 1330 1335
Ser Ala Ala Asp Phe Glu Phe Leu Gly Val Lys Ile Pro Arg Tyr
1340 1345 1350
Arg Asp Tyr Thr Pro Ser Ser Leu Leu Lys Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Val Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ala
1370 1375 1380
Lys Leu Gly Glu Gly
1385
<210> 5
<211> 1334
<212> PRT
<213> 无害利斯特菌
<220>
<221> 尚未归类的特征
<222> (10)..(21)
<223> N端 RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (762)..(769)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (840)..(866)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (985)..(992)
<223> RuvC样结构域
<400> 5
Met Lys Lys Pro Tyr Thr Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Leu Thr Asp Gln Tyr Asp Leu Val Lys Arg Lys Met
20 25 30
Lys Ile Ala Gly Asp Ser Glu Lys Lys Gln Ile Lys Lys Asn Phe Trp
35 40 45
Gly Val Arg Leu Phe Asp Glu Gly Gln Thr Ala Ala Asp Arg Arg Met
50 55 60
Ala Arg Thr Ala Arg Arg Arg Ile Glu Arg Arg Arg Asn Arg Ile Ser
65 70 75 80
Tyr Leu Gln Gly Ile Phe Ala Glu Glu Met Ser Lys Thr Asp Ala Asn
85 90 95
Phe Phe Cys Arg Leu Ser Asp Ser Phe Tyr Val Asp Asn Glu Lys Arg
100 105 110
Asn Ser Arg His Pro Phe Phe Ala Thr Ile Glu Glu Glu Val Glu Tyr
115 120 125
His Lys Asn Tyr Pro Thr Ile Tyr His Leu Arg Glu Glu Leu Val Asn
130 135 140
Ser Ser Glu Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Tyr Arg Gly Asn Phe Leu Ile Glu Gly Ala Leu Asp Thr
165 170 175
Gln Asn Thr Ser Val Asp Gly Ile Tyr Lys Gln Phe Ile Gln Thr Tyr
180 185 190
Asn Gln Val Phe Ala Ser Gly Ile Glu Asp Gly Ser Leu Lys Lys Leu
195 200 205
Glu Asp Asn Lys Asp Val Ala Lys Ile Leu Val Glu Lys Val Thr Arg
210 215 220
Lys Glu Lys Leu Glu Arg Ile Leu Lys Leu Tyr Pro Gly Glu Lys Ser
225 230 235 240
Ala Gly Met Phe Ala Gln Phe Ile Ser Leu Ile Val Gly Ser Lys Gly
245 250 255
Asn Phe Gln Lys Pro Phe Asp Leu Ile Glu Lys Ser Asp Ile Glu Cys
260 265 270
Ala Lys Asp Ser Tyr Glu Glu Asp Leu Glu Ser Leu Leu Ala Leu Ile
275 280 285
Gly Asp Glu Tyr Ala Glu Leu Phe Val Ala Ala Lys Asn Ala Tyr Ser
290 295 300
Ala Val Val Leu Ser Ser Ile Ile Thr Val Ala Glu Thr Glu Thr Asn
305 310 315 320
Ala Lys Leu Ser Ala Ser Met Ile Glu Arg Phe Asp Thr His Glu Glu
325 330 335
Asp Leu Gly Glu Leu Lys Ala Phe Ile Lys Leu His Leu Pro Lys His
340 345 350
Tyr Glu Glu Ile Phe Ser Asn Thr Glu Lys His Gly Tyr Ala Gly Tyr
355 360 365
Ile Asp Gly Lys Thr Lys Gln Ala Asp Phe Tyr Lys Tyr Met Lys Met
370 375 380
Thr Leu Glu Asn Ile Glu Gly Ala Asp Tyr Phe Ile Ala Lys Ile Glu
385 390 395 400
Lys Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ala Ile
405 410 415
Pro His Gln Leu His Leu Glu Glu Leu Glu Ala Ile Leu His Gln Gln
420 425 430
Ala Lys Tyr Tyr Pro Phe Leu Lys Glu Asn Tyr Asp Lys Ile Lys Ser
435 440 445
Leu Val Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Ala Asn Gly
450 455 460
Gln Ser Glu Phe Ala Trp Leu Thr Arg Lys Ala Asp Gly Glu Ile Arg
465 470 475 480
Pro Trp Asn Ile Glu Glu Lys Val Asp Phe Gly Lys Ser Ala Val Asp
485 490 495
Phe Ile Glu Lys Met Thr Asn Lys Asp Thr Tyr Leu Pro Lys Glu Asn
500 505 510
Val Leu Pro Lys His Ser Leu Cys Tyr Gln Lys Tyr Leu Val Tyr Asn
515 520 525
Glu Leu Thr Lys Val Arg Tyr Ile Asn Asp Gln Gly Lys Thr Ser Tyr
530 535 540
Phe Ser Gly Gln Glu Lys Glu Gln Ile Phe Asn Asp Leu Phe Lys Gln
545 550 555 560
Lys Arg Lys Val Lys Lys Lys Asp Leu Glu Leu Phe Leu Arg Asn Met
565 570 575
Ser His Val Glu Ser Pro Thr Ile Glu Gly Leu Glu Asp Ser Phe Asn
580 585 590
Ser Ser Tyr Ser Thr Tyr His Asp Leu Leu Lys Val Gly Ile Lys Gln
595 600 605
Glu Ile Leu Asp Asn Pro Val Asn Thr Glu Met Leu Glu Asn Ile Val
610 615 620
Lys Ile Leu Thr Val Phe Glu Asp Lys Arg Met Ile Lys Glu Gln Leu
625 630 635 640
Gln Gln Phe Ser Asp Val Leu Asp Gly Val Val Leu Lys Lys Leu Glu
645 650 655
Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Ala Lys Leu Leu Met
660 665 670
Gly Ile Arg Asp Lys Gln Ser His Leu Thr Ile Leu Asp Tyr Leu Met
675 680 685
Asn Asp Asp Gly Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Ser
690 695 700
Asn Leu Ser Phe Lys Ser Ile Ile Glu Lys Glu Gln Val Thr Thr Ala
705 710 715 720
Asp Lys Asp Ile Gln Ser Ile Val Ala Asp Leu Ala Gly Ser Pro Ala
725 730 735
Ile Lys Lys Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val
740 745 750
Ser Val Met Gly Tyr Pro Pro Gln Thr Ile Val Val Glu Met Ala Arg
755 760 765
Glu Asn Gln Thr Thr Gly Lys Gly Lys Asn Asn Ser Arg Pro Arg Tyr
770 775 780
Lys Ser Leu Glu Lys Ala Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys
785 790 795 800
Glu His Pro Thr Asp Asn Gln Glu Leu Arg Asn Asn Arg Leu Tyr Leu
805 810 815
Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Gln Asp Leu Asp
820 825 830
Ile His Asn Leu Ser Asn Tyr Asp Ile Asp His Ile Val Pro Gln Ser
835 840 845
Phe Ile Thr Asp Asn Ser Ile Asp Asn Leu Val Leu Thr Ser Ser Ala
850 855 860
Gly Asn Arg Glu Lys Gly Asp Asp Val Pro Pro Leu Glu Ile Val Arg
865 870 875 880
Lys Arg Lys Val Phe Trp Glu Lys Leu Tyr Gln Gly Asn Leu Met Ser
885 890 895
Lys Arg Lys Phe Asp Tyr Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr
900 905 910
Glu Ala Asp Lys Ala Arg Phe Ile His Arg Gln Leu Val Glu Thr Arg
915 920 925
Gln Ile Thr Lys Asn Val Ala Asn Ile Leu His Gln Arg Phe Asn Tyr
930 935 940
Glu Lys Asp Asp His Gly Asn Thr Met Lys Gln Val Arg Ile Val Thr
945 950 955 960
Leu Lys Ser Ala Leu Val Ser Gln Phe Arg Lys Gln Phe Gln Leu Tyr
965 970 975
Lys Val Arg Asp Val Asn Asp Tyr His His Ala His Asp Ala Tyr Leu
980 985 990
Asn Gly Val Val Ala Asn Thr Leu Leu Lys Val Tyr Pro Gln Leu Glu
995 1000 1005
Pro Glu Phe Val Tyr Gly Asp Tyr His Gln Phe Asp Trp Phe Lys
1010 1015 1020
Ala Asn Lys Ala Thr Ala Lys Lys Gln Phe Tyr Thr Asn Ile Met
1025 1030 1035
Leu Phe Phe Ala Gln Lys Asp Arg Ile Ile Asp Glu Asn Gly Glu
1040 1045 1050
Ile Leu Trp Asp Lys Lys Tyr Leu Asp Thr Val Lys Lys Val Met
1055 1060 1065
Ser Tyr Arg Gln Met Asn Ile Val Lys Lys Thr Glu Ile Gln Lys
1070 1075 1080
Gly Glu Phe Ser Lys Ala Thr Ile Lys Pro Lys Gly Asn Ser Ser
1085 1090 1095
Lys Leu Ile Pro Arg Lys Thr Asn Trp Asp Pro Met Lys Tyr Gly
1100 1105 1110
Gly Leu Asp Ser Pro Asn Met Ala Tyr Ala Val Val Ile Glu Tyr
1115 1120 1125
Ala Lys Gly Lys Asn Lys Leu Val Phe Glu Lys Lys Ile Ile Arg
1130 1135 1140
Val Thr Ile Met Glu Arg Lys Ala Phe Glu Lys Asp Glu Lys Ala
1145 1150 1155
Phe Leu Glu Glu Gln Gly Tyr Arg Gln Pro Lys Val Leu Ala Lys
1160 1165 1170
Leu Pro Lys Tyr Thr Leu Tyr Glu Cys Glu Glu Gly Arg Arg Arg
1175 1180 1185
Met Leu Ala Ser Ala Asn Glu Ala Gln Lys Gly Asn Gln Gln Val
1190 1195 1200
Leu Pro Asn His Leu Val Thr Leu Leu His His Ala Ala Asn Cys
1205 1210 1215
Glu Val Ser Asp Gly Lys Ser Leu Asp Tyr Ile Glu Ser Asn Arg
1220 1225 1230
Glu Met Phe Ala Glu Leu Leu Ala His Val Ser Glu Phe Ala Lys
1235 1240 1245
Arg Tyr Thr Leu Ala Glu Ala Asn Leu Asn Lys Ile Asn Gln Leu
1250 1255 1260
Phe Glu Gln Asn Lys Glu Gly Asp Ile Lys Ala Ile Ala Gln Ser
1265 1270 1275
Phe Val Asp Leu Met Ala Phe Asn Ala Met Gly Ala Pro Ala Ser
1280 1285 1290
Phe Lys Phe Phe Glu Thr Thr Ile Glu Arg Lys Arg Tyr Asn Asn
1295 1300 1305
Leu Lys Glu Leu Leu Asn Ser Thr Ile Ile Tyr Gln Ser Ile Thr
1310 1315 1320
Gly Leu Tyr Glu Ser Arg Lys Arg Leu Asp Asp
1325 1330
<210> 6
<211> 1053
<212> PRT
<213> 金黄色葡萄球菌
<400> 6
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 7
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 7
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 8
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 8
atgaagcgga actacatcct gggcctggac atcggcatca ccagcgtggg ctacggcatc 60
atcgactacg agacacggga cgtgatcgat gccggcgtgc ggctgttcaa agaggccaac 120
gtggaaaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa gcggcggagg 180
cggcatagaa tccagagagt gaagaagctg ctgttcgact acaacctgct gaccgaccac 240
agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag ccagaagctg 300
agcgaggaag agttctctgc cgccctgctg cacctggcca agagaagagg cgtgcacaac 360
gtgaacgagg tggaagagga caccggcaac gagctgtcca ccaaagagca gatcagccgg 420
aacagcaagg ccctggaaga gaaatacgtg gccgaactgc agctggaacg gctgaagaaa 480
gacggcgaag tgcggggcag catcaacaga ttcaagacca gcgactacgt gaaagaagcc 540
aaacagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc 600
tacatcgacc tgctggaaac ccggcggacc tactatgagg gacctggcga gggcagcccc 660
ttcggctgga aggacatcaa agaatggtac gagatgctga tgggccactg cacctacttc 720
cccgaggaac tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa cgccctgaac 780
gacctgaaca atctcgtgat caccagggac gagaacgaga agctggaata ttacgagaag 840
ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgcc 900
aaagaaatcc tcgtgaacga agaggatatt aagggctaca gagtgaccag caccggcaag 960
cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acattaccgc ccggaaagag 1020
attattgaga acgccgagct gctggatcag attgccaaga tcctgaccat ctaccagagc 1080
agcgaggaca tccaggaaga actgaccaat ctgaactccg agctgaccca ggaagagatc 1140
gagcagatct ctaatctgaa gggctatacc ggcacccaca acctgagcct gaaggccatc 1200
aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgctat cttcaaccgg 1260
ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aagagatccc caccaccctg 1320
gtggacgact tcatcctgag ccccgtcgtg aagagaagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcattatcga gctggcccgc 1440
gagaagaact ccaaggacgc ccagaaaatg atcaacgaga tgcagaagcg gaaccggcag 1500
accaacgagc ggatcgagga aatcatccgg accaccggca aagagaacgc caagtacctg 1560
atcgagaaga tcaagctgca cgacatgcag gaaggcaagt gcctgtacag cctggaagcc 1620
atccctctgg aagatctgct gaacaacccc ttcaactatg aggtggacca catcatcccc 1680
agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tcgtgaagca ggaagaaaac 1740
agcaagaagg gcaaccggac cccattccag tacctgagca gcagcgacag caagatcagc 1800
tacgaaacct tcaagaagca catcctgaat ctggccaagg gcaagggcag aatcagcaag 1860
accaagaaag agtatctgct ggaagaacgg gacatcaaca ggttctccgt gcagaaagac 1920
ttcatcaacc ggaacctggt ggataccaga tacgccacca gaggcctgat gaacctgctg 1980
cggagctact tcagagtgaa caacctggac gtgaaagtga agtccatcaa tggcggcttc 2040
accagctttc tgcggcggaa gtggaagttt aagaaagagc ggaacaaggg gtacaagcac 2100
cacgccgagg acgccctgat cattgccaac gccgatttca tcttcaaaga gtggaagaaa 2160
ctggacaagg ccaaaaaagt gatggaaaac cagatgttcg aggaaaagca ggccgagagc 2220
atgcccgaga tcgaaaccga gcaggagtac aaagagatct tcatcacccc ccaccagatc 2280
aagcacatta aggacttcaa ggactacaag tacagccacc gggtggacaa gaagcctaat 2340
agagagctga ttaacgacac cctgtactcc acccggaagg acgacaaggg caacaccctg 2400
atcgtgaaca atctgaacgg cctgtacgac aaggacaatg acaagctgaa aaagctgatc 2460
aacaagagcc ccgaaaagct gctgatgtac caccacgacc cccagaccta ccagaaactg 2520
aagctgatta tggaacagta cggcgacgag aagaatcccc tgtacaagta ctacgaggaa 2580
accgggaact acctgaccaa gtactccaaa aaggacaacg gccccgtgat caagaagatt 2640
aagtattacg gcaacaaact gaacgcccat ctggacatca ccgacgacta ccccaacagc 2700
agaaacaagg tcgtgaagct gtccctgaag ccctacagat tcgacgtgta cctggacaat 2760
ggcgtgtaca agttcgtgac cgtgaagaat ctggatgtga tcaaaaaaga aaactactac 2820
gaagtgaata gcaagtgcta tgaggaagct aagaagctga agaagatcag caaccaggcc 2880
gagtttatcg cctccttcta caacaacgat ctgatcaaga tcaacggcga gctgtataga 2940
gtgatcggcg tgaacaacga cctgctgaac cggatcgaag tgaacatgat cgacatcacc 3000
taccgcgagt acctggaaaa catgaacgac aagaggcccc ccaggatcat taagacaatc 3060
gcctccaaga cccagagcat taagaagtac agcacagaca ttctgggcaa cctgtatgaa 3120
gtgaaatcta agaagcaccc tcagatcatc aaaaagggc 3159
<210> 9
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 9
atgaagcgca actacatcct cggactggac atcggcatta cctccgtggg atacggcatc 60
atcgattacg aaactaggga tgtgatcgac gctggagtca ggctgttcaa agaggcgaac 120
gtggagaaca acgaggggcg gcgctcaaag aggggggccc gccggctgaa gcgccgccgc 180
agacatagaa tccagcgcgt gaagaagctg ctgttcgact acaaccttct gaccgaccac 240
tccgaacttt ccggcatcaa cccatatgag gctagagtga agggattgtc ccaaaagctg 300
tccgaggaag agttctccgc cgcgttgctc cacctcgcca agcgcagggg agtgcacaat 360
gtgaacgaag tggaagaaga taccggaaac gagctgtcca ccaaggagca gatcagccgg 420
aactccaagg ccctggaaga gaaatacgtg gcggaactgc aactggagcg gctgaagaaa 480
gacggagaag tgcgcggctc gatcaaccgc ttcaagacct cggactacgt gaaggaggcc 540
aagcagctcc tgaaagtgca aaaggcctat caccaacttg accagtcctt tatcgatacc 600
tacatcgatc tgctcgagac tcggcggact tactacgagg gtccagggga gggctcccca 660
tttggttgga aggatattaa ggagtggtac gaaatgctga tgggacactg cacatacttc 720
cctgaggagc tgcggagcgt gaaatacgca tacaacgcag acctgtacaa cgcgctgaac 780
gacctgaaca atctcgtgat cacccgggac gagaacgaaa agctcgagta ttacgaaaag 840
ttccagatta ttgagaacgt gttcaaacag aagaagaagc cgacactgaa gcagattgcc 900
aaggaaatcc tcgtgaacga agaggacatc aagggctatc gagtgacctc aacgggaaag 960
ccggagttca ccaatctgaa ggtctaccac gacatcaaag acattaccgc ccggaaggag 1020
atcattgaga acgcggagct gttggaccag attgcgaaga ttctgaccat ctaccaatcc 1080
tccgaggata ttcaggaaga actcaccaac ctcaacagcg aactgaccca ggaggagata 1140
gagcaaatct ccaacctgaa gggctacacc ggaactcata acctgagcct gaaggccatc 1200
aacttgatcc tggacgagct gtggcacacc aacgataacc agatcgctat tttcaatcgg 1260
ctgaagctgg tccccaagaa agtggacctc tcacaacaaa aggagatccc tactaccctt 1320
gtggacgatt tcattctgtc ccccgtggtc aagagaagct tcatacagtc aatcaaagtg 1380
atcaatgcca ttatcaagaa atacggtctg cccaacgaca ttatcattga gctcgcccgc 1440
gagaagaact cgaaggacgc ccagaagatg attaacgaaa tgcagaagag gaaccgacag 1500
actaacgaac ggatcgaaga aatcatccgg accaccggga aggaaaacgc gaagtacctg 1560
atcgaaaaga tcaagctcca tgacatgcag gaaggaaagt gtctgtactc gctggaggcc 1620
attccgctgg aggacttgct gaacaaccct tttaactacg aagtggatca tatcattccg 1680
aggagcgtgt cattcgacaa ttccttcaac aacaaggtcc tcgtgaagca ggaggaaaac 1740
tcgaagaagg gaaaccgcac gccgttccag tacctgagca gcagcgactc caagatttcc 1800
tacgaaacct tcaagaagca catcctcaac ctggcaaagg ggaagggtcg catctccaag 1860
accaagaagg aatatctgct ggaagaaaga gacatcaaca gattctccgt gcaaaaggac 1920
ttcatcaacc gcaacctcgt ggatactaga tacgctactc ggggtctgat gaacctcctg 1980
agaagctact ttagagtgaa caatctggac gtgaaggtca agtcgattaa cggaggtttc 2040
acctccttcc tgcggcgcaa gtggaagttc aagaaggaac ggaacaaggg ctacaagcac 2100
cacgccgagg acgccctgat cattgccaac gccgacttca tcttcaaaga atggaagaaa 2160
cttgacaagg ctaagaaggt catggaaaac cagatgttcg aagaaaagca ggccgagtct 2220
atgcctgaaa tcgagactga acaggagtac aaggaaatct ttattacgcc acaccagatc 2280
aaacacatca aggatttcaa ggattacaag tactcacatc gcgtggacaa aaagccgaac 2340
agggaactga tcaacgacac cctctactcc acccggaagg atgacaaagg gaataccctc 2400
atcgtcaaca accttaacgg cctgtacgac aaggacaacg ataagctgaa gaagctcatt 2460
aacaagtcgc ccgaaaagtt gctgatgtac caccacgacc ctcagactta ccagaagctc 2520
aagctgatca tggagcagta tggggacgag aaaaacccgt tgtacaagta ctacgaagaa 2580
actgggaatt atctgactaa gtactccaag aaagataacg gccccgtgat taagaagatt 2640
aagtactacg gcaacaagct gaacgcccat ctggacatca ccgatgacta ccctaattcc 2700
cgcaacaagg tcgtcaagct gagcctcaag ccctaccggt ttgatgtgta ccttgacaat 2760
ggagtgtaca agttcgtgac tgtgaagaac cttgacgtga tcaagaagga gaactactac 2820
gaagtcaact ccaagtgcta cgaggaagca aagaagttga agaagatctc gaaccaggcc 2880
gagttcattg cctccttcta taacaacgac ctgattaaga tcaacggcga actgtaccgc 2940
gtcattggcg tgaacaacga tctcctgaac cgcatcgaag tgaacatgat cgacatcact 3000
taccgggaat acctggagaa tatgaacgac aagcgcccgc cccggatcat taagactatc 3060
gcctcaaaga cccagtcgat caagaagtac agcaccgaca tcctgggcaa cctgtacgag 3120
gtcaaatcga agaagcaccc ccagatcatc aagaaggga 3159
<210> 10
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 10
atgaaaagga actacattct ggggctggcc atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 11
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 11
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagaggcc 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 12
<211> 1082
<212> PRT
<213> 脑膜炎奈瑟氏菌
<400> 12
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp
20 25 30
Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080
<210> 13
<211> 3249
<212> DNA
<213> 脑膜炎奈瑟氏菌
<220>
<221> 尚未归类的特征
<222> (1)..(3249)
<223> 示例性密码子优化的Cas9
<400> 13
atggccgcct tcaagcccaa ccccatcaac tacatcctgg gcctggacat cggcatcgcc 60
agcgtgggct gggccatggt ggagatcgac gaggacgaga accccatctg cctgatcgac 120
ctgggtgtgc gcgtgttcga gcgcgctgag gtgcccaaga ctggtgacag tctggctatg 180
gctcgccggc ttgctcgctc tgttcggcgc cttactcgcc ggcgcgctca ccgccttctg 240
cgcgctcgcc gcctgctgaa gcgcgagggt gtgctgcagg ctgccgactt cgacgagaac 300
ggcctgatca agagcctgcc caacactcct tggcagctgc gcgctgccgc tctggaccgc 360
aagctgactc ctctggagtg gagcgccgtg ctgctgcacc tgatcaagca ccgcggctac 420
ctgagccagc gcaagaacga gggcgagacc gccgacaagg agctgggtgc tctgctgaag 480
ggcgtggccg acaacgccca cgccctgcag actggtgact tccgcactcc tgctgagctg 540
gccctgaaca agttcgagaa ggagagcggc cacatccgca accagcgcgg cgactacagc 600
cacaccttca gccgcaagga cctgcaggcc gagctgatcc tgctgttcga gaagcagaag 660
gagttcggca acccccacgt gagcggcggc ctgaaggagg gcatcgagac cctgctgatg 720
acccagcgcc ccgccctgag cggcgacgcc gtgcagaaga tgctgggcca ctgcaccttc 780
gagccagccg agcccaaggc cgccaagaac acctacaccg ccgagcgctt catctggctg 840
accaagctga acaacctgcg catcctggag cagggcagcg agcgccccct gaccgacacc 900
gagcgcgcca ccctgatgga cgagccctac cgcaagagca agctgaccta cgcccaggcc 960
cgcaagctgc tgggtctgga ggacaccgcc ttcttcaagg gcctgcgcta cggcaaggac 1020
aacgccgagg ccagcaccct gatggagatg aaggcctacc acgccatcag ccgcgccctg 1080
gagaaggagg gcctgaagga caagaagagt cctctgaacc tgagccccga gctgcaggac 1140
gagatcggca ccgccttcag cctgttcaag accgacgagg acatcaccgg ccgcctgaag 1200
gaccgcatcc agcccgagat cctggaggcc ctgctgaagc acatcagctt cgacaagttc 1260
gtgcagatca gcctgaaggc cctgcgccgc atcgtgcccc tgatggagca gggcaagcgc 1320
tacgacgagg cctgcgccga gatctacggc gaccactacg gcaagaagaa caccgaggag 1380
aagatctacc tgcctcctat ccccgccgac gagatccgca accccgtggt gctgcgcgcc 1440
ctgagccagg cccgcaaggt gatcaacggc gtggtgcgcc gctacggcag ccccgcccgc 1500
atccacatcg agaccgcccg cgaggtgggc aagagcttca aggaccgcaa ggagatcgag 1560
aagcgccagg aggagaaccg caaggaccgc gagaaggccg ccgccaagtt ccgcgagtac 1620
ttccccaact tcgtgggcga gcccaagagc aaggacatcc tgaagctgcg cctgtacgag 1680
cagcagcacg gcaagtgcct gtacagcggc aaggagatca acctgggccg cctgaacgag 1740
aagggctacg tggagatcga ccacgccctg cccttcagcc gcacctggga cgacagcttc 1800
aacaacaagg tgctggtgct gggcagcgag aaccagaaca agggcaacca gaccccctac 1860
gagtacttca acggcaagga caacagccgc gagtggcagg agttcaaggc ccgcgtggag 1920
accagccgct tcccccgcag caagaagcag cgcatcctgc tgcagaagtt cgacgaggac 1980
ggcttcaagg agcgcaacct gaacgacacc cgctacgtga accgcttcct gtgccagttc 2040
gtggccgacc gcatgcgcct gaccggcaag ggcaagaagc gcgtgttcgc cagcaacggc 2100
cagatcacca acctgctgcg cggcttctgg ggcctgcgca aggtgcgcgc cgagaacgac 2160
cgccaccacg ccctggacgc cgtggtggtg gcctgcagca ccgtggccat gcagcagaag 2220
atcacccgct tcgtgcgcta caaggagatg aacgccttcg acggtaaaac catcgacaag 2280
gagaccggcg aggtgctgca ccagaagacc cacttccccc agccctggga gttcttcgcc 2340
caggaggtga tgatccgcgt gttcggcaag cccgacggca agcccgagtt cgaggaggcc 2400
gacacccccg agaagctgcg caccctgctg gccgagaagc tgagcagccg ccctgaggcc 2460
gtgcacgagt acgtgactcc tctgttcgtg agccgcgccc ccaaccgcaa gatgagcggt 2520
cagggtcaca tggagaccgt gaagagcgcc aagcgcctgg acgagggcgt gagcgtgctg 2580
cgcgtgcccc tgacccagct gaagctgaag gacctggaga agatggtgaa ccgcgagcgc 2640
gagcccaagc tgtacgaggc cctgaaggcc cgcctggagg cccacaagga cgaccccgcc 2700
aaggccttcg ccgagccctt ctacaagtac gacaaggccg gcaaccgcac ccagcaggtg 2760
aaggccgtgc gcgtggagca ggtgcagaag accggcgtgt gggtgcgcaa ccacaacggc 2820
atcgccgaca acgccaccat ggtgcgcgtg gacgtgttcg agaagggcga caagtactac 2880
ctggtgccca tctacagctg gcaggtggcc aagggcatcc tgcccgaccg cgccgtggtg 2940
cagggcaagg acgaggagga ctggcagctg atcgacgaca gcttcaactt caagttcagc 3000
ctgcacccca acgacctggt ggaggtgatc accaagaagg cccgcatgtt cggctacttc 3060
gccagctgcc accgcggcac cggcaacatc aacatccgca tccacgacct ggaccacaag 3120
atcggcaaga acggcatcct ggagggcatc ggcgtgaaga ccgccctgag cttccagaag 3180
taccagatcg acgagctggg caaggagatc cgcccctgcc gcctgaagaa gcgccctcct 3240
gtgcgctaa 3249
<210> 14
<211> 859
<212> PRT
<213> 人工序列
<220>
<223> 衍生自Sm、Sp、St、和Li的合成Cas9共有序列
Cas9序列
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (8)..(18)
<223> N端 RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (23)..(23)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (24)..(24)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (26)..(26)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (29)..(31)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (33)..(33)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (36)..(36)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (45)..(45)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (54)..(54)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (63)..(63)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (71)..(71)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (75)..(75)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (76)..(76)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (78)..(80)
<223> 每个 Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (82)..(82)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (84)..(84)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (85)..(85)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (89)..(89)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (90)..(90)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (98)..(98)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (100)..(100)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (106)..(106)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (113)..(113)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (116)..(116)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (125)..(125)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (126)..(126)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (128)..(133)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (135)..(135)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (137)..(137)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (139)..(147)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (153)..(155)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (157)..(157)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (159)..(159)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (161)..(161)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (163)..(163)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (166)..(168)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (170)..(170)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (171)..(171)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (173)..(175)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (177)..(177)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (183)..(183)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (185)..(187)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (189)..(189)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (192)..(195)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (198)..(198)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (199)..(199)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (202)..(202)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (206)..(206)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (207)..(207)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (210)..(210)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (212)..(212)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (213)..(213)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (219)..(219)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (220)..(220)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (222)..(222)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (224)..(224)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (226)..(226)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (236)..(236)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (240)..(240)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (241)..(241)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (244)..(246)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (248)..(248)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (249)..(249)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (250)..(250)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (252)..(254)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (256)..(256)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (257)..(257)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (268)..(268)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (271)..(271)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (273)..(273)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (277)..(277)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (280)..(280)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (281)..(281)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (283)..(283)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (289)..(289)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (290)..(290)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (292)..(294)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (301)..(301)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (308)..(308)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (319)..(322)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (328)..(328)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (329)..(329)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (335)..(337)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (346)..(346)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (347)..(347)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (356)..(361)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (363)..(363)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (370)..(373)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (375)..(375)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (376)..(376)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (379)..(379)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (386)..(390)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (393)..(393)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (395)..(395)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (396)..(396)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (398)..(398)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (400)..(400)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (403)..(403)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (407)..(407)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (410)..(410)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (411)..(411)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (413)..(416)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (418)..(418)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (422)..(422)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (428)..(428)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (431)..(431)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (433)..(433)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (437)..(439)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (445)..(445)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (451)..(451)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (456)..(456)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (459)..(459)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (465)..(469)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (481)..(481)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (482)..(482)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (484)..(484)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (490)..(490)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (494)..(494)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (495)..(502)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (497)..(497)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (506)..(506)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (510)..(510)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (513)..(513)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (514)..(514)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (517)..(517)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (520)..(520)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (525)..(525)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (526)..(526)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (529)..(529)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (531)..(531)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (532)..(532)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (534)..(534)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (542)..(542)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (546)..(546)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (547)..(547)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (553)..(553)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (555)..(575)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (556)..(556)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (560)..(560)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (563)..(563)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (565)..(565)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (567)..(567)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (579)..(579)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (582)..(582)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (583)..(583)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (585)..(585)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (588)..(588)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (590)..(590)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (592)..(592)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (594)..(596)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (610)..(610)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (616)..(616)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (628)..(628)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (631)..(631)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (633)..(633)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (634)..(634)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (636)..(636)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (638)..(641)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (643)..(645)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (653)..(653)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (657)..(657)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (659)..(659)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (660)..(660)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (665)..(665)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (666)..(666)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (668)..(668)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (669)..(669)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (670)..(677)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (680)..(680)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (681)..(681)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (683)..(683)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (686)..(686)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (696)..(696)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (697)..(697)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (704)..(704)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (708)..(708)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (710)..(710)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (711)..(711)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (714)..(714)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (717)..(720)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (722)..(722)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (725)..(725)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (727)..(727)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (733)..(735)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (740)..(740)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (742)..(742)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (749)..(754)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (758)..(761)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (763)..(768)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (771)..(771)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (774)..(777)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (782)..(782)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (784)..(786)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (788)..(788)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (790)..(790)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (795)..(795)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (799)..(799)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (801)..(801)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (802)..(802)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (804)..(804)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (806)..(813)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (815)..(818)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (820)..(820)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (823)..(827)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (829)..(829)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (830)..(830)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (832)..(832)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (835)..(837)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (842)..(844)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (846)..(846)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (848)..(848)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (851)..(851)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (857)..(857)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (857)..(857)
<223> Xaa可以是任何天然存在的氨基酸
<400> 14
Met Lys Tyr Xaa Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp
1 5 10 15
Ala Val Thr Asp Xaa Tyr Xaa Xaa Lys Xaa Lys Gly Xaa Xaa Xaa Ile
20 25 30
Xaa Lys Asn Xaa Gly Leu Phe Asp Gly Thr Ala Arg Xaa Arg Thr Ala
35 40 45
Arg Arg Arg Arg Arg Xaa Asn Arg Ile Tyr Leu Gln Ile Phe Xaa Glu
50 55 60
Met Asp Phe Phe Arg Leu Xaa Ser Phe Val Xaa Xaa Lys Xaa Xaa Xaa
65 70 75 80
Pro Xaa Phe Xaa Xaa Glu Tyr His Xaa Xaa Pro Thr Ile Tyr His Leu
85 90 95
Arg Xaa Leu Xaa Lys Asp Leu Arg Leu Xaa Tyr Leu Ala Leu Ala His
100 105 110
Xaa Ile Lys Xaa Arg Gly Asn Phe Leu Ile Glu Gly Xaa Xaa Asn Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Tyr Xaa Phe Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Pro Glu Lys Gly Phe Xaa Xaa Xaa Leu Xaa Gly Xaa Phe
145 150 155 160
Xaa Phe Xaa Leu Glu Xaa Xaa Xaa Lys Xaa Xaa Tyr Xaa Xaa Xaa Leu
165 170 175
Xaa Leu Leu Ile Gly Asp Xaa Tyr Xaa Xaa Xaa Phe Xaa Ala Lys Xaa
180 185 190
Xaa Xaa Xaa Leu Ser Xaa Xaa Val Thr Xaa Ala Leu Ser Xaa Xaa Met
195 200 205
Ile Xaa Arg Xaa Xaa His Asp Leu Leu Lys Xaa Xaa Tyr Xaa Glu Xaa
210 215 220
Phe Xaa Lys Gly Tyr Ala Gly Tyr Ile Asp Gly Xaa Gln Phe Tyr Xaa
225 230 235 240
Xaa Lys Leu Xaa Xaa Xaa Gly Xaa Xaa Xaa Lys Xaa Xaa Xaa Glu Xaa
245 250 255
Xaa Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Xaa Ile Pro Xaa Gln
260 265 270
Xaa His Leu Glu Xaa Ala Ile Xaa Xaa Gln Xaa Tyr Pro Phe Leu Asn
275 280 285
Xaa Xaa Ile Xaa Xaa Xaa Thr Phe Arg Ile Pro Tyr Xaa Val Gly Pro
290 295 300
Leu Ala Gly Xaa Ser Phe Ala Trp Arg Lys Ile Pro Trp Asn Xaa Xaa
305 310 315 320
Xaa Xaa Asp Ser Ala Phe Ile Xaa Xaa Met Thr Asp Leu Pro Xaa Xaa
325 330 335
Xaa Val Leu Pro Lys His Ser Leu Tyr Xaa Xaa Val Tyr Asn Glu Leu
340 345 350
Thr Lys Val Xaa Xaa Xaa Xaa Xaa Xaa Lys Xaa Ile Phe Lys Arg Lys
355 360 365
Val Xaa Xaa Xaa Xaa Gly Xaa Xaa Phe Asn Xaa Ser Thr Tyr His Asp
370 375 380
Leu Xaa Xaa Xaa Xaa Xaa Leu Asp Xaa Asn Xaa Xaa Glu Xaa Ile Xaa
385 390 395 400
Leu Thr Xaa Phe Glu Asp Xaa Met Ile Xaa Xaa Leu Xaa Xaa Xaa Xaa
405 410 415
Lys Xaa Leu Arg Arg Xaa Tyr Thr Gly Trp Gly Xaa Leu Ser Xaa Leu
420 425 430
Xaa Gly Ile Arg Xaa Xaa Xaa Ser Thr Ile Leu Asp Xaa Leu Asp Asn
435 440 445
Arg Asn Xaa Met Gln Leu Ile Xaa Asp Leu Xaa Phe Lys Ile Lys Gln
450 455 460
Xaa Xaa Xaa Xaa Xaa Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
465 470 475 480
Xaa Xaa Lys Xaa Val Asp Glu Leu Val Xaa Met Gly Pro Xaa Ile Val
485 490 495
Xaa Glu Met Ala Arg Glu Asn Gln Thr Xaa Gly Asn Ser Xaa Arg Lys
500 505 510
Xaa Xaa Lys Glu Xaa Gly Ser Xaa Ile Leu Lys Glu Xaa Xaa Asn Leu
515 520 525
Xaa Asn Xaa Xaa Leu Xaa Leu Tyr Tyr Leu Gln Asn Gly Xaa Asp Met
530 535 540
Tyr Xaa Xaa Leu Asp Ile Leu Ser Xaa Tyr Asp Xaa Asp His Ile Xaa
545 550 555 560
Pro Gln Xaa Phe Xaa Asp Xaa Ser Ile Asp Asn Val Leu Ser Asn Arg
565 570 575
Lys Asp Xaa Val Pro Xaa Xaa Val Xaa Lys Lys Xaa Trp Xaa Leu Xaa
580 585 590
Leu Xaa Xaa Xaa Arg Lys Phe Asp Leu Thr Lys Ala Glu Arg Gly Gly
595 600 605
Leu Xaa Asp Lys Ala Phe Ile Xaa Arg Gln Leu Val Glu Thr Arg Gln
610 615 620
Ile Thr Lys Xaa Val Ala Xaa Leu Xaa Xaa Asn Xaa Asp Xaa Xaa Xaa
625 630 635 640
Xaa Val Xaa Xaa Xaa Thr Leu Lys Ser Leu Val Ser Xaa Phe Arg Lys
645 650 655
Xaa Phe Xaa Xaa Leu Tyr Lys Val Xaa Xaa Asn Xaa Xaa His His Ala
660 665 670
His Asp Ala Tyr Leu Asn Val Xaa Xaa Leu Xaa Tyr Pro Xaa Leu Glu
675 680 685
Glu Phe Val Tyr Gly Asp Tyr Xaa Xaa Lys Ala Thr Lys Phe Tyr Xaa
690 695 700
Asn Ile Met Xaa Phe Xaa Xaa Gly Glu Xaa Trp Lys Xaa Xaa Xaa Xaa
705 710 715 720
Val Xaa Met Gln Xaa Asn Xaa Val Lys Lys Glu Gln Xaa Xaa Xaa Pro
725 730 735
Lys Asn Ser Xaa Leu Xaa Lys Asp Lys Tyr Gly Gly Xaa Xaa Xaa Xaa
740 745 750
Xaa Xaa Lys Gly Lys Xaa Xaa Xaa Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa
755 760 765
Phe Leu Xaa Gly Tyr Xaa Xaa Xaa Xaa Leu Pro Lys Tyr Xaa Leu Xaa
770 775 780
Xaa Xaa Gly Xaa Arg Xaa Leu Ala Ser Glu Xaa Lys Gly Asn Xaa Leu
785 790 795 800
Xaa Xaa Leu Xaa Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Xaa Xaa
805 810 815
Xaa Xaa Phe Xaa Ala Asn Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Gly Xaa
820 825 830
Ala Phe Xaa Xaa Xaa Ile Arg Arg Tyr Xaa Xaa Xaa Thr Xaa Ile Xaa
835 840 845
Gln Ser Xaa Thr Gly Leu Tyr Glu Xaa Arg Leu
850 855
<210> 15
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> RuvC样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Val或His
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Ile、Leu、或Val
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Met或Thr
<400> 15
Ile Xaa Xaa Glu Xaa Ala Arg Glu
1 5
<210> 16
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> RuvC样结构域
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Ile、Leu、或Val
<400> 16
Ile Val Xaa Glu Met Ala Arg Glu
1 5
<210> 17
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> RuvC样结构域
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是His或Leu
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa是Arg或Val
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Glu或Val
<400> 17
His His Ala Xaa Asp Ala Xaa Xaa
1 5
<210> 18
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> RuvC样结构域
<400> 18
His His Ala His Asp Ala Tyr Leu
1 5
<210> 19
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> N端RuvC样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Lys或Pro
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是Val、Leu、Ile、或Phe
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Gly、Ala、或Ser
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Leu、Ile、Val、或Phe
<220>
<221> 模块化残基
<222> (7)..(26)
<223> N端RuvC样结构域,每个Xaa可以是任何氨基酸或不存在的
,区域可涵盖5-20个残基
<220>
<221> 变体
<222> (29)..(29)
<223> Xaa是Asp、Glu、Asn、或Gln
<400> 19
Lys Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Asp Xaa Tyr
20 25 30
<210> 20
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> N端RuvC样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Ile、Val、Met、Leu、或Thr
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是Thr、Ile、 Val、Ser、Asn、Tyr、Glu、或Leu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Asn、Ser、Gly、Ala、Asp、Thr、Arg、Met、或Phe
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Ser、Tyr、Asn、或Phe
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa是Val、Ile、Leu、Cys、Thr、或Phe
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa是Trp、Phe、Val、Tyr、Ser、或Leu
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Ala、Ser、Cys、Val、或Gly
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Val、Ile、Leu、Ala、Met、或His
<220>
<221> 变体
<222> (12)..(12)
<223> 任何氨基酸或不存在的
<400> 20
Asp Xaa Gly Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
1 5 10
<210> 21
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> N端RuvC样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Ile、Val、Met、Leu、或Thr
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是Thr、Ile、Val、Ser、Asn、Tyr、Glu、或Leu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Asn、Ser、Gly、Ala、Asp、Thr、Arg、Met、或Phe
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa是Val、Ile、Leu、Cys、Thr、或Phe
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa是Trp、Phe、Val、Tyr、Ser、或Leu
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Ala、Ser、Cys、Val、或Gly
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Val、Ile、Leu、Ala、Met、或His
<220>
<221> 变体
<222> (12)..(12)
<223> 任何氨基酸或不存在的
<400> 21
Asp Xaa Gly Xaa Xaa Ser Xaa Gly Xaa Xaa Xaa Xaa
1 5 10
<210> 22
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> N端RuvC样结构域
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是Thr、Ile、Val、Ser、Asn、Tyr、Glu、或Leu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Asn、Ser、Gly、Ala、Asp、Thr、Arg、Met、或Phe
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Val、Ile、Leu、Ala、Met、或His
<220>
<221> 变体
<222> (12)..(12)
<223> 任何氨基酸或不存在的
<400> 22
Asp Ile Gly Xaa Xaa Ser Val Gly Trp Ala Xaa Xaa
1 5 10
<210> 23
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> N端RuvC样结构域
<220>
<221> 模块化残基
<222> (12)..(12)
<223> 任何非极性烷基氨基酸或羟基氨基酸
<400> 23
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Xaa
1 5 10
<210> 24
<211> 73
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Lys或Arg
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Val或Thr
<220>
<221> 变体
<222> (13)..(13)
<223> Xaa是Gly或Asp
<220>
<221> 变体
<222> (14)..(14)
<223> Xaa是Glu、Gln、或Asp
<220>
<221> 变体
<222> (15)..(15)
<223> Xaa是Glu或Asp
<220>
<221> 变体
<222> (19)..(19)
<223> Xaa是Asp、Asn、或His
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa是Tyr、Arg、或Asn
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Gln、Asp、或Asn
<220>
<221> 模块化残基
<222> (25)..(64)
<223> HNH样结构域,每个Xaa可以是任何氨基酸或不存在的,区域
可涵盖15-40个残基
<220>
<221> 变体
<222> (67)..(67)
<223> Xaa是Gly或Glu
<220>
<221> 变体
<222> (69)..(69)
<223> Xaa是Ser或Gly
<220>
<221> 变体
<222> (71)..(71)
<223> Xaa是Asp或Asn
<400> 24
Leu Tyr Tyr Leu Gln Asn Gly Xaa Asp Met Tyr Xaa Xaa Xaa Xaa Leu
1 5 10 15
Asp Ile Xaa Xaa Leu Ser Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Asn Arg Xaa Lys Xaa Asp Xaa Val Pro
65 70
<210> 25
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa是Asp、Glu、Gln、或Asn
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Leu、Ile、Arg、Gln、Val、Met、或Lys
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Ile、Val、Thr、Ala、或Leu
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Val、Tyr、Ile、Leu、Phe、或Trp
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Gln、His、Arg、Lys、Tyr、Ile、Leu、Phe、或Trp
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa是Ser、Ala、Asp、Thr、或Lys
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Phe、Leu、Val、Lys、Tyr、Met、Ile、Arg、Ala、Glu、Asp、或
Gln
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Leu、Arg、Thr、Ile、Val、Ser、Cys、Tyr、Lys、Phe、或Gly
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Lys、Gln、Tyr、Thr、Phe、Leu、Trp、Met、Ala、Glu、Gly、或
Ser
<220>
<221> 变体
<222> (13)..(13)
<223> Xaa是Asp、Ser、Asn、Arg、Leu、或Thr
<220>
<221> 变体
<222> (14)..(14)
<223> Xaa是Asp、Asn、或Ser
<220>
<221> 变体
<222> (15)..(15)
<223> Xaa是Ser、Ala、Thr、Gly、或Arg
<220>
<221> 变体
<222> (16)..(16)
<223> Xaa是Ile、Leu、Phe、Ser、Arg、Tyr、Gln、Trp、Asp、Lys、或His
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa是Asp、Ser、Ile、Asn、Glu、Ala、His、Phe、Leu、Gln、Met、
Gly、Tyr、或Val
<220>
<221> 变体
<222> (19)..(19)
<223> Xaa是Lys、Leu、Arg、Met、Thr、或Phe
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa是Val、Leu、Ile、Ala、或Thr
<220>
<221> 变体
<222> (21)..(21)
<223> Xaa是Leu、Ile、Val、或Ala
<220>
<221> 变体
<222> (22)..(22)
<223> Xaa是Thr、Val、Cys、Glu、Ser、或Ala
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Arg、Phe、Thr、Trp、Glu、Leu、Asn、Cys、Lys、Val、Ser、
Gln、Ile、Tyr、His、或Ala
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa是Ser、Pro、Arg、Lys、Asn、Ala、His、Gln、Gly、或Leu
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa是Asp、Gly、Thr、Asn、Ser、Lys、Ala、Ile、Glu、Leu、 Gln、
Arg、或Tyr
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa是Lys、Val、Ala、Glu、Tyr、Ile、Cys、Leu、Ser、Thr、Gly、
Lys、Met、Asp、或Phe
<400> 25
Xaa Xaa Xaa His Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asn
20 25
<210> 26
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Leu、Ile、Arg、Gln、Val、Met、或Lys
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Ile、Val、Thr、Ala、或Leu
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Val、Tyr、Ile、Leu、Phe、或Trp
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Gln、His、Arg、Lys、Tyr、Ile、Leu、Phe、或Trp
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Phe、Leu、Val、Lys、Tyr、Met、Ile、Arg、Ala、Glu、Asp、或
Gln
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Leu、Arg、Thr、Ile、Val、Ser、Cys、Tyr、Lys、Phe、或Gly
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Lys、Gln、Tyr、Thr、Phe、Leu、Trp、Met、Ala、Glu、Gly、或
Ser
<220>
<221> 变体
<222> (16)..(16)
<223> Xaa是Ile、Leu、Phe、Ser、Arg、Tyr、Gln、Trp、Asp、Lys、或His
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa是Asp、Ser、Ile、Asn、Glu、Ala、His、Phe、Leu、Gln、Met、
Gly、Tyr、或Val
<220>
<221> 变体
<222> (22)..(22)
<223> Xaa是Thr、Val、Cys、Glu、Ser、或Ala
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Arg、Phe、Thr、Trp、Glu、Leu、Asn、Cys、Lys、Val、Ser、
Gln、Ile、Tyr、His、或Ala
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa是Ser、Pro、Arg、Lys、Asn、Ala、His、Gln、Gly、或Leu
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa是Asp、Gly、Thr、Asn、Ser、Lys、Ala、Ile、Glu、Leu、Gln、
Arg、或Tyr
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa是Lys、Val、Ala、Glu、Tyr、Ile、Cys、Leu、Ser、Thr、Gly、
Lys、Met、Asp、或Phe
<400> 26
Xaa Xaa Xaa His Xaa Xaa Pro Xaa Ser Xaa Xaa Xaa Asp Asp Ser Xaa
1 5 10 15
Xaa Asn Lys Val Leu Xaa Xaa Xaa Xaa Xaa Asn
20 25
<210> 27
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Gln、His、Arg、Lys、Tyr、Ile、Leu、或Trp
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Phe、Leu、Val、Lys、Tyr、Met、Ile、Arg、Ala、Glu、Asp、或
Gln
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Leu、Arg、Thr、Ile、Val、Ser、Cys、Tyr、Lys、Phe、或Gly
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Lys、Gln、Tyr、Thr、Phe、Leu、Trp、Met、Ala、Glu、Gly、或
Ser
<220>
<221> 变体
<222> (16)..(16)
<223> Xaa是Ile、Leu、Phe、Ser、Arg、Tyr、Gln、Trp、Asp、Lys、或His
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa是Asp、Ser、Ile、Asn、Glu、Ala、His、Phe、Leu、Gln、Met、
Gly、Tyr、或Val
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Arg、Phe、Thr、Trp、Glu、Leu、Asn、Cys、Lys、Val、Ser、
Gln、Ile、Tyr、His、或Ala
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa是Ser、Pro、Arg、Lys、Asn、Ala、His、Gln、Gly、或Leu
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa是Asp、Gly、Thr、Asn、Ser、Lys、Ala、Ile、Glu、Leu、Gln、
Arg、或Tyr
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa是Lys、Val、Ala、Glu、Tyr、Ile、Cys、Leu、Ser、Thr、Gly、
Lys、Met、Asp、或Phe
<400> 27
Xaa Val Xaa His Ile Val Pro Xaa Ser Xaa Xaa Xaa Asp Asp Ser Xaa
1 5 10 15
Xaa Asn Lys Val Leu Thr Xaa Xaa Xaa Xaa Asn
20 25
<210> 28
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Ile或Val
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Ile或Val
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa是Ala或Ser
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Ile或Leu
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Lys或Thr
<220>
<221> 变体
<222> (14)..(14)
<223> Xaa是Asp或Asn
<220>
<221> 变体
<222> (19)..(19)
<223> Xaa是Arg、Lys、或Leu
<220>
<221> 变体
<222> (22)..(22)
<223> Xaa是Thr或Val
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Ser或Arg
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa是Lys、Asp、或Ala
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa是Glu、Lys、Gly、或Asn
<400> 28
Asp Xaa Asp His Ile Xaa Pro Gln Xaa Phe Xaa Xaa Asp Xaa Ser Ile
1 5 10 15
Asp Asn Xaa Val Leu Xaa Xaa Ser Xaa Xaa Asn
20 25
<210> 29
<211> 116
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向区域
<220>
<221> 尚未归类的特征
<222> (21)..(42)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (43)..(46)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (47)..(70)
<223> 第二互补结构域
<400> 29
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 30
<211> 116
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向区域
<220>
<221> 尚未归类的特征
<222> (21)..(42)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (43)..(46)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (47)..(70)
<223> 第二互补结构域
<400> 30
nnnnnnnnnn nnnnnnnnnn guauuagagc uaugcuguau uggaaacaau acagcauagc 60
aaguuaauau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 31
<211> 96
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (33)..(36)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (37)..(50)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (51)..(62)
<223> 近端结构域
<400> 31
nnnnnnnnnn nnnnnnnnnn guuuaagagc uagaaauagc aaguuuaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 32
<211> 47
<212> RNA
<213> 人工序列
<220>
<223> 衍生自酿脓链球菌的gRNA近端和尾部结构域
<400> 32
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcu 47
<210> 33
<211> 49
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 33
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cgguggugc 49
<210> 34
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 34
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcggau c 51
<210> 35
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 35
aaggcuaguc cguuaucaac uugaaaaagu g 31
<210> 36
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 36
aaggcuaguc cguuauca 18
<210> 37
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 37
aaggcuaguc cg 12
<210> 38
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 衍生自金黄色葡萄球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g、或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<400> 38
nnnnnnnnnn nnnnnnnnnn guuuuaguac ucuggaaaca gaaucuacua aaacaaggca 60
aaaugccgug uuuaucucgu caacuuguug gcgagauuuu uu 102
<210> 39
<211> 42
<212> RNA
<213> 人工的
<220>
<223> 衍生自酿脓链球菌的模块化gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(42)
<223> 第一互补结构域
<400> 39
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 40
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> 衍生自酿脓链球菌的模块化gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(9)
<223> 5'延伸结构域
<220>
<221> 尚未归类的特征
<222> (10)..(33)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (34)..(45)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (46)..(85)
<223> 尾部结构域
<400> 40
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuu 85
<210> 41
<211> 62
<212> RNA
<213> 人工序列
<220>
<223> 衍生自酿脓链球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (33)..(36)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (37)..(50)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (51)..(62)
<223> 近端结构域
<400> 41
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cg 62
<210> 42
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 衍生自酿脓链球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (33)..(36)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (37)..(50)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (51)..(62)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (63)..(102)
<223> 尾部结构域
<400> 42
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 43
<211> 75
<212> RNA
<213> 人工序列
<220>
<223> 衍生自酿脓链球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (21)..(36)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (37)..(40)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (41)..(58)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (59)..(70)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (71)..(75)
<223> 尾部结构域
<400> 43
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60
ggcuaguccg uuauc 75
<210> 44
<211> 87
<212> RNA
<213> 人工序列
<220>
<223> 衍生自酿脓链球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (43)..(46)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (57)..(70)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (71)..(82)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (83)..(87)
<223> 尾部结构域
<400> 44
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuauc 87
<210> 45
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 衍生自嗜热链球菌的模块化gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a, c, u, g、未知的或其他的
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(42)
<223> 第一互补结构域
<400> 45
nnnnnnnnnn nnnnnnnnnn guuuuagagc uguguuguuu cg 42
<210> 46
<211> 78
<212> RNA
<213> 人工序列
<220>
<223> 衍生自嗜热链球菌的模块化gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(3)
<223> 5'延伸结构域
<220>
<221> 尚未归类的特征
<222> (4)..(27)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (28)..(40)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (41)..(78)
<223> 尾部结构域
<400> 46
gggcgaaaca acacagcgag uuaaaauaag gcuuaguccg uacucaacuu gaaaaggugg 60
caccgauucg guguuuuu 78
<210> 47
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> 衍生自酿脓链球菌的模块化gRNA
<400> 47
gaaccauuca aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa 60
guggcaccga gucggugcuu uuuuu 85
<210> 48
<211> 96
<212> RNA
<213> 人工序列
<220>
<223> 来自酿脓链球菌的gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g、或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<400> 48
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 49
<211> 96
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g、或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (33)..(36)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (37)..(50)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (51)..(62)
<223> 近端结构域
<400> 49
nnnnnnnnnn nnnnnnnnnn guauuagagc uagaaauagc aaguuaauau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 50
<211> 104
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g、或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(36)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (37)..(40)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (41)..(58)
<223> 第二互补结构域
<400> 50
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60
ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugc 104
<210> 51
<211> 106
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g、或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(37)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (38)..(41)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (42)..(60)
<223> 第二互补结构域
<400> 51
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuggaa acagcauagc aaguuaaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 106
<210> 52
<211> 12
<212> PRT
<213> 杜尔丹尼嗜胨菌(Peptoniphilus duerdenii)
<400> 52
Asp Ile Gly Thr Ala Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 53
<211> 12
<212> PRT
<213> 齿垢密螺旋体
<400> 53
Asp Val Gly Thr Gly Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 54
<211> 12
<212> PRT
<213> 变形链球菌
<400> 54
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val
1 5 10
<210> 55
<211> 12
<212> PRT
<213> 酿脓链球菌
<400> 55
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 56
<211> 12
<212> PRT
<213> 无害利斯特菌
<400> 56
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Leu
1 5 10
<210> 57
<211> 12
<212> PRT
<213> 嗜鳃黄杆菌FL-15
<400> 57
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Val Val
1 5 10
<210> 58
<211> 11
<212> PRT
<213> Pedobacter glucosidilyticus
<400> 58
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Ile
1 5 10
<210> 59
<211> 12
<212> PRT
<213> 脆弱拟杆菌NCTC 9343
<400> 59
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Leu Val
1 5 10
<210> 60
<211> 12
<212> PRT
<213> 具核梭杆菌
<400> 60
Asp Ile Gly Thr Asn Ser Val Gly Trp Cys Val Thr
1 5 10
<210> 61
<211> 12
<212> PRT
<213> 氨基酸球菌属物种D21
<400> 61
Asp Ile Gly Thr Asn Ser Val Gly Tyr Ala Val Thr
1 5 10
<210> 62
<211> 12
<212> PRT
<213> 灵巧粪球菌GD-7
<400> 62
Asp Met Gly Thr Gly Ser Leu Gly Trp Ala Val Thr
1 5 10
<210> 63
<211> 12
<212> PRT
<213> 科塔热乳球菌(Oenococcus kitaharae)DSM 17330
<400> 63
Asp Ile Gly Thr Ser Ser Val Gly Trp Ala Ala Ile
1 5 10
<210> 64
<211> 12
<212> PRT
<213> 米索开链型杆菌(Catenibacterium mitsuokai)DSM 15897
<400> 64
Asp Leu Gly Thr Gly Ser Val Gly Trp Ala Val Val
1 5 10
<210> 65
<211> 12
<212> PRT
<213> 鸡毒支原体菌株F
<400> 65
Asp Leu Gly Val Gly Ser Val Gly Trp Ala Ile Val
1 5 10
<210> 66
<211> 12
<212> PRT
<213> 羊肺炎支原体SC01
<400> 66
Asp Leu Gly Ile Ala Ser Ile Gly Trp Ala Ile Ile
1 5 10
<210> 67
<211> 12
<212> PRT
<213> 犬枝原体PG 14
<400> 67
Asp Leu Gly Ile Ala Ser Val Gly Trp Ala Ile Val
1 5 10
<210> 68
<211> 12
<212> PRT
<213> 关节液支原体53
<400> 68
Asp Leu Gly Val Ala Ser Val Gly Trp Ser Ile Val
1 5 10
<210> 69
<211> 12
<212> PRT
<213> 直肠真杆菌
<400> 69
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Ile Leu
1 5 10
<210> 70
<211> 12
<212> PRT
<213> 粪肠球菌TX0012
<400> 70
Asp Leu Gly Ile Ser Ser Val Gly Trp Ser Val Ile
1 5 10
<210> 71
<211> 12
<212> PRT
<213> 营养泥杆菌DSM 2926
<400> 71
Asp Ile Gly Ile Ala Ser Val Gly Trp Ser Val Ile
1 5 10
<210> 72
<211> 12
<212> PRT
<213> 白色瘤胃球菌8
<400> 72
Asp Val Gly Ile Gly Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 73
<211> 12
<212> PRT
<213> 米特姆迷踪菌(Elusimicrobium minutum)Pei191
<400> 73
Asp Leu Gly Val Gly Ser Ile Gly Phe Ala Ile Val
1 5 10
<210> 74
<211> 12
<212> PRT
<213> 艾克曼菌(Akkermansia muciniphila)
<400> 74
Asp Ile Gly Tyr Ala Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 75
<211> 12
<212> PRT
<213> 普里沃菌(Prevotella ruminicola)
<400> 75
Asp Thr Gly Thr Asn Ser Leu Gly Trp Ala Ile Val
1 5 10
<210> 76
<211> 12
<212> PRT
<213> 普希瑞姆海洋菌(Cand. Puniceispirillum marinum)
<400> 76
Asp Leu Gly Thr Asn Ser Ile Gly Trp Cys Leu Leu
1 5 10
<210> 77
<211> 12
<212> PRT
<213> 深红红螺菌
<400> 77
Asp Ile Gly Thr Asp Ser Leu Gly Trp Ala Val Phe
1 5 10
<210> 78
<211> 12
<212> PRT
<213> 鼠李糖乳杆菌GG
<400> 78
Asp Ile Gly Ser Asn Ser Ile Gly Phe Ala Val Val
1 5 10
<210> 79
<211> 12
<212> PRT
<213> 球状球壳菌
<400> 79
Asp Leu Gly Val Gly Ser Ile Gly Val Ala Val Ala
1 5 10
<210> 80
<211> 12
<212> PRT
<213> 沼泽红假单胞菌
<400> 80
Asp Leu Gly Ile Ala Ser Cys Gly Trp Gly Val Val
1 5 10
<210> 81
<211> 12
<212> PRT
<213> 运动支原体163K
<400> 81
Asp Leu Gly Ile Ala Ser Val Gly Trp Cys Leu Thr
1 5 10
<210> 82
<211> 12
<212> PRT
<213> 嗜热链球菌 LMD-9
<400> 82
Asp Ile Gly Ile Gly Ser Val Gly Val Gly Ile Leu
1 5 10
<210> 83
<211> 12
<212> PRT
<213> 路邓葡萄球菌M23590
<400> 83
Asp Ile Gly Ile Thr Ser Val Gly Tyr Gly Leu Ile
1 5 10
<210> 84
<211> 12
<212> PRT
<213> 细长真杆菌DSM 3991
<400> 84
Asp Ile Gly Ile Thr Ser Val Gly Phe Gly Ile Ile
1 5 10
<210> 85
<211> 12
<212> PRT
<213> 棒状乳杆菌KCTC 3535
<400> 85
Asp Val Gly Ile Thr Ser Thr Gly Tyr Ala Val Leu
1 5 10
<210> 86
<211> 12
<212> PRT
<213> 赛苏尼变形菌(Nitratifractor salsuginis)DSM 16511
<400> 86
Asp Leu Gly Ile Thr Ser Phe Gly Tyr Ala Ile Leu
1 5 10
<210> 87
<211> 12
<212> PRT
<213> 两岐双岐杆菌S17
<400> 87
Asp Ile Gly Asn Ala Ser Val Gly Trp Ser Ala Phe
1 5 10
<210> 88
<211> 12
<212> PRT
<213> 加氏乳杆菌
<400> 88
Asp Val Gly Thr Asn Ser Cys Gly Trp Val Ala Met
1 5 10
<210> 89
<211> 12
<212> PRT
<213> 纤维放线菌11B
<400> 89
Asp Val Gly Glu Arg Ser Ile Gly Leu Ala Ala Val
1 5 10
<210> 90
<211> 12
<212> PRT
<213> 长双歧杆菌DJO10A
<400> 90
Asp Val Gly Leu Asn Ser Val Gly Leu Ala Ala Val
1 5 10
<210> 91
<211> 12
<212> PRT
<213> 齿双歧杆菌
<400> 91
Asp Val Gly Leu Met Ser Val Gly Leu Ala Ala Ile
1 5 10
<210> 92
<211> 12
<212> PRT
<213> 白喉棒状杆菌
<400> 92
Asp Val Gly Thr Phe Ser Val Gly Leu Ala Ala Ile
1 5 10
<210> 93
<211> 12
<212> PRT
<213> 迪特米葡萄球菌(Staphylococcus pseudintermedius)ED99
<400> 93
Asp Ile Gly Thr Gly Ser Val Gly Tyr Ala Cys Met
1 5 10
<210> 94
<211> 12
<212> PRT
<213> 黄褐二氧化碳嗜纤维菌
<400> 94
Asp Leu Gly Thr Thr Ser Ile Gly Phe Ala His Ile
1 5 10
<210> 95
<211> 12
<212> PRT
<213> 栖牙普氏菌
<400> 95
Asp Leu Gly Thr Asn Ser Ile Gly Ser Ser Val Arg
1 5 10
<210> 96
<211> 12
<212> PRT
<213> 青枯雷尔氏菌
<400> 96
Asp Ile Gly Thr Asn Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 97
<211> 12
<212> PRT
<213> 多杀性巴氏杆菌菌株Pm70
<400> 97
Asp Leu Gly Ile Ala Ser Val Gly Trp Ala Val Val
1 5 10
<210> 98
<211> 12
<212> PRT
<213> 粒毛单胞菌
<400> 98
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Val Leu
1 5 10
<210> 99
<211> 12
<212> PRT
<213> 雪貂螺杆菌12198
<400> 99
Asp Ile Gly Ile Ala Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 100
<211> 12
<212> PRT
<213> 直肠杆菌
<400> 100
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Ile Ile
1 5 10
<210> 101
<211> 12
<212> PRT
<213> 解纤维梭菌H10
<400> 101
Asp Val Gly Ile Ala Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 102
<211> 11
<212> PRT
<213> 嗜甲基菌属物种OH31
<400> 102
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Leu
1 5 10
<210> 103
<211> 12
<212> PRT
<213> 脑膜炎奈瑟氏菌
<400> 103
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val
1 5 10
<210> 104
<211> 12
<212> PRT
<213> 产气荚膜梭状芽胞杆菌
<400> 104
Asp Ile Gly Ile Thr Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 105
<211> 12
<212> PRT
<213> 产琥珀酸沃廉菌DSM 1740
<400> 105
Asp Leu Gly Ile Ser Ser Leu Gly Trp Ala Ile Val
1 5 10
<210> 106
<211> 12
<212> PRT
<213> 固氮螺菌属物种B510
<400> 106
Asp Leu Gly Thr Asn Ser Ile Gly Trp Gly Leu Leu
1 5 10
<210> 107
<211> 12
<212> PRT
<213> 依尼菌(Verminephrobacter eiseniae)
<400> 107
Asp Leu Gly Ser Thr Ser Leu Gly Trp Ala Ile Phe
1 5 10
<210> 108
<211> 12
<212> PRT
<213> 空肠弯曲杆菌NCTC 11168
<400> 108
Asp Ile Gly Ile Ser Ser Ile Gly Trp Ala Phe Ser
1 5 10
<210> 109
<211> 12
<212> PRT
<213> 印度洋细小棒菌DS-1
<400> 109
Asp Ile Gly Thr Thr Ser Ile Gly Phe Ser Val Ile
1 5 10
<210> 110
<211> 12
<212> PRT
<213> 芝江菌(Dinoroseobacter shibae)DFL 12
<400> 110
Asp Ile Gly Thr Ser Ser Ile Gly Trp Trp Leu Tyr
1 5 10
<210> 111
<211> 12
<212> PRT
<213> 汉博硝化菌(Nitrobacter hamburgensis)X14
<400> 111
Asp Leu Gly Ser Asn Ser Leu Gly Trp Phe Val Thr
1 5 10
<210> 112
<211> 12
<212> PRT
<213> 慢生根瘤菌物种BTAi1
<400> 112
Asp Leu Gly Ala Asn Ser Leu Gly Trp Phe Val Val
1 5 10
<210> 113
<211> 15
<212> PRT
<213> 蜡样芽胞杆菌
<400> 113
Asp Ile Gly Leu Arg Ile Gly Ile Thr Ser Cys Gly Trp Ser Ile
1 5 10 15
<210> 114
<211> 12
<212> PRT
<213> 华德萨特菌(Sutterella wadsworthensis)
<400> 114
Asp Met Gly Ala Lys Tyr Thr Gly Val Phe Tyr Ala
1 5 10
<210> 115
<211> 12
<212> PRT
<213> 产琥珀酸沃廉菌DSM 1740
<400> 115
Asp Leu Gly Gly Lys Asn Thr Gly Phe Phe Ser Phe
1 5 10
<210> 116
<211> 12
<212> PRT
<213> 土拉热弗朗西丝菌
<400> 116
Asp Leu Gly Val Lys Asn Thr Gly Val Phe Ser Ala
1 5 10
<210> 117
<211> 12
<212> PRT
<213> γ-变形杆菌HTCC5015
<400> 117
Asp Leu Gly Ala Lys Phe Thr Gly Val Ala Leu Tyr
1 5 10
<210> 118
<211> 12
<212> PRT
<213> 嗜肺性军团病杆菌菌株巴黎
<400> 118
Asp Leu Gly Gly Lys Phe Thr Gly Val Cys Leu Ser
1 5 10
<210> 119
<211> 12
<212> PRT
<213> 曼霍米萨特菌(Parasutterella excrementihominis)
<400> 119
Asp Leu Gly Gly Thr Tyr Thr Gly Thr Phe Ile Thr
1 5 10
<210> 120
<211> 12
<212> PRT
<213> 嗜热链球菌
<400> 120
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 121
<211> 12
<212> PRT
<213> 尤里真细菌(Eubacterium yurii)
<400> 121
Asp Val Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 122
<211> 12
<212> PRT
<213> 丁酸孤菌
<400> 122
Asp Met Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 123
<211> 12
<212> PRT
<213> 木里菌(Solobacterium moorei)F0204
<400> 123
Asp Val Gly Thr Ser Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 124
<211> 27
<212> PRT
<213> 齿垢密螺旋体
<400> 124
Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Ser Asn Arg Val Leu Val Cys Ser Ser Cys Asn
20 25
<210> 125
<211> 27
<212> PRT
<213> 灵巧粪球菌GD-7
<400> 125
Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Thr Met Asp Asp Ser Leu
1 5 10 15
Asn Asn Arg Val Leu Val Lys Lys Asn Tyr Asn
20 25
<210> 126
<211> 27
<212> PRT
<213> 杜尔丹尼嗜胨菌(Peptoniphilus duerdenii)
<400> 126
Asp Gln Asp His Ile Tyr Pro Lys Ser Lys Ile Tyr Asp Asp Ser Leu
1 5 10 15
Glu Asn Arg Val Leu Val Lys Lys Asn Leu Asn
20 25
<210> 127
<211> 27
<212> PRT
<213> 米索开粪球菌(Catenibacterium mitsuokai)DSM 15897
<400> 127
Gln Ile Asp His Ile Val Pro Gln Ser Leu Val Lys Asp Asp Ser Phe
1 5 10 15
Asp Asn Arg Val Leu Val Val Pro Ser Glu Asn
20 25
<210> 128
<211> 27
<212> PRT
<213> 变形链球菌
<400> 128
Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Ile
1 5 10 15
Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn
20 25
<210> 129
<211> 27
<212> PRT
<213> 嗜热链球菌
<400> 129
Asp Ile Asp His Ile Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Val Ser Ser Ala Ser Asn
20 25
<210> 130
<211> 27
<212> PRT
<213> 科塔热乳球菌(Oenococcus kitaharae)DSM 17330
<400> 130
Asp Ile Asp His Ile Ile Pro Gln Ala Tyr Thr Lys Asp Asn Ser Leu
1 5 10 15
Asp Asn Arg Val Leu Val Ser Asn Ile Thr Asn
20 25
<210> 131
<211> 27
<212> PRT
<213> 无害利斯特菌
<400> 131
Asp Ile Asp His Ile Val Pro Gln Ser Phe Ile Thr Asp Asn Ser Ile
1 5 10 15
Asp Asn Leu Val Leu Thr Ser Ser Ala Gly Asn
20 25
<210> 132
<211> 27
<212> PRT
<213> 酿脓链球菌
<400> 132
Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
20 25
<210> 133
<211> 27
<212> PRT
<213> 氨基酸球菌属物种D21
<400> 133
Asn Ile Asp His Ile Tyr Pro Gln Ser Met Val Lys Asp Asp Ser Leu
1 5 10 15
Asp Asn Lys Val Leu Val Gln Ser Glu Ile Asn
20 25
<210> 134
<211> 27
<212> PRT
<213> 鼠李糖乳杆菌GG
<400> 134
Asp Ile Asp His Ile Leu Pro Gln Ser Leu Ile Lys Asp Asp Ser Leu
1 5 10 15
Asp Asn Arg Val Leu Val Asn Ala Thr Ile Asn
20 25
<210> 135
<211> 27
<212> PRT
<213> 盖斯里乳杆菌(Lactobacillus gasseri)
<400> 135
Asp Ile Asp His Ile Leu Pro Gln Ser Phe Ile Lys Asp Asp Ser Leu
1 5 10 15
Glu Asn Arg Val Leu Val Lys Lys Ala Val Asn
20 25
<210> 136
<211> 27
<212> PRT
<213> 迪特米葡萄球菌(Staphylococcus pseudintermedius)ED99
<400> 136
Glu Val Asp His Ile Phe Pro Arg Ser Phe Ile Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Val Ile Lys Lys Met Asn
20 25
<210> 137
<211> 27
<212> PRT
<213> 由里菌(Olsenella uli)
<400> 137
Glu Val Asp His Ile Ile Pro Arg Ser Tyr Ile Lys Asp Asp Ser Phe
1 5 10 15
Glu Asn Lys Val Leu Val Tyr Arg Glu Glu Asn
20 25
<210> 138
<211> 27
<212> PRT
<213> 两岐双岐杆菌S17
<400> 138
Asp Ile Asp His Ile Ile Pro Gln Ala Val Thr Gln Asn Asp Ser Ile
1 5 10 15
Asp Asn Arg Val Leu Val Ala Arg Ala Glu Asn
20 25
<210> 139
<211> 27
<212> PRT
<213> 鸡毒支原体菌株F
<400> 139
Glu Ile Asp His Ile Ile Pro Tyr Ser Ile Ser Phe Asp Asp Ser Ser
1 5 10 15
Ser Asn Lys Leu Leu Val Leu Ala Glu Ser Asn
20 25
<210> 140
<211> 27
<212> PRT
<213> 犬枝原体PG 14
<400> 140
Glu Ile Asp His Ile Ile Pro Tyr Ser Leu Cys Phe Asp Asp Ser Ser
1 5 10 15
Ala Asn Lys Val Leu Val His Lys Gln Ser Asn
20 25
<210> 141
<211> 27
<212> PRT
<213> 营养泥杆菌DSM 2926
<400> 141
Asp Ile Asp His Ile Ile Pro Tyr Ser Arg Ser Met Asp Asp Ser Tyr
1 5 10 15
Ser Asn Lys Val Leu Val Leu Ser Gly Glu Asn
20 25
<210> 142
<211> 27
<212> PRT
<213> 未培养白蚁1群细菌
<400> 142
Asp Ile Asp His Ile Ile Pro Tyr Ser Lys Ser Met Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Cys Leu Ala Glu Glu Asn
20 25
<210> 143
<211> 27
<212> PRT
<213> 空肠弯曲杆
<400> 143
Glu Ile Asp His Ile Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr
1 5 10 15
Met Asn Lys Val Leu Val Phe Thr Lys Gln Asn
20 25
<210> 144
<211> 27
<212> PRT
<213> 解纤维梭菌H10
<400> 144
Gln Ile Asp His Ile Tyr Pro Tyr Ser Arg Ser Met Asp Asp Ser Tyr
1 5 10 15
Met Asn Lys Val Leu Val Leu Thr Asp Glu Asn
20 25
<210> 145
<211> 27
<212> PRT
<213> 产气荚膜梭状芽胞杆菌
<400> 145
Glu Ile Asp His Ile Ile Pro Phe Ser Arg Ser Phe Asp Asp Ser Leu
1 5 10 15
Ser Asn Lys Ile Leu Val Leu Gly Ser Glu Asn
20 25
<210> 146
<211> 27
<212> PRT
<213> 脑膜炎奈瑟氏球菌
<400> 146
Glu Ile Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Val Leu Gly Ser Glu Asn
20 25
<210> 147
<211> 27
<212> PRT
<213> 多杀性巴氏杆菌菌株Pm70
<400> 147
Glu Ile Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Val Leu Ala Ser Glu Asn
20 25
<210> 148
<211> 27
<212> PRT
<213> 粪肠球菌TX0012
<400> 148
Glu Ile Asp His Ile Ile Pro Ile Ser Ile Ser Leu Asp Asp Ser Ile
1 5 10 15
Asn Asn Lys Val Leu Val Leu Ser Lys Ala Asn
20 25
<210> 149
<211> 27
<212> PRT
<213> 细长真杆菌DSM 3991
<400> 149
Glu Val Asp His Ile Ile Pro Ile Ser Ile Ser Leu Asp Asp Ser Ile
1 5 10 15
Thr Asn Lys Val Leu Val Thr His Arg Glu Asn
20 25
<210> 150
<211> 27
<212> PRT
<213> 厄必嗜酸菌(Acidovorax ebreus)
<400> 150
Gln Val Asp His Ala Leu Pro Tyr Ser Arg Ser Tyr Asp Asp Ser Lys
1 5 10 15
Asn Asn Lys Val Leu Val Leu Thr His Glu Asn
20 25
<210> 151
<211> 27
<212> PRT
<213> 嗜热链球菌 LMD-9
<400> 151
Glu Val Asp His Ile Leu Pro Leu Ser Ile Thr Phe Asp Asp Ser Leu
1 5 10 15
Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn
20 25
<210> 152
<211> 27
<212> PRT
<213> 直肠真杆菌
<400> 152
Glu Ile Asp His Ile Ile Pro Arg Ser Ile Ser Phe Asp Asp Ala Arg
1 5 10 15
Ser Asn Lys Val Leu Val Tyr Arg Ser Glu Asn
20 25
<210> 153
<211> 27
<212> PRT
<213> 路邓葡萄球菌M23590
<400> 153
Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr
1 5 10 15
His Asn Lys Val Leu Val Lys Gln Ser Glu Asn
20 25
<210> 154
<211> 27
<212> PRT
<213> 肠炎胎弧菌(Roseburia intestinalis)
<400> 154
Asp Ile Asp His Ile Leu Pro Tyr Ser Ile Thr Phe Asp Asp Ser Phe
1 5 10 15
Arg Asn Lys Val Leu Val Thr Ser Gln Glu Asn
20 25
<210> 155
<211> 27
<212> PRT
<213> 产琥珀酸沃廉菌DSM 1740
<400> 155
Glu Ile Asp His Ile Leu Pro Arg Ser Arg Ser Ala Asp Asp Ser Phe
1 5 10 15
Ala Asn Lys Val Leu Cys Leu Ala Arg Ala Asn
20 25
<210> 156
<211> 27
<212> PRT
<213> 普希瑞姆海洋菌(Cand. Puniceispirillum marinum)
<400> 156
Glu Ile Glu His Leu Leu Pro Phe Ser Leu Thr Leu Asp Asp Ser Met
1 5 10 15
Ala Asn Lys Thr Val Cys Phe Arg Gln Ala Asn
20 25
<210> 157
<211> 27
<212> PRT
<213> 固氮螺菌属物种B510
<400> 157
Asp Ile Asp His Ile Leu Pro Phe Ser Val Ser Leu Asp Asp Ser Ala
1 5 10 15
Ala Asn Lys Val Val Cys Leu Arg Glu Ala Asn
20 25
<210> 158
<211> 27
<212> PRT
<213> 慢生根瘤菌物种BTAi1
<400> 158
Asp Ile Asp His Leu Ile Pro Phe Ser Ile Ser Trp Asp Asp Ser Ala
1 5 10 15
Ala Asn Lys Val Val Cys Met Arg Tyr Ala Asn
20 25
<210> 159
<211> 27
<212> PRT
<213> 汉博硝化菌(Nitrobacter hamburgensis)X14
<400> 159
Asp Ile Asp His Ile Leu Pro Val Ala Met Thr Leu Asp Asp Ser Pro
1 5 10 15
Ala Asn Lys Ile Ile Cys Met Arg Tyr Ala Asn
20 25
<210> 160
<211> 27
<212> PRT
<213> 芝江菌(Dinoroseobacter shibae)
<400> 160
Asp Val Asp His Ile Leu Pro Tyr Ser Arg Thr Leu Asp Asp Ser Phe
1 5 10 15
Pro Asn Arg Thr Leu Cys Leu Arg Glu Ala Asn
20 25
<210> 161
<211> 27
<212> PRT
<213> 依尼菌(Verminephrobacter eiseniae)
<400> 161
Glu Ile Glu His Ile Leu Pro Phe Ser Arg Thr Leu Asp Asp Ser Leu
1 5 10 15
Asn Asn Arg Thr Val Ala Met Arg Arg Ala Asn
20 25
<210> 162
<211> 27
<212> PRT
<213> 克夫米乳杆菌(Lactobacillus coryniformis)KCTC 3535
<400> 162
Glu Val Asp His Ile Ile Pro Tyr Ser Ile Ser Trp Asp Asp Ser Tyr
1 5 10 15
Thr Asn Lys Val Leu Thr Ser Ala Lys Cys Asn
20 25
<210> 163
<211> 27
<212> PRT
<213> 沼泽红假单胞菌
<400> 163
Gln Val Asp His Ile Leu Pro Trp Ser Arg Phe Gly Asp Asp Ser Tyr
1 5 10 15
Leu Asn Lys Thr Leu Cys Thr Ala Arg Ser Asn
20 25
<210> 164
<211> 27
<212> PRT
<213> 黑粉菌R24
<400> 164
Gln Val Asp His Ile Leu Pro Phe Ser Lys Thr Leu Asp Asp Ser Phe
1 5 10 15
Ala Asn Lys Val Leu Ala Gln His Asp Ala Asn
20 25
<210> 165
<211> 27
<212> PRT
<213> 雪貂螺杆菌12198
<400> 165
Gln Ile Asp His Ala Phe Pro Leu Ser Arg Ser Leu Asp Asp Ser Gln
1 5 10 15
Ser Asn Lys Val Leu Cys Leu Thr Ser Ser Asn
20 25
<210> 166
<211> 27
<212> PRT
<213> 运动支原体163K
<400> 166
Asp Ile Asp His Ile Val Pro Arg Ser Ile Ser Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Leu Val Ile Val Asn Lys Leu Asp Asn
20 25
<210> 167
<211> 27
<212> PRT
<213> 羊肺炎支原体SC01
<400> 167
Glu Ile Glu His Ile Ile Pro Tyr Ser Met Ser Tyr Asp Asn Ser Gln
1 5 10 15
Ala Asn Lys Ile Leu Thr Glu Lys Ala Glu Asn
20 25
<210> 168
<211> 27
<212> PRT
<213> 关节液支原体53
<400> 168
Glu Ile Asp His Val Ile Pro Tyr Ser Lys Ser Ala Asp Asp Ser Trp
1 5 10 15
Phe Asn Lys Leu Leu Val Lys Lys Ser Thr Asn
20 25
<210> 169
<211> 27
<212> PRT
<213> 普若安胞菌(Aminomonas paucivorans)DSM 12260
<400> 169
Glu Met Asp His Ile Leu Pro Tyr Ser Arg Ser Leu Asp Asn Gly Trp
1 5 10 15
His Asn Arg Val Leu Val His Gly Lys Asp Asn
20 25
<210> 170
<211> 27
<212> PRT
<213> 白色瘤胃球菌8
<400> 170
Glu Val Asp His Ile Val Pro Tyr Ser Leu Ile Leu Asp Asn Thr Ile
1 5 10 15
Asn Asn Lys Ala Leu Val Tyr Ala Glu Glu Asn
20 25
<210> 171
<211> 27
<212> PRT
<213> 产琥珀酸丝状杆菌
<400> 171
Glu Ile Glu His Val Ile Pro Gln Ser Leu Tyr Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Val Ile Cys Glu Ala Glu Val Asn
20 25
<210> 172
<211> 27
<212> PRT
<213> 脆弱类拟杆菌NCTC 9343
<400> 172
Asp Ile Glu His Ile Ile Pro Gln Ala Arg Leu Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Thr Leu Glu Ala Arg Ser Val Asn
20 25
<210> 173
<211> 27
<212> PRT
<213> 生痰二氧化碳嗜纤维菌
<400> 173
Glu Ile Glu His Ile Val Pro Lys Ala Arg Val Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Thr Leu Thr Phe His Arg Ile Asn
20 25
<210> 174
<211> 28
<212> PRT
<213> 大芬戈尔德菌
<400> 174
Asp Lys Asp His Ile Ile Pro Gln Ser Met Lys Lys Asp Asp Ser Ile
1 5 10 15
Ile Asn Asn Leu Val Leu Val Asn Lys Asn Ala Asn
20 25
<210> 175
<211> 27
<212> PRT
<213> 拉门提若红菌(Parvibaculum lavamentivorans)DS-1
<400> 175
Glu Val Glu His Ile Trp Pro Arg Ser Arg Ser Phe Asp Asn Ser Pro
1 5 10 15
Arg Asn Lys Thr Leu Cys Arg Lys Asp Val Asn
20 25
<210> 176
<211> 27
<212> PRT
<213> 蜡样芽胞杆菌
<400> 176
Ile Val Asn His Ile Ile Pro Tyr Asn Arg Ser Phe Asp Asp Thr Tyr
1 5 10 15
His Asn Arg Val Leu Thr Leu Thr Glu Thr Lys
20 25
<210> 177
<211> 27
<212> PRT
<213> 云母普氏杆菌
<400> 177
Asp Met Glu His Thr Ile Pro Lys Ser Ile Ser Phe Asp Asn Ser Asp
1 5 10 15
Gln Asn Leu Thr Leu Cys Glu Ser Tyr Tyr Asn
20 25
<210> 178
<211> 27
<212> PRT
<213> 普里沃菌(Prevotella ruminicola)
<400> 178
Asp Ile Glu His Thr Ile Pro Arg Ser Ala Gly Gly Asp Ser Thr Lys
1 5 10 15
Met Asn Leu Thr Leu Cys Ser Ser Arg Phe Asn
20 25
<210> 179
<211> 27
<212> PRT
<213> 柱状黄杆菌
<400> 179
Asp Ile Glu His Thr Ile Pro Arg Ser Ile Ser Gln Asp Asn Ser Gln
1 5 10 15
Met Asn Lys Thr Leu Cys Ser Leu Lys Phe Asn
20 25
<210> 180
<211> 27
<212> PRT
<213> 深红红螺菌
<400> 180
Asp Ile Asp His Val Ile Pro Leu Ala Arg Gly Gly Arg Asp Ser Leu
1 5 10 15
Asp Asn Met Val Leu Cys Gln Ser Asp Ala Asn
20 25
<210> 181
<211> 27
<212> PRT
<213> 米特姆迷踪菌(Elusimicrobium minutum)Pei191
<400> 181
Asp Ile Glu His Leu Phe Pro Ile Ala Glu Ser Glu Asp Asn Gly Arg
1 5 10 15
Asn Asn Leu Val Ile Ser His Ser Ala Cys Asn
20 25
<210> 182
<211> 27
<212> PRT
<213> 哥罗布菌(Sphaerochaeta globus)菌株Buddy
<400> 182
Asp Val Asp His Ile Phe Pro Arg Asp Asp Thr Ala Asp Asn Ser Tyr
1 5 10 15
Gly Asn Lys Val Val Ala His Arg Gln Cys Asn
20 25
<210> 183
<211> 27
<212> PRT
<213> 赛苏尼变形菌(Nitratifractor salsuginis)DSM 16511
<400> 183
Asp Ile Glu His Ile Val Pro Gln Ser Leu Gly Gly Leu Ser Thr Asp
1 5 10 15
Tyr Asn Thr Ile Val Thr Leu Lys Ser Val Asn
20 25
<210> 184
<211> 27
<212> PRT
<213> 嗜酸栖热菌11B
<400> 184
Glu Leu Asp His Ile Val Pro Arg Thr Asp Gly Gly Ser Asn Arg His
1 5 10 15
Glu Asn Leu Ala Ile Thr Cys Gly Ala Cys Asn
20 25
<210> 185
<211> 28
<212> PRT
<213> 长双歧杆菌DJO10A
<400> 185
Glu Met Asp His Ile Val Pro Arg Lys Gly Val Gly Ser Thr Asn Thr
1 5 10 15
Arg Thr Asn Phe Ala Ala Val Cys Ala Glu Cys Asn
20 25
<210> 186
<211> 28
<212> PRT
<213> 齿双歧杆菌
<400> 186
Glu Met Asp His Ile Val Pro Arg Lys Gly Val Gly Ser Thr Asn Thr
1 5 10 15
Arg Val Asn Leu Ala Ala Ala Cys Ala Ala Cys Asn
20 25
<210> 187
<211> 28
<212> PRT
<213> 白喉棒状杆菌
<400> 187
Glu Met Asp His Ile Val Pro Arg Ala Gly Gln Gly Ser Thr Asn Thr
1 5 10 15
Arg Glu Asn Leu Val Ala Val Cys His Arg Cys Asn
20 25
<210> 188
<211> 33
<212> PRT
<213> 华德萨特菌(Sutterella wadsworthensis)
<400> 188
Glu Ile Asp His Ile Leu Pro Arg Ser Leu Ile Lys Asp Ala Arg Gly
1 5 10 15
Ile Val Phe Asn Ala Glu Pro Asn Leu Ile Tyr Ala Ser Ser Arg Gly
20 25 30
Asn
<210> 189
<211> 33
<212> PRT
<213> γ-变形杆菌HTCC5015
<400> 189
Glu Ile Asp His Ile Ile Pro Arg Ser Leu Thr Gly Arg Thr Lys Lys
1 5 10 15
Thr Val Phe Asn Ser Glu Ala Asn Leu Ile Tyr Cys Ser Ser Lys Gly
20 25 30
Asn
<210> 190
<211> 33
<212> PRT
<213> 曼霍米萨特菌(Parasutterella excrementihominis)
<400> 190
Glu Ile Asp His Ile Ile Pro Arg Ser Leu Thr Leu Lys Lys Ser Glu
1 5 10 15
Ser Ile Tyr Asn Ser Glu Val Asn Leu Ile Phe Val Ser Ala Gln Gly
20 25 30
Asn
<210> 191
<211> 33
<212> PRT
<213> 嗜肺性军团病杆菌菌株巴黎
<400> 191
Glu Ile Asp His Ile Tyr Pro Arg Ser Leu Ser Lys Lys His Phe Gly
1 5 10 15
Val Ile Phe Asn Ser Glu Val Asn Leu Ile Tyr Cys Ser Ser Gln Gly
20 25 30
Asn
<210> 192
<211> 33
<212> PRT
<213> 产琥珀酸沃廉菌DSM 1740
<400> 192
Glu Ile Asp His Ile Leu Pro Arg Ser His Thr Leu Lys Ile Tyr Gly
1 5 10 15
Thr Val Phe Asn Pro Glu Gly Asn Leu Ile Tyr Val His Gln Lys Cys
20 25 30
Asn
<210> 193
<211> 30
<212> PRT
<213> 土拉热弗朗西丝菌
<400> 193
Glu Leu Asp His Ile Ile Pro Arg Ser His Lys Lys Tyr Gly Thr Leu
1 5 10 15
Asn Asp Glu Ala Asn Leu Ile Cys Val Thr Arg Gly Asp Asn
20 25 30
<210> 194
<211> 27
<212> PRT
<213> 艾克曼菌(Akkermansia muciniphila)
<400> 194
Glu Leu Glu His Ile Val Pro His Ser Phe Arg Gln Ser Asn Ala Leu
1 5 10 15
Ser Ser Leu Val Leu Thr Trp Pro Gly Val Asn
20 25
<210> 195
<211> 27
<212> PRT
<213> 木里菌(Solobacterium moorei)F0204
<400> 195
Asp Ile Asp His Ile Tyr Pro Arg Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Thr Asn Arg Val Leu Val Glu Lys Asp Ile Asn
20 25
<210> 196
<211> 28
<212> PRT
<213> 非典型韦荣球菌ACS-134-V-Col7a
<400> 196
Tyr Asp Ile Asp His Ile Tyr Pro Arg Ser Leu Thr Lys Asp Asp Ser
1 5 10 15
Phe Asp Asn Leu Val Leu Cys Glu Arg Thr Ala Asn
20 25
<210> 197
<211> 28
<212> PRT
<213> 具核梭杆菌
<400> 197
Asp Ile Asp His Ile Tyr Pro Arg Ser Lys Val Ile Lys Asp Asp Ser
1 5 10 15
Phe Asp Asn Leu Val Leu Val Leu Lys Asn Glu Asn
20 25
<210> 198
<211> 27
<212> PRT
<213> 艾洛克产线菌(Filifactor alocis)
<400> 198
Asp Arg Asp His Ile Tyr Pro Gln Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Leu Val Leu Val Asn Lys Thr Tyr Asn
20 25
<210> 199
<211> 5
<212> DNA
<213> 嗜热链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> 任何核苷酸(例如,A、G、C、或T)
<400> 199
nggng 5
<210> 200
<211> 7
<212> DNA
<213> 嗜热链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (7)..(7)
<223> A或T
<400> 200
nnagaaw 7
<210> 201
<211> 4
<212> DNA
<213> 变形链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<400> 201
naar 4
<210> 202
<211> 5
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> A或G
<400> 202
nngrr 5
<210> 203
<211> 6
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (6)..(6)
<223> 任何核苷酸(例如,A、G、C、或T)
<400> 203
nngrrn 6
<210> 204
<211> 6
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> A或G
<400> 204
nngrrt 6
<210> 205
<211> 6
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C、或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (6)..(6)
<223> A, G,或C
<400> 205
nngrrv 6
<210> 206
<400> 206
000
<210> 207
<400> 207
000
<210> 208
<400> 208
000
<210> 209
<400> 209
000
<210> 210
<400> 210
000
<210> 211
<400> 211
000
<210> 212
<400> 212
000
<210> 213
<400> 213
000
<210> 214
<400> 214
000
<210> 215
<400> 215
000
<210> 216
<400> 216
000
<210> 217
<400> 217
000
<210> 218
<400> 218
000
<210> 219
<400> 219
000
<210> 220
<400> 220
000
<210> 221
<400> 221
000
<210> 222
<400> 222
000
<210> 223
<400> 223
000
<210> 224
<400> 224
000
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<400> 229
000
<210> 230
<400> 230
000
<210> 231
<400> 231
000
<210> 232
<400> 232
000
<210> 233
<400> 233
000
<210> 234
<400> 234
000
<210> 235
<400> 235
000
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 251
gaaggaaacu agcuaaa 17
<210> 252
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 252
ggagaaggaa acuagcuaaa 20
<210> 253
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 253
gggagaagga aacuagcuaa 20
<210> 254
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 254
guauccucua ugaugggaga 20
<210> 255
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 255
guuuccuucu cccaucauag 20
<210> 256
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 256
guccugguau ccucuaugau 20
<210> 257
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 257
agaaggaaac uagcuaa 17
<210> 258
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 258
uccucuauga ugggaga 17
<210> 259
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 259
ccugguaucc ucuauga 17
<210> 260
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 260
ccaucauaga ggauacc 17
<210> 261
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 261
uccuucuccc aucauag 17
<210> 262
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 262
uagcaguauc cucuugg 17
<210> 263
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 263
uuagcaguau ccucuug 17
<210> 264
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 264
aacuggaaug acugaau 17
<210> 265
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 265
cugguauccu cuaugau 17
<210> 266
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 266
aauuagcagu auccucu 17
<210> 267
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 267
auuagcagua uccucuu 17
<210> 268
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 268
aguccuggua uccucuauga 20
<210> 269
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 269
cucccaucau agaggauacc 20
<210> 270
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 270
aauuagcagu auccucuugg 20
<210> 271
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 271
aaauuagcag uauccucuug 20
<210> 272
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 272
aaaaacugga augacugaau 20
<210> 273
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 273
aaaaauuagc aguauccucu 20
<210> 274
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 274
aaaauuagca guauccucuu 20
<210> 275
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 275
gaaucggaac aaggcaa 17
<210> 276
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 276
gaccaauagc cuugaca 17
<210> 277
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 277
ggcuauuggu caaggca 17
<210> 278
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 278
gucaaggcua uugguca 17
<210> 279
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 279
guguguggaa cugcuga 17
<210> 280
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 280
gggccggcgg cuggcua 17
<210> 281
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 281
gaguauccag ugaggcc 17
<210> 282
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 282
gcugacaaaa gaagucc 17
<210> 283
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 283
ggccaggggc cggcggc 17
<210> 284
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 284
gggaaggggc ccccaag 17
<210> 285
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 285
gagauagugu ggggaag 17
<210> 286
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 286
guauccagug aggccag 17
<210> 287
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 287
gugaggccag gggccgg 17
<210> 288
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 288
gcuggccaac ccauggg 17
<210> 289
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 289
ggcuaaacuc cacccau 17
<210> 290
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 290
ggauacucua agacuau 17
<210> 291
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 291
ggggccggcg gcuggcu 17
<210> 292
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 292
ggcuagggau gaagaauaaa 20
<210> 293
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 293
gagugugugg aacugcugaa 20
<210> 294
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 294
ggaaugacug aaucggaaca 20
<210> 295
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 295
gcauugagau agugugggga 20
<210> 296
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 296
gcuauugguc aaggcaaggc 20
<210> 297
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 297
guggggaagg ggcccccaag 20
<210> 298
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 298
ggcaaggcug gccaacccau 20
<210> 299
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 299
guuugccuug ucaaggcuau 20
<210> 300
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 300
gcuaaacucc acccaugggu 20
<210> 301
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 301
caaauaucug ucugaaa 17
<210> 302
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 302
uagggaugaa gaauaaa 17
<210> 303
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 303
ugagauagug uggggaa 17
<210> 304
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 304
uguguggaac ugcugaa 17
<210> 305
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 305
augacugaau cggaaca 17
<210> 306
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 306
caaggcuggc caaccca 17
<210> 307
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 307
uggcuaaacu ccaccca 17
<210> 308
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 308
uggguggagu uuagcca 17
<210> 309
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 309
aguauccagu gaggcca 17
<210> 310
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 310
ucaaguuugc cuuguca 17
<210> 311
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 311
uugagauagu gugggga 17
<210> 312
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 312
auaaauuaga gaaaaac 17
<210> 313
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 313
ccggccccug gccucac 17
<210> 314
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 314
agccagccgc cggcccc 17
<210> 315
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 315
cugucugaaa cgguccc 17
<210> 316
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 316
auggguggag uuuagcc 17
<210> 317
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 317
caucccuagc cagccgc 17
<210> 318
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 318
auuggucaag gcaaggc 17
<210> 319
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 319
ccagugaggc caggggc 17
<210> 320
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 320
uuccacacac ucgcuuc 17
<210> 321
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 321
cgcuucugga acgucug 17
<210> 322
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 322
ucuuagagua uccagug 17
<210> 323
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 323
uuugcauuga gauagug 17
<210> 324
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 324
uuccagaagc gagugug 17
<210> 325
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 325
ugcauugaga uagugug 17
<210> 326
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 326
aaggcuggcc aacccau 17
<210> 327
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 327
ugccuuguca aggcuau 17
<210> 328
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 328
aaacuccacc caugggu 17
<210> 329
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 329
uugcauugag auagugu 17
<210> 330
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 330
augcaaauau cugucugaaa 20
<210> 331
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 331
acugaaucgg aacaaggcaa 20
<210> 332
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 332
cauugagaua guguggggaa 20
<210> 333
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 333
cuugaccaau agccuugaca 20
<210> 334
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 334
aggcaaggcu ggccaaccca 20
<210> 335
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 335
cccuggcuaa acuccaccca 20
<210> 336
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 336
ccaugggugg aguuuagcca 20
<210> 337
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 337
uagaguaucc agugaggcca 20
<210> 338
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 338
caaggcuauu ggucaaggca 20
<210> 339
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 339
cuugucaagg cuauugguca 20
<210> 340
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 340
uggucaaguu ugccuuguca 20
<210> 341
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 341
cgagugugug gaacugcuga 20
<210> 342
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 342
caggggccgg cggcuggcua 20
<210> 343
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 343
agaauaaauu agagaaaaac 20
<210> 344
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 344
ccgccggccc cuggccucac 20
<210> 345
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 345
ccuagccagc cgccggcccc 20
<210> 346
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 346
uaucugucug aaacgguccc 20
<210> 347
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 347
cccaugggug gaguuuagcc 20
<210> 348
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 348
uuagaguauc cagugaggcc 20
<210> 349
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 349
acggcugaca aaagaagucc 20
<210> 350
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 350
cuucaucccu agccagccgc 20
<210> 351
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 351
ugaggccagg ggccggcggc 20
<210> 352
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 352
uauccaguga ggccaggggc 20
<210> 353
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 353
caguuccaca cacucgcuuc 20
<210> 354
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 354
auugagauag uguggggaag 20
<210> 355
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 355
agaguaucca gugaggccag 20
<210> 356
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 356
ccagugaggc caggggccgg 20
<210> 357
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 357
aaggcuggcc aacccauggg 20
<210> 358
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 358
acucgcuucu ggaacgucug 20
<210> 359
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 359
uagucuuaga guauccagug 20
<210> 360
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 360
auauuugcau ugagauagug 20
<210> 361
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 361
acguuccaga agcgagugug 20
<210> 362
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 362
auuugcauug agauagugug 20
<210> 363
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 363
ccuggcuaaa cuccacccau 20
<210> 364
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 364
acuggauacu cuaagacuau 20
<210> 365
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 365
ccaggggccg gcggcuggcu 20
<210> 366
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 366
uauuugcauu gagauagugu 20
<210> 367
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 367
guuuccuucu cccaucaua 19
<210> 368
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 368
gcuaguuucc uucucccauc aua 23
<210> 369
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 369
gaauaaauua gagaaaaac 19
<210> 370
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 370
gaagaauaaa uuagagaaaa ac 22
<210> 371
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 371
ggaagaauaa auuagagaaa aac 23
<210> 372
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 372
gggaagaaua aauuagagaa aaac 24
<210> 373
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 373
gaaggaaacu agcuaaaggg 20
<210> 374
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 374
gagaaggaaa cuagcuaaag gg 22
<210> 375
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 375
ggagaaggaa acuagcuaaa ggg 23
<210> 376
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 376
gggagaagga aacuagcuaa aggg 24
<210> 377
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 377
uuuccuucuc ccaucaua 18
<210> 378
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 378
aguuuccuuc ucccaucaua 20
<210> 379
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 379
uaguuuccuu cucccaucau a 21
<210> 380
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 380
cuaguuuccu ucucccauca ua 22
<210> 381
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 381
agcuaguuuc cuucucccau caua 24
<210> 382
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 382
agagaaaaac uggaauga 18
<210> 383
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 383
uagagaaaaa cuggaauga 19
<210> 384
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 384
uuagagaaaa acuggaauga 20
<210> 385
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 385
auuagagaaa aacuggaaug a 21
<210> 386
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 386
aauuagagaa aaacuggaau ga 22
<210> 387
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 387
aaauuagaga aaaacuggaa uga 23
<210> 388
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 388
uaaauuagag aaaaacugga auga 24
<210> 389
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 389
aauaaauuag agaaaaac 18
<210> 390
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 390
aagaauaaau uagagaaaaa c 21
<210> 391
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 391
aggaaacuag cuaaaggg 18
<210> 392
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 392
aaggaaacua gcuaaaggg 19
<210> 393
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 393
agaaggaaac uagcuaaagg g 21
<210> 394
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 394
uggggaaggg gcccccaa 18
<210> 395
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 395
guggggaagg ggcccccaa 19
<210> 396
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 396
uguggggaag gggcccccaa 20
<210> 397
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 397
guguggggaa ggggccccca a 21
<210> 398
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 398
agugugggga aggggccccc aa 22
<210> 399
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 399
uagugugggg aaggggcccc caa 23
<210> 400
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 400
auaguguggg gaaggggccc ccaa 24
<210> 401
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 401
accucagacg uuccagaa 18
<210> 402
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 402
aaccucagac guuccagaa 19
<210> 403
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 403
uaaccucaga cguuccagaa 20
<210> 404
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 404
auaaccucag acguuccaga a 21
<210> 405
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 405
gauaaccuca gacguuccag aa 22
<210> 406
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 406
ugauaaccuc agacguucca gaa 23
<210> 407
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 407
uugauaaccu cagacguucc agaa 24
<210> 408
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 408
cgccggcccc uggccuca 18
<210> 409
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 409
ccgccggccc cuggccuca 19
<210> 410
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 410
gccgccggcc ccuggccuca 20
<210> 411
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 411
agccgccggc cccuggccuc a 21
<210> 412
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 412
cagccgccgg ccccuggccu ca 22
<210> 413
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 413
ccagccgccg gccccuggcc uca 23
<210> 414
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 414
gccagccgcc ggccccuggc cuca 24
<210> 415
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 415
ggcaaggcug gccaaccc 18
<210> 416
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 416
aggcaaggcu ggccaaccc 19
<210> 417
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 417
aaggcaaggc uggccaaccc 20
<210> 418
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 418
caaggcaagg cuggccaacc c 21
<210> 419
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 419
ucaaggcaag gcuggccaac cc 22
<210> 420
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 420
gucaaggcaa ggcuggccaa ccc 23
<210> 421
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 421
ggucaaggca aggcuggcca accc 24
<210> 422
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 422
ggcuggccaa cccauggg 18
<210> 423
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 423
aggcuggcca acccauggg 19
<210> 424
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 424
caaggcuggc caacccaugg g 21
<210> 425
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 425
gcaaggcugg ccaacccaug gg 22
<210> 426
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 426
ggcaaggcug gccaacccau ggg 23
<210> 427
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 427
aggcaaggcu ggccaaccca uggg 24
<210> 428
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 428
gagugugugg aacugcug 18
<210> 429
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 429
cgagugugug gaacugcug 19
<210> 430
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 430
gcgagugugu ggaacugcug 20
<210> 431
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 431
agcgagugug uggaacugcu g 21
<210> 432
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 432
aagcgagugu guggaacugc ug 22
<210> 433
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 433
gaagcgagug uguggaacug cug 23
<210> 434
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 434
agaagcgagu guguggaacu gcug 24
<210> 435
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 435
ccuggcuaaa cuccaccc 18
<210> 436
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 436
cccuggcuaa acuccaccc 19
<210> 437
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 437
ucccuggcua aacuccaccc 20
<210> 438
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 438
gucccuggcu aaacuccacc c 21
<210> 439
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 439
ggucccuggc uaaacuccac cc 22
<210> 440
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 440
cggucccugg cuaaacucca ccc 23
<210> 441
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 441
acggucccug gcuaaacucc accc 24
<210> 442
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 442
ggcggcuggc uagggaug 18
<210> 443
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 443
cggcggcugg cuagggaug 19
<210> 444
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 444
ccggcggcug gcuagggaug 20
<210> 445
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 445
gccggcggcu ggcuagggau g 21
<210> 446
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 446
ggccggcggc uggcuaggga ug 22
<210> 447
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 447
gggccggcgg cuggcuaggg aug 23
<210> 448
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 448
ggggccggcg gcuggcuagg gaug 24
<210> 449
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 449
aggggccggc ggcuggcu 18
<210> 450
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 450
caggggccgg cggcuggcu 19
<210> 451
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 451
gccaggggcc ggcggcuggc u 21
<210> 452
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 452
ggccaggggc cggcggcugg cu 22
<210> 453
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 453
aggccagggg ccggcggcug gcu 23
<210> 454
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 454
gaggccaggg gccggcggcu ggcu 24
<210> 455
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 455
aaacuugacc aauagucu 18
<210> 456
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 456
caaacuugac caauagucu 19
<210> 457
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 457
gcaaacuuga ccaauagucu 20
<210> 458
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 458
ggcaaacuug accaauaguc u 21
<210> 459
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 459
aggcaaacuu gaccaauagu cu 22
<210> 460
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 460
aaggcaaacu ugaccaauag ucu 23
<210> 461
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 461
caaggcaaac uugaccaaua gucu 24
<210> 462
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 462
uucagacaga uauuugca 18
<210> 463
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 463
uuucagacag auauuugca 19
<210> 464
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 464
guuucagaca gauauuugca 20
<210> 465
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 465
cguuucagac agauauuugc a 21
<210> 466
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 466
ccguuucaga cagauauuug ca 22
<210> 467
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 467
accguuucag acagauauuu gca 23
<210> 468
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 468
gaccguuuca gacagauauu ugca 24
<210> 469
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 469
aguuuccuuc ucccauca 18
<210> 470
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 470
uaguuuccuu cucccauca 19
<210> 471
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 471
cuaguuuccu ucucccauca 20
<210> 472
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 472
gcuaguuucc uucucccauc a 21
<210> 473
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 473
agcuaguuuc cuucucccau ca 22
<210> 474
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 474
uagcuaguuu ccuucuccca uca 23
<210> 475
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 475
uuagcuaguu uccuucuccc auca 24
<210> 476
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 476
auugagauag ugugggga 18
<210> 477
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 477
cauugagaua gugugggga 19
<210> 478
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 478
ugcauugaga uagugugggg a 21
<210> 479
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 479
uugcauugag auaguguggg ga 22
<210> 480
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 480
uuugcauuga gauagugugg gga 23
<210> 481
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 481
auuugcauug agauagugug ggga 24
<210> 482
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 482
ucccaucaua gaggauac 18
<210> 483
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 483
cucccaucau agaggauac 19
<210> 484
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 484
ucucccauca uagaggauac 20
<210> 485
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 485
uucucccauc auagaggaua c 21
<210> 486
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 486
cuucucccau cauagaggau ac 22
<210> 487
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 487
ccuucuccca ucauagagga uac 23
<210> 488
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 488
uccuucuccc aucauagagg auac 24
<210> 489
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 489
uguggggaag gggccccc 18
<210> 490
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 490
guguggggaa ggggccccc 19
<210> 491
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 491
agugugggga aggggccccc 20
<210> 492
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 492
uagugugggg aaggggcccc c 21
<210> 493
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 493
auaguguggg gaaggggccc cc 22
<210> 494
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 494
gauagugugg ggaaggggcc ccc 23
<210> 495
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 495
agauagugug gggaaggggc cccc 24
<210> 496
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 496
caugggugga guuuagcc 18
<210> 497
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 497
ccaugggugg aguuuagcc 19
<210> 498
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 498
acccaugggu ggaguuuagc c 21
<210> 499
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 499
aacccauggg uggaguuuag cc 22
<210> 500
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 500
caacccaugg guggaguuua gcc 23
<210> 501
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 501
ccaacccaug gguggaguuu agcc 24
<210> 502
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 502
ccaugggugg aguuuagc 18
<210> 503
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 503
cccaugggug gaguuuagc 19
<210> 504
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 504
acccaugggu ggaguuuagc 20
<210> 505
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 505
aacccauggg uggaguuuag c 21
<210> 506
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 506
caacccaugg guggaguuua gc 22
<210> 507
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 507
ccaacccaug gguggaguuu agc 23
<210> 508
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 508
gccaacccau ggguggaguu uagc 24
<210> 509
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 509
ugauaaccuc agacguuc 18
<210> 510
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 510
uugauaaccu cagacguuc 19
<210> 511
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 511
auugauaacc ucagacguuc 20
<210> 512
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 512
uauugauaac cucagacguu c 21
<210> 513
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 513
uuauugauaa ccucagacgu uc 22
<210> 514
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 514
cuuauugaua accucagacg uuc 23
<210> 515
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 515
gcuuauugau aaccucagac guuc 24
<210> 516
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 516
cauugagaua gugugggg 18
<210> 517
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 517
gcauugagau agugugggg 19
<210> 518
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 518
ugcauugaga uagugugggg 20
<210> 519
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 519
uugcauugag auaguguggg g 21
<210> 520
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 520
uuugcauuga gauagugugg gg 22
<210> 521
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 521
auuugcauug agauagugug ggg 23
<210> 522
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 522
uauuugcauu gagauagugu gggg 24
<210> 523
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 523
aggcuggcca acccaugg 18
<210> 524
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 524
aaggcuggcc aacccaugg 19
<210> 525
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 525
caaggcuggc caacccaugg 20
<210> 526
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 526
gcaaggcugg ccaacccaug g 21
<210> 527
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 527
ggcaaggcug gccaacccau gg 22
<210> 528
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 528
aggcaaggcu ggccaaccca ugg 23
<210> 529
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 529
aaggcaaggc uggccaaccc augg 24
<210> 530
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 530
agcgagugug uggaacug 18
<210> 531
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 531
aagcgagugu guggaacug 19
<210> 532
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 532
gaagcgagug uguggaacug 20
<210> 533
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 533
agaagcgagu guguggaacu g 21
<210> 534
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 534
cagaagcgag uguguggaac ug 22
<210> 535
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 535
ccagaagcga guguguggaa cug 23
<210> 536
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 536
uccagaagcg agugugugga acug 24
<210> 537
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 537
auuugcauug agauagug 18
<210> 538
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 538
uauuugcauu gagauagug 19
<210> 539
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 539
gauauuugca uugagauagu g 21
<210> 540
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 540
agauauuugc auugagauag ug 22
<210> 541
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 541
cagauauuug cauugagaua gug 23
<210> 542
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 542
acagauauuu gcauugagau agug 24
<210> 543
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 543
guuccagaag cgagugug 18
<210> 544
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 544
cguuccagaa gcgagugug 19
<210> 545
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 545
gacguuccag aagcgagugu g 21
<210> 546
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 546
agacguucca gaagcgagug ug 22
<210> 547
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 547
cagacguucc agaagcgagu gug 23
<210> 548
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 548
ucagacguuc cagaagcgag ugug 24
<210> 549
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 549
uugcauugag auagugug 18
<210> 550
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 550
uuugcauuga gauagugug 19
<210> 551
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 551
uauuugcauu gagauagugu g 21
<210> 552
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 552
auauuugcau ugagauagug ug 22
<210> 553
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 553
gauauuugca uugagauagu gug 23
<210> 554
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 554
agauauuugc auugagauag ugug 24
<210> 555
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 555
uauuugcauu gagauagu 18
<210> 556
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 556
auauuugcau ugagauagu 19
<210> 557
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 557
gauauuugca uugagauagu 20
<210> 558
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 558
agauauuugc auugagauag u 21
<210> 559
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 559
cagauauuug cauugagaua gu 22
<210> 560
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 560
acagauauuu gcauugagau agu 23
<210> 561
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 561
gacagauauu ugcauugaga uagu 24
<210> 562
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 562
cguuccagaa gcgagugu 18
<210> 563
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 563
acguuccaga agcgagugu 19
<210> 564
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 564
gacguuccag aagcgagugu 20
<210> 565
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 565
agacguucca gaagcgagug u 21
<210> 566
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 566
cagacguucc agaagcgagu gu 22
<210> 567
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 567
ucagacguuc cagaagcgag ugu 23
<210> 568
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 568
cucagacguu ccagaagcga gugu 24
<210> 569
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 569
uuugcauuga gauagugu 18
<210> 570
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 570
auuugcauug agauagugu 19
<210> 571
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 571
auauuugcau ugagauagug u 21
<210> 572
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 572
gauauuugca uugagauagu gu 22
<210> 573
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 573
agauauuugc auugagauag ugu 23
<210> 574
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 574
cagauauuug cauugagaua gugu 24
<210> 575
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 575
gaauaaauua gagaaaaa 18
<210> 576
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 576
agaauaaauu agagaaaaa 19
<210> 577
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 577
aagaauaaau uagagaaaaa 20
<210> 578
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 578
gaagaauaaa uuagagaaaa a 21
<210> 579
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 579
ggaagaauaa auuagagaaa aa 22
<210> 580
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 580
gggaagaaua aauuagagaa aaa 23
<210> 581
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 581
agggaagaau aaauuagaga aaaa 24
<210> 582
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 582
cuagggauga agaauaaa 18
<210> 583
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 583
gcuagggaug aagaauaaa 19
<210> 584
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 584
uggcuaggga ugaagaauaa a 21
<210> 585
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 585
cuggcuaggg augaagaaua aa 22
<210> 586
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 586
gcuggcuagg gaugaagaau aaa 23
<210> 587
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 587
ggcuggcuag ggaugaagaa uaaa 24
<210> 588
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 588
agaaggaaac uagcuaaa 18
<210> 589
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 589
gagaaggaaa cuagcuaaa 19
<210> 590
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 590
gggagaagga aacuagcuaa a 21
<210> 591
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 591
ugggagaagg aaacuagcua aa 22
<210> 592
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 592
augggagaag gaaacuagcu aaa 23
<210> 593
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 593
gaugggagaa ggaaacuagc uaaa 24
<210> 594
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 594
aaaacuggaa ugacugaa 18
<210> 595
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 595
aaaaacugga augacugaa 19
<210> 596
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 596
gaaaaacugg aaugacugaa 20
<210> 597
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 597
agaaaaacug gaaugacuga a 21
<210> 598
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 598
gagaaaaacu ggaaugacug aa 22
<210> 599
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 599
agagaaaaac uggaaugacu gaa 23
<210> 600
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 600
uagagaaaaa cuggaaugac ugaa 24
<210> 601
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 601
gcuagggaug aagaauaa 18
<210> 602
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 602
ggcuagggau gaagaauaa 19
<210> 603
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 603
uggcuaggga ugaagaauaa 20
<210> 604
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 604
cuggcuaggg augaagaaua a 21
<210> 605
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 605
gcuggcuagg gaugaagaau aa 22
<210> 606
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 606
ggcuggcuag ggaugaagaa uaa 23
<210> 607
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 607
cggcuggcua gggaugaaga auaa 24
<210> 608
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 608
gagaaggaaa cuagcuaa 18
<210> 609
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 609
ggagaaggaa acuagcuaa 19
<210> 610
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 610
ugggagaagg aaacuagcua a 21
<210> 611
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 611
augggagaag gaaacuagcu aa 22
<210> 612
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 612
gaugggagaa ggaaacuagc uaa 23
<210> 613
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 613
ugaugggaga aggaaacuag cuaa 24
<210> 614
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 614
auagucuuag aguaucca 18
<210> 615
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 615
aauagucuua gaguaucca 19
<210> 616
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 616
caauagucuu agaguaucca 20
<210> 617
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 617
ccaauagucu uagaguaucc a 21
<210> 618
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 618
accaauaguc uuagaguauc ca 22
<210> 619
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 619
gaccaauagu cuuagaguau cca 23
<210> 620
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 620
ugaccaauag ucuuagagua ucca 24
<210> 621
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 621
auccucuaug augggaga 18
<210> 622
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 622
uauccucuau gaugggaga 19
<210> 623
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 623
gguauccucu augaugggag a 21
<210> 624
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 624
ugguauccuc uaugauggga ga 22
<210> 625
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 625
cugguauccu cuaugauggg aga 23
<210> 626
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 626
ccugguaucc ucuaugaugg gaga 24
<210> 627
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 627
uccugguauc cucuauga 18
<210> 628
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 628
guccugguau ccucuauga 19
<210> 629
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 629
aaguccuggu auccucuaug a 21
<210> 630
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 630
gaaguccugg uauccucuau ga 22
<210> 631
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 631
agaaguccug guauccucua uga 23
<210> 632
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 632
aagaaguccu gguauccucu auga 24
<210> 633
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 633
ggagaaggaa acuagcua 18
<210> 634
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 634
gggagaagga aacuagcua 19
<210> 635
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 635
ugggagaagg aaacuagcua 20
<210> 636
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 636
augggagaag gaaacuagcu a 21
<210> 637
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 637
gaugggagaa ggaaacuagc ua 22
<210> 638
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 638
ugaugggaga aggaaacuag cua 23
<210> 639
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 639
augaugggag aaggaaacua gcua 24
<210> 640
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 640
aaagggaaga auaaauua 18
<210> 641
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 641
uaaagggaag aauaaauua 19
<210> 642
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 642
cuaaagggaa gaauaaauua 20
<210> 643
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 643
gcuaaaggga agaauaaauu a 21
<210> 644
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 644
agcuaaaggg aagaauaaau ua 22
<210> 645
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 645
uagcuaaagg gaagaauaaa uua 23
<210> 646
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 646
cuagcuaaag ggaagaauaa auua 24
<210> 647
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 647
agaguaucca gugaggcc 18
<210> 648
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 648
uagaguaucc agugaggcc 19
<210> 649
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 649
cuuagaguau ccagugaggc c 21
<210> 650
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 650
ucuuagagua uccagugagg cc 22
<210> 651
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 651
gucuuagagu auccagugag gcc 23
<210> 652
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 652
agucuuagag uauccaguga ggcc 24
<210> 653
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 653
uagaguaucc agugaggc 18
<210> 654
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 654
uuagaguauc cagugaggc 19
<210> 655
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 655
cuuagaguau ccagugaggc 20
<210> 656
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 656
ucuuagagua uccagugagg c 21
<210> 657
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 657
gucuuagagu auccagugag gc 22
<210> 658
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 658
agucuuagag uauccaguga ggc 23
<210> 659
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 659
uagucuuaga guauccagug aggc 24
<210> 660
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 660
caggggccgg cggcuggc 18
<210> 661
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 661
ccaggggccg gcggcuggc 19
<210> 662
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 662
gccaggggcc ggcggcuggc 20
<210> 663
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 663
ggccaggggc cggcggcugg c 21
<210> 664
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 664
aggccagggg ccggcggcug gc 22
<210> 665
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 665
gaggccaggg gccggcggcu ggc 23
<210> 666
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 666
ugaggccagg ggccggcggc uggc 24
<210> 667
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 667
aaaauuagca guauccuc 18
<210> 668
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 668
aaaaauuagc aguauccuc 19
<210> 669
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 669
aaaaaauuag caguauccuc 20
<210> 670
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 670
aaaaaaauua gcaguauccu c 21
<210> 671
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 671
aaaaaaaauu agcaguaucc uc 22
<210> 672
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 672
uaaaaaaaau uagcaguauc cuc 23
<210> 673
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 673
auaaaaaaaa uuagcaguau ccuc 24
<210> 674
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 674
guuccacaca cucgcuuc 18
<210> 675
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 675
aguuccacac acucgcuuc 19
<210> 676
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 676
gcaguuccac acacucgcuu c 21
<210> 677
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 677
agcaguucca cacacucgcu uc 22
<210> 678
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 678
cagcaguucc acacacucgc uuc 23
<210> 679
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 679
ucagcaguuc cacacacucg cuuc 24
<210> 680
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 680
uauccucuau gaugggag 18
<210> 681
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 681
guauccucua ugaugggag 19
<210> 682
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 682
gguauccucu augaugggag 20
<210> 683
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 683
ugguauccuc uaugauggga g 21
<210> 684
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 684
cugguauccu cuaugauggg ag 22
<210> 685
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 685
ccugguaucc ucuaugaugg gag 23
<210> 686
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 686
uccugguauc cucuaugaug ggag 24
<210> 687
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 687
gccggcggcu ggcuaggg 18
<210> 688
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 688
ggccggcggc uggcuaggg 19
<210> 689
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 689
gggccggcgg cuggcuaggg 20
<210> 690
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 690
ggggccggcg gcuggcuagg g 21
<210> 691
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 691
aggggccggc ggcuggcuag gg 22
<210> 692
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 692
caggggccgg cggcuggcua ggg 23
<210> 693
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 693
ccaggggccg gcggcuggcu aggg 24
<210> 694
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 694
ugguauccuc uaugaugg 18
<210> 695
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 695
cugguauccu cuaugaugg 19
<210> 696
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 696
ccugguaucc ucuaugaugg 20
<210> 697
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 697
uccugguauc cucuaugaug g 21
<210> 698
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 698
guccugguau ccucuaugau gg 22
<210> 699
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 699
aguccuggua uccucuauga ugg 23
<210> 700
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 700
aaguccuggu auccucuaug augg 24
<210> 701
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 701
guccugguau ccucuaug 18
<210> 702
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 702
aguccuggua uccucuaug 19
<210> 703
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 703
aaguccuggu auccucuaug 20
<210> 704
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 704
gaaguccugg uauccucuau g 21
<210> 705
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 705
agaaguccug guauccucua ug 22
<210> 706
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 706
aagaaguccu gguauccucu aug 23
<210> 707
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 707
aaagaagucc ugguauccuc uaug 24
<210> 708
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 708
cuaaagggaa gaauaaau 18
<210> 709
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 709
gcuaaaggga agaauaaau 19
<210> 710
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 710
agcuaaaggg aagaauaaau 20
<210> 711
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 711
uagcuaaagg gaagaauaaa u 21
<210> 712
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 712
cuagcuaaag ggaagaauaa au 22
<210> 713
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 713
acuagcuaaa gggaagaaua aau 23
<210> 714
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 714
aacuagcuaa agggaagaau aaau 24
<210> 715
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 715
aaacuggaau gacugaau 18
<210> 716
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 716
aaaacuggaa ugacugaau 19
<210> 717
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 717
gaaaaacugg aaugacugaa u 21
<210> 718
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 718
agaaaaacug gaaugacuga au 22
<210> 719
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 719
gagaaaaacu ggaaugacug aau 23
<210> 720
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 720
agagaaaaac uggaaugacu gaau 24
<210> 721
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 721
ccugguaucc ucuaugau 18
<210> 722
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 722
uccugguauc cucuaugau 19
<210> 723
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 723
aguccuggua uccucuauga u 21
<210> 724
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 724
aaguccuggu auccucuaug au 22
<210> 725
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 725
gaaguccugg uauccucuau gau 23
<210> 726
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 726
agaaguccug guauccucua ugau 24
<210> 727
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 727
aaauuagcag uauccucu 18
<210> 728
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 728
aaaauuagca guauccucu 19
<210> 729
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 729
aaaaaauuag caguauccuc u 21
<210> 730
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 730
aaaaaaauua gcaguauccu cu 22
<210> 731
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 731
aaaaaaaauu agcaguaucc ucu 23
<210> 732
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 732
uaaaaaaaau uagcaguauc cucu 24
<210> 733
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 733
cacucgcuuc uggaacgu 18
<210> 734
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 734
acacucgcuu cuggaacgu 19
<210> 735
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 735
cacacucgcu ucuggaacgu 20
<210> 736
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 736
acacacucgc uucuggaacg u 21
<210> 737
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 737
cacacacucg cuucuggaac gu 22
<210> 738
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 738
ccacacacuc gcuucuggaa cgu 23
<210> 739
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 739
uccacacacu cgcuucugga acgu 24
<210> 740
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 740
cucaaugcaa auaucugu 18
<210> 741
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 741
ucucaaugca aauaucugu 19
<210> 742
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 742
aucucaaugc aaauaucugu 20
<210> 743
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 743
uaucucaaug caaauaucug u 21
<210> 744
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 744
cuaucucaau gcaaauaucu gu 22
<210> 745
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 745
acuaucucaa ugcaaauauc ugu 23
<210> 746
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 746
cacuaucuca augcaaauau cugu 24
<210> 747
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 747
aguuccacac acucgcuu 18
<210> 748
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 748
caguuccaca cacucgcuu 19
<210> 749
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 749
gcaguuccac acacucgcuu 20
<210> 750
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 750
agcaguucca cacacucgcu u 21
<210> 751
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 751
cagcaguucc acacacucgc uu 22
<210> 752
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 752
ucagcaguuc cacacacucg cuu 23
<210> 753
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 753
uucagcaguu ccacacacuc gcuu 24
<210> 754
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 754
aauuagcagu auccucuu 18
<210> 755
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 755
aaauuagcag uauccucuu 19
<210> 756
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 756
aaaaauuagc aguauccucu u 21
<210> 757
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 757
aaaaaauuag caguauccuc uu 22
<210> 758
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 758
aaaaaaauua gcaguauccu cuu 23
<210> 759
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 759
aaaaaaaauu agcaguaucc ucuu 24
<210> 760
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 760
gaagaaaacu agcuaaa 17
<210> 761
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 761
gcagcaguau ccucuug 17
<210> 762
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 762
ggagaagaaa acuagcuaaa 20
<210> 763
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 763
gggagaagaa aacuagcuaa 20
<210> 764
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 764
guccugguau cuucuauggu 20
<210> 765
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 765
agaagaaaac uagcuaa 17
<210> 766
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 766
aguccuggua ucuucua 17
<210> 767
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 767
ccaccauaga agauacc 17
<210> 768
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 768
ccugguaucu ucuaugg 17
<210> 769
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 769
cagcaguauc cucuugg 17
<210> 770
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 770
aauuggaaug acugaau 17
<210> 771
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 771
cugguaucuu cuauggu 17
<210> 772
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 772
agcagcagua uccucuu 17
<210> 773
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 773
agaaguccug guaucuucua 20
<210> 774
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 774
cucccaccau agaagauacc 20
<210> 775
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 775
aguccuggua ucuucuaugg 20
<210> 776
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 776
aagcagcagu auccucuugg 20
<210> 777
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 777
uaagcagcag uauccucuug 20
<210> 778
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 778
agaauaaauu agagaaaaau 20
<210> 779
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 779
aaaaauugga augacugaau 20
<210> 780
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 780
auuaagcagc aguauccucu 20
<210> 781
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 781
uuaagcagca guauccucuu 20
<210> 782
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 782
auaaauuaga gaaaaau 17
<210> 783
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 783
aagcagcagu auccucu 17
<210> 784
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 784
gaagaaaacu agcuaaaggg 20
<210> 785
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 785
gagaagaaaa cuagcuaaag gg 22
<210> 786
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 786
ggagaagaaa acuagcuaaa ggg 23
<210> 787
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 787
gggagaagaa aacuagcuaa aggg 24
<210> 788
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 788
gaauaaauua gagaaaaau 19
<210> 789
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 789
gaagaauaaa uuagagaaaa au 22
<210> 790
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 790
ggaagaauaa auuagagaaa aau 23
<210> 791
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 791
gggaagaaua aauuagagaa aaau 24
<210> 792
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 792
agagaaaaau uggaauga 18
<210> 793
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 793
uagagaaaaa uuggaauga 19
<210> 794
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 794
uuagagaaaa auuggaauga 20
<210> 795
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 795
auuagagaaa aauuggaaug a 21
<210> 796
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 796
aauuagagaa aaauuggaau ga 22
<210> 797
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 797
aaauuagaga aaaauuggaa uga 23
<210> 798
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 798
uaaauuagag aaaaauugga auga 24
<210> 799
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 799
agaaaacuag cuaaaggg 18
<210> 800
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 800
aagaaaacua gcuaaaggg 19
<210> 801
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 801
agaagaaaac uagcuaaagg g 21
<210> 802
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 802
aauaaauuag agaaaaau 18
<210> 803
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 803
aagaauaaau uagagaaaaa u 21
<210> 804
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 804
aguuuucuuc ucccacca 18
<210> 805
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 805
uaguuuucuu cucccacca 19
<210> 806
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 806
cuaguuuucu ucucccacca 20
<210> 807
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 807
gcuaguuuuc uucucccacc a 21
<210> 808
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 808
agcuaguuuu cuucucccac ca 22
<210> 809
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 809
uagcuaguuu ucuucuccca cca 23
<210> 810
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 810
uuagcuaguu uucuucuccc acca 24
<210> 811
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 811
ucccaccaua gaagauac 18
<210> 812
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 812
cucccaccau agaagauac 19
<210> 813
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 813
ucucccacca uagaagauac 20
<210> 814
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 814
uucucccacc auagaagaua c 21
<210> 815
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 815
cuucucccac cauagaagau ac 22
<210> 816
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 816
ucuucuccca ccauagaaga uac 23
<210> 817
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 817
uucuucuccc accauagaag auac 24
<210> 818
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 818
agaagaaaac uagcuaaa 18
<210> 819
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 819
gagaagaaaa cuagcuaaa 19
<210> 820
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 820
gggagaagaa aacuagcuaa a 21
<210> 821
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 821
ugggagaaga aaacuagcua aa 22
<210> 822
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 822
gugggagaag aaaacuagcu aaa 23
<210> 823
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 823
ggugggagaa gaaaacuagc uaaa 24
<210> 824
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 824
aaaauuggaa ugacugaa 18
<210> 825
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 825
aaaaauugga augacugaa 19
<210> 826
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 826
gaaaaauugg aaugacugaa 20
<210> 827
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 827
agaaaaauug gaaugacuga a 21
<210> 828
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 828
gagaaaaauu ggaaugacug aa 22
<210> 829
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 829
agagaaaaau uggaaugacu gaa 23
<210> 830
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 830
uagagaaaaa uuggaaugac ugaa 24
<210> 831
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 831
gagaagaaaa cuagcuaa 18
<210> 832
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 832
ggagaagaaa acuagcuaa 19
<210> 833
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 833
ugggagaaga aaacuagcua a 21
<210> 834
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 834
gugggagaag aaaacuagcu aa 22
<210> 835
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 835
ggugggagaa gaaaacuagc uaa 23
<210> 836
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 836
uggugggaga agaaaacuag cuaa 24
<210> 837
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 837
ggagaagaaa acuagcua 18
<210> 838
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 838
gggagaagaa aacuagcua 19
<210> 839
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 839
ugggagaaga aaacuagcua 20
<210> 840
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 840
gugggagaag aaaacuagcu a 21
<210> 841
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 841
ggugggagaa gaaaacuagc ua 22
<210> 842
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 842
uggugggaga agaaaacuag cua 23
<210> 843
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 843
auggugggag aagaaaacua gcua 24
<210> 844
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 844
uuaagcagca guauccuc 18
<210> 845
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 845
auuaagcagc aguauccuc 19
<210> 846
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 846
aauuaagcag caguauccuc 20
<210> 847
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 847
aaauuaagca gcaguauccu c 21
<210> 848
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 848
aaaauuaagc agcaguaucc uc 22
<210> 849
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 849
aaaaauuaag cagcaguauc cuc 23
<210> 850
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 850
aaaaaauuaa gcagcaguau ccuc 24
<210> 851
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 851
uaucuucuau ggugggag 18
<210> 852
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 852
guaucuucua uggugggag 19
<210> 853
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 853
gguaucuucu auggugggag 20
<210> 854
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 854
ugguaucuuc uaugguggga g 21
<210> 855
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 855
cugguaucuu cuaugguggg ag 22
<210> 856
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 856
ccugguaucu ucuauggugg gag 23
<210> 857
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 857
uccugguauc uucuauggug ggag 24
<210> 858
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 858
uccugguauc uucuaugg 18
<210> 859
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 859
guccugguau cuucuaugg 19
<210> 860
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 860
aaguccuggu aucuucuaug g 21
<210> 861
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 861
gaaguccugg uaucuucuau gg 22
<210> 862
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 862
agaaguccug guaucuucua ugg 23
<210> 863
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 863
aagaaguccu gguaucuucu augg 24
<210> 864
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 864
ugguaucuuc uauggugg 18
<210> 865
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 865
cugguaucuu cuauggugg 19
<210> 866
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 866
ccugguaucu ucuauggugg 20
<210> 867
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 867
uccugguauc uucuauggug g 21
<210> 868
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 868
guccugguau cuucuauggu gg 22
<210> 869
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 869
aguccuggua ucuucuaugg ugg 23
<210> 870
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 870
aaguccuggu aucuucuaug gugg 24
<210> 871
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 871
guccugguau cuucuaug 18
<210> 872
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 872
aguccuggua ucuucuaug 19
<210> 873
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 873
aaguccuggu aucuucuaug 20
<210> 874
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 874
gaaguccugg uaucuucuau g 21
<210> 875
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 875
agaaguccug guaucuucua ug 22
<210> 876
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 876
aagaaguccu gguaucuucu aug 23
<210> 877
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 877
aaagaagucc ugguaucuuc uaug 24
<210> 878
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 878
aaauuggaau gacugaau 18
<210> 879
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 879
aaaauuggaa ugacugaau 19
<210> 880
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 880
gaaaaauugg aaugacugaa u 21
<210> 881
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 881
agaaaaauug gaaugacuga au 22
<210> 882
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 882
gagaaaaauu ggaaugacug aau 23
<210> 883
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 883
agagaaaaau uggaaugacu gaau 24
<210> 884
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 884
uaagcagcag uauccucu 18
<210> 885
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 885
uuaagcagca guauccucu 19
<210> 886
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 886
aauuaagcag caguauccuc u 21
<210> 887
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 887
aaauuaagca gcaguauccu cu 22
<210> 888
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 888
aaaauuaagc agcaguaucc ucu 23
<210> 889
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 889
aaaaauuaag cagcaguauc cucu 24
<210> 890
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 890
ccugguaucu ucuauggu 18
<210> 891
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 891
uccugguauc uucuauggu 19
<210> 892
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 892
aguccuggua ucuucuaugg u 21
<210> 893
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 893
aaguccuggu aucuucuaug gu 22
<210> 894
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 894
gaaguccugg uaucuucuau ggu 23
<210> 895
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 895
agaaguccug guaucuucua uggu 24
<210> 896
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 896
aagcagcagu auccucuu 18
<210> 897
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 897
uaagcagcag uauccucuu 19
<210> 898
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 898
auuaagcagc aguauccucu u 21
<210> 899
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 899
aauuaagcag caguauccuc uu 22
<210> 900
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 900
aaauuaagca gcaguauccu cuu 23
<210> 901
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 901
aaaauuaagc agcaguaucc ucuu 24
<210> 902
<211> 4758
<212> DNA
<213> 智人
<220>
<221> 尚未归类的特征
<222> (2716)..(2719)
<223> HPFH缺失位点(4 bp del -225至-222)
<220>
<221> 尚未归类的特征
<222> (2748)..(2753)
<223> GATA1结合模序
<220>
<221> 尚未归类的特征
<222> (2762)..(2767)
<223> GATA1结合模序
<220>
<221> 尚未归类的特征
<222> (2791)..(2799)
<223> FKLF转录因子结合模序
<220>
<221> 尚未归类的特征
<222> (2823)..(2830)
<223> CP1/Coup TFII结合模序
<220>
<221> 尚未归类的特征
<222> (2824)..(2836)
<223> HPFH缺失位点(13 bp del -114至-102)
<220>
<221> 尚未归类的特征
<222> (2991)..(2993)
<223> 起始密码子
<400> 902
tttaggaagt caaggtttag gcagggatag ccattctatt ttattagggg caatactatt 60
tccaacggca tctggctttt ctcagccctt gtgaggctct acagggaggt tgaggtgtta 120
gagatcagag caggaaacag gtttttcttt ccacggtaac tacaatgaag tgatccttac 180
tttactaagg aacttttcat tttaagtgtt gacgcatgcc taaagaggtg aaattaatcc 240
cataccctta agtctacaga ctggtcacag catttcaagg aggagacctc attgtaagct 300
tctagggagg tggggactta ggtgaaggaa atgagccagc agaagctcac aagtcagcat 360
cagcgtgtca tgtctcagca gcagaacagc acggtcagat gaaaatatag tgtgaagaat 420
ttgtataaca ttaattgaga aggcagattc actggagttc ttatataatt gaaagttaat 480
gcacgttaat aagcaagagt ttagtttaat gtgatggtgt tatgaactta acgcttgtgt 540
ctccagaaaa ttcacatgct gaatccccaa ctcccaattg gctccatttg tgggggaggc 600
tttggaaaag taatcaggtt tagaggagct catgagagca gatccccatc atagaattat 660
tttcctcatc agaagcagag agattagcca tttctcttcc ttctggtgag gacacagtgg 720
gaagtcagcc acctgcaacc caggaagaga gccctgacca ggaaccagca gaaaagtgag 780
aaaaaatcct gttgttgaag tcacccagtc tatgctattt tgttatagca ccttgcacta 840
agtaaggcag atgaagaaag agaaaaaaat aagcttcggt gttcagtgga ttagaaacca 900
tgtttatctc aggtttacaa atctccactt gtcctctgtg tttcagaata aaataccaac 960
tctactactc tcatctgtaa gatgcaaata gtaagcctga gcccttctgt ctaactttga 1020
attctatttt ttcttcaacg tactttaggc ttgtaatgtg tttatataca gtgaaatgtc 1080
aagttctttc tttatatttc tttctttctt ttttttcctc agcctcagag ttttccacat 1140
gcccttccta ctttcaggaa cttctttctc caaacgtctt ctgcctggct ccatcaaatc 1200
ataaaggacc cacttcaaat gccatcactc actaccattt cacaattcgc actttctttc 1260
tttgtccttt ttttttttag taaaacaagt ttataaaaaa ttgaaggaat aaatgaatgg 1320
ctacttcata ggcagagtag acgcaagggc tactggttgc cgatttttat tgttattttt 1380
caatagtatg ctaaacaagg ggtagattat ttatgctgcc catttttaga ccataaaaga 1440
taacttcctg atgttgccat ggcatttttt tccttttaat tttatttcat ttcattttaa 1500
tttcgaaggt acatgtgcag gatgtgcagg cttgttacat gggtaaatgt gtgtctttct 1560
ggccttttag ccatctgtat caatgagcag atataagctt tacacaggat catgaaggat 1620
gaaagaattt caccaatatt ataataattt caatcaacct gatagcttag gggataaact 1680
aatttgaaga tacagcttgc ctccgataag ccagaattcc agagcttctg gcattataat 1740
ctagcaaggt tagagatcat ggatcacttt cagagaaaaa caaaaacaaa ctaaccaaaa 1800
gcaaaacaga accaaaaaac caccataaat acttcctacc ctgttaatgg tccaatatgt 1860
cagaaacagc actgtgttag aaataaagct gtctaaagta cactaatatt cgagttataa 1920
tagtgtgtgg actattagtc aataaaaaca acccttgcct ctttagagtt gttttccatg 1980
tacacgcaca tcttatgtct tagagtaaga ttccctgaga agtgaaccta gcatttatac 2040
aagataatta attctaatcc acagtacctg ccaaagaaca ttctaccatc atctttactg 2100
agcatagaag agctacgcca aaaccctggg tcatcagcca gcacacacac ttatccagtg 2160
gtaaatacac atcatctggt gtatacatac atacctgaat atggaatcaa atatttttct 2220
aagatgaaac agtcatgatt tatttcaaat aggtacggat aagtagatat tgaggtaagc 2280
attaggtctt atattatgta acactaatct attactgcgc tgaaactgtg gctttataga 2340
aattgttttc actgcactat tgagaaatta agagataatg gcaaaagtca caaagagtat 2400
attcaaaaag aagtatagca ctttttcctt agaaaccact gctaactgaa agagactaag 2460
atttgtcccg tcaaaaatcc tggacctatg cctaaaacac atttcacaat ccctgaactt 2520
ttcaaaaatt ggtacatgct ttagctttaa actacaggcc tcactggagc tagagacaag 2580
aaggtaaaaa acggctgaca aaagaagtcc tggtatcctc tatgatggga gaaggaaact 2640
agctaaaggg aagaataaat tagagaaaaa ctggaatgac tgaatcggaa caaggcaaag 2700
gctataaaaa aaattagcag tatcctcttg ggggcccctt ccccacacta tctcaatgca 2760
aatatctgtc tgaaacggtc cctggctaaa ctccacccat gggttggcca gccttgcctt 2820
gaccaatagc cttgacaagg caaacttgac caatagtctt agagtatcca gtgaggccag 2880
gggccggcgg ctggctaggg atgaagaata aaaggaagca cccttcagca gttccacaca 2940
ctcgcttctg gaacgtctga ggttatcaat aagctcctag tccagacgcc atgggtcatt 3000
tcacagagga ggacaaggct actatcacaa gcctgtgggg caaggtgaat gtggaagatg 3060
ctggaggaga aaccctggga aggtaggctc tggtgaccag gacaagggag ggaaggaagg 3120
accctgtgcc tggcaaaagt ccaggtcgct tctcaggatt tgtggcacct tctgactgtc 3180
aaactgttct tgtcaatctc acaggctcct ggttgtctac ccatggaccc agaggttctt 3240
tgacagcttt ggcaacctgt cctctgcctc tgccatcatg ggcaacccca aagtcaaggc 3300
acatggcaag aaggtgctga cttccttggg agatgccaca aagcacctgg atgatctcaa 3360
gggcaccttt gcccagctga gtgaactgca ctgtgacaag ctgcatgtgg atcctgagaa 3420
cttcaaggtg agtccaggag atgtttcagc cctgttgcct ttagtctcga ggcaacttag 3480
acaacggagt attgatctga gcacagcagg gtgtgagctg tttgaagata ctggggttgg 3540
gggtgaagaa actgcagagg actaactggg ctgagaccca gtggtaatgt tttagggcct 3600
aaggagtgcc tctaaaaatc tagatggaca attttgactt tgagaaaaga gaggtggaaa 3660
tgaggaaaat gacttttctt tattagattc cagtagaaag aactttcatc tttccctcat 3720
ttttgttgtt ttaaaacatc tatctggagg caggacaagt atggtcgtta aaaagatgca 3780
ggcagaaggc atatattggc tcagtcaaag tggggaactt tggtggccaa acatacattg 3840
ctaaggctat tcctatatca gctggacaca tataaaatgc tgctaatgct tcattacaaa 3900
cttatatcct ttaattccag atgggggcaa agtatgtcca ggggtgagga acaattgaaa 3960
catttgggct ggagtagatt ttgaaagtca gctctgtgtg tgtgtgtgtg tgtgcgcgcg 4020
cgcgtgtgtg tgtgtgtgtc agcgtgtgtt tcttttaacg tcttcagcct acaacataca 4080
gggttcatgg tggcaagaag atagcaagat ttaaattatg gccagtgact agtgcttgaa 4140
ggggaacaac tacctgcatt taatgggaag gcaaaatctc aggctttgag ggaagttaac 4200
ataggcttga ttctgggtgg aagcttggtg tgtagttatc tggaggccag gctggagctc 4260
tcagctcact atgggttcat ctttattgtc tcctttcatc tcaacagctc ctgggaaatg 4320
tgctggtgac cgttttggca atccatttcg gcaaagaatt cacccctgag gtgcaggctt 4380
cctggcagaa gatggtgact gcagtggcca gtgccctgtc ctccagatac cactgagctc 4440
actgcccatg attcagagct ttcaaggata ggctttattc tgcaagcaat acaaataata 4500
aatctattct gctgagagat cacacatgat tttcttcagc tctttttttt acatcttttt 4560
aaatatatga gccacaaagg gtttatattg agggaagtgt gtatgtgtat ttctgcatgc 4620
ctgtttgtgt ttgtggtgtg tgcatgctcc tcatttattt ttatatgaga tgtgcatttt 4680
gatgagcaaa taaaagcagt aaagacactt gtacacggga gttctgcaag tgggagtaaa 4740
tggtgtagga gaaatccg 4758
<210> 903
<211> 4773
<212> DNA
<213> 智人
<220>
<221> 尚未归类的特征
<222> (1233)..(1238)
<223> GATA1结合位点
<220>
<221> 尚未归类的特征
<222> (2672)..(2677)
<223> GATA1结合位点
<220>
<221> 尚未归类的特征
<222> (2686)..(2691)
<223> GATA1结合位点
<220>
<221> 尚未归类的特征
<222> (2715)..(2723)
<223> FKLF转录因子结合模序
<220>
<221> 尚未归类的特征
<222> (2747)..(2754)
<223> CP1/Coup TFII结合模序
<220>
<221> 尚未归类的特征
<222> (2748)..(2760)
<223> HPFH缺失位点(13 bp del -114至-102)
<220>
<221> 尚未归类的特征
<222> (2915)..(2917)
<223> 起始密码子
<400> 903
ttatgtcatt accagagtta aaattctata atggcttctc actccctacc actgaggaca 60
agtttatgtc cttaggttta tgcttccctg aaacaatacc acctgctatt ctccacttta 120
catatcaacg gcactggttc tttatctaac tctctggcac agcaggagtt tgttttcttc 180
tgcttcagag ctttgaattt actatttcag cttctaaact ttatttggca atgccttccc 240
atggcagatt ccttctgtca ttttgcctct gttcgaatac tttctcctta atttcattct 300
tagttaataa tatctgaaat tattttgttg tttaacttaa ttattaattt tatgtatgtt 360
ctacctagat tataatcttc agaggaaagt tttattctct gacttattta acttaaatgc 420
ccactacttt aaaaattatg acatttattt aacagatatt tgctgaacaa atgtttgaaa 480
atacatggga aagaatgctt gaaaacactt gaaattgctt gtgtaaagaa acagttttat 540
cagttaggat ttaatcaatg tcagaagcaa tgatatagga aaaatcgagg aataagacag 600
ttatggataa ggagaaatca acaaactctt aaaagatatt gcctcaaaag cataagagga 660
aataagggtt tatacatgac ttttagaaca ctgccttggt ttttggataa atggggaagt 720
tgtttgaaaa caggagggat cctagatatt ccttagtctg aggaggagca attaagattc 780
acttgtttag aggctgggag tggtggctca cgcctgtaat cccagaattt tgggaggcca 840
aggcaggcag atcacctgag gtcaagagtt caagaccaac ctggccaaca tggtgaaatc 900
ccatctctac aaaaatacaa aaattagaca ggcatgatgg caagtgcctg taatcccagc 960
tacttgggag gctgaggaag gagaattgct tgaacctgga aggcaggagt tgcagtgagc 1020
cgagatcata ccactgcact ccagcctggg tgacagaaca agactctgtc tcaaaaaaaa 1080
aaaagagaga ttcaaaagat tcacttgttt aggccttagc gggcttagac accagtctct 1140
gacacattct taaaggtcag gctctacaaa tggaacccaa ccagactctc agatatggcc 1200
aaagatctat acacacccat ctcacagatc ccctatctta aagagaccct aatttgggtt 1260
cacctcagtc tctataatct gtaccagcat accaataaaa atctttctca cccatcctta 1320
gattgagaga agtcacttat tattatgtga gtaactggaa gatactgata agttgacaaa 1380
tctttttctt tcctttctta ttcaactttt attttaactt ccaaagaaca agtgcaatat 1440
gtgcagcttt gttgcgcagg tcaacatgta tctttctggt cttttagccg cctaacactt 1500
tgagcagata taagccttac acaggattat gaagtctgaa aggattccac caatattatt 1560
ataattccta tcaacctgat aggttagggg aaggtagagc tctcctccaa taagccagat 1620
ttccagagtt tctgacgtca taatctacca aggtcatgga tcgagttcag agaaaaaaca 1680
aaagcaaaac caaacctacc aaaaaataaa aatcccaaag aaaaaataaa gaaaaaaaca 1740
gcatgaatac ttcctgccat gttaagtggc caatatgtca gaaacagcac tgagttacag 1800
ataaagatgt ctaaactaca gtgacatccc agctgtcaca gtgtgtggac tattagtcaa 1860
taaaacagtc cctgcctctt aagagttgtt ttccatgcaa atacatgtct tatgtcttag 1920
aataagattc cctaagaagt gaacctagca tttatacaag ataattaatt ctaatccata 1980
gtatctggta aagagcattc taccatcatc tttaccgagc atagaagagc tacaccaaaa 2040
ccctgggtca tcagccagca catacactta tccagtgata aatacacatc atcgggtgcc 2100
tacatacata cctgaatata aaaaaaatac ttttgctgag atgaaacagg cgtgatttat 2160
ttcaaatagg tacggataag tagatattga agtaaggatt cagtcttata ttatattaca 2220
taacattaat ctattcctgc actgaaactg ttgctttata ggatttttca ctacactaat 2280
gagaacttaa gagataatgg cctaaaacca cagagagtat attcaaagat aagtatagca 2340
cttcttattt ggaaaccaat gcttactaaa tgagactaag acgtgtccca tcaaaaatcc 2400
tggacctatg cctaaaacac atttcacaat ccctgaactt ttcaaaaatt ggtacatgct 2460
ttaactttaa actacaggcc tcactggagc tacagacaag aaggtgaaaa acggctgaca 2520
aaagaagtcc tggtatcttc tatggtggga gaagaaaact agctaaaggg aagaataaat 2580
tagagaaaaa ttggaatgac tgaatcggaa caaggcaaag gctataaaaa aaattaagca 2640
gcagtatcct cttgggggcc ccttccccac actatctcaa tgcaaatatc tgtctgaaac 2700
ggtccctggc taaactccac ccatgggttg gccagccttg ccttgaccaa tagccttgac 2760
aaggcaaact tgaccaatag tcttagagta tccagtgagg ccaggggccg gcggctggct 2820
agggatgaag aataaaagga agcacccttc agcagttcca cacactcgct tctggaacgt 2880
ctgaggttat caataagctc ctagtccaga cgccatgggt catttcacag aggaggacaa 2940
ggctactatc acaagcctgt ggggcaaggt gaatgtggaa gatgctggag gagaaaccct 3000
gggaaggtag gctctggtga ccaggacaag ggagggaagg aaggaccctg tgcctggcaa 3060
aagtccaggt cgcttctcag gatttgtggc accttctgac tgtcaaactg ttcttgtcaa 3120
tctcacaggc tcctggttgt ctacccatgg acccagaggt tctttgacag ctttggcaac 3180
ctgtcctctg cctctgccat catgggcaac cccaaagtca aggcacatgg caagaaggtg 3240
ctgacttcct tgggagatgc cataaagcac ctggatgatc tcaagggcac ctttgcccag 3300
ctgagtgaac tgcactgtga caagctgcat gtggatcctg agaacttcaa ggtgagtcca 3360
ggagatgttt cagcactgtt gcctttagtc tcgaggcaac ttagacaact gagtattgat 3420
ctgagcacag cagggtgtga gctgtttgaa gatactgggg ttgggagtga agaaactgca 3480
gaggactaac tgggctgaga cccagtggca atgttttagg gcctaaggag tgcctctgaa 3540
aatctagatg gacaactttg actttgagaa aagagaggtg gaaatgagga aaatgacttt 3600
tctttattag atttcggtag aaagaacttt cacctttccc ctatttttgt tattcgtttt 3660
aaaacatcta tctggaggca ggacaagtat ggtcattaaa aagatgcagg cagaaggcat 3720
atattggctc agtcaaagtg gggaactttg gtggccaaac atacattgct aaggctattc 3780
ctatatcagc tggacacata taaaatgctg ctaatgcttc attacaaact tatatccttt 3840
aattccagat gggggcaaag tatgtccagg ggtgaggaac aattgaaaca tttgggctgg 3900
agtagatttt gaaagtcagc tctgtgtgtg tgtgtgtgtg tgtgcgcgcg tgtgtttgtg 3960
tgtgtgtgag agcgtgtgtt tcttttaacg ttttcagcct acagcataca gggttcatgg 4020
tggcaagaag ataacaagat ttaaattatg gccagtgact agtgctgcaa gaagaacaac 4080
tacctgcatt taatgggaaa gcaaaatctc aggctttgag ggaagttaac ataggcttga 4140
ttctgggtgg aagcttggtg tgtagttatc tggaggccag gctggagctc tcagctcact 4200
atgggttcat ctttattgtc tcctttcatc tcaacagctc ctgggaaatg tgctggtgac 4260
cgttttggca atccatttcg gcaaagaatt cacccctgag gtgcaggctt cctggcagaa 4320
gatggtgact ggagtggcca gtgccctgtc ctccagatac cactgagctc actgcccatg 4380
atgcagagct ttcaaggata ggctttattc tgcaagcaat caaataataa atctattctg 4440
ctaagagatc acacatggtt gtcttcagtt ctttttttat gtctttttaa atatatgagc 4500
cacaaagggt tttatgttga gggatgtgtt tatgtgtatt tatacatggc tatgtgtgtt 4560
tgtgtcatgt gcacactcca cacttttttg tttacgttag atgtgggttt tgatgagcaa 4620
ataaaagaac taggcaataa agaaacttgt acatgggagt tctgcaagtg ggagtaaaag 4680
gtgcaggaga aatctggttg gaagaaagac ctctatagga caggactcct cagaaacaga 4740
tgttttggaa gagatgggga aaggttcagt gaa 4773
<210> 904
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> ssODN1 5'同源臂
<400> 904
gggtgcttcc ttttattctt catccctagc cagccgccgg cccctggcct cactggatac 60
tctaagacta ttggtcaagt ttgcctt 87
<210> 905
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> ssODN1 3'同源臂
<400> 905
gtcaaggcaa ggctggccaa cccatgggtg gagtttagcc agggaccgtt tcagacagat 60
atttgcattg agatagtgtg gggaagggg 89
<210> 906
<211> 176
<212> DNA
<213> 人工序列
<220>
<223> ssODN1
<400> 906
gggtgcttcc ttttattctt catccctagc cagccgccgg cccctggcct cactggatac 60
tctaagacta ttggtcaagt ttgccttgtc aaggcaaggc tggccaaccc atgggtggag 120
tttagccagg gaccgtttca gacagatatt tgcattgaga tagtgtgggg aagggg 176
<210> 907
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> PhTx ssODN1 5'同源臂
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 修饰至含有硫代磷酸酯
<400> 907
gggtgcttcc ttttattctt catccctagc cagccgccgg cccctggcct cactggatac 60
tctaagacta ttggtcaagt ttgcctt 87
<210> 908
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> PhTx ssODN1 3'同源臂
<220>
<221> 尚未归类的特征
<222> (89)..(89)
<223> 修饰至含有硫代磷酸酯
<400> 908
gtcaaggcaa ggctggccaa cccatgggtg gagtttagcc agggaccgtt tcagacagat 60
atttgcattg agatagtgtg gggaagggg 89
<210> 909
<211> 176
<212> DNA
<213> 人工序列
<220>
<223> PhTx ssODN1
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 修饰至含有硫代磷酸酯
<220>
<221> 尚未归类的特征
<222> (176)..(176)
<223> 修饰至含有硫代磷酸酯
<400> 909
gggtgcttcc ttttattctt catccctagc cagccgccgg cccctggcct cactggatac 60
tctaagacta ttggtcaagt ttgccttgtc aaggcaaggc tggccaaccc atgggtggag 120
tttagccagg gaccgtttca gacagatatt tgcattgaga tagtgtgggg aagggg 176
<210> 910
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 910
ggctattggt caaggca 17
<210> 911
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 911
caaggctatt ggtcaaggca 20
<210> 912
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 912
tgccttgtca aggctat 17
<210> 913
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 913
gtttgccttg tcaaggctat 20
<210> 914
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 914
gaccaatagc cttgaca 17
<210> 915
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 915
cttgaccaat agccttgaca 20
<210> 916
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 916
gtcaaggcta ttggtca 17
<210> 917
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 917
cttgtcaagg ctattggtca 20
<210> 918
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 918
tcaagtttgc cttgtca 17
<210> 919
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域
<400> 919
tggtcaagtt tgccttgtca 20
<210> 920
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 920
ggcuauuggu caaggcaagg 20
<210> 921
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 921
caaggcuauu ggucaaggca agg 23
<210> 922
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 922
ugccuuguca aggcuauugg 20
<210> 923
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 923
guuugccuug ucaaggcuau ugg 23
<210> 924
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 924
gaccaauagc cuugacaagg 20
<210> 925
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 925
cuugaccaau agccuugaca agg 23
<210> 926
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 926
gucaaggcua uuggucaagg 20
<210> 927
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 927
cuugucaagg cuauugguca agg 23
<210> 928
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 928
ucaaguuugc cuugucaagg 20
<210> 929
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 929
uggucaaguu ugccuuguca agg 23
<210> 930
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 930
ggctattggt caaggcaagg 20
<210> 931
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 931
caaggctatt ggtcaaggca agg 23
<210> 932
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 932
tgccttgtca aggctattgg 20
<210> 933
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 933
gtttgccttg tcaaggctat tgg 23
<210> 934
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 934
gaccaatagc cttgacaagg 20
<210> 935
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 935
cttgaccaat agccttgaca agg 23
<210> 936
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 936
gtcaaggcta ttggtcaagg 20
<210> 937
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 937
cttgtcaagg ctattggtca agg 23
<210> 938
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 938
tcaagtttgc cttgtcaagg 20
<210> 939
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向结构域加上PAM (NGG)
<400> 939
tggtcaagtt tgccttgtca agg 23

Claims (369)

1.一种gRNA分子,所述gRNA分子包含靶向结构域,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
2.如权利要求1所述的gRNA分子,其中所述HBG1或HBG2调控区域分别与HBG1或HBG2基因相邻。
3.如权利要求2所述的gRNA分子,其中所述HBG1调控区域位于跨越SEQ ID NO:902的核苷酸1-2990的区域。
4.如权利要求2所述的gRNA分子,其中所述HBG2调控区域位于跨越SEQ ID NO:903的核苷酸1-2914的区域。
5.如权利要求1-4中任一项所述的gRNA分子,其中所述靶向结构域被配置成在HBG靶位置的500、400、300、200、100、50、25、或10个核苷酸内提供选自双链断裂和单链断裂的切割事件。
6.如权利要求1所述的gRNA分子,其中所述靶结构域完全位于HBG1或HBG2调控区域内。
7.如权利要求1-6中任一项所述的gRNA分子,其中所述靶向结构域被配置成靶向HBG1或HBG2调控区域中的转录调控元件。
8.如权利要求7所述的gRNA分子,其中所述转录调控元件是启动子。
9.如权利要求8所述的gRNA分子,其中所述启动子控制HBG1和HBG2中的一种或多种的转录。
10.如权利要求7所述的gRNA分子,其中所述转录调控元件是沉默子。
11.如权利要求1-10中任一项所述的gRNA分子,其中所述靶向结构域包含与SEQ IDNO:251-901中任一个所示的核苷酸序列相同或相差不超过1、2、3、4、或5个核苷酸的核苷酸序列。
12.如权利要求11所述的gRNA分子,其中所述靶向结构域包含与SEQ ID NO:251-901中任一个所示的核苷酸序列相同的核苷酸序列。
13.如权利要求1-12中任一项所述的gRNA分子,其中所述gRNA分子是模块化gRNA分子。
14.如权利要求1-12中任一项所述的gRNA分子,其中所述gRNA分子是单分子gRNA分子。
15.如权利要求1-12中任一项所述的gRNA分子,其中所述gRNA分子是嵌合gRNA分子。
16.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是16个或更多个核苷酸。
17.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是17个或更多个核苷酸。
18.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是18个或更多个核苷酸。
19.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是19个或更多个核苷酸。
20.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是20个或更多个核苷酸。
21.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是21个或更多个核苷酸。
22.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是22个或更多个核苷酸。
23.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是23个或更多个核苷酸。
24.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是24个或更多个核苷酸。
25.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是25个或更多个核苷酸。
26.如权利要求1-12中任一项所述的gRNA分子,其中所述靶向结构域在长度上是26个或更多个核苷酸。
27.如权利要求1-12中任一项所述的gRNA分子,所述gRNA分子进一步包含第一互补结构域、连接结构域、第二互补结构域、近端结构域、5'延伸结构域、和尾部结构域中的一个或多个。
28.如权利要求27所述的gRNA分子,所述gRNA分子从5'到3'包含:靶向结构域;第一互补结构域;连接结构域;第二互补结构域;和近端结构域。
29.如权利要求28所述的gRNA分子,所述gRNA分子进一步包含尾部结构域。
30.如权利要求1-29中任一项所述的gRNA分子,所述gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少20个核苷酸的一起考虑的近端结构域和尾部结构域;和由17或18个核苷酸组成的靶向结构域。
31.如权利要求1-29中任一项所述的gRNA分子,所述gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少25个核苷酸的一起考虑的近端结构域和尾部结构域;和由17或18个核苷酸组成的靶向结构域。
32.如权利要求1-29中任一项所述的gRNA分子,所述gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少30个核苷酸的一起考虑的近端结构域和尾部结构域;和由17个核苷酸组成的靶向结构域。
33.如权利要求1-37中任一项所述的gRNA分子,所述gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少40个核苷酸的一起考虑的近端结构域和尾部结构域;和由17个核苷酸组成的靶向结构域。
34.一种核酸组合物,所述核酸组合物包含:(a)编码包含靶向结构域的gRNA分子的核苷酸序列,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
35.如权利要求34所述的核酸组合物,其中所述gRNA分子是如权利要求1-33中任一项所述的gRNA分子。
36.如权利要求34或35所述的核酸组合物,其中所述靶向结构域被配置成在HBG靶位置的500、400、300、200、100、50、25、或10个核苷酸内提供选自双链断裂和单链断裂的切割事件。
37.如权利要求34-36中任一项所述的核酸组合物,其中所述靶向结构域包含与SEQ IDNO:251-901中任一个所示的核苷酸序列相同或相差不超过1、2、3、4、或5个核苷酸的核苷酸序列。
38.如权利要求37所述的核酸组合物,其中所述靶向结构域包含与SEQ ID NO:251-901中任一个所示的核苷酸序列相同的核苷酸序列。
39.如权利要求34-38中任一项所述的核酸组合物,其中所述gRNA分子是模块化gRNA分子。
40.如权利要求34-38中任一项所述的核酸组合物,其中所述gRNA分子是单分子gRNA分子。
41.如权利要求34-38中任一项所述的核酸组合物,其中所述gRNA分子是嵌合gRNA分子。
42.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是16个或更多个核苷酸。
43.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是17个或更多个核苷酸。
44.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是18个或更多个核苷酸。
45.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是19个或更多个核苷酸。
46.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是20个或更多个核苷酸。
47.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是21个或更多个核苷酸。
48.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是22个或更多个核苷酸。
49.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是23个或更多个核苷酸。
50.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是24个或更多个核苷酸。
51.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是25个或更多个核苷酸。
52.如权利要求34-41中任一项所述的核酸组合物,其中所述靶向结构域在长度上是26个或更多个核苷酸。
53.如权利要求34-52中任一项所述的核酸组合物,其中所述gRNA分子进一步包含靶向结构域;第一互补结构域;连接结构域;第二互补结构域;和近端结构域中的一个或多个。
54.如权利要求53所述的核酸组合物,其中所述gRNA分子从5'到3'包含:靶向结构域;第一互补结构域;连接结构域;第二互补结构域;和近端结构域。
55.如权利要求54所述的核酸组合物,其中所述gRNA进一步包含尾部结构域。
56.如权利要求34-55中任一项所述的核酸组合物,其中所述gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少20个核苷酸的一起考虑的近端结构域和尾部结构域;和具有17或18个核苷酸的靶向结构域。
57.如权利要求34-55中任一项所述的核酸组合物,其中所述gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少25个核苷酸的一起考虑的近端结构域和尾部结构域;和在长度上有17或18个核苷酸的靶向结构域。
58.如权利要求34-55中任一项所述的核酸组合物,其中所述gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少30个核苷酸的一起考虑的近端结构域和尾部结构域;和在长度上有17个核苷酸的靶向结构域。
59.如权利要求34-55中任一项所述的核酸组合物,其中所述gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少40个核苷酸的一起考虑的近端结构域和尾部结构域;和在长度上有17个核苷酸的靶向结构域。
60.如权利要求34-59中任一项所述的核酸组合物,所述核酸组合物进一步包含:(b)编码RNA指导的核酸酶的核苷酸序列。
61.如权利要求60所述的核酸组合物,其中所述RNA指导的核酸酶是Cas9分子或Cas9-融合蛋白。
62.如权利要求61所述的核酸组合物,其中所述Cas9分子是具有酶活性的Cas9(eaCas9)分子。
63.如权利要求62所述的核酸组合物,其中所述eaCas9分子包含切口酶分子。
64.如权利要求62或63所述的核酸组合物,其中所述eaCas9分子在靶核酸中形成双链断裂。
65.如权利要求62或63所述的核酸组合物,其中所述eaCas9分子在靶核酸中形成单链断裂。
66.如权利要求65所述的核酸组合物,其中所述单链断裂形成于所述靶核酸的与所述gRNA分子的靶向结构域互补的链中。
67.如权利要求66所述的核酸组合物,其中所述单链断裂形成于所述靶核酸的不同于与所述gRNA分子的靶向结构域互补的链的链中。
68.如权利要求61-67中任一项所述的核酸组合物,其中所述eaCas9分子包含HNH样结构域切割活性,但没有或具有不显著的N-末端RuvC样结构域切割活性。
69.如权利要求68所述的核酸组合物,其中所述eaCas9分子是HNH样结构域切口酶。
70.如权利要求68或69所述的核酸组合物,其中所述eaCas9分子在D10处包含突变。
71.如权利要求65-70中任一项所述的核酸组合物,其中所述eaCas9分子包含N端RuvC样结构域切割活性,但没有或具有不显著的HNH样结构域切割活性。
72.如权利要求70所述的核酸组合物,其中所述eaCas9分子是N端RuvC样结构域切口酶。
73.如权利要求71或72所述的核酸组合物,其中所述eaCas9分子在H840或N863处包含突变。
74.如权利要求34-73中任一项所述的核酸组合物,所述核酸组合物进一步包含:(c)编码包含靶向结构域的第二gRNA分子的核苷酸序列,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
75.如权利要求74所述的核酸组合物,其中所述第二gRNA分子是如权利要求1-33中任一项所述的gRNA分子。
76.如权利要求74或75所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域被配置成在HBG靶位置的500、400、300、200、100、50、25、或10个核苷酸内提供选自双链断裂和单链断裂的切割事件。
77.如权利要求74-76中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域包含与SEQ ID NO:251-901中任一个所示的核苷酸序列相同或相差不超过1、2、3、4、或5个核苷酸的核苷酸序列。
78.如权利要求77所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域包含与SEQ ID NO:251-901中任一个所示的核苷酸序列相同的核苷酸序列。
79.如权利要求74-78中任一项所述的核酸组合物,其中所述第二gRNA分子是单分子gRNA分子。
80.如权利要求74-78中任一项所述的核酸组合物,其中所述第二gRNA分子是模块化gRNA分子。
81.如权利要求74-78中任一项所述的核酸组合物,其中所述第二gRNA分子是嵌合gRNA分子。
82.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是16个或更多个核苷酸。
83.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是17个或更多个核苷酸。
84.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是18个或更多个核苷酸。
85.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是19个或更多个核苷酸。
86.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是20个或更多个核苷酸。
87.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是21个或更多个核苷酸。
88.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是22个或更多个核苷酸。
89.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是23个或更多个核苷酸。
90.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是24个或更多个核苷酸。
91.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是25个或更多个核苷酸。
92.如权利要求74-81中任一项所述的核酸组合物,其中所述第二gRNA分子的所述靶向结构域在长度上是26个或更多个核苷酸。
93.如权利要求74-92中任一项所述的核酸组合物,其中所述第二gRNA分子进一步包含靶向结构域;第一互补结构域;连接结构域;第二互补结构域;和近端结构域中的一个或多个。
94.如权利要求93所述的核酸组合物,其中所述第二gRNA分子从5'到3'包含:靶向结构域;第一互补结构域;连接结构域;第二互补结构域;和近端结构域。
95.如权利要求94所述的核酸组合物,其中所述第二gRNA进一步包含尾部结构域。
96.如权利要求74-95中任一项所述的核酸组合物,其中所述第二gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少20个核苷酸的一起考虑的近端结构域和尾部结构域;和具有17或18个核苷酸的靶向结构域。
97.如权利要求74-95中任一项所述的核酸组合物,其中所述第二gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少25个核苷酸的一起考虑的近端结构域和尾部结构域;和在长度上有17或18个核苷酸的靶向结构域。
98.如权利要求74-95中任一项所述的核酸组合物,其中所述第二gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少30个核苷酸的一起考虑的近端结构域和尾部结构域;和在长度上有17个核苷酸的靶向结构域。
99.如权利要求74-95中任一项所述的核酸组合物,其中所述第二gRNA分子包含:包含不多于25个核苷酸的连接结构域;包含至少40个核苷酸的一起考虑的近端结构域和尾部结构域;和在长度上有17个核苷酸的靶向结构域。
100.如权利要求74-99中任一项所述的核酸组合物,所述核酸组合物进一步包含:(d)编码包含靶向结构域的第三gRNA分子的核苷酸序列,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
101.如权利要求100所述的核酸组合物,所述核酸组合物进一步包含:(f)编码包含靶向结构域的第四gRNA分子的核苷酸序列,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
102.如权利要求34-101中任一项所述的核酸组合物,所述核酸组合物进一步包含(g)模板核酸。
103.如权利要求102所述的核酸组合物,其中所述模板核酸是单链寡脱氧核苷酸(ssODN)。
104.如权利要求103所述的核酸组合物,其中所述模板核酸包含5'同源臂、替换序列、和3'同源臂。
105.如权利要求104所述的核酸组合物,其中所述5'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸;所述替换序列在长度上包含0个核苷酸;并且所述3'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。
106.如权利要求105所述的核酸组合物,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp、HBG靶位置内的靶位点同源性5',并且所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp、HBG靶位置内的靶位点同源性3'。
107.如权利要求106所述的核酸组合物,其中所述靶位点选自下组,该组由以下组成:HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2c.-114至-102(例如,SEQ IDNO:903(HBG2)的核苷酸2748-2760)。
108.如权利要求107所述的核酸组合物,其中所述靶位点是HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQ IDNO:902(HBG1)的核苷酸2824-2836)的同源性5'。
109.如权利要求108所述的核酸组合物,其中所述5'同源臂包含SEQ ID NO:904(即,ssODN1 5'同源臂),基本上由其组成或由其组成。
110.如权利要求108或109所述的核酸组合物,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQID NO:902(HBG1)的核苷酸2824-2836)的同源性3'。
111.如权利要求108-110中任一项所述的核酸组合物,其中所述3'同源臂包含SEQ IDNO:905(即,ssODN1 3'同源臂),基本上由其组成或由其组成。
112.如权利要求107所述的核酸组合物,其中所述靶位点是HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ IDNO:903(HBG2)的核苷酸2748-2760)的同源性5'。
113.如权利要求112所述的核酸组合物,其中所述5'同源臂包含SEQ ID NO:904(即,ssODN1 5'同源臂),基本上由其组成或由其组成。
114.如权利要求112或113所述的核酸组合物,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQID NO:903(HBG2)的核苷酸2748-2760)的同源性3'。
115.如权利要求112-114中任一项所述的核酸组合物,其中所述3'同源臂包含SEQ IDNO:905(即,ssODN1 3'同源臂),基本上由其组成或由其组成。
116.如权利要求108-115中任一项所述的核酸组合物,其中所述模板核酸包含SEQ IDNO:906(即,ssODN1),基本上由其组成或由其组成。
117.如权利要求107所述的核酸组合物,其中所述靶位点是HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ IDNO:902(HBG1)的核苷酸2716-2719)的同源性5'。
118.如权利要求117所述的核酸组合物,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ IDNO:902(HBG1)的核苷酸2716-2719)的同源性3'。
119.如权利要求103-118中任一项所述的核酸组合物,其中所述ssODN包含5'硫代磷酸酯修饰。
120.如权利要求103-118中任一项所述的核酸组合物,其中所述ssODN包含3'硫代磷酸酯修饰。
121.如权利要求103-118中任一项所述的核酸组合物,其中所述ssODN包含5'硫代磷酸酯修饰和3'硫代磷酸酯修饰。
122.如权利要求34-121中任一项所述的核酸组合物,其中所述核酸组合物不包含(c)编码第二gRNA分子的核苷酸序列、(d)编码第三gRNA分子的核苷酸序列、或(e)编码第四gRNA分子的核苷酸序列。
123.如权利要求34-122中任一项所述的核酸组合物,其中(a)和(b)存在于一个核酸分子上。
124.如权利要求101-122中任一项所述的核酸组合物,其中(a)、(b)、和(g)存在于一个核酸分子上。
125.如权利要求123或124所述的核酸组合物,其中所述核酸分子是AAV载体或LV载体。
126.如权利要求34-122中任一项所述的核酸组合物,其中:(a)存在于第一核酸分子上;并且(b)存在于第二核酸分子上。
127.如权利要求126所述的核酸组合物,其中所述第一和第二核酸分子是AAV载体或LV载体。
128.如权利要求74-122中任一项所述的核酸组合物,其中(a)和(c)存在于一个核酸分子上。
129.如权利要求101-122中任一项所述的核酸组合物,其中(a)和(g)存在于一个核酸分子上。
130.如权利要求128或129所述的核酸组合物,其中所述核酸分子是AAV载体或LV载体。
131.如权利要求74-122中任一项所述的核酸组合物,其中:(a)存在于第一核酸分子上;并且(c)存在于第二核酸分子上。
132.如权利要求101-122中任一项所述的核酸组合物,其中:(a)存在于第一核酸分子上;并且(g)存在于第二核酸分子上。
133.如权利要求130或131所述的核酸组合物,其中所述第一和第二核酸分子是AAV载体或LV载体。
134.如权利要求60-122中任一项所述的核酸组合物,其中(a)、(b)和(c)存在于一个核酸分子上。
135.如权利要求101-122中任一项所述的核酸组合物,其中:(a)、(b)、和(g)存在于一个核酸分子上。
136.如权利要求134或135所述的核酸组合物,其中所述核酸分子是AAV载体或LV载体。
137.如权利要求60-122中任一项所述的核酸组合物,其中:
(a)、(b)、和(c)之一在第一核酸分子上进行编码;并且
(a)、(b)、和(c)中的第二个和第三个在第二核酸分子上进行编码。
138.如权利要求101-122中任一项所述的核酸组合物,其中:
(a)、(b)、和(g)之一在第一核酸分子上进行编码;以及
(a)、(b)、和(g)中的第二个和第三个在第二核酸分子上进行编码。
139.如权利要求137或138所述的核酸组合物,其中所述第一和第二核酸分子是AAV载体或LV载体。
140.如权利要求137或139所述的核酸组合物,其中:(a)存在于第一核酸分子上;并且(b)和(c)存在于第二核酸分子上。
141.如权利要求138或139所述的核酸组合物,其中:(a)存在于第一核酸分子上;并且(b)和(g)存在于第二核酸分子上。
142.如权利要求140或141所述的核酸组合物,其中所述第一和第二核酸分子是AAV载体或LV载体。
143.如权利要求137或139所述的核酸组合物,其中:(b)存在于第一核酸分子上;并且(a)和(c)存在于第二核酸分子上。
144.如权利要求138或139所述的核酸组合物,其中:(b)存在于第一核酸分子上;并且(a)和(g)存在于第二核酸分子上。
145.如权利要求143或144所述的核酸组合物,其中所述第一和第二核酸分子是AAV载体或LV载体。
146.如权利要求137或139所述的核酸组合物,其中:(c)存在于第一核酸分子上;并且(b)和(a)存在于第二核酸分子上。
147.如权利要求138或139所述的核酸组合物,其中:(g)存在于第一核酸分子上;并且(b)和(a)存在于第二核酸分子上。
148.如权利要求146或147所述的核酸组合物,其中所述第一和第二核酸分子是AAV载体或LV载体。
149.如权利要求126、131、132、137、139、140、141、143、144、146、或147中任一项所述的核酸组合物,其中所述第一核酸分子不同于AAV载体并且所述第二核酸分子是AAV载体。
150.如权利要求34-149中任一项所述的核酸组合物,其中所述核酸组合物包含可操作地连接至(a)上的启动子。
151.如权利要求74-149中任一项所述的核酸组合物,其中所述核酸组合物包含可操作地连接至(c)上的第二启动子。
152.如权利要求151中任一项所述的核酸组合物,其中所述启动子和第二启动子彼此不同。
153.如权利要求151中任一项所述的核酸组合物,其中所述启动子和第二启动子相同。
154.如权利要求60-149中任一项所述的核酸组合物,其中所述核酸组合物包含可操作地连接至(b)上的启动子。
155.一种组合物,所述组合物包含(a)如权利要求1-33中任一项所述的gRNA分子。
156.如权利要求155所述的组合物,所述组合物进一步包含(b)RNA指导的核酸酶。
157.如权利要求156所述的组合物,其中所述RNA指导的核酸酶是Cas9分子或Cas9-融合蛋白。
158.如权利要求157所述的组合物,其中所述Cas9分子是具有酶活性的Cas9(eaCas9)分子。
159.如权利要求158所述的组合物,其中所述eaCas9分子包含切口酶分子。
160.如权利要求158或159所述的组合物,其中所述eaCas9分子在靶核酸中形成双链断裂。
161.如权利要求158或159所述的组合物,其中所述eaCas9分子在靶核酸中形成单链断裂。
162.如权利要求161所述的组合物,其中所述单链断裂形成于所述靶核酸的与所述gRNA分子的靶向结构域互补的链中。
163.如权利要求161所述的组合物,其中所述单链断裂形成于所述靶核酸的不同于与所述gRNA分子的靶向结构域互补的链的链中。
164.如权利要求158-163中任一项所述的组合物,其中所述eaCas9分子包含HNH样结构域切割活性,但没有或具有不显著的N-末端RuvC样结构域切割活性。
165.如权利要求164所述的组合物,其中所述eaCas9分子是HNH样结构域切口酶。
166.如权利要求164或165所述的组合物,其中所述eaCas9分子在D10处包含突变。
167.如权利要求158-163中任一项所述的组合物,其中所述eaCas9分子包含N端RuvC样结构域切割活性,但没有或具有不显著的HNH样结构域切割活性。
168.如权利要求167所述的组合物,其中所述eaCas9分子是N端RuvC样结构域切口酶。
169.如权利要求167或168所述的组合物,其中所述eaCas9分子在H840或N863处包含突变。
170.如权利要求156-169中任一项所述的组合物,所述组合物进一步包含(c)包含靶向结构域的第二gRNA分子,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
171.如权利要求170所述的组合物,其中所述第二gRNA分子是如权利要求1-33中任一项所述的gRNA分子。
172.如权利要求156-171中任一项所述的组合物,所述组合物进一步包含(d)第三gRNA分子。
173.如权利要求172所述的组合物,所述组合物进一步包含(e)第四gRNA分子。
174.如权利要求155-173中任一项所述的组合物,所述组合物进一步包含(g)模板核酸。
175.如权利要求174所述的组合物,其中所述模板核酸是单链寡脱氧核苷酸(ssODN)。
176.如权利要求175所述的组合物,其中所述模板核酸包含5'同源臂、替换序列、和3'同源臂。
177.如权利要求176所述的组合物,其中所述5'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸;所述替换序列在长度上包含0个核苷酸;并且所述3'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。
178.如权利要求177所述的组合物,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp、HBG靶位置内的靶位点同源性5',并且所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp、HBG靶位置内的靶位点同源性3'。
179.如权利要求178所述的组合物,其中所述靶位点选自下组,该组由以下组成:HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2c.-114至-102(例如,SEQ IDNO:903(HBG2)的核苷酸2748-2760)。
180.如权利要求179所述的组合物,其中所述靶位点是HBG1c.-114至-102(例如,SEQID NO:902(HBG1)的核苷酸2824-2836),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)的同源性5'。
181.如权利要求180所述的组合物,其中所述5'同源臂包含SEQ ID NO:904(即,ssODN15'同源臂),基本上由其组成或由其组成。
182.如权利要求180或181所述的组合物,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQ IDNO:902(HBG1)的核苷酸2824-2836)的同源性3'。
183.如权利要求179-182中任一项所述的组合物,其中所述3'同源臂包含SEQ ID NO:905(即,ssODN1 3'同源臂),基本上由其组成或由其组成。
184.如权利要求179所述的组合物,其中所述靶位点是HBG2c.-114至-102(例如,SEQID NO:903(HBG2)的核苷酸2748-2760),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)的同源性5'。
185.如权利要求184所述的组合物,其中所述5'同源臂包含SEQ ID NO:904(即,ssODN15'同源臂),基本上由其组成或由其组成。
186.如权利要求184或185所述的组合物,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ IDNO:903(HBG2)的核苷酸2748-2760)的同源性3'。
187.如权利要求184-186中任一项所述的组合物,其中所述3'同源臂包含SEQ ID NO:905(即,ssODN1 3'同源臂),基本上由其组成或由其组成。
188.如权利要求175-187中任一项所述的组合物,其中所述模板核酸包含SEQ ID NO:906(即,ssODN1),基本上由其组成或由其组成。
189.如权利要求179所述的组合物,其中所述靶位点是HBG1c.-225至-222(例如,SEQID NO:902(HBG1)的核苷酸2716-2719),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)的同源性5'。
190.如权利要求189所述的组合物,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)的同源性3'。
191.如权利要求175-190中任一项所述的组合物,其中所述ssODN包含5'硫代磷酸酯修饰。
192.如权利要求175-190中任一项所述的组合物,其中所述ssODN包含3'硫代磷酸酯修饰。
193.如权利要求175-190中任一项所述的组合物,其中所述ssODN包含5'硫代磷酸酯修饰和3'硫代磷酸酯修饰。
194.一种改变细胞的方法,所述方法包括使所述细胞与以下接触:
(a)如权利要求1-33中任一项所述的gRNA分子;以及
(b)RNA指导的核酸酶。
195.如权利要求194所述的方法,所述方法进一步包括使所述细胞与以下接触:(c)包含靶向结构域的第二gRNA分子,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
196.如权利要求194或195所述的方法,其中所述RNA指导的核酸酶是Cas9分子或Cas9-融合蛋白。
197.如权利要求196所述的方法,其中所述第二gRNA分子是如权利要求1-33中任一项所述的gRNA分子。
198.如权利要求195-196中任一项所述的方法,其中所述Cas9分子是具有酶活性的Cas9(eaCas9)分子。
199.如权利要求198所述的方法,其中所述eaCas9分子包含切口酶分子。
200.如权利要求198或199所述的方法,其中所述eaCas9分子在靶核酸中形成双链断裂。
201.如权利要求198或199所述的方法,其中所述eaCas9分子在靶核酸中形成单链断裂。
202.如权利要求201所述的方法,其中所述单链断裂形成于所述靶核酸的与所述gRNA分子的靶向结构域互补的链中。
203.如权利要求201所述的方法,其中所述单链断裂形成于所述靶核酸的不同于与所述gRNA分子的靶向结构域互补的链的链中。
204.如权利要求198-203中任一项所述的组合方法物,其中所述eaCas9分子包含HNH样结构域切割活性,但没有或具有不显著的N-末端RuvC样结构域切割活性。
205.如权利要求204所述的方法,其中所述eaCas9分子是HNH样结构域切口酶。
206.如权利要求204或205所述的方法,其中所述eaCas9分子在D10处包含突变。
207.如权利要求198-203中任一项所述的方法,其中所述eaCas9分子包含N端RuvC样结构域切割活性,但没有或具有不显著的HNH样结构域切割活性。
208.如权利要求207所述的方法,其中所述eaCas9分子是N端RuvC样结构域切口酶。
209.如权利要求207或208所述的方法,其中所述eaCas9分子在H840或N863处包含突变。
210.如权利要求196-209中任一项所述的方法,所述方法进一步包括使所述细胞与(d)第三gRNA分子接触。
211.如权利要求210所述的方法,所述方法进一步包括使所述细胞与(e)第四gRNA分子接触。
212.如权利要求194-211中任一项所述的方法,其中所述细胞来自患有β-血红蛋白病的受试者。
213.如权利要求212所述的方法,其中所述β-血红蛋白病选自由SCD和β-Thal组成的组。
214.如权利要求194-213中任一项所述的方法,其中所述细胞是红系细胞。
215.如权利要求214所述的方法,其中所述细胞是成红细胞。
216.如权利要求194-215中任一项所述的方法,其中所述接触步骤在体内进行。
217.如权利要求194-216中任一项所述的方法,所述方法包括获取所述细胞中的所述HBG靶位置的序列的信息。
218.如权利要求194-217中任一项所述的方法,所述方法包括向HBG靶位置引入indel。
219.如权利要求218所述的方法,其中所述indel选自下组,该组由以下组成:HBG113bp del-114至-102、HBG1 4bp del-225至-222、和HBG2 13bp del-114至-102。
220.如权利要求218或219所述的方法,其中所述indel是使用NHEJ引入的。
221.如权利要求194-220中任一项所述的方法,所述方法包括向HBG靶位置引入单核苷酸改变。
222.如权利要求221所述的方法,其中所述单核苷酸改变选自下组,该组由以下组成:HBG1c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A、和HBG2c.-109G>T、c.-114C>A、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G。
223.如权利要求221或222所述的方法,其中所述单核苷酸改变是使用HDR引入的。
224.如权利要求194-223中任一项所述的方法,所述方法包括向HBG靶位置的靶位点引入改变。
225.如权利要求224所述的方法,其中所述改变选自下组,该组由以下组成:HBG1 13bpdel-114至-102、HBG1 4bp del-225至-222、和HBG2 13bp del-114至-102。
226.如权利要求224或225所述的方法,其中所述改变是使用HDR引入的。
227.如权利要求226所述的方法,所述方法进一步包括使所述细胞与(g)模板核酸接触。
228.如权利要求227所述的方法,其中所述模板核酸是单链寡脱氧核苷酸(ssODN)。
229.如权利要求228所述的方法,其中所述模板核酸包含5'同源臂、替换序列、和3'同源臂。
230.如权利要求229所述的方法,其中所述5'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸;所述替换序列在长度上包含0个核苷酸;并且所述3'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。
231.如权利要求230所述的方法,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp、靶位点同源性5',并且所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp、靶位点同源性3'。
232.如权利要求231所述的方法,其中所述改变是HBG1 13bp del-114至-102并且所述靶位点是HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)。
233.如权利要求232所述的方法,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)的同源性5'。
234.如权利要求230-233中任一项所述的方法,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)的同源性3'。
235.如权利要求234所述的方法,其中所述改变是HBG2 13bp del-114至-102并且靶位点是HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)。
236.如权利要求235所述的方法,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)的同源性5'。
237.如权利要求234或235所述的方法,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ IDNO:903(HBG2)的核苷酸2748-2760)的同源性3'。
238.如权利要求232-237中任一项所述的方法,其中所述5'同源臂包含SEQ ID NO:904(ssODN1 5'同源臂),基本上由其组成或由其组成。
239.如权利要求232-238中任一项所述的方法,其中所述3'同源臂包含SEQ ID NO:905(ssODN1 3'同源臂),基本上由其组成或由其组成。
240.如权利要求232-239中任一项所述的方法,其中所述模板核酸包含SEQ ID NO:906(ssODN1),基本上由其组成或由其组成。
241.如权利要求231所述的方法,其中所述改变是HBG1 4bp del-225至-222并且靶位点是HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)。
242.如权利要求241所述的方法,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)的同源性5'。
243.如权利要求241或242所述的方法,所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)的同源性3'。
244.如权利要求228-243中任一项所述的方法,其中所述ssODN包含5'硫代磷酸酯修饰。
245.如权利要求228-243中任一项所述的方法,其中所述ssODN包含3'硫代磷酸酯修饰。
246.如权利要求228-243中任一项所述的方法,其中所述ssODN包含5'硫代磷酸酯修饰和3'硫代磷酸酯修饰。
247.如权利要求195-246中任一项所述的方法,其中所述接触步骤包含使所述细胞与编码(a)、(b)、和(c)中的至少一个的核酸组合物接触。
248.如权利要求227-246中任一项所述的方法,其中所述接触步骤包含使所述细胞与编码(a)、(b)、(g)、和任选地(c)的核酸组合物接触。
249.如权利要求248或249所述的方法,其中所述接触步骤包含使所述细胞与如权利要求34-154中任一项所述的核酸组合物接触。
250.如权利要求195-249中任一项所述的方法,其中所述接触步骤包含向所述细胞递送所述(b)和编码(a)的核酸组合物。
251.如权利要求250所述的方法,其中所述核酸组合物进一步编码(c)。
252.如权利要求250或251所述的方法,其中所述核酸组合物进一步编码(g)。
253.如权利要求195-251中任一项所述的方法,其中所述接触步骤包含向所述细胞递送(a)和(b)。
254.如权利要求195-251中任一项所述的方法,其中所述接触步骤包含向所述细胞递送(a)和编码(b)的核酸组合物。
255.如权利要求253或254所述的方法,其中所述接触步骤进一步包含向所述细胞递送(c)。
256.如权利要求227-255中任一项所述的方法,其中所述接触步骤进一步包含向所述细胞递送(g)。
257.一种治疗有需要的受试者中的β-血红蛋白病的方法,所述方法包括使所述受试者或来自所述受试者的细胞与以下接触:
(a)如权利要求1-33中任一项所述的gRNA分子;以及
(b)RNA指导的核酸酶。
258.如权利要求257所述的方法,其中所述RNA指导的核酸酶是Cas9分子或Cas9-融合蛋白。
259.如权利要求257或258所述的方法,其中所述β-血红蛋白病选自由SCD和β-Thal组成的组。
260.如权利要求257-259中任一项所述的方法,所述方法进一步包括使所述受试者或来自所述受试者的所述细胞与以下接触:(c)包含靶向结构域的第二gRNA分子,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
261.如权利要求260所述的方法,其中所述第二gRNA分子是如权利要求1-33中任一项所述的gRNA分子。
262.如权利要求258-261中任一项所述的方法,其中所述Cas9分子是具有酶活性的Cas9(eaCas9)分子。
263.如权利要求262所述的方法,其中所述eaCas9分子包含切口酶分子。
264.如权利要求262或263所述的方法,其中所述eaCas9分子在靶核酸中形成双链断裂。
265.如权利要求262或263所述的方法,其中所述eaCas9分子在靶核酸中形成单链断裂。
266.如权利要求265所述的方法,其中所述单链断裂形成于所述靶核酸的与所述gRNA分子的靶向结构域互补的链中。
267.如权利要求265所述的方法,其中所述单链断裂形成于所述靶核酸的不同于与所述gRNA分子的靶向结构域互补的链的链中。
268.如权利要求263-267中任一项所述的组合方法物,其中所述eaCas9分子包含HNH样结构域切割活性,但没有或具有不显著的N-末端RuvC样结构域切割活性。
269.如权利要求268所述的方法,其中所述eaCas9分子是HNH样结构域切口酶。
270.如权利要求268或269所述的方法,其中所述eaCas9分子在D10处包含突变。
271.如权利要求262-270中任一项所述的方法,其中所述eaCas9分子包含N端RuvC样结构域切割活性,但没有或具有不显著的HNH样结构域切割活性。
272.如权利要求271所述的方法,其中所述eaCas9分子是N端RuvC样结构域切口酶。
273.如权利要求271或272中任一项所述的方法,其中所述eaCas9分子在H840或N863处包含突变。
274.如权利要求257-273中任一项所述的方法,所述方法进一步包括使所述受试者或来自所述受试者的所述细胞与(d)第三gRNA分子接触。
275.如权利要求274所述的方法,所述方法进一步包括使所述受试者或来自所述受试者的所述细胞与第四gRNA分子接触。
276.如权利要求257-275中任一项所述的方法,所述方法包括向HBG靶位置引入单核苷酸改变。
277.如权利要求276所述的方法,其中所述单核苷酸改变选自下组,该组由以下组成:HBG1c.-114C>T、c.-117G>A、c.-158C>T、c.-167C>T、c.-170G>A、c.-175T>G、c.-175T>C、c.-195C>G、c.-196C>T、c.-198T>C、c.-201C>T、c.-251T>C、或c.-499T>A、和HBG2c.-109G>T、c.-114C>A、c.-114C>T、c.-157C>T、c.-158C>T、c.-167C>T、c.-167C>A、c.-175T>C、c.-202C>G、c.-211C>T、c.-228T>C、c.-255C>G、c.-309A>G、c.-369C>G、或c.-567T>G。
278.如权利要求276或277所述的方法,其中所述单核苷酸改变是使用HDR引入的。
279.如权利要求257-278中任一项所述的方法,所述方法包括向HBG靶位置内的靶位点引入indel。
280.如权利要求279所述的方法,其中所述indel选自下组,该组由以下组成:HBG113bp del-114至-102、HBG1 4bp del-225至-222、和HBG2 13bp del-114至-102。
281.如权利要求279或280所述的方法,其中所述改变是使用HDR引入的。
282.如权利要求281所述的方法,所述方法进一步包括使所述受试者或来自所述受试者的所述细胞与(g)模板核酸接触。
283.如权利要求282所述的方法,其中所述模板核酸是单链寡脱氧核苷酸(ssODN)。
284.如权利要求283所述的方法,其中所述模板核酸包含5'同源臂、替换序列、和3'同源臂,其中所述替换序列是0个核苷酸。
285.如权利要求284所述的方法,其中所述5'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸;所述替换序列在长度上包含0个核苷酸;并且所述3'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。
286.如权利要求285所述的方法,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp、HBG靶位置内的靶位点同源性5',并且所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp、HBG靶位置内的靶位点同源性3'。
287.如权利要求286所述的方法,其中所述indel是HBG1 13bp del-114至-102并且靶位点是SEQ ID NO:902的HBG1-114至-102。
288.如权利要求287所述的方法,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)的同源性5'。
289.如权利要求287或288所述的方法,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQ IDNO:902(HBG1)的核苷酸2824-2836)的同源性3'。
290.如权利要求286所述的方法,其中所述indel是HBG2 13bp del-114至-102并且靶位点是HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)。
291.如权利要求290所述的方法,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)的同源性5'。
292.如权利要求290或291所述的方法,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ IDNO:903(HBG2)的核苷酸2748-2760)的同源性3'。
293.如权利要求290-292中任一项所述的方法,其中所述5'同源臂包含SEQ ID NO:904(ssODN1 5'同源臂),基本上由其组成或由其组成。
294.如权利要求290-293中任一项所述的方法,其中所述3'同源臂包含SEQ ID NO:905(ssODN1 3'同源臂),基本上由其组成或由其组成。
295.如权利要求283-294中任一项所述的方法,其中所述模板核酸包含SEQ ID NO:906(ssODN1),基本上由其组成或由其组成。
296.如权利要求256所述的方法,其中所述indel是HBG1 4bp del-225至-222并且靶位点是HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)。
297.如权利要求296所述的方法,其中所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)的同源性5'。
298.如权利要求296或297所述的方法,所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)的同源性3'。
299.如权利要求283-298中任一项所述的方法,其中所述ssODN包含5'硫代磷酸酯修饰。
300.如权利要求283-298中任一项所述的方法,其中所述ssODN包含3'硫代磷酸酯修饰。
301.如权利要求258-298中任一项所述的方法,其中所述ssODN包含5'硫代磷酸酯修饰和3'硫代磷酸酯修饰。
302.如权利要求257-301中任一项所述的方法,其中所述接触步骤在体内进行。
303.如权利要求257-302中任一项所述的方法,其中所述接触步骤包含静脉内注射。
304.如权利要求260-303中任一项所述的方法,其中所述接触步骤包含使所述受试者或来自所述受试者的所述细胞与编码(a)、(b)、和(c)中的至少一个的核酸组合物接触。
305.如权利要求282-303中任一项所述的方法,其中所述接触步骤包含使所述受试者或来自所述受试者的所述细胞与编码(a)、(b)、(c)、和(g)中的至少一个的核酸组合物接触。
306.如权利要求257-305中任一项所述的方法,其中所述接触步骤包含使所述受试者或来自所述受试者的所述细胞与如权利要求34-154中任一项所述的核酸组合物接触。
307.如权利要求257-305中任一项所述的方法,其中所述接触步骤包含向所述受试者或来自所述受试者的所述细胞递送(b)和编码(a)的核酸组合物。
308.如权利要求307所述的方法,其中所述核酸组合物进一步编码(c)。
309.如权利要求307或308所述的方法,其中所述核酸组合物进一步编码(g)。
310.如权利要求257-305中任一项所述的方法,其中所述接触步骤包含向所述受试者或来自所述受试者的所述细胞递送(a)和(b)。
311.如权利要求257-305中任一项所述的方法,其中所述接触步骤包含向使所述受试者或来自所述受试者的所述细胞递送(a)和编码(b)的核酸组合物。
312.如权利要求310或311所述的方法,其中所述接触步骤进一步包含向使所述受试者或来自所述受试者的所述细胞递送(c)。
313.如权利要求282-312中任一项所述的方法,其中所述接触步骤进一步包含向所述受试者或来自所述受试者的所述细胞递送(g)。
314.一种反应混合物,所述反应混合物包含:
(a)如权利要求1-33中任一项所述的gRNA分子、如权利要求34-154中任一项所述的核酸组合物、或如权利要求155-193中任一项所述的组合物;以及
来自患有β-血红蛋白病的受试者的细胞。
315.一种试剂盒,所述试剂盒包含,
(a)如权利要求1-33中任一项所述的gRNA分子、或编码所述gRNA分子的核酸组合物、以及以下中的一个或多个:
(b)RNA指导的核酸酶;
(c)包含靶向结构域的第二gRNA分子,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列;以及
(d)编码(b)和(c)中的一个或多个的核酸组合物。
316.如权利要求315所述的试剂盒,其中所述RNA指导的核酸酶是Cas9分子或Cas9-融合蛋白。
317.如权利要求315或316所述的试剂盒,其中所述第二gRNA分子是如权利要求1-33中任一项所述的gRNA分子。
318.如权利要求315-317中任一项所述的试剂盒,所述试剂盒包含编码(a)、(b)、和(c)中的一个或多个的核酸组合物。
319.如权利要求315-318中任一项所述的试剂盒,所述试剂盒进一步包含第三gRNA分子,所述第三gRNA分子包含靶向结构域,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
320.如权利要求319所述的试剂盒,所述试剂盒进一步包含第四gRNA分子,所述第四gRNA分子包含靶向结构域,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
321.如权利要求315-320中任一项所述的试剂盒,所述试剂盒进一步包含(g)模板核酸。
322.如权利要求1-33中任一项所述的gRNA分子,用于治疗对其有需要的受试者的β-血红蛋白病。
323.如权利要求291所述的gRNA分子,其中所述gRNA分子与(b)RNA指导的核酸酶组合使用。
324.如权利要求323所述的gRNA分子,其中所述RNA指导的核酸酶是Cas9分子或Cas9-融合蛋白。
325.如权利要求322-324中任一项所述的gRNA分子,其中所述gRNA分子与下组合使用:(c)包含靶向结构域的第二gRNA分子,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
326.如权利要求322-325中任一项所述的gRNA分子,其中所述gRNA分子与(g)模板核酸组合使用。
327.如权利要求1-33中任一项所述的gRNA分子在生产用于治疗对其有需要的受试者的β-血红蛋白病的药物中的用途。
328.如权利要求327所述的用途,其中所述药物进一步包含(b)RNA指导的核酸酶。
329.如权利要求328所述的用途,其中所述RNA指导的核酸酶是Cas9分子。
330.如权利要求327-329中任一项所述的用途,其中所述药物进一步包含(c)包含靶向结构域的第二gRNA分子,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
331.如权利要求327-330中任一项所述的用途,其中所述药物进一步包含(g)模板核酸。
332.一种基因组编辑系统,所述基因组编辑系统包含:
(a)如权利要求1-33中任一项所述的gRNA分子;以及
(b)RNA指导的核酸酶。
333.如权利要求332所述的基因组编辑系统,其中所述RNA指导的核酸酶是Cas9分子或Cas9-融合蛋白。
334.如权利要求333所述的基因组编辑系统,其中所述Cas9分子是具有酶活性的Cas9(eaCas9)分子。
335.如权利要求334所述的基因组编辑系统,其中所述eaCas9分子包含切口酶分子。
336.如权利要求334或335所述的基因组编辑系统,其中所述eaCas9分子在靶核酸中形成双链断裂。
337.如权利要求334或335所述的基因组编辑系统,其中所述eaCas9分子在靶核酸中形成单链断裂。
338.如权利要求337所述的基因组编辑系统,其中所述单链断裂形成于所述靶核酸的与所述gRNA分子的靶向结构域互补的链中。
339.如权利要求337所述的基因组编辑系统,其中所述单链断裂形成于所述靶核酸的不同于与所述gRNA分子的靶向结构域互补的链的链中。
340.如权利要求334-339中任一项所述的基因组编辑系统,其中所述eaCas9分子包含HNH样结构域切割活性,但没有或具有不显著的N-末端RuvC样结构域切割活性。
341.如权利要求340所述的基因组编辑系统,其中所述eaCas9分子是HNH样结构域切口酶。
342.如权利要求340或341所述的基因组编辑系统,其中所述eaCas9分子在D10处包含突变。
343.如权利要求334-342中任一项所述的基因组编辑系统,其中所述eaCas9分子包含N端RuvC样结构域切割活性,但没有或具有不显著的HNH样结构域切割活性。
344.如权利要求343所述的基因组编辑系统,其中所述eaCas9分子是N端RuvC样结构域切口酶。
345.如权利要求343或344所述的基因组编辑系统,其中所述eaCas9分子在H840或N863处包含突变。
346.如权利要求332-345中任一项所述的基因组编辑系统,所述基因组编辑系统进一步包含(c)包含靶向结构域的第二gRNA分子,所述靶向结构域包含与完全或部分位于HBG1或HBG2调控区域内的靶结构域互补或部分互补的核苷酸序列。
347.如权利要求34所述的基因组编辑系统,其中所述第二gRNA分子是如权利要求1-33中任一项所述的gRNA分子。
348.如权利要求332-347中任一项所述的基因组编辑系统,其中所述基因组编辑系统进一步包含(d)第三gRNA分子。
349.如权利要求348所述的基因组编辑系统,其中所述基因组编辑系统进一步包含(e)第四gRNA分子。
350.如权利要求332-349中任一项所述的基因组编辑系统,其中所述基因组编辑系统进一步包含(g)模板核酸。
351.如权利要求350所述的基因组编辑系统,其中所述模板核酸是单链寡脱氧核苷酸(ssODN)。
352.如权利要求351所述的基因组编辑系统,其中所述模板核酸包含5'同源臂、替换序列、和3'同源臂。
353.如权利要求352所述的基因组编辑系统,其中所述5'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸;所述替换序列在长度上包含0个核苷酸;并且所述3'同源臂在长度上包含约200个核苷酸,例如,长度为至少25、50、75、100、125、150、175、或200个核苷酸。
354.如权利要求353所述的基因组编辑系统,其中所述5'同源臂包含约50至100bp,例如,55至95、60至90、70至90、或80至90bp、HBG靶位置内的靶位点同源性5',并且所述3'同源臂包含约50至100bp,例如,55至95、60至90、70至90、或80至90bp、HBG靶位置内的靶位点同源性3'。
355.如权利要求354所述的基因组编辑系统,其中所述靶位点选自下组,该组由以下组成:HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)、HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719)、和HBG2c.-114至-102(例如,SEQ IDNO:903(HBG2)的核苷酸2748-2760)。
356.如权利要求355所述的基因组编辑系统,其中所述靶位点是HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-114至-102(例如,SEQ IDNO:902(HBG1)的核苷酸2824-2836)的同源性5'。
357.如权利要求356所述的基因组编辑系统,其中所述5'同源臂包含SEQ ID NO:904(即,ssODN1 5'同源臂),基本上由其组成或由其组成。
358.如权利要求180或181所述的基因组编辑系统,其中所述3'同源臂包含约50至100bp,例如,55至95、60至90、70至90、或80至90bp,HBG1c.-114至-102(例如,SEQ ID NO:902(HBG1)的核苷酸2824-2836)的同源性3'。
359.如权利要求355-358中任一项所述的基因组编辑系统,其中所述3'同源臂包含SEQID NO:905(即,ssODN1 3'同源臂),基本上由其组成或由其组成。
360.如权利要求355所述的基因组编辑系统,其中所述靶位点是HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ IDNO:903(HBG2)的核苷酸2748-2760)的同源性5'。
361.如权利要求360所述的基因组编辑系统,其中所述5'同源臂包含SEQ ID NO:904(即,ssODN1 5'同源臂),基本上由其组成或由其组成。
362.如权利要求360或361所述的基因组编辑系统,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG2c.-114至-102(例如,SEQ ID NO:903(HBG2)的核苷酸2748-2760)的同源性3'。
363.如权利要求356-362中任一项所述的基因组编辑系统,其中所述3'同源臂包含SEQID NO:905(即,ssODN1 3'同源臂),基本上由其组成或由其组成。
364.如权利要求356-363中任一项所述的基因组编辑系统,其中所述模板核酸包含SEQID NO:906(即,ssODN1),基本上由其组成或由其组成。
365.如权利要求355所述的基因组编辑系统,其中所述靶位点是HBG1c.-225至-222(例如,SEQ ID NO:902(HBG1)的核苷酸2716-2719),并且所述5'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQ IDNO:902(HBG1)的核苷酸2716-2719)的同源性5'。
366.如权利要求365所述的基因组编辑系统,其中所述3'同源臂包含约50bp至100bp,例如,55bp至95bp、60bp至90bp、70bp至90bp、或80bp至90bp,HBG1c.-225至-222(例如,SEQID NO:902(HBG1)的核苷酸2716-2719)的同源性3'。
367.如权利要求351-366中任一项所述的基因组编辑系统,其中所述ssODN包含5'硫代磷酸酯修饰。
368.如权利要求351-366中任一项所述的基因组编辑系统,其中所述ssODN包含3'硫代磷酸酯修饰。
369.如权利要求351-366中任一项所述的基因组编辑系统,其中所述ssODN包含5'硫代磷酸酯修饰和3'硫代磷酸酯修饰。
CN201780029929.9A 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物 Pending CN109153994A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202311860300.2A CN118127006A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN202311860310.6A CN117802102A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN202311860322.9A CN117821458A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662308190P 2016-03-14 2016-03-14
US62/308,190 2016-03-14
US201762456615P 2017-02-08 2017-02-08
US62/456,615 2017-02-08
PCT/US2017/022377 WO2017160890A1 (en) 2016-03-14 2017-03-14 Crispr/cas-related methods and compositions for treating beta hemoglobinopathies

Related Child Applications (3)

Application Number Title Priority Date Filing Date
CN202311860322.9A Division CN117821458A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN202311860300.2A Division CN118127006A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN202311860310.6A Division CN117802102A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物

Publications (1)

Publication Number Publication Date
CN109153994A true CN109153994A (zh) 2019-01-04

Family

ID=58413206

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202311860300.2A Pending CN118127006A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN202311860310.6A Pending CN117802102A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN202311860322.9A Pending CN117821458A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN201780029929.9A Pending CN109153994A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN202311860300.2A Pending CN118127006A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN202311860310.6A Pending CN117802102A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
CN202311860322.9A Pending CN117821458A (zh) 2016-03-14 2017-03-14 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物

Country Status (11)

Country Link
US (1) US20200255857A1 (zh)
EP (1) EP3430142A1 (zh)
JP (2) JP2019508051A (zh)
KR (2) KR20230070331A (zh)
CN (4) CN118127006A (zh)
AU (2) AU2017235333B2 (zh)
CA (1) CA3017956A1 (zh)
IL (1) IL261714B1 (zh)
MX (1) MX2018011114A (zh)
SG (1) SG11201807859WA (zh)
WO (1) WO2017160890A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111321171A (zh) * 2018-12-14 2020-06-23 江苏集萃药康生物科技有限公司 一种应用CRISPR/Cas9介导ES打靶技术制备基因打靶动物模型的方法
CN111876416A (zh) * 2020-07-01 2020-11-03 广州瑞风生物科技有限公司 激活γ-珠蛋白基因表达的方法和组合物
CN112011576A (zh) * 2019-05-31 2020-12-01 华东师范大学 Crispr基因编辑技术在治疗地中海贫血中的应用
CN112979823A (zh) * 2019-12-18 2021-06-18 华东师范大学 一种用于治疗和/或预防β血红蛋白病的产品及融合蛋白
CN114848851A (zh) * 2022-04-29 2022-08-05 广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院) 治疗β-地中海贫血的药物

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
EP3262172A2 (en) 2015-02-23 2018-01-03 Crispr Therapeutics AG Materials and methods for treatment of hemoglobinopathies
JP7030522B2 (ja) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
CN108026526B (zh) 2015-06-09 2023-05-12 爱迪塔斯医药公司 用于改善移植的crispr/cas相关方法和组合物
EP4269577A3 (en) 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
IL264565B1 (en) 2016-08-03 2024-03-01 Harvard College Adenosine nuclear base editors and their uses
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors
SG11201903454VA (en) * 2016-11-02 2019-05-30 Univ Basel Immunologically discernible cell surface variants for use in cell therapy
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
TW201839136A (zh) 2017-02-06 2018-11-01 瑞士商諾華公司 治療血色素異常症之組合物及方法
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
WO2018170184A1 (en) 2017-03-14 2018-09-20 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
EP3601562A1 (en) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
EP3615664A4 (en) * 2017-04-24 2021-01-27 Seattle Children's Hospital (DBA Seattle Children's Research Institute) HOMOLOGY-BASED REPAIR COMPOSITIONS FOR THE TREATMENT OF HEMOGLOBINOPATHIES
EP3622070A2 (en) 2017-05-10 2020-03-18 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2019003193A1 (en) * 2017-06-30 2019-01-03 Novartis Ag METHODS FOR TREATING DISEASES USING GENE EDITING SYSTEMS
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
EP3658573A1 (en) 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019079347A1 (en) * 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
US20210180091A1 (en) * 2017-10-26 2021-06-17 Vertex Pharmaceuticals Incorporated Materials and methods for treatment of hemoglobinopathies
JP2021502077A (ja) * 2017-11-06 2021-01-28 エディタス・メディシン,インコーポレイテッド 免疫療法のためのt細胞におけるcblbのcrispr−cas9編集のための方法、組成物および構成要素
KR20200097760A (ko) * 2017-12-11 2020-08-19 에디타스 메디신, 인코포레이티드 유전자 편집을 위한 cpf1-관련 방법 및 조성물
WO2019150203A1 (en) 2018-02-05 2019-08-08 Crispr Therapeutics Ag Materials and methods for treatment of hemoglobinopathies
EP3762496A2 (en) * 2018-03-07 2021-01-13 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
WO2019178416A1 (en) * 2018-03-14 2019-09-19 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
MX2020009487A (es) * 2018-03-14 2020-12-10 Editas Medicine Inc Sistemas y metodos para el tratamiento de hemoglobinopatias.
JP2021521825A (ja) * 2018-04-24 2021-08-30 リガンダル・インコーポレイテッド ゲノム編集方法及び組成物
US20220033856A1 (en) * 2018-09-11 2022-02-03 Université de Paris Methods for increasing fetal hemoglobin content in eukaryotic cells and uses thereof for the treatment of hemoglobinopathies
EP3887521A1 (en) * 2018-11-29 2021-10-06 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
CA3236512A1 (en) 2019-02-13 2020-08-20 Beam Therapeutics Inc. Compositions and methods for treating hemoglobinopathies
WO2020191246A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
CA3236664A1 (en) * 2021-11-02 2023-05-11 Blair Leavitt Compositions and methods for preventing, ameliorating, or treating sickle cell disease
WO2024073751A1 (en) 2022-09-29 2024-04-04 Vor Biopharma Inc. Methods and compositions for gene modification and enrichment

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101802184A (zh) * 2007-07-23 2010-08-11 赛莱克蒂斯公司 切割来自人血红蛋白β基因的DNA靶序列的大范围核酸酶变体及其用途
WO2013126794A1 (en) * 2012-02-24 2013-08-29 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies
WO2014186585A2 (en) * 2013-05-15 2014-11-20 Sangamo Biosciences, Inc. Methods and compositions for treatment of a genetic condition
WO2014197748A2 (en) * 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation
CN104704110A (zh) * 2012-08-29 2015-06-10 桑格摩生物科学股份有限公司 用于治疗遗传性病状的方法和组合物
CN104955943A (zh) * 2012-11-27 2015-09-30 儿童医疗中心有限公司 用于胎儿血红蛋白再诱导的靶向bcl11a远端调控元件

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106459995B (zh) * 2013-11-07 2020-02-21 爱迪塔斯医药有限公司 使用统治型gRNA的CRISPR相关方法和组合物
US9938521B2 (en) 2014-03-10 2018-04-10 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating leber's congenital amaurosis 10 (LCA10)
WO2015148863A2 (en) * 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
EP3262172A2 (en) * 2015-02-23 2018-01-03 Crispr Therapeutics AG Materials and methods for treatment of hemoglobinopathies
JP7030522B2 (ja) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101802184A (zh) * 2007-07-23 2010-08-11 赛莱克蒂斯公司 切割来自人血红蛋白β基因的DNA靶序列的大范围核酸酶变体及其用途
WO2013126794A1 (en) * 2012-02-24 2013-08-29 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies
CN104704110A (zh) * 2012-08-29 2015-06-10 桑格摩生物科学股份有限公司 用于治疗遗传性病状的方法和组合物
CN104955943A (zh) * 2012-11-27 2015-09-30 儿童医疗中心有限公司 用于胎儿血红蛋白再诱导的靶向bcl11a远端调控元件
WO2014186585A2 (en) * 2013-05-15 2014-11-20 Sangamo Biosciences, Inc. Methods and compositions for treatment of a genetic condition
WO2014197748A2 (en) * 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ELIZABETH TRAXLER等: "Genome Editing Recreates Hereditary Persistence of Fetal Hemoglobin in Primary Human Erythroblasts", 《BLOOD》 *
蔡畅等: "Cas9-CRISPR敲除hae3基因对斑马鱼血红蛋白生成的影响", 《大连海洋大学学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111321171A (zh) * 2018-12-14 2020-06-23 江苏集萃药康生物科技有限公司 一种应用CRISPR/Cas9介导ES打靶技术制备基因打靶动物模型的方法
CN112011576A (zh) * 2019-05-31 2020-12-01 华东师范大学 Crispr基因编辑技术在治疗地中海贫血中的应用
CN112979823A (zh) * 2019-12-18 2021-06-18 华东师范大学 一种用于治疗和/或预防β血红蛋白病的产品及融合蛋白
CN112979823B (zh) * 2019-12-18 2022-04-08 华东师范大学 一种用于治疗和/或预防β血红蛋白病的产品及融合蛋白
CN111876416A (zh) * 2020-07-01 2020-11-03 广州瑞风生物科技有限公司 激活γ-珠蛋白基因表达的方法和组合物
CN111876416B (zh) * 2020-07-01 2021-09-03 广州瑞风生物科技有限公司 激活γ-珠蛋白基因表达的方法和组合物
WO2022000572A1 (zh) * 2020-07-01 2022-01-06 广州瑞风生物科技有限公司 激活γ-珠蛋白基因表达的方法和组合物
CN114848851A (zh) * 2022-04-29 2022-08-05 广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院) 治疗β-地中海贫血的药物

Also Published As

Publication number Publication date
IL261714B1 (en) 2024-06-01
US20200255857A1 (en) 2020-08-13
KR20230070331A (ko) 2023-05-22
IL261714A (en) 2018-10-31
CN117821458A (zh) 2024-04-05
JP2019508051A (ja) 2019-03-28
CA3017956A1 (en) 2017-09-21
WO2017160890A1 (en) 2017-09-21
KR20180120752A (ko) 2018-11-06
JP2023075166A (ja) 2023-05-30
AU2017235333B2 (en) 2023-08-24
EP3430142A1 (en) 2019-01-23
AU2023214243A1 (en) 2023-08-31
CN118127006A (zh) 2024-06-04
SG11201807859WA (en) 2018-10-30
CN117802102A (zh) 2024-04-02
KR102532663B1 (ko) 2023-05-16
MX2018011114A (es) 2019-02-20
AU2017235333A1 (en) 2018-10-04

Similar Documents

Publication Publication Date Title
CN109153994A (zh) 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物
US20230026726A1 (en) Crispr/cas-related methods and compositions for treating sickle cell disease
US20230126434A1 (en) Optimized crispr/cas9 systems and methods for gene editing in stem cells
US11512311B2 (en) Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency
EP3274454B1 (en) Crispr/cas-related methods, compositions and components
EP3132030B1 (en) Crispr-cas-related methods, compositions and components for cancer immunotherapy
EP3114227B1 (en) Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
US20170007679A1 (en) Crispr/cas-related methods and compositions for treating hiv infection and aids
CN109996880A (zh) 基于模块化aav递送系统的crispr-cas基因组工程
WO2015148860A1 (en) Crispr/cas-related methods and compositions for treating beta-thalassemia
CN107690480A (zh) Cas9分子/指导rna分子复合物的评价
CN109312338A (zh) 治疗单纯疱疹病毒的crispr/cas相关方法及组合物
CA2985615A1 (en) Crispr/cas-related methods and compositions for treating hiv infection and aids
EP3116997A1 (en) Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
CN106459995A (zh) 使用统治型gRNA的CRISPR相关方法和组合物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190104