CN112313334A - 用以编辑血红蛋白相关突变的同源定向修复模板设计和递送 - Google Patents

用以编辑血红蛋白相关突变的同源定向修复模板设计和递送 Download PDF

Info

Publication number
CN112313334A
CN112313334A CN201980042235.8A CN201980042235A CN112313334A CN 112313334 A CN112313334 A CN 112313334A CN 201980042235 A CN201980042235 A CN 201980042235A CN 112313334 A CN112313334 A CN 112313334A
Authority
CN
China
Prior art keywords
cell
seq
cells
nucleic acid
nuclease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980042235.8A
Other languages
English (en)
Inventor
戴维德·J·罗林斯
索姆亚·帕塔比
安德鲁·M·沙尔博格
凯尔·雅各比
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seattle Childrens Hospital
Original Assignee
Seattle Childrens Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seattle Childrens Hospital filed Critical Seattle Childrens Hospital
Publication of CN112313334A publication Critical patent/CN112313334A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/795Porphyrin- or corrin-ring-containing peptides
    • C07K14/805Haemoglobins; Myoglobins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2239/00Indexing codes associated with cellular immunotherapy of group A61K39/46
    • A61K2239/31Indexing codes associated with cellular immunotherapy of group A61K39/46 characterized by the route of administration
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2239/00Indexing codes associated with cellular immunotherapy of group A61K39/46
    • A61K2239/38Indexing codes associated with cellular immunotherapy of group A61K39/46 characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/32Special delivery means, e.g. tissue-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/34Allele or polymorphism specific uses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • C12N2330/51Specially adapted vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Cell Biology (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Hematology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Diabetes (AREA)
  • Virology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本文提供的方法和组合物的一些实施方式涉及修饰血红蛋白基因座(例如血红蛋白相关的突变,包括镰状细胞突变)。一些实施方式涉及通过在镰状细胞突变位点处引入磷酸二酯DNA链断裂来修饰镰状细胞突变。

Description

用以编辑血红蛋白相关突变的同源定向修复模板设计和递送
相关申请
本申请要求2019年3月19日提交的名称为“HOMOLOGY-DIRECTED REPAIR TEMPLATEDESIGN AND DELIVERY TO EDIT HEMOGLOBIN-RELATED MUTATIONS”的美国临时申请No.62/820521,以及2018年4月27日提交的名称为“HOMOLOGY-DIRECTED REPAIR TEMPLATE DESIGNAND DELIVERY TO EDIT HEMOGLOBIN-RELATED MUTATIONS”的美国临时申请No.62/663553的优先权,以引用的方式分别将其公开内容整体并入本文。
对序列表的引用
本申请与电子格式的序列表一起提交。序列表作为标题为SCRI194WOSEQLISTING的文件提供,创建于2019年4月15日,大小为约159kb。以引用的方式将电子格式的序列表中的信息整体并入本文。
技术领域
本文提供的方法和组合物的一些实施方式涉及修饰血红蛋白基因座(例如血红蛋白相关的突变,包括镰状细胞突变)。一些实施方式涉及通过在镰状细胞突变位点处引入磷酸二酯DNA链断裂来修饰该镰状细胞突变。
背景技术
镰状细胞疾病(SCD)包括血液紊乱,例如镰状细胞性贫血。在一些情况下,SCD导致存在于红细胞中的携氧蛋白血红蛋白异常。这可能导致红血细胞包含刚性、镰刀样的形状和/或贫血。
基于核酸内切酶的系统已迅速成为重要的基因编辑工具。用于基因编辑的基于核酸内切酶的手段的实例包括含有(但不限于)锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)、大范围核酸酶(如MegaTAL)和CRISPR/Cas9的系统。显然需要更多抑制和/或治疗SCD的手段。
发明内容
本文提供的方法和组合物的实施方式涉及修饰血红蛋白基因座,例如血红蛋白相关的突变(包括镰状细胞突变)。一些实施方式涉及用于HBB基因的同源定向修复(HDR)的核酸。
一些实施方式包括用于编辑细胞中HBB基因的方法,所述方法包括:(i)向细胞中引入编码向导RNA(gRNA)的多核苷酸;以及(ii)向所述细胞中引入模板多核苷酸。
在一些实施方式中,gRNA包含与SEQ ID NO:01-SEQ ID NO:06中任一项的核苷酸序列具有至少95%同一性的核酸。在一些实施方式中,gRNA包含与SEQ ID NO:07-SEQ IDNO:12中任一项的核苷酸序列具有至少95%同一性的核酸。在一些实施方式中,gRNA包含SEQ ID NO:01-SEQ ID NO:06中任一项的核苷酸序列。在一些实施方式中,gRNA包含核苷酸序列SEQ ID NO:01。在一些实施方式中,gRNA包含核苷酸序列SEQ ID NO:07。
在一些实施方式中,向细胞中引入编码gRNA的多核苷酸包括使细胞与包含CAS9蛋白和编码gRNA的多核苷酸的核糖核蛋白(RNP)接触。在一些实施方式中,CAS9蛋白和编码gRNA的多核苷酸的比为0.1:1到1:10之间。在一些实施方式中,CAS9蛋白和编码gRNA的多核苷酸的比为1:1到1:5之间。在一些实施方式中,CAS9蛋白和编码gRNA的多核苷酸的比为约1:2.5。
在一些实施方式中,模板多核苷酸编码HBB基因的至少部分或其互补物(complement)。在一些实施方式中,模板多核苷酸编码野生型HBB基因的至少部分或其互补物。在一些实施方式中,所述HBB基因的至少部分包含HBB基因的外显子1。
在一些实施方式中,病毒载体包含模板多核苷酸。在一些实施方式中,载体是腺相关病毒(AAV)载体。在一些实施方式中,载体是自互补AAV(scAAV)载体。在一些实施方式中,模板多核苷酸包含至少约4kb的HBB基因。
在一些实施方式中,单链供体寡核苷酸(ssODN)包含模板多核苷酸。在一些实施方式中,ssODN包含与SEQ ID NO:64-SEQ ID NO:72中任一项的核苷酸序列具有至少95%同一性的核苷酸序列。在一些实施方式中,ssODN包含SEQ ID NO:64-SEQ ID NO:72中任一项的核苷酸序列。
在一些实施方式中,在HBB基因的外显子1中生成双链断裂。在一些实施方式中,在HBB基因的外显子1的第六密码子附近生成双链断裂。
在一些实施方式中,步骤(i)在步骤(ii)之前进行。在一些实施方式中,步骤(i)和步骤(ii)同时进行。在一些实施方式中,步骤(i)和/或步骤(ii)包括进行核转染。在一些实施方式中,进行核转染包括使用LONZA系统。在一些实施方式中,该系统包括使用方波脉冲(square wave pulse)。在一些实施方式中,步骤(i)和/或步骤(ii)包括接触约200,000个细胞/20μL的核转染反应,其中,所述核转染反应包含gRNA和/或模板多核苷酸。
在一些实施方式中,所述细胞是哺乳动物细胞。在一些实施方式中,所述细胞是人细胞。在一些实施方式中,所述细胞是原代细胞。在一些实施方式中,所述细胞是造血干细胞(HSC)。在一些实施方式中,所述细胞是T细胞或B细胞。在一些实施方式中,所述细胞是CD34+细胞。
在一些实施方式中,HBB基因与SEQ ID NO:37的核苷酸序列具有至少95%的同一性。
在一些实施方式中,所述核酸包括以下中的一个或多个:编码HBB基因的第一序列;编码一个或多个向导RNA切割位点的第二序列;以及编码一个或多个核酸酶结合位点的第三序列。
在一些实施方式中,HBB基因包含SEQ ID NO:37所示的核酸序列。在一些实施方式中,第二序列包含SEQ ID NO:1所示的核酸序列。在一些实施方式中,所述一个或多个核酸酶结合位点包含正向和反向转录激活因子样效应物核酸酶(TALEN)结合位点。在一些实施方式中,所述一个或多个核酸结合位点是成簇的规律间隔的短回文重复序列(CRISPR)相关蛋白9(Cas9)结合位点。一些实施方式包括一个或多个增强子元件。一些实施方式包括同源臂序列。一些实施方式包括编码启动子的核酸序列。
一些实施方式涉及用于在细胞中促进HBB蛋白表达的HDR的载体。在一些实施方式中,载体包含以下中的一个或多个:编码HBB基因的第一序列;编码一个或多个向导RNA切割位点的第二序列;以及编码一个或多个核酸酶结合位点的第三序列。
在一些实施方式中,HBB基因包含SEQ ID NO:37所示的核酸序列。在一些实施方式中,第二序列包含SEQ ID NO:1所示的核酸序列。在一些实施方式中,所述一个或多个核酸酶结合位点包含正向和反向转录激活因子样效应物核酸酶(TALEN)结合位点。在一些实施方式中,所述一个或多个核酸结合位点为成簇的规律间隔的短回文重复序列(CRISPR)相关蛋白9(Cas9)结合位点。一些实施方式包括一个或多个增强子元件。在一些实施方式中,载体是腺相关病毒载体(AAV)。在一些实施方式中,载体是自互补AAV(scAAV)。在一些实施方式中,细胞是人细胞。在一些实施方式中,所述细胞是原代细胞。在一些实施方式中,所述细胞是自体细胞。在一些实施方式中,所述细胞是T细胞。在一些实施方式中,所述细胞是造血干细胞(HSC)。在一些实施方式中,所述细胞是CD34+HSC。一些实施方式涉及用于促进细胞中CD40L蛋白表达的HDR的系统。在一些实施方式中,该系统包括一个或多个上述段落所述的任何载体,以及编码核酸酶的核酸。在一些实施方式中,核酸酶是TALEN核酸酶。在一些实施方式中,核酸酶是Cas核酸酶。在一些实施方式中,载体和核酸被配置用于共同递送至细胞。在一些实施方式中,共同递送至细胞修饰内源性HBB基因座。在一些实施方式中,所述细胞是原代人造血细胞。
一些实施方式涉及用于表达HBB的细胞。在一些实施方式中,所述细胞包含核酸。在一些实施方式中,所述核酸包括以下中的一个或多个:编码HBB基因的第一序列;编码启动子的第二序列;编码一个或多个向导RNA切割位点的第三序列;以及编码一个或多个核酸酶结合位点的第四序列。
在一些实施方式中,所述核酸在载体中。在一些实施方式中,所述载体是AAV。在一些实施方式中,所述AAV是scAAV。在一些实施方式中,所述细胞是人细胞。在一些实施方式中,所述细胞是原代细胞。在一些实施方式中,所述细胞是自体细胞。在一些实施方式中,所述细胞是T细胞。在一些实施方式中,所述细胞是HSC。在一些实施方式中,所述细胞是CD34+HSC。
一些实施方式涉及在有需要的受试者中促进HBB基因的HDR的方法。在一些实施方式中,所述方法包括一个或多个以下步骤:向受试者给予一个或多个上述段落所述的任何细胞或载体;以及向受试者给予核酸酶。
在一些实施方式中,所述核酸酶是TALEN核酸酶。在一些实施方式中,所述核酸酶是Cas核酸酶。在一些实施方式中,所述核酸酶与细胞或与载体共同给予至受试者。在一些实施方式中,所述细胞来自受试者,并且其中,通过向所述细胞中引入一个或多个上述段落所述的核酸或载体来对细胞进行遗传修饰。在一些实施方式中,通过过继细胞转移进行给予。在一些实施方式中,所述细胞是人细胞。在一些实施方式中,所述细胞是原代细胞。在一些实施方式中,所述细胞是自体细胞。在一些实施方式中,所述细胞是T细胞。在一些实施方式中,所述细胞是HSC。在一些实施方式中,所述细胞是CD34+HSC。在一些实施方式中,受试者患有镰状细胞疾病。在一些实施方式中,促进HDR引起对HBB基因的一个或多个编辑。在一些实施方式中,对HBB基因的一个或多个编辑包括对镰状细胞突变的修正。在一些实施方式中,镰状细胞突变包括E7V突变。
一些实施方式涉及治疗、抑制或缓解有需要的受试者中的镰状细胞疾病(SCD)或与SCD有关的疾病症状的方法。在一些实施方式中,所述方法包括一个或多个以下步骤:向受试者给予上述段落中任一项或多项所述的细胞或载体;向所述受试者给予核酸酶;以及任选地将所述受试者鉴别或选择为将从接受用于SCD或与SCD有关的疾病症状的疗法中受益的受试者,和/或任选地测量所述受试者中SCD进展方面的改善或与SCD有关的疾病症状方面的改善。
在一些实施方式中,所述核酸酶是TALEN核酸酶。在一些实施方式中,所述核酸酶是CRISPR/Cas核酸酶。在一些实施方式中,将核酸酶与细胞或与载体共同给予至受试者。在一些实施方式中,所述细胞来自受试者,其中,通过向所述细胞中引入上述段落中任一项或多项所述的核酸或载体来对细胞进行遗传修饰。在一些实施方式中,通过过继细胞转移进行给予。在一些实施方式中,所述细胞是人细胞。在一些实施方式中,所述细胞是原代细胞。在一些实施方式中,所述细胞是自体细胞。在一些实施方式中,所述细胞是T细胞。在一些实施方式中,所述细胞是HSC。在一些实施方式中,所述细胞是CD34+HSC。一些实施方式包括将细胞植入至受试者的骨髓中。在一些实施方式中,所述细胞来自受试者,并且所述细胞来自骨髓相同的受试者。
附图说明
图1A、图1B和图1C描绘了示出数据的图形表示,所述数据显示了用核酸酶在HBB基因座处的有效编辑。图1A、图1B和图1C各为描述响应核酸酶的插入缺失%的图。
图2A、图2B、图2C、图2D、图2E和图2F描绘了示出用于测试缺失修复模板1242、模板1243、模板1244、模板1245的rAAV6递送的设计以及相关数据的图形表示。
图3A、图3B、图3C、图3D、图3E和图3F包括用于测试非缺失修复模板1289、模板1290的rAAV6递送的设计以及相关数据的描绘。
图4A、图4B、图4C和图4D包括用于测试人密码子优化的镰状导入盒1246、1247、1248、1249的rAAV6递送的设计以及相关数据的描绘。
图5A、图5B、图5C、图5D、图5E和图5F包括用于测试镰状突变引入(GTC)1314的rAAV6递送的设计以及相关数据的描绘。
图6A、图6B和图6C包括用于测试镰状引入修复模板1321的rAAV6递送的设计以及相关数据的描绘。
图7A、图7B、图7C和图7D包括用于测试ssODN引入镰状突变(GTC改变)的设计以及相关数据的描绘。
图8A、图8B、图8C、图8D、图8E和图8F包括用于测试用于镰状修正(CCC GAA改变)的ssODN的设计以及相关数据的描绘。
图9A、图9B和图9C包括示出了在12周时经编辑的人细胞在W41小鼠的骨髓中的植入的图形数据。
图10A描绘了基因组HBB基因的示意图,其示出了sgRNA和TALEN结合位点的位置。从GAG(密码子6)到GTC或GTG的核苷酸置换将氨基酸从谷氨酸改变为缬氨酸并引起SCD。
图10B描绘了筛选TALEN mRNA(T)或候选sgRNA(g1-g6,以RNP递送)以在HBB基因处产生DSB(由TIDE/ICE测量,供体n=2-3)。
图10C描绘了cas9:sgRNA比优化以最大化mPBSC中的编辑效率。通过TIDE/ICE分析NHEJ率(Cas9:sgRNA比为1:1(各40pmol),供体n=2,或比为1:2.5(20pmol Cas9和50pmolsgRNA),供体n=15)。
图10D描绘了通过mPBSC中的MiSeq分析使用以RNP递送的sgRNA-g1,对HBB处的中靶(on-target)破坏和HBD处的脱靶(off-target)破坏进行的评价(供体n=7)。
图10E描绘了使用NEON电穿孔系统(供体n=15)或Lonza核转染系统(供体n=3)以RNP递送的sgRNA-g1的编辑效率。所有条形图均示出平均值±SD。*p<0.05**p<0.01***p<0.001****,p<0.0001。通过2因素ANOVA和Dunnett多重比较对每个样品平均值与相应对照样品平均值进行比较来计算p值。
图10F描绘了通过CCTop算法预测的前5个脱靶基因的脱靶分析。凝胶显示了通过T7核酸内切酶测定评价的经空白处理(M)和sgRNA-g1 RNP处理(RNP)样品中扩增的前5个脱靶基因的扩增子。(i)OT1:DENND3(泳道1-泳道2),(ii)OT2:MIR7974(泳道3-泳道4),(iii)OT3:LINC01206(泳道5-泳道6),(iv)OT4:HBD(泳道7-泳道8),(v)OT5:TULP4(泳道9-泳道10),(vi)靶标位点:HBB(泳道11-泳道12)。星号(*)代表切割带。#代表与任何潜在裂解片段(对于TULP4的313bp和143bp)都不匹配的假带(ghost band)。
图10G描绘了前5个脱靶基因的TIDE/ICE测序分析(i)OT1:DENND3,(ii)OT2:MIR7679,(iii)OT3:LINC01206,(iv)OT4:HBD,(v)OT5:TULP4,(vi)靶标位点:HBB(n=2个实验)。
图11A描绘了rAAV6盒的示意代表图,所述rAAV6盒被设计用以驱动通过HDR在密码子6处引入镰状突变的GTC(E6V)或引入密码子优化的SNP改变的GAA(E6optE)。
图11B描绘了在mPBSC中测试用RNP和rAAV6递送进行的基因编辑以及随后进行红系分化的实验时间线。
图11C分别描绘了以指定浓度单独用RNP电穿孔、单独用rAAV6供体模板转导、或共同递送RNP和GTC(E6V)rAAV6供体模板后,通过ddPCR测量的WT(%)、HDR(%)以及通过TIDE/ICE测序测量的NHEJ(%)(供体n=4)。
图11D描绘了对红系细胞的RP-HPLC分析,以测量仅用RNP处理的细胞、仅用rAAV6处理的细胞或用RNP加GTC(E6V)rAAV6处理的细胞中的β-珠蛋白表达(供体n=7)。
图11E分别描绘了以指定浓度单独用RNP电穿孔、单独用rAAV6供体模板转导或共同递送RNP和GAA(E6optE)rAAV6供体模板后,通过ddPCR测量的WT(%)、HDR(%)以及通过TIDE/ICE测序测量的NHEJ(%)(1%rAAV6;供体n=3)。
图11F描绘了对红系细胞的RP-HPLC分析,以测量仅用RNP处理的细胞、仅用rAAV6处理的细胞或RNP加GAA(E6optE)rAAV6处理的细胞的β-珠蛋白表达(供体n=3)。(βA=成人珠蛋白,βS=镰状珠蛋白,γG=γ2,γA=γ1)。所有条形图示出平均值±SD。*p<0.05,**p<0.01,***p<0.001,****p<0.0001。通过2因素ANOVA和Dunnett多重比较将NHEJ(%)、HDR(%)、WT(%)或珠蛋白亚型(%)的各个样品平均值与空白样品的各NHEJ(%)、HDR(%)、WT(%)或珠蛋白亚型(%)进行比较来计算p值。
图11G描绘了分别在使用Neon电穿孔系统(n=3)或Lonza核转染系统(n=1)共递送RNP和GTC(E6V)rAAV6后,通过ddPCR和TIDE/ICE测序测量的HDR和NHEJ结果。
图11H描绘了使用neon电穿孔用RNP编辑并用GTC(E6V)rAAV6(n=5)转导的样品的集落测序。
图11I描绘了在电穿孔和GTC(E6V)或GAA(E6optE)rAAV6转导后第2天mPBSC的活力。
图11J描绘了红系细胞的IEC,以在体外测定在单独用rAAV6处理的细胞和用RNP加GTC(E6V)rAAV6处理的细胞中的珠蛋白四聚体(HbF:胎儿;HbA:成人;HbA2:未成年;HbS:镰状)。所有条形图示出平均值±SD。n代表个体实验的数量。*p<0.05,**p<0.01,***p<0.001,****,p<0.0001。通过2因素ANOVA和Dunnett多重比较对每个样品平均值与相应的对照样品平均值进行比较来计算p值。
图11K描绘了经编辑和分化的红系细胞的RP-HPLC分析。参考、空白、仅rAAV6和RNP加GTC(E6V)rAAV6(3%)转导的细胞驱动镰状珠蛋白表达的RP-HPLC色谱图迹线(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。垂直数字是HPLC洗脱时间。较低的迹线示出镰状珠蛋白表达(红色箭头)。
图11L描绘了用sgRNA-g1 RNP测试的以rAAV6递送的复合cDNA盒的示意代表图。1321具有驱动GTC改变(E6V氨基酸改变)的HBG1Δ13启动子以及红系增强子;HPFH-2和HS-40。MND-GFP充当HDR的替代物,并具有与SV40聚腺苷酸化序列相反的取向。1322具有与1321相同的设计,但是具有缺失(Δ-127、-71)以去除HBB启动子。实验设置类似于图11B。
图11M描绘了在仅RNP、仅rAAV6以及RNP与rAAV6转导一起的电穿孔和转导后14天通过流式细胞术测量的GFP表达(1321供体n=2,1322供体n=1)。
图11N描绘了红系细胞的RP-HPLC分析,以测量仅RNP处理的细胞、仅rAAV6处理的细胞或RNP加GTC(E6V)1321/1322rAAV6处理的细胞中的β-珠蛋白表达。所有条形图示出平均值±SD。n代表个体实验的数量。(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。
图11O描绘了经编辑和分化的红系细胞的RP-HPLC分析。空白、仅rAAV6、仅RNP以及RNP加GAA(E6optE)rAAV6驱动的成人珠蛋白的表达的RP-HPLC色谱图迹线(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。垂直数字为HPLC洗脱时间。较低的迹线示出成人珠蛋白表达的恢复。
图12A描绘了ssODN盒的示意代表图,所述ssODN盒设计为驱动通过HDR在密码子6处引入镰状突变的GTC(E6V)或引入密码子优化的SNP改变的GAA(E6optE)。
图12B描绘了在mPBSC中测试用RNP和ssODN递送进行基因编辑、随后进行红系分化的实验时间线。
图12C描绘了分别在以指定浓度仅用RNP电穿孔或RNP和GTC(E6V)ssODN供体模板的共同递送后,通过ddPCR测量的WT(%)、HDR(%)以及通过TIDE/ICE测序测量的NHEJ(%)(50pmol ssODN;供体n=5)。
图12D描绘了红系细胞的RP-HPLC分析,以测量仅用RNP处理的细胞或用RNP加GTC(E6V)ssODN处理的细胞中的β-珠蛋白表达(50pmol ssODN:供体n=5)。
图12E描绘了分别在以指定浓度仅用RNP电穿孔或RNP和GAA(E6optE)ssODN的共同递送后,通过ddPCR测量的WT(%)、HDR(%)以及通过TIDE/ICE测序测量的NHEJ(%)(50pmolssODN;供体n=8)。
图12F描绘了红系细胞的RP-HPLC分析,以测量仅用RNP处理的细胞或用RNP加GAA(E6optE)ssODN处理的细胞中的β-珠蛋白表达(50pmol ssODN;供体n=6)。(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。所有条形图示出平均值±SD。*p<0.05,**p<0.01,***p<0.001,****p<0.0001。通过2因素ANOVA和Dunnett多重比较将NHEJ(%)、HDR(%)、WT(%)或珠蛋白亚型(%)的各个样品平均值与空白样品的各NHEJ(%)、HDR(%)、WT(%)或珠蛋白亚型(%)进行比较来计算p值。
图12G描绘了用通过HDR在密码子6处引入镰状突变的GTC或GTG(E6V)ssODN或引入密码子优化的SNP改变的GAA(E6optE)ssODN进行电穿孔后第2天CD34+mPBSC的活力。
图12H描绘了分别在以指定浓度仅用RNP电穿孔或RNP和供体GTG(E6V)ssODN的共同递送后,通过ddPCR测量的WT(%)、HDR(%)以及通过TIDE/ICE测序测量的NHEJ(50pmolssODN,供体n=3)。
图12I描绘了用Neon电穿孔系统测试的用RNP编辑并用GTG(E6V)ssODN和GAA(E6optE)ssODN修饰的样品的集落测序(供体n=3)。
图12J描绘了对红系细胞的RP-HPLC分析,以确定具有GTG(E6V)ssODN递送的经编辑的细胞中的珠蛋白表达(供体n=3)。(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。
图12K描绘了分别在使用Neon电穿孔系统(50pmol ssODN,n=2)或Lonza核转染系统(50pmol ssODN,n=3)以指定浓度仅用RNP电穿孔或RNP和GAA(E6optE)ssODN的共同递送后,通过ddPCR测量的WT(%)、HDR(%)以及通过TIDE/ICE测序测量的NHEJ(%)。所有条形图示出平均值±SD。n代表个体实验的数量。*p<0.05,**p<0.01,***p<0.001,****p<0.0001。
图12L描绘了经编辑和分化的红系细胞的RP-HPLC分析。空白、仅RNP以及RNP加GTC(E6V)ssODN和rAAV6供体模板驱动镰状珠蛋白表达的RP-HPLC色谱图迹线(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。垂直数字为HPLC洗脱时间。较低的迹线示出镰状珠蛋白表达(箭头)。
图12M描绘了经编辑和分化的红系细胞的RP-HPLC分析。参考、空白、仅RNP以及RNP加GTG(E6V)ssODN驱动镰状珠蛋白表达的RP-HPLC色谱图迹线(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。垂直数字为HPLC洗脱时间。较低的迹线示出镰状珠蛋白表达(箭头)。
图12N描绘了经编辑和分化的红系细胞的RP-HPLC分析。空白、仅RNP以及RNP加GAA(Eopt6E)ssODN和rAAV6供体模板驱动的成人珠蛋白表达的RP-HPLC色谱图迹线(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。垂直数字为HPLC洗脱时间。较低的迹线示出成人珠蛋白表达的恢复。
图13A描绘了在用GTC(E6V)rAAV6(n=6)以及ssODN(使用GTC(E6V,n=8)、GTG(E6V,n=3)或GAA(E6optE,n=2)ssODN)处理的细胞中,通过MiSeq分析的HDR与NHEJ编辑的量化。
图13B描绘了通过MiSeq的插入缺失谱分析,将仅RNP介导的编辑与用rAAV6或ssODN递送(供体n=6)促进HDR后存在于细胞中的残余插入缺失进行比较。
图13C描绘了在以下样品中测得的各种基因编辑结果WT、NHEJ(插入、置换、删除)和HDR:空白、仅RNP、RNP与rAAV6的共同递送以及RNP与ssODN的共同递送。经分析的样品是编辑后第14天分析的移植前输入样品。(n=4)。所有条形图示出平均值±SD。*p<0.05,**p<0.01,***p<0.001,****p<0.0001。p值是通过2因素ANOVA和Dunnett多重比较,将NHEJ(%)、HDR(%)的各样品平均值与空白样品的各NHEJ(%)、HDR(%)进行比较而计算得出的。
图13D描绘了来自体外经编辑的样品和体内BM样品的比对的配对末端读段的数量。每个点代表唯一的样本。
图13E描绘了来自在空白、仅RNP、RNP与rAAV6共同递送以及RNP与ssODN共同递送中观测到的主要NHEJ事件的共有序列。
图13F描绘了在用rAAV6或ssODN递送促进HDR后,通过MiSeq分析对体外和体内移码突变(frame shift mutations)%的量化。
图14A描绘了在mPBSC中体外和在NBSGW小鼠模型中体内测试用GTC(E6V)rAAV6或ssODN处理的细胞的基因编辑的实验时间线。
图14B描绘了用基于FSC/SSC和单个细胞的门控而来的BM和脾中人细胞(hCD45+)的嵌合。
图14C描绘了BM hCD45+群内的人CD19+和CD33+亚群。
图14D描绘了在mCD45-群上门控的BM中的人CD235+细胞。将BM细胞在红系分化培养基中离体培养14天,并通过流式细胞术测量CD235+(离体)。
图14E描绘了BM hCD45+群中人CD34+和CD34+CD38lo细胞的比例。
图14F描绘了通过ddPCR确定GTC(E6V)rAAV6或ssODN处理的输入细胞(第14天,n=4)、以及移植后3周(第21天;n=2)和移植后12-14周(第84-96天;空白:n=8;RNP+rAAV6:n=17;RNP+ssODN:n=18)的HDR率。
图14G描绘了通过TIDE/ICE测序确定的GTC(E6V)rAAV6或ssODN处理的输入细胞(第14天)、移植后3周(第21天)和移植后12-14周(第84-96天)的NHEJ率。
图14H描绘了通过MiSeq分析确定的在指定时间点的GTC(E6V)rAAV6或ssODN处理的细胞的HDR率。
图14I描绘了通过MiSeq分析确定的GTC(E6V)rAAV6或ssODN处理的细胞在指定的时间点的NHEJ率。n代表样品或动物。输入n=4,所有条形图示出平均值±SD。ns:不显著。*p<0.05,**p<0.01,***p<0.001,****p<0.0001。通过用2因素ANOVA和Dunnett多重比较将NHEJ(%)、HDR(%)和WT(%)的各样品平均值与空白样品的各NHEJ(%)、HDR(%)和WT(%)进行比较来计算p值。
图14J描绘了从hCD45+群门控的脾中的人CD19+和CD33+群。
图14K描绘了由非CD19+和非CD33+细胞门控的BM和脾中的人CD3+群。
图14L描绘了在移植有用GTC(E6V)供体编辑的HSC的NBSGW受体小鼠的BM内的人细胞(hCD45+)的代表性流式图。流式图示出了多谱系植入,包括:(i)经空白编辑、(ii)经rAAV6编辑和(iii)经ssODN编辑的细胞受体的BM内的CD19+、CD33+和CD235+细胞。门控策略:活的、单细胞,hCD45+>CD19+CD33+。在mCD45-细胞上门控红系细胞。
图14M(左子图)描绘了移植前CD34+和CD34+CD38lo细胞的代表性流式图,其示出:(i)经空白编辑、(ii)经rAAV6编辑或(iii)经ssODN编辑(用GTC(E6V)修饰)的群。策略:活的、单细胞,hCD45+>CD34+CD38+>CD90+CD133+。图14M(右子图)描绘了使用对于LT-HSC富集的另外的标志物鉴别群而来的CD34+CD38lo细胞的代表性流式图,如通过CD133+CD90+双阳性细胞所鉴别的。
图14N描绘了来自移植有(i)经空白编辑的,(ii)经rAAV6编辑的或(iii)经ssODN编辑的细胞(GTC(E6V)供体构建体)的NBSGW小鼠的BM的CD34+和CD34+CD38lo区室的代表性流式图。门控策略:活的、单细胞,hCD45+>CD34+CD38+。
图14O描绘了在使用GTC(E6V)rAAV6或ssODN递送对CD34+mPBSC进行基因编辑后,测量红系培养物中β-珠蛋白亚型的RP-HPLC分析。
图14P描绘了在12至14周时从移植有空白(n=2)修饰的细胞、GTC(E6V)编辑的rAAV6(n=4)修饰的细胞或GTC(E6V)编辑的ssODN(n=3)修饰的细胞的受体小鼠中分离的BM细胞,所述细胞在收获后在红系培养条件下离体扩增2周。进行RP-HPLC分析以测量表达的珠蛋白亚型(α=α,βA=成人,βS=镰状,γG=γ2,γA=γ1)。
图14Q描绘了单个BFU-E集落(由methocult培养产生)的离子交换HPLC,以确定在基因编辑后表达的珠蛋白四聚体。
图14R描述了单个BFU-E集落的离子交换HPLC的概述,以测量在经基因编辑的细胞中表达的珠蛋白四聚体(HbF:胎儿;HbA:成人;HbA2:未成年;HbS:镰状)。所有条形图示出平均值±SD。n代表个体动物的数量。*p<0.05,**p<0.01,***p<0.001,****p<0.0001,通过2因素ANOVA和Dunnett多重比较将各个样品平均值与空白或对照样品的各样品平均值进行比较来计算p值。
图14S描述了经编辑和分化的红系集落的IEC分析。来自移植4中单个BFU-E集落的离子交换HPLC实例,用以测量珠蛋白四聚体(HbF:胎儿;HbA:成人;HbA2:未成年;HbS:镰状)。较低的迹线表明由植入的经GTC(E6V)ssODN编辑的HSC衍生而来的单个集落中的镰状珠蛋白表达(红色箭头)。垂直数字为HPLC洗脱时间。
图14T描绘了对经编辑和分化的红系集落的IEC分析。来自移植3中单个BFU-E集落的离子交换HPLC实例,用以测定珠蛋白四聚体(HbF:胎儿;HbA:成人;HbA2:未成年;HbS:镰状)。较低的迹线表明由植入的经GTC(E6V)ssODN编辑的HSC衍生而来的集落中的镰状珠蛋白表达(红色箭头)。垂直数字为HPLC洗脱时间。
图15A描绘了对于CM149或ER100 LONZA核转染方法(使用SCGM或SFEM-II培养基),通过细胞计数的编辑后活力百分比、通过ddPCR的HDR%、通过ICE的NHEJ%以及通过流式细胞术测量的LT-HSC区室(门控策略:活的、单细胞,CD34+CD38lo>CD90+CD133+)。
图15B描绘了对于CM149或ER100 LONZA核转染方法(使用SCGM或SFEM-II培养基)的编辑后β-样珠蛋白以及使用rAAV6或ssODN供体模板的HDR的百分比的图。
图16A描述了对于CM149或ER100 LONZA核转染方法,在核转染时使用各种细胞密度的SFEM-II培养基的活力百分比的图。
图16B描绘了对于CM149或ER100 LONZA核转染方法,在核转染时使用各种细胞密度的SFEM-II培养基的HDR的图。
图16C描绘了对于CM149或ER100 LONZA核转染方法,在核转染时使用各种细胞密度的SFEM-II培养基的NHEJ的图。
图17A描绘了对于各种LONZA核转染方案,用EP、RNP或RNP和ssODN处理的细胞在编辑后2-14天的活力百分比的图。
图17B描绘了对于各种LONZA核转染方案,用EP、RNP或RNP和ssODN处理的细胞的HDR、NHEJ和β样珠蛋白表达百分比的图。
图17C描绘了经受各种LONZA核转染方案的细胞的活力和HDR的对比。
图18描绘了经受DU100或CX100 LONZA核转染方案的细胞的活力、HDR和NHEJ百分比的图。
图19示出了对于E6V(GTC)改变和EoptE(GAA)改变二者的代表性空白、AAV、RNP、RNP+AAV和RNP+ssODN样品的ddPCR测定结果。
图20A描绘了由ddPCR数据确定的HDR百分比的图。
图20B描绘了由ICE算法数据确定的HDR百分比的图。
具体实施方式
本文公开的组合物和方法的一些实施方式涉及编辑血红蛋白相关的突变。一些此类实施方式包括通过在镰状细胞突变位点处引入磷酸二酯DNA链断裂而原位编辑镰状细胞突变。
镰状细胞疾病是由单核苷酸颠换(transversion)引起的,该单核苷酸颠换增加了成人珠蛋白(βA)的疏水性并使其易于聚合。SCD患者经常依赖输血,发病率增加且寿命缩短。尽管可以通过来自健康供体的HLA匹配同种异体移植来实现治病性治疗,但HLA匹配供体的可及性有限,并且由于移植物抗宿主病(GvHD)的可能性以及强度较高的骨髓清除调理后的短期和长期影响可能使结果复杂化。自体干细胞中的基因编辑可以绕开HLA匹配供体可及性的限制,并直接修正自我更新干细胞中的致病突变。此外,成功的靶向基因编辑的建立将减轻由早期病毒载体带来的随机整合这一历史风险。
基因编辑包括产生双链断裂(DSB)的位点特异性核酸内切酶,所述双链断裂被细胞DNA修复机制以无缝修复、易出错的非同源末端连接(NHEJ)或在存在DNA供体模板的情况下的精确的HDR来解决。这些修复结果受到细胞周期阶段的显著影响。G0/G1期的静止期细胞中的DSB主要以NHEJ解决,而进入S/G2期则通过HDR解决。这些修复结果是互斥的,因此争夺个体HSC内以及整个HSC群中的整体结果。
HBB基因的外显子1中的SCD单核苷酸突变可使用设计者核酸酶(包括锌指核酸酶(ZFN)mRNA、TALEN和CRISPR/Cas9)结合DNA修复模板的数种共同递送的替代方法,通过同源定向修复来修正,所述DNA修复模板包括:整合酶缺陷型慢病毒载体(IDLV)、rAAV6和ssODN(Hoban,MD等,(2015).Blood 125:2597-2604;DeWitt,MA等,(2017)Methods 121-122:9-15;Dever,DP等,(2016)Nature 539:384-389;以及Hoban,MD等,(2016)Mol Ther 24:1561-1569.)17-20,在此以引用的方式将其各自明确地整体并入)。在这些方法中,使用rAAV6或单链寡脱氧核苷酸(ssODN)构成最有效的供体模板递送平台。但是,对于rAAV6和ssODN供体模板递送方法,尚未同时比较总编辑结果(包括精确HDR的频率与NHEJ的频率对比)。此外,为了具有临床相关性和治疗性,高保真HDR结果应成比例地超过不适当地修复DSB并导致基因组不稳定的易出错NHEJ。
为了更好地理解供体模板递送在以下方面的作用,如本文所公开,已评价了成人CD34+mPBSC中体外和体内供体模板递送的不同方法:(i)HDR和NHEJ结果的占比;(ii)在编辑后保留HSC区室的完整性和长期植入潜力;以及(iii)改变经编辑细胞的纵向持久性(persistence)。这些研究包括镰状突变(GTC或GTG;编码谷氨酸至缬氨酸的改变(E6V))或沉默改变(GAA;编码谷氨酸至谷氨酸(E6optE)),其被引入健康供体的mPBSC中。在RNP介导的HBB的外显子1的破坏和可选供体模板的递送后,使用通过ddPCR的分子分析以及通过镰状珠蛋白的引入(βS;GTC或GTG的情况下;E6V改变)或成人珠蛋白的恢复(在GAA改变的情况下;E60optE)的珠蛋白表达作为功能结果进行基因编辑结果的评价。使用这些方法,直接比较了可选递送平台的结果。体外研究表明了rAAV6递送引起HDR比NHEJ比例更大的优越,而ssODN供体模板递送引入比HDR显著更多的NHEJ。与此同时,对所移植的经HDR编辑的HSC细胞(包含GTC改变(E6V))的植入和持久性进行了纵向评价。与体外发现相反,在NBSGW受体小鼠的骨髓(BM)中,由ssODN供体模板修饰的细胞在12-14周时持续存在的百分比更高。综上所述,这些发现为基于HDR的基因编辑的替代方法提供了重要的功能评价。
本文提供的基因编辑系统和方法可应用于任何基于核酸酶的基因编辑手段,包括但不限于基因破坏和/或基因靶向。例如,本公开的方面涉及基于CRISPR/Cas9的基因编辑。在一些替代方式中,提供了Cas9核酸酶介导的增强的基因编辑。在一些实施方式中,提供了基于核酸酶的基因编辑系统和方法。用于基因编辑的基于核酸酶的手段的实例包括包含例如但不限于如下核酸酶的系统:ZFN、TALEN、大范围核酸酶(例如MegaTAL)或CRISPR/Cas9。
在一些替代方式中,核酸酶通过在基因组中的期望位置处引入特定的双链断裂来进行靶向基因组修饰,并利用细胞的修复机制通过同源重组和非同源末端连接机制来修复所诱导的断裂。可以使用数种工程化的核酸酶。作为示例而非限制,核酸酶可以包括锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、CRISPR/Cas系统、RNA引导的核酸内切酶或工程化的大范围核酸酶再工程化的归巢核酸内切酶。靶向基因破坏在研究、治疗、农业和工业用途中具有广泛的适用性。产生靶向基因破坏的一种策略是通过由位点特异性核酸内切酶引起的双链DNA断裂的生成。
在一些替代方式中,CRISPR/Cas9使向导RNA能够在多种细胞类型中有效表达。表达向导RNA的系统的实例是基于腺相关病毒载体(AAV)的使用。AAV载体能够转导范围广泛的原代细胞。
在一些替代方式中,当使用腺相关病毒载体(AAV)来表达Cas9靶向所需的向导RNA时,基于Cas9的手段可以提高基因编辑效率并且毒性最小。
定义
如本文使用的,“一个/一种(a或an)”可意味着一个/种或多于一个/种。
如本文使用的,术语“约(about)”表示数值包括为确定数值所采用的方法的固有误差变化或者实验之间存在的变化。
“核酸”或“核酸分子”是指多核苷酸,如脱氧核糖核酸(DNA)或核糖核酸(RNA);寡核苷酸;通过聚合酶链式反应(PCR)产生的片段;或通过连接、切断、核酸内切酶作用和核酸外切酶作用中任一种产生的片段。核酸分子可由单体组成,所述单体为天然存在的核苷酸(例如DNA或RNA)或天然存在的核苷酸的类似物(例如天然存在的核苷酸的对映体形式),或两者的组合。经修饰的核苷酸可具有糖部分和/或嘧啶或嘌呤碱基部分的改变。糖修饰包括例如用卤素、烷基基团、胺类或叠氮基基团替换一个或多个羟基基团,或者可将糖官能化为醚或酯。此外,可用空间上和电子上相似的结构(例如氮杂糖和/或碳环糖类似物)替换整个糖部分。碱基部分中的修饰的实例包括烷基化嘌呤或嘧啶、酰化嘌呤或嘧啶或其它公知的杂环置换。核酸单体可通过磷酸二酯键或此类连接的类似物连接。磷酸二酯连接的类似物包括硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯(phosphoroselenoate)、二硒代磷酸酯(phosphorodiselenoate)、苯胺硫代磷酸酯(phosphoroanilothioate)、苯胺磷酸酯(phosphoranilidate)或氨基磷酸酯。术语“核酸分子”还包括所谓的“肽核酸”,其包含连接至聚酰胺骨架的天然存在的核酸碱基或经修饰的核酸碱基。核酸可为单链核酸或双链核酸。
在本文中使用“编码(Coding for或encoding)”,并且是指多核苷酸(例如基因、cDNA或mRNA)中核苷酸的特定序列充当合成其它大分子(例如氨基酸的限定序列)的模板的性能。因此,如果对应于基因的mRNA的转录和翻译在细胞或其它生物系统中产生蛋白质,则该基因编码该蛋白质。
在一些替代方式中,CRISPR/Cas9系统的基本组分包括靶基因;向导RNA;以及Cas9核酸内切酶、其衍生物或其片段。在一些替代方式中,应用CRISPR/Cas9进行基因编辑的一个方面在于需要有效地将向导RNA递送至各种各样的细胞类型的系统。例如,这可涉及以核酸的方式来递送体外产生的向导RNA(通过体外转录或化学合成产生的向导RNA)。在一些替代方式中,编码向导RNA的核酸通过掺入修饰的碱基(例如2'O-甲基碱基)而被赋予核酸酶抗性。
可用于本文所述的替代方式的示例性向导RNA(可含有一个或多个本文所示的修饰的碱基)在由如下编码的序列中提供:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5或SEQ ID NO:6。在一些替代方式中,由于腺相关病毒(AAV)载体能够转导范围广泛的原代细胞,用于表达向导RNA的重要系统基于AAV载体的使用。在一些替代方式中,AAV载体不会引起感染,也已知不会整合到基因组中。因此,在一些替代方式中,使用AAV载体具有既安全又有效的益处。
术语“与……互补”意味着互补序列与参考多核苷酸序列的全部或者一个或多个部分同源。为了说明,核苷酸序列“CATTAG”对应于参考序列“CATTAG”并且与参考序列“GTAATC”互补。
“启动子”是指导结构基因转录的核苷酸序列。在一些替代方式中,启动子位于基因的5'非编码区中,临近结构基因的转录起始位点。在转录起始中发挥功能的启动子中的序列元件通常特征在于共有核苷酸序列。这些启动子元件包括:RNA聚合酶结合位点、TATA序列、CAAT序列、分化特异性元件(DSE;McGehee等,Mol.Endocrinol.7:551(1993);在此处以引用的方式将其整体明确地并入)、环AMP应答元件(CRE)、血清应答元件(SRE;Treisman,Seminars in Cancer Biol.1:47(1990);在此处以引用的方式将其整体明确地并入)、糖皮质激素应答元件(GRE)以及其它转录因子(例如CRE/ATF(O'Reilly等,J.Biol.Chem.267:19938(1992))、AP2(Ye等,J.Biol.Chem.269:25728(1994))、SP1)的结合位点、cAMP应答元件结合蛋白(CREB;Loeken,Gene Expr.3:253(1993))以及八聚体因子(octamer factors)(总体上参见:Watson等编,Molecular Biology of the Gene,第4版(The Benjamin/Cummings Publishing Company,Inc.,1987)以及Lemaigre和Rousseau,Biochem.J.303:1(1994);所有参考文献在此处以引用的方式将它们整体明确地并入)。如本文使用的,启动子可为组成型激活的、阻遏型或诱导型。如果启动子是诱导型启动子,则转录速率相应于诱导剂而增加。反之,如果启动子是组成型启动子,则转录速率不受诱导剂调控。阻遏型启动子也是公知的。在一些替代方式中,调控元件可为非翻译区。在一些替代方式中,非翻译区是5'非翻译区。在一些替代方式中,非翻译区是3'非翻译区。在一些替代方式中,使用5'非翻译区或3'非翻译区。在一些替代方式中,使用5'非翻译区和3'非翻译区二者。本领域技术人员将理解本文的替代方式中使用的非翻译区的含义。
“调控元件”是调节核心启动子活性的核苷酸序列。例如,调控元件可含有与细胞因子结合的核苷酸序列,这能够使得转录专一地或优先地在特定的细胞、组织或细胞器中进行。这些类型的调控元件通常与以“细胞特异性”、“组织特异性”或“细胞器特异性”的方式表达的基因相关联。在一些替代方式中,提供了用于编辑细胞中至少一个靶基因的系统,其中所述系统包含编码CRISPR向导RNA的第一核酸序列,其中所述CRISPR向导RNA与细胞中至少一个靶基因互补,并且,其中所述第一核酸序列存在于载体中;所述系统还包含编码Cas9蛋白的第二核酸序列、编码第一腺病毒蛋白的第三核酸序列以及编码第二腺病毒蛋白的第四核酸序列。在一些替代方式中,所述第一核酸序列、第二核酸序列、第三核酸序列和第四核酸序列连接至在真核细胞(例如人类细胞)中可操作的调控元件。
“多肽”是由肽键连接的氨基酸残基的聚合物,无论是天然产生的还是合成产生的。少于约10个氨基酸残基的多肽通常被称为“肽”。多肽可被认为是蛋白质。
“蛋白质”是包含一个或多个多肽链的大分子。蛋白质还可包含非肽组分,如糖类(carbohydrate)基团。糖类和其它非肽取代基可由其中产生蛋白质的细胞添加到该蛋白质中,并且将随着细胞类型而变化。蛋白质在本文中根据其氨基酸骨架的结构来定义;取代基(例如糖类基团)通常不进行详细说明,尽管如此,其仍可以存在。在一些替代方式中,提供了用于编辑细胞中至少一个靶基因的系统,其中所述系统包含编码CRISPR向导RNA的第一核酸序列,其中所述CRISPR向导RNA与细胞中至少一个靶基因互补,并且,其中所述第一核酸序列存在于载体中;所述系统还包含编码Cas9蛋白的第二核酸序列、编码第一腺病毒蛋白的第三核酸序列以及编码第二腺病毒蛋白的第四核酸序列。
术语“宿主细胞”意指根据本发明的替代方式引入有Cas9-mRNA/AAV-向导RNA的细胞以及与本文的系统一起提供的细胞。宿主细胞可为原核细胞或真核细胞。原核宿主细胞的实例包括但不限于:大肠杆菌(E.coli)、固氮菌、金黄色葡萄球菌(Staphylococcusaureus)、白色葡萄球菌(Staphylococcus albus)、嗜酸乳杆菌(Lactobacillusacidophilus)、炭疽芽孢杆菌(Bacillus anthracis)、枯草芽孢杆菌(Bacillussubtilis)、苏云金芽孢杆菌(Bacillus thuringiensis)、破伤风梭菌(Clostridiumtetani)、肉毒梭菌(Clostridium botulinum)、变异链球菌(Streptococcus mutans)、肺炎链球菌(Streptococcus pneumoniae)、支原体(mycoplasmas)或蓝细菌(cyanobacteria)。真核宿主细胞的实例包括但不限于:原生动物细胞、真菌细胞、藻类细胞、植物细胞、昆虫细胞、两栖动物细胞、禽类细胞和/或哺乳动物细胞。在一些替代方式中,提供了用于编辑细胞中至少一个靶基因的系统,其中所述细胞是真核细胞。在一些替代方式中,所述细胞是哺乳动物细胞。在一些替代方式中,所述细胞是人细胞。在一些替代方式中,所述细胞是原代细胞。在一些替代方式中,所述细胞不是转化细胞。在一些替代方式中,所述细胞是原代淋巴细胞。在一些替代方式中,所述细胞是原代淋巴细胞、CD34+干细胞、肝细胞、心肌细胞、神经元、胶质细胞、肌肉细胞或肠细胞。
术语“核酸内切酶”是指切割多核苷酸链内的磷酸二酯键的酶。所述多核苷酸可为双链DNA(dsDNA)、单链DNA(ssDNA)、RNA、DNA和RNA的双链杂合体、以及合成的DNA(例如含有除A、C、G和T以外的碱基)。核酸内切酶可对称地切割多核苷酸,留下“平”末端,或者在不直接相对的位置产生可被称为“粘性末端”的突出端(overhang)。本文所述的方法和组合物可应用于由核酸内切酶产生的切割位点。在所述系统的一些替代方式中,所述系统可进一步提供编码核酸内切酶(例如Cas9、TALEN或MegaTAL)的核酸、或包含核酸内切酶(例如Cas9、TALEN或MegaTAL或它们的一个或多个部分)的结构域的融合蛋白。这些实例并不意味着是限制性的,其它核酸内切酶和包含其它核酸内切酶的系统和方法的替代方式以及这些示例性替代方式的变型和修饰是可能的,并不需要过度实验。所有这些变型和修饰都在当前教导的范围内。
术语“转录激活因子样效应物核酸酶”或“TAL效应物核酸酶”(TALEN)是指包含与核酸酶结构域融合的TAL效应物结构域的核酸酶。从植物病原体黄单胞菌属(Xanthomonas)中分离的TAL效应物DNA结合结构域已有描述(参见Boch等,(2009)Science 29Oct.2009(10.1126/science.117881);及Moscou和Bogdanove,(2009)Science 29Oct.2009(10.1126/science.1178817);在此处以引用的方式将这两篇参考文献整体明确地并入)。可对这些DNA结合结构域进行工程化以结合至期望靶标并融合至核酸酶结构域(例如Fok1核酸酶结构域),从而得到TAL效应物结构域-核酸酶融合蛋白。本文所述的方法和系统可应用于由TAL效应物核酸酶产生的切割位点。在本文提供的系统的一些替代方式中,所述系统可进一步包含TALEN核酸酶或编码TALEN核酸酶的载体或核酸。在本文提供的方法的一些替代方式中,所述方法可进一步包括提供核酸酶(例如TALEN核酸酶)。
在一些替代方式中,TALENS是通过将Tal效应物DNA结合结构域融合至DNA切割结构域而产生的人工限制性酶。Tal效应物可为细菌DNA结合蛋白,由可以以高亲和力结合一个核苷酸的高度同源的34个氨基酸模块组成。TALENS模块的第12和第13个可变氨基酸(称为重复可变二核苷酸)赋予碱基特异性(即NN→G/A,NI→A,NG→T,NK→G,HD→C和NS→A/T/C/G),并且可通过组装个体模块来生成可靶向核苷酸序列的TALEN阵列。氨基酸序列与DNA识别之间的关系允许通过选择与相关的重复可变双残基(RVD)接触的重复区片的组合来对特定的DNA结合结构域进行工程化。TALENS可用于通过在感兴趣的细胞中诱导双链断裂(DSB)来编辑基因组,并且其中的细胞可以通过数种类型的修复机制做出反应。
MegaTAL源自于两种不同类别的DNA靶向酶的组合。大范围核酸酶(也称为归巢核酸内切酶)是指在同一结构域中同时具有DNA识别和核酸酶功能的收益的单肽链。在本文提供的系统的一些替代方式中,所述系统可进一步包含MegaTAL核酸酶或者编码MegaTAL核酸酶的载体或核酸。在本文提供的方法的一些替代方式中,所述方法可进一步包括提供MegaTAL核酸酶或者编码MegaTAL核酸酶的载体或核酸。
锌指蛋白(ZFP)是真核DNA结合蛋白。例如,用于基因组编辑的最常见的ZFP基序是Cys2-His2指,并且各种类型都对核苷酸三联体具有特异性。可以通过组装单个锌指来生成人工ZFP结构域,以靶向通常9-18nt长的特定DNA序列。锌指核酸酶(ZFN)是用于在人的多种细胞类型中进行靶向基因组操作的强大的工具。ZFN由与非特异性核酸内切酶结构域连接的工程化的DNA结合锌指结构域组成,并可以引入刺激同源和非同源重组二者的双链断裂(DSB),然后可以用于进行基因组操纵。因此,ZFP在研究和基因治疗应用二者中都有潜力。
成簇的规律间隔的短回文重复序列(CRISPR)包含DNA基因座,其可以包含短碱基序列重复,其中随每个重复之后为来自病毒暴露的短区段间隔区DNA。CRISPR区域可以与编码CRISPR相关蛋白的cas基因相关联。CRISPR/Cas系统是原核免疫系统,其赋予对外来遗传元件(例如质粒和噬菌体)的抗性,并提供一种形式的获得性免疫。CRISPR间隔区以类似于真核生物中RNAi的方式识别和切开这些外源遗传元件。作为基因组编辑机制,可以将RNA引导的核酸内切酶Cas蛋白和适当的向导RNA递送到细胞中,并可在期望的位置切开有机体的基因组。CRISPRS是靶向/修饰基因的有效机制,并且该机制是本领域技术人员已知的。
Cas9(CRISPR相关蛋白9)是一种RNA引导的DNA核酸内切酶,在其它细菌中,其与酿脓链球菌(Streptococcus pyogenes)的CRISPR(成簇的规律间隔的短回文重复序列)获得性免疫系统相关。酿脓链球菌利用Cas9来记忆并随后探询和切割外来DNA(例如侵入的噬菌体DNA或质粒DNA)。Cas9通过将外来DNA解链然后检查它是否与向导RNA的20个碱基对的间隔区区域互补来进行该探询。如果DNA底物与向导RNA互补,则Cas9切割侵入的DNA。
CRISPR(成簇的规律间隔的短回文重复序列)是含有短碱基序列重复的原核DNA区段。每个重复之后是来自以前暴露于细菌病毒或质粒的短区段“间隔区DNA”。CRISPR/Cas系统已被用于在整个生命树中的物种内进行基因编辑(添加、破坏或改变特定基因的序列)和基因调控。通过将Cas9蛋白、其衍生物或其区段以及适当的向导RNA递送到细胞中,可在任何所期望的位置切开有机体的基因组。使用CRISPR来建立能够改变整个群体的基因组的RNA引导的基因驱动器成为可能。在一些替代方式中,提供了用于编辑细胞中至少一个靶基因的系统,其中所述系统包含:编码CRISPR向导RNA的第一核酸序列,其中所述CRISPR向导RNA与细胞中至少一个靶基因互补,并且,其中所述第一核酸序列存在于载体中;编码Cas9蛋白、其衍生物或其片段的第二核酸序列;编码第一腺病毒蛋白的第三核酸序列;以及编码第二腺病毒蛋白的第四核酸序列。
在一些替代方式中,使用化学修饰的向导RNA在考虑之列。化学修饰的向导RNA已用于人原代细胞中的CRISPR-Cas基因组编辑(Hendel,A.等,Nat Biotechnol.2015Sep;33(9):985-9)。向导RNA的化学修饰可包括赋予核酸酶抗性的修饰。核酸酶可为核酸内切酶或核酸外切酶、或两者皆可。一些化学修饰不受限制地包括:2'-氟代、2'O-甲基、硫代磷酸酯二硫醇3'-3'端连接、2-氨基-dA、5-甲基-dC、C-5丙炔基-C、或C-5丙炔基-U、吗啉代。这些实例并不意味着是限制性的,其它化学修饰以及这些示例性替代方式的变型和修饰也在考虑之列。
术语“切割”是指多核苷酸的共价骨架的断裂。切割可通过多种方法(包括但不限于磷酸二酯键的酶促水解或化学水解)起始。单链切割和双链切割都是可能的,并且由于两个不同的单链切割事件可导致双链切割的发生。双链DNA、RNA或DNA/RNA杂合体的切割可引起平末端或交错末端(staggered end)的产生。
如本文使用的术语“受试者”包括动物界的所有成员(包括非人灵长类动物和人)。在一些替代方式中,提供了用于编辑细胞中至少一个靶基因的系统,其中所述系统包含:编码CRISPR向导RNA的第一核酸序列,其中所述CRISPR向导RNA与细胞中至少一个靶基因互补,并且,其中所述第一核酸序列存在于载体中;编码Cas9蛋白、其衍生物或其片段的第二核酸序列;编码第一腺病毒蛋白的第三核酸序列;以及编码第二腺病毒蛋白的第四核酸序列。在一些替代方式中,将包含经编辑的基因的细胞递送给有需要的受试者。
通过采用非同源末端连接DNA修复途径,可将由罕见切割核酸内切酶引入的靶向DNA双链断裂用于不同细胞类型中的基因破坏应用。然而,核酸内切酶产生的化学上整齐的断裂经常受到精确的修复,从而限制了靶向基因破坏的效率。本文所述的几种替代方式涉及提高由核酸内切酶诱导的位点特异性DNA双链断裂的不精确修复导致的靶向基因破坏率的方法。在一些替代方式中,系统可进一步包含与末端加工酶偶联(coupled)的位点特异性核酸内切酶以提高靶向基因破坏率。偶联可为例如物理上的、空间上的和/或时间上的。
不受任何特定理论所束缚,因为非同源末端连接(NHEJ)过程可引起断裂位点处的插入和删除,通过“易出错”的NHEJ来解决双链DNA断裂可被用来产生靶向破坏和基因敲除。NHEJ由几条各自具有不同突变结果的子途径(sub-pathway)介导。经典NHEJ途径(cNHEJ)包括KU/DNA-PKcs/Lig4/XRCC4复合物,并且以最小的加工将末端连接回一起。由于由设计者核酸内切酶平台(锌指核酸酶(ZFN)、TAL效应物核酸酶(TALEN)和归巢核酸内切酶(HE))产生的DNA断裂都留下在连接前不需要进行处理的化学上整齐的、相容的突出断裂,它们是通过cNHEJ途径进行精确修复的优异底物。在缺失经典NHEJ途径来解决断裂或其解决断裂失败时,另一种NHEJ途径(altNHEJ)可替代;然而,这些途径具有相当高的致突变性。
不受任何特定理论所束缚,由末端加工酶进行的DNA双链断裂的修饰可使修复偏向于altNHEJ途径。此外,末端加工酶的不同子集可通过不同机制增强破坏。例如,特异性水解暴露于3'突出端的磷酸二酯键的核酸外切酶Trex2使断裂位点处的修复偏向于致突变的缺失。相比之下,预期作为非模板型聚合酶的末端脱氧核苷酸转移酶(terminaldeoxynucleotidyl transferase,TdT)通过促进在连接之前加入核苷酸碱基以改变DNA末端从而使断裂位点处的修复偏向于致突变的插入。因此,本领域技术人员可使用具有不同活性的末端加工酶与本文提供的任何系统或方法一起来提供所期望的工程化结果。进一步,本领域技术人员可借助不同末端加工酶之间的协同作用,以此来实现最大的或独特类型的效果。
可构建编码本文所述的核酸内切酶、末端加工酶和融合蛋白的各种RNA分子来将选定的蛋白质或肽提供至细胞。正如本领域已知的,编码核酸内切酶、末端加工酶和融合蛋白的RNA分子可经过修饰而含有不同的密码子,从而优化在选定的宿主细胞中的表达。在一些替代方式中,所述RNA可包含poly(A)尾,所述poly(A)尾具有50个、100个、150个、200个、250个、300个、350个、400个、450个、500个共价连接的腺苷残基,或者具有由上述任何两个值所限定的范围内的残基量。
所述系统的几种替代方式进一步包含用于同时表达位点特异性核酸内切酶和末端加工酶的载体或核酸,从而将靶向基因破坏的效率提高多达~70倍,基本上在少于72小时内在100%的含有靶位点的细胞群中安排突变结果。
表达载体
在一些替代方式中,表达构建体可使用本领域已知的方法设计。核酸表达载体的实例包括但不限于:重组病毒、慢病毒、腺病毒、质粒、细菌人工染色体、酵母人工染色体、人类人工染色体、微环DNA、游离基因(episomes)、cDNA、RNA或PCR产物。在一些替代方式中,核酸表达载体编码单个肽(例如核酸内切酶、末端加工酶或具有核酸内切酶和末端加工活性的融合蛋白)。在一些替代方式中,核酸表达载体在单个多顺反子表达盒中编码一种或多种核酸内切酶和一种或多种末端加工酶。在所述系统的一些替代方式中,提供了一种或多种核酸内切酶和一种或多种末端加工酶,其中它们通过2A肽序列或者“自动切割(autocleavage)”序列或自切割(self-cleavage)序列彼此连接。在一些替代方式中,所述核酸表达载体是DNA表达载体。在一些替代方式中,所述核酸表达载体是RNA表达载体。在一些替代方式中,所述表达载体是病毒载体。在本文提供的系统的一些替代方式中,所述病毒载体是腺相关病毒(AAV)载体。
在一些替代方式中,核酸表达载体进一步包含一个或多个选择标记,所述选择标记有助于鉴别或选择已接受并表达核酸内切酶、末端加工酶和/或具有核酸内切酶和末端加工活性的融合蛋白以及该选择标记的宿主细胞。选择标记的实例包括但不限于:编码荧光蛋白(例如EGFP、DS-Red、YFP或CFP)的基因、编码赋予对选择试剂的抗性的蛋白质的基因(例如PuroR基因、ZeoR基因、HygroR基因、neoR基因或杀稻瘟菌素(blasticidin)抗性基因)。在一些情况下,所述选择标记包含荧光报告子和选择标记。
在一些替代方式中,DNA表达载体包含启动子,所述启动子能够驱动一种或多种核酸内切酶、末端加工酶和/或具有核酸内切酶和末端加工活性的融合蛋白的表达。启动子的实例包括但不限于:逆转录病毒LTR元件;组成型启动子,如CMV、HSV1-TK、SV40、EF-1α或β-肌动蛋白;诱导型启动子,如那些含有Tet-操纵子元件的启动子;和/或组织特异型启动子。合适的细菌和真核生物启动子是本领域公知的并且描述于例如Sambrook等,MolecularCloning,A Laboratory Manual(第2版2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);以及Current Protocols in Molecular Biology(2010)中,在此处以引用的方式将所述参考文献整体明确地并入。植物启动子的非限制性实例包括来源于拟南芥(A.thaliana)泛素3(ubiquitin-3,ubi-3)的启动子序列。
在一些替代方式中,将编码一种或多种核酸内切酶、末端加工酶和/或具有核酸内切酶和末端加工活性或核酸外切酶活性的融合蛋白的核酸克隆到载体中,用于与本文提供的系统的载体和核酸一起转化到真核细胞中。在一些替代方式中,将编码不同核酸内切酶和末端加工酶的核酸克隆到同一载体中。在这些情况下,编码不同核酸内切酶和末端加工酶的核酸可任选地被T2A、自切割序列、蛋白酶切割位点或IRES序列分隔。载体可为原核载体(例如质粒、或穿梭载体)、昆虫载体或真核载体(包括本文所述的植物载体)。核酸酶和融合蛋白的表达可在组成型启动子或诱导型启动子的控制下。在一些替代方式中,所述载体包含编码Cas9、其衍生物或其片段的核酸序列。在一些替代方式中,所述载体包含编码Trex的核酸序列。在一些替代方式中,载体中的基因和/或核酸经密码子优化以在哺乳动物细胞(例如人细胞)中表达。在一些替代方式中,所述载体是mRNA。在一些替代方式中,所述载体是编码Cas9蛋白、其衍生物或其片段的mRNA。在一些替代方式中,编码Cas9蛋白、其衍生物或其片段的核酸经密码子优化以在真核细胞(例如人细胞)中表达。在一些替代方式中,所述Cas9蛋白、其衍生物或其片段来自于酿脓链球菌或是由来自其它有机体的其它Cas9蛋白制成的共有序列。
将具有核酸内切酶和/或末端加工活性的多肽和/或编码具有核酸内切酶和/或末端加工活性的多肽的多核苷酸引入宿主细胞中可使用本文所述的或本领域普通技术人员已知的用于核酸或蛋白质递送的任何合适的方法。本文所述的多肽和多核苷酸可体外递送至培养的细胞中以及原位递送至组织和整个有机体中。将本发明替代方式的多肽和多核苷酸引入宿主细胞可通过化学方法、生物学方法或机械方法实现。这可包括但不限于:电穿孔、声致穿孔、使用基因枪、脂质体转染、磷酸钙转染、使用树状分子(dendrimer)、显微注射、聚凝胺、原生质体融合、使用病毒载体(包括腺病毒载体、AAV载体或逆转录病毒载体)或II型核酶(group II ribozymes)。
针对AAV载体的免疫应答
腺相关病毒(AAV)载体可被用于基于基因疗法的遗传疾病治疗中。然而,针对AAV载体的免疫应答的产生可危害载体的治疗功效。类似地,针对在基于CRISPR/Cas9(或基于一种或多种其它核酸酶)的基因组编辑中使用的AAV载体的免疫应答的产生可危害基因靶向的功效。
在一些替代方式中,在考虑之列的是在基于CRISPR/Cas9(和/或基于一种或多种其它核酸酶)的基因组编辑中使用的AAV载体将具有降低的免疫原性。在一些替代方式中,在考虑之列的是在基于CRISPR/Cas9(和/或基于一种或多种其它核酸酶)的基因组编辑中使用的AAV载体将不具有免疫原性。在一些替代方式中,由于免疫原性降低,对AAV载体发展出抗性的可能性将是最小的。在一些替代方式中,由于缺乏免疫原性,对AAV载体发展出抗性的可能性将降低或不存在。
有机体
本文所述的替代方式可适用于任何期望进行基因(特别是例如血红蛋白或血红蛋白相关基因)编辑的真核有机物。真核有机物的实例包括但不限于:藻类、植物、动物(例如哺乳动物,诸如小鼠、大鼠、灵长类动物、猪、牛、羊、兔、狗、猫或马等)、鱼类或昆虫。在一些替代方式中,对来自有机体的分离的细胞进行如本文所述的遗传修饰。在一些替代方式中,修饰的细胞发育成繁殖成熟的有机体。可使用真核(例如,藻类细胞、酵母细胞、植物细胞、真菌细胞、鱼类细胞、禽类细胞或哺乳动物细胞)细胞。也可使用来自含有一种或多种其它遗传修饰的有机体的细胞。
哺乳动物细胞的实例包括感兴趣的有机体的任何细胞或细胞系,例如:卵母细胞、体细胞、K562细胞、CHO(中国仓鼠卵巢)细胞、HEP-G2细胞、BaF-3细胞、Schneider细胞、COS细胞(表达SV40 T-抗原的猴肾细胞)、CV-1细胞、HuTu80细胞、NTERA2细胞、NB4细胞、HL-60细胞或HeLa细胞、293细胞或骨髓瘤细胞(如SP2或NS0)。也可使用外周血单个核细胞(PBMC)或T细胞,同样还可使用胚胎干细胞和成体干细胞。例如,可使用的干细胞包括:胚胎干细胞(ES)、诱导多能干细胞(iPSC)、间充质干细胞、造血干细胞、肌肉干细胞、皮肤干细胞、脂肪来源干细胞或神经元干细胞。在一些替代方式中,提供了用于编辑细胞中至少一个靶基因的系统,其中所述系统包含编码CRISPR向导RNA的第一核酸序列,其中所述CRISPR向导RNA与细胞中至少一个靶基因互补,并且其中所述第一核酸序列存在于载体中,其中所述系统还包含编码Cas9蛋白、其衍生物或其片段的第二核酸序列;编码第一腺病毒蛋白的第三核酸序列;以及编码第二腺病毒蛋白的第四核酸序列。在一些替代方式中,所述细胞是真核细胞。在一些替代方式中,所述细胞是哺乳动物细胞(例如人细胞)。在一些替代方式中,所述细胞是原代细胞。在一些替代方式中,所述细胞不是转化细胞。在一些替代方式中,所述细胞是原代淋巴细胞、CD34+干细胞、肝细胞、心肌细胞、神经元、胶质细胞、肌肉细胞或肠细胞。
如本文所述的“造血干细胞”或“HSC”是可产生髓系细胞的前体细胞,所述髓系细胞例如巨噬细胞、单核细胞、巨噬细胞、中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、红细胞、巨核细胞/血小板、树突状细胞或淋巴样谱系(例如,如T细胞、B细胞或NK细胞)。在一些替代方式中,HSC具有异质种群,其中存在三类干细胞,所述三类干细胞的区别在于它们在血液中的淋巴样后代与髓系后代的比(L/M)。
药物给予
通过本文提供的系统或方法制造的细胞可以直接给予至患者以靶向切割DNA序列和用于治疗性或预防性应用,例如用于治疗、抑制或缓解血红蛋白相关疾病(例如镰状细胞疾病或β地中海贫血)。在一些替代方式中,通过本文提供的组合物、系统或方法制造细胞。在一些替代方式中,提供了组合物,其中所述组合物包含所述细胞。在一些替代方式中,本文所述的组合物可以用于治疗、预防、缓解或抑制疾病或者缓解疾病病症或与疾病相关的症状的方法。在一些替代方式中,给予细胞或组合物以治疗、预防、缓解或抑制遗传疾病。
包含所述细胞的组合物以任何合适的方式进行给予,在一些替代方式中,与药学上可接受的载体一起给予。给予此类蛋白质或多核苷酸的合适方法是可获得的并且是本领域技术人员所熟知的,而且,尽管可使用超过一种的途径来给予特定组合物,但是特定途径通常可比另一途径提供更直接且更有效的反应。
药学上可接受的载体由给予的特定组合物以及用于给予组合物的特定方法来部分地确定。因此,可获得各种各样的药物组合物的合适制剂(参见例如Remington'sPharmaceutical Sciences)。
适合肠胃外给予(例如,诸如通过静脉内途径、肌内途径、皮内途径和皮下途径)的制剂包括水性的和非水性的等渗无菌注射溶液(可含有抗氧化剂、缓冲剂、抑菌剂或使制剂与预定接受者的血液等渗的溶质)、或水性的或非水性的无菌混悬剂(可包含助悬剂、增溶剂、增稠剂、稳定剂或防腐剂)。所公开的组合物可例如通过静脉内输注、口服、局部、腹膜内、膀胱内或鞘内进行给予。可将化合物的制剂提供在单位剂量或多剂量的密封容器(如安瓿或小瓶)中。注射溶液和悬浮剂可由无菌粉剂、颗粒剂或片剂来制备。
在一些替代方式中,在考虑之列的是以下给予途径中的一种或多种:肠胃外给予途径、皮下给予途径、关节内给予途径、支气管内给予途径、腹内给予途径、囊内给予途径、软骨内给予途径、腔内给予途径、体腔内(intracelial)给予途径、小脑内(intracelebellar)给予途径、脑室内给予途径、结肠内(intracolic)给予途径、宫颈内给予途径、胃内给予途径、肝内给予途径、心肌内给予途径、骨内给予途径、骨盆内给予途径、心包内给予途径、腹膜内给予途径、胸膜内给予途径、前列腺内给予途径、肺内给予途径、直肠内给予途径、肾内给予途径、视网膜内给予途径、椎管内(intraspinal)给予途径、滑膜内给予途径、胸内给予途径、宫内给予途径、膀胱内给予途径、病灶内给予途径、推注(bolus)、阴道给予途径、直肠给予途径、颊给予途径、舌下给予途径、鼻内给予途径或经皮给予途径。在一些替代方式中,待给予的组合物可被配制成由一种或多种上述途径进行递送。
核酸组合物
一些替代方式涉及用于编辑HBB基因的组合物。在一些替代方式中,组合物包含核酸。在一些替代方式中,所述核酸包括单向导RNA(sgRNA),例如由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6中的任一项编码的sgRNA。在一些替代方式中,编码sgRNA的核酸与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性,或在上述百分比的任意两个所定义的范围内。
在一些替代方式中,核酸包括与向导RNA(gRNA)支架结合的sgRNA,例如由SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:12中任一项编码的sgRNA。在一些替代方式中,编码sgRNA的核苷酸序列与SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:12的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性,或在上述百分比的任意两个所定义的范围内。
在一些替代方式中,核酸包括由SEQ ID NO:13-SEQ ID NO:18中任一项编码的前间区序列邻近基序(PAM)序列。
一些替代方式包括直接在镰状突变处切割DNA的sgRNA,例如SCL-g1(在本文中也称为“SCL-1”或“g1”)。例如,与Cas9核酸酶一起,CRISPR替代方式可包括引入sgRNA,所述sgRNA包含对非可变支架序列的靶DNA 5'特异的约20个碱基的序列。sgRNA可以以RNA递送,或者可以通过用具有在启动子的控制下的sgRNA编码序列的质粒转化细胞来递送。
在一些替代方式中,核酸包括缺失修复模板(deletional repair template)或非缺失修复模板(non-deletional repair template),例如将由AAV递送的模板。在一些替代方式中,模板包含SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20或SEQ ID NO:21中的一个或多个;或包含与SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:21中任一项的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性,或在上述百分比的任意两个所定义的范围内的序列。在一些替代方式中,修复模板的核苷酸序列与SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36中任一项的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性,或在上述百分比的任意两个所定义的范围内。模板可包含调节因子和/或增强子,以使同源定向修复(HDR)最大化。
在一些替代方式中,核酸包括TALEN,例如在SEQ ID NO:22或SEQ ID NO:23中编码的TALEN。在一些替代方式中,TALEN的核苷酸序列与由SEQ ID NO:22或SEQ ID NO:23编码的序列或根据SEQ ID NO:22或SEQ ID NO:23的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性,或在上述百分比的任意两个所定义的范围内。
在一些替代方式中,核酸包括单链供体寡核苷酸(ssODN)。在一些实施方式中,ssODN包括SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:21中的一个或多个。在一些替代方式中,ssODN的核苷酸序列与由SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:21中的任一项编码的序列或根据SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:21中的任一项的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性,或在上述百分比的任意两个所定义的范围内。
编辑HBB基因的某些方法
本文提供的方法和组合物的一些实施方式包括用于编辑细胞中HBB基因的方法。在一些此类实施方式中,编辑可以包括HDR。一些实施方式包括(i)向细胞中引入编码向导RNA(gRNA)的多核苷酸,或向细胞中引入编码TALEN的多核苷酸;以及(ii)向细胞中引入模板多核苷酸。
在一些实施方式中,gRNA包含与SEQ ID NO:01-SEQ ID NO:06中任一项的核苷酸序列具有至少约85%、90%或95%同一性的核酸。在一些实施方式中,gRNA包含与SEQ IDNO:07-SEQ ID NO:12中任一项的核苷酸序列具有至少约85%、90%或95%同一性的核酸。在一些实施方式中,gRNA包含SEQ ID NO:01-SEQ ID NO:06中任一项的核苷酸序列。在一些实施方式中,gRNA包含核苷酸序列SEQ ID NO:01。在一些实施方式中,gRNA包含核苷酸序列SEQ ID NO:07。
在一些实施方式中,向细胞中引入编码gRNA的多核苷酸包括使细胞与包含CAS9蛋白和编码gRNA的多核苷酸的核糖核蛋白(RNP)接触。在一些实施方式中,CAS9蛋白和编码gRNA的多核苷酸的比为0.1:1到1:10之间,或1:1到1:5之间。在一些实施方式中,CAS9蛋白和编码gRNA的多核苷酸的比为约1:2.5。
在一些实施方式中,模板多核苷酸编码HBB基因的至少部分或其互补物。在一些实施方式中,模板多核苷酸编码野生型HBB基因的至少部分或其互补物。在一些实施方式中,HBB基因的至少部分包含HBB基因的外显子1。
在一些实施方式中,病毒载体包含模板多核苷酸。在一些实施方式中,载体是腺相关病毒(AAV)载体。在一些实施方式中,载体是自互补AAV(scAAV)载体。在一些实施方式中,模板多核苷酸包含至少约4kb的HBB基因。
在一些实施方式中,单链供体寡核苷酸(ssODN)包含模板多核苷酸。
在一些实施方式中,ssODN包含与SEQ ID NO:64-SEQ ID NO:72中任一项的核苷酸序列具有至少80%、85%、90%或95%同一性的核苷酸序列。在一些实施方式中,ssODN包含SEQ ID NO:64-SEQ ID NO:72中任一项的核苷酸序列。
在一些实施方式中,在HBB基因的外显子1中生成双链断裂。在一些实施方式中,在HBB基因的外显子1的第六密码子附近生成双链断裂。
在一些实施方式中,步骤(i)在步骤(ii)之前进行。在一些实施方式中,步骤(i)和步骤(ii)同时进行。在一些实施方式中,步骤(i)和/或步骤(ii)包括进行核转染。在一些实施方式中,进行核转染包括使用LONZA系统。在一些实施方式中,所述系统包括使用方波脉冲。在一些实施方式中,步骤(i)和/或步骤(ii)包括接触约200,000个细胞/20μL的核转染反应,其中所述核转染反应包含gRNA和/或模板多核苷酸。
在一些实施方式中,所述细胞是哺乳动物细胞。在一些实施方式中,所述细胞是人细胞。在一些实施方式中,所述细胞是原代细胞。在一些实施方式中,所述细胞是造血干细胞(HSC)。在一些实施方式中,所述细胞是T细胞或B细胞。在一些实施方式中,所述细胞是CD34+细胞。
在一些实施方式中,HBB基因与核苷酸序列SEQ ID NO:37具有至少95%的同一性。
治疗方法
镰状细胞病(SCD)是由HBB基因的外显子1中的单核苷酸颠换引起的,导致在第6个氨基酸处谷氨酸成为缬氨酸(E6V)。这种改变增加了成人珠蛋白(βA)的疏水性,并使之易于聚合,从而导致红细胞的特征性镰状化样式。镰状患者仍依赖输血,发病率增加,寿命缩短。在供体模板(重组腺相关病毒(rAAV)或ssODN)存在下用核酸酶进行基因编辑可以修理突变并通过细胞修复机制驱动模板驱动的修复。为了最优利益,SCD中的临床基因编辑将引起有效的供体指导的核苷酸改变,同时通过NHEJ限制对靶的HBB核酸酶驱动的基因破坏。
因此,本文提供的一些替代方式涉及使用治疗性基因组编辑方法治疗、缓解、抑制或改善SCD。在一些替代方式中,提供了在HSPC中引入处于内源性启动子和增强子的控制下的完整HBB cDNA的系统和方法。在一些替代方式中,本文所述的系统和方法挽救HBB中的免疫缺陷和功能缺陷并提供治病性疗法。
一些替代方式涉及编辑HBB基因的方法。例如,该方法可以包括提供包含HBB基因的细胞。在一些替代方式中,该方法包括向细胞提供一种或多种本文所述的核酸组合物,例如根据SEQ ID NO:1-SEQ ID NO:36中的一项或多项的序列或由SEQ ID NO:1-SEQ ID NO:36中的一项或多项编码的序列,或者例如,与根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQID NO:34、SEQ ID NO:35或SEQ ID NO:36中任一项的序列或由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36中任一项编码的序列具有85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性或在上述百分比的任意两个所定义的范围内的序列。
在一些替代方式中,所述细胞是哺乳动物细胞、人细胞、原代细胞、淋巴细胞、CD34+干细胞、肝细胞、心肌细胞、神经元、胶质细胞、肌肉细胞或肠细胞,或本文描述的任何细胞。在一些替代方式中,通过用病毒载体转导细胞或用病毒感染细胞来向细胞提供核酸。在一些替代方式中,病毒载体是腺相关病毒(AAV)载体,例如重组AAV。AAV可以是一种血清型或多种血清型的混合物,例如血清型6。例如,在一些替代方式中使用重组血清型6AAV(rAAV6)。
在一些替代方式中,对核酸进行密码子优化以在宿主细胞中表达,例如在真核细胞(例如人细胞)中表达。一些替代方式包括向细胞提供编码基因编辑蛋白(例如Cas9蛋白)的第二核酸。在一些替代方式中,第二核酸是与第一核酸分离的核酸,例如编码一个或多个AAV基因的核酸,但是可以与第一核酸结合。在一些替代方式中,提供核酸引起对HBB基因的一个或多个编辑,例如对镰状细胞突变的修正。在一些替代方式中,镰状细胞突变的修正包括E7V突变的修正。在一些替代方式中,提供核酸引起HBB基因的外显子1中的磷酸二酯键断裂。
一些替代方式中,该方法进一步包括将细胞植入到受试者的骨髓中。在一些替代方式中,所述细胞来自受试者,并且所述细胞来自骨髓相同的受试者。换而言之,待植入的细胞可能与受试者的细胞或骨髓为同基因。在一些替代方式中,所述细胞与受试者的细胞或骨髓是同种异体的。
某些序列
一些实施方式包括来自SEQ ID NO:1-SEQ ID NO:36的一个或多个序列。表1包括SEQ ID NO:1-SEQ ID NO:21的序列,其与表2中进一步描述的SEQ ID NO:22-SEQ ID NO:36相比相对较短。SEQ ID NO:1-SEQ ID NO:6是sgRNA靶序列。SEQ ID NO:1和SEQ ID NO:6包括反义链序列,而SEQ ID NO:2-SEQ ID NO:5包括有义链序列。SEQ ID NO:1-SEQ ID NO:36方向为5′到3′。SEQ ID NO:36类似于SEQ ID NO:35,但是没有HBB启动子的直接重复,因此具有小的缺失。该rAAV6模板(SEQ ID NO:36)驱动E7V突变的HBG1启动子驱动进入HBB基因座,并保留天然内含子1。MND-GFP处于反向取向,以防止SEQ ID NO:36中的启动子干扰。表2提供了有关SEQ ID NO:24-SEQ ID NO:36的额外的信息。SEQ ID NO:22是具有15,662的序列长度、大小为49KB的DNA分子,而SEQ ID NO:23是具有15,866的序列长度、大小为54KB的DNA分子。SEQ ID NO:22和SEQ ID NO:23的载体是:从pWNY2.0而来兼容的pEVL300 noBsmBIGG。
表1
Figure BDA0002852950830000381
Figure BDA0002852950830000391
Figure BDA0002852950830000401
表2
Figure BDA0002852950830000402
Figure BDA0002852950830000411
实施例
实施例1关于β-珠蛋白(HBB)基因座处的HDR,对rAAV6和ssODN的比较
通过使用Crispr/Cas9核糖核蛋白(RNP)将E6V镰状突变引入动员的人外周血CD34+细胞(hPBSC)中,评价了rAAV6和ssODN递送在修正SCD中的影响和临床相关性。使用了两种供体递送策略:具有2.2kb同源臂(HA)的rAAV6(AMS#1314)和包含168个核苷酸的ssODN(E7V-GTC和E7V-GTG改变,以及具有CCCGAA变化的V7E)。在Crispr/Cas9 RNP产生双链断裂后,评价了与残余NHEJ率相比HDR的效率(3%rAAV6,AMS#1314以及12.5pmol、25pmol、50pmol或100pmol ssODN)。
在包含细胞因子(100ng/mL的SCF、IL-6、Flt-3L、TPO)的SCGM培养基中,将动员的人外周血CD34+细胞解冻48小时。解冻后48小时将细胞电穿孔,然后添加至含病毒的恢复培养基(3%rAAV6,AMS#1314)中用于rAAV6递送。将含有12.5pmol、25pmol、50pmol或100pmol具有GTC或GTG改变的E7V或具有CCCGAA改变的V7E的剂量滴定的ssODN与RNP一起进行电穿孔,然后添加至恢复培养基中。18-24小时后,将细胞转移到分化培养基中,所述培养基含有具有1%Pen/Strep、20ng/mL hSCF、1ng/mL hIL-3、2IU/mL EPO和20%热灭活的FBS的IMDM。将细胞分化14天,并分析红系细胞的各种珠蛋白亚型。
在体外测试中,在使用rAAV6(AMS#1314)测试的5个CD34+供体中,编辑后第10天的HDR:NHEJ的比为31%:18%,在使用ssODN E7V GTG测试的3个CD34+供体中为13%:30%(分别约为2:1对1:2的比)。将经编辑的CD34+细胞分化2周成为红系细胞,并使用RP-HPLC对红系前体细胞中的βS(镰状珠蛋白)的量进行定量。βS的量分别为rAAV6模板递送时18-27%(n=5),使用ssODN递送时0-9%(n=3)。因此,rAAV6或ssODN E7V GTG成功地在HBB基因座内引入了靶向核苷酸改变。rAAV6(AMS#1314)是在HBB基因座内引入靶向核苷酸改变的优越方法。这些发现还突出显示了测量HDR:NHEJ比和治疗性蛋白水平作为评价临床基因编辑潜力的指标的好处,所述基因编辑设计以在限制对中靶基因的破坏的同时引入核苷酸变化。
实施例2-HDR模板设计和递送以编辑和修正HBB基因的外显子1内的镰状突变
为了编辑和修正镰状突变,开发了在HBB基因的E7V突变处进行编辑的核酸酶。TALEN以及Crispr/Cas9核糖核蛋白介导的化学修饰的单向导RNA(sgRNA)的递送二者均经过优化,以在HBB基因的外显子1处进行编辑。数据显示在人造血干细胞(CD34+)和K562的镰状基因座中的有效编辑。设计了各种修复模板体系结构,用于rAAV6介导的具有独特调控元件的新的HDR修复模板的递送。在HBB基因座处对抗镰状化(T87Q)珠蛋白盒、镰状珠蛋白导入盒和镰状修正盒进行了测试。这些模板的设计是独特的。获得了高效、临床相关的HBB基因座处的同源依赖修复(HDR)率。
还设计并优化了修复模板的ssODN递送,以在HBB基因座处驱动HDR。设计并测试了引入镰状突变以及修正镰状突变的ssODN。在镰状基因座处实现了单等位基因或双等位基因HDR整合。此外,观测到来自整合的模板的临床相关的珠蛋白表达,与递送方式无关。
筛选RNP和TALEN以在人HBB基因的外显子1中产生双链(ds)断裂。图1A示出了比较以RNP和TALEN递送的各种sgRNA的核酸酶效率。产生最高插入缺失(INDEL)%的核酸酶是g4、g5和g6。配置Cas9:sgRNA比以使编辑效率最大化,并且20:50的Cas9:sgRNA比相比40:40的比产生更高的插入缺失%(图1B)。如图1C所示,使用以RNP递送的sgRNA 1和sgRNA 6评价了不同CD34+供体之间的编辑效率。结果显示,利用核酸酶实现了HBB基因座处的有效编辑。
调节因子和增强子被配置为将使用引入抗镰状化珠蛋白(βT87Q)的缺失模板1242-缺失模板1245的HDR最大化。图2A包括缺失模板1242-缺失模板1245的示意图,并且示出了各个模板中使用的元件。如图2B所示,在电穿孔和AAV6转导后的第2天确定CD34+细胞的活力。用缺失修复模板进行的转导倾向于产生约60%的活力。图2C示出了用3种不同向导进行的HDR的比较,所述向导以RNP与缺失模板1242-缺失模板1245一起进行递送。如图2D所示,用缺失模板1242-缺失模板1245确定使用RNP和缺失模板的基于ddPCR的相对HDR%。还使用TIDE测序分析(图2E)和HPLC分析(图2F)查看来自在红系分化培养基中分化2周的细胞的β珠蛋白表达,来确定编辑效率。结果表明,具有抗镰状化珠蛋白的缺失修复模板通过rAAV6被有效且高效地递送至细胞,并整合到细胞的基因组中。
用非缺失模板进行的HDR也被配置为引入抗镰状化珠蛋白βT87Q。图3A包括非缺失模板1289-非缺失模板1290的示意图,并且示出了各个模板中使用的元件。如图3B所示,确定了电穿孔和AAV6转导后第2天的CD34+细胞的活力,并且也趋向于约60%,范围为约30%至约90%。图3C示出了使用RNP和非缺失模板1289-非缺失模板1290的基于流式细胞术的HDR%。如图3D所示,对于模板1289和模板1290,确定了使用RNP和非缺失模板的基于ddPCR的相对HDR%。还使用TIDE测序分析(图3E)和HPLC分析(图3F)查看混合(bulk)GFP+群和GFP+/-分选的细胞中来自红系分化培养基中分化2周的细胞中的β-珠蛋白表达,从而确定了编辑效率。结果表明,具有抗镰状化珠蛋白的非缺失修复模板通过rAAV6有效且高效地递送至细胞,并有效地改变了HBB基因座。
开发了用人密码子优化的模板进行的HDR,所述模板具有引入镰状突变的不同HR臂长度。图4A包括人密码子优化模板1246-模板1249的示意图。如图4B所示,确定了电穿孔和AAV6转导后第2天的CD34+细胞的活力。图4C示出了使用RNP和人密码子优化的模板1246-模板1249的基于ddPCR的绝对HDR%。如图4D所示,进行了HPLC分析,查看在红系分化培养基中分化2周的细胞中β-珠蛋白的表达。结果表明,具有抗镰状化珠蛋白的人密码子优化模板通过rAAV6有效且高效地递送至细胞,并有效地改变了HBB基因座。
用模板1314进行的HDR对引入镰状突变有效。图5A包括模板1314的示意图。如图5B所示,在电穿孔和AAV6转导后的第2天确定CD34+细胞的活力。图5C示出了用来自5个不同供体的经RNP和模板1314编辑的样品的集落测序结果。使用4个供体的TIDE测序(图5D)和HPLC分析(图5E)查看来自在红系分化培养基中分化2周的细胞的β-珠蛋白表达,来确定编辑效率。产生了色谱图(图5F),其示出了来自第14天分化的HDR样品的各种珠蛋白亚型。结果表明,镰状突变的引入在由rAAV6递送的模板的递送之后得以实现。
用非缺失模板进行的HDR被配置为引入镰状突变。图6A包括非缺失模板1321的示意图。如图6B所示,在电穿孔和AAV6转导后的第2天确定CD34+细胞的活力。在用模板1321进行的编辑样品中测量了HDR事件(图6C)。结果表明,镰状基因突变的引入在由rAAV6递送的非缺失模板的递送后得以实现。
用ssODN进行的HDR被配置用于引入镰状突变。图7A包括ssODN E7V的示意图。如图7B所示,确定在用100pmol、50pmol、25pmol或12.5pmol GTC电穿孔后第2天CD34+细胞的活力。这些相同剂量也用在图7C和图7D中。通过ddPCR在使用剂量滴定的E7V ssODN编辑的样品中测量HDR和NHEJ(图7C)。如图7D所示,对在红系细胞中表达的各种珠蛋白亚型进行HPLC分析。结果表明,镰状突变在ssODN递送后得以实现。
将用ssODN进行的HDR配置用于修正镰状突变(CCC GAA)。图8A包括ssODN V7E的示意图。如图8B所示,在电穿孔后第2天测量CD34+细胞的活力。编辑后,通过3个不同供体的TIDE测序评价插入缺失(图8C)。如图8D所示,通过ddPCR在用剂量滴定的V7E ssODN编辑的样品中测量HDR和NHEJ。如图8E所示,还通过在具有V7E ssODN的编辑样本中进行集落测序来测量HDR和NHEJ。对红系细胞中的各种珠蛋白亚型进行了HPLC分析(图8F)。结果表明,ssODN对于递送和镰状修正有效。
将经编辑的细胞植入W41 SCID小鼠中。图9A示出了12周时骨髓中人CD45+植入的结果。植入方法包括用25mg/kg的白消安处理6-8周龄的W41小鼠。通过尾静脉注射递送2×106个人细胞。监测小鼠12周,并在处死它们时测量整体人嵌合体、多谱系植入和红系重构。用人特异性引物通过ddPCR测量HDR%,通过TIDE测序测量插入缺失%。
如图9B所示,通过TIDE测序在植入的人细胞中测量插入缺失。如图9C所示,通过ddPCR在12周时在骨髓中测量HDR。结果表明,经编辑的细胞被植入受试者的骨髓中,以产生非镰状血细胞。
如本文所述,使用各种策略来设计可以插入HBB基因座中以修正镰状突变的HDR模板。模板包括三组:第1组:基于rAAV6的HDR模板,具有各种增强子、内含子、启动子、polyA尾、各种同源臂长度和/或将T87Q抗镰状化珠蛋白插入HBB基因的缺失盒和非缺失盒。此类模板提供HDR的证据,并显示通过将修复模板插入人细胞而驱动的独特的抗镰状化(T87Q)珠蛋白表达。第2组:基于rAAV6的HDR模板,其具有各种增强子、内含子、启动子、polyA尾、各种同源臂长度和/或在HBB基因处插入镰状突变或修正镰状突变的缺失盒和非缺失盒。此类模板提供HDR的证据,并显示通过将修复模板插入人细胞而驱动的独特的镰状珠蛋白表达(HbS)或成人血红蛋白(HbA)。第3组:基于ssODN的模板,其驱动镰状突变的插入HBB基因或驱动将镰状修正插入HBB基因。数据提供HDR的证据,并显示了由ssODN插入人细胞所驱动的独特的镰状珠蛋白表达或成人血红蛋白(HbA)。
本文设计和测试的新的模板的实例包括以下:本文描述的rAAV6 HDR修复模板设计;以rAAV6提供的HDR修复模板,其包括1242、1243、1244、1245、1246、1247、1248、1249、1289、1290、1314、1321、1322;引入镰状突变的ssODN设计,其驱动HBB基因外显子1的密码子7中的GTG改变以及GTC改变(具有GTC和GTG改变的两种E7V盒都是独特的,并且以前未被报道);以及ssODN设计,其修正镰状突变并驱动HBB基因密码子6和7的CCC GAA改变。
已经使用了距离镰状突变17个碱基的sgRNA(SCL-g6)。HDR模板以scAAV6递送,并递送了一个长的cDNA盒,该盒整合在HBB基因处并引入了抗镰状化HBB cDNA(HbAS3)。cDNA被插入基因的起始处并保持内源性启动子/增强子功能。或者,先前已测试的HDR模板使用具有2.2kb的HR臂的rAAV6 E6V供体,其具有与密码子7处的GTC改变一起的各个密码子中的5个密码子优化核苷酸序列改变(gTCgagaagtctgcAgtCactgcTctAtggggGaaA;SEQ ID NO:38)。这些模板被设计为与以RNP递送的SCL向导6一起使用。
先前已经尝试的ssODN模板在HBB基因的外显子1内的密码子7处引入了E7V GTA(Dewitt等)或V7E GAA改变,并且与距镰状突变17个碱基的SCL-g6 sgRNA一起起作用。另一方面,本文所述的rAAV6供体盒利用了在镰状突变处特异性切割的新的向导SCL-g1。本文所述的新的rAAV6和ssODN修复模板产生非缺失的HDR事件,其驱动出乎意料的高水平的HDR,这是临床相关的。在一些替代方式中,这些新的供体模板(a)插入抗镰状化T87Q珠蛋白,(b)引入镰状突变,或(c)递送人密码子优化的镰状修正。本文所述的新的rAAV6盒利用启动子、增强子、polyA尾和调节元件的独特组合来最大化珠蛋白表达。
一些实施方式中描述的方法的益处在于在突变位点进行编辑可以改善功能结果。在一些实施方式中,sgRNA在镰状突变处切割。在一些实施方式中,切割位点与同源臂的接近允许突变的转化方面的改进。在一些实施方式中,rAAV6模板或ssODN模板被专门创建以与在镰状突变处进行编辑的SCL-g1一起工作,从而允许镰状突变的高效修正。
在一些实施方式中,模板设计使HBB基因座处的HDR最大化。在一些实施方式中,HBB基因座还具有本文所示的双等位基因整合的预料不到的倾向,在一些实施方式中,所述双等位基因整合提供了主要的治疗益处。
在一些实施方式中,通过选择调节元件使珠蛋白表达最大化。例如,选择某些调节元件可以改善或增加T87Q抗镰状化珠蛋白或成人珠蛋白的表达。在一些实施方式中,以下元件中的一个或多个调控较高水平HDR的驱动并增加珠蛋白表达:SV40 polyA尾、HPFH-2增强子和/或wPRE-3元件。
在一些实施方式中,递送人密码子优化的镰状修正盒帮助镰状患者恢复功能性HbA血红蛋白。在一些实施方式中,在近端位置(proximal location)具有天然内含子1允许最大的珠蛋白表达。
实施例3-使用可选的供体模板递送方法对HSC中的HBB基因处进行同源定向修复 的体内结果
实验方案
rAAV6生产:生产了rAAV6原液(stock)。将rAAV6载体、血清型辅助质粒和HgT1-腺辅助质粒转染到HEK293T细胞中。在48小时时收获细胞,裂解并用benzonase处理。碘克沙醇密度梯度用于纯化具有重组rAAV6基因组的病毒粒子。通过使用ITR特异性引物和探针确定基于qPCR的rAAV6基因组滴度。培养物体积的1%、2%和3%用于将rAAV6转导到mPBSC中。
CD34+造血干细胞:冷冻的mPBSC购自Fred Hutchinson癌症研究所,Seattle,WA的血液学卓越合作中心。
sgRNA和TALEN设计:使用CRISPR设计工具(http://crispr.mit.edu/和http://crispor.tefor.net/)设计了预测切割接近镰状突变处的向导。所有的向导都被合成为化学修饰的2′-O-甲基类似物,在前三个5′和3′末端残基中具有3′硫代磷酸酯核苷酸间连接(Synthego Inc.,CA)。用Golden Gate克隆策略组装了在镰状突变处切割的TALEN。TALENmRNA基于先前公开的方案产生(Grier,AE等,(2016).Mol Ther Nucleic Acids 5:e306;在此以引用的方式将其明确地整体并入)。
电穿孔、细胞转导和红系分化培养:Alt-R S.p Cas9核酸酶3NLS蛋白被用于所有研究(Integrated DNA Technologies Inc.,Coralville,IA)。将CD34+细胞培养在具有各自为100ng/mL的FLT-3配体、TPO、hSCF和IL-6(Peprotech,Rocky Hill,NJ)的SCGM培养基(CellGenix,New Hampshire)。解冻后48小时,使用NEON电穿孔系统(ThermoFischerScientific,Waltham,MA)以1300V、20毫秒和1个脉冲或使用Lonza 4-D核转染器(Lonza,Basel,瑞士,CM149方案)对细胞进行电穿孔。通过将20pmol Cas9和50pmol sgRNA(每2×105个细胞,Cas9:sgRNA的比为1:2.5)混合,在临电穿孔或核转染前制成Cas9 RNP。新鲜制成RNP混合物,并在将其室温下孵育15分钟。每2×105个细胞使用100pmol、50pmol、25pmol、12.5pmol的ssODN供体模板,并在临电穿孔或核转染前将其添加到RNP混合物中。将电穿孔或核转染后的细胞添加到包含rAAV6并具有细胞因子的SCGM培养基中(以培养物体积的1%、2%或3%;3%GTC rAAV6~MOI为4500-5100,1%GAA rAAV6~MOI为2190)或对于经ssODN处理的细胞和对照细胞,添加到具有细胞因子的普通SCGM培养基。将细胞在培养基中于37℃孵育过夜18小时。18小时后,将细胞转移至含有IMDM培养基的未经组织培养物处理的平板,所述培养基含有1ng/mL hIL-3、2IU/mL EPO,20ng/mL h-SCF,20%热灭活的FBS和1%的pen/strep。(Fisher Scientific,Hampton,NH和Peprotech,Rocky Hill,NJ)。细胞密度保持在5×105至1×106个细胞/mL之间,以使由于增殖应激或过度拥挤引起的胎儿血红蛋白诱导最小化。在第14天使用BV421标记的血型糖蛋白-A抗体(BD,562938)通过流式细胞术监测CD235的表达。
使用ddPCR测量用rAAV6和ssODN的HDR事件:用DNeasy血液和组织试剂盒(Qiagen,Germantown,MD)提取gDNA,并进行RNase处理。将100ng gDNA用6个单位的ECORV-HF(NewEngland Biolabs,Ipswich,MA)在37℃下处理15分钟,以切割扩增子区域之外的gDNA。ddPCR正向和反向引物(ddPCR F/R)用于扩增210bp扩增子。该测定设计为WT-HEX和HDR-FAM探针一起运行的双探针测定,而参考-HEX探针在单独的孔中以相同的ddPCR F/R引物使用ddPCR supermix for probes(无dUTP,BIO-Rad)平行运行。表3和表4列出了引物和探针。
表3
Figure BDA0002852950830000491
表4
Figure BDA0002852950830000492
产生微滴并在BIO-RAD热循环仪上进行扩增(95℃:5分钟,94℃:30秒,56℃:1分钟,72℃:1分钟,转到步骤2:49个循环,98℃:10分钟,12℃:∞)。FAM和HEX荧光强度在BIO-RAD QX200机器(BIO-RAD,Hercules,CA)上测量。在关于参考基因(REF-HEX+)进行修正后,计算出HDR(%)事件(HDR-FAM+)和WT(WT-HEX+)事件(表3)。
测量插入缺失频率:电穿孔后第10天的gDNA用于由正向和反向引物(HBB-F/R-1250,表3)扩增切割位点周围的1250bp扩增子。使用NucleoSpin凝胶和PCR清洁试剂盒(Machery Nagel,Bethlehem,PA)清洁PCR产物,并用测序引物(SCL-F/R-386,表3)对其进行Sanger测序。编辑后,使用TIDE/ICE算法分析序列以测量插入缺失。
MiSeq分析:用MiSeq引物(表3)使用PrimeSTAR GXL DNA聚合酶(TaKaRa,Kusatsu,日本)从200ng gDNA中扩增HBB(386bp)和HBD(301bp)基因特异性扩增子。引物在扩增子上添加了突出(overhang)的接头序列。使用Nextera 96-index试剂盒(FC-121-1012,Illumina,圣地亚哥,加利福尼亚)为每个样品添加5′和3′独特索引(index)。样品用Agencourt AMPure XP(Beckman Coulter,Brea,CA)纯化,并在琼脂糖/PAGE凝胶上验证条带。测量并合并样品以制备文库,并在Qubit(ThermoFischer Scientific,Waltham,MA)上进行质量控制,并在MiSeq 500CycleV2试剂盒(Illumina,San Diego,CA)上进行分析。数据使用Crispresso2算法进行挖掘。HBB分析用于中靶基因修饰,HBD用于脱靶分析。
在NBSGW小鼠中的植入研究:NOD、B6、SCID II2rγ-/-Kit(W41/W41)(NBSGW)小鼠购自Jackson实验室,并保持在指定的无病原体设施中。所有动物研究均根据实验室动物护理评估和鉴定协会的标准进行,并得到SCRI机构动物护理和使用委员会的批准。
在移植经编辑的细胞前24小时,对6-7周龄的NBSGW小鼠进行白消安(Selleckchem)处理。编辑后24小时,通过尾静脉注入2×106个经编辑的细胞。定期监测动物。在转移后3周和12-14周收获这些动物的BM和脾,并分析细胞的人嵌合hCD45+、mCD45+以及CD19+、CD33+、CD235+、CD3+、CD34+、CD38+细胞的多谱系植入。收获来自BM细胞的gDNA,并通过ddPCR对其进行分析以确定HDR(%)和WT(%)。通过TIDE/ICE测序分析插入缺失。收获后,将BM细胞在红系分化培养基中培养两周。通过流式细胞术测量来自离体分化培养物的细胞的CD235+表达。收获后2周,还将细胞沉淀、洗涤并通过RP-HPLC分析,以寻找珠蛋白表达。将BM细胞(30,000个细胞/板/3mL的methocult)添加到methocult完全培养基(STEMCELLTechnologies,Vancouver,加拿大)中,并铺板进行CFU分析。收获后14天挑选单个BFU-E集落,将其裂解在水中,并通过IEC分析珠蛋白的表达。
统计分析:在Graph Pad Prism 7上使用双因素ANOVA分析和Dunnett多重比较检验对从实验收集的数据进行分析。将各组中的所有样品与对照或空白处理的细胞进行比较,以评价其显著性。ns:不显著,*p<0.05,**p<0.01,***p<0.001,****p<0.0001。
红系细胞裂解:收集在分化培养基中培养14天的红系细胞,并在PBS中洗涤以除去污染蛋白。在HPLC级水中进行细胞的低渗裂解。将溶血产物的上清液在4℃下以20,000g离心30分钟,然后将1μg-10μg蛋白质注入柱中。
红系细胞的RP-HPLC分析:在红系分化后,在Shimadzu Prominence UFLC色谱上使用Aeris 3.6um Widepore C4 250×4.6mm柱(Phenomenex)通过RP-HPLC评估珠蛋白亚型的表达。使用的流动相为:A:水0.1%TFA(三氟乙酸),B:乙腈0.08%TFA,流速为0.8mL/min。在75分钟的定时程序中运行从39%到50%B的梯度。柱箱温度为40℃,样品盘保持在4℃。在220nm处检测峰。运行参考以比较各种珠蛋白峰的洗脱时间。
红系细胞的IEC:PBS洗涤后的细胞使用以下流动相在PolyCATA200×2.1mm 5μm
Figure BDA0002852950830000511
(PolyC#202CT0510)上进行分析:A相:HPLC级水中Tris 40mM,KCN 3mM,用乙酸调节至pH 6.5;B相:HPLC级水中Tris 40mM,KCN 3mM,NaCl 0.2M用乙酸调节至pH 6.5。使用定时的24分钟程序来创建流速为0.3mL/min的2%至100%B梯度。柱箱温度为30℃,样品盘保持在4℃。在418nm处检测峰。运行参考以比较珠蛋白四聚体的洗脱时间。
集落测序:使用GXL DNA聚合酶(Takara Bio)用HBB-1250正向和反向引物(表3)从50ng gDNA扩增切割位点周围的1250bp的扩增子。使用NucleoSpin凝胶和PCR清洁试剂盒(Macherey-Nagel,Bethlehem,PA)纯化PCR产物,并亚克隆到Zero Blunt TOPO PCR克隆载体(Fisher Scientific,Hampton,NH)中,并转化至TOP10感受态细胞(Fisher Scientific,Hampton,NH)中。挑选抗卡那霉素的集落并用SCL-386引物进行测序。分析个体序列以确定序列是否为WT、NHEJ或HDR结果。
T7-核酸内切酶测定:使用GXL DNA聚合酶(Takara Bio),用HBB-1250引物从总gDNA扩增核酸酶切割位点周围的1250bp区域。使用NucleoSpin Gel和PCR清洁试剂盒(Macherey-Nagel,Bethlehem,PA)纯化PCR产物。将400ng PCR产物在19uL反应体积中的1×Buffer 2(New England Biolabs,Ipswich,MA)中变性并重新退火。将样品用T7核酸内切酶I(New England Biolabs,Ipswich,MA)处理,并在37℃下孵育15分钟,然后加载在1%琼脂糖凝胶上并成像。
流式细胞术和分析:在LSR II流式细胞仪(BD Biosciences)上进行流式细胞术分析,并使用FlowJo软件(TreeStar)进行数据分析。在与活细胞相对应的FSC/SSC群上绘制门控,并使用FSC-A/FSC-W绘制Singlets。
ssODN设计:单链寡核苷酸(ssODN)由IDT(
Figure BDA0002852950830000521
DNA Oligonucleotides)合成,在5'和3'端的2个末端核苷酸具有硫代磷酸酯连接。表5列出了用于HDR的ssODN序列。
表5
Figure BDA0002852950830000531
CD34细胞中的核酸酶效率
进行核酸酶筛选以鉴别在HBB基因的外显子1内有效产生双链断裂(DSB)的方法(图10A)。在CD34+mPBSC中评价了以RNP复合物或基于TALEN的核酸酶递送的可选sgRNA的切割效率。在初始的核酸酶筛选中,以Cas9:sgRNA比为1:1测试了一系列候选sgRNA的RNP递送,并鉴别了向导4(g4)、g5、g6、g1在生成DSB方面最有效(图10B)。基于这些发现,对sgRNA-g1进行了优化,因为它在SCD突变位点密码子6附近生成DSB。sgRNA-g6(G10)也进行了广泛的平行测试。在用neon电穿孔系统以1:2.5的Cas9:sgRNA比测试两种向导后,sgRNA-g1的总编辑率翻倍(g1:从17.8±4.4%增至35.2±10.6%;g6:26.7±1.6%至38.3±8.7%,图10C)。通过MiSeq分析的sgRNA-g1的中靶HBB破坏为38.7±12.2%(n=7个供体),脱靶HBD破坏为0.129±0.01%(图10D)。CCTop 22预测的sgRNA-g1的前5个脱靶基因通过T7核酸内切酶分析(图10F)和TIDE测序(图10G)均未显示插入缺失。与电穿孔系统(Neon;35.2±10.6%,n=15个供体,图10E)相比,使用核转染系统(Lonza;86±2.6%,n=3个供体),总体编辑率提高了~2.5倍。
通过rAAV6供体模板递送引入GTC改变
用2.2kb同源臂构建了rAAV6载体,其被设计为在HBB基因的外显子1的密码子6处引入GTC(编码E6V)或沉默改变GAA(编码E6optE)。该设计集中于保留内含子1和天然启动子/增强子区域以使转录和翻译最大化(图11A)。实验时间线在图11B中示出。在RNP介导的切割之后测试3%GTC(编码E6V)rAAV6供体模板产生37.5±15%的HDR率以及12.7±5.3%的残余NHEJ率(图11C)。用电穿孔和核转染系统二者进行的GTC(编码E6V)rAAV6的测试表明,总编辑率的增加引起HDR率和残余NHEJ率二者增加(图11G)。当RNP与GTC rAAV6共递送时,通过集落测序另外验证了HDR和残余NHEJ率(30.8±6.3%HDR,17.9±7.2%NHEJ,n=5个供体,图11H)。用3%培养物体积的GTC rAAV6进行电穿孔和转导后的细胞活力平均为79.2%(图11I)。通过反相HPLC(RP-HPLC)在分化的红系前体细胞中测量珠蛋白亚型。单独编辑和在存在GTC rAAV6的情况下进行编辑引起βA的显著降低(使用neon,82%至54±16%)以及γA(HBG1)和γG(HBG2)的2倍增加。RNP和3%GTC rAAV6的共同递送引起28.4±9.8%的βS表达(n=6个供体,图11D)。通过离子交换色谱法(IEC)测量RNP和GTC rAAV6(编码E6V)共同递送后在红系细胞中产生的珠蛋白四聚体。RNP和3%GTC rAAV6共同递送中,观测到HbA减少和HbS四聚体的剂量依赖性增加(15.8%)(图S2D)。通过RP-HPLC分析的GTC(编码E6V)rAAV6处理的细胞的样品色谱图证实存在38.6%的βs峰(图11K)。
与这些核苷酸改变研究并行地,还对更复杂的rAAV6供体模板构建体进行了广泛的测试,所述rAAV6供体模板构建体被设计为引入与可选的组织特异性增强子和调节因子相关联的GFP表达盒(图11L)。这些后者rAAV6供体模板产生显著的HDR率(1321:14.4%和1322:18.4%,图11M),但是期望的珠蛋白表达受到损害(βs=1.35至2.6%,图11N)。
通过rAAV6供体模板递送引入GAA SNP改变
在正常细胞中引入镰状突变不能评估在患者细胞中回转突变的潜能,并且还可能改变经编辑的红系祖细胞的适应性(fitness)。代替使用来自SCD受试者的HSC的研究,测试了沉默SNP改变(GAA;编码E6optE)的引入。与RNP共同递送的GAA(编码E6optE)rAAV6供体模板(1%培养物体积)的测试产生37.5±6%的HDR率和43.7±11.5%的NHEJ率(图11E)。值得注意的是,与RNP和GTC(编码E6V)rAAV6盒共同递送相比,使用RNP和GAA(编码E6optE)rAAV6共同递送的总NHEJ事件的增加可能反映了使用核转染系统的总体编辑率增加。尽管GTC(编码E6V)rAAV6编辑的数据包括使用Neon(n=3)和Lonza(n=1)二者的实验,但GAA(编码E6optE)rAAV6的共同递送专门用Lonza(n=3)测试。在用1%GAA(编码E6optE)rAAV6进行电穿孔和转导后,细胞活力平均为60%(图11I)。RP-HPLC分析鉴别出RNP编辑样品中βA水平显著降低(从对照细胞中的82%至经RNP编辑细胞中的16.9±15%)以及βA(HBG1)和γG(HBG2)的3倍增长。相比之下,RNP和1%GAA(编码E6optE)rAAV6的共同递送引起较不稳健(robust)的βA水平下降(54.2±10%βA表达;n=3,图11F)以及较不突出的βA(HBG1)和γG(HBG2)的增加。RNP和GAA(编码E6optE)rAAV6共同递送后,βA表达的保留可能归因于AAV介导的HDR。与这个结论一致地,用RNP和GAA(编码E6optE)rAAV6共同递送处理的细胞的RP-HPLC分析显示出HDR后的64.7%的βA(图11O)。综上所述,我们的研究结果表明,RNP和rAAV6共同递送能够促进HBB外显子1中高水平的HDR,使得设计为回转患者细胞中的镰状突变的沉默突变的引入或者镰状突变的引入。
通过ssODN供体模板递送引入GTC改变
进行研究以评价RNP和ssODN的共同递送在引入与在mPBSC中使用rAAV6实现的核苷酸改变相同的核苷酸改变方面的效率。将可选的168bp ssODN设计为产生GTG(编码E6V)、GTC(编码E6V)或GAA(编码E6optE)核苷酸改变(图12A)。实验时间线在图12B中示出。随着所测试的ssODN浓度的增加,细胞毒性呈剂量依赖性增加(图12G)。RNP和50pmol ssODN共同递送后,GTC ODN的HDR基因转化率为11.9±3.4%,GTG ODN为17±4.3%,残余NHEJ分别为17.4±17.5%和20.0±1.7%(图12C、图12H)。通过集落测序进一步验证了50pmol GTGssODN(编码E6V)的HDR和NHEJ率,分别为12.6±8.8%和30.1±12.4%(图12I)。通过RP-HPLC评估珠蛋白亚型。RNP介导的破坏后,观测到βA的显著降低,以及βA(HBG1)和γG(HBG2)的1.5倍升高。RNP和不同浓度的ssODN的共同递送引起镰状珠蛋白表达的剂量依赖性增加,最佳βS表达为50pmol的GTC(编码E6V)ssODN(图12D)和GTG ssODN(图12J)。分别用GTC(编码E6V)ssODN编辑引起5.2%βS表达(50pmol,n=5,图3D),用GTG(编码E6V)ssODN编辑引起5.3%βS表达(50pmol,n=3)(图12J)。与这些平均值一致,源自分化的红系细胞的样品色谱图显示,GTC(编码E6V)ssODN的βS表达为8.9%(图12L),GTG(编码E6V)ssODN为9.2%βS(图12M)。使用GTC ssODN与rAAV6在来自同一供体的mPBSC中进行编辑的直接比较分别显示了8.9%与24.5%的βS表达(图12L)。
通过ssODN供体模板递送引入GAA SNP改变
与使用rAAV6供体模板的研究一致,测试了可选的沉默SNP改变(GAA;编码E6optE)的引入。RNP和50pmol GAA(编码E6optE)ssODN的共同递送引起24.5±7.6%的HDR基因转化率,与44±13.8%的残余NHEJ率(图12E)。随ssODN浓度的增加,在Neon和Lonza系统二者中均观测到HDR的剂量依赖性增加和NHEJ的相应减少(图12K)。使用Neon电穿孔系统后的编辑结果也通过集落测序证实,表明10.6±2.8%的HDR率,和35.5±8.6%的残余NHEJ率(图12I)。测量了分化的红系沉淀中的珠蛋白亚型,观察到βA显著降低(25.7%,n=6个供体),βA(HBG1)和γG(HBG2)升高1.5至3倍,以及RNP介导的破坏。相对的,使用GAA(编码E6optE)ssODN供体模板将βA表达保持在58.4%(n=6个供体,图12F)。示出经编辑的分化的红系细胞中珠蛋白亚型的样品色谱图表明了从RNP破坏的样品中的0%HbA增加到RNP和GAA(编码E6optE)ssODN共同递送后的75.6%(图12N)。将经仅RNP编辑的细胞与使用RNP和HDR供体模板的共同递送编辑的mPBSC的直接比较显示,GAA ssODN和rAAV6供体模板的HbA表达分别从0%增加至75.6%和64.7%(图12N)。
通过MiSeq分析对ssODN和rAAV6供体模板的递送方法的比较
为了进一步评估使用我们的替代平台所实现的基因编辑效率,使用了MiSeq分析来验证编辑结果。评估了对于与所有ssODN供体模板以及GTC(编码E6V)rAAV6供体模板相关联的RNP共同递送,使用Neon电穿孔系统所实现的HDR和NHEJ率。从每个体外(和体内)样品中获得平均113,000个成对的比对读段(图13D)。数据表明,rAAV6供体模板驱动的HDR水平高于NHEJ(GTC rAAV6:27.8%HDR,16%NHEJ),而ssODN递送体外驱动的NHEJ水平高于HDR(GTC ssODN:14.3%HDR和19.6%NHEJ)(图13A、图13B、图13C)。分析产生的插入缺失谱,单独的RNP导致60.4%的删除(主要是-3bp、-1bp、-5bp、-6bp和-12bp删除)以及2%的插入。供体模板与RNP的共同递送使插入缺失谱降低到主要为-3和-1bp删除(图13B、图13E)。在经rAAV6编辑的样品和经ssODN编辑的样品中观测到野生型(WT)、具有删除的NHEJ和HDR等位基因(图13C)。与ssODN供体模板递送(体外12.2%和体内5.3%)相比,Crispresso 27分析确定rAAV6供体模板递送引起更少的移码突变(体外8.6%和体内1.4%;图13F)。
ssODN与rAAV6递送对体内经HDR编辑的细胞持续植入的影响
为了了解可选的供体模板平台在改变经HDR编辑的CD34+细胞的长期植入潜能中的作用,将经编辑以引入GTC(编码E6V)改变的健康对照mPBSC移植入白消安调理(12.5mg/kg至25mg/kg)的NBSGW受体小鼠(允许人红系区室发育的免疫缺陷株)。在电穿孔后第1天,移植来自相同供体并在各个平台上进行编辑的细胞(2×106个细胞)。随时间评估经移植的动物,并在3周和12-14周评价经移植的动物的BM和脾中的人细胞植入(图14A)。
人嵌合体对于经空白编辑的细胞或经ssODN编辑的细胞的受体具有可比性。相反,在rAAV6编辑的细胞的受体中观测到hCD45+细胞植入的显著减少(图14B)。此外,在经rAAV6编辑的组中,CD19+B细胞的比例适度增加,表明偏向更分化的后代(图14C)。在同生群中包括髓系(CD33+)、T细胞(CD3+)和红系(CD235+)细胞在内的其它谱系占比等价(图14C、图14D、图14J、图14K、图14L)。在收获后将从BM分离的细胞在红系分化培养基中培养2周以允许CD235+细胞扩增(收获时增加4.01%,在离体培养物中增加至27.6%;图14D)。经编辑的供体细胞在移植前和移植后的代表性流式图显示了等比例的原始HSC亚群,所述亚群包括:CD34+;CD34+CD38lo和CD34+CD38loCD133+CD90+细胞(图14E、图14M、图14N)。对于rAAV6和ssODN递送方法,在4批移植中输入HDR率(培养第14天)分别为24.28±7.5%和17.5±6%。对于rAAV6和ssODN递送,移植后3周BM中经HDR编辑的细胞分别降至13.58±0.16%和15.19±2.8%(n=2)。在12-14周时,rAAV6供体模板编辑的细胞的受体的HDR率陡然下降至0.66±0.66%(n=17)。引人注目的是,在ssODN供体模板编辑的细胞的受体中,HDR率也下降,但下降程度较小至4.136±2.1%(n=18)(图14F)。对于rAAV6和ssODN供体模板递送方法,输入NHEJ分别为7±1.4%和13.5±3.7%,并且在移植后3周时保持不变(rAAV6:9±3%,ssODN:12.3±2.1%),而在12-14周下降(NHEJ rAAV6:1.3±0.85%,ssODN:5±2.7%,图14G)。通过MiSeq分析验证了体内的BM中的HDR和NHEJ率(HDR:rAAV6:0.65±0.65%,ssODN:3.84±2.1%;NHEJ:rAAV6:2.5±2.5%和ssODN:9.9±5.3%,图14H、图14I)。
在红系培养条件下体外维持各个初始编辑的细胞群的亚组,并分析珠蛋白亚型。经rAAV6编辑的细胞显示16.4±6.8%,而经ssODN编辑的细胞显示12.42±4.4%的βS表达(图14O)。在经ssODN编辑组中,通过HPLC分析的离体BM培养物表达3.8%的βS(n=3只动物)。相比而言,在经rAAV6(n=4只动物)或经空白编辑的样品(n=2只动物,图14P)中未检测到βS。69个BFU-E集落的HPLC显示源自ssODN编辑组的3/35个集落表达βS,因此引起平均5.13%的βS表达。相比而言,在经rAAV6编辑的集落(n=26个集落)或经空白编辑的集落(n=8个集落,图14Q、图14R)中未检测到βS表达。源自ssODN编辑组的单个红系集落的色谱图表明βS表达水平为38.7%、84.5%和56.3%(图14S、图14T)。空白样品的单集落的HPLC谱包含97%的HbA,而经编辑组的HbA减少,HbF(rAAV6:17.4%,ssODN:17.9%)和/或HbS增加(图14Q、图14R、图14S、图14T)。综上所述,这些研究表明,在体内,经ssODN修饰的细胞表现优于经rAAV6修饰的细胞,引起经HDR编辑的细胞更高的持续植入以及镰状珠蛋白表达二者。
DNA供体模板的递送可用于在人造血干细胞中靶向基因切割后实现精确的基因修正。HDR与NHEJ的总体比例影响了镰状细胞疾病中基因修正的潜在临床益处。在本文公开的研究中,评估了可选供体模板对于在体外实现初始基因转化事件的递送方法、以及对体内经编辑细胞的存活、干细胞样潜能(stem-like potential)和持续移入的影响的作用。合并的数据证明了复杂性,并解决了在SCD中实现长期临床基因修正的一些挑战。尽管与ssODN相比,在使用rAAV6的HSC活力、表型或体外扩增方面未观察到主要差异,但显示出rAAV6供体模板介导始终较高的HDR:NHEJ比。相比而言,在移植实验中,使用以ssODN供体模板编辑的HSC实现了更高水平的持续HDR。
对候选TALEN对和跨越镰状突变位点周围的53bp区域的多个候选向导RNA进行了初步筛选。如本文所示,sgRNA-g1有效地创建了与镰状突变位点直接相邻的DSB(在21-22bp之间),因此被选为比在距突变位点16b处产生DSB的sgRNA-g6(G10)更有用的向导。以1:2.5的比例使用Cas9:sgRNA在人mPBSC中促进最高水平的编辑,而没有可证明的脱靶效应(图10D、图10F、图10G)。值得注意的是,当使用核转染系统(图10E)时,总编辑率翻了一倍多,在体外HDR和残余插入缺失二者均增加(图11G、图12G)。递送含有sgRNA-g1的RNP后,测试了可选rAAV6盒与一系列ssODN在HBB外显子1第六个密码子中驱动一个或两个核苷酸改变的能力。体外研究表明,rAAV6促进了比NHEJ更高的HDR率(GTC rAAV6:37.5±15%HDR和12.7±5.3%NHEJ,图11C)。相比而言,ssODN递送驱动了比HDR更多的NHEJ(GTC ssODN:11.9±3.4%HDR和17.4±17.5%NHEJ,图12C、图13A)。
实施例4:CM149和ER100 Lonza方法的比较
将CM149和ER100 Lonza核转染方法进行比较,用RNP进行编辑,随后进行rAAV6或ssODN供体模板递送。将用Lonza程序CM149和ER100的活力(使用MUSE细胞计数器评估)、HDR(通过ddPCR评估)和NHEJ(通过ICE评估)结果进行了比较,使用了在SCGM培养基(100万个细胞/mL)或SFEM-II培养基(250,000个细胞/mL)中培养的动员CD34+HSC。
在两种测试的培养基中,单独的RNP的NHEJ破坏率和HDR后的残余插入缺失对于2个Lonza方法是相当。相比而言,与ER100方法相比,使用CM149方法用RNP以及浓度为50pmol和25pmol的ssODN进行的HDR编辑在编辑后第2天产生更多的活细胞(图15A)。在SFEM-II培养基中的RNP+50pmol ssODN获得40%的HDR。尽管ER100在ssODN为50pmol和25pmol时实现了比CM149更高的HDR率,但是使用ER100显著降低了活力和细胞计数,因此是不期望的。与SCGM培养基相比,具有低密度培养的SFEM-II培养基在LT-HSC(CD34+CD38 Lo)区室(CD34+CD38Lo)中保留了更多的细胞,因此可能优选用于体内植入。两种方法在两种测试培养基中均驱动了约30%的βA成人珠蛋白表达(图15B)。两种方法均引起编辑后活力低于70%(第2天),因此,对于长期植入,两种Lonza方法可能都是次优的。
实施例5:核转染时细胞密度的比较
比较了核转染时的细胞密度,以评价细胞密度在驱动最优HDR、NHEJ和活力中的作用。在20μL Lonza反应中改变细胞密度(每20μL核转染反应200,000/400,000/600,000个细胞),以了解在RNP编辑以及rAAV6和ssODN供体模板递送后,细胞数量是否对活力、HDR和NHEJ结果有影响。
在用两种测试方法(CM149和ER100)进行核转染后第2天,关于编辑后的CD34+细胞的活力,200,000个细胞/20μL的核转染反应优于其余的细胞密度(图16A)。如在编辑后第14天所测得的,对于HDR,200,000个细胞/20μL的核转染反应优于其余的细胞密度,除了用ER100测试的RNP+50pmol ssODN,其中400,000个细胞/20μL反应效果最好(图16B)。细胞密度对NHEJ率没有影响(图16C)。使用两种测试的方法,在各种密度下,HDR后的总NHEJ率和残余NHEJ率是相当的。
实施例6:细胞活力和HDR率的评估
使用与RNP和ssODN递送相关的可选Lonza程序评估了细胞活力和HDR率。
CX100在编辑后的第2天实现了70%的活力,在第14天实现了27%的HDR。EO100、DU100和DZ100在编辑后第2天具有40-50%的HDR,但仅具有20-45%的活力(图17A)。关于活力:ER100<DZ100<DU100<EO100<CM149<CX100。关于HDR:ER100<CM149<CX100<DZ100<EO100<DU100(图17B)。高活力和高HDR是优选的,因此CX100程序是与RNP和ssODN递送相结合以在长期HSC中实现HDR的最期望的平台(图17C)。
实施例7:ssODN的评估
用CX100和DU100对ssODN(pmol滴定)进行评估以使活力和HDR最大化。结合最佳表现的Lonza核转染方法评估了ssODN的可选剂量,以找出使第2天的细胞活力和HDR率最大化的条件。使用Lonza DU100或CX100程序,用RNP对100pmol、50pmol和25pmol的ssODN进行测试。
CX100比DU100引起更高的活力。50pmol+RNP的CX100具有80%的活力和30%的HDR。RNP破坏与两种方法相同。与DU100相比,使用CX100的RNP+50pmol ssODN的残余NHEJ更高(图18)。
实施例4-实施例7说明了使用各种Lonza核转染方法使HDR最大化同时保持活力的条件。总体而言,SFEM-II培养基比SCGM培养基更为可取,因为LT-HSC区室中保留了更多的细胞。Lonza CX100程序保留了80%的经编辑细胞的活力,同时驱动30%的HDR结果。因此,研究显示最适合使用ssODN和rAAV6进行HBB的HDR编辑的临床翻译的有限范围的条件,包括:(a)在使用250,000个细胞/mL至1000,000个细胞/mL的低密度培养条件下使用SFEM-II培养基;(b)在SFEM-II培养基中以100ng/mL的IL-6、TPO、FLT-3L、SCF使用细胞因子;(c)使用具有最优效果的可选Lonza程序:(i)对于使HDR最大化,ER100<CM149<CX100<DZ100<EO100<DU100,(ii)对于使活力最大化,ER100<DZ100<DU100<EO100<CM149<CX100,(iii)以1∶1、1∶2.5、1∶5的比使用RNP(使用20pmol到40pmol Cas9);(iv)对200,000个细胞使用浓度为10pmol至100pmol的ssODN;(v)以1-3%的培养物体积使用rAAV6,MOI 2000至6000,基于病毒滴度。
实施例8:体内和体外检测HDR和野生型结果
ddPCR测定用于测量HDR事件和未编辑的(野生型)事件二者。开发了一种测定作为互斥测定,其中HDR FAM探针结合或野生型HEX探针结合基因组DNA(gDNA)。将FAM和HEX探针混合在一起,并允许在同一孔中竞争结合位点。结合同一扩增子中所有gDNA的参考HEX探针用作内标并平行运行。计算如下:
%HDR=(%FAM+)/(Ref HEX+)
%WT=(%HEX+)/(Ref HEX+)
图19示出了关于E6V(GTC)改变和EoptE(GAA)改变二者的代表性空白、AAV、RNP、RNP+AAV和RNP+ssODN样品的ddPCR测定结果。所有FAM+事件明确地代表HDR事件,而HEX+事件则代表野生型事件。
实施例9:通过ddPCR验证HDR以及通过ICE验证NHEJ
从ddPCR数据计算出HDR百分比(%)(图20A),并从ICE算法数据计算出NHEJ%(图20B)。ICE分析用于确定NHEJ%。ICE算法可用于确定敲出率(NHEJ)和敲入率(HDR)。提供了向导序列和供体模板序列以清楚地区分插入缺失和HDR。该分析提供了经验证以确保正确鉴别插入缺失和HDR的序列迹线。HDR和NHEJ数据组合成一张图,以示出总编辑率(总编辑=%NHEJ+%HDR),并证明随着HDR的增加,NHEJ减少。使用Crispresso算法通过MiSeq分析进一步验证了HDR和NHEJ数据,其确认了ICE和ddPCR数据,并证明了通过RNP传递,大多数NHEJ事件主要是删除。
如本文所用,术语“包含(comprising)”与“包括(including)”、“含有(containing)”或“以...为特征(characterized by)”同义,并且是包括性的或开放性的,并且不排除额外的未叙述的要素或方法步骤。
以上描述公开了本发明的几种方法和材料。本发明易于修改方法和材料,以及改变制造方法和设备。通过对本公开内容的考虑或对本文公开的本发明的实践,此类修改对于本领域技术人员将变得显而易见。因此,无意将本发明限制于本文公开的具体替代方式,而是其涵盖了落入本发明的真实范围和精神内的所有修改和替代方式。
本文引用的所有参考文献(包括但不限于已公开和未公开的申请、专利和参考文献)均以引用的方式整体并入本文,并因此成为本说明书的一部分。如果以引用的方式并入的出版物和专利或专利申请与说明书中包含的公开内容相矛盾,本说明书旨在取代和/或优先于任何此类矛盾的材料。
序列表
<110> David J. Rawlings
Sowmya Pattabhi
Andrew M. Scharenberg
Kyle Jacoby
Christopher Thomas Lux
<120> 用以编辑血红蛋白相关突变的同源定向修复模板设计和递送
<130> SCRI.194WO
<150> 62663553
<151> 2018-04-27
<150> 62820521
<151> 2019-03-19
<160> 81
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> g1或SCL-1
<400> 1
gtaacggcag acttctcctc 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> g2或SCL-2
<400> 2
gtctgccgtt actgccctgt 20
<210> 3
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> g3或SCL-3
<400> 3
tctgccgtta ctgccctgt 19
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> g4或SCL-4
<400> 4
agtctgccgt tactgccctg 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> g5或SCL-5
<400> 5
aaggtgaacg tggatgaagt 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> g6或SCL-6
<400> 6
cttgccccac agggcagtaa 20
<210> 7
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> SCL-1 + gRNA支架
<400> 7
gtaacggcag acttctcctc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 8
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> SCL-2 + gRNA支架
<400> 8
gtctgccgtt actgccctgt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 9
<211> 99
<212> DNA
<213> 人工序列
<220>
<223> SCL-3 + gRNA支架
<400> 9
tctgccgtta ctgccctgtg ttttagagct agaaatagca agttaaaata aggctagtcc 60
gttatcaact tgaaaaagtg gcaccgagtc ggtgctttt 99
<210> 10
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> SCL-4 + gRNA支架
<400> 10
agtctgccgt tactgccctg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 11
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> SCL-5 + gRNA支架
<400> 11
aaggtgaacg tggatgaagt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 12
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> SCL-6 + gRNA支架
<400> 12
cttgccccac agggcagtaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 13
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> SCL-1 PAM序列
<400> 13
agg 3
<210> 14
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> SCL-2 PAM序列
<400> 14
ggg 3
<210> 15
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> SCL-3 PAM序列
<400> 15
ggg 3
<210> 16
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> SCL-4 PAM序列
<400> 16
tgg 3
<210> 17
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> SCL-5 PAM序列
<400> 17
tgg 3
<210> 18
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> SCL-6 PAM序列
<400> 18
cgg 3
<210> 19
<211> 168
<212> DNA
<213> 人工序列
<220>
<223> ssODN-V7E:GTC
<400> 19
tcagggcaga gccatctatt gcttacattt gcttctgaca caactgtgtt cactagcaac 60
ctcaaacaga caccatggtg catctgactc ctgtcgagaa gtctgccgtt actgccctgt 120
ggggcaaggt gaacgtggat gaagttggtg gtgaggccct gggcaggt 168
<210> 20
<211> 168
<212> DNA
<213> 人工序列
<220>
<223> ssODN-V7E:GTG
<400> 20
tcagggcaga gccatctatt gcttacattt gcttctgaca caactgtgtt cactagcaac 60
ctcaaacaga caccatggtg catctgactc ctgtggagaa gtctgccgtt actgccctgt 120
ggggcaaggt gaacgtggat gaagttggtg gtgaggccct gggcaggt 168
<210> 21
<211> 168
<212> DNA
<213> 人工序列
<220>
<223> ssODN
CCCGAA
<400> 21
tcagggcaga gccatctatt gcttacattt gcttctgaca caactgtgtt cactagcaac 60
ctcaaacaga caccatggtg catctgactc ccgaagagaa gtctgccgtt actgccctgt 120
ggggcaaggt gaacgtggat gaagttggtg gtgaggccct gggcaggt 168
<210> 22
<211> 15662
<212> DNA
<213> 人工序列
<220>
<223> FrankenpEVL_SCL L Talen
<400> 22
gcgtataatg gactattgtg tgctgataag gagaacataa gcgcagaaca atatgtatct 60
attccggtgt tgtgttcctt tgttattctg ctattatgtt ctcttatagt gtgacgaaag 120
cagcataatt aatcgccact tgttctttga ttgtgttacg atatccagag acttagaaac 180
gggggaaccg ggatgagcaa ggtaaaaatc ggtgagttga tcaacacgct tgtgaatgag 240
gtagaggcaa ttgatgcctc agaccgccca caaggcgaca aaacgaagag aattaaagcc 300
gcagccgcac ggtataagaa cgcgttattt aatgataaaa gaaagttccg tgggaaagga 360
ttgcagaaaa gaataaccgc gaatactttt aacgcctata tgagcagggc aagaaagcgg 420
tttgatgata aattacatca tagctttgat aaaaatatta ataaattatc ggaaaagtat 480
cctctttaca gcgaagaatt atcttcatgg ctttctatgc ctacggctaa tattcgccag 540
cacatgtcat cgttacaatc taaattgaaa gaaataatgc cgcttgccga agagttatca 600
aatgtaagaa taggctctaa aggcagtgat gcaaaaatag caagactaat aaaaaaatat 660
ccagattgga gttttgctct tagtgattta aacagtgatg attggaagga gcgccgtgac 720
tatctttata agttattcca acaaggctct gcgttgttag aagaactaca ccagctcaag 780
gtcaaccatg aggttctgta ccatctgcag ctaagccctg cggagcgtac atctatacag 840
caacgatggg ccgatgttct gcgcgagaag aagcgtaatg ttgtggttat tgactaccca 900
acatacatgc agtctatcta tgatattttg aataatcctg cgactttatt tagtttaaac 960
actcgttctg gaatggcacc tttggccttt gctctggctg cggtatcagg gcgaagaatg 1020
attgagataa tgtttcaggg tgaatttgcc gtttcaggaa agtatacggt taatttctca 1080
gggcaagcta aaaaacgctc tgaagataaa agcgtaacca gaacgattta tactttatgc 1140
gaagcaaaat tattcgttga attattaaca gaattgcgtt cttgctctgc tgcatctgat 1200
ttcgatgagg ttgttaaagg atatggaaag gatgatacaa ggtctgagaa cggcaggata 1260
aatgctattt tagcaaaagc atttaaccct tgggttaaat catttttcgg cgatgaccgt 1320
cgtgtttata aagatagccg cgctatttac gctcgcatcg cttatgagat gttcttccgc 1380
gtcgatccac ggtggaaaaa cgtcgacgag gatgtgttct tcatggagat tctcggacac 1440
gacgatgaga acacccagct gcactataag cagttcaagc tggccaactt ctccagaacc 1500
tggcgacctg aagttgggga tgaaaacacc aggctggtgg ctctgcagaa actggacgat 1560
gaaatgccag gctttgccag aggtgacgct ggcgtccgtc tgcatgaaac cgttaagcag 1620
ctggtggagc aggacccatc agcaaaaata accaacagca ctctccgggc ctttaaattt 1680
agcccgacga tgattagccg gtacctggag tttgccgctg atgcattggg gcagttcgtt 1740
ggcgagaacg ggcagtggca gctgaagata gagacacctg caatcgtcct gcctgatgaa 1800
gaatccgttg aaaccatcga cgaaccggat gatgagtccc aagacgacga gctggatgaa 1860
gatgaaattg agctcgacga gggtggcggc gatgaaccaa ccgaagagga agggccagaa 1920
gaacatcagc caactgctct aaaacccgtc ttcaagcctg caaaaaataa cggggacgga 1980
acgtacaaga tagagtttga atacgatgga aagcattatg cctggtccgg ccccgccgat 2040
agccctatgg ccgcaatgcg atccgcatgg gaaacgtact acagctaaaa gaaaagccac 2100
cggtgttaat cggtggcttt tttattgagg cctgtcccta cccatcccct gcaagggacg 2160
gaaggattag gcggaaactg cagctgcaac tacggacatc gccgtcccga ctgcagggac 2220
ttccccgcgt aaagcggggc ttaaattcgg gctggccaac cctatttttc tgcaatcgct 2280
ggcgatgtta gtttcgtgga tagcgtttcc agcttttcaa tggccagctc aaaatgtgct 2340
ggcagcacct tctccagttc cgtatcaata tcggtgatcg gcagctctcc acaagacata 2400
ctccggcgac cgccacgaac tacatcgcgc agcagctccc gttcgtagac acgcatgttg 2460
cccagagccg tttctgcagc cgttaatatc cggcgcagct cggcgatgat tgccgggaga 2520
tcatccacgg ttattgggtt cggtgatggg ttcctgcagg cgcggcggag agccatccag 2580
acgccgctaa cccatgcgtt acggtactga aaactttgtg ctatgtcgtt tatcaggccc 2640
cgaagttctt ctttctgccg ccagtccagt ggttcaccgg cgttcttagg ctcaggctcg 2700
acaaaagcat actcgccgtt tttccggata gctggcagaa cctcgttcgt cacccacttg 2760
cggaaccgcc aggctgtcgt cccctgtttc accgcgtcgc ggcagcggag gattatggtg 2820
tagaggccag attccgatac cacatttact tccctggcca tccgatcaag tttttgtgcc 2880
tcggttaaac cgagggtcaa tttttcatca tgatccagct tacgcaatgc atcagaaggg 2940
ttggctatat tcaatgcagc acagatatcc agcgccacaa accacgggtc accaccgaca 3000
agaaccaccc gtatagggtg gctttcctga aatgaaaaga cggagagagc cttcattgcg 3060
cctccccgga tttcagctgc tcagaaaggg acagggagca gccgcgagct tcctgcgtga 3120
gttcgcgcgc gacctgcaga agttccgcag cttcctgcaa atacagcgtg gcctcataac 3180
tggagatagt gcggtgagca gagcccacaa gcgcttcaac ctgcagcagg cgttcctcaa 3240
tcgtcttcag caggccctgg gcgtttaact gaatctggtt catgcgatca cctcgctgac 3300
cgggatacgg gctgacagaa cgaggacaaa acggctggcg aactggcgac gagcttctcg 3360
ctcggatgat gcagtggtgg aaaggcggtg gatatgggat tttttgtccg tgcggacgac 3420
agctgcaaat ttgaatttga acatggtatg cattcctatc ttgtataggg tgctaccacc 3480
agagttgaga atctctatag gggtggtagc ccagacaggg ttctcaacac cggtacaaga 3540
agaaaccggc ccaaccgaag ttggccccat ctgagccacc ataattcagg tatgcgcaga 3600
tttaacacac aaaaaaacac gctggcgcgt gttgtgcgct tcttgtcatt cggggttgag 3660
aggcccggct gcagattttg ctgcagcggg gtaactctac cgccaaagca gaacgcacgt 3720
caataattta ggtggatatt ttaccccgtg accagtcacg tgcacaggtg tttttatagt 3780
ttgctttact gactgatcag aacctgatca gttattggag tccggtaatc ttattgatga 3840
ccgcagccac cttagatgtt gtctcaaacc ccatacggcc acgaatgagc cactggaacg 3900
gaatagtcag caggtacagc ggaacgaacc acaaacggtt cagacgctgc cagaacgtcg 3960
catcacgacg ttccatccat tcggtattgt cgacgacctg gtaagcgtat tgtcctggcg 4020
tttttgctgc ttccgagtag caatcctctt caccacaaag aaagttactt atctgcttcc 4080
agttttcgaa cccttcttct ttgagccgct tttccagctc attcctccac aaaacaggca 4140
cccatcctct gcgataaatc atgattattt gtcctttaaa taaggctgta gaactgcaaa 4200
atcgctctcg ttcacatgct gtacgtagat gcgtagcaaa ttgccgttcc atccctgtaa 4260
tccaccttct ttggaaagat cgtccttgac ctcacgaaga actttatcca atagccctgc 4320
ggcacaagaa attgcctgct ctggatcagc aaattcatat tgattaatag gtgattgcca 4380
cacaccaaaa acaggaatca tcttttcggc taaacgcctc tcctgttctt tcttaatctc 4440
aagttgtaag cggaccagct caccatccat cattttttgt agatcatgcg ccactattca 4500
cccccactgg ccatcagcaa ataaagcttc atactcggac accggcaggc ggcttccacg 4560
gattgaaagg tcaagccaac cacgtccaga tgggtcagcc ttatccgatt cttcccaccg 4620
ttctgcagct gtagcaacca ggcattctac cgccttcatg tagtcttctg tacggaacca 4680
gccgtagtta atgccaccat cagtaactgc ccaggccatc tttttctctt cggcctcaat 4740
agcccggatg cggttatcgc acagctcgcg acagtacttc agctgttcgt aatccagttg 4800
cttcaggaac tctggtgtcg acgtcatagt ggcttcacct tataggcttt tagaagcgcc 4860
ctggcttcgt ctgtgtggtc ttccatgctc ttatcgctgg caatgcagca ataaactccc 4920
tcactatctg agaacccgtt catccgaatg atcgtgaatg gaagttcccg gccagtttta 4980
taatcgctat agcttgtcgc gtcgtggctg accttgacca cataagggtc gtagccctcc 5040
acgatgacaa ggcattcccg ttgttttccc attacccctc cggttatatc gccacggctt 5100
gccgctggct tagaaacgct ttcagcagcc ttatttcgcg tactgatagc aggtccataa 5160
attcggtcat gtacagcgag gcgaacgttc tcgcgatgct ggccactggc cacaggcgta 5220
ccgcctccat ttcggttgct ggcaacgcgt tctccgccca cgcctccggt accgccaccg 5280
ggatagcctc cagtgcctgg ataattactg attgtggggc gtccggaacg tgctctgttt 5340
tggatcgagg gttaccatgt atatctatat ttagatccaa atcgcgatcc acttcgatgg 5400
tggttttttc caccttacgt gcgtgaattg ataaaccggc ctcgcggcgc ttctccacga 5460
tattcatgag gaactcgacc gagtccgggt caatggaacg catcgtgggg cgtgcatcgc 5520
catctctggc gcgtctggtc ttactggata gccccataga ctccaggatg cctatgcaga 5580
ggtctgcagg cgctttcttc ttgcctttct ctgtgttgaa gccgccgatg cgtaaaacgt 5640
tgtttagcag atcgcgccgt tccggcgtga gcaggttatc tctggcgcgt ttgagggcgt 5700
ccatgtctgc ttcaccttcc agggtttttg gatcgatacc gcagtcgcgg aagtactgct 5760
gcagcgtcgc cgatttgagg gtgtagaaac cacgcatgcc tatctcaaca gcaggggtcg 5820
atttcactcg gtaatcggtt atggccggga atttagcctg gaactctgcg tcggcctgtt 5880
cccgcgtcat ggccgtagtg acgaactgct gccatcttcc ggcaacgcga taagcgtagg 5940
taaagtgaat caacgcttct tcacggtcaa ggcgacgggc ggttatctca tccagctgca 6000
tggtttcaaa caggcgcact tttttcaggc cgccgtcgaa atagaatttt aacgccacct 6060
cgtcgacatc cagctgcagc tccttttcga tgtcccagcg gaccagctgg gcctgctcat 6120
ccagggacag ggtgcgtttt tttatcaact catcgtgttc ggcctggtca ggagtatcga 6180
cactcaggtg gcgctccata agctgctcaa agaccagttc acgggcttct ttacgtaaat 6240
ccttaccgat gctgtttgca agcgcgtcgg tggccatagg cgcgacctga tagccatcat 6300
catgcatgat gcaaatcatg ttgctggcat aatcatttct ggccgatgcc tcgagcgcgg 6360
cggctttaat tttgagctgc atgaatgaag agttagccac gccgagtgaa attcggtcac 6420
cgtcaaagac aacgtctgtc agcagcccgg agtggccagc cgtttcgagc aaggcctgcg 6480
cgtaggcgcg tttgattttt tccggatcgg tttcacgttt accgcgaagc ttgtcgaaac 6540
cgataatgta ttcctgagct gtacggtcgc ggcgcagcat ctggatggcg tcgctgggga 6600
ccacttcgcc gcagaacatg ccgaaatggc ggtggaagtg tttctcctca atcgatacac 6660
ctgaagatat cgacgggctg tagatgaggc cgtcatattt tttcaccatc actttaggct 6720
ggttggtgaa atcgtcgact tccttctcct gtttgttttt ctggttaacg cagagaaact 6780
ttttgtcagg gaactgtagt ctcagctgca tggtaacgtc ttcggcgaac gtcgaactgt 6840
cggtggccag catgattcgt tcgccgcgtt gcactgcagc gataacctcg gtcatgatcc 6900
gatttttctc ggtataaaat acgcggatag gcttgttggt ttcgcggttg cgaacgtcga 6960
ccgggagttc aatcacgtga atttgcagcc aggcaggtag gcccagctcc tcgcgtcgct 7020
tcatcgccag ttcagccagg tcaacaagca gatcgttggc atcggcatcc accataatgg 7080
catgctcttc agtacgcgcc agcgcgtcga taagcgtgtt gaatacgcct accgggtttt 7140
ccatcgcacg cccggccaga atggcacgca ggccctgtgt tgcttcatcg aagccgaaga 7200
agtcatgctg gcgcatcagc ggttgccagc agcctttaag tatggagttg atgcaaatag 7260
tcagcttgtt ggcatatggc gccatttcct gatagccggg atcctgataa tgcagaatgt 7320
cggctttcgc gcctttccct tcggtcatca tttcatgcag gccgcctatc agggatacgc 7380
ggtgcgcgac ggaaacgcca cgcgtggact gcagcatcag tggacgcagg aggcctgtcg 7440
atttacccga ccccatcccg gcgcggacaa taacgatgcc ctgcagctgt gcggcgtatg 7500
tcatcacctc atcggtcatc ctggaggttt caaaccgttt gtaagtgatg tgtgacgggc 7560
gaaggttcgg gttggtgatg cgttcactga acgaacgtga tgtttgcgcg gcacggcatt 7620
tgcgattcaa ccggcgcgta atgtgatctt taacggtacc gttataaatt tctgcgatac 7680
ccatatcccg cagcgtgctg ctgaaaaggc gcataagttc tttcgggctg tttggtaccg 7740
ggcatgtcag catgccaata tcaacggcgc gaagcagttc tttggcaaaa gtgcgtctgt 7800
tcagacgcgg gagagtacgc agcttattca gcgtgatcga caacagatcg gttgcacggc 7860
tcagatgatt tctcgttaac tggcgagcga cttccttcag ccctctcagg ctgtgcaggt 7920
cgttaaaatc gctgcattcc agctcagggt catcctcaaa agttgggtaa acacatttga 7980
cgccggaaaa cttctccatg atgtcgaatc cggtgcggag gcctgtgttg ccttttcctt 8040
cagctgagga tttgcggtcg ttatcgagag cgcaagtgat ttgcgcagcc gggtacatgt 8100
tcaccagctg ctcgacaacg tgaatcatgt tgttagcgga aaccgcaatg actaccgcgt 8160
caaagcgttt tttcgggtcg tttctggtcg ccagccagat ggatgccccg gtggcgaaac 8220
cctctgcagt cgcaattttt tgcgccccct gcaggtcgcc aataacaaag catgcaccga 8280
cgaaatcacc gttagtgatg gcgctggtct ggaacttgcc accattcaga tcgatacgtt 8340
gccagccaac aatccgcccg tcttttcttc cgtccaggtg ggacagaggt atcgccatgt 8400
aagttgttgg tccacggctc catttcgcac tgtcgtgact ggtcacgcga cgtatatcac 8460
aagcgccaaa tacgtcacga attccctttt ttaccgcata aggccaggag ccatcttcag 8520
ctggcgaatg ttcccaggcg cgatggaaag ccaaccatcc aagcaggcgt tcctgctcca 8580
tctgattgtt ttttaaatca ttaacgcgtt gttgttcagc tcggaggcgg cgtgcttcag 8640
cctggcgctc catgcgtgca cgttcttctt ccggctgagc gaccacggtc gcaccattcc 8700
gttgctgttc acggcgatac tccgaaaaca ggaatgaaaa gccactccag gagccagcgt 8760
catgcgcttt ttcaacgaag ttaacgaaag gataactgat gccatccttg ctctgctcaa 8820
ggcgtgaata gatttccaca cggcctttaa ggctcttctg cagagcttcc ggggaggaat 8880
tattgtaggt ggtatagcgc tctacaccac cgcgcggatt gagctgaatc ttatcagcac 8940
acgcaggcca gttgataccg gccatcttcg ccagctcagt cagctcatca cgtgccgcgt 9000
caagcagtga aaacggatcg ctgccaaagc gctccgcgta gaattcttgt aaggtcattt 9060
tttagccttt ccatgcgaat tagcattttt tcgggttgaa aaaatccgca ggagcagcca 9120
caataaacgc actatctttc tgaaggacgt atctgcgtta tcgtggctac ttcctgaaaa 9180
aggcccgagt ttgccgactc ggtttttttt tcgtcttttt tcggctgcta cggtctggtt 9240
caaccccgac aaagtataga tcggattaaa ccagaattat agtcagcaat aaaccctgtt 9300
attgtatcat ctaccctcaa ccatgaacga tttgatcgta ccgactactt ggtgcacaaa 9360
ttgaagatca cttttatcat ggataacccg ttgagagtta gcactatcaa ggtagtaatg 9420
ctgctcgtca taacgggcta atcgttgaat tgtgatctcg ccgttattat cacaaaccag 9480
tacatcctca cccggtacaa gcgtaagtga agaatcgacc aggataacat ctcccggctg 9540
gtagtttcgc tgaatctggt tcccgaccgt cagtgcgtaa acggtgttcc gttgactcac 9600
gaacggcagg aatcgctctg tgttggcagg ttctccaggc tgccagtctc tatccggtcc 9660
tgtctctgtc gtaccaataa caggaacgcg gtctggatca gattcagtgc catacagtat 9720
ccattgcacg ggcttacgca ggcattttgc cagcgatagc ccgatctcca gcgacggcat 9780
cacgtcgcca cgttctaagt tttggacgcc cggaagagag attcctacag cttctgccac 9840
ttgcttcagc gtcagtttca gctctaaacg gcgtgctttc agtcgttcgc ctcgtgtttt 9900
cataccctta atcataaatg atctctttat agctggctat aatttttata aattatacct 9960
agctttaatt ttcacttatt gattataata atccccatga aacccgaaga acttgtgcgc 10020
catttcggcg atgtggaaaa agcagcggtt ggcgtgggcg tgacacccgg cgcagtctat 10080
caatggctgc aagctgggga gattccacct ctacgacaaa gcgatataga ggtccgtacc 10140
gcgtacaaat taaagagtga tttcacctct cagcgcatgg gtaaggaagg gcataacaag 10200
gggatcctct agacgcagaa aggcccaccc gaaggtgagc cagtgtgatt acatttgcgg 10260
cctaactgtg gccagtccag ttacgctgga gtcactagtg cggccgcgac aacttgtcta 10320
gggcccaatg gcccatacac ttagtgtaat acgactcact atagggagag cggccgcttt 10380
ttcagcaaga ttaagccgcc accatggcgc cgcggcctcc taagaagaag cggaaagtcg 10440
aattcgtgga tctgcgaaca ctgggctata gccagcagca gcaggagaag atcaaaccca 10500
aggtgaggtc cacagtcgca cagcaccatg aagccctggt gggccacggg ttcactcacg 10560
ctcatattgt cgcactgtct cagcatccag ccgctctggg aaccgtggca gtcacatacc 10620
agcacatcat tactgccctg cccgaggcta cccatgaaga catcgtggga gtcggcaaac 10680
agtggagcgg cgcacgggcc ctggaggctc tgctgaccga cgcaggggaa ctgagaggac 10740
cccctctgca gctggataca gggcagctgg tgaagattgc taagagggga ggggtgacag 10800
caatggaagc cgtccacgca agcaggaacg cactgacagg ggcccccctg aacctgactc 10860
cggaccaagt ggtggctatc gccagcaacc acggcggcaa gcaagcgctc gaaacggtgc 10920
agcggctgtt gccggtgctg tgccaggacc atggcctgac tccggaccaa gtggtggcta 10980
tcgccagcca cgatggcggc aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc 11040
tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc aacattggcg 11100
gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag gaccatggcc 11160
tgactccgga ccaagtggtg gctatcgcca gccacgatgg cggcaagcaa gcgctcgaaa 11220
cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgactccg gaccaagtgg 11280
tggctatcgc cagccacgat ggcggcaagc aagcgctcga aacggtgcag cggctgttgc 11340
cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc gccagcaacg 11400
gtggtggaaa acaggccctt gaaacggtgc agcggctgtt gccggtgctg tgccaggacc 11460
atggcctgac tccggaccaa gtggtggcta tcgccagcaa ccacggcggc aagcaagcgc 11520
tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg accccggacc 11580
aagtggtggc tatcgccagc aacattggcg gcaagcaagc gctcgaaacg gtgcagcggc 11640
tgttgccggt gctgtgccag gaccatggcc tgactccgga ccaagtggtg gctatcgcca 11700
gccacgatgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc 11760
aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaacggt ggcggcaagc 11820
aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc 11880
cggaccaagt ggtggctatc gccagccacg atggcggcaa gcaagcgctc gaaacggtgc 11940
agcggctgtt gccggtgctg tgccaggacc atggcctgac tccggaccaa gtggtggcta 12000
tcgccagcca cgatggcggc aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc 12060
tgtgccagga ccatggcctg accccggacc aagtggtggc tatcgccagc aacggtggcg 12120
gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag gaccatggcc 12180
tgactccgga ccaagtggtg gctatcgcca gcaaccacgg cggcaagcaa gcgctcgaaa 12240
cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg 12300
tggctatcgc cagcaacatt ggcggcaagc aagcgctcga aagcattgtg gcccagctga 12360
gccggcctga tccggcgttg gccgcgttga ccaacgacca cctggtcgct ctggcttgcc 12420
tgggaggacg ccctgctatg gacgctgtga agaaaggact gccccacgca cccgaactga 12480
ttagacgggt gaaccggaga atcggcgaga gaacatccca tagggtggca atctctagaa 12540
ctcagctggt caagagtgaa ctggaggaaa agaaatcaga gctgcgccac aagctgaaat 12600
acgtgcctca tgagtatatc gaactgatcg agattgctcg caattcaacc caggaccgga 12660
tcctggaaat gaaagtgatg gagttcttta tgaaagtcta cggatatcgg gggaaacacc 12720
tgggagggag cagaaagcca gatggggcca tctacacagt gggatccccc atcgactatg 12780
gcgtgattgt cgatactaaa gcctacagcg gaggctataa cctgcctatc ggccaggctg 12840
acgagatgca gagatacgtg gaggaaaacc agacccgcaa taagcatatt aaccccaatg 12900
aatggtggaa agtgtatcct agctccgtca cagagttcaa gtttctgttc gtgagcggac 12960
actttaaggg caactacaaa gcacagctga ctaggctgaa tcatatcacc aactgcaatg 13020
gagccgtgct gtctgtcgag gaactgctga tcgggggaga gatgattaag gctggcacac 13080
tgactctgga ggaagtgagg cgcaagttca acaatgggga aatcaacttc taacctgcag 13140
gatgataagc tagccccggg cgtacggaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13260
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13320
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13380
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aacgagacct 13440
tagggccatt agacttgaag tcaagcggcc gcttacaact ggaccttgct ggtacataga 13500
actgattaac tgaccattta aatcatacca acatggtcaa ataaaacgaa aggctcagtc 13560
gaaagactgg gcctttcgtt ttaatctgat cggcacgtaa gaggttccaa ctttcaccat 13620
aatgaaataa gatcactacc gggcgtattt tgagttatcg agattttcag gagctaagga 13680
agctaaaatg agccatattc aacgggaaac gtcttgctcg aggccgcgat taaattccaa 13740
catggatgct gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc 13800
gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa 13860
aggtagcgtt gccaatgatg ttacagatga gatggtcagg ctaaactggc tgacggaatt 13920
tatgcctctt ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac 13980
cactgcgatc ccagggaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga 14040
aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa 14100
ttgtcctttt aacggcgatc gcgtatttcg tctggctcag gcgcaatcac gaatgaataa 14160
cggtttggtt ggtgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt 14220
ctggaaagaa atgcataaac ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 14280
tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 14340
acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 14400
gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 14460
gaataaattg cagtttcact tgatgctcga tgagtttttc taacctaggt gacagaagtc 14520
aaaagcctcc ggtcggaggc ttttgacttt ctgctagatc tgtttcaatg cggtgaaggg 14580
ccaggcagct ggggattatg tccagacccg gccagcatgt tggttttatc gcatattcag 14640
cgttgtcgcg tttacccagg taaaatggaa gcagtgtatc gtctgcgtga atgtgcaaat 14700
caggaacgta accgtggtac atagatgcag tcccttgcgg gtcgttccct tcaacgagta 14760
ggacgcggtg cccttgcaag gctaaccatt gcgcctggtg tactgcagat gaggttttat 14820
aaacccctcc cttgtgtgac ataacggaaa gtacaaccgg gtttttatcg tcaggtcttt 14880
ggtttgggtt accaaacaca ctccgcatat ggctaatttg gtcaattgtg tagccagcgc 14940
gacgttctac tcggcccctc atctcaaaat caggagccgg tagacgacca gctttttccg 15000
catctctgat agcctgcggt gttacgccga tcaggtctgc aacttctgtt ataccccagc 15060
ggcgagtaat acgacgcgct tccgggctgt catcgccgaa ctgtgcgatg gcaatagcgc 15120
gcgtcatttc ctgaccgcga ttgatacagt ctttcagcaa attaattaac gacatcctgt 15180
ttcctctcaa acatgccctt atctttgtgt ttttcatcat actttacgtt tttaaagcaa 15240
agcaacataa aaaaagcaaa gtgacttaga aaacgcaaag ttaaggttca aatcaatttt 15300
ttgatgcgct acagaagcta tttagcttca tctaagcgca acggtattac ttacgttggt 15360
atatttaaaa cctaacttaa tgattttaaa tgataataaa tcataccaat tgctatcaaa 15420
agttaagcga acatgctgat tttcacgctg tttatacact ttgaggcatc tctatctctt 15480
ctgtctctat attgaaacac aatcaaagaa catcaatcca tgtgacatcc cccactatct 15540
aagaacacca taacagaaca caacatagga atgcaacatt aatgtatcaa taattcggaa 15600
catatgcact atatcatatc tcaattacgg aacatatcag cacacaattg cccattatac 15660
gc 15662
<210> 23
<211> 15866
<212> DNA
<213> 人工序列
<220>
<223> FrankenpEVL_SCL R Talen
<400> 23
gcgtataatg gactattgtg tgctgataag gagaacataa gcgcagaaca atatgtatct 60
attccggtgt tgtgttcctt tgttattctg ctattatgtt ctcttatagt gtgacgaaag 120
cagcataatt aatcgccact tgttctttga ttgtgttacg atatccagag acttagaaac 180
gggggaaccg ggatgagcaa ggtaaaaatc ggtgagttga tcaacacgct tgtgaatgag 240
gtagaggcaa ttgatgcctc agaccgccca caaggcgaca aaacgaagag aattaaagcc 300
gcagccgcac ggtataagaa cgcgttattt aatgataaaa gaaagttccg tgggaaagga 360
ttgcagaaaa gaataaccgc gaatactttt aacgcctata tgagcagggc aagaaagcgg 420
tttgatgata aattacatca tagctttgat aaaaatatta ataaattatc ggaaaagtat 480
cctctttaca gcgaagaatt atcttcatgg ctttctatgc ctacggctaa tattcgccag 540
cacatgtcat cgttacaatc taaattgaaa gaaataatgc cgcttgccga agagttatca 600
aatgtaagaa taggctctaa aggcagtgat gcaaaaatag caagactaat aaaaaaatat 660
ccagattgga gttttgctct tagtgattta aacagtgatg attggaagga gcgccgtgac 720
tatctttata agttattcca acaaggctct gcgttgttag aagaactaca ccagctcaag 780
gtcaaccatg aggttctgta ccatctgcag ctaagccctg cggagcgtac atctatacag 840
caacgatggg ccgatgttct gcgcgagaag aagcgtaatg ttgtggttat tgactaccca 900
acatacatgc agtctatcta tgatattttg aataatcctg cgactttatt tagtttaaac 960
actcgttctg gaatggcacc tttggccttt gctctggctg cggtatcagg gcgaagaatg 1020
attgagataa tgtttcaggg tgaatttgcc gtttcaggaa agtatacggt taatttctca 1080
gggcaagcta aaaaacgctc tgaagataaa agcgtaacca gaacgattta tactttatgc 1140
gaagcaaaat tattcgttga attattaaca gaattgcgtt cttgctctgc tgcatctgat 1200
ttcgatgagg ttgttaaagg atatggaaag gatgatacaa ggtctgagaa cggcaggata 1260
aatgctattt tagcaaaagc atttaaccct tgggttaaat catttttcgg cgatgaccgt 1320
cgtgtttata aagatagccg cgctatttac gctcgcatcg cttatgagat gttcttccgc 1380
gtcgatccac ggtggaaaaa cgtcgacgag gatgtgttct tcatggagat tctcggacac 1440
gacgatgaga acacccagct gcactataag cagttcaagc tggccaactt ctccagaacc 1500
tggcgacctg aagttgggga tgaaaacacc aggctggtgg ctctgcagaa actggacgat 1560
gaaatgccag gctttgccag aggtgacgct ggcgtccgtc tgcatgaaac cgttaagcag 1620
ctggtggagc aggacccatc agcaaaaata accaacagca ctctccgggc ctttaaattt 1680
agcccgacga tgattagccg gtacctggag tttgccgctg atgcattggg gcagttcgtt 1740
ggcgagaacg ggcagtggca gctgaagata gagacacctg caatcgtcct gcctgatgaa 1800
gaatccgttg aaaccatcga cgaaccggat gatgagtccc aagacgacga gctggatgaa 1860
gatgaaattg agctcgacga gggtggcggc gatgaaccaa ccgaagagga agggccagaa 1920
gaacatcagc caactgctct aaaacccgtc ttcaagcctg caaaaaataa cggggacgga 1980
acgtacaaga tagagtttga atacgatgga aagcattatg cctggtccgg ccccgccgat 2040
agccctatgg ccgcaatgcg atccgcatgg gaaacgtact acagctaaaa gaaaagccac 2100
cggtgttaat cggtggcttt tttattgagg cctgtcccta cccatcccct gcaagggacg 2160
gaaggattag gcggaaactg cagctgcaac tacggacatc gccgtcccga ctgcagggac 2220
ttccccgcgt aaagcggggc ttaaattcgg gctggccaac cctatttttc tgcaatcgct 2280
ggcgatgtta gtttcgtgga tagcgtttcc agcttttcaa tggccagctc aaaatgtgct 2340
ggcagcacct tctccagttc cgtatcaata tcggtgatcg gcagctctcc acaagacata 2400
ctccggcgac cgccacgaac tacatcgcgc agcagctccc gttcgtagac acgcatgttg 2460
cccagagccg tttctgcagc cgttaatatc cggcgcagct cggcgatgat tgccgggaga 2520
tcatccacgg ttattgggtt cggtgatggg ttcctgcagg cgcggcggag agccatccag 2580
acgccgctaa cccatgcgtt acggtactga aaactttgtg ctatgtcgtt tatcaggccc 2640
cgaagttctt ctttctgccg ccagtccagt ggttcaccgg cgttcttagg ctcaggctcg 2700
acaaaagcat actcgccgtt tttccggata gctggcagaa cctcgttcgt cacccacttg 2760
cggaaccgcc aggctgtcgt cccctgtttc accgcgtcgc ggcagcggag gattatggtg 2820
tagaggccag attccgatac cacatttact tccctggcca tccgatcaag tttttgtgcc 2880
tcggttaaac cgagggtcaa tttttcatca tgatccagct tacgcaatgc atcagaaggg 2940
ttggctatat tcaatgcagc acagatatcc agcgccacaa accacgggtc accaccgaca 3000
agaaccaccc gtatagggtg gctttcctga aatgaaaaga cggagagagc cttcattgcg 3060
cctccccgga tttcagctgc tcagaaaggg acagggagca gccgcgagct tcctgcgtga 3120
gttcgcgcgc gacctgcaga agttccgcag cttcctgcaa atacagcgtg gcctcataac 3180
tggagatagt gcggtgagca gagcccacaa gcgcttcaac ctgcagcagg cgttcctcaa 3240
tcgtcttcag caggccctgg gcgtttaact gaatctggtt catgcgatca cctcgctgac 3300
cgggatacgg gctgacagaa cgaggacaaa acggctggcg aactggcgac gagcttctcg 3360
ctcggatgat gcagtggtgg aaaggcggtg gatatgggat tttttgtccg tgcggacgac 3420
agctgcaaat ttgaatttga acatggtatg cattcctatc ttgtataggg tgctaccacc 3480
agagttgaga atctctatag gggtggtagc ccagacaggg ttctcaacac cggtacaaga 3540
agaaaccggc ccaaccgaag ttggccccat ctgagccacc ataattcagg tatgcgcaga 3600
tttaacacac aaaaaaacac gctggcgcgt gttgtgcgct tcttgtcatt cggggttgag 3660
aggcccggct gcagattttg ctgcagcggg gtaactctac cgccaaagca gaacgcacgt 3720
caataattta ggtggatatt ttaccccgtg accagtcacg tgcacaggtg tttttatagt 3780
ttgctttact gactgatcag aacctgatca gttattggag tccggtaatc ttattgatga 3840
ccgcagccac cttagatgtt gtctcaaacc ccatacggcc acgaatgagc cactggaacg 3900
gaatagtcag caggtacagc ggaacgaacc acaaacggtt cagacgctgc cagaacgtcg 3960
catcacgacg ttccatccat tcggtattgt cgacgacctg gtaagcgtat tgtcctggcg 4020
tttttgctgc ttccgagtag caatcctctt caccacaaag aaagttactt atctgcttcc 4080
agttttcgaa cccttcttct ttgagccgct tttccagctc attcctccac aaaacaggca 4140
cccatcctct gcgataaatc atgattattt gtcctttaaa taaggctgta gaactgcaaa 4200
atcgctctcg ttcacatgct gtacgtagat gcgtagcaaa ttgccgttcc atccctgtaa 4260
tccaccttct ttggaaagat cgtccttgac ctcacgaaga actttatcca atagccctgc 4320
ggcacaagaa attgcctgct ctggatcagc aaattcatat tgattaatag gtgattgcca 4380
cacaccaaaa acaggaatca tcttttcggc taaacgcctc tcctgttctt tcttaatctc 4440
aagttgtaag cggaccagct caccatccat cattttttgt agatcatgcg ccactattca 4500
cccccactgg ccatcagcaa ataaagcttc atactcggac accggcaggc ggcttccacg 4560
gattgaaagg tcaagccaac cacgtccaga tgggtcagcc ttatccgatt cttcccaccg 4620
ttctgcagct gtagcaacca ggcattctac cgccttcatg tagtcttctg tacggaacca 4680
gccgtagtta atgccaccat cagtaactgc ccaggccatc tttttctctt cggcctcaat 4740
agcccggatg cggttatcgc acagctcgcg acagtacttc agctgttcgt aatccagttg 4800
cttcaggaac tctggtgtcg acgtcatagt ggcttcacct tataggcttt tagaagcgcc 4860
ctggcttcgt ctgtgtggtc ttccatgctc ttatcgctgg caatgcagca ataaactccc 4920
tcactatctg agaacccgtt catccgaatg atcgtgaatg gaagttcccg gccagtttta 4980
taatcgctat agcttgtcgc gtcgtggctg accttgacca cataagggtc gtagccctcc 5040
acgatgacaa ggcattcccg ttgttttccc attacccctc cggttatatc gccacggctt 5100
gccgctggct tagaaacgct ttcagcagcc ttatttcgcg tactgatagc aggtccataa 5160
attcggtcat gtacagcgag gcgaacgttc tcgcgatgct ggccactggc cacaggcgta 5220
ccgcctccat ttcggttgct ggcaacgcgt tctccgccca cgcctccggt accgccaccg 5280
ggatagcctc cagtgcctgg ataattactg attgtggggc gtccggaacg tgctctgttt 5340
tggatcgagg gttaccatgt atatctatat ttagatccaa atcgcgatcc acttcgatgg 5400
tggttttttc caccttacgt gcgtgaattg ataaaccggc ctcgcggcgc ttctccacga 5460
tattcatgag gaactcgacc gagtccgggt caatggaacg catcgtgggg cgtgcatcgc 5520
catctctggc gcgtctggtc ttactggata gccccataga ctccaggatg cctatgcaga 5580
ggtctgcagg cgctttcttc ttgcctttct ctgtgttgaa gccgccgatg cgtaaaacgt 5640
tgtttagcag atcgcgccgt tccggcgtga gcaggttatc tctggcgcgt ttgagggcgt 5700
ccatgtctgc ttcaccttcc agggtttttg gatcgatacc gcagtcgcgg aagtactgct 5760
gcagcgtcgc cgatttgagg gtgtagaaac cacgcatgcc tatctcaaca gcaggggtcg 5820
atttcactcg gtaatcggtt atggccggga atttagcctg gaactctgcg tcggcctgtt 5880
cccgcgtcat ggccgtagtg acgaactgct gccatcttcc ggcaacgcga taagcgtagg 5940
taaagtgaat caacgcttct tcacggtcaa ggcgacgggc ggttatctca tccagctgca 6000
tggtttcaaa caggcgcact tttttcaggc cgccgtcgaa atagaatttt aacgccacct 6060
cgtcgacatc cagctgcagc tccttttcga tgtcccagcg gaccagctgg gcctgctcat 6120
ccagggacag ggtgcgtttt tttatcaact catcgtgttc ggcctggtca ggagtatcga 6180
cactcaggtg gcgctccata agctgctcaa agaccagttc acgggcttct ttacgtaaat 6240
ccttaccgat gctgtttgca agcgcgtcgg tggccatagg cgcgacctga tagccatcat 6300
catgcatgat gcaaatcatg ttgctggcat aatcatttct ggccgatgcc tcgagcgcgg 6360
cggctttaat tttgagctgc atgaatgaag agttagccac gccgagtgaa attcggtcac 6420
cgtcaaagac aacgtctgtc agcagcccgg agtggccagc cgtttcgagc aaggcctgcg 6480
cgtaggcgcg tttgattttt tccggatcgg tttcacgttt accgcgaagc ttgtcgaaac 6540
cgataatgta ttcctgagct gtacggtcgc ggcgcagcat ctggatggcg tcgctgggga 6600
ccacttcgcc gcagaacatg ccgaaatggc ggtggaagtg tttctcctca atcgatacac 6660
ctgaagatat cgacgggctg tagatgaggc cgtcatattt tttcaccatc actttaggct 6720
ggttggtgaa atcgtcgact tccttctcct gtttgttttt ctggttaacg cagagaaact 6780
ttttgtcagg gaactgtagt ctcagctgca tggtaacgtc ttcggcgaac gtcgaactgt 6840
cggtggccag catgattcgt tcgccgcgtt gcactgcagc gataacctcg gtcatgatcc 6900
gatttttctc ggtataaaat acgcggatag gcttgttggt ttcgcggttg cgaacgtcga 6960
ccgggagttc aatcacgtga atttgcagcc aggcaggtag gcccagctcc tcgcgtcgct 7020
tcatcgccag ttcagccagg tcaacaagca gatcgttggc atcggcatcc accataatgg 7080
catgctcttc agtacgcgcc agcgcgtcga taagcgtgtt gaatacgcct accgggtttt 7140
ccatcgcacg cccggccaga atggcacgca ggccctgtgt tgcttcatcg aagccgaaga 7200
agtcatgctg gcgcatcagc ggttgccagc agcctttaag tatggagttg atgcaaatag 7260
tcagcttgtt ggcatatggc gccatttcct gatagccggg atcctgataa tgcagaatgt 7320
cggctttcgc gcctttccct tcggtcatca tttcatgcag gccgcctatc agggatacgc 7380
ggtgcgcgac ggaaacgcca cgcgtggact gcagcatcag tggacgcagg aggcctgtcg 7440
atttacccga ccccatcccg gcgcggacaa taacgatgcc ctgcagctgt gcggcgtatg 7500
tcatcacctc atcggtcatc ctggaggttt caaaccgttt gtaagtgatg tgtgacgggc 7560
gaaggttcgg gttggtgatg cgttcactga acgaacgtga tgtttgcgcg gcacggcatt 7620
tgcgattcaa ccggcgcgta atgtgatctt taacggtacc gttataaatt tctgcgatac 7680
ccatatcccg cagcgtgctg ctgaaaaggc gcataagttc tttcgggctg tttggtaccg 7740
ggcatgtcag catgccaata tcaacggcgc gaagcagttc tttggcaaaa gtgcgtctgt 7800
tcagacgcgg gagagtacgc agcttattca gcgtgatcga caacagatcg gttgcacggc 7860
tcagatgatt tctcgttaac tggcgagcga cttccttcag ccctctcagg ctgtgcaggt 7920
cgttaaaatc gctgcattcc agctcagggt catcctcaaa agttgggtaa acacatttga 7980
cgccggaaaa cttctccatg atgtcgaatc cggtgcggag gcctgtgttg ccttttcctt 8040
cagctgagga tttgcggtcg ttatcgagag cgcaagtgat ttgcgcagcc gggtacatgt 8100
tcaccagctg ctcgacaacg tgaatcatgt tgttagcgga aaccgcaatg actaccgcgt 8160
caaagcgttt tttcgggtcg tttctggtcg ccagccagat ggatgccccg gtggcgaaac 8220
cctctgcagt cgcaattttt tgcgccccct gcaggtcgcc aataacaaag catgcaccga 8280
cgaaatcacc gttagtgatg gcgctggtct ggaacttgcc accattcaga tcgatacgtt 8340
gccagccaac aatccgcccg tcttttcttc cgtccaggtg ggacagaggt atcgccatgt 8400
aagttgttgg tccacggctc catttcgcac tgtcgtgact ggtcacgcga cgtatatcac 8460
aagcgccaaa tacgtcacga attccctttt ttaccgcata aggccaggag ccatcttcag 8520
ctggcgaatg ttcccaggcg cgatggaaag ccaaccatcc aagcaggcgt tcctgctcca 8580
tctgattgtt ttttaaatca ttaacgcgtt gttgttcagc tcggaggcgg cgtgcttcag 8640
cctggcgctc catgcgtgca cgttcttctt ccggctgagc gaccacggtc gcaccattcc 8700
gttgctgttc acggcgatac tccgaaaaca ggaatgaaaa gccactccag gagccagcgt 8760
catgcgcttt ttcaacgaag ttaacgaaag gataactgat gccatccttg ctctgctcaa 8820
ggcgtgaata gatttccaca cggcctttaa ggctcttctg cagagcttcc ggggaggaat 8880
tattgtaggt ggtatagcgc tctacaccac cgcgcggatt gagctgaatc ttatcagcac 8940
acgcaggcca gttgataccg gccatcttcg ccagctcagt cagctcatca cgtgccgcgt 9000
caagcagtga aaacggatcg ctgccaaagc gctccgcgta gaattcttgt aaggtcattt 9060
tttagccttt ccatgcgaat tagcattttt tcgggttgaa aaaatccgca ggagcagcca 9120
caataaacgc actatctttc tgaaggacgt atctgcgtta tcgtggctac ttcctgaaaa 9180
aggcccgagt ttgccgactc ggtttttttt tcgtcttttt tcggctgcta cggtctggtt 9240
caaccccgac aaagtataga tcggattaaa ccagaattat agtcagcaat aaaccctgtt 9300
attgtatcat ctaccctcaa ccatgaacga tttgatcgta ccgactactt ggtgcacaaa 9360
ttgaagatca cttttatcat ggataacccg ttgagagtta gcactatcaa ggtagtaatg 9420
ctgctcgtca taacgggcta atcgttgaat tgtgatctcg ccgttattat cacaaaccag 9480
tacatcctca cccggtacaa gcgtaagtga agaatcgacc aggataacat ctcccggctg 9540
gtagtttcgc tgaatctggt tcccgaccgt cagtgcgtaa acggtgttcc gttgactcac 9600
gaacggcagg aatcgctctg tgttggcagg ttctccaggc tgccagtctc tatccggtcc 9660
tgtctctgtc gtaccaataa caggaacgcg gtctggatca gattcagtgc catacagtat 9720
ccattgcacg ggcttacgca ggcattttgc cagcgatagc ccgatctcca gcgacggcat 9780
cacgtcgcca cgttctaagt tttggacgcc cggaagagag attcctacag cttctgccac 9840
ttgcttcagc gtcagtttca gctctaaacg gcgtgctttc agtcgttcgc ctcgtgtttt 9900
cataccctta atcataaatg atctctttat agctggctat aatttttata aattatacct 9960
agctttaatt ttcacttatt gattataata atccccatga aacccgaaga acttgtgcgc 10020
catttcggcg atgtggaaaa agcagcggtt ggcgtgggcg tgacacccgg cgcagtctat 10080
caatggctgc aagctgggga gattccacct ctacgacaaa gcgatataga ggtccgtacc 10140
gcgtacaaat taaagagtga tttcacctct cagcgcatgg gtaaggaagg gcataacaag 10200
gggatcctct agacgcagaa aggcccaccc gaaggtgagc cagtgtgatt acatttgcgg 10260
cctaactgtg gccagtccag ttacgctgga gtcactagtg cggccgcgac aacttgtcta 10320
gggcccaatg gcccatacac ttagtgtaat acgactcact atagggagag cggccgcttt 10380
ttcagcaaga ttaagccgcc accatggcgc cgcggcctcc taagaagaag cggaaagtcg 10440
aattcgtgga tctgcgaaca ctgggctata gccagcagca gcaggagaag atcaaaccca 10500
aggtgaggtc cacagtcgca cagcaccatg aagccctggt gggccacggg ttcactcacg 10560
ctcatattgt cgcactgtct cagcatccag ccgctctggg aaccgtggca gtcacatacc 10620
agcacatcat tactgccctg cccgaggcta cccatgaaga catcgtggga gtcggcaaac 10680
agtggagcgg cgcacgggcc ctggaggctc tgctgaccga cgcaggggaa ctgagaggac 10740
cccctctgca gctggataca gggcagctgg tgaagattgc taagagggga ggggtgacag 10800
caatggaagc cgtccacgca agcaggaacg cactgacagg ggcccccctg aacctgaccc 10860
cggaccaagt ggtggctatc gccagcaacg gtggcggcaa gcaagcgctc gaaacggtgc 10920
agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa gtggtggcta 10980
tcgccagcaa ccacggcggc aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc 11040
tgtgccagga ccatggcctg actccggacc aagtggtggc tatcgccagc cacgatggcg 11100
gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag gaccatggcc 11160
tgactccgga ccaagtggtg gctatcgcca gccacgatgg cggcaagcaa gcgctcgaaa 11220
cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgactccg gaccaagtgg 11280
tggctatcgc cagccacgat ggcggcaagc aagcgctcga aacggtgcag cggctgttgc 11340
cggtgctgtg ccaggaccat ggcctgactc cggaccaagt ggtggctatc gccagccacg 11400
atggtggaaa acaggccctt gaaacggtgc agcggctgtt gccggtgctg tgccaggacc 11460
atggcctgac cccggaccaa gtggtggcta tcgccagcaa cattggcggc aagcaagcgc 11520
tcgaaacggt gcagcggctg ttgccggtgc tgtgccagga ccatggcctg actccggacc 11580
aagtggtggc tatcgccagc cacgatggcg gcaagcaagc gctcgaaacg gtgcagcggc 11640
tgttgccggt gctgtgccag gaccatggcc tgaccccgga ccaagtggtg gctatcgcca 11700
gcaacattgg cggcaagcaa gcgctcgaaa cggtgcagcg gctgttgccg gtgctgtgcc 11760
aggaccatgg cctgaccccg gaccaagtgg tggctatcgc cagcaaccac ggcggcaagc 11820
aagcgctcga aacggtgcag cggctgttgc cggtgctgtg ccaggaccat ggcctgaccc 11880
cggaccaagt ggtggctatc gccagcaacc acggcggcaa gcaagcgctc gaaacggtgc 11940
agcggctgtt gccggtgctg tgccaggacc atggcctgac cccggaccaa gtggtggcta 12000
tcgccagcaa ccacggcggc aagcaagcgc tcgaaacggt gcagcggctg ttgccggtgc 12060
tgtgccagga ccatggcctg actccggacc aagtggtggc tatcgccagc cacgatggcg 12120
gcaagcaagc gctcgaaacg gtgcagcggc tgttgccggt gctgtgccag gaccatggcc 12180
tgaccccgga ccaagtggtg gctatcgcca gcaacattgg cggcaagcaa gcgctcgaaa 12240
cggtgcagcg gctgttgccg gtgctgtgcc aggaccatgg cctgaccccg gaccaagtgg 12300
tggctatcgc cagcaaccac ggcggcaagc aagcgctcga aacggtgcag cggctgttgc 12360
cggtgctgtg ccaggaccat ggcctgaccc cggaccaagt ggtggctatc gccagcaacg 12420
gtggcggcaa gcaagcgctc gaaacggtgc agcggctgtt gccggtgctg tgccaggacc 12480
atggcctgac cccggaccaa gtggtggcta tcgccagcaa cattggcggc aagcaagcgc 12540
tcgaaagcat tgtggcccag ctgagccggc ctgatccggc gttggccgcg ttgaccaacg 12600
accacctggt cgctctggct tgcctgggag gacgccctgc tatggacgct gtgaagaaag 12660
gactgcccca cgcacccgaa ctgattagac gggtgaaccg gagaatcggc gagagaacat 12720
cccatagggt ggcaatctct agaactcagc tggtcaagag tgaactggag gaaaagaaat 12780
cagagctgcg ccacaagctg aaatacgtgc ctcatgagta tatcgaactg atcgagattg 12840
ctcgcaattc aacccaggac cggatcctgg aaatgaaagt gatggagttc tttatgaaag 12900
tctacggata tcgggggaaa cacctgggag ggagcagaaa gccagatggg gccatctaca 12960
cagtgggatc ccccatcgac tatggcgtga ttgtcgatac taaagcctac agcggaggct 13020
ataacctgcc tatcggccag gctgacgaga tgcagagata cgtggaggaa aaccagaccc 13080
gcaataagca tattaacccc aatgaatggt ggaaagtgta tcctagctcc gtcacagagt 13140
tcaagtttct gttcgtgagc ggacacttta agggcaacta caaagcacag ctgactaggc 13200
tgaatcatat caccaactgc aatggagccg tgctgtctgt cgaggaactg ctgatcgggg 13260
gagagatgat taaggctggc acactgactc tggaggaagt gaggcgcaag ttcaacaatg 13320
gggaaatcaa cttctaacct gcaggatgat aagctagccc cgggcgtacg gaaaaaaaaa 13380
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13500
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13560
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13620
aaaaaaaaaa aaaaaacgag accttagggc cattagactt gaagtcaagc ggccgcttac 13680
aactggacct tgctggtaca tagaactgat taactgacca tttaaatcat accaacatgg 13740
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttaatc tgatcggcac 13800
gtaagaggtt ccaactttca ccataatgaa ataagatcac taccgggcgt attttgagtt 13860
atcgagattt tcaggagcta aggaagctaa aatgagccat attcaacggg aaacgtcttg 13920
ctcgaggccg cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg 13980
cgataatgtc gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc 14040
agagttgttt ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt 14100
caggctaaac tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac 14160
tcctgatgat gcatggttac tcaccactgc gatcccaggg aaaacagcat tccaggtatt 14220
agaagaatat cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg 14280
gttgcattcg attcctgttt gtaattgtcc ttttaacggc gatcgcgtat ttcgtctggc 14340
tcaggcgcaa tcacgaatga ataacggttt ggttggtgcg agtgattttg atgacgagcg 14400
taatggctgg cctgttgaac aagtctggaa agaaatgcat aaacttttgc cattctcacc 14460
ggattcagtc gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa 14520
attaataggt tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc 14580
catcctatgg aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa 14640
atatggtatt gataatcctg atatgaataa attgcagttt cacttgatgc tcgatgagtt 14700
tttctaacct aggtgacaga agtcaaaagc ctccggtcgg aggcttttga ctttctgcta 14760
gatctgtttc aatgcggtga agggccaggc agctggggat tatgtccaga cccggccagc 14820
atgttggttt tatcgcatat tcagcgttgt cgcgtttacc caggtaaaat ggaagcagtg 14880
tatcgtctgc gtgaatgtgc aaatcaggaa cgtaaccgtg gtacatagat gcagtccctt 14940
gcgggtcgtt cccttcaacg agtaggacgc ggtgcccttg caaggctaac cattgcgcct 15000
ggtgtactgc agatgaggtt ttataaaccc ctcccttgtg tgacataacg gaaagtacaa 15060
ccgggttttt atcgtcaggt ctttggtttg ggttaccaaa cacactccgc atatggctaa 15120
tttggtcaat tgtgtagcca gcgcgacgtt ctactcggcc cctcatctca aaatcaggag 15180
ccggtagacg accagctttt tccgcatctc tgatagcctg cggtgttacg ccgatcaggt 15240
ctgcaacttc tgttataccc cagcggcgag taatacgacg cgcttccggg ctgtcatcgc 15300
cgaactgtgc gatggcaata gcgcgcgtca tttcctgacc gcgattgata cagtctttca 15360
gcaaattaat taacgacatc ctgtttcctc tcaaacatgc ccttatcttt gtgtttttca 15420
tcatacttta cgtttttaaa gcaaagcaac ataaaaaaag caaagtgact tagaaaacgc 15480
aaagttaagg ttcaaatcaa ttttttgatg cgctacagaa gctatttagc ttcatctaag 15540
cgcaacggta ttacttacgt tggtatattt aaaacctaac ttaatgattt taaatgataa 15600
taaatcatac caattgctat caaaagttaa gcgaacatgc tgattttcac gctgtttata 15660
cactttgagg catctctatc tcttctgtct ctatattgaa acacaatcaa agaacatcaa 15720
tccatgtgac atcccccact atctaagaac accataacag aacacaacat aggaatgcaa 15780
cattaatgta tcaataattc ggaacatatg cactatatca tatctcaatt acggaacata 15840
tcagcacaca attgcccatt atacgc 15866
<210> 24
<211> 7365
<212> DNA
<213> 人工序列
<220>
<223> 模板1242
<400> 24
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctagtgcatc aacttcttat ttgtgtaata agaaaattgg gaaaacgatc ttcaatatgc 240
ttaccaagct gtgattccaa atattacgta aatacacttg caaaggagga tgtttttagt 300
agcaatttgt actgatggta tggggccaag agatatatct tagagggagg gctgagggtt 360
tgaagtccaa ctcctaagcc agtgccagaa gagccaagga caggtacggc tgtcatcact 420
tagacctcac cctgtggagc cacaccctag ggttggccaa tctactccca ggagcaggga 480
gggcaggagc cagggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540
ttctgacaca actgtgttca ctagcaacct caaacagaca ccaggtgagt taaacccatg 600
agagagaata acagaactgc gagtgatggg ccagttaagc gtagatggct aattagttca 660
gacaaatgta aaatgccaac accgtctgta aagaaaccta actgatcctc ttcctttgtc 720
ctgtcttctt cacaggccgc caccatggtc catcttacac cggaggagaa gtccgctgta 780
acggcactgt gggggaaagt taatgtcgat gaagtcggcg gtgaagcact cggcaggttg 840
ctggtagtgt acccgtggac acaacgattc tttgaaagtt tcggggacct gtccacaccc 900
gatgctgtga tgggtaatcc aaaagtaaaa gcacacggca agaaagtcct cggcgcgttt 960
agtgatggtc tggcccattt ggataacttg aagggtacat tcgcgcagct ttccgaactc 1020
cactgtgaca agttgcacgt agatccagaa aacttccggc ttctgggcaa tgtgcttgta 1080
tgcgttctgg ctcaccattt tgggaaggag tttaccccac ccgtgcaagc ggcttaccaa 1140
aaagtggtcg caggagtggc taatgccctt gcacataaat atcactaagg taccgagcat 1200
cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat 1260
gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt 1320
tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt 1380
cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat 1440
gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct 1500
tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag 1560
gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc 1620
cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc 1680
ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct 1740
aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct 1800
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 1860
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 1920
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 1980
gatgcggtgg gctctatggc ccgcgggaac agagaaacag gagaatatgg gccaaacagg 2040
atatctgtgg taagcagttc ctgccccggc tcagggccaa gaacagttgg aacagcagaa 2100
tatgggccaa acaggatatc tgtggtaagc agttcctgcc ccggctcagg gccaagaaca 2160
gatggtcccc agatgcggtc ccgccctcag cagtttctag agaaccatca gatgtttcca 2220
gggtgcccca aggacctgaa atgaccctgt gccttatttg aactaaccaa tcagttcgct 2280
tctcgcttct gttcgcgcgc ttctgctccc cgagctctat ataagcagag ctcgtttagt 2340
gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacttccata gaaggcggcc 2400
gcgccgccac catggtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg 2460
tcgagctgga cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg 2520
atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag ctgcccgtgc 2580
cctggcccac cctcgtgacc accctgacct acggcgtgca gtgcttcagc cgctaccccg 2640
accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc 2700
gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg 2760
gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca 2820
tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc atggccgaca 2880
agcagaagaa cggcatcaag gtgaacttca agatccgcca caacatcgag gacggcagcg 2940
tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc 3000
ccgacaacca ctacctgagc acccagtccg ccctgagcaa agaccccaac gagaagcgcg 3060
atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc 3120
tgtacaaggg aagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg 3180
agaaccctgg acctacctgc aggcctgaga acttcagggt gagtctatgg gacgcttgat 3240
gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg ataagtaaca 3300
gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 3360
gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 3420
tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3480
acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3540
cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3600
tttgtcgacg tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg 3660
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 3720
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgccagctg 3780
gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 3840
cgaatggcga ttccgttgca atggctggcg gtaatattgt tctggatatt accagcaagg 3900
ccgatagttt gagttcttct actcaggcaa gtgatgttat tactaatcaa agaagtattg 3960
cgacaacggt taatttgcgt gatggacaga ctcttttact cggtggcctc actgattata 4020
aaaacacttc tcaggattct ggcgtaccgt tcctgtctaa aatcccttta atcggcctcc 4080
tgtttagctc ccgctctgat tctaacgagg aaagcacgtt atacgtgctc gtcaaagcaa 4140
ccatagtacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 4200
gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 4260
ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc 4320
cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 4380
agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 4440
aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 4500
gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa 4560
aaatttaacg cgaattttaa caaaatatta acgtttacaa tttaaatatt tgcttataca 4620
atcttcctgt ttttggggct tttctgatta tcaaccgggg tacatatgat tgacatgcta 4680
gttttacgat taccgttcat cgattctctt gtttgctcca gactctcagg caatgacctg 4740
atagcctttg tagagacctc tcaaaaatag ctaccctctc cggcatgaat ttatcagcta 4800
gaacggttga atatcatatt gatggtgatt tgactgtctc cggcctttct cacccgtttg 4860
aatctttacc tacacattac tcaggcattg catttaaaat atatgagggt tctaaaaatt 4920
tttatccttg cgttgaaata aaggcttctc ccgcaaaagt attacagggt cataatgttt 4980
ttggtacaac cgatttagct ttatgctctg aggctttatt gcttaatttt gctaattctt 5040
tgccttgcct gtatgattta ttggatgttg gaatcgcctg atgcggtatt ttctccttac 5100
gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct gctctgatgc 5160
cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct gacgggcttg 5220
tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct gcatgtgtca 5280
gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt 5340
tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca cttttcgggg 5400
aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct 5460
catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat 5520
tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc 5580
tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg 5640
ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg 5700
ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga 5760
cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta 5820
ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc 5880
tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc 5940
gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg 6000
ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc 6060
aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca 6120
acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct 6180
tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat 6240
cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg 6300
gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat 6360
taagcattgg taactgtcag accaagttta ctcatatata ctttagattg atttaaaact 6420
tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat 6480
cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc 6540
ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct 6600
accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg 6660
cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca 6720
cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc 6780
tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga 6840
taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac 6900
gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga 6960
agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag 7020
ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg 7080
acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag 7140
caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc 7200
tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc 7260
tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc 7320
aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatg 7365
<210> 25
<211> 8087
<212> DNA
<213> 人工序列
<220>
<223> 模板1243
<400> 25
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctagtgcatc aacttcttat ttgtgtaata agaaaattgg gaaaacgatc ttcaatatgc 240
ttaccaagct gtgattccaa atattacgta aatacacttg caaaggagga tgtttttagt 300
agcaatttgt actgatggta tggggccaag agatatatct tagagggagg gctgagggtt 360
tgaagtccaa ctcctaagcc agtgccagaa gagccaagga caggtacggc tgtcatcact 420
tagacctcac cctgtggagc cacaccctag ggttggccaa tctactccca ggagcaggga 480
gggcaggagc cagggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540
ttctgacaca actgtgttca ctagcaacct caaacagaca ccaggtgagt taaacccatg 600
agagagaata acagaactgc gagtgatggg ccagttaagc gtagatggct aattagttca 660
gacaaatgta aaatgccaac accgtctgta aagaaaccta actgatcctc ttcctttgtc 720
ctgtcttctt cacaggccgc caccatggtc catcttacac cggaggagaa gtccgctgta 780
acggcactgt gggggaaagt taatgtcgat gaagtcggcg gtgaagcact cggcaggttg 840
ctggtagtgt acccgtggac acaacgattc tttgaaagtt tcggggacct gtccacaccc 900
gatgctgtga tgggtaatcc aaaagtaaaa gcacacggca agaaagtcct cggcgcgttt 960
agtgatggtc tggcccattt ggataacttg aagggtacat tcgcgcagct ttccgaactc 1020
cactgtgaca agttgcacgt agatccagaa aacttccggc ttctgggcaa tgtgcttgta 1080
tgcgttctgg ctcaccattt tgggaaggag tttaccccac ccgtgcaagc ggcttaccaa 1140
aaagtggtcg caggagtggc taatgccctt gcacataaat atcactaagg taccgagcat 1200
cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat 1260
gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt 1320
tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt 1380
cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat 1440
gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct 1500
tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag 1560
gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc 1620
cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc 1680
ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct 1740
aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct 1800
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 1860
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 1920
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 1980
gatgcggtgg gctctatggc ttaattaacg agatcgagac catcctggct aacacagtga 2040
aaccccgtct ctactaaaaa aatacaaaaa attagccggg cttggtggcg ggtgcctgta 2100
gtcccagcta ctatggaggc tgaggcggga gaatggcgtg aacgcggggg gcggagcttg 2160
cagtgagcag agatcagggg ccactgcact ccagcctggg cgacagagag agactctgtc 2220
tcaaaaaaaa gaaaaaaaaa atttagtaga ctagctaaaa aaatccagag atagttattg 2280
atgcatatgt aaaagtcttc caatatttac aagtacaatg aaaaaaaaat aaccttgaat 2340
taagtgtaga actcattgac aatgtttcaa aggatgtgag ggataaacta aaatttgggc 2400
agtacatgct gttcctgtgt acttggaaca gagggagaaa atctgggctg gaaatattgt 2460
tataggagtt agcacatgaa ggtgacaact aaattatttg gagtagatgg agtcaccagc 2520
acatgtgaat agttttagaa tgaaatgacc caagatagaa ctttggagag cccccaaatt 2580
taaataaaat cagtataaga gaagaggaag aaaccaaatg gtatactagt ctaaattgtt 2640
tcttagtgac aaaagaataa cctgaatatt agattagctg cctatatgct ctctgaatca 2700
atttcattca acatgcaaca gtccgcggga acagagaaac aggagaatat gggccaaaca 2760
ggatatctgt ggtaagcagt tcctgccccg gctcagggcc aagaacagtt ggaacagcag 2820
aatatgggcc aaacaggata tctgtggtaa gcagttcctg ccccggctca gggccaagaa 2880
cagatggtcc ccagatgcgg tcccgccctc agcagtttct agagaaccat cagatgtttc 2940
cagggtgccc caaggacctg aaatgaccct gtgccttatt tgaactaacc aatcagttcg 3000
cttctcgctt ctgttcgcgc gcttctgctc cccgagctct atataagcag agctcgttta 3060
gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacttcca tagaaggcgg 3120
ccgcgccgcc accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 3180
ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 3240
cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt 3300
gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc 3360
cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 3420
gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 3480
gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 3540
catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga 3600
caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag 3660
cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 3720
gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg 3780
cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 3840
gctgtacaag ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga 3900
ggagaaccct ggacctacct gcaggcctga gaacttcagg gtgagtctat gggacgcttg 3960
atgttttctt tccccttctt ttctatggtt aagttcatgt cataggaagg ggataagtaa 4020
cagggtacag tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga 4080
tcgttttagt ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc 4140
tttctttttt tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta 4200
taacaaaagg aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc 4260
tgcctagtac attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct 4320
actttgtcga cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag 4380
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 4440
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgccagc 4500
tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 4560
ggcgaatggc gattccgttg caatggctgg cggtaatatt gttctggata ttaccagcaa 4620
ggccgatagt ttgagttctt ctactcaggc aagtgatgtt attactaatc aaagaagtat 4680
tgcgacaacg gttaatttgc gtgatggaca gactctttta ctcggtggcc tcactgatta 4740
taaaaacact tctcaggatt ctggcgtacc gttcctgtct aaaatccctt taatcggcct 4800
cctgtttagc tcccgctctg attctaacga ggaaagcacg ttatacgtgc tcgtcaaagc 4860
aaccatagta cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 4920
gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 4980
ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt 5040
tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 5100
gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 5160
ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 5220
ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 5280
aaaaatttaa cgcgaatttt aacaaaatat taacgtttac aatttaaata tttgcttata 5340
caatcttcct gtttttgggg cttttctgat tatcaaccgg ggtacatatg attgacatgc 5400
tagttttacg attaccgttc atcgattctc ttgtttgctc cagactctca ggcaatgacc 5460
tgatagcctt tgtagagacc tctcaaaaat agctaccctc tccggcatga atttatcagc 5520
tagaacggtt gaatatcata ttgatggtga tttgactgtc tccggccttt ctcacccgtt 5580
tgaatcttta cctacacatt actcaggcat tgcatttaaa atatatgagg gttctaaaaa 5640
tttttatcct tgcgttgaaa taaaggcttc tcccgcaaaa gtattacagg gtcataatgt 5700
ttttggtaca accgatttag ctttatgctc tgaggcttta ttgcttaatt ttgctaattc 5760
tttgccttgc ctgtatgatt tattggatgt tggaatcgcc tgatgcggta ttttctcctt 5820
acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat 5880
gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 5940
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 6000
cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta 6060
tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg 6120
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 6180
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 6240
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 6300
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 6360
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 6420
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 6480
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 6540
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 6600
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 6660
ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 6720
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 6780
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 6840
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 6900
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 6960
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 7020
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 7080
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 7140
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 7200
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 7260
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 7320
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 7380
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 7440
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 7500
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 7560
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 7620
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 7680
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 7740
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 7800
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 7860
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 7920
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 7980
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 8040
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatg 8087
<210> 26
<211> 7712
<212> DNA
<213> 人工序列
<220>
<223> 模板1244
<400> 26
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctagtgcatc aacttcttat ttgtgtaata agaaaattgg gaaaacgatc ttcaatatgc 240
ttaccaagct gtgattccaa atattacgta aatacacttg caaaggagga tgtttttagt 300
agcaatttgt actgatggta tggggccaag agatatatct tagagggagg gctgagggtt 360
tgaagtccaa ctcctaagcc agtgccagaa gagccaagga caggtacggc tgtcatcact 420
tagacctcac cctgtggagc cacaccctag ggttggccaa tctactccca ggagcaggga 480
gggcaggagc cagggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540
ttctgacaca actgtgttca ctagcaacct caaacagaca ccaggtgagt taaacccatg 600
agagagaata acagaactgc gagtgatggg ccagttaagc gtagatggct aattagttca 660
gacaaatgta aaatgccaac accgtctgta aagaaaccta actgatcctc ttcctttgtc 720
ctgtcttctt cacaggccgc caccatggtc catcttacac cggaggagaa gtccgctgta 780
acggcactgt gggggaaagt taatgtcgat gaagtcggcg gtgaagcact cggcaggttg 840
ctggtagtgt acccgtggac acaacgattc tttgaaagtt tcggggacct gtccacaccc 900
gatgctgtga tgggtaatcc aaaagtaaaa gcacacggca agaaagtcct cggcgcgttt 960
agtgatggtc tggcccattt ggataacttg aagggtacat tcgcgcagct ttccgaactc 1020
cactgtgaca agttgcacgt agatccagaa aacttccggc ttctgggcaa tgtgcttgta 1080
tgcgttctgg ctcaccattt tgggaaggag tttaccccac ccgtgcaagc ggcttaccaa 1140
aaagtggtcg caggagtggc taatgccctt gcacataaat atcactaagg taccgataat 1200
caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct 1260
tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg 1320
gctttcattt tctcctcctt gtataaatcc tggttagttc ttgccacggc ggaactcatc 1380
gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg 1440
gtgtttattt gtgaaatttg tgatgctatt gctttatttg taaccattct agctttattt 1500
gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta 1560
acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt 1620
aaagcttaat taacgagatc gagaccatcc tggctaacac agtgaaaccc cgtctctact 1680
aaaaaaatac aaaaaattag ccgggcttgg tggcgggtgc ctgtagtccc agctactatg 1740
gaggctgagg cgggagaatg gcgtgaacgc ggggggcgga gcttgcagtg agcagagatc 1800
aggggccact gcactccagc ctgggcgaca gagagagact ctgtctcaaa aaaaagaaaa 1860
aaaaaattta gtagactagc taaaaaaatc cagagatagt tattgatgca tatgtaaaag 1920
tcttccaata tttacaagta caatgaaaaa aaaataacct tgaattaagt gtagaactca 1980
ttgacaatgt ttcaaaggat gtgagggata aactaaaatt tgggcagtac atgctgttcc 2040
tgtgtacttg gaacagaggg agaaaatctg ggctggaaat attgttatag gagttagcac 2100
atgaaggtga caactaaatt atttggagta gatggagtca ccagcacatg tgaatagttt 2160
tagaatgaaa tgacccaaga tagaactttg gagagccccc aaatttaaat aaaatcagta 2220
taagagaaga ggaagaaacc aaatggtata ctagtctaaa ttgtttctta gtgacaaaag 2280
aataacctga atattagatt agctgcctat atgctctctg aatcaatttc attcaacatg 2340
caacagtccg cgggaacaga gaaacaggag aatatgggcc aaacaggata tctgtggtaa 2400
gcagttcctg ccccggctca gggccaagaa cagttggaac agcagaatat gggccaaaca 2460
ggatatctgt ggtaagcagt tcctgccccg gctcagggcc aagaacagat ggtccccaga 2520
tgcggtcccg ccctcagcag tttctagaga accatcagat gtttccaggg tgccccaagg 2580
acctgaaatg accctgtgcc ttatttgaac taaccaatca gttcgcttct cgcttctgtt 2640
cgcgcgcttc tgctccccga gctctatata agcagagctc gtttagtgaa ccgtcagatc 2700
gcctggagac gccatccacg ctgttttgac ttccatagaa ggcggccgcg ccgccaccat 2760
ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 2820
cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg 2880
caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 2940
cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca 3000
gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 3060
caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 3120
gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 3180
gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg 3240
catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga 3300
ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 3360
cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 3420
gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagggaag 3480
cggagctact aacttcagcc tgctgaagca ggctggagac gtggaggaga accctggacc 3540
tacctgcagg cctgagaact tcagggtgag tctatgggac gcttgatgtt ttctttcccc 3600
ttcttttcta tggttaagtt catgtcatag gaaggggata agtaacaggg tacagtttag 3660
aatgggaaac agacgaatga ttgcatcagt gtggaagtct caggatcgtt ttagtttctt 3720
ttatttgctg ttcataacaa ttgttttctt ttgtttaatt cttgctttct ttttttttct 3780
tctccgcaat ttttactatt atacttaatg ccttaacatt gtgtataaca aaaggaaata 3840
tctctgagat acattaagta acttaaaaaa aaactttaca cagtctgcct agtacattac 3900
tatttggaat atatgtgtgc ttatttgcat attcataatc tccctacttt gtcgacgtag 3960
ataagtagca tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca 4020
ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 4080
cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg ccagctggcg taatagcgaa 4140
gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga atggcgattc 4200
cgttgcaatg gctggcggta atattgttct ggatattacc agcaaggccg atagtttgag 4260
ttcttctact caggcaagtg atgttattac taatcaaaga agtattgcga caacggttaa 4320
tttgcgtgat ggacagactc ttttactcgg tggcctcact gattataaaa acacttctca 4380
ggattctggc gtaccgttcc tgtctaaaat ccctttaatc ggcctcctgt ttagctcccg 4440
ctctgattct aacgaggaaa gcacgttata cgtgctcgtc aaagcaacca tagtacgcgc 4500
cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac 4560
ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg 4620
ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt 4680
tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc 4740
cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct 4800
tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga 4860
ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga 4920
attttaacaa aatattaacg tttacaattt aaatatttgc ttatacaatc ttcctgtttt 4980
tggggctttt ctgattatca accggggtac atatgattga catgctagtt ttacgattac 5040
cgttcatcga ttctcttgtt tgctccagac tctcaggcaa tgacctgata gcctttgtag 5100
agacctctca aaaatagcta ccctctccgg catgaattta tcagctagaa cggttgaata 5160
tcatattgat ggtgatttga ctgtctccgg cctttctcac ccgtttgaat ctttacctac 5220
acattactca ggcattgcat ttaaaatata tgagggttct aaaaattttt atccttgcgt 5280
tgaaataaag gcttctcccg caaaagtatt acagggtcat aatgtttttg gtacaaccga 5340
tttagcttta tgctctgagg ctttattgct taattttgct aattctttgc cttgcctgta 5400
tgatttattg gatgttggaa tcgcctgatg cggtattttc tccttacgca tctgtgcggt 5460
atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 5520
cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 5580
tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 5640
tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat 5700
gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga 5760
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 5820
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 5880
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 5940
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 6000
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 6060
agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 6120
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 6180
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 6240
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 6300
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 6360
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 6420
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 6480
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 6540
tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 6600
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 6660
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 6720
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 6780
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 6840
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 6900
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 6960
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 7020
cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 7080
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 7140
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 7200
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 7260
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 7320
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 7380
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 7440
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 7500
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct 7560
gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga 7620
acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat acgcaaaccg 7680
cctctccccg cgcgttggcc gattcattaa tg 7712
<210> 27
<211> 7925
<212> DNA
<213> 人工序列
<220>
<223> 模板1245
<400> 27
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctagtgcatc aacttcttat ttgtgtaata agaaaattgg gaaaacgatc ttcaatatgc 240
ttaccaagct gtgattccaa atattacgta aatacacttg caaaggagga tgtttttagt 300
agcaatttgt actgatggta tggggccaag agatatatct tagagggagg gctgagggtt 360
tgaagtccaa ctcctaagcc agtgccagaa gagccaagga caggtacggc tgtcatcact 420
tagacctcac cctgtggagc cacaccctag ggttggccaa tctactccca ggagcaggga 480
gggcaggagc cagggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540
ttctgacaca actgtgttca ctagcaacct caaacagaca ccatggtcca tcttacaccg 600
gaggagaagt ccgctgtaac ggcactgtgg gggaaagtta atgtcgatga agtcggcggt 660
gaagcactcg gcaggttgct ggtagtgtac ccgtggacac aacgattctt tgaaagtttc 720
ggggacctgt ccacacccga tgctgtgatg ggtaatccaa aagtaaaagc acacggcaag 780
aaagtcctcg gcgcgtttag tgatggtctg gcccatttgg ataacttgaa gggtacattc 840
gcgcagcttt ccgaactcca ctgtgacaag ttgcacgtag atccagaaaa cttccggctt 900
ctgggcaatg tgcttgtatg cgttctggct caccattttg ggaaggagtt taccccaccc 960
gtgcaagcgg cttaccaaaa agtggtcgca ggagtggcta atgcccttgc acataaatat 1020
cactaaggta ccgagcatct taccgccatt tattcccata tttgttctgt ttttcttgat 1080
ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag 1140
ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc 1200
cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg 1260
actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct 1320
ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg 1380
ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct 1440
gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct 1500
gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc 1560
cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct 1620
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1680
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1740
tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 1800
aatagcaggc atgctgggga tgcggtgggc tctatggctt aattaacgag atcgagacca 1860
tcctggctaa cacagtgaaa ccccgtctct actaaaaaaa tacaaaaaat tagccgggct 1920
tggtggcggg tgcctgtagt cccagctact atggaggctg aggcgggaga atggcgtgaa 1980
cgcggggggc ggagcttgca gtgagcagag atcaggggcc actgcactcc agcctgggcg 2040
acagagagag actctgtctc aaaaaaaaga aaaaaaaaat ttagtagact agctaaaaaa 2100
atccagagat agttattgat gcatatgtaa aagtcttcca atatttacaa gtacaatgaa 2160
aaaaaaataa ccttgaatta agtgtagaac tcattgacaa tgtttcaaag gatgtgaggg 2220
ataaactaaa atttgggcag tacatgctgt tcctgtgtac ttggaacaga gggagaaaat 2280
ctgggctgga aatattgtta taggagttag cacatgaagg tgacaactaa attatttgga 2340
gtagatggag tcaccagcac atgtgaatag ttttagaatg aaatgaccca agatagaact 2400
ttggagagcc cccaaattta aataaaatca gtataagaga agaggaagaa accaaatggt 2460
atactagtct aaattgtttc ttagtgacaa aagaataacc tgaatattag attagctgcc 2520
tatatgctct ctgaatcaat ttcattcaac atgcaacagt ccgcgggaac agagaaacag 2580
gagaatatgg gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa 2640
gaacagttgg aacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2700
ccggctcagg gccaagaaca gatggtcccc agatgcggtc ccgccctcag cagtttctag 2760
agaaccatca gatgtttcca gggtgcccca aggacctgaa atgaccctgt gccttatttg 2820
aactaaccaa tcagttcgct tctcgcttct gttcgcgcgc ttctgctccc cgagctctat 2880
ataagcagag ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt 2940
gacttccata gaaggcggcc gcgccgccac catggtgagc aagggcgagg agctgttcac 3000
cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca agttcagcgt 3060
gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt tcatctgcac 3120
caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct acggcgtgca 3180
gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt ccgccatgcc 3240
cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact acaagacccg 3300
cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcatcga 3360
cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca acagccacaa 3420
cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca agatccgcca 3480
caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca cccccatcgg 3540
cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg ccctgagcaa 3600
agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg ccgccgggat 3660
cactctcggc atggacgagc tgtacaaggg aagcggagct actaacttca gcctgctgaa 3720
gcaggctgga gacgtggagg agaaccctgg acctacctgc aggcctgaga acttcagggt 3780
gagtctatgg gacgcttgat gttttctttc cccttctttt ctatggttaa gttcatgtca 3840
taggaagggg ataagtaaca gggtacagtt tagaatggga aacagacgaa tgattgcatc 3900
agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa caattgtttt 3960
cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact attatactta 4020
atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa gtaacttaaa 4080
aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg tgcttatttg 4140
catattcata atctccctac tttgtcgacg tagataagta gcatggcggg ttaatcatta 4200
actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4260
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4320
gcgagcgagc gcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 4380
cagttgcgca gcctgaatgg cgaatggcga ttccgttgca atggctggcg gtaatattgt 4440
tctggatatt accagcaagg ccgatagttt gagttcttct actcaggcaa gtgatgttat 4500
tactaatcaa agaagtattg cgacaacggt taatttgcgt gatggacaga ctcttttact 4560
cggtggcctc actgattata aaaacacttc tcaggattct ggcgtaccgt tcctgtctaa 4620
aatcccttta atcggcctcc tgtttagctc ccgctctgat tctaacgagg aaagcacgtt 4680
atacgtgctc gtcaaagcaa ccatagtacg cgccctgtag cggcgcatta agcgcggcgg 4740
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 4800
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 4860
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 4920
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 4980
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 5040
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 5100
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa 5160
tttaaatatt tgcttataca atcttcctgt ttttggggct tttctgatta tcaaccgggg 5220
tacatatgat tgacatgcta gttttacgat taccgttcat cgattctctt gtttgctcca 5280
gactctcagg caatgacctg atagcctttg tagagacctc tcaaaaatag ctaccctctc 5340
cggcatgaat ttatcagcta gaacggttga atatcatatt gatggtgatt tgactgtctc 5400
cggcctttct cacccgtttg aatctttacc tacacattac tcaggcattg catttaaaat 5460
atatgagggt tctaaaaatt tttatccttg cgttgaaata aaggcttctc ccgcaaaagt 5520
attacagggt cataatgttt ttggtacaac cgatttagct ttatgctctg aggctttatt 5580
gcttaatttt gctaattctt tgccttgcct gtatgattta ttggatgttg gaatcgcctg 5640
atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc 5700
agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct 5760
gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc 5820
tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag 5880
ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg 5940
tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata 6000
cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga 6060
aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca 6120
ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat 6180
cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag 6240
agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc 6300
gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct 6360
cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca 6420
gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 6480
ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat 6540
gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 6600
gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 6660
cttactctag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 6720
ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 6780
gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 6840
gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 6900
gagataggtg cctcactgat taagcattgg taactgtcag accaagttta ctcatatata 6960
ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt 7020
gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 7080
gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 7140
caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 7200
ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 7260
tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 7320
ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 7380
tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 7440
cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 7500
gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 7560
ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 7620
gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 7680
agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 7740
tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 7800
tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 7860
gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat 7920
taatg 7925
<210> 28
<211> 5216
<212> DNA
<213> 人工序列
<220>
<223> 模板1246
<400> 28
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctatatacac acatatatat atatattttt tcttttctta ccagaaggtt ttaatccaaa 240
taaggagaag atatgcttag aaccgaggta gagttttcat ccattctgtc ctgtaagtat 300
tttgcatatt ctggagacgc aggaagagat ccatctacat atcccaaagc tgaattatgg 360
tagacaaaac tcttccactt ttagtgcatc aacttcttat ttgtgtaata agaaaattgg 420
gaaaacgatc ttcaatatgc ttaccaagct gtgattccaa atattacgta aatacacttg 480
caaaggagga tgtttttagt agcaatttgt actgatggta tggggccaag agatatatct 540
tagagggagg gctgagggtt tgaagtccaa ctcctaagcc agtgccagaa gagccaagga 600
caggtacggc tgtcatcact tagacctcac cctgtggagc cacaccctag ggttggccaa 660
tctactccca ggagcaggga gggcaggagc cagggctggg cataaaagtc agggcagagc 720
catctattgc ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagaca 780
ccatggtcca tcttacaccg gtggagaaat ccgctgtaac ggcactttgg gggaaagtta 840
atgtcgatga ggtcggtggt gaggccctgg gcaggttggt atcaaggtta caagacaggt 900
ttaaggagac caatagaaac tgggcatgtg gagacagaga agactcttgg gtttctgata 960
ggcactgact ctctctgcct attggtctat tttcccaccc ttaggctgct ggtggtctac 1020
ccttggaccc agaggttctt tgagtccttt ggggatctgt ccactcctga tgctgttatg 1080
ggcaacccta aggtgaaggc tcatggcaag aaagtgctcg gtgcctttag tgatggcctg 1140
gctcacctgg acaacctcaa gggcaccttt gccacactga gtgagctgca ctgtgacaag 1200
ctgcacgtgg atcctgagaa cttcagggtg agtctatggg acgcttgatg ttttctttcc 1260
ccttcttttc tatggttaag ttcatgtcat aggaagggga taagtaacag ggtacagttt 1320
agaatgggaa acagacgaat gattgcatca gtgtggaagt ctcaggatcg ttttagtttc 1380
ttttatttgc tgttcataac aattgttttc ttttgtttaa ttcttgcttt cttttttttt 1440
cttctccgca atttgtcgac gtagataagt agcatggcgg gttaatcatt aactacaagg 1500
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 1560
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 1620
cgcgccagct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc 1680
agcctgaatg gcgaatggcg attccgttgc aatggctggc ggtaatattg ttctggatat 1740
taccagcaag gccgatagtt tgagttcttc tactcaggca agtgatgtta ttactaatca 1800
aagaagtatt gcgacaacgg ttaatttgcg tgatggacag actcttttac tcggtggcct 1860
cactgattat aaaaacactt ctcaggattc tggcgtaccg ttcctgtcta aaatcccttt 1920
aatcggcctc ctgtttagct cccgctctga ttctaacgag gaaagcacgt tatacgtgct 1980
cgtcaaagca accatagtac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2040
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2100
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2160
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2220
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2280
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2340
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2400
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttaca atttaaatat 2460
ttgcttatac aatcttcctg tttttggggc ttttctgatt atcaaccggg gtacatatga 2520
ttgacatgct agttttacga ttaccgttca tcgattctct tgtttgctcc agactctcag 2580
gcaatgacct gatagccttt gtagagacct ctcaaaaata gctaccctct ccggcatgaa 2640
tttatcagct agaacggttg aatatcatat tgatggtgat ttgactgtct ccggcctttc 2700
tcacccgttt gaatctttac ctacacatta ctcaggcatt gcatttaaaa tatatgaggg 2760
ttctaaaaat ttttatcctt gcgttgaaat aaaggcttct cccgcaaaag tattacaggg 2820
tcataatgtt tttggtacaa ccgatttagc tttatgctct gaggctttat tgcttaattt 2880
tgctaattct ttgccttgcc tgtatgattt attggatgtt ggaatcgcct gatgcggtat 2940
tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 3000
tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 3060
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 3120
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 3180
atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 3240
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 3300
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 3360
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 3420
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 3480
gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 3540
cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 3600
tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 3660
ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 3720
ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 3780
atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 3840
cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 3900
atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 3960
gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 4020
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 4080
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 4140
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 4200
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 4260
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 4320
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 4380
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 4440
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 4500
aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 4560
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 4620
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 4680
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 4740
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 4800
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 4860
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 4920
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 4980
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 5040
atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 5100
gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 5160
gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatg 5216
<210> 29
<211> 4816
<212> DNA
<213> 人工序列
<220>
<223> 模板1247
<400> 29
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctagtgcatc aacttcttat ttgtgtaata agaaaattgg gaaaacgatc ttcaatatgc 240
ttaccaagct gtgattccaa atattacgta aatacacttg caaaggagga tgtttttagt 300
agcaatttgt actgatggta tggggccaag agatatatct tagagggagg gctgagggtt 360
tgaagtccaa ctcctaagcc agtgccagaa gagccaagga caggtacggc tgtcatcact 420
tagacctcac cctgtggagc cacaccctag ggttggccaa tctactccca ggagcaggga 480
gggcaggagc cagggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540
ttctgacaca actgtgttca ctagcaacct caaacagaca ccatggtcca tcttacaccg 600
gtggagaaat ccgctgtaac ggcactttgg gggaaagtta atgtcgatga ggtcggtggt 660
gaggccctgg gcaggttggt atcaaggtta caagacaggt ttaaggagac caatagaaac 720
tgggcatgtg gagacagaga agactcttgg gtttctgata ggcactgact ctctctgcct 780
attggtctat tttcccaccc ttaggctgct ggtggtctac ccttggaccc agaggttctt 840
tgagtccttt ggggatctgt ccactcctga tgctgttatg ggcaacccta aggtgaaggc 900
tcatggcaag aaagtgctcg gtgcctttag tgatggcctg gctcacctgg acaacctcaa 960
gggcaccttt gccacactga gtgagctgca ctgtgacaag ctgcacgtgg atcctgagaa 1020
cttcagggtg agtctatggg acgcttgatg ttttgtcgac gtagataagt agcatggcgg 1080
gttaatcatt aactacaagg aacccctagt gatggagttg gccactccct ctctgcgcgc 1140
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 1200
ggcctcagtg agcgagcgag cgcgccagct ggcgtaatag cgaagaggcc cgcaccgatc 1260
gcccttccca acagttgcgc agcctgaatg gcgaatggcg attccgttgc aatggctggc 1320
ggtaatattg ttctggatat taccagcaag gccgatagtt tgagttcttc tactcaggca 1380
agtgatgtta ttactaatca aagaagtatt gcgacaacgg ttaatttgcg tgatggacag 1440
actcttttac tcggtggcct cactgattat aaaaacactt ctcaggattc tggcgtaccg 1500
ttcctgtcta aaatcccttt aatcggcctc ctgtttagct cccgctctga ttctaacgag 1560
gaaagcacgt tatacgtgct cgtcaaagca accatagtac gcgccctgta gcggcgcatt 1620
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 1680
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 1740
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 1800
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 1860
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 1920
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 1980
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 2040
aacgtttaca atttaaatat ttgcttatac aatcttcctg tttttggggc ttttctgatt 2100
atcaaccggg gtacatatga ttgacatgct agttttacga ttaccgttca tcgattctct 2160
tgtttgctcc agactctcag gcaatgacct gatagccttt gtagagacct ctcaaaaata 2220
gctaccctct ccggcatgaa tttatcagct agaacggttg aatatcatat tgatggtgat 2280
ttgactgtct ccggcctttc tcacccgttt gaatctttac ctacacatta ctcaggcatt 2340
gcatttaaaa tatatgaggg ttctaaaaat ttttatcctt gcgttgaaat aaaggcttct 2400
cccgcaaaag tattacaggg tcataatgtt tttggtacaa ccgatttagc tttatgctct 2460
gaggctttat tgcttaattt tgctaattct ttgccttgcc tgtatgattt attggatgtt 2520
ggaatcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat 2580
ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc 2640
caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 2700
ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 2760
cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg 2820
tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 2880
ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 2940
aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct 3000
tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag 3060
atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta 3120
agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc 3180
tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca 3240
tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg 3300
atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg 3360
ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca 3420
tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa 3480
acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa 3540
ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata 3600
aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat 3660
ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc 3720
cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata 3780
gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt 3840
actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga 3900
agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 3960
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 4020
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 4080
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 4140
tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 4200
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 4260
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 4320
gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 4380
gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 4440
gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 4500
tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 4560
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct 4620
tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc 4680
gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg 4740
agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt 4800
ggccgattca ttaatg 4816
<210> 30
<211> 4416
<212> DNA
<213> 人工序列
<220>
<223> 模板1248
<400> 30
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
cttgccagaa gagccaagga caggtacggc tgtcatcact tagacctcac cctgtggagc 240
cacaccctag ggttggccaa tctactccca ggagcaggga gggcaggagc cagggctggg 300
cataaaagtc agggcagagc catctattgc ttacatttgc ttctgacaca actgtgttca 360
ctagcaacct caaacagaca ccatggtcca tcttacaccg gtggagaaat ccgctgtaac 420
ggcactttgg gggaaagtta atgtcgatga ggtcggtggt gaggccctgg gcaggttggt 480
atcaaggtta caagacaggt ttaaggagac caatagaaac tgggcatgtg gagacagaga 540
agactcttgg gtttctgata ggcactgact ctctctgcct attggtctat tttcccaccc 600
ttaggctgct ggtggtctac ccttggaccc agaggttctt tgagtccttt gggggtcgac 660
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 720
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 780
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgccagct ggcgtaatag 840
cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggcg 900
attccgttgc aatggctggc ggtaatattg ttctggatat taccagcaag gccgatagtt 960
tgagttcttc tactcaggca agtgatgtta ttactaatca aagaagtatt gcgacaacgg 1020
ttaatttgcg tgatggacag actcttttac tcggtggcct cactgattat aaaaacactt 1080
ctcaggattc tggcgtaccg ttcctgtcta aaatcccttt aatcggcctc ctgtttagct 1140
cccgctctga ttctaacgag gaaagcacgt tatacgtgct cgtcaaagca accatagtac 1200
gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 1260
acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 1320
ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 1380
gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 1440
tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 1500
ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 1560
gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 1620
gcgaatttta acaaaatatt aacgtttaca atttaaatat ttgcttatac aatcttcctg 1680
tttttggggc ttttctgatt atcaaccggg gtacatatga ttgacatgct agttttacga 1740
ttaccgttca tcgattctct tgtttgctcc agactctcag gcaatgacct gatagccttt 1800
gtagagacct ctcaaaaata gctaccctct ccggcatgaa tttatcagct agaacggttg 1860
aatatcatat tgatggtgat ttgactgtct ccggcctttc tcacccgttt gaatctttac 1920
ctacacatta ctcaggcatt gcatttaaaa tatatgaggg ttctaaaaat ttttatcctt 1980
gcgttgaaat aaaggcttct cccgcaaaag tattacaggg tcataatgtt tttggtacaa 2040
ccgatttagc tttatgctct gaggctttat tgcttaattt tgctaattct ttgccttgcc 2100
tgtatgattt attggatgtt ggaatcgcct gatgcggtat tttctcctta cgcatctgtg 2160
cggtatttca caccgcatat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 2220
aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 2280
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 2340
accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 2400
taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg 2460
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 2520
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 2580
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 2640
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 2700
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2760
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2820
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2880
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 2940
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 3000
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 3060
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 3120
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 3180
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 3240
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 3300
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 3360
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 3420
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 3480
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 3540
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 3600
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 3660
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 3720
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa 3780
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 3840
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 3900
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 3960
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 4020
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 4080
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 4140
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 4200
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc 4260
ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag 4320
ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa 4380
accgcctctc cccgcgcgtt ggccgattca ttaatg 4416
<210> 31
<211> 4116
<212> DNA
<213> 人工序列
<220>
<223> 模板1249
<400> 31
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctacatttgc ttctgacaca actgtgttca ctagcaacct caaacagaca ccatggtcca 240
tcttacaccg gtggagaaat ccgctgtaac ggcactttgg gggaaagtta atgtcgatga 300
ggtcggtggt gaggccctgg gcaggttggt atcaaggtta caagacaggt ttaagtcgac 360
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 420
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 480
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgccagct ggcgtaatag 540
cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggcg 600
attccgttgc aatggctggc ggtaatattg ttctggatat taccagcaag gccgatagtt 660
tgagttcttc tactcaggca agtgatgtta ttactaatca aagaagtatt gcgacaacgg 720
ttaatttgcg tgatggacag actcttttac tcggtggcct cactgattat aaaaacactt 780
ctcaggattc tggcgtaccg ttcctgtcta aaatcccttt aatcggcctc ctgtttagct 840
cccgctctga ttctaacgag gaaagcacgt tatacgtgct cgtcaaagca accatagtac 900
gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 960
acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 1020
ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 1080
gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 1140
tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 1200
ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 1260
gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 1320
gcgaatttta acaaaatatt aacgtttaca atttaaatat ttgcttatac aatcttcctg 1380
tttttggggc ttttctgatt atcaaccggg gtacatatga ttgacatgct agttttacga 1440
ttaccgttca tcgattctct tgtttgctcc agactctcag gcaatgacct gatagccttt 1500
gtagagacct ctcaaaaata gctaccctct ccggcatgaa tttatcagct agaacggttg 1560
aatatcatat tgatggtgat ttgactgtct ccggcctttc tcacccgttt gaatctttac 1620
ctacacatta ctcaggcatt gcatttaaaa tatatgaggg ttctaaaaat ttttatcctt 1680
gcgttgaaat aaaggcttct cccgcaaaag tattacaggg tcataatgtt tttggtacaa 1740
ccgatttagc tttatgctct gaggctttat tgcttaattt tgctaattct ttgccttgcc 1800
tgtatgattt attggatgtt ggaatcgcct gatgcggtat tttctcctta cgcatctgtg 1860
cggtatttca caccgcatat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 1920
aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 1980
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 2040
accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 2100
taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg 2160
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 2220
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 2280
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 2340
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 2400
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2460
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2520
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2580
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 2640
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 2700
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 2760
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 2820
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 2880
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 2940
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 3000
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 3060
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 3120
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 3180
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 3240
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 3300
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 3360
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 3420
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa 3480
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 3540
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 3600
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 3660
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 3720
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 3780
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 3840
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 3900
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc 3960
ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag 4020
ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa 4080
accgcctctc cccgcgcgtt ggccgattca ttaatg 4116
<210> 32
<211> 7995
<212> DNA
<213> 人工序列
<220>
<223> 模板1289
<400> 32
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctagtgcatc aacttcttat ttgtgtaata agaaaattgg gaaaacgatc ttcaatatgc 240
ttaccaagct gtgattccaa atattacgta aatacacttg caaaggagga tgtttttagt 300
agcaatttgt actgatggta tggggccaag agatatatct tagagggagg gctgagggtt 360
tgaagtccaa ctcctaagcc agtgccagaa gagccaagga caggtacggc tgtcatcact 420
tagacctcac cctgtggagc cacaccctag ggttggccaa tctactccca ggagcaggga 480
gggcaggagc cagggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540
ttctgacaca actgtgttca ctagcaacct caaacagaca ccatggtgca tctgactcct 600
gaggagaagt ccgctgtaac ggcactgtgg gggaaagtta atgtcgatga agtcggcggt 660
gaagcactcg gcaggttgct ggtagtgtac ccgtggacac aacgattctt tgaaagtttc 720
ggggacctgt ccacacccga tgctgtgatg ggtaatccaa aagtaaaagc acacggcaag 780
aaagtcctcg gcgcgtttag tgatggtctg gcccatttgg ataacttgaa gggtacattc 840
gcgcagcttt ccgaactcca ctgtgacaag ttgcacgtag atccagaaaa cttccggctt 900
ctgggcaatg tgcttgtatg cgttctggct caccattttg ggaaggagtt taccccaccc 960
gtgcaagcgg cttaccaaaa agtggtcgca ggagtggcta atgcccttgc acataaatat 1020
cactaaggta ccgagcatct taccgccatt tattcccata tttgttctgt ttttcttgat 1080
ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag 1140
ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc 1200
cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg 1260
actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct 1320
ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg 1380
ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct 1440
gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct 1500
gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc 1560
cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct 1620
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1680
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1740
tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 1800
aatagcaggc atgctgggga tgcggtgggc tctatggctt aattaacgag atcgagacca 1860
tcctggctaa cacagtgaaa ccccgtctct actaaaaaaa tacaaaaaat tagccgggct 1920
tggtggcggg tgcctgtagt cccagctact atggaggctg aggcgggaga atggcgtgaa 1980
cgcggggggc ggagcttgca gtgagcagag atcaggggcc actgcactcc agcctgggcg 2040
acagagagag actctgtctc aaaaaaaaga aaaaaaaaat ttagtagact agctaaaaaa 2100
atccagagat agttattgat gcatatgtaa aagtcttcca atatttacaa gtacaatgaa 2160
aaaaaaataa ccttgaatta agtgtagaac tcattgacaa tgtttcaaag gatgtgaggg 2220
ataaactaaa atttgggcag tacatgctgt tcctgtgtac ttggaacaga gggagaaaat 2280
ctgggctgga aatattgtta taggagttag cacatgaagg tgacaactaa attatttgga 2340
gtagatggag tcaccagcac atgtgaatag ttttagaatg aaatgaccca agatagaact 2400
ttggagagcc cccaaattta aataaaatca gtataagaga agaggaagaa accaaatggt 2460
atactagtct aaattgtttc ttagtgacaa aagaataacc tgaatattag attagctgcc 2520
tatatgctct ctgaatcaat ttcattcaac atgcaacagt ccgcgggaac agagaaacag 2580
gagaatatgg gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa 2640
gaacagttgg aacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2700
ccggctcagg gccaagaaca gatggtcccc agatgcggtc ccgccctcag cagtttctag 2760
agaaccatca gatgtttcca gggtgcccca aggacctgaa atgaccctgt gccttatttg 2820
aactaaccaa tcagttcgct tctcgcttct gttcgcgcgc ttctgctccc cgagctctat 2880
ataagcagag ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt 2940
gacttccata gaaggcggcc gcgccgccac catggtgagc aagggcgagg agctgttcac 3000
cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca agttcagcgt 3060
gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt tcatctgcac 3120
caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct acggcgtgca 3180
gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt ccgccatgcc 3240
cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact acaagacccg 3300
cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcatcga 3360
cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca acagccacaa 3420
cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca agatccgcca 3480
caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca cccccatcgg 3540
cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg ccctgagcaa 3600
agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg ccgccgggat 3660
cactctcggc atggacgagc tgtacaagta agctttattt gtgaaatttg tgatgctatt 3720
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 3780
tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagccctgc aggaggagaa 3840
gtctgccgtt actgccctgt ggggcaaggt gaacgtggat gaagttggtg gtgaggccct 3900
gggcaggttg gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcatg 3960
tggagacaga gaagactctt gggtttctga taggcactga ctctctctgc ctattggtct 4020
attttcccac ccttaggctg ctggtggtct acccttggac ccagaggttc tttgagtcct 4080
ttggggatct gtccactcct gatgctgtta tgggcaaccc taaggtgaag gctcatggca 4140
agaaagtgct cggtgccttt agtgatggcc tggctcacct ggacaacctc aagggcacct 4200
ttgccacact gagtgagctg cactgtgaca agcgtcgacg tagataagta gcatggcggg 4260
ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct 4320
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 4380
gcctcagtga gcgagcgagc gcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 4440
cccttcccaa cagttgcgca gcctgaatgg cgaatggcga ttccgttgca atggctggcg 4500
gtaatattgt tctggatatt accagcaagg ccgatagttt gagttcttct actcaggcaa 4560
gtgatgttat tactaatcaa agaagtattg cgacaacggt taatttgcgt gatggacaga 4620
ctcttttact cggtggcctc actgattata aaaacacttc tcaggattct ggcgtaccgt 4680
tcctgtctaa aatcccttta atcggcctcc tgtttagctc ccgctctgat tctaacgagg 4740
aaagcacgtt atacgtgctc gtcaaagcaa ccatagtacg cgccctgtag cggcgcatta 4800
agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 4860
cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 4920
gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 4980
aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 5040
cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 5100
acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 5160
tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta 5220
acgtttacaa tttaaatatt tgcttataca atcttcctgt ttttggggct tttctgatta 5280
tcaaccgggg tacatatgat tgacatgcta gttttacgat taccgttcat cgattctctt 5340
gtttgctcca gactctcagg caatgacctg atagcctttg tagagacctc tcaaaaatag 5400
ctaccctctc cggcatgaat ttatcagcta gaacggttga atatcatatt gatggtgatt 5460
tgactgtctc cggcctttct cacccgtttg aatctttacc tacacattac tcaggcattg 5520
catttaaaat atatgagggt tctaaaaatt tttatccttg cgttgaaata aaggcttctc 5580
ccgcaaaagt attacagggt cataatgttt ttggtacaac cgatttagct ttatgctctg 5640
aggctttatt gcttaatttt gctaattctt tgccttgcct gtatgattta ttggatgttg 5700
gaatcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 5760
gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc 5820
aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc 5880
tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc 5940
gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt 6000
ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 6060
tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 6120
ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 6180
ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 6240
tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 6300
gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 6360
gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 6420
acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 6480
tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 6540
caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 6600
gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 6660
cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 6720
tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 6780
agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 6840
tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 6900
ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 6960
acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 7020
ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 7080
gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 7140
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 7200
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 7260
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 7320
ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 7380
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 7440
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 7500
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 7560
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 7620
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 7680
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 7740
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 7800
ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 7860
tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 7920
gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 7980
gccgattcat taatg 7995
<210> 33
<211> 7995
<212> DNA
<213> 人工序列
<220>
<223> 模板1290
<400> 33
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtagat 180
ctagtgcatc aacttcttat ttgtgtaata agaaaattgg gaaaacgatc ttcaatatgc 240
ttaccaagct gtgattccaa atattacgta aatacacttg caaaggagga tgtttttagt 300
agcaatttgt actgatggta tggggccaag agatatatct tagagggagg gctgagggtt 360
tgaagtccaa ctcctaagcc agtgccagaa gagccaagga caggtacggc tgtcatcact 420
tagacctcac cctgtggagc cacaccctag ggttggccaa tctactccca ggagcaggga 480
gggcaggagc cagggctggg cataaaagtc agggcagagc catctattgc ttacatttgc 540
ttctgacaca actgtgttca ctagcaacct caaacagaca ccatggtgca tctgactcct 600
gaggagaagt ccgctgtaac ggcactgtgg gggaaagtta atgtcgatga agtcggcggt 660
gaagcactcg gcaggttgct ggtagtgtac ccgtggacac aacgattctt tgaaagtttc 720
ggggacctgt ccacacccga tgctgtgatg ggtaatccaa aagtaaaagc acacggcaag 780
aaagtcctcg gcgcgtttag tgatggtctg gcccatttgg ataacttgaa gggtacattc 840
gcgcagcttt ccgaactcca ctgtgacaag ttgcacgtag atccagaaaa cttccggctt 900
ctgggcaatg tgcttgtatg cgttctggct caccattttg ggaaggagtt taccccaccc 960
gtgcaagcgg cttaccaaaa agtggtcgca ggagtggcta atgcccttgc acataaatat 1020
cactaaggta ccgagcatct taccgccatt tattcccata tttgttctgt ttttcttgat 1080
ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag 1140
ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc 1200
cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg 1260
actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct 1320
ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg 1380
ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct 1440
gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct 1500
gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc 1560
cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct 1620
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1680
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1740
tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 1800
aatagcaggc atgctgggga tgcggtgggc tctatggctt aattaacgag atcgagacca 1860
tcctggctaa cacagtgaaa ccccgtctct actaaaaaaa tacaaaaaat tagccgggct 1920
tggtggcggg tgcctgtagt cccagctact atggaggctg aggcgggaga atggcgtgaa 1980
cgcggggggc ggagcttgca gtgagcagag atcaggggcc actgcactcc agcctgggcg 2040
acagagagag actctgtctc aaaaaaaaga aaaaaaaaat ttagtagact agctaaaaaa 2100
atccagagat agttattgat gcatatgtaa aagtcttcca atatttacaa gtacaatgaa 2160
aaaaaaataa ccttgaatta agtgtagaac tcattgacaa tgtttcaaag gatgtgaggg 2220
ataaactaaa atttgggcag tacatgctgt tcctgtgtac ttggaacaga gggagaaaat 2280
ctgggctgga aatattgtta taggagttag cacatgaagg tgacaactaa attatttgga 2340
gtagatggag tcaccagcac atgtgaatag ttttagaatg aaatgaccca agatagaact 2400
ttggagagcc cccaaattta aataaaatca gtataagaga agaggaagaa accaaatggt 2460
atactagtct aaattgtttc ttagtgacaa aagaataacc tgaatattag attagctgcc 2520
tatatgctct ctgaatcaat ttcattcaac atgcaacagt ccgcgggaac agagaaacag 2580
gagaatatgg gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa 2640
gaacagttgg aacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2700
ccggctcagg gccaagaaca gatggtcccc agatgcggtc ccgccctcag cagtttctag 2760
agaaccatca gatgtttcca gggtgcccca aggacctgaa atgaccctgt gccttatttg 2820
aactaaccaa tcagttcgct tctcgcttct gttcgcgcgc ttctgctccc cgagctctat 2880
ataagcagag ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt 2940
gacttccata gaaggcggcc gcgccgccac catggtgagc aagggcgagg agctgttcac 3000
cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca agttcagcgt 3060
gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt tcatctgcac 3120
caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct acggcgtgca 3180
gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt ccgccatgcc 3240
cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact acaagacccg 3300
cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcatcga 3360
cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca acagccacaa 3420
cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca agatccgcca 3480
caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca cccccatcgg 3540
cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg ccctgagcaa 3600
agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg ccgccgggat 3660
cactctcggc atggacgagc tgtacaagta agctttattt gtgaaatttg tgatgctatt 3720
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 3780
tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagccctgc aggaggagaa 3840
gtctgaggtt actgccctgt ggggcaaggt gaacgtggat gaagttggtg gtgaggccct 3900
gggcaggttg gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcatg 3960
tggagacaga gaagactctt gggtttctga taggcactga ctctctctgc ctattggtct 4020
attttcccac ccttaggctg ctggtggtct acccttggac ccagaggttc tttgagtcct 4080
ttggggatct gtccactcct gatgctgtta tgggcaaccc taaggtgaag gctcatggca 4140
agaaagtgct cggtgccttt agtgatggcc tggctcacct ggacaacctc aagggcacct 4200
ttgccacact gagtgagctg cactgtgaca agcgtcgacg tagataagta gcatggcggg 4260
ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct 4320
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 4380
gcctcagtga gcgagcgagc gcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 4440
cccttcccaa cagttgcgca gcctgaatgg cgaatggcga ttccgttgca atggctggcg 4500
gtaatattgt tctggatatt accagcaagg ccgatagttt gagttcttct actcaggcaa 4560
gtgatgttat tactaatcaa agaagtattg cgacaacggt taatttgcgt gatggacaga 4620
ctcttttact cggtggcctc actgattata aaaacacttc tcaggattct ggcgtaccgt 4680
tcctgtctaa aatcccttta atcggcctcc tgtttagctc ccgctctgat tctaacgagg 4740
aaagcacgtt atacgtgctc gtcaaagcaa ccatagtacg cgccctgtag cggcgcatta 4800
agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 4860
cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 4920
gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 4980
aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 5040
cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 5100
acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 5160
tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta 5220
acgtttacaa tttaaatatt tgcttataca atcttcctgt ttttggggct tttctgatta 5280
tcaaccgggg tacatatgat tgacatgcta gttttacgat taccgttcat cgattctctt 5340
gtttgctcca gactctcagg caatgacctg atagcctttg tagagacctc tcaaaaatag 5400
ctaccctctc cggcatgaat ttatcagcta gaacggttga atatcatatt gatggtgatt 5460
tgactgtctc cggcctttct cacccgtttg aatctttacc tacacattac tcaggcattg 5520
catttaaaat atatgagggt tctaaaaatt tttatccttg cgttgaaata aaggcttctc 5580
ccgcaaaagt attacagggt cataatgttt ttggtacaac cgatttagct ttatgctctg 5640
aggctttatt gcttaatttt gctaattctt tgccttgcct gtatgattta ttggatgttg 5700
gaatcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 5760
gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc 5820
aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc 5880
tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc 5940
gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt 6000
ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 6060
tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 6120
ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 6180
ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 6240
tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 6300
gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 6360
gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 6420
acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 6480
tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 6540
caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 6600
gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 6660
cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 6720
tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 6780
agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 6840
tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 6900
ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 6960
acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 7020
ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 7080
gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 7140
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 7200
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 7260
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 7320
ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 7380
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 7440
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 7500
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 7560
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 7620
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 7680
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 7740
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 7800
ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 7860
tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 7920
gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 7980
gccgattcat taatg 7995
<210> 34
<211> 8036
<212> DNA
<213> 人工序列
<220>
<223> 模板1314
<400> 34
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt cctgcggccg cgattcaaac ttccgcagaa cactttattt cacatataca 180
tgcctcttat atcagggatg tgaaacaggg tcttgaaaac tgtctaaatc taaaacaatg 240
ctaatgcagg tttaaattta ataaaataaa atccaaaatc taacagccaa gtcaaatctg 300
catgttttaa catttaaaat attttaaaga cgtcttttcc caggattcaa catgtgaaat 360
cttttctcag ggatacacgt gtgcctagat cctcattgct ttagtttttt acagaggaat 420
gaatataaaa agaaaatact taaattttat ccctcttacc tctataatca tacataggca 480
taatttttta acctaggctc cagatagcca tagaagaacc aaacactttc tgcgtgtgtg 540
agaataatca gagtgagatt ttttcacaag tacctgatga gggttgagac aggtagaaaa 600
agtgagagat ctctatttat ttagcaataa tagagaaagc atttaagaga ataaagcaat 660
ggaaataaga aatttgtaaa tttccttctg ataactagaa atagaggatc cagtttcttt 720
tggttaacct aaattttatt tcattttatt gttttatttt attttatttt attttatttt 780
gtgtaatcgt agtttcagag tgttagagct gaaaggaaga agtaggagaa acatgcaaag 840
taaaagtata acactttcct tactaaaccg acatgggttt ccaggtaggg gcaggattca 900
ggatgactga cagggccctt agggaacact gagaccctac gctgacctca taaatgcttg 960
ctacctttgc tgttttaatt acatctttta atagcaggaa gcagaactct gcacttcaaa 1020
agtttttcct cacctgagga gttaatttag tacaagggga aaaagtacag ggggatggga 1080
gaaaggcgat cacgttggga agctatagag aaagaagagt aaattttagt aaaggaggtt 1140
taaacaaaca aaatataaag agaaatagga acttgaatca aggaaatgat tttaaaacgc 1200
agtattctta gtggactaga ggaaaaaaat aatctgagcc aagtagaaga ccttttcccc 1260
tcctacccct actttctaag tcacagaggc tttttgttcc cccagacact cttgcagatt 1320
agtccaggca gaaacagtta gatgtcccca gttaacctcc tatttgacac cactgattac 1380
cccattgata gtcacacttt gggttgtaag tgacttttta tttatttgta tttttgactg 1440
cattaagagg tctctagttt tttatctctt gtttcccaaa acctaataag taactaatgc 1500
acagagcaca ttgatttgta tttattctat ttttagacat aatttattag catgcatgag 1560
caaattaaga aaaacaacaa caaatgaatg catatatatg tatatgtatg tgtgtatata 1620
tacacacata tatatatata ttttttcttt tcttaccaga aggttttaat ccaaataagg 1680
agaagatatg cttagaaccg aggtagagtt ttcatccatt ctgtcctgta agtattttgc 1740
atattctgga gacgcaggaa gagatccatc tacatatccc aaagctgaat tatggtagac 1800
aaaactcttc cacttttagt gcatcaactt cttatttgtg taataagaaa attgggaaaa 1860
cgatcttcaa tatgcttacc aagctgtgat tccaaatatt acgtaaatac acttgcaaag 1920
gaggatgttt ttagtagcaa tttgtactga tggtatgggg ccaagagata tatcttagag 1980
ggagggctga gggtttgaag tccaactcct aagccagtgc cagaagagcc aaggacaggt 2040
acggctgtca tcacttagac ctcaccctgt ggagccacac cctagggttg gccaatctac 2100
tcccaggagc agggagggca ggagccaggg ctgggcataa aagtcagggc agagccatct 2160
attgcttaca tttgcttctg acacaactgt gttcactagc aacctcaaac agacaccatg 2220
gtgcatctga ctcctgtcga gaagtctgcc gttactgccc tgtggggcaa ggtgaacgtg 2280
gatgaagttg gtggtgaggc cctgggcagg ttggtatcaa ggttacaaga caggtttaag 2340
gagaccaata gaaactgggc atgtggagac agagaagact cttgggtttc tgataggcac 2400
tgactctctc tgcctattgg tctattttcc cacccttagg ctgctggtgg tctacccttg 2460
gacccagagg ttctttgagt cctttgggga tctgtccact cctgatgctg ttatgggcaa 2520
ccctaaggtg aaggctcatg gcaagaaagt gctcggtgcc tttagtgatg gcctggctca 2580
cctggacaac ctcaagggca cctttgccac actgagtgag ctgcactgtg acaagctgca 2640
cgtggatcct gagaacttca gggtgagtct atgggacgct tgatgttttc tttccccttc 2700
ttttctatgg ttaagttcat gtcataggaa ggggataagt aacagggtac agtttagaat 2760
gggaaacaga cgaatgattg catcagtgtg gaagtctcag gatcgtttta gtttctttta 2820
tttgctgttc ataacaattg ttttcttttg tttaattctt gctttctttt tttttcttct 2880
ccgcaatttt tactattata cttaatgcct taacattgtg tataacaaaa ggaaatatct 2940
ctgagataca ttaagtaact taaaaaaaaa ctttacacag tctgcctagt acattactat 3000
ttggaatata tgtgtgctta tttgcatatt cataatctcc ctactttatt ttcttttatt 3060
tttaattgat acataatcat tatacatatt tatgggttaa agtgtaatgt tttaatatgt 3120
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 3180
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 3240
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 3300
atttctgggt taaggcaata gcaatatctc tgcatataaa tatttctgca tataaattgt 3360
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 3420
ttattttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 3480
tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctgtgtgc 3540
tggcccatca ctttggcaaa gaattcaccc caccagtgca ggctgcctat cagaaagtgg 3600
tggctggtgt ggctaatgcc ctggcccaca agtatcacta agctcgcttt cttgctgtcc 3660
aatttctatt aaaggttcct ttgttcccta agtccaacta ctaaactggg ggatattatg 3720
aagggccttg agcatctgga ttctgcctaa taaaaaacat ttattttcat tgcaatgatg 3780
tatttaaatt atttctgaat attttactaa aaagggaatg tgggaggtca gtgcatttaa 3840
aacataaaga aatgaagagc tagttcaaac cttgggaaaa tacactatat cttaaactcc 3900
atgaaagaag gtgaggctgc aaacagctaa tgcacattgg caacagcccc tgatgcatat 3960
gccttattca tccctcagaa aaggattcaa gtagaggctt gatttggagg ttaaagtttt 4020
gctatgctgt attttacatt acttattgtt ttagctgtcc tcatgaatgt cttttcacta 4080
cccatttgct tatcctgcat ctctcagcct tgactccact cagttctctt gcttagagat 4140
accacctttc ccctgaagtg ttccttccat gttttacggc gagatggttt ctcctcgcct 4200
ggccactcag ccttagttgt ctctgttgtc ttatagaggt ctacttgaag aaggaaaaac 4260
aggggtcatg gtttgactgt cctgtgagcc cttcttccct gatcggatcc cctgcaggag 4320
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 4380
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 4440
gcgcgcagct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc 4500
agcctgaatg gcgaatggcg attccgttgc aatggctggc ggtaatattg ttctggatat 4560
taccagcaag gccgatagtt tgagttcttc tactcaggca agtgatgtta ttactaatca 4620
aagaagtatt gcgacaacgg ttaatttgcg tgatggacag actcttttac tcggtggcct 4680
cactgattat aaaaacactt ctcaggattc tggcgtaccg ttcctgtcta aaatcccttt 4740
aatcggcctc ctgtttagct cccgctctga ttctaacgag gaaagcacgt tatacgtgct 4800
cgtcaaagca accatagtac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 4860
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 4920
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 4980
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 5040
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 5100
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 5160
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 5220
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttaca atttaaatat 5280
ttgcttatac aatcttcctg tttttggggc ttttctgatt atcaaccggg gtacatatga 5340
ttgacatgct agttttacga ttaccgttca tcgattctct tgtttgctcc agactctcag 5400
gcaatgacct gatagccttt gtagagacct ctcaaaaata gctaccctct ccggcatgaa 5460
tttatcagct agaacggttg aatatcatat tgatggtgat ttgactgtct ccggcctttc 5520
tcacccgttt gaatctttac ctacacatta ctcaggcatt gcatttaaaa tatatgaggg 5580
ttctaaaaat ttttatcctt gcgttgaaat aaaggcttct cccgcaaaag tattacaggg 5640
tcataatgtt tttggtacaa ccgatttagc tttatgctct gaggctttat tgcttaattt 5700
tgctaattct ttgccttgcc tgtatgattt attggatgtt ggaatcgcct gatgcggtat 5760
tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 5820
tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 5880
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 5940
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 6000
atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 6060
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 6120
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 6180
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 6240
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 6300
gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 6360
cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 6420
tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 6480
ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 6540
ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 6600
atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 6660
cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 6720
atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 6780
gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 6840
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 6900
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 6960
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 7020
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 7080
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 7140
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 7200
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 7260
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 7320
aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 7380
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 7440
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 7500
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 7560
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 7620
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 7680
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 7740
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 7800
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 7860
atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 7920
gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 7980
gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatg 8036
<210> 35
<211> 8207
<212> DNA
<213> 人工序列
<220>
<223> 模板1321
<400> 35
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt cctacgcgta gatctagtta gatgtcccca gttaacctcc tatttgacac 180
cactgattac cccattgata gtcacacttt gggttgtaag tgacttttta tttatttgta 240
tttttgactg cattaagagg tctctagttt tttatctctt gtttcccaaa acctaataag 300
taactaatgc acagagcaca ttgatttgta tttattctat ttttagacat aatttattag 360
catgcatgag caaattaaga aaaacaacaa caaatgaatg catatatatg tatatgtatg 420
tgtgtatata tacacacata tatatatata ttttttcttt tcttaccaga aggttttaat 480
ccaaataagg agaagatatg cttagaaccg aggtagagtt ttcatccatt ctgtcctgta 540
agtattttgc atattctgga gacgcaggaa gagatccatc tacatatccc aaagctgaat 600
tatggtagac aaaactcttc cacttttagt gcatcaactt cttatttgtg taataagaaa 660
attgggaaaa cgatcttcaa tatgcttacc aagctgtgat tccaaatatt acgtaaatac 720
acttgcaaag gaggatgttt ttagtagcaa tttgtactga tggtatgggg ccaagagata 780
tatcttagag ggagggctga gggtttgaag tccaactcct aagccagtgc cagaagagcc 840
aaggacaggt acggctgtca tcacttagac ctcaccctgt ggagccacac cctagggttg 900
gccaatctac tcccaggagc agggagggca ggagccaggg ctgggcataa aagtcagggc 960
agagccatct attgcttaca tttgcttctg acacaactgt gttcactagc aacctcaaac 1020
agacaccatg gtgcatctga ctccttaagc tttaaaaaac ctcccacatc tccccctgaa 1080
cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg 1140
ttacaaataa agcaatagca tcacaaattt cacaaataaa gcttacttgt acagctcgtc 1200
catgccgaga gtgatcccgg cggcggtcac gaactccagc aggaccatgt gatcgcgctt 1260
ctcgttgggg tctttgctca gggcggactg ggtgctcagg tagtggttgt cgggcagcag 1320
cacggggccg tcgccgatgg gggtgttctg ctggtagtgg tcggcgagct gcacgctgcc 1380
gtcctcgatg ttgtggcgga tcttgaagtt caccttgatg ccgttcttct gcttgtcggc 1440
catgatatag acgttgtggc tgttgtagtt gtactccagc ttgtgcccca ggatgttgcc 1500
gtcctccttg aagtcgatgc ccttcagctc gatgcggttc accagggtgt cgccctcgaa 1560
cttcacctcg gcgcgggtct tgtagttgcc gtcgtccttg aagaagatgg tgcgctcctg 1620
gacgtagcct tcgggcatgg cggacttgaa gaagtcgtgc tgcttcatgt ggtcggggta 1680
gcggctgaag cactgcacgc cgtaggtcag ggtggtcacg agggtgggcc agggcacggg 1740
cagcttgccg gtggtgcaga tgaacttcag ggtcagcttg ccgtaggtgg catcgccctc 1800
gccctcgccg gacacgctga acttgtggcc gtttacgtcg ccgtccagct cgaccaggat 1860
gggcaccacc ccggtgaaca gctcctcgcc cttgctcacc atggtggcgg cgcggccgcg 1920
atctgacggt tcactaaacg agctctgctt atatagagct cggggagcag aagcgcgcga 1980
acagaagcga gaagcgaact gattggttag ttcaaataag gcacagggtc atttcaggtc 2040
cttggggcac cctggaaaca tctgatggtt ctctagaaac tgctgagggc gggaccgcat 2100
ctggggacca tctgttcttg gccctgagcc ggggcaggaa ctgcttacca cagatatcct 2160
gtttggccca tattctgctg ttccaactgt tcttggccct gagccggggc aggaactgct 2220
taccacagat atcctgtttg gcccatattc tcctgtttct ctgttcccgc ggcgagatcg 2280
agaccatcct ggctaacaca gtgaaacccc gtctctacta aaaaaataca aaaaattagc 2340
cgggcttggt ggcgggtgcc tgtagtccca gctactatgg aggctgaggc gggagaatgg 2400
cgtgaacgcg gggggcggag cttgcagtga gcagagatca ggggccactg cactccagcc 2460
tgggcgacag agagagactc tgtctcaaaa aaaagaaaaa aaaaatttag tagactagct 2520
aaaaaaatcc agagatagtt attgatgcat atgtaaaagt cttccaatat ttacaagtac 2580
aatgaaaaaa aaataacctt gaattaagtg tagaactcat tgacaatgtt tcaaaggatg 2640
tgagggataa actaaaattt gggcagtaca tgctgttcct gtgtacttgg aacagaggga 2700
gaaaatctgg gctggaaata ttgttatagg agttagcaca tgaaggtgac aactaaatta 2760
tttggagtag atggagtcac cagcacatgt gaatagtttt agaatgaaat gacccaagat 2820
agaactttgg agagccccca aatttaaata aaatcagtat aagagaagag gaagaaacca 2880
aatggtatac tagtctaaat tgtttcttag tgacaaaaga ataacctgaa tattagatta 2940
gctgcctata tgctctctga atcaatttca ttcaacatgc aacagttctg gaacctatca 3000
gggaccacag tcagccaggc aagcacatct gcccaagcca agggtggagg catgcagctg 3060
tgggggtctg tgaaaacact tgagggagca gataactggg ccaaccatga ctcagtgctt 3120
ctggaggcca acaggactgc tgagtcatcc tgtgggggtg gaggtgggac aagggaaagg 3180
ggtgaatggt actgctgatt acaacctctg gtgctgcctc cccctcctgt ttatctgaga 3240
gaggcctcac tggagctaga gacaagaagg taaaaaacgg ctgacaaaag aagtcctggt 3300
atcctctatg atgggagaag gaaactagct aaagggaaga ataaattaga gaaaaactgg 3360
aatgactgaa tcggaacaag gcaaaggcta taaaaaaaat tagcagtatc ctcttggggg 3420
ccccttcccc acactatctc aatgcaaata tctgtctgaa acggtccctg gctaaactcc 3480
acccatgggt tggccagcct tgccttgaca aggcaaactt gaccaatagt cttagagtat 3540
ccagtgaggc caggggccgg cggctggcta gggatgaaga ataaaaggaa gcacccttca 3600
gcagttccac acactcgctt ctggaacgtc tgaggttatc aataagctcc tagtccagac 3660
gccatggtcc atcttacacc ggtggagaag tctgccgtta ctgccctgtg gggcaaggtg 3720
aacgtggatg aagttggtgg tgaggccctg ggcaggttgg tatcaaggtt acaagacagg 3780
tttaaggaga ccaatagaaa ctgggcatgt ggagacagag aagactcttg ggtttctgat 3840
aggcactgac tctctctgcc tattggtcta ttttcccacc cttaggctgc tggtggtcta 3900
cccttggacc cagaggttct ttgagtcctt tggggatctg tccactcctg atgctgttat 3960
gggcaaccct aaggtgaagg ctcatggcaa gaaagtgctc ggtgccttta gtgatggcct 4020
ggctcacctg gacaacctca agggcacctt tgccacactg agtgagctgc actgtgacaa 4080
gctgcacgtg gatcctgaga acttcagggt gagtctatgg gacgcttgat gttttctttc 4140
cccttctttt ctatggttaa gttcatgtca taggaagggg ataagtaaca gggtacagtt 4200
tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc gttttagttt 4260
cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt tctttttttt 4320
tcttctccgc aatttttact attatactta atgccttaac attgtgtata acaaaaggaa 4380
atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg cctagtacat 4440
tactatttgg aatatatgtg tgcttatttg catattcata atcgtcgaca ggaaccccta 4500
gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca 4560
aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc 4620
tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 4680
ggcgaatggc gattccgttg caatggctgg cggtaatatt gttctggata ttaccagcaa 4740
ggccgatagt ttgagttctt ctactcaggc aagtgatgtt attactaatc aaagaagtat 4800
tgcgacaacg gttaatttgc gtgatggaca gactctttta ctcggtggcc tcactgatta 4860
taaaaacact tctcaggatt ctggcgtacc gttcctgtct aaaatccctt taatcggcct 4920
cctgtttagc tcccgctctg attctaacga ggaaagcacg ttatacgtgc tcgtcaaagc 4980
aaccatagta cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 5040
gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 5100
ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt 5160
tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 5220
gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 5280
ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 5340
ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 5400
aaaaatttaa cgcgaatttt aacaaaatat taacgtttac aatttaaata tttgcttata 5460
caatcttcct gtttttgggg cttttctgat tatcaaccgg ggtacatatg attgacatgc 5520
tagttttacg attaccgttc atcgattctc ttgtttgctc cagactctca ggcaatgacc 5580
tgatagcctt tgtagagacc tctcaaaaat agctaccctc tccggcatga atttatcagc 5640
tagaacggtt gaatatcata ttgatggtga tttgactgtc tccggccttt ctcacccgtt 5700
tgaatcttta cctacacatt actcaggcat tgcatttaaa atatatgagg gttctaaaaa 5760
tttttatcct tgcgttgaaa taaaggcttc tcccgcaaaa gtattacagg gtcataatgt 5820
ttttggtaca accgatttag ctttatgctc tgaggcttta ttgcttaatt ttgctaattc 5880
tttgccttgc ctgtatgatt tattggatgt tggaatcgcc tgatgcggta ttttctcctt 5940
acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat 6000
gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 6060
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 6120
cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta 6180
tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg 6240
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 6300
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 6360
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 6420
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 6480
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 6540
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 6600
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 6660
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 6720
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 6780
ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 6840
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 6900
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 6960
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 7020
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 7080
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 7140
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 7200
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 7260
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 7320
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 7380
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 7440
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 7500
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 7560
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 7620
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 7680
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 7740
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 7800
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 7860
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 7920
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 7980
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 8040
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 8100
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 8160
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatg 8207
<210> 36
<211> 8009
<212> DNA
<213> 人工序列
<220>
<223> 模板1322
<400> 36
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt cctacgcgta gatctagtta gatgtcccca gttaacctcc tatttgacac 180
cactgattac cccattgata gtcacacttt gggttgtaag tgacttttta tttatttgta 240
tttttgactg cattaagagg tctctagttt tttatctctt gtttcccaaa acctaataag 300
taactaatgc acagagcaca ttgatttgta tttattctat ttttagacat aatttattag 360
catgcatgag caaattaaga aaaacaacaa caaatgaatg catatatatg tatatgtatg 420
tgtgtatata tacacacata tatatatata ttttttcttt tcttaccaga aggttttaat 480
ccaaataagg agaagatatg cttagaaccg aggtagagtt ttcatccatt ctgtcctgta 540
agtattttgc atattctgga gacgcaggaa gagatccatc tacatatccc aaagctgaat 600
tatggtagac aaaactcttc cacttttagt gcatcaactt cttatttgtg taataagaaa 660
attgggaaaa cgatcttcaa tatgcttacc aagctgtgat tccaaatatt acgtaaatac 720
acttgcaaag gaggatgttt ttagtagcaa tttgtactga tggtatgggg ccaagagata 780
tatcttagag ggagggctga gggtttgaag tccaactcct aagccagtgc cagaagagcc 840
aaggacaggt gctttaaaaa acctcccaca tctccccctg aacctgaaac ataaaatgaa 900
tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag 960
catcacaaat ttcacaaata aagcttactt gtacagctcg tccatgccga gagtgatccc 1020
ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg ggtctttgct 1080
cagggcggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc cgtcgccgat 1140
gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga tgttgtggcg 1200
gatcttgaag ttcaccttga tgccgttctt ctgcttgtcg gccatgatat agacgttgtg 1260
gctgttgtag ttgtactcca gcttgtgccc caggatgttg ccgtcctcct tgaagtcgat 1320
gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct cggcgcgggt 1380
cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc cttcgggcat 1440
ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcggctga agcactgcac 1500
gccgtaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc cggtggtgca 1560
gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc cggacacgct 1620
gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca ccccggtgaa 1680
cagctcctcg cccttgctca ccatggtggc ggcgcggccg cgatctgacg gttcactaaa 1740
cgagctctgc ttatatagag ctcggggagc agaagcgcgc gaacagaagc gagaagcgaa 1800
ctgattggtt agttcaaata aggcacaggg tcatttcagg tccttggggc accctggaaa 1860
catctgatgg ttctctagaa actgctgagg gcgggaccgc atctggggac catctgttct 1920
tggccctgag ccggggcagg aactgcttac cacagatatc ctgtttggcc catattctgc 1980
tgttccaact gttcttggcc ctgagccggg gcaggaactg cttaccacag atatcctgtt 2040
tggcccatat tctcctgttt ctctgttccc gcggcgagat cgagaccatc ctggctaaca 2100
cagtgaaacc ccgtctctac taaaaaaata caaaaaatta gccgggcttg gtggcgggtg 2160
cctgtagtcc cagctactat ggaggctgag gcgggagaat ggcgtgaacg cggggggcgg 2220
agcttgcagt gagcagagat caggggccac tgcactccag cctgggcgac agagagagac 2280
tctgtctcaa aaaaaagaaa aaaaaaattt agtagactag ctaaaaaaat ccagagatag 2340
ttattgatgc atatgtaaaa gtcttccaat atttacaagt acaatgaaaa aaaaataacc 2400
ttgaattaag tgtagaactc attgacaatg tttcaaagga tgtgagggat aaactaaaat 2460
ttgggcagta catgctgttc ctgtgtactt ggaacagagg gagaaaatct gggctggaaa 2520
tattgttata ggagttagca catgaaggtg acaactaaat tatttggagt agatggagtc 2580
accagcacat gtgaatagtt ttagaatgaa atgacccaag atagaacttt ggagagcccc 2640
caaatttaaa taaaatcagt ataagagaag aggaagaaac caaatggtat actagtctaa 2700
attgtttctt agtgacaaaa gaataacctg aatattagat tagctgccta tatgctctct 2760
gaatcaattt cattcaacat gcaacagttc tggaacctat cagggaccac agtcagccag 2820
gcaagcacat ctgcccaagc caagggtgga ggcatgcagc tgtgggggtc tgtgaaaaca 2880
cttgagggag cagataactg ggccaaccat gactcagtgc ttctggaggc caacaggact 2940
gctgagtcat cctgtggggg tggaggtggg acaagggaaa ggggtgaatg gtactgctga 3000
ttacaacctc tggtgctgcc tccccctcct gtttatctga gagaggcctc actggagcta 3060
gagacaagaa ggtaaaaaac ggctgacaaa agaagtcctg gtatcctcta tgatgggaga 3120
aggaaactag ctaaagggaa gaataaatta gagaaaaact ggaatgactg aatcggaaca 3180
aggcaaaggc tataaaaaaa attagcagta tcctcttggg ggccccttcc ccacactatc 3240
tcaatgcaaa tatctgtctg aaacggtccc tggctaaact ccacccatgg gttggccagc 3300
cttgccttga caaggcaaac ttgaccaata gtcttagagt atccagtgag gccaggggcc 3360
ggcggctggc tagggatgaa gaataaaagg aagcaccctt cagcagttcc acacactcgc 3420
ttctggaacg tctgaggtta tcaataagct cctagtccag acgccatggt ccatcttaca 3480
ccggtggaga agtctgccgt tactgccctg tggggcaagg tgaacgtgga tgaagttggt 3540
ggtgaggccc tgggcaggtt ggtatcaagg ttacaagaca ggtttaagga gaccaataga 3600
aactgggcat gtggagacag agaagactct tgggtttctg ataggcactg actctctctg 3660
cctattggtc tattttccca cccttaggct gctggtggtc tacccttgga cccagaggtt 3720
ctttgagtcc tttggggatc tgtccactcc tgatgctgtt atgggcaacc ctaaggtgaa 3780
ggctcatggc aagaaagtgc tcggtgcctt tagtgatggc ctggctcacc tggacaacct 3840
caagggcacc tttgccacac tgagtgagct gcactgtgac aagctgcacg tggatcctga 3900
gaacttcagg gtgagtctat gggacgcttg atgttttctt tccccttctt ttctatggtt 3960
aagttcatgt cataggaagg ggataagtaa cagggtacag tttagaatgg gaaacagacg 4020
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 4080
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 4140
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 4200
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 4260
tgtgcttatt tgcatattca taatcgtcga caggaacccc tagtgatgga gttggccact 4320
ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 4380
ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctggcgtaa tagcgaagag 4440
gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgattccgt 4500
tgcaatggct ggcggtaata ttgttctgga tattaccagc aaggccgata gtttgagttc 4560
ttctactcag gcaagtgatg ttattactaa tcaaagaagt attgcgacaa cggttaattt 4620
gcgtgatgga cagactcttt tactcggtgg cctcactgat tataaaaaca cttctcagga 4680
ttctggcgta ccgttcctgt ctaaaatccc tttaatcggc ctcctgttta gctcccgctc 4740
tgattctaac gaggaaagca cgttatacgt gctcgtcaaa gcaaccatag tacgcgccct 4800
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 4860
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 4920
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 4980
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 5040
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 5100
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 5160
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 5220
ttaacaaaat attaacgttt acaatttaaa tatttgctta tacaatcttc ctgtttttgg 5280
ggcttttctg attatcaacc ggggtacata tgattgacat gctagtttta cgattaccgt 5340
tcatcgattc tcttgtttgc tccagactct caggcaatga cctgatagcc tttgtagaga 5400
cctctcaaaa atagctaccc tctccggcat gaatttatca gctagaacgg ttgaatatca 5460
tattgatggt gatttgactg tctccggcct ttctcacccg tttgaatctt tacctacaca 5520
ttactcaggc attgcattta aaatatatga gggttctaaa aatttttatc cttgcgttga 5580
aataaaggct tctcccgcaa aagtattaca gggtcataat gtttttggta caaccgattt 5640
agctttatgc tctgaggctt tattgcttaa ttttgctaat tctttgcctt gcctgtatga 5700
tttattggat gttggaatcg cctgatgcgg tattttctcc ttacgcatct gtgcggtatt 5760
tcacaccgca tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag 5820
ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc 5880
gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca 5940
tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata ggttaatgtc 6000
atgataataa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc 6060
cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc 6120
tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc 6180
gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg 6240
gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat 6300
ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc 6360
acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa 6420
ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa 6480
aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt 6540
gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct 6600
tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat 6660
gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg 6720
cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg 6780
atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt 6840
attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg 6900
ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg 6960
gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg 7020
tcagaccaag tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa 7080
aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt 7140
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 7200
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 7260
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 7320
ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta 7380
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 7440
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 7500
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 7560
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 7620
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 7680
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 7740
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 7800
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 7860
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 7920
accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg caaaccgcct 7980
ctccccgcgc gttggccgat tcattaatg 8009
<210> 37
<211> 1606
<212> DNA
<213> 人工序列
<220>
<223> HBB血红蛋白亚基β的基因序列[智人(Homo
sapiens)(人)] NCBI上Gene ID:3043(更新于
2018年4月21日),位于人基因组的
11p15.4。该序列起始于外显子1的
开始。该序列在NCBI数据库中
标识为: NC_000011.10:c5227071-5225466 智人
染色体11, GRCh38.p12初级组装
<400> 37
acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atggtgcatc 60
tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac gtggatgaag 120
ttggtggtga ggccctgggc aggttggtat caaggttaca agacaggttt aaggagacca 180
atagaaactg ggcatgtgga gacagagaag actcttgggt ttctgatagg cactgactct 240
ctctgcctat tggtctattt tcccaccctt aggctgctgg tggtctaccc ttggacccag 300
aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 360
gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 420
aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 480
cctgagaact tcagggtgag tctatgggac gcttgatgtt ttctttcccc ttcttttcta 540
tggttaagtt catgtcatag gaaggggata agtaacaggg tacagtttag aatgggaaac 600
agacgaatga ttgcatcagt gtggaagtct caggatcgtt ttagtttctt ttatttgctg 660
ttcataacaa ttgttttctt ttgtttaatt cttgctttct ttttttttct tctccgcaat 720
ttttactatt atacttaatg ccttaacatt gtgtataaca aaaggaaata tctctgagat 780
acattaagta acttaaaaaa aaactttaca cagtctgcct agtacattac tatttggaat 840
atatgtgtgc ttatttgcat attcataatc tccctacttt attttctttt atttttaatt 900
gatacataat cattatacat atttatgggt taaagtgtaa tgttttaata tgtgtacaca 960
tattgaccaa atcagggtaa ttttgcattt gtaattttaa aaaatgcttt cttcttttaa 1020
tatacttttt tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat 1080
aatgatacaa tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg 1140
ggttaaggca atagcaatat ctctgcatat aaatatttct gcatataaat tgtaactgat 1200
gtaagaggtt tcatattgct aatagcagct acaatccagc taccattctg cttttatttt 1260
atggttggga taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt 1320
catacctctt atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca 1380
tcactttggc aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg 1440
tgtggctaat gccctggccc acaagtatca ctaagctcgc tttcttgctg tccaatttct 1500
attaaaggtt cctttgttcc ctaagtccaa ctactaaact gggggatatt atgaagggcc 1560
ttgagcatct ggattctgcc taataaaaaa catttatttt cattgc 1606
<210> 38
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 38
gtcgagaagt ctgcagtcac tgctctatgg gggaaa 36
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> HBB-1250
<400> 39
aggctttttg ttcccccaga 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> HBB-1250
<400> 40
agccttcacc ttagggttgc 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> SCL-386
<400> 41
gggttggcca atctactccc 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> SCL-386
<400> 42
cctctgggtc caagggtaga 20
<210> 43
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> ddPCR
<400> 43
cataaaagtc agggcagag 19
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> ddPCR
<400> 44
gtctccttaa acctgtcttg 20
<210> 45
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> LINC01206
<400> 45
caaaaagcaa aatttgggga ta 22
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> LINC01206
<400> 46
cttttagccc agtgccagac 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> MIR7974
<400> 47
atcagcccct ctttctggat 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> MIR7974
<400> 48
agtgcagtgg tgccatcata 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> HBD
<400> 49
cagatcccca aaggactcaa 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> HBD
<400> 50
gcggtgggga gatatgtaga 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TULP4
<400> 51
cacgccagga tgtaagctct 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TULP4
<400> 52
tctgaggcaa aagtgcaaga 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> DENND3
<400> 53
gggggtttct atccctcact 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> DENND3
<400> 54
caagagggtc aggttgagga 20
<210> 55
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> HBB-Miseq (具有接头)
<400> 55
tcgtcggcag cgtcagatgt gtataagaga caggggttgg ccaatctact ccc 53
<210> 56
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> HBB-Miseq (具有接头)
<400> 56
gtctcgtggg ctcggagatg tgtataagag acagcctctg ggtccaaggg taga 54
<210> 57
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> HBD-Miseq(具有接头)
<400> 57
tcgtcggcag cgtcagatgt gtataagaga cagcacaaac taatgaaacc ctgct 55
<210> 58
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> HBD-Miseq(具有接头)
<400> 58
gtctcgtggg ctcggagatg tgtataagag acagtctaca catgcccagt ttcca 55
<210> 59
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> GTC HDR FAM
<400> 59
ctcctgtcga gaagtctgc 19
<210> 60
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> GAA HDR FAM
<400> 60
ctcccgaaga gaagtctgc 19
<210> 61
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> GTG HDR FAM
<400> 61
ctcctgtgga gaagtctgc 19
<210> 62
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> GAG WT HEX
<400> 62
tgactcctgt cgagaagt 18
<210> 63
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> REF HEX
<400> 63
gttcactagc aacctcaaac agacacc 27
<210> 64
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > GTC
<400> 64
tcagggcaga gccatctatt gcttacattt gcttctgaca caactgtgtt cactagcaa 59
<210> 65
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > GTC
<400> 65
cctcaaacag acaccatggt gcatctgact cctgtcgaga agtctgccgt tactgccct 59
<210> 66
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > GTC
<400> 66
gtggggcaag gtgaacgtgg atgaagttgg tggtgaggcc ctgggcaggt 50
<210> 67
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > CCC GAA
<400> 67
tcagggcaga gccatctatt gcttacattt gcttctgaca caactgtgtt cactagcaa 59
<210> 68
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > CCC GAA
<400> 68
cctcaaacag acaccatggt gcatctgact cccgaagaga agtctgccgt tactgccct 59
<210> 69
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > CCC GAA
<400> 69
gtggggcaag gtgaacgtgg atgaagttgg tggtgaggcc ctgggcaggt 50
<210> 70
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > GTG
<400> 70
tcagggcaga gccatctatt gcttacattt gcttctgaca caactgtgtt cactagcaa 59
<210> 71
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > GTG
<400> 71
cctcaaacag acaccatggt gcatctgact cctgtggaga agtctgccgt tactgccct 59
<210> 72
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> E6V GAG > GTG
<400> 72
gtggggcaag gtgaacgtgg atgaagttgg tggtgaggcc ctgggcaggt 50
<210> 73
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 73
caacctcaaa cagacaccat ggtgcatctg actcctgagg agaagtctgc cgttactgcc 60
ctgtggggca aggtg 75
<210> 74
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 74
caacctcaaa cagacaccat ggtgcacctg actcctgaga agtctgccgt tactgccctg 60
tggggcaagg tg 72
<210> 75
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 75
caacctcaaa cagacaccat ggtgcacctg actcctgaag tctgccgtta ctgccctgtg 60
gggcaaggtg 70
<210> 76
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 76
caacctcaaa cagacaccat ggtgcacctg actcctgccg ttactgccct gtggggcaag 60
gtg 63
<210> 77
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 77
caacctcaaa cagacaccat ggtgcacctg actcctgagt ctgccgttac tgccctgtgg 60
ggcaaggtg 69
<210> 78
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 78
caacctcaaa cagacaccat ggtgcacctg actcctgaga agtctgccgt tactgccctg 60
tggggcaagg tg 72
<210> 79
<211> 74
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 79
caacctcaaa cagacaccat ggtgcacctg actcctgaga gaagtctgcc gttactgccc 60
tgtggggcaa ggtg 74
<210> 80
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 80
caacctcaaa cagacaccat ggtgcacctg actcctgaga agtctgccgt tactgccctg 60
tggggcaagg tg 72
<210> 81
<211> 74
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 81
caacctcaaa cagacaccat ggtgcacctg actcctgaga gaagtctgcc gttactgccc 60
tgtggggcaa ggtg 74

Claims (101)

1.一种用于编辑细胞中的HBB基因的方法,所述方法包括:
(i)向所述细胞中引入编码向导RNA(gRNA)的多核苷酸,以及
(ii)向所述细胞中引入模板多核苷酸。
2.如权利要求1所述的方法,其中,所述gRNA包含与SEQ ID NO:01-SEQ ID NO:06中任一项的核苷酸序列具有至少95%同一性的核酸。
3.如权利要求1或2所述的方法,其中,所述gRNA包含与SEQ ID NO:07-SEQ ID NO:12中任一项的核苷酸序列具有至少95%同一性的核酸。
4.如权利要求1-3中任一项所述的方法,其中,所述gRNA包含SEQ ID NO:01-SEQ IDNO:06中任一项的核苷酸序列。
5.如权利要求1-4中任一项所述的方法,其中,所述gRNA包含SEQ ID NO:01的核苷酸序列。
6.如权利要求1-5中任一项所述的方法,其中,所述gRNA包含SEQ ID NO:07的核苷酸序列。
7.如权利要求1-6中任一项所述的方法,其中,向所述细胞中引入编码gRNA的多核苷酸包括使所述细胞与包含CAS9蛋白和编码所述gRNA的多核苷酸的核糖核蛋白(RNP)接触。
8.如权利要求7所述的方法,其中,所述CAS9蛋白和编码所述gRNA的多核苷酸的比为0.1:1到1:10之间。
9.如权利要求7所述的方法,其中,所述CAS9蛋白和编码所述gRNA的多核苷酸的比为1:1到1:5之间。
10.如权利要求7所述的方法,其中,所述CAS9蛋白和编码所述gRNA的多核苷酸的比为约1:2.5。
11.如权利要求1-10中任一项所述的方法,其中,所述模板多核苷酸编码所述HBB基因的至少部分或其互补物。
12.如权利要求1-11中任一项所述的方法,其中,所述模板多核苷酸编码野生型HBB基因的至少部分或其互补物。
13.如权利要求1-12中任一项所述的方法,其中,所述HBB基因的至少部分包含所述HBB基因的外显子1。
14.如权利要求1-13中任一项所述的方法,其中,病毒载体包含所述模板多核苷酸。
15.如权利要求14所述的方法,其中,所述载体是腺相关病毒(AAV)载体。
16.如权利要求14或15所述的方法,其中,所述载体是自互补AAV(scAAV)载体。
17.如权利要求1-16中任一项所述的方法,其中,所述模板多核苷酸包含至少约4kb的HBB基因。
18.如权利要求1-17中任一项所述的方法,其中,单链供体寡核苷酸(ssODN)包含所述模板多核苷酸。
19.如权利要求18所述的方法,其中,所述ssODN包含与SEQ ID NO:64-SEQ ID NO:72中任一项的核苷酸序列具有至少95%同一性的核苷酸序列。
20.如权利要求18或19所述的方法,其中,所述ssODN包含SEQ ID NO:64-SEQ ID NO:72中任一项的核苷酸序列。
21.如权利要求1-20中任一项所述的方法,其中,在所述HBB基因的外显子1中生成双链断裂。
22.如权利要求21所述的方法,其中,所述双链断裂在所述HBB基因的外显子1的第六密码子附近生成。
23.如权利要求1-22中任一项所述的方法,其中,步骤(i)在步骤(ii)之前进行。
24.如权利要求1-22中任一项所述的方法,其中,步骤(i)和步骤(ii)同时进行。
25.如权利要求1-24中任一项所述的方法,其中,步骤(i)和/或步骤(ii)包括进行核转染。
26.如权利要求25所述的方法,其中,进行核转染包括使用LONZA系统。
27.如权利要求26所述的方法,其中,所述系统包括使用方波脉冲。
28.如权利要求1-27中任一项所述的方法,其中,步骤(i)和/或步骤(ii)包括接触约200,000个细胞/20μL的核转染反应,其中,所述核转染反应包含所述gRNA和/或所述模板多核苷酸。
29.如权利要求1-28中任一项所述的方法,其中,所述细胞是哺乳动物细胞。
30.如权利要求1-29中任一项所述的方法,其中,所述细胞是人细胞。
31.如权利要求1-30中任一项所述的方法,其中,所述细胞是原代细胞。
32.如权利要求1-31中任一项所述的方法,其中,所述细胞是造血干细胞(HSC)。
33.如权利要求1-32中任一项所述的方法,其中,所述细胞是T细胞或B细胞。
34.如权利要求1-33中任一项所述的方法,其中,所述细胞是CD34+细胞。
35.如权利要求1-34中任一项所述的方法,其中,所述HBB基因与核苷酸序列SEQ IDNO:37具有至少95%同一性。
36.一种治疗或缓解受试者中的镰状细胞性贫血的方法,所述方法包括向有需要的受试者给予根据权利要求1-35中任一项制备的细胞。
37.如权利要求36所述的方法,其中,所述受试者是人。
38.一种用于HBB基因的同源定向修复(HDR)的核酸,所述核酸包括:
编码HBB基因的至少部分的第一序列;
编码向导RNA切割位点的第二序列;以及
编码核酸酶结合位点的第三序列。
39.如权利要求38所述的核酸,其中,所述HBB基因的至少部分包含所述HHB基因的外显子1。
40.如权利要求38或39所述的核酸,其中,所述HBB基因包含与核苷酸序列SEQ ID NO:37具有至少95%同一性的核酸。
41.如权利要求38-40中任一项所述的核酸,其中,所述第二序列包含与SEQ ID NO:01-SEQ ID NO:06中任一项所示的核苷酸序列具有至少95%同一性的核酸。
42.如权利要求38-41中任一项所述的核酸,其中,所述第二序列包含SEQ ID NO:01-SEQ ID NO:06中任一项所示的核苷酸序列。
43.如权利要求38-42中任一项所述的核酸,其中,所述第二序列包含SEQ ID NO:07-SEQ ID NO:12中任一项所示的核苷酸序列。
44.如权利要求38-43中任一项所述的核酸,其中,所述第二序列包含核苷酸序列SEQID NO:01。
45.如权利要求38-44中任一项所述的核酸,其中,所述一个或多个核酸酶结合位点包含正向和反向转录激活因子样效应物核酸酶(TALEN)结合位点。
46.如权利要求38-45中任一项所述的核酸,其中,所述一个或多个核酸酶结合位点是成簇的规律间隔的短回文重复序列(CRISPR)相关蛋白9(Cas9)结合位点。
47.如权利要求38-46中任一项所述的核酸,所述核酸进一步包含一个或多个增强子元件。
48.如权利要求38-47中任一项所述的核酸,所述核酸进一步还包含同源臂序列。
49.如权利要求38-48中任一项所述的核酸,所述核酸进一步包含编码启动子的核酸序列。
50.一种细胞,所述细胞包含如权利要求38-49中任一项所述的核酸。
51.如权利要求50所述的细胞,其中,所述细胞是哺乳动物细胞。
52.如权利要求50或51所述的细胞,其中,所述细胞是人细胞。
53.如权利要求50-52中任一项所述的细胞,其中,所述细胞是原代细胞。
54.如权利要求50-53中任一项所述的细胞,其中,所述细胞是造血干细胞(HSC)。
55.如权利要求50-54中任一项所述的细胞,其中,所述细胞是T细胞或B细胞。
56.如权利要求50-55中任一项所述的细胞,其中,所述细胞是CD34+细胞。
57.如权利要求50-56中任一项所述的细胞,其中,所述细胞是离体的。
58.一种载体,所述载体包含如权利要求38-49中任一项所述的核酸。
59.如权利要求58所述的载体,其中,所述载体是腺相关病毒载体(AAV)。
60.如权利要求58或59所述的载体,其中,所述载体是自互补AAV(scAAV)。
61.一种用于细胞中HBB基因的同源定向修复(HDR)的系统,所述系统包含如权利要求59-60中任一项所述的载体和编码核酸酶的核酸。
62.如权利要求61所述的系统,其中,所述核酸酶是TALEN核酸酶。
63.如权利要求61所述的系统,其中,所述核酸酶是CAS核酸酶。
64.如权利要求61-63中任一项所述的系统,其中,所述载体和核酸被配置为共同递送至所述细胞。
65.如权利要求64所述的系统,其中,向所述细胞的共递送修饰内源性HBB基因座。
66.如权利要求61-65中任一项所述的系统,其中,所述细胞是哺乳动物细胞。
67.如权利要求61-66中任一项所述的系统,其中,所述细胞是人细胞。
68.如权利要求61-67中任一项所述的系统,其中,所述细胞是原代细胞。
69.如权利要求61-68中任一项所述的系统,其中,所述细胞是造血干细胞(HSC)。
70.如权利要求61-69中任一项所述的系统,其中,所述细胞是T细胞或B细胞。
71.如权利要求61-70中任一项所述的系统,其中,所述细胞是CD34+细胞。
72.如权利要求61-71中任一项所述的系统,其中,所述HBB基因与核苷酸序列SEQ IDNO:37具有至少95%同一性。
73.一种在有需要的受试者中促进HBB基因的HDR的方法,所述方法包括:
向受试者给予如权利要求50-57中任一项所述的细胞或如权利要求58-60中任一项所述的载体。以及
向所述受试者给予核酸酶。
74.如权利要求73所述的方法,其中,所述核酸酶是TALEN核酸酶。
75.如权利要求73所述的方法,其中,所述核酸酶是CAS核酸酶。
76.如权利要求73-75中任一项所述的方法,其中,所述核酸酶与所述细胞或与所述载体共同给予至所述受试者。
77.如权利要求73-76中任一项所述的方法,其中,所述给予包括过继细胞转移。
78.如权利要求73-77中任一项所述的方法,其中,所述细胞是人细胞。
79.如权利要求73-78中任一项所述的方法,其中,所述细胞是原代细胞。
80.如权利要求73-79中任一项所述的方法,其中,所述细胞是自体细胞。
81.如权利要求73-80中任一项所述的方法,其中,所述细胞是T细胞。
82.如权利要求73-81中任一项所述的方法,其中,所述细胞是HSC。
83.如权利要求73-82中任一项所述的方法,其中,所述细胞是CD34+HSC。
84.如权利要求73-83中任一项所述的方法,其中,所述受试者患有镰状细胞疾病。
85.如权利要求73-84中任一项所述的方法,其中,促进HDR引起对所述HBB基因的一个或多个编辑。
86.如权利要求85所述的方法,其中,所述对HBB基因的一个或多个编辑包括对镰状细胞突变的修正。
87.如权利要求86所述的方法,其中,所述镰状细胞突变包括E7V突变。
88.一种在有需要的受试者中治疗、抑制或缓解镰状细胞疾病(SCD)或与SCD相关的疾病症状的方法,所述方法包括:
向受试者给予如权利要求50-57中任一项所述的细胞或如权利要求58-60中任一项所述的载体;
向所述受试者给予核酸酶;以及
任选地将所述受试者鉴别或选择为将从接受用于SCD或与SCD相关的疾病症状的疗法中受益的受试者,和/或任选地在所述受试者中测量SCD的进展方面的改善或与SCD相关的疾病症状方面的改善。
89.如权利要求88所述的方法,其中,所述核酸酶是TALEN核酸酶。
90.如权利要求88所述的方法,其中,所述核酸酶是CRISPR/Cas核酸酶。
91.如权利要求88-90中任一项所述的方法,其中,所述核酸酶与所述细胞或与所述载体共同给予至所述受试者。
92.如权利要求88-91中任一项所述的方法,其中,所述细胞来自所述受试者,其中,通过向所述细胞中引入如权利要求*-*中任一项所述的核酸来对所述细胞进行遗传修饰。
93.如权利要求88-92中任一项所述的方法,其中,所述给予通过过继细胞转移进行。
94.如权利要求88-93中任一项所述的方法,其中,所述细胞是人细胞。
95.如权利要求88-94中任一项所述的方法,其中,所述细胞是原代细胞。
96.如权利要求88-95中任一项所述的方法,其中,所述细胞是自体细胞。
97.如权利要求88-96中任一项所述的方法,其中,所述细胞是T细胞。
98.如权利要求88-97中任一项所述的方法,其中,所述细胞是HSC。
99.如权利要求88-98中任一项所述的方法,其中,所述细胞是CD34+HSC。
100.如权利要求88-99中任一项所述的方法,所述方法进一步包括将所述细胞植入至受试者的骨髓中。
101.如权利要求100所述的方法,其中,所述细胞来自受试者,并且其中,所述细胞来自所述骨髓相同的受试者。
CN201980042235.8A 2018-04-27 2019-04-24 用以编辑血红蛋白相关突变的同源定向修复模板设计和递送 Pending CN112313334A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862663553P 2018-04-27 2018-04-27
US62/663,553 2018-04-27
US201962820521P 2019-03-19 2019-03-19
US62/820,521 2019-03-19
PCT/US2019/028861 WO2019209914A2 (en) 2018-04-27 2019-04-24 Homology-directed repair template design and delivery to edit hemoglobin-related mutations

Publications (1)

Publication Number Publication Date
CN112313334A true CN112313334A (zh) 2021-02-02

Family

ID=68295766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980042235.8A Pending CN112313334A (zh) 2018-04-27 2019-04-24 用以编辑血红蛋白相关突变的同源定向修复模板设计和递送

Country Status (7)

Country Link
US (1) US20210309995A1 (zh)
JP (1) JP2021521855A (zh)
KR (1) KR20210005179A (zh)
CN (1) CN112313334A (zh)
AU (1) AU2019261387A1 (zh)
CA (1) CA3106812A1 (zh)
WO (1) WO2019209914A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109486814A (zh) * 2017-10-31 2019-03-19 广东赤萌医疗科技有限公司 一种用于修复HBB1基因点突变的gRNA、基因编辑系统、表达载体和基因编辑试剂盒
CN113174433A (zh) * 2021-04-22 2021-07-27 中南大学 一种基于Cas蛋白的检测方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
CN113186203B (zh) * 2020-02-13 2022-12-30 斯微(上海)生物科技股份有限公司 治疗或者预防冠状病毒病的疫苗试剂
MX2022013254A (es) 2020-04-22 2023-01-24 BioNTech SE Vacuna contra el coronavirus.
WO2022232839A1 (en) * 2021-04-30 2022-11-03 The Board Of Trustees Of The Leland Stanford Junior University Methods for improved production of primary cd34+ cells
CA3226002A1 (en) * 2021-06-29 2023-01-05 Council Of Scientific & Industrial Research Engineered fncas9 and uses thereof
WO2023049458A1 (en) * 2021-09-24 2023-03-30 Maxcyte, Inc. A method of enhanced viral transduction using electroporation
CN114848851A (zh) * 2022-04-29 2022-08-05 广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院) 治疗β-地中海贫血的药物
US11878055B1 (en) 2022-06-26 2024-01-23 BioNTech SE Coronavirus vaccine

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009013559A1 (en) * 2007-07-23 2009-01-29 Cellectis Meganuclease variants cleaving a dna target sequence from the human hemoglobin beta gene and uses thereof
EP3981876A1 (en) * 2014-03-26 2022-04-13 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
CN107690480B (zh) * 2015-04-24 2022-03-22 爱迪塔斯医药公司 Cas9分子/指导rna分子复合物的评价

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109486814A (zh) * 2017-10-31 2019-03-19 广东赤萌医疗科技有限公司 一种用于修复HBB1基因点突变的gRNA、基因编辑系统、表达载体和基因编辑试剂盒
CN113174433A (zh) * 2021-04-22 2021-07-27 中南大学 一种基于Cas蛋白的检测方法
CN113174433B (zh) * 2021-04-22 2024-03-26 苏州淦江生物技术有限公司 一种基于Cas蛋白的检测方法

Also Published As

Publication number Publication date
CA3106812A1 (en) 2019-10-31
WO2019209914A3 (en) 2020-01-16
JP2021521855A (ja) 2021-08-30
US20210309995A1 (en) 2021-10-07
KR20210005179A (ko) 2021-01-13
AU2019261387A1 (en) 2020-11-19
WO2019209914A2 (en) 2019-10-31
EP3784783A2 (en) 2021-03-03

Similar Documents

Publication Publication Date Title
CN112313334A (zh) 用以编辑血红蛋白相关突变的同源定向修复模板设计和递送
CN111344395B (zh) 产生经修饰的自然杀伤细胞的方法及使用方法
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
AU2021204620A1 (en) Central nervous system targeting polynucleotides
KR20200064129A (ko) 트랜스제닉 선택 방법 및 조성물
KR20180097631A (ko) 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법
JP2023036921A (ja) 蝸牛および前庭細胞に核酸を送達するための物質および方法
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
US9353164B2 (en) Cardiac-specific nucleic acid regulatory elements and methods and use thereof
CN112218882A (zh) Foxp3在经编辑的cd34+细胞中的表达
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
KR20180034467A (ko) L-dopa의 전신 합성 및 조절
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
TW202317753A (zh) 經武裝之嵌合受體及其使用方法
CN115298307A (zh) 核酸调节元件的新组合及其方法和用途
CN115768890A (zh) 通过分子和物理启动对t细胞免疫疗法的热控制
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
CN115768901A (zh) 腺病毒的大负载整合
KR20220041214A (ko) Il-1 수퍼패밀리의 사이토카인의 시공적 제한 활성으로 무장된 면역반응성 세포
CN110484565A (zh) 一种基于腺相关病毒载体改造的自杀基因系统及其应用
CN114008209A (zh) Aav介导的枫糖尿症(msud)基因疗法
CN108159434B (zh) 一种基因载体及其用于治疗青光眼的基因治疗药物
CN107988259B (zh) SmartBac杆状病毒表达系统及其应用
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)
NL2027815B1 (en) Genomic integration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40046220

Country of ref document: HK