CN113302292A - 遗传修饰细胞的减少和最少的操作制造 - Google Patents

遗传修饰细胞的减少和最少的操作制造 Download PDF

Info

Publication number
CN113302292A
CN113302292A CN201980088336.9A CN201980088336A CN113302292A CN 113302292 A CN113302292 A CN 113302292A CN 201980088336 A CN201980088336 A CN 201980088336A CN 113302292 A CN113302292 A CN 113302292A
Authority
CN
China
Prior art keywords
seq
cells
aunp
antibody
fancf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980088336.9A
Other languages
English (en)
Inventor
J·E·阿达伊尔
R·沙赫巴齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fred Hutchinson Cancer Center
Original Assignee
Fred Hutchinson Cancer Research Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fred Hutchinson Cancer Research Center filed Critical Fred Hutchinson Cancer Research Center
Publication of CN113302292A publication Critical patent/CN113302292A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/28Bone marrow; Haematopoietic stem cells; Mesenchymal stem cells of any origin, e.g. adipose-derived stem cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/69Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit
    • A61K47/6921Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere
    • A61K47/6927Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere the form being a solid microparticle having no hollow or gas-filled cores
    • A61K47/6929Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere the form being a solid microparticle having no hollow or gas-filled cores the form being a nanoparticle, e.g. an immuno-nanoparticle
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • C07K16/2812Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against CD4
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2896Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against molecules with a "CD"-designation, not provided for elsewhere
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N11/00Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
    • C12N11/02Enzymes or microbial cells immobilised on or in an organic carrier
    • C12N11/08Enzymes or microbial cells immobilised on or in an organic carrier the carrier being a synthetic polymer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N11/00Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
    • C12N11/02Enzymes or microbial cells immobilised on or in an organic carrier
    • C12N11/08Enzymes or microbial cells immobilised on or in an organic carrier the carrier being a synthetic polymer
    • C12N11/089Enzymes or microbial cells immobilised on or in an organic carrier the carrier being a synthetic polymer obtained otherwise than by reactions only involving carbon-to-carbon unsaturated bonds
    • C12N11/091Phenol resins; Amino resins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y5/00Nanobiotechnology or nanomedicine, e.g. protein engineering or drug delivery
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Cell Biology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nanotechnology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Hematology (AREA)
  • Virology (AREA)
  • Medical Informatics (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicinal Preparation (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

描述了用于遗传修饰已进行了减少或最少的操作的生物样品中所选细胞类型的纳米颗粒。所述纳米颗粒递送精确基因组工程所需的所有组分并克服与当前临床实践相关的许多缺点以出于治疗目的遗传工程化细胞。

Description

遗传修饰细胞的减少和最少的操作制造
相关申请的交叉引用
本申请要求2018年12月5日提交的美国临时专利申请号62/775,721的优先权,所述临时专利申请以引用的方式整体并入本文,就如同在本文中全面陈述一样。
关于序列表的声明
与本申请相关的序列表以文本文件格式代替纸质副本提供,并且特此以引用的方式并入本说明书中。含有序列表的文本文件的名称是F053-0091 PCT_ST25.txt。文本文件是296KB,在2019年12月5日创建,并且经由EFS-Web电子提交。
技术领域
本公开提供了以减少的或最少的操作遗传修饰所选的细胞类型的纳米颗粒。纳米颗粒递送精确基因组工程所需的所有组分并克服与当前临床实践相关的许多缺点以出于治疗目的遗传工程化细胞。
背景技术
患者特异性基因疗法具有治疗遗传性、感染性和恶性疾病的巨大潜力。例如,逆转录病毒介导的基因添加到造血干细胞(HSC)以及造血干细胞和祖细胞(HSPC)中在过去10年中已经证明了对几种遗传疾病的治疗结果,所述疾病包括遗传性免疫缺陷(例如,X连锁和腺苷脱氨酶缺乏的重症联合免疫缺陷(SCID))、血红蛋白病、Wiskott-Aldrich综合征和异染性脑白质营养不良。此外,这种治疗方法还改善了不良预后诊断诸如成胶质细胞瘤的结果。与来自供体的细胞相反,使用基因校正的自体或“自身”细胞消除了移植物-宿主免疫应答的风险,从而不需要免疫抑制药物。
目前临床医学中使用的系统缺乏将基因编辑组分递送至HSC和HSPC以及其他血细胞类型的最佳方法。例如,CRISPR-Cas9平台是临床环境中用于HSPC中的基因编辑的一种方法。如果目的是基因破坏,则仅需要电穿孔来递送基因编辑组分。然而,电穿孔对许多细胞类型有毒性,并且在起始细胞数低的情况下,这种毒性对于使用HSC和/或HSPC的疗法尤其成问题。
如果目的是插入新的遗传物质,则必须包括用于同源定向修复的DNA模板。如果新的遗传物质较小,这可以通过在单链DNA(ssDNA)模板中进行电穿孔来实现,但是对于较大的模板,使用腺相关病毒载体(AAV)是目前临床实践中的黄金标准。无论单独使用电穿孔还是与AAV组合使用电穿孔,都不能保证将要递送的所有单独的基因编辑组分都递送到相同的细胞中。此外,电穿孔依赖于细胞膜的机械破坏和透化,因此损害了细胞的活力,使得它们对于治疗性用途来说不太理想。此外,与基于病毒的方法一样,电穿孔不能选择性地将基因从异质池中递送到特定细胞类型,因此必须在其之前进行细胞选择和纯化过程。细胞选择和纯化过程是导致不期望的高毒性水平的苛刻过程。最后,当细胞再灌注时,AAV处理具有免疫原性潜力。
可简化所需步骤并确保将所有组分递送至预期细胞类型的递送基因编辑组分的任何改进方法都将是临床医学领域的显著改进。已经提出了诸如聚合复合物和脂质体复合物的纳米颗粒,但是这些已经表明是有毒性的,证明了有限的基因编辑组分递送效率以及在HSC和HSPC中有限的基因编辑功效。
发明内容
本公开提供了允许以减少的和最少的操作对所选细胞类型进行选择性遗传修饰的纳米颗粒(NP)。减少的操作意味着不需要使用电穿孔和病毒载体,诸如AAV。最少的操作意味着不需要使用电穿孔、病毒载体以及细胞选择和纯化过程。此外,本公开还提供了特异性工程化以递送基因组编辑所需的所有组分的NP。NP可用于需要功能丧失突变的疗法,但重要的是,也可提供基因添加或特定突变的校正所需的所有组分。所描述的方法是安全的(即,没有脱靶毒性)、可靠的、可扩展的、易于制造的、合成的和即插即用的(即,相同的基础平台可用于递送不同的治疗性核酸)。
附图说明
本文提交的许多附图利用彩色更好地理解。申请人将附图的彩色版本视为原始提交的一部分,并保留在以后的程序中呈递附图的彩色图像的权利。
图1A-1C.(图1A)目前临床上使用的用于离体基因编辑的系统缺乏用于HSC、HSPC和其他血细胞的最佳递送方法。如(图1A)所示,目前临床上使用的方案包括8个步骤:(1)动员和单采;(2)靶细胞类型的免疫磁性分离(例如,图1A中的CD34+HSPC);(3)用重组生长因子(rhGF)刺激培养基中的分离细胞;(4)电穿孔细胞以递送基因编辑组分(例如,图1A中的CRISPR/Cas9核糖核蛋白);(5)电穿孔后孵育培养基和rhGF中的细胞;(6)用携带基因编辑供体模板的病毒载体(例如,图1A中的腺相关病毒载体(AAV))转导;(7)进一步孵育培养基和rhGF中的细胞;和(8)用于再输注到受调节的患者中的细胞收获。临床医学的目的是减少和最少的操作制造。(图1B)减少的操作制造不需要电穿孔或病毒载体递送,但仍可利用靶细胞纯化过程。如(图1B)所示,本文公开的NP可用于减少对(图1A)的步骤3-6的依赖。(图1C)在一些实施方案中,最少操作离体制造不需要分离所选的细胞类型、电穿孔或病毒介导的基因编辑组分递送,因此极大地提高了离体细胞制造的效率。本文公开的具有靶向配体的NP进一步减少对图1A的步骤2-7的依赖,并且不需要使用细胞选择和纯化过程。
图2(现有技术).CD34+CD45RA-CD90+细胞负责血液再繁殖。通过流式分选将非人灵长类CD34+细胞分离成部分i(CD45RA-CD90+)、ii(CD45RA-CD90-)和iii(CD45RA+CD90-),然后用编码绿色荧光蛋白、mCherry或mCerulean的LV转导并移植到骨髓消融的自体受体中。在所有情况下,血细胞植入仅对应于CD34+CD45RA-CD90+(部分i)细胞。
图3(现有技术).移植的CD34高CD45RA-CD90+细胞/kg体重与嗜中性粒细胞和血小板植入的对数相关性(Spearman等级相关系数R2:0.0-0.19=非常弱,0.20-0.39=弱,0.4-0.59=中等,0.6-0.79=强,0.8-1.0=非常强)。线性回归和95%置信区间分别用实线和虚线表示。
图4.当施用给人时,AuNP尺寸决定目标组织/消除途径。
图5A-5D.示意图表示NP的合成和结构。(图5A)金纳米颗粒(AuNP)的早期生产方案的示意图,金纳米颗粒是具有已确立的体内相容性的可扩展的合成递送支架。(图5B)用于产生和负载具有示例性基因编辑组分的AuNP的合成方法的示意图。一个描绘的AuNP示出连接到AuNP表面的crRNA。然后将Cpf1核酸酶和ssDNA连接到crRNA上。另一个描绘的AuNP示出连接到18-乙二醇间隔物的crRNA,其具有连接到19nm AuNP核心的表面的硫醇修饰。CRISPR核酸酶连接到cRNA以形成RNP。AuNP涂覆有低分子量(MW(例如,2000))聚乙烯亚胺(PEI)。将ssDNA层压在PEI涂覆的表面上。(图5C)Au/CRISPR NP组装过程的示意图。1)合成并纯化AuNP核心。2)具有间隔臂和硫醇基团的crRNA缀合到金(Au)核心的表面。3)通过CRISPR核酸酶与crRNA的相互作用在表面上形成RNP复合物。4)用2K MW的PEI涂覆RNP复合物。5)通过与PEI的静电相互作用在表面上捕获ssDNA模板。(图5D)描绘本文所述的AuNP的另一个示意图。
图6A-6E.具有所选的细胞靶向配体的示例性AuNP。(图6A)配置有用于基因添加和细胞靶向的所有组分的示例性AuNP的描绘。所描述的组分包括crRNA、Cpf1核酸酶和单链DNA(ssDNA)以提供治疗性核酸序列(例如基因或其校正部分)。靶向配体包括适体。(图6B)可用于递送大的寡核苷酸的替代的配制的“分层”AuNP的示意图,所述大的寡核苷酸诸如包括同源定向修复模板(HDT)的供体模板、治疗性DNA序列和其他潜在元件。供体模板比所描绘的核糖核蛋白复合物(RNP)离AuNP表面更远。还描绘了适体靶向配体。(图6C)图5D中所示的设计,其中适体靶向配体通过直接氨基酸连接件连接到核酸酶。(图6D)图5D中所示的设计,其中适体靶向配体通过聚乙二醇(PEG)系链连接到核酸酶。(图6E)图5D中所示的设计,其中抗体靶向配体通过胺-巯基交联剂或直接氨基酸连接件连接到核酸酶。还提供了通过PEG系链连接的抗体靶向配体。
图7A、7B.CCR5基因上的靶向基因座。(图7A)靶基因座具有针对Cpf1和Cas9二者的PAM位点,在中间具有20bp的指导区段(SEQ ID NO:1)。(图7B)用8bp Notl识别序列插入片段和40bp长的对称同源臂在切割位点周围设计HDT(SEQ ID NO:2)。
图8A、8B.γ-珠蛋白基因启动子内的靶向基因座。(图8A)靶基因座具有针对Cpf1和Cas9二者的PAM位点,在中间具有21 bp的指导区段(SEQ ID NO:3)。(图8B)用13bp HPFH缺失和30bp长的对称同源臂在切割位点周围设计HDT(SEQ ID NO:4)。
图9.完全负载的AuNP是单分散的并且显示良好的ζ电位。
图10A-10D.示出合成的AuNP的特征性质和最佳负载浓度的图和数字图像。(图10A)合成的AuNP的局部表面等离子体共振(LSPR)峰。(图10B)AuNP和Au/CRISPRNP的LSPR峰。(图10C)示出最佳AuNP/ssDNA w/w负载比的凝胶电泳。(图10D)Au/CRISPR NP的负载浓度。
图11A,11B.最佳负载浓度。(图11A)AuNP/crRNA 50nm(比率6);AuNP/crRNA 15nm(比率1);和AuNP/crRNA/Cpf1/PEI/DNA 15nm(比率0.5)。(图11B)在相同的起始试剂量下,较小的AuNP将可用表面积增加三倍。通过减小尺寸,NP的表面积和缀合比增加。
图12A-12E.(12A)CRISPR组分逐层缀合到AuNP上。(图12B)在每个分层步骤之后,AuNP的动态光散射表征。在添加各层之后,尖锐的单峰和尺寸变化表明与表面的精确连接。(图12C)在每个分层步骤后,AuNP的平均尺寸(Z-平均,标绘在右轴上的柱状图)和多分散指数(PDI,标绘在左轴上的点)。PDI值<0.2示出高单分散性而没有聚集。数据为平均值±s.e(n=3)。(图12D)添加各组分后AuNP的LSPR中的红移证实了物质负载。(图12E)添加各层后的ζ电位测量从AuNP的-26mV变为最终Au/CRISPRNP的+27mV。数据为平均值±s.e(n=3)。
图13A-13D.Cpf1和ssDNA的最佳量的表征。(图13A)不同AuNP/Cpf1 w/w比的NP的尺寸分析。一式三份进行测量。(图13B)不同AuNP/Cpf1 w/w比的Z平均值和PDI值。发现AuNP/Cpf1 w/w比为0.6在尺寸和PDI方面是最佳的。一式三份进行测量。(图13C)不同AuNP/ssDNA w/w比的NP的尺寸分析。一式三份进行测量。(图13D)不同AuNP/ssDNA w/w比的Z平均值和PDI值。发现AuNP/ssDNA w/w比为1在尺寸和PDI方面是最佳的。一式三份进行测量。
图14A-14E.Au/CRISPR NP可以向HSPC的细胞核递送CRISPR组分。(图14A)HSPC在体外吸收完全负载的AuNP。(图14B)向培养物中添加Au/CRISPR NP后原代人CD34+HSPC的细胞核(蓝色,Hoechst)。(图14C)荧光团标记的crRNA(绿色,Alexa488)用于追踪细胞质和细胞核中的细胞生物分布。(图14D)荧光团标记的ssDNA(红色,Alexa660)也存在于细胞质和细胞核中。图像最左侧的可见小囊泡表明通过胞吞作用被动摄取。(图14E)所有三种染色的重叠示出crRNA和ssDNA的共定位。通过共焦显微镜以Z-堆叠模式和60x放大倍数获得图像。
图15A-15C.Au/CRISPR NP对原代人CD34+HSPC无毒性。(图15A、15B)24小时(上图)和48小时(下图)后的活-死活力测定结果。Au/CRISPR NP处理组的细胞活力高于70%,并且与模拟处理组相似。(图15C)通过台盼蓝染料排除测定的细胞活力。测定结果与活-死测定结果密切相关。
图16A-16D.图示出K562细胞和CD34+细胞中的基因切割效率的图。(图16A)用AuNP和电穿孔方法递送后的活力百分比。(图16B)CRISPR组分的施用剂量。(图16C、16D)通过分解追踪插入缺失(TIDE)测定结果示出K562细胞和CD34+细胞中的切割效率百分比。
图17,在获自G-CSF动员的健康成年供体的原代CD34+细胞中体外观察到高达10%的基因编辑和HDR。使用快速解冻方法解冻CD34+细胞,并在含有10%FBS和1%Pen/Strep的Iscove改良Dulbecco培养基(IMDM)中培养过夜。次日早晨,AuNP如下产生晶种并组装:产生晶种;添加具有PEG间隔物的crRNA以防止静电排斥;添加Cpf1蛋白并允许RNP形成;用2K支化PEI和单链寡核苷酸(ssODN)涂覆。在本实施例中,除了末端硫醇添加以外,不存在crRNA的化学修饰以促进与AuNP表面的共价键合用于连接。将ssODN用作HDT,此处为使用Notl位点的8bp插入片段,其侧接与CCR5靶基因座同源(对称)的40nt。将配制的AuNP添加到细胞中并在温和的板混合下孵育48小时。48小时后,收获细胞,洗涤,分离基因组DNA(gDNA)用于PCR扩增和分析。
图18.TIDE测定结果示出在CD34+细胞中用Au/CRISPR NP(15nm、50nm和100nm)编辑后的插入缺失。
图19A-19C.移植到NSG小鼠中的细胞的体外分析。(图19A)在移植时,通过TIDE观察到10%HDR,在人CD34+细胞的靶基因座处没有显著的插入缺失。(图19B)仅在接受完全负载的AuNP的细胞中观察到T7核酸内切酶I(T7EI)和Notl二者的限制性消化。(图19C)有趣的是,仅当细胞用AuNP处理时,才注意到该供体的集落形成能力增加。在每种条件下形成的菌落类型中没有观察到显著差异。
图20.移植后早期分析表明基因编辑的细胞植入。在移植后6周收集外周血用于gDNA分析。在用完全负载的AuNP处理的所有小鼠中,7/10通过TIDE示出0.5-6%的可检测的编辑。在一只小鼠(5%总编辑)中,通过TIDE分析观察到1.7%HDR。
图21A-21D.HDR条件和最佳编辑剂量的优化。(图21A)针对非靶链设计的HDT表现出较高水平的Notl插入。数据为平均值±s.e(n=3)。(图21B)示出相关消化条带的T7EI和NotI限制酶消化。(图21C)不同Au/CRISPR NP浓度在原代人HSPC中对HDR的影响。数据为平均值±s.e(n=3)。(图21D)超过20μg/mL的浓度对CD34+细胞具有毒性作用。数据为平均值±s.e(n=3)。通过双样品t检验确定统计显著性。
图22A-22C.不同血清条件和转染组分对基因编辑的影响。(图22A)在不同条件下处理48小时后的细胞活力。数据为平均值±s.e(n=3)。(图22B)通过TIDE测定的总编辑水平。数据为平均值±s.e(n=3)。(图22C)通过TIDE测定的HDR水平。数据为平均值±s.e(n=3)。
图23A-23F.携带Cpf1的Au/CRISPR NP在HDR方面胜过Cas9。(图23A)通过TIDE测定的总编辑结果。Au/CRISPR NP提高了Cas9在CCR5基因座处的切割效率。数据为平均值±s.e(n=3)。(图23B)通过TIDE测定的HDR结果示出与Cas9相比,使用Cpf1的Notl插入水平更高。对于Au/CRISPR NP递送的Cpf1和Cas9二者观察到的HDR水平高于电穿孔。数据为平均值±s.e(n=3)。通过双样品t检验确定统计显著性。(图23C)Miseq分析证实了通过TIDE测定观察到的趋势。数据为平均值±s.e(n=3)。通过双样品t检验确定统计显著性。(图23D)使用Au/CRISPR NP和电穿孔方法用CRISPR Cpf1和Cas9处理后CD34+细胞的细胞活力。所有研究组的细胞活力均高于70%。数据为平均值±s.e(n=3)。通过进行单向ANOVA确定统计显著性。(图23E)示出总集落数的集落形成细胞(CFC)测定结果。数据为平均值±s.e(n=3)。(图23F)CFC测定结果示出不同菌落的百分比。数据为平均值±s.e(n=3)。
图24A、24B.再铺板的CFC测定示出处理对长期祖细胞的集落形成潜力的影响。(图24A)示出总集落数的CFC测定结果。数据为平均值±s.e(n=3)。(图24B)示出不同集落的百分比的CFC测定结果。数据为平均值±s.e(n=3)。
图25.通过Miseq分析的γ-珠蛋白基因启动子内的靶向基因座的HDR结果示出Cpf1的13bp缺失谱水平高于Cas9。数据为平均值±s.e(n=3)。
图26.AuNP处理的CD34+细胞在体内植入。使用与关于图17所述相同的程序,不同之处在于CD34+细胞最初获自不同的人供体。48小时后,收获细胞,洗涤,并注射到亚致死辐射的成年(8-12周)NSG小鼠中。细胞储备用于评估平板集落测定并且分离gDNA用于PCR扩增和分析。
图27A-27G.AuNP处理增强NSG小鼠中的HSPC植入。(图27A、27B)如通过NSG受体的外周血中表达人CD45的细胞的百分比所测量的植入。AuNP和Au/CRISPR-HDT-NP处理的细胞比模拟处理的细胞植入得更好。数据是平均值±s.e(对于Au/CRISPR-HDT-NP,n=10,对于AuNP,n=10,对于模拟,n=5,对于未注射,n=4)。通过双样品t检验确定统计显著性。(图27C)外周血中的人CD20+B细胞植入动力学。(图27D)外周血中的人CD14+单核细胞植入动力学。(图27E)外周血中的人CD3+T细胞植入动力学。(图27F)示出骨髓样品的总集落数的CFC测定。CFC结果与植入结果密切相关。数据为平均值±s.e(n=3)。通过双样品t检验确定统计显著性。(图27G)示出不同形态的频率的CFC测定结果。数据为平均值±s.e(n=3)。
图28.小鼠体重在研究过程中是稳定的。追踪不同队列的小鼠体重。数据是平均值±s.e(对于Au/CRISPR-HDT-NP,n=10,对于AuNP,n=10,对于模拟,n=5,对于未注射,n=4)。
图29A-29D.用Au/CRISPR NP处理后尸检样品中细胞群体的植入水平。(图29A)骨髓中的植入水平。数据是平均值±s.e(对于Au/CRISPR-HDT-NP,n=10,对于AuNP,n=10,对于模拟,n=5)。(图29B)脾中的植入水平。数据是平均值±s.e(对于Au/CRISPR-HDT-NP,n=10,对于AuNP,n=10,对于模拟,n=5)。(图29C)胸腺中的植入水平。数据是平均值±s.e(对于Au/CRISPR-HDT-NP,n=10,对于AuNP,n=10,对于模拟,n=5)。(图29D)外周血中的植入水平。数据是平均值±s.e(对于Au/CRISPR-HDT-NP,n=10,对于AuNP,n=10,对于模拟,n=5)。
图30A、30B.(图30A)在植入前Au/CRISPR NP处理的细胞的集落形成潜力。示出植入前的总集落数的CFC测定。数据为平均值±s.e(n=3)。通过双样品t检验确定统计显著性。(图30B)示出不同集落的百分比的CFC测定结果。数据为平均值±s.e(n=3)。
图31.用Au/CRISPR NP处理后的代表性菌落形态。爆裂形成单位-红细胞(BFU-E),粒细胞单核细胞(GM)。
图32A-32E.植入后的持续编辑水平。(图32A)植入前的总编辑和HDR水平的TIDE测定结果。(图32B)总编辑水平的追踪。从移植后4周开始,每隔一周收集外周血样品。数据为平均值±s.e(n=10)。(图32C)植入后HDR水平的追踪。数据为平均值±s.e(n=10)。(图32D)尸检时外周血、骨髓和脾中的总编辑水平。数据为平均值±s.e(n=10)。(图32E)尸检时外周血、骨髓和脾中的HDR水平。数据为平均值±s.e(n=10)。
图33.用Au/CRISPRNP处理后的Notl和T7EI限制酶消化。
图34.crRNA、HDT和引物的序列(SEQ ID NO:5-19)。
图35A-35D.(图35A)CCR5上Cpf1和Cas9的潜在脱靶切割位点和γ-珠蛋白靶位点(SEQ ID NO:20-27)。(图35B)用于遗传性持续性胎儿血红蛋白增多症(HPFH)的Cas9和Cpf1指导序列和HDR模板(SEQ ID NO228-52和214-224)。每个指导序列跨越特定突变。提供了可用于crRNA合成的靶DNA序列。(图35C)由用于遗传工程的DNA靶位点(SEQ ID NO:20-22、24-26、28-32、42、43、84-97、和214-224)转录的RNA序列(SEQ ID NO:225-262)。(图35D)表提供了DNA靶位点、cRNA序列和HDT的互补组。
图36.支持本公开的其他序列(SEQ ID NO:112-138)。
具体实施方式
基因疗法具有治疗遗传性、感染性和恶性疾病的巨大潜力。例如,逆转录病毒介导的基因添加到造血干细胞(HSC)以及造血干细胞和祖细胞(HSPC)中在过去10年中已经证明了对几种遗传疾病的治疗结果,所述疾病包括遗传性免疫缺陷(例如,X连锁和腺苷脱氨酶缺乏的重症联合免疫缺陷(SCID))、血红蛋白病、Wiskott-Aldrich综合征和异染性脑白质营养不良。此外,这种治疗方法还改善了不良预后诊断诸如成胶质细胞瘤的结果。使用基因校正的自体或“自身”细胞,而不是来自供体的细胞,消除了基于细胞的遗传疗法的包括移植物-宿主免疫应答在内的许多风险,从而不需要免疫抑制药物。
目前,临床系统缺乏将基因编辑组分递送到许多细胞类型的最佳方法。例如,对于造血干细胞(HSC)以及造血干细胞和
祖细胞(HSPC),目前的最新技术包括通过骨髓抽吸物或动员的外周血从患者中除去细胞,通过表达表面标记物CD34的细胞的免疫选择将该大群体分选为自体HSPC,然后在细胞因子存在下培养这些细胞。如果目的是破坏存在问题的基因,则使用电穿孔将基因编辑组分递送到细胞。电穿孔通常是指对细胞施加电场以增加细胞膜的渗透性,从而允许分子通过而引入细胞中。电穿孔对许多细胞类型有毒性,并且在起始细胞数低的情况下,这种毒性对于使用HSC和/或HSPC的疗法尤其成问题。
如果目的是将新的遗传物质插入细胞中,则必须包括用于同源定向修复的DNA模板。如果新的遗传物质较小,这可以仅通过电穿孔来实现,但是对于较大形式的遗传物质,另外使用腺相关病毒载体(AAV)是目前临床实践中的黄金标准。仍然存在与使用病毒载体进行基因转移相关的遗传毒性和其他限制的已知风险。例如,在用HSPC基因疗法治疗的患者中,由于插入诱变引起的恶性肿瘤的发展证明了遗传毒性的风险。这种不利的副作用源于逆转录病毒介导的转基因递送到宿主细胞基因组中的半随机性质。插入的转基因序列对附近基因的调节异常是在一些基因疗法患者中观察到的克隆扩增和恶性转化的分子基础,但是插入的转基因和周围基因组环境之间的相互作用也可以导致转基因减弱或沉默,从而降低治疗效果。与特定病毒载体的使用相关的其他限制包括免疫应答的诱导,在分裂细胞中随时间的功效降低(例如腺相关载体),不能在体内充分靶向所选细胞类型(例如逆转录病毒载体),以及如所指示的,不能控制插入位点和插入数目(例如慢病毒载体)。
最近几年已经看到基因编辑作为逆转录病毒介导的基因转移的更安全的替代方案,通过开发工程化指导RNA以及靶向特定DNA序列并在靶向序列处可预测地产生DNA双链断裂(DSB)的核酸酶而使其成为可能。迄今为止,当需要去除或沉默有问题的基因(即,产生功能丧失突变)时,这些可编程复合物在提供有前景的疗法方面最有效。这是因为DSB最常通过易错的非同源末端连接(NHEJ)修复,这导致在DSB位点处的寡核苷酸插入和缺失(插入缺失)。
对于基因添加或特定突变的校正,需要DSB的较不常见的同源定向修复(HDR)。在这种情况下,必须共同递送包括工程化的指导RNA和核酸酶以及同源定向修复模板的更复杂的有效负载。本方法的概念验证已在HSPC中得到证实,但也需要一些基因编辑组分的串联电穿孔,随后用非整合病毒载体、特别是重组腺相关病毒(rAAV)载体转导以递送DNA模板,或在指定细胞浓度下,限定浓度的工程化核酸酶组分与化学修饰的单链寡核苷酸模板的同时电穿孔。此外,每个工程化的指导RNA、核酸酶和同源定向修复模板必须被独特地工程化用于每个特定的遗传靶标,这需要对细胞系和HSPC中的递送、活性和特异性进行单独的评估。
无论单独使用电穿孔还是与AAV组合使用电穿孔,都不能保证将基因编辑所需的所有单独组分递送到相同细胞中。此外,电穿孔和许多病毒载体不能选择性地将基因从异质池中递送到特定细胞类型,因此必须在这些处理之前进行细胞选择和/或纯化过程。细胞选择和纯化过程是可导致细胞毒性或丧失适合度的操作。这样的一个实例是血液干细胞,其在操作时可以开始分化,导致植入潜力的丧失,因为更分化的血细胞不能支持长期的血液产生。
因此,尽管在基因组内的特定位点进行遗传疗法的能力有许多令人激动的突破,但安全且有效的递送载体的持续缺乏阻碍了基因编辑系统的临床翻译,特别是HSC/HSPC。
毒性降低并且可简化确保将所有基因编辑组分递送到细胞所需的步骤的任何改进的将基因编辑组分递送到细胞的方法都将是临床医学的显著改进。从逻辑角度来看,同样考虑到操作自体细胞产品所需的复杂基础设施,具有更局部和流线型的制造过程将减少静脉到静脉的时间,这在某些疾病情况下可能是重要的。已经提出了纳米颗粒诸如聚合复合物和脂质体复合物,但是这些已经表明对细胞毒性太大,并且证明将基因编辑组分递送到例如HSPC的效率有限。
本公开提供了允许以减少的和最少的操作对所选细胞类型进行选择性遗传修饰的纳米颗粒(NP)。减少的操作意味着不需要使用电穿孔和病毒载体,诸如AAV。在特定的实施方案中,减少的操作意味着不使用电穿孔和病毒载体,诸如AAV。最少的操作意味着不需要使用电穿孔、病毒载体以及细胞选择和纯化过程。在特定的实施方案中,最少的操作意味着不使用电穿孔、病毒载体和细胞选择和纯化过程。在特定的实施方案中,最少的操作意味着在暴露于本文公开的NP之前,仅洗涤含有所选血细胞类型的样品以除去血小板。如本文别处将更详细描述的,NP是否用于减少的操作或最少的操作过程取决于细胞靶向配体是否与NP缔合。
靶向配体包括例如抗体、适体、配体或指定NP与目标细胞类型相互作用的其他分子。所选的细胞靶向配体可包括表面锚定的靶向配体,其选择性地将NP结合到所选细胞并引发细胞摄取。在特定的实施方案中,细胞摄取可由受体诱导的胞吞作用介导。如本文别处更详细公开的,所选的细胞靶向配体可包括抗体、scFv蛋白、DART分子、肽和/或适体。特定实施方案利用识别CD3、CD4、CD34、CD90、CD133、CD164、促黄体生成激素释放激素(LHRH)受体、芳基烃受体(AHR)或CD46的抗体、抗体结合片段或适体来靶向HSC。特定的实施方案包括抗人CD3抗体、抗人CD4抗体、抗人CD34抗体、抗人CD90抗体、抗人CD133抗体、抗人CD164抗体、抗人CD133适体、人黄体生成激素、人绒毛膜促性腺激素(hCG,LHRH受体的配体)、醋酸地格瑞克(LHRH受体的拮抗剂)或StemRegenin 1(AHR的配体)中的一种或多种作为靶向配体。
当将公开的NP添加到细胞的异质混合物(例如,离体血液产品)中时,工程化的NP结合到所选细胞群体,并内化到靶细胞中。本过程为NP携带的遗传工程组分提供了入口,因此所选细胞被遗传修饰。在单个颗粒上提供遗传工程所需的所有组分确保摄取颗粒的细胞接受所有必需的组分而不是其子集。通过将NP靶向期望的细胞群体,细胞选择(免疫磁性或其他)不再是必需的。
本文公开的NP的使用加速了治疗性细胞的离体制造,并且在加工和遗传工程期间产生较少的细胞损害。在特定的实施方案中,这种方法还减少了从患者细胞的收获到遗传修饰的血细胞产物的再输注的时间量
在特定的实施方案中,本文公开的NP是金纳米颗粒(AuNP)。具体地,AuNP已经表明对非分裂和分裂的哺乳动物细胞均无毒性,并且已经在临床试验中应用于RNA治疗剂的体内递送。此外,由于它们独特的表面化学,AuNP可以负载有基因编辑所需的所有组分。如本文更详细描述的,基因编辑组分可以以特别设计的分层构造连接到NP,所述分层构造在例如尺寸、多分散指数和基因编辑效率方面优化NP的功能和表征。
特定的实施方案包括具有提供靶向的功能丧失突变的组分的NP。这些实施方案包括与NP表面缔合的靶向元件(例如指导RNA)和切割元件(例如核酸酶)。在特定的实施方案中,靶向元件通过硫醇接头缀合到NP的表面。在特定的实施方案中,靶向元件和/或切割元件通过硫醇接头缀合到NP的表面。在特定的实施方案中,靶向元件通过硫醇接头缀合到NP的表面,并且切割元件连接到靶向元件以形成核糖核蛋白(RNP)复合物。靶向元件将切割元件靶向到特定位点以进行切割和NHEJ修复。
特定的实施方案包括具有提供靶向的功能获得突变(例如基因添加或校正)的组分的NP。在特定的实施方案中,这些实施方案包括与靶向元件、切割元件、同源定向修复模板(HDT)和治疗性DNA序列缔合的金属NP(例如AuNP)。靶向元件将切割元件靶向到特定位点以进行切割,同源定向修复模板提供HDR修复,其中在HDR修复后,治疗性DNA序列已插入靶位点内。同源定向修复模板和治疗性DNA序列一起在本文中可称为供体模板。在特定的实施方案中,靶向元件通过硫醇接头缀合到NP的表面。在特定的实施方案中,靶向元件和/或切割元件通过硫醇接头缀合到NP的表面。在特定的实施方案中,靶向元件通过硫醇接头缀合到NP的表面,并且切割元件连接到靶向元件以形成核糖核蛋白(RNP)复合物。在这些实施方案中,RNP复合物比供体模板材料更接近NP的表面。当例如靶向元件和/或切割元件是细菌来源时,这种构造是有益的。这是因为许多可能接受本文所述NP的个体可能对细菌来源的组分(诸如细菌来源的基因编辑组分)具有预先存在的免疫力。在完全配制的NP的内层上包括细菌来源的基因编辑组分允许非细菌来源的组分(例如供体模板)屏蔽细菌来源的组分(例如靶向元件和/或切割元件)不受患者免疫系统的影响。这保护细菌来源的组分免受攻击,并且还避免或减少施用后对NP的不希望的炎症应答。此外,这可以允许在体内重复施用NP而不被宿主免疫应答灭活。
特定的实施方案可以利用与至少四个层缔合的AuNP,其中第一层包含CRISPR(成簇规则间隔短回文重复序列)指导RNA(crRNA),第二层包含核酸酶,第三层包含ssDNA,并且第四层包含靶向配体,其中第一层最接近NP核心的表面,第二层第二接近NP核心的表面。第三层第三接近纳米颗粒核心,并且第四层离NP核心最远。在特定的实施方案中,层是指与NP缔合的层,其包含用于所选细胞群体的遗传修饰的组分,包括crRNA、核酸酶、供体模板、靶向配体和/或用于产生包括接头和聚合物(例如聚乙二醇(PEG)和聚乙烯亚胺(PEI))的层的组分。
特定的实施方案利用CRISPR基因编辑。在特定的实施方案中,CRISPR基因编辑可以使用CRISPR指导RNA(crRNA)和/或CRISPR核酸酶(例如,Cpf1(也称为Cas12a)或Cas9)进行。
特定的实施方案采用增加HDR效率和/或准确性的特征结构。例如,Cpf1具有短的单个crRNA并以具有5’2-4个核苷酸(nt)突出端(称为粘性末端)的交错形式切割靶DNA。粘性末端有利于HDR,Kim等人(2016)Nat Biotechnol.34(8):863-8。而且,在进行RNP切割基因组以促进HDR之前,应从NP中释放供体模板。因此,在本文公开的特定的实施方案中,发现供体模板比靶向元件和切割元件离NP的表面更远。本公开还出乎意料地发现在AuNP上递送基因编辑组分增加了HDR的效率和/或准确性。因此,特定的实施方案利用AuNP递送基因编辑组分。
基于期望的治疗结果,针对个体患者定制用于遗传工程的特定物质。当靶向配体未被包含作为NP的组分时,NP提供减少的操作制造,从而不需要利用电穿孔和病毒载体递送。包含靶向配体允许最少的操作制造,从而不需要进行细胞选择和纯化过程。
在向减少或最少操作的血细胞产品中添加NP后,进行一段时间的孵育。此后,可以任选地洗涤细胞产品以除去过量的NP并再施用给患者。在特定的实施方案中,可存储细胞。存储可包括室温、冷藏(2-8℃)或低温保存(≤20℃,包括在液氮或气相中存储)条件,这取决于患者准备再输注所需的时间长度。生物样品可以在暴露于NP之前和/或之后再输注给患者之前进行冷冻保存。
本公开的各方面现在以如下另外的细节和选项中来描述:(I)基因编辑系统和组分;(II)纳米颗粒及其与基因编辑组分的缀合;(III)基因编辑效率;(IV)所选细胞和所选细胞靶向配体;(V)细胞群体的来源和加工;(VI)细胞的配制和冷冻保存;(VII)纳米颗粒配制;(VIII)试剂盒;(IX)示例性使用方法;(X)示例性制造方案和比较;(XI)评估纳米颗粒性能的测定;(XII)示例性实施方案;(XIII)实验实施方案;和(XIV)结束段落。
(I)基因编辑系统和组分。在本公开的教导内,可以使用能够精确序列靶向和修饰的任何基因编辑系统。这些系统通常包含用于精确靶向的靶向元件和用于切割靶向的遗传位点的切割元件。指导RNA是靶向元件的一个实例,而各种核酸酶提供切割元件的实例。靶向元件和切割元件可以是单独的分子或者例如通过纳米颗粒连接。可替代地,靶向元件和切割元件可以连接在一起成为一个两用分子。当意图插入治疗性核酸序列时,系统还包含与治疗性核酸序列缔合的HDR模板(其可包括同源臂)。然而,如下文进一步详述,不同的基因编辑系统可采用不同的组分和构造,同时保持精确靶向、切割和修饰所选基因组位点的能力。
在特定的实施方案中,可以使用CRISPR基因编辑系统来靶向用于遗传工程的位点。CRISPR核酸酶系统是赋予对外来遗传元件(诸如质粒和噬菌体)的抗性并提供一种形式的获得性免疫的原核免疫系统。CRISPR是含有短重复碱基序列的DNA基因座。在原核免疫系统的情况下,每个重复之后是属于原核生物所暴露的外来遗传元件的间隔DNA的短区段。这种散布有间隔区的CRISPR重复序列阵列可以被转录成RNA。所述RNA可被加工为成熟形式并与Cas(CRISPR相关)核酸酶缔合。CRISPR-Cas系统包含具有可与外来遗传元件杂交的序列的RNA和Cas核酸酶,其可识别并切割基因组中的这些外源遗传元件。
CRISPR-Cas系统不需要生成定制蛋白来靶向特定序列,而是可以通过短指导RNA分子(crRNA)编程单个Cas酶以识别特定DNA靶标。细菌和古细菌适应性免疫的CRISPR-Cas系统表明了蛋白质组成和基因组基因座结构的极端多样性。CRISPR-Cas系统基因座具有多于50个基因家族并且不存在严格通用基因,这表明基因座结构的快速进化和极端多样性。目前,采用多管齐下的方法,对93种Cas蛋白的395个图谱进行了全面的Cas基因鉴定。分类包括签名基因谱加上基因座结构的签名。提出了CRISPR-Cas系统的分类,其中将这些系统大致分为两类,第1类具有多亚基效应子复合物,并且第2类具有单亚基效应子模块,例如Cas9蛋白。使用CRISPR/Cas9 mRNA和作为HDR的供体模板的单链寡脱氧核糖核苷酸(ssODN)的电穿孔在人CD34+细胞中的有效基因编辑已经得到证明。De Ravin等人Sci TranslMed.2017;9(372):eaah3480。与第2类CRISPR-Cas系统缔合的新型效应子蛋白可以开发为有力的基因组工程工具,并且推定的新型效应子蛋白及其工程和优化的预测是重要的。除了第1类和第2类CRISPR-Cas系统之外,最近由Cpf1示例的推定的第2类V型CRISPR-Cas类已经被鉴定Zetsche等人).2015(Cell163)3(:759-771。
关于CRISPR-Cas系统及其组分的其他信息描述于US8697359、US8771945、US8795965、US8865406、US8871445、US8889356、US8889418、US8895308、US8906616、US8932814、US8945839、US8993233和US8999641及其相关申请;以及WO2014/018423、WO2014/093595、WO2014/093622、WO2014/093635、WO2014/093655、WO2014/093661、WO2014/093694、W02014/093701、W02014/093709、WO2014/093712、WO2014/093718、WO2014/145599、WO2014/204723、WO2014/204724、WO2014/204725、WO2014/204726、WO2014/204727、WO2014/204728、WO2014/204729、WO2015/065964、WO2015/089351、WO2015/089354、WO2015/089364、WO2015/089419、WO2015/089427、WO2015/089462、WO2015/089465、WO2015/089473和WO2015/089486、WO2016205711、WO2017/106657、WO2017/127807及其相关申请中。
Cpf1核酸酶尤其可以通过短的三碱基对识别序列(TTN)(称为原间隔物相邻基序或PAM)在靶位点选择中提供额外的灵活性。Cpfts切割位点距离PAM序列至少18bp,因此酶可以在插入缺失(插入和缺失)形成后重复切割特定基因座,从而潜在地增加HDR的效率。成功的HDR导致PAM序列的突变,使得不再发生进一步的切割。此外,具有粘性末端的交错DSB允许定向特异性供体模板插入,这在非分裂细胞中是有利的。
如前所述,特定的实施方案采用增加HDR效率和/或准确性的特征结构。例如,Cpf1具有短的单个crRNA并以具有5’2-4个核苷酸(nt)突出端(称为粘性末端)的交错形式切割靶DNA。粘性末端有利于HDR,Kim等人(2016)Nat Biotechnol.34(8):863-8。而且,在进行RNP切割基因组以促进HDR之前,应从NP中释放供体模板。因此,在本文公开的特定的实施方案中,发现供体模板比靶向元件和切割元件离NP的表面更远。本公开还出乎意料地发现在AuNP上递送基因编辑组分增加了HDR的效率和/或准确性。因此,特定的实施方案利用AuNP递送基因编辑组分。
特定的实施方案可以利用工程化变体Cpf1。例如,US 2018/0030425描述了来自毛螺菌科(Lachnospiraceae)细菌ND2006和氨基酸球菌属(Acidaminococcus sp.)BV3L6的具有改变的和改进的靶标特异性的工程化Cpf1核酸酶。特定变体包括在一个或多个以下位置具有突变(即,用不同的氨基酸例如丙氨酸、甘氨酸或丝氨酸替换天然氨基酸)的毛螺菌科细菌ND2006:S203、N274、N278、K290、K367、K532、K609、K915、Q962、K963、K966、K1002和/或S1003。特定Cpf1变体还可以包括在一个或多个以下位置具有突变(即,用不同的氨基酸例如丙氨酸、甘氨酸或丝氨酸替换天然氨基酸(除非天然氨基酸是丝氨酸))的氨基酸球菌属BV3L6 Cpf1(AsCpf1):N178、S186、N278、N282、R301、T315、S376、N515、K523、K524、K603、K965、Q1013、Q1014和/或K1054。在特定的实施方案中,工程化Cpf1变体包括eCfp1。其他Cpf1变体描述于US 2016/0208243和WO/2017/184768中。
特定的实施方案利用锌指核酸酶(ZFN)作为基因编辑剂。ZFN是经过工程化以结合和裂解特定位置处的DNA的一类位点特异性核酸酶。ZFN用于将双链断裂(DSB)引入DNA序列中的特定位点,这使得ZFN能够靶向多种不同细胞中基因组内的独特序列。此外,在双链断裂之后,发生HDR或NHEJ以修复DSB,从而实现基因组编辑。
ZFN通过将锌指DNA结合结构域与DNA裂解结构域融合来合成。DNA结合结构域包含三至六个作为转录因子的锌指蛋白。DNA裂解结构域包括例如Fokl内切核酸酶的催化结构域。Fokl结构域用作二聚体,其需要两个具有用于靶序列上的位点的独特DNA结合结构域的构建体。Fokl裂解结构域在分隔两个反向半位点的五或六个碱基对间隔序列内裂解。
关于ZFN的其他信息,参见Kim,等人Proceedings of the National Academy ofSciences of the United States of America 93,1156-1160(1996);Wolfe,等人Annualreview of biophysics and biomolecular structure 29,183-212(2000);Bibikova,等人Science 300,764(2003);Bibikova,等人Genetics 161,1169-1175(2002);Miller,等人The EMBO joumal 4,1609-1614(1985);以及Miller,等人Nature biotechnology25,778-785(2007)]。
特定的实施方案可以使用转录激活因子样效应子核酸酶(TALEN)作为基因编辑剂。TALEN是指融合蛋白,其包含转录激活因子样效应子(TALE)DNA结合蛋白和DNA裂解结构域。TALEN用于通过在DNA中诱导DSB来编辑基因和基因组,其诱导细胞中的修复机制。通常,两个TALEN必须结合并侧接靶DNA位点的每一侧,以使DNA裂解结构域二聚化并诱导DSB。如果存在外源双链供体DNA片段,则在细胞中通过NHEJ或HDR修复DSB。
如所指示,已经将TALEN工程化以结合例如内源基因组的靶序列,并在靶序列的位置处切割DNA。TALEN的TALE是黄单胞菌属(Xanthomonas)细菌分泌的DNA结合蛋白。TALE的DNA结合结构域包含高度保守的33或34个氨基酸重复序列,在每个重复序列的第12和第13位置处具有不同的残基。称为重复可变二残基(RVD)的这两个位置显示出与特定核苷酸识别的强相关性。因此,通过改变RVD中的氨基酸以及掺入非常规RVD氨基酸,可改善靶向特异性。
可用于TALEN融合体的DNA裂解结构域的实例是野生型和变体Fokl内切核酸酶。关于TALEN的其他信息,参见Boch,等人Science326,1509-1512(2009);Moscou,&Bogdanove,Science 326,1501(2009);Christian,等人Genetics 186,757-761(2010);以及Miller,等人Nature biotechnology 29,143-148(2011)。
特定的实施方案利用MegaTAL作为基因编辑剂。MegaTAL具有单链稀有裂解核酸酶结构,其中TALE与大范围核酸酶的DNA裂解结构域融合。也称为归巢内切核酸酶的大范围核酸酶是在同一结构域中具有DNA识别和核酸酶功能两者的单肽链。与TALEN相反,megaTAL仅需要递送单个肽链用于功能活性。
用于相关遗传工程靶标的示例性crRNA包含:UAAUUUCUACUCUUGUAGAUUUCGGACCCGUGCUACAACUU(SEQ ID NO:80,chr11-gsh-gRNA1);UAAUUUCUACUCUUGUAGAUAUAGAAUAGCCUCAUAUUUUA(SEQ ID NO:81,chr11-gsh-gRNA 2);UAAUUUCUACUCUUGUAGAUGAGCUGUUGGCAUCAUGUUCCUG(SEQ ID NO:82,chr11-gsh-gRNA 3);UAAUUUCUACUCUUGUAGAUUCCAAACCUCCUAAAUGAUAC(SEQ ID NO:83,chr11-gsh-gRNA 4);以及UAAUUUCUACUCUUGUAGAUCACCCGAUCCACUGGGGAGCA(SEQ ID NO:5,chr11-gsh-gRNA 5)。用于遗传工程的相关靶位点包含(PAM位点以斜体表示):TTTGTGTCCCCGTTTTGGTTGGTAAAC(SEQ ID NO:84,chr11-gsh-靶标1);TTLAAAAATCAATACCGATAATAATGA(SEQ ID NO:85,chr11-gsh-靶标2);TTTCTTAATATGAATATTAATATCGGT(SEQ ID NO:86,chr11-gsh-靶标3);TTTCCGTATCTGGAAGGGGCATCTTGG(SEQ ID NO:87,chr11-gsh-靶标4);TTTCCTTAGGACCGGAAGGATTACAGC(SEQ ID NO:88,chr11-gsh-靶标5);TTTGCCTAAAAGGCACTATGTCAAATG(SEQ ID NO:89,chr11-gsh-靶标6);TTTGGAGCTGTTGGCATCATGTTCCTG(SEQ ID NO:90,chr11-gsh-靶标7);TTTGATTCTTTTCTATCTCAGGACAGA(SEQ ID NO:91,chr11-gsh-靶标8);TTLATAGACATCCCACACTGTAGTTCT(SEQ ID NO:92,chr11-gsh-靶标9);TTLATTAATTTGAGAACCAACATAAGG(SEQ ID NO:93,chr11-gsh-靶标10);TTLATTTTCTTTTTGGTAAGAAGGAAC(SEQ ID NO:94,chr11-gsh-靶标11);TTTCACACACACACACACACACACACA(SEQ ID NO:95,chr11-gsh-靶标12);TT7ATCCAAACCTCCTAAATGATAC(SEQ ID NO:96,chr11-gsh-靶标13);TT7ACACCCGATCCACTGGGGAGCA(SEQ ID NO:21,chr11-gsh-靶标14);以及TT7TTGATTCTTTTCTATCTCAGGACA(SEQ ID NO:97,chr11-gsh-靶标15)。这些靶位点反映HSPC内的基因组安全港(GSH)。在特定的实施方案中,这些GSH位点是上文反映的SEQ ID NO:21和84-97(chr11-gsh-靶标1-15),但具有1、2、3或4个核苷酸取代以说明群体中的典型遗传变异。
本公开还提供了可用于治疗其他病症诸如血红蛋白病和人免疫缺陷病毒(HIV)的基因座的靶位点和靶向序列(参见例如图7A、7B、8A、8B、34和35A-35D)。
在特定的实施方案中,NP可以递送促进所需的目标DNA修复途径的因子。修复双链DNA断裂的任何途径中的第一步骤是在稳定断裂位点处DNA的游离末端。可以掺入对目标修复途径特异的DNA稳定蛋白以促进该特异性DNA修复途径。对于NHEJ,两种蛋白参与稳定DNA的游离末端:Ku70和Ku80。对于HDR,需要由MRE11、Nbs1和RAD50组成的称为MRN的三蛋白复合物。这些分子可包括所涉及的任何因子的寡聚物(mRNA)或蛋白质以确保接受基因编辑机制的细胞也存在这些因子。可替代地或组合地,也可包括将降低NHEJ途径表达的小干扰RNA(siRNA、短发夹RNA或微RNA)。
HDR的模板可以是对称的或不对称的同源臂,如Richardson等人,NatBiotechnol.2016;34(3):339-44所述。每个供体模板可以包含同源臂(HDR模板),其侧接用于克隆追踪的20bp随机DNA条形码元件,所述条形码元件位于在临床应用中驱动治疗性DNA序列表达的人磷酸甘油酸激酶(PGK)启动子上游。人源化Cpf1蛋白可以由商业制造商(Aldevron)合成,并且具有两个修饰、原子寡聚乙二醇间隔物和3’末端硫醇的指导RNA也可以从商业来源(Integrated DNA Technologies,Coralville,IA)获得。单链同源模板DNA(ssODN)也可以由商业制造商(Integrated DNA Technologies,Coralville,IA)合成。对于此类序列的实例,参见图7A、7B、8A、8B、34、35B和35D。
如所指出的,在特定的实施方案中,提供遗传疗法的基因编辑系统将包含指导RNA和核酸酶。在特定的实施方案中,可使用供体模板,尤其是在进行功能获得疗法或精确功能丧失疗法时。在特定的实施方案中,基因编辑系统包含HDR模板和治疗性核酸序列。
基因编辑系统的所有基于核酸的组分可以是单链、双链,或者可以具有单链和双链区域的混合物。例如,指导RNA或供体模板可以是单链DNA、单链RNA、双链DNA或双链RNA。在利用本文所述的NP的特定的实施方案中,可以通过本领域技术人员已知的方法保护离NP表面最远的核酸末端(例如,免受核酸外切降解)。例如,可以将一个或多个双脱氧核苷酸残基添加到线性分子的3’末端和/或将自互补寡核苷酸连接到一个或两个末端。参见例如Chang等人(1987)Proc.Natl.Acad Sci USA 84:4959-4963;Nehls等人(1996)Science272:886-889。用于保护外源多核苷酸免于降解的其他方法包括添加末端氨基和使用修饰的核苷酸间键,例如像硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。化学修饰的mRNA可用于增加细胞内稳定性,而可将不对称同源臂和硫代磷酸酯修饰掺入ssODN中以提高HDR效率。在利用本文所述的NP的特定的实施方案中,可以通过例如添加电荷屏蔽间隔物来保护核酸免受静电(基于电荷的)排斥。在特定的实施方案中,电荷屏蔽间隔物可包括添加到一个或两个末端的18原子寡聚乙二醇(OEG)间隔物。在特定的实施方案中,电荷屏蔽间隔物可包括添加到一个或两个末端的10-26原子寡聚乙二醇(OEG)间隔物。
供体多核苷酸可具有任何长度,例如10个核苷酸或更多、50个核苷酸或更多、100个核苷酸或更多、250个核苷酸或更多、500个核苷酸或更多、1000个核苷酸或更多、5000个核苷酸或更多等。
在特定的实施方案中,HDR模板(HDT)被设计用作同源重组中的模板,诸如在被基因编辑系统的酶(例如核酸酶)切口或裂解的靶序列内或附近。HDR模板多核苷酸可具有任何合适的长度,如10、15、20、25、50、75、100、150、200、500、1000、2000、3000、4000、5000或更多个核苷酸。在特定的实施方案中,HDR模板多核苷酸与包含靶序列的多核苷酸的一部分互补。当最佳比对时,HDR模板多核苷酸与靶序列的一个或多个核苷酸(例如,1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100或更多个核苷酸)重叠。
在特定的实施方案中,HDR模板可以包括与裂解位点的基因组序列的足够同源性,例如,与侧接切割位点的核苷酸序列具有70%、80%、85%、90%、95%或100%同源性,例如,在裂解位点的50个碱基或更少之内,例如,在裂解位点的30个碱基之内、15个碱基之内、10个碱基之内、5个碱基之内或直接侧接裂解位点,以支持所述HDR模板和与其具有同源性的基因组序列之间的HDR。在HDR模板与靶向的基因组序列之间具有序列同源性的25、50、100或200个核苷酸或多于200个核苷酸(或10与200个核苷酸之间的任何整数值或更多)可以支持HDR。同源臂或侧接序列通常与基因组序列相同,例如与发生双链断裂(DSB)的基因组区域相同。然而,不需要绝对同一性。
在特定的实施方案中,供体模板包含侧接两个同源区的异源治疗性核酸序列,使得靶DNA区和两个侧接序列之间的HDR导致异源治疗性核酸序列插入靶区。在一些实例中,HDR模板的同源臂或侧接序列是不对称的。
如所指出的,在特定的实施方案中,供体模板包含治疗性核酸序列。治疗性核酸序列可以包含校正的基因序列;完整基因序列和/或与基因表达相关的一个或多个调节元件。校正的基因序列可以是需要校正的基因的一部分,或者可以提供基因的完整替换拷贝。校正的基因序列可以提供基因的完整拷贝,而不必替换现有的缺陷基因。本领域普通技术人员将认识到,当提供校正的拷贝时,可能需要或不需要去除缺陷基因。当将基因插入遗传安全港时,治疗性核酸序列应包含编码区和其表达所需的所有调节元件。
治疗性基因和基因产物的实例包括骨骼蛋白4.1、血型糖蛋白、p55、Duffy等位基因、珠蛋白家族基因;WAS;phox;抗肌萎缩蛋白;丙酮酸激酶;CLN3;ABCD1;芳基硫酸酯酶A;SFTPB;SFTPC;NLX2.1;ABCA3;GATA1;核糖体蛋白基因;TERT;TERC;DKC1;TINF2;CFTR;LRRK2;PARK2;PARK7;PINK1;SNCA;PSEN1;PSEN2;APP;SOD1;TDP43;FUS;泛素2;C9ORF72、α2β1;αvβ3;αvβ5;αvβ63;BOB/GPR15;Bonzo/STRL-33/TYMSTR;CCR2;CCR3;CCR5;CCR8;CD4;CD46;CD55;CXCR4;氨基肽酶-N;HHV-7;ICAM;ICAM-1;PRR2/HveB;HveA;α-肌营养不良蛋白聚糖;LDLR/α2MR/LRP;PVR;PRR1/HveC、层粘连蛋白受体、101F6、123F2、53BP2、ab1、ABLI、ADP、aFGF、APC、ApoA1、ApoAIV、ApoE、ATM、BAI-1、BDNF、Beta*(BLU)、bFGF、BLC1、BLC6、BRCA1、BRCA2、CBFA1、CBL、C-CAM、CFTR、CNTF、COX-1、CSFIR、CTS-1、胞嘧啶脱氨酶、DBCCR-1、DCC、Dp、DPC-4、E1A、E2F、EBRB2、erb、ERBA、ERBB、ETS1、ETS2、ETV6、Fab、FancA、FancB、FancC、FancDI、FancD2、FancE、FancF、FancG、Fancl、FancJ、FancL、FancM、FancN、FancO、FancP、FancQ、FancR、FancS、FancT、FancU、FancV、和FancW、FCC、FGF、FGR、FHIT、fms、FOX、FUS 1、FUS1、FYN、G-CSF、GDAIF、基因21、基因26、GM-CSF、GMF、gsp、HCR、HIC-1、HRAS、hst、IGF、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、ING1、干扰素α、干扰素β、干扰素γ、IRF-1、JUN、KRAS、LCK、LUCA-1、LUCA-2、LYN、MADH4、MADR2、MCC、mda7、MDM2、MEN-I、MEN-II、MLL、MMAC1、MYB、MYC、MYCL1、MYCN、neu、NF-1、NF-2、NGF、NOEY1、NOEY2、NRAS、NT3、NT5、OVCA1、p16、p21、p27、p53、p57、p73、p300、PGS、PIM1、PL6、PML、PTEN、raf、Rap1A、ras、Rb、RB1、RET、rks-3、ScFv、scFV ras、SEM A3、SRC、TAL1、TCL3、TFPI、血小板反应蛋白、胸苷激酶、TNF、TP53、trk、T-VEC、VEGF、VHL、WT1、WT-1、YES、zac1、艾杜糖苷酶、IDS、GNS、HGSNAT、SGSH、NAGLU、GUSB、GALNS、GLB1、ARSB、HYAL1、F8、F9、HBB、CYB5R3、γC、JAK3、IL7RA、RAG1、RAG2、DCLRE1C、PRKDC、LIG4、NHEJ1、CD3D、CD3E、CD3Z、CD3G、PTPRC、ZAP70、LCK、AK2、ADA、PNP、WHN、CHD7、ORAI1、STIM1、CORO1A、CIITA、RFXANK、RFX5、RFXAP、RMRP、DKC1、TERT、TINF2、DCLRE1B和SLC46A1。
在特定的实施方案中,治疗性基因包含治疗性表达产物(例如蛋白质、RNA)的编码序列和导致基因产物表达的所有相关调节元件(例如启动子等)。
在特定的实施方案中,治疗性遗传工程破坏遗传位点以防止结合。参见例如图8A、8B。在特定的实施方案中,遗传工程基于基因编辑组分,包括Cpf1和指导RNA,所述指导RNA靶向重叠染色体11上的γ珠蛋白基因座中的BCL11a结合位点的单核苷酸多态性(SNP)或13个核苷酸缺失,或染色体2上的BCL11a基因的第二内含子中的红系特异性增强子元件内的SNP。在特定的实施方案中,遗传工程基于基因编辑组分,包括Cpf1和指导RNA,所述指导RNA靶向位于染色体11上的γ珠蛋白基因座的5bp BCL11a结合位点内的突变或位于染色体2上的BCL11a基因中的选自rs1427407和rs7569946的红系特异性增强子区域中的两个SNP突变中的一个。还参见图8A、8B、34和35A-35D。
在特定的实施方案中,可以选择治疗性核酸序列(例如基因)以掺入遗传位点中以提供遗传修饰细胞的体内选择。例如,使用细胞生长开关的体内选择允许少数群体的遗传修饰细胞被诱导地扩增。实现体内选择的策略是采用药物选择,同时共表达输送化学抗性的转基因,诸如O6-甲基鸟嘌呤-DNA-甲基转移酶MGMT。替代方法是通过递送同源异型框转录因子HOXB4赋予基因修饰的HSC增强的增殖潜力。在特定的实施方案中,可以将自杀基因掺入到遗传修饰的细胞中,从而可以例如通过施用激活自杀基因的药物来消除这种细胞群体。参见,例如,Cancer Gene Ther.2012Aug;19(8):523-9;PLoS One.2013;8(3):e59594和Molecular Therapy-Oncolytics(2016)3,16011。
特定的实施方案包括使血细胞与能够在靶位点插入供体模板的基因编辑系统接触。在特定的实施方案中,基因编辑系统包含能够与靶序列杂交的crRNA和编码诸如Cpf1或Cas9的核酸酶的核酸。
特定的实施方案包括使血细胞与能够在靶位点插入供体模板的基因编辑系统接触。在特定的实施方案中,基因编辑系统包含能够与靶序列杂交的crRNA和编码诸如Cpf1或Cas9的核酸酶的核酸。在特定的实施方案中,Cas9或Cpf1编码序列可以包含SEQ ID NO:112-124。在特定的实施方案中,Cas9或Cpf1氨基酸序列可以包含SEQ ID NO:125-138。
(II)纳米颗粒及其与基因编辑组分的缀合。如所指出的,需要不依赖于电穿孔、病毒载体和/或细胞选择或纯化过程的基因编辑系统的递送方法。
本公开提供了工程化的NP,其允许递送基因编辑组分,而不需要依赖电穿孔或病毒载体递送基因编辑组分。当治疗性用途仅需要使有问题的基因失活时,NP仅需要与靶向元件和切割元件缔合(尽管可以根据需要或有助于特定目的包含其他组分)。当治疗性用途添加或校正基因时,NP与靶向元件、切割元件和供体模板缔合。为了进一步避免细胞选择或纯化过程,可以将靶向配体连接到NP,以导致将NP选择性递送到异质细胞池内的所选细胞群体。
特定的实施方案利用胶态金属NP。胶态金属包括分散在液态水中的任何水不溶性金属颗粒或金属化合物。胶体金属可以是金属颗粒在水溶液中的悬浮液。可以使用可以制成胶态形式的任何金属,包括Au、银、铜、镍、铝、锌、钙、铂、钯和铁。在特定的实施方案中,使用例如由HAuCl4制备的AuNP。在特定的实施方案中,NP是涂覆有Au以制备Au涂覆的NP的非Au NP。
制备胶态金属NP(包括来自HAuCl4的Au胶态NP)的方法是本领域普通技术人员已知的。例如,本文所述的方法以及其他地方所述的那些方法(例如,US 2001/005581;2003/0118657;和2003/0053983)可用于制备NP。
在特定的示例性实施方案中,通过优化的Turkevich和晶种生长方法合成三种不同尺寸范围(15、50、100nm)的AuNP核心(Shahbazi,等人,Nanomedicine(Lond),2017.12(16):第1961-1973页;Shahbazi,等人,Nanotechnology,2017.28(2):第025103页;Turkevich,等人Discussions of the Faraday Society,1951.11(0):第55-75页;Perrault&Chan,Journal of the American Chemical Society,2009.131(47):第17042-17043页)。在第一步骤中,通过使100mL 0.25mM氯化金(III)三水合物溶液达到沸点并添加1mL 3.33%柠檬酸三钠脱水物溶液来合成15nm的晶种AuNP。NP的合成在高速搅拌下进行10分钟。将制备的NP冷却至40℃并用于以下生长步骤。
为了制备50nm和100nm尺寸范围的AuNP,制备两种不同的100mL 0.25mM氯化金(III)三水合物溶液,并在温和搅拌条件下分别添加2440μL和304μL晶种AuNP以分别合成50nm和100nmAuNP。向这些溶液中添加1mL 15mM柠檬酸三钠脱水物溶液,并且使混合物达到最高搅拌速度。然后,添加1mL 25mM氢醌溶液,并且对于50nm AuNP合成持续30分钟,并且对于100nm AuNP合成持续5小时。最后,通过在5000xg下离心并分散在超纯水中来纯化合成的NP。在特定的实施方案中,NP核心>100nm;>90nm;>80nm;>70nm;>60nm;>50nm;>40nm;>30nm;或20nm。
虽然特别描述了AuNP,但是本公开中包括的NP可以以不同形式提供,例如作为固体NP(例如,金属诸如银、Au、铁、钛)、非金属、基于脂质的固体、聚合物、NP的悬浮液或其组合。可制备金属、介电和半导体NP,以及混合结构(例如,核壳NP)。由半导体材料制成的NP也可标记为量子点,如果它们足够小(通常低于10nm),则发生电子能级的量子化。此类纳米级颗粒在生物医学应用中用作药物运载体或成像剂,并且可适用于本公开中的相似目的。
如所指出的,多种活性组分可以缀合到本文公开的NP用于靶向的基因编辑。例如,作为基因编辑系统组分的核酸可以直接或间接并且共价或非共价缀合到NP的表面。例如,核酸可以在核酸的一个末端与NP的表面共价结合。
与NP缀合的核酸可以具有10个核苷酸(nt)-1000nt的长度,例如1nt-25nt、25nt-50nt、50nt-100nt、100nt-250nt、250nt-500nt、500nt-1000nt或大于1000nt。在特定的实施方案中,通过与接头缀合而修饰的核酸长度不超过50nt或40nt。
当通过例如居间接头间接缀合时,任何类型的分子可用作接头。例如,接头可以是包含至少两个碳原子(例如,3、4、5、6、7、8、9、10、11、12、13、14或更多个碳原子)的脂族链,并且可以被一个或多个官能团取代,包括酮、醚、酯、酰胺、醇、胺、脲、硫脲、亚砜、砜、磺酰胺和/或二硫化物。
在特定的实施方案中,接头在偶联NP表面的游离末端(例如未缀合到指导RNA的末端)包含二硫化物。在特定的实施方案中,二硫化物是C2-C10二硫化物,即它可以是包括2、3、4、5、6、7、8、9或10个碳原子的以二硫化物封端的脂族链,尽管设想可以使用更长的脂族链。在特定的实施方案中,二硫化物是3碳二硫化碳(C3 S-S)。接头可以具有巯基(SH)或二硫基(S-S)或不同数目的硫原子。在特定的实施方案中,可以引入硫醇修饰而不使用接头。在特定的实施方案中,核酸酶作为与其指导RNA预缀合的蛋白质(核糖核蛋白(RNP)复合物)递送。在这种制剂中,指导RNA分子与NP结合,并且默认地,也可以结合核酸酶(参见例如图5B)。
本文公开的一个进步是修饰CRISPR组分以连接至NP的能力。这是因为CRISPR组分中的大多数修饰可能损害切割效率。例如,Li等人(Engineering CRISPR-Cpf1 crRNAs andmRNAs to maximize genome editing efficiency.2017.1:第0066页)表明Cpf1 crRNA的5’末端对于任何修饰都是不安全的,因为此类修饰导致消除crRNA与Cpf1核酸酶的结合。本文公开了不损害切割效率的对crRNA的3’末端的修饰。在特定的实施方案中,在缀合到NP的第一步骤中,crRNA的3’末端用18原子的六乙二醇间隔物(18间隔物)和3碳二硫化物(C3S-S)修饰以将crRNA连接到AuNP的表面。
基于前述,在特定的实施方案中,例如当NP包含Au时,接头可以是任何含硫醇的分子。硫醇基与Au的反应产生共价硫化物(-S-)键。AuNP对硫醇(-SH)和二硫醇(S-S)基团具有高亲和力,并且在AuNP的表面与硫基团之间存在半共价键(Hakkinen,Nat Chem,2012.4(6):第443-455页)。在特定的实施方案中,可以将硫醇基团添加到核酸以促进与AuNP的表面的连接。这种方法可改进核酸摄取和稳定性(参见例如Mirkin,等人,A Nature,1996.382(6592):第607-609页)。
使用优化的两步晶种生长法,以3个不同尺寸范围(15nm、50nm、100nm)合成高度单分散的AuNP,并将其与Cpf1 crRNA和核酸内切酶缀合(图5B和11B)。由于带负电荷的表面与带负电荷的crRNA之间的强静电排斥,因此难以在没有例如硫醇修饰的情况下将crRNA连接到AuNP的表面。在特定的实施方案中,在第二步骤中,在纯化crRNA缀合的AuNP之后,添加Cpf1核酸内切酶并与crRNA缀合的AuNP一起孵育以促进其与crRNA的5’柄的结合(Dong,等人,Nature,2016.532(7600):第522-526页),所设计的包含crRNA和Cpf1核酸内切酶二者的NP的紧凑结构导致如下构象,其增加对降解剂的稳定性并且由于总体中性电荷(即,ζ电位)而促进细胞对Au/CRISPR NP的摄取。虽然对于CRISPR/Cpf1优化所公开的NP给出了特别的相关性,但是相同的概念可以应用于其他CRISPR类别。此外,与crRNA和Cpf1核酸内切酶一起,18间隔物硫醇修饰的单链DNA(ssDNA)可以连接到AuNP的表面以获得新型NP,目的是用于同源定向修复(HDR)。
在特定的实施方案中,可以通过在N-或C-末端添加半胱氨酸残基将间隔物-硫醇接头添加到Cpf1或Cas9蛋白本身或前述的工程化变体(例如,如下所述)。然后可以将核酸酶蛋白作为第一层添加到AuNP核心的表面上。这种间隔物-硫醇接头可以增加蛋白质的稳定性并增加切割效率。在特定的实施方案中,RNA复合物在crRNA与核酸酶之间形成,然后通过间隔物-硫醇接头连接到AuNP核心表面的表面。
如前所述,添加细菌来源的基因编辑组分作为第一个负载步骤可以在施用给具有对所述组分的预先存在的免疫性的受试者之后提供对这些组分的有益屏蔽。屏蔽可以归因于其他基因编辑组分(例如供体模板)并且不需要依赖于保护性聚合物壳。在特定的实施方案中,不包括聚合物壳。在特定的实施方案中,屏蔽可允许连续体内施用。
在特定的实施方案中,可以将crRNA以不同的AuNP/crRNA w/w比率(0.25、0.5、1、1.5、2、3、4、5、6)添加到AuNP中并混合。可以将pH为3的柠檬酸盐缓冲液以10mM浓度添加到混合物中以筛选带负电荷的crRNA与AuNP之间的负排斥。搅拌5分钟后,将NP离心,并且通过琼脂糖凝胶电泳显示未结合的crRNA。在确定最佳缀合浓度后,可将1μL63μM Cpf1核酸酶添加到AuNP/crRNA溶液中并孵育20分钟。
重要的是,柠檬酸盐缓冲液的使用在制造中提供了显著的优点。先前的方法依赖于使用NaCl来筛选带负电荷的NP表面并减少类似带负电荷的DNA的排斥。然而,NaCl可引起AuNP的不可逆聚集,因此其必须随着浓度的递增变化随时间逐渐添加。通常,NaCl必须在48小时内添加以避免聚集。当使用pH为3的柠檬酸盐缓冲液时,这种结合可以在少于3分钟内以更高的效率发生。Zhang,等人(2012).Journal of the American Chemical Society134(17):7266-7269,降低了GMP制造工厂中的产品成本和时间。
制备的Au/CRISPR NP的尺寸和形态可以通过在透射电子显微镜(TEM)下成像来表征。可以将AuNP(4μL)添加到铜格栅中并使其干燥过夜。在120kV下进行成像。
可以通过负染色电子显微镜显示具有基因编辑组分的涂层。例如,NP可以分别用0.7%甲酸铀酰和2%乙酸铀酰染色。可将染色的样品(4μL)添加到碳涂覆的铜格栅并孵育1分钟,并用滤纸吸干。在用20μl染剂溶液进行三次洗涤循环之后,可以将4μl染剂溶液添加到格栅,并且吸干并风干。
NP还可以由Nanodrop UV-可见光分光光度计通过分析NP在与基因编辑组分缀合之前和之后的局部表面等离子体共振(LSPR)峰的位移来表征。
在特定的实施方案中,NP诸如在合成期间是分层的,以包含PEI或其他带正电荷的聚合物,用于增加表面积和缀合较大的ssDNA或其他分子,诸如靶向配体和/或大的供体模板(参见例如图6B)。这种NP可以逐层形式制备,并且带正电荷的聚合物(诸如;不同分子量和形式的PEI)可用于涂覆AuNP或基因编辑组分涂覆的AuNP的带负电荷的表面,以连接基因编辑组分和其他组分(诸如抗体结合结构域)。分层实质上增加了可用于缀合分子(诸如具有或不具有其他蛋白质的大寡核苷酸)的NP的表面积。
特定的实施方案利用分子量为1,000-3,000道尔顿(例如,1,000;1,200;1,400;1,600;1,800;2,000;2,200;2,400;2,600;2,800;或3,000道尔顿)的带正电荷的聚合物。带正电荷的聚合物的实例包括多胺;聚有机胺(例如,聚乙烯亚胺(PEI)、聚乙烯亚胺纤维素);聚(酰胺基胺)(PAMAM);聚氨基酸(例如,聚赖氨酸(PLL)、聚精氨酸);多糖(例如,纤维素、葡聚糖、DEAE葡聚糖、淀粉);精胺、亚精胺、聚(乙烯基苄基三烷基铵)、聚(4-乙烯基-N-烷基-吡啶鎓)、聚(丙烯酰基-三烷基铵)和Tat蛋白。
也可以使用任何浓度和任何比率的聚合物(和任选的脂质)的共混物。使用各种等级以不同比率共混不同聚合物类型可以产生从每种贡献聚合物借用的特征。也可以采用各种末端基团化学。
在特定的实施方案中,带正电荷的聚合物(例如PEI)可以作为涂层添加到NP的已经形成的部分上,并且可以同时或之后添加ssDNA。可替代地,可以通过添加ssDNA作为层,然后添加带正电荷的聚合物作为后续层来改变缀合步骤。在特定的实施方案中,不包括带正电荷的聚合物和ssDNA作为第一层,因为该层可以保留用于与接头偶联的RNP复合物。
在特定的实施方案中,本公开的多层NP具有25-70nm的平均尺寸并且是高度单分散的。AuNP的透射电子显微镜图像(TEM)和LSPR显示出均匀表面涂层而没有任何聚集(图10A、10B)。考虑到整个递送系统的合成性质,所有组分可在几小时内组装,这与之前的由于例如使用NaCl作为电荷筛选而需要多天的方法完全不同。
如图10A所示,合成的NP是高度单分散的,并且实现了成功的4nm涂层而没有任何聚集,这在涂覆50nm AuNP后将NP的尺寸增加至54nm。此外,AuNP的LSPR的强度和红移的降低表明与基因编辑组分的成功缀合而没有任何聚集(图10A)。每层将具有不同的最佳负载比。第一层由RNA组成,然而为了测试此层的最佳负载比率,使用单链DNA测试核苷酸(ssDNA)。使用用于修饰crRNA的相同18间隔物C3 S-S修饰这种测试寡核苷酸。在负载研究中,不同的AuNP/crRNA w/w比率表明颗粒核心:ssDNA(并且据推断,crRNA)的比率为6对于进行缀合而言是最佳的(图10C)。使用这种最佳负载比率,将crRNA以30μg/mL的浓度负载在AuNP的表面上(图10D)。这些数据有助于计算基因编辑研究的精确应用剂量。
如本领域普通技术人员将理解的,所提供的比率是迭代的,因为当添加每个层时,用于最佳负载的比率稍微不同。NP作为整体的特征,以及最后添加的层,以及要添加的新层的特性都影响所述比率。在特定的实施方案中,对于crRNA(第一层),6∶1的比率是最佳的。
在特定的实施方案中,对于Cpf1蛋白,0.6的比率对于负载到NP核心+crRNA层上是最佳的,并且最终HDT层具有1的最佳负载比率。Cpf1蛋白的修饰或长度的改变或HDT的化学修饰可影响这些比率。
颗粒核心与基因编辑组分的特别可用的比率包括颗粒核心:Cpf1的0.5;0.6;或0.7的重量/重量(w/w)比率;颗粒核心:HDT的0.9;1.0;或1.1的重量/重量(w/w)比率。
所描述的方法产生了高效的、负载的、基因编辑的NP,其能够递送合成的、非化学修饰的核糖核蛋白以及ssDNA同源模板以插入新的DNA,而不需要电穿孔或病毒载体递送。在特定的实施方案中,完全负载的AuNP的流体动力学尺寸为150-190nm、160-185nm、170-180nm或176nm。
另外的颗粒设计包含以下列顺序从NP核心表面的近端向远端延伸的下列组分:硫醇化PEI、接头、靶向元件和切割元件。在特定的实施方案中,接头是聚乙二醇接头。在特定的实施方案中,在中等长度环己烷间隔臂的相对末端含有NHS-酯和马来酰亚胺反应性基团的水溶性胺-巯基交联剂可用于将切割元件与靶向配体连接。在特定的实施方案中,胺-巯基交联剂包括磺基琥珀酰亚胺基4-[N-马来酰亚胺基甲基]环己烷-1-羧酸酯(磺基-SMCC,图6E)。在特定的实施方案中,ssDNA在围绕NP核心的层内,所述层与接头的层共同延伸。这种构造例如在图5D和6C-6E中描绘。
接头包括聚合物接头。在特定的实施方案中,接头可以是具有1至500个氨基酸的氨基酸序列,其可以为通过接头连接的两个区域、结构域、基序、盒或模块之间的构象运动提供灵活性和空间。在特定的实施方案中,接头可以是柔性的、刚性的或半刚性的,这取决于通过接头连接的组分的所需功能或结构。在特定的实施方案中,当接头连接两个分子、区域、结构域、基序、盒或模块时,接头可以是直接的。在特定的实施方案中,当两个分子、区域、结构域、基序、盒或模块不是通过单个接头直接连接而是通过接头从两侧连接到第三个接头或结构域时,接头可以是间接的。示例性接头序列包含具有一至十个GlyxSery重复的接头序列,其中x和y独立地为0至10的整数,条件是x和y不同时为0(例如,((Gly4Ser)3(SEQ IDNO:98)、(Gly3Ser)2(SEQ ID NO:99)、Gly2Ser或其组合,诸如(Gly3Ser)2Gly2Ser)(SEQ IDNO:100))。
刚性或半刚性接头的实例包括富含脯氨酸的接头。在特定的实施方案中,富含脯氨酸的接头是具有比仅基于偶然性所预期的更多的脯氨酸残基的肽序列。在特定的实施方案中,富含脯氨酸的接头是具有至少30%、至少35%、至少36%、至少39%、至少40%、至少48%、至少50%或至少51%脯氨酸残基的接头。富含脯氨酸的接头的特定的实例包括富含脯氨酸的唾液蛋白(PRP)的片段。
(III)基因编辑效率。在K562细胞中测定用于电穿孔的crRNA、hAsCpf1 RNA和ssODN的最佳浓度。最佳浓度显示最高的活力和GFP表达。在24孔板中以1×105个细胞/孔的浓度培养K562细胞。使用含10%FBS和1%PenStrep的Iscove改良Dulbecco培养基(IMDM)培养细胞。在24孔板中以5×105个细胞/孔的浓度培养CD34+细胞。CD34+细胞的培养条件与具有所需生长因子的K562细胞相同。将Au/CRISPR NP以25nM的浓度添加到这些孔中并且在48小时孵育之后评估编辑效率。在特定的实施方案中,AuNP/CRISPR可以与细胞群体一起孵育1-48小时、1-36小时、1-24小时或1-12小时。在特定的实施方案中,AuNP/CRISPR可以与细胞群体一起孵育1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时、25小时、26小时、27小时、28小时、29小时、30小时、31小时、32小时、33小时、34小时、35小时、36小时、37小时、38小时、39小时、40小时、41小时、42小时、43小时、44小时、45小时、46小时、47小时、48小时或更长时间。用Harvard Apparatus ECM 830方波电穿孔系统使用BTX Express Solution(USA)在1mm比色皿中以250V和5ms脉冲持续时间进行细胞的电穿孔。使用具有2mm间隙宽度的1mm BTX比色皿在250V下持续5毫秒电穿孔1-3百万个K562细胞。将细胞重悬于培养基中并在电穿孔后进行分析。在最少操作实施方案的情况下,对于临床逻辑或疾病情况,1-24、1-48或1-72小时是优选的。在某些情况下,调节癌症患者用于再输注可能需要2天,但在遗传疾病情况下,患者可能未被调节并且优选限制体外操作时间。
与其中使用较高量的crRNA和Cpf1(126nM)的电穿孔方法相比,靶向chr11:67812349-67812375位置的AuNP/CRISPR能够以非常低的crRNA和Cpf1核酸内切酶浓度(25nM)成功切割靶位点(图16C)以实现相同的切割效率。由于PAM位点后15bp的A>T突变,此位点的切割效率很低。在接下来的测试中,在原代CD34+细胞中靶向相同的位置,并且表明Au/CRISPRNP能够以非常低的crRNA和Cpf1核酸内切酶浓度以非常好的切割效率靶向所述位点,而不产生任何毒性作用(图16A、16D和18)。不幸的是,原代CD34+细胞的电穿孔不利地影响细胞的活力,并且对于电穿孔的细胞没有观察到切割。AuNP/CRISPR的计算浓度比电穿孔方法所需的浓度低5倍(图16B)。如Kim等人(Nat Biotechnol,2016.34(8):第863-8页)先前所述,CRISPR Cpf1基因编辑系统的缺失与插入的比率更高(图18)。
如图23A-23C所示,AuNP介导的基因递送改进了Cas9性能,然而,对于HDR,Cpf1更好。与电穿孔的细胞相比,AuNP处理的细胞表现出更高的活力。对于Cas9,相对于电穿孔,AuNP介导的递送改进了总编辑和HDR。对于没有使用同源定向修复模板(HDT)递送的Cpf1,电穿孔导致更高的总基因编辑(插入和缺失,插入缺失)。这表明电穿孔本身可能影响使用的修复途径或靶位点处Cpf1切割的频率。向Cpf1制剂中添加HDT改进了总编辑并得到最高的HDR率。总之,这些数据表明AuNP+Cpf1/crRNA+HDT的完全负载的制剂得到最高的HDR率和最少的插入缺失形成。这对于用于基因编辑的许多靶基因座是理想的。
在特定的实施方案中,本领域已知的许多测定可用于检测基因编辑和/或基因编辑水平(百分比)或基因编辑率。在特定的实施方案中,作为基因编辑结果的酶限制性位点的缺失或引入可以通过侧接基因编辑靶位点的扩增基因组DNA的限制性酶消化并通过凝胶电泳观察消化产物来评估。在特定的实施方案中,可以使用T7核酸内切酶I(T7EI)测定。在T7EI测定中,可以从已经被靶向用于遗传修饰的细胞分离出基因组DNA,并且可以PCR扩增侧接基因编辑靶位点的基因组区域。扩增产物可以退火并用T7EI消化。T7EI识别并裂解非完全匹配的DNA,因此任何基因编辑都可以被检测为退火异源双链体中的错配,然后通过T7EI切割。T7EI测定中的基因修饰百分比可如下计算:基因修饰百分比=100x(1-(1-裂解部分)1/2)。T7EI测定试剂盒可以从例如New England Biolabs,Ipswich,MA获得。
在特定的实施方案中,基因编辑或基因编辑水平(百分比)可以通过分解追踪插入缺失(TIDE)测定法来检测。可以PCR扩增侧接基因编辑靶位点的基因组区域,并且可以纯化扩增产物。纯化产物的Sanger测序可以用荧光标记的终止双脱氧核苷三磷酸进行(测序试剂盒可购自例如Thermo Fisher Scientific,Waltham,MA)。循环测序后,获得的序列可在TIDE软件上运行。结果可报告为基因修饰百分比(Brinkman等人,Nucleic AcidsResearch,42(22):e168-e168(2014))。
在特定的实施方案中,可以通过测序检测基因编辑或基因编辑的水平(百分比)。可以PCR扩增侧接基因编辑靶位点的基因组区域,并且可以纯化扩增产物。可进行第二次PCR以添加给定测序平台所需的衔接子和/或其他序列。可以利用任何测序方法,包括合成测序、焦磷酸测序、连接测序、滚环扩增测序、单分子实时测序、基于释放质子检测的测序和纳米孔测序。
在特定的实施方案中,使用包含本文所述的NP的治疗性制剂可以在靶细胞中产生5%至100%、5%至90%、5%至80%、5%至70%、5%至60%、5%至50%、5%至40%、5%至30%或5%至20%的平均总基因编辑。在特定的实施方案中,使用包含本文所述的NP的治疗性制剂可以在靶细胞中产生5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%或更多的平均总基因编辑。
共聚焦显微镜表明所公开的NP避免了溶酶体截留并且成功地定位到来自健康供体的CD34+原代造血细胞的细胞核。使用与CCR5基因座具有±40个核苷酸的同源臂长度的Notl限制酶模板表现出高达10%的敲入频率而没有细胞毒性。设计非靶DNA链的模板产生了更高的同源定向修复(HDR)效率(图17),在用Notl和T7EI酶消化后具有清晰的447bp和316bp的切割条带(图19B)。在相同CCR5靶位点的Cpf1和Cas9核酸酶活性的直接比较证明,相对于Cas9,Cpf1偏向于HDR和模板敲入,Cas9优先产生插入缺失。将CRISPR Cpf1 NP处理的人CD34+细胞异种移植到免疫缺陷小鼠中表现出与未处理的细胞相比在植入中早期增加的趋势,这表明NP处理的HSPC的未知益处。CCR5遗传修饰的细胞植入频率与培养物中观察到的相同,其中10%的人细胞在体内显示出Notl模板添加。
在特定的实施方案中,在孵育期间,每mL最少操作的血细胞产品添加1、2、3、4、5、8、10、12、15或20μg/mL NP。孵育期可以是例如40分钟至48小时长(在特定的实施方案中,1小时)。在特定的实施方案中,孵育时间为1小时、2小时、3小时、4小时、5小时和最多48小时的每个整数。孵育可以在2-8摄氏度(冷藏)、23-28摄氏度(室温)或37摄氏度(体温)下进行。在任何温度下的孵育过程中,可能发生产品的轻微摇动或旋转。
(IV)所选细胞和所选细胞靶向配体。待靶向用于遗传修饰的细胞群体(即,细胞类型)包括HSC、HSPC、造血祖细胞(HPC)、T细胞、B细胞、自然杀伤(NK)细胞、巨噬细胞、单核细胞、间充质干细胞(MSC)、白细胞(WBC)、单核细胞(MNC)、内皮细胞(EC)、基质细胞和/或骨髓成纤维细胞。所选细胞群体可以指被本发明的NP靶向或已经被本公开的NP靶向用于遗传修饰的细胞群体。
HSC是多能的并且最终产生所有类型的终末分化血细胞。HSC可以自我更新,或者它可以分化成更定型的祖细胞,这些祖细胞被不可逆地确定为仅少数类型血细胞的祖先。例如,HSC可以分化成(i)骨髓祖细胞,其最终产生单核细胞和巨噬细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、红细胞、巨核细胞/血小板、树突细胞,或(ii)淋巴祖细胞,其最终产生T细胞、B细胞和NK细胞。一旦干细胞分化成骨髓祖细胞,其后代不能产生淋巴谱系细胞,并且类似地,淋巴祖细胞不能产生骨髓谱系细胞。关于造血和造血干细胞分化的一般讨论,参见Differentiated Cells and the Maintenance of Tissues第17章,Alberts等人,1989,Molecular Biology of the Cell,第2版,Garland Publishing,New York,N.Y.;Regenerative Medicine,Department of Health and Human Services第2章,2006年8月,以及Hematopoietic Stem Cells第5辛,2009,Stem Cell Information,Department ofHealth and Human Services。
特定的HSC群体包括HSC1(Lin-CD34+CD38-CD45RA-CD90+CD49f+)和HSC2(CD34+CD38-CD45RA-CD90-CD49f+)。例如,在特定的实施方案中,人HSC1可通过以下图谱鉴定:CD34+/CD38-/CD45RA-/CD90+或CD34+/CD45RA-/CD90+,并且小鼠LT-HSC可通过Lin-Sca1+ckit+CD150+CD48-Flt3-CD34-(其中Lin表示不表达成熟细胞的任何标记物,包括CD3、Cd4、CD8、CD11b、CD11c、NK1.1、Gr1和TER119)鉴定。因此,HSC1可以包括标记物图谱:LHR+/CD34+/CD38-/CD45RA-/CD90+。除了LHR的表达之外,在特定的实施方案中,HSC1可以通过以下图谱鉴定:Lin-/CD34+/CD38-/CD45RA-/CD90+/CD49f+。因此,HSC1可以包括标记物图谱:LHR+/Lin-/CD34+/CD38-/CD45RA-/CD90+/CD49f+。除了LHR的表达之外,在特定的实施方案中,HSC2可以通过以下图谱鉴定:CD34+/CD38-/CD45RA-/CD90-/CD49f+。因此,HSC2可以包括标记物图谱:LHR+/CD34+/CD38-/CD45RA-/CD90-/CD49f+。基于前述图谱,LHR的表达可与以下一种或多种标记物的存在或不存在组合以鉴定HSC1和/或HSC2细胞群体:Lin/CD34/CD38/CD45RA/CD90/CD49f和CD133。也可以使用各种其他组合,只要标记物组合可靠地鉴定HSC1或HSC2即可。在特定的实施方案中,HSC通过CDl33+图谱鉴定。在特定的实施方案中,HSC通过CD34+/CD133+图谱鉴定。在特定的实施方案中,HSC通过CD164+图谱鉴定。在特定的实施方案中,HSC通过CD34+/CD164+图谱鉴定。
HSPC是指造血干细胞和/或造血祖细胞。HSPC可自我更新或可以分化为骨髓祖细胞或淋巴祖细胞,如上文针对HSC所述。相对于其他类型的造血细胞,HSPC对于在HSPC上以增加的水平表达的特异性标记物可以是阳性的。例如,此类标记物包括CD34、CD43、CD45RO、CD45RA、CD59、CD90、CD109、CD117、CD133、CD166、HLA DR或其组合。而且,相对于其他类型的造血细胞,HSPC对于表达的标记物可以是阴性的。例如,此类标记物包括Lin、CD38或其组合。优选地,HSPC是CD34+细胞。
在特定的实施方案中,‘HSC/HSPC’可指HSC、HSPC或两者。
淋巴细胞包括T细胞和B细胞。T细胞是免疫系统的关键部分,有助于控制免疫应答以及杀死细胞,诸如病毒感染的细胞和癌细胞。存在几种T细胞类型,包括辅助T细胞、细胞毒性T细胞、中枢记忆T细胞、效应记忆T细胞、调节性T细胞和原初T细胞。B细胞参与适应性免疫系统,包括产生针对诸如细菌、病毒和其他生物体的入侵者的抗体。
已经发现了几种不同的T细胞子集,每种具有不同的功能。在特定的实施方案中,所选的细胞靶向配体通过受体介导的胞吞作用实现对特定淋巴细胞群体的选择性定向。例如,大多数T细胞具有作为几种蛋白质的复合物存在的T细胞受体(TCR)。实际的T细胞受体由两条单独的肽链组成,所述肽链由独立的T细胞受体α和β(TCRα和TCRβ)基因产生并称为α-和β-TCR链。
γδT细胞代表在其表面上具有不同T细胞受体(TCR)的小T细胞子集。在γδT细胞中,TCR由一条γ链和一条δ链组成。这组T细胞比αβT细胞少得多(总T细胞的2%)。
CD3在所有成熟T细胞上表达。因此,本文公开的所选的细胞靶向配体可结合CD3以实现核酸向所有成熟T细胞的选择性递送。激活的T细胞表达4-1BB(CD137)、CD69和CD25。因此,本文公开的所选的细胞靶向配体可结合4-1BB、CD69或CD25以实现核酸向激活的T细胞的选择性递送。CD5和转铁蛋白受体也在T细胞上表达。
T细胞可进一步分为辅助细胞(CD4+T细胞)和细胞毒性T细胞(CTL,CD8+T细胞),其包括溶细胞性T细胞。T辅助细胞在免疫过程中协助其他白细胞,包括将B细胞成熟为浆细胞和激活细胞毒性T细胞和巨噬细胞等功能。这些细胞也称为CD4+T细胞,因为它们在其表面上表达CD4蛋白。当辅助T细胞通过在抗原呈递细胞(APC)的表面上表达的MHC II类分子呈递有肽抗原时,它们被激活。一旦被激活,它们迅速分裂并分泌调节或协助主动免疫应答的称为细胞因子的小蛋白质。
细胞毒性T细胞破坏病毒感染的细胞和肿瘤细胞,并且还涉及移植排斥。这些细胞也称为CD8+T细胞,因为它们在其表面上表达CD8糖蛋白。这些细胞通过与MHC I类相关的抗原结合识别它们的靶标,所述抗原存在于身体的几乎每个细胞的表面上。
如本文所用,“中枢记忆”T细胞(或“TCM”)是指经历过抗原的CTL,其在其表面上表达CD62L或CCR7和CD45RO,并且与原初细胞相比不表达CD45RA或具有降低的CD45RA表达。在特定的实施方案中,中枢记忆细胞对于CD62L、CCR7、CD25、CD127、CD45RO和CD95的表达是阳性的,并且与原初细胞相比具有降低的CD45RA表达。
如本文所用,“效应记忆”T细胞(或“TEM”)是指经历过抗原的T细胞,与中枢记忆细胞相比,其表面上不表达CD62L或具有降低的CD62L表达,并且与原初细胞相比,其不表达CD45RA或具有降低的CD45RA表达。在特定的实施方案中,与原初细胞或中枢记忆细胞相比,效应记忆细胞对CD62L和CCR7的表达是阴性的,并且具有CD28和CD45RA的可变表达。与记忆或原初T细胞相比,效应T细胞对于颗粒酶B和穿孔素是阳性的。
调节性T细胞(“TREG”)是T细胞的亚群,其调节免疫系统,维持对自身抗原的耐受性并消除自身免疫性疾病。TREG表达CD25、CTLA-4、GITR、GARP和LAP。
如本文所用,“原初”T细胞是指表达CD62L和CD45RA的未经历过抗原的T细胞,并且与中枢或效应记忆细胞相比不表达CD45RO。在特定的实施方案中,原初CD8+T淋巴细胞的特征在于原初T细胞的表型标记物的表达,包括CD62L、CCR7、CD28、CD127和CD45RA。
B细胞可通过B细胞受体(BCR)的存在与其他淋巴细胞区分开来。B细胞的主要功能是产生抗体。B细胞表达CD5、CD19、CD20、CD21、CD22、CD35、CD40、CD52和CD80,本文公开的所选细胞靶向配体可结合CD5、CD19、CD20、CD21、CD22、CD35、CD40、CD52和/或CD80以实现核酸向B细胞的选择性递送。靶向B细胞受体同种型恒定区的抗体(IgM、IgG、IgA、IgE)也可用于靶向B细胞亚型。
自然杀伤细胞(也称为NK细胞、K细胞和杀伤细胞)响应于干扰素或巨噬细胞衍生的细胞因子而被激活。NK细胞可通过释放破坏细胞膜的颗粒来诱导凋亡或细胞裂解,并可分泌细胞因子以募集其他免疫细胞。它们用于遏制病毒感染,同时适应性免疫应答产生可清除感染的抗原特异性细胞毒性T细胞。NK细胞表达NKG2D、CD8、CD16、CD56、KIR2DL4、KIR2DS1、KIR2DS2、KIR3DS1、NKG2C、NKG2E、NKG2D和天然细胞毒性受体(NCR)家族的几个成员。NCR的实例包括NKp30、NKp44、NKp46、NKp80和DNAM-1。
巨噬细胞(及其前体,单核细胞)存在于身体的每个组织中(在某些情况下为小胶质细胞、枯否细胞和破骨细胞),在组织中它们吞噬凋亡细胞、病原体和其他非自身组分。在巨噬细胞(及其前体,单核细胞)表面上表达的蛋白质的实例包括CD11b、CD11c、CD64、CD68、CD119、CD163、CD206、CD209、F4/80、IFGR2、Toll样受体(TLR)1-9、IL-4Rα和MARCO。
可与本文公开的NP连接的所选细胞靶向配体选择性地结合异质细胞群体内的目标细胞。“选择性递送”到异质细胞混合物内的所选细胞类型是指至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的所施用NP相对于群体中不表达靶标记物的细胞成比例地被所靶向的细胞摄取。在特定的实施方案中,样品中所选细胞群体的50%或更多摄取NP,并且任一种非靶细胞群体的少于20%摄取NP。
在特定的实施方案中,所选细胞靶向配体的结合结构域包括细胞标记物配体、受体配体、抗体、肽、肽适体、核酸、核酸适体、镜像体或其组合。在所选细胞靶向配体的情况下,结合结构域包括结合另一种物质以形成能够介导胞吞作用的复合物的任何物质。
“抗体”是靶向配体的一个实例,并且包括全抗体或抗体的结合片段,例如Fv、Fab、Fab’、F(ab’)2和单链Fv片段(scFv)或免疫球蛋白的任何生物学有效片段,所述生物学有效片段特异性结合由所选细胞表达的基序。抗体或抗原结合片段包括多克隆抗体、单克隆抗体、人抗体、人源化抗体、合成抗体、嵌合抗体、双特异性抗体、小体和线性抗体的全部或一部分。
单链可变片段(scFv)是用短接头肽连接的免疫球蛋白的重链和轻链的可变区的融合蛋白。Fv片段包括抗体单臂的VL和VH结构域,但缺少恒定区。尽管Fv片段的两个结构域VL和VH由单独的基因编码,但是它们可以使用例如重组方法通过合成接头连接,所述合成接头使它们能够被制成单个蛋白链,其中VL和VH区配对形成单价分子(单链Fv(scFv))。关于Fv和scFv的其他信息,参见例如Bird,等人,Science 242(1988)423-426;Huston,等人,Proc.Natl.Acad.Sci.USA 85(1988)5879-5883;Plueckthun,in The Pharmacology ofMonoclonal Antibodies,vol.113,Rosenburg and Moore(eds.),Springer-Verlag,NewYork),(1994)269-315;WO1993/16185;美国专利号5,571,894;和美国专利号5,587,458。
Fab片段是包括VL、VH、CL和CH1结构域的单价抗体片段。F(ab’)2片段是包括在铰链区通过二硫键连接的两个Fab片段的二价片段。双抗体包括两个可以是二价的表位结合位点。参见例如EP0404097;WO1993/01161;和Holliger,等人,Proc.Natl.Acad.Sci.USA90(1993)6444-6448。也可以形成双亲和再靶向抗体(DARTTM;基于双抗体形式,但特征在于用于另外稳定的C-末端二硫键(Moore等人,Blood 117,4542-51(2011)))。抗体片段还可以包括分离的CDR。关于抗体片段的综述,参见Hudson,等人,Nat Med.9(2003)129-134。
与非人抗体相比,来自人源的抗体或人源化抗体在人类中具有减低的免疫原性或没有免疫原性,并且具有较低数目的非免疫原性表位。通常选择抗体及其片段以在人受试者中具有降低水平的抗原性或无抗原性。
可使用获得单克隆抗体的方法、噬菌体展示的方法、产生人或人源化抗体的方法或使用经工程化以产生抗体的转基因动物或植物的方法来制备特异性结合由所选细胞类型表达的基序的抗体,如本领域普通技术人员已知的(参见例如美国专利号6,291,161和6,291,158),可获得部分或完全合成的抗体的噬菌体展示文库,并可筛选可结合所选细胞类型基序的抗体或其片段。例如,可以通过对于特异性结合目标靶标的Fab片段筛选Fab噬菌体文库来鉴定结合结构域(参见Hoet等人,Nat.Biotechnol.23:344,2005)。还可获得人抗体的噬菌体展示文库。另外,可以使用在方便的系统(例如,小鼠、HuMAb
Figure BDA0003153030530000461
TCmouseTM
Figure BDA0003153030530000462
美洲驼、鸡、大鼠、仓鼠、兔等)中使用目标靶标作为免疫原的杂交瘤开发的传统策略来开发靶向配体结合结构域。在特定的实施方案中,抗体特异性结合由所选淋巴细胞表达的基序,并且不与非特异性组分或不相关的靶标交叉反应。一旦鉴定,就可以分离和/或确定编码抗体的氨基酸序列或核酸序列。
可以设计适体以促进选择性递送,包括穿过细胞膜递送到细胞内区室或进入细胞核。制备适体和将此类适体缀合到NP表面的方法描述于例如Huang等人Anal.Chem.,2008,80(3),第567-572页中。在特定的实施方案中,本公开的适体结合CD133。
在特定的实施方案中,肽适体是指在两个末端连接到蛋白质支架的肽环(其对靶蛋白具有特异性)。这种双重结构约束将肽适体的结合亲和力极大地增加到与抗体相当的水平。可变环长度通常为8至20个氨基酸(例如,8至12个氨基酸),并且支架可以是稳定、可溶、小且无毒性的任何蛋白质(例如,硫氧还蛋白-A、stefin A三倍突变体、绿色荧光蛋白、水蛭抑制剂(eglin)C和细胞转录因子SpI)。肽适体选择可以使用不同的系统进行,诸如酵母双杂交系统(例如,Gal4酵母双杂交系统)或LexA相互作用捕获系统。
核酸适体是单链核酸(DNA或RNA)配体,其通过折叠成特异性球状结构起作用,所述特异性球状结构决定以高亲和力和特异性与靶蛋白或其他分子的结合,如Osborne等人,Curr.Opin.Chem.Biol.1:5-9,1997;以及Cerchia等人,FEBS Letters 528:12-16,2002中所述。在特定的实施方案中,适体很小(15KD;或在15-80个核苷酸之间或在20-50个核苷酸之间)。适体通常通过称为SELEX(通过指数富集进行配体的系统演化;参见,例如,Tuerk等人,Science,249:505-510,1990;Green等人,Methods Enzymology.75-86,1991;以及Gold等人,Annu.Rev.Biochem.,64:763-797,1995)的程序从由1014-1015个随机低聚核苷酸序列组成的文库中分离。产生适体的其他方法描述于例如美国专利号6,344,318;6,331,398;6,110,900;5,817,785;5,756,291;5,696,249;5,670,637;5,637,461;5,595,877;5,527,894;5,496,938;5,475,096;和5,270,16中。镜像体与核酸适体相似,不同之处在于至少一个β-核糖单元被β-D-脱氧核糖或选自例如β-D-核糖、α-D-核糖、β-L-核糖的修饰的糖单元替换。
在特定的实施方案中,RNA适体序列对细胞上或细胞中的适体配体具有结合亲和力。在特定的实施方案中,适体配体在细胞上,例如使得其至少部分可用于细胞膜的细胞外面或侧面。例如,适体配体可以是细胞表面蛋白。因此,适体配体可以是融合蛋白的一部分,融合蛋白的另一部分具有膜锚或跨膜结构域。在特定的实施方案中,适体配体在细胞中。例如,适体配体可以内化到细胞内,即细胞膜内(超出细胞膜),例如细胞质内、细胞器(包括线粒体)内、内体内或核内。在特定的实施方案中,适体可以包含供体模板序列,其可以包括同源定向修复(HDR)模板和治疗性核酸序列。
本文公开的所选细胞靶向配体可以结合CD34、CD46、CD90、CD133、CD164、Sca-1、CD117、LHRH受体和/或AHR,以实现将NP到HSC的选择性递送。如前所述,特定的实施方案包括作为靶向配体的CD34抗体、CD90抗体、CD133抗体、CD164抗体、适体、人促黄体激素、人绒毛膜促性腺激素、醋酸地格瑞克(LHRH受体的拮抗剂)或StemRegenin 1中的一种或多种。
在特定得实施方案中,结合CD34的靶向配体是人或人源化抗体。在特定的实施方案中,结合CD34的靶向配体是抗体克隆:581;抗体克隆:561;抗体克隆:REA1164;或抗体克隆:AC136;或由其衍生的结合片段。
在特定的实施方案中,结合CD34的结合结构域包含可变轻链,其包含含有RSSQTIVHSNGNTYLE(SEQ ID NO:139)的CDRL1序列、含有QVSNRFS(SEQ ID NO:140)的CDRL2序列、含有FQGSHVPRT(SEQ ID NO:141)的CDRL3序列、含有GYTFTNYGMN(SEQ ID NO:142)的CDRH1序列、含有WINTNTGEPKYAEEFKG(SEQ ID NO:143)的CDRH2序列和含有GYGNYARGAWLAY(SEQ ID NO:144)的CDRH3序列。关于结合CD34的结合结构域的更多信息,参见WO2008CN01963。其他CD34结合结构域也可商购获得。例如,Invitrogen提供CD34单克隆抗体(QBEND/10;克隆:QBEnd/10;目录号:MA1-10202)。
在特定的实施方案中,结合CD90的结合结构域是抗体克隆:5E10;抗体克隆:DG3;抗体克隆:REA897;或由其衍生的结合片段。
在特定的实施方案中,结合CD90的结合结构域是单链抗体,其包含序列CMASASQVQLVQSGAEVKKPGASVKVSCKASGYTFTGYYVHWVRQAPGQGLEWMGWVNPNSGDTNYAQKFQGRVTMTRDTSISTAYMELSGLRSDDTAVYYCARDGDEDWYFDLWGRGTPVTVSSGILGSGGGGSGGGGSGGGGSDIRLTQSPSSLSASIGDRVTITCRASQGISRSLVWYQQKPGKAPRLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDFATYYCLQHNTYPFTFGPGTK VDIKSGIPEQKL(SEQ ID NO:145)。在特定的实施方案中,结合结构域是人的或人源化的。关于结合CD90的结合结构域的更多信息,参见WO2017US35989。CD90结合结构域也可商购获得。例如,Abcam提供抗CD90/Thyl抗体([EPR3133];克隆:EPR3133;目录号:ab133350)。
在特定的实施方案中,结合CD133的结合结构域是抗体克隆:REA820;抗体克隆:REA753;抗体克隆:REA816;抗体克隆:293C3;抗体克隆:AC141;抗体克隆:AC133;抗体克隆:7;或由其衍生的结合片段。
在特定的实施方案中,结合CD133的结合结构域衍生自C178ABC-CD133MAb。在特定的实施方案中,结合结构域包含可变轻链NIVMTQSPKSMSMSLGERVTLSCKASENVDTYVSWYQQKPEQSPKVLIYGASNRYTGVPDRFTGSGSATDFSLTISNVQAEDLADYHCGQSYRYPLTFGAGTKLELKR(SEQ IDNO:146)和可变重链EIQLQQSGPDLMKPGASVKISCKASGYSFTNYYVHWVKQSLDKSLEWIGYVDPFNGDFNYNQKFKDKATLTVDKSSSTAYMHLSSLTSEDSAVYYCARGGLDWYDTSYWYFDVWGAGTAV(SEQ ID NO:147)。
在特定的实施方案中,结合结构域包含可变轻链,其包含含有QSSQSVYNNNYLA(SEQID NO:148)的CDRL1序列、含有RASTLAS(SEQ ID NO:149)的CDRL2序列、含有QGEFSCDSADCAA(SEQ ID NO:150)的CDRL3序列、含有GIDLNNY(SEQ ID NO:151)的CDRH1序列、含有FGSDS(SEQ ID NO:152)的CDRH2序列和含有GGL的CDRH3序列。
在特定的实施方案中,结合结构域是人的或人源化的。关于结合CD133的结合结构域的更多信息,参见WO2011089211,美国公开号2018/0105598和/或美国公开号2013/0224202。CD133结合结构域也可商购获得。例如,Abcam提供抗CD133抗体([EPR20980-45;克隆:EPR20980-45;目录号:ab226355)。
在特定的实施方案中,结合CD133的结合结构域是适体。适体可以是来自TocrisBiosciences的适体A15或B19。在特定的实施方案中,适体A15是指具有15个碱基和式C182H219F9N58O104P16的RNA适体。组织适体的分子量为5549.58,并且序列修饰为:2-氟嘧啶、3’-反向脱氧胸苷帽、5’-荧光DY647标签。还参见Shigdar等人(2013)RNA aptamerstargeting cancer stem cell marker CD133.Cancer Lett.330 84 PMID:23196060。在特定的实施方案中,适体B19是指具有19个碱基和式C221H263F10N73O131P20的RNA适体。组织适体具有6847.32的分子量,并且序列修饰为:2-氟嘧啶、3’-反向脱氧胸苷帽、5’-荧光DY647标签。还参见Shigdar等人(2013)RNA aptamers targeting cancer stem cellmarker CD133.Cancer Lett.330 84 PMID:23196060
在特定的实施方案中,RNA适体包含含有CCCUCCUACAUAGGG(SEQ ID NO:153)的共有序列。在特定的实施方案中,RNA适体包含共有序列,所述共有序列包含GAGACAAGAAUAAACGCUCAACCCACCCUCCUACAUAGGGAGGAACGAGUUACUAUAGA GCUUCGACAGGAGGCUCACAAC(SEQ IDNO:154);
GAGACAAGAAUAAACGCUCAACCCACCCUCCUACAUAGGGAGGAACGAGUUACUAUAG(SEQ ID NO:155);
GCUCAACCCACCCUCCUACAUAGGGAGGAACGAGU(SEQ ID NO:111);
CCACCCUCCUACAUAGGGUGG(SEQ ID NO:156);CAGAACGUAUACUAUUCUG(SEQ ID NO:157);
AGAACGUAUACUAUU(SEQ ID NO:158);或
GAGACAAGAAUAAACGCUCAAGGAAAGCGCUUAUUGUUUGCUAUGUUAGAACGUAUACUAUUUCGACAGGAGGCUCACAACAGGC(SEQ ID NO:159)。关于CD133适体的其他信息,参见EP2880185。
使用结合促黄体激素受体(LHR)的靶向配体的特定实施方案。特定的实施方案可以利用LHα亚基和LHβ亚基。在特定的实施方案中,α亚基包含DCPECTLQENPFFSQPGAPILQCMGCCFSRAYPTPLRSKKTMLVQKNVTSESTCCVAKSYNRV TVMGGFKVENHTACHCSTCYYHKS(人)(SEQ IDNO:53)或GCPECKLKENKYFSKLGAPIYQCMGCCFSRAYPTPARSKKTMLVPKNITSEATCCVAKAFTKATVMGNARVENHTECHCSTCYYHKS(小鼠)(SEQ ID NO:54)。
在特定的实施方案中,LHβ亚基包含SREPLRPWCHPINAILAVEKEGCPVCITVNTTICAGYCPTMMRVLQAVLPPLPQVVCTYRDVRF ESIRLPGCPRGVDPVVSFPVALSCRCGPCRRSTSDCGGPKDHPLTCDHPQLSGLLFL(人)(SEQ ID NO:55)或SRGPLRPLCRPVNATLAAENEFCPVCITFTTSICAGYCPSMVRVLPAALPPVPQPVCTYRELRFASVRLPGCPPGVDPIVSFPVALSCRCGPCRLSSSDCGGPRTQPMACDLPHLPGLLLL(小鼠)(SEQ ID NO:56)。
许多结合LHR或其他HSC1/HSC2标记物的抗体可商购获得。例如,抗LHR抗体可购自Abcam、Invitrogen、Alomone Labs、Novus Biologicals、Origene Technologies、Bio-Rad、Abbexa、St.John’s Laboratory、Millipore Sigma(Burlington,MA)、LifeSpanBiosciences等。
在特定的实施方案中,抗LHR结合剂包含含有GYSITSGYG(SEQ ID NO:57)的CDRH1;含有IHYSGST(SEQ ID NO:58)的CDRH2;含有ARSLRY(SEQ ID NO:59)的CDRH3;和含有SSVNY(SEQ ID NO:60)的CDRL1;含有DTS的CDRL2;和含有HQWSSYPYT(SEQ ID NO:61)的CDRL3。
在特定的实施方案中,抗LHR结合剂包含含有GFSLTTYG(SEQ ID NO:62)的CDRH1;含有IWGDGST(SEQ ID NO:63)的CDRH2;和含有AEGSSLFAY(SEQ ID NO:64)的CDRH3;和含有QSLLNSGNQKNY(SEQ ID NO:65)的CDRL1;含有WAS的CDRL2;和含有QNDYSYPLT(SEQ ID NO:66)的CDRL3。
在特定的实施方案中,抗LHR结合剂包含含有GYSFTGYY(SEQ ID NO:67)的CDRH1;含有IYPYNGVS(SEQ ID NO:68)的CDRH2;和含有ARERGLYQLRAMDY(SEQ ID NO:69)的CDRH3;以及含有QSISNN(SEQ ID NO:70)的CDRL1;含有NAS的CDRL2;和含有QQSNSWPYT(SEQ ID NO:71)的CDRL3。
在特定的实施方案中,抗LHR结合剂包含重链和轻链,所述重链包含EVQLQESGPDLVKPSQSLSLTCTVTGYSITSGYGWHRQFPGNKLEWMGYIHYSGSTTYNPSLKSRISISRDTSKNQFFLQLNSVTTEDTATYYCARSLRYWGQGTTLTVSS(SEQ ID NO:72),所述轻链包含DIVMTQTPAIMSASPGQKVTITCSASSSVNYMHWYQQKLGSSPKLWIYDTSKLAPGVPARFSGSGSGTSYSLTISSMEAEDAASYFCHQWSSYPYTFGSGTKLEIK(SEQ ID NO:73)。
在特定的实施方案中,抗LHR结合剂包含重链和轻链,所述重链包含QVQLKESGPGLVAPSQSLSrrCTVSGFSLTTYGVSWVRQPPGKGLEWLGVIWGDGSTYYHSALISRLSISKDNSKSQVFLKLNSLQTDDTATYYCAEGSSLFAYWGQGTLVTVS A(SEQ ID NO:74),所述轻链包含DIVMTQSPSSLTVTAGEKVTMSCKSSQSLLNSGNQKNYLTWYQQKPGQPPKLLIYWASTRQSGVPDRFTGSGSGTDFTLTISSVQAEDXAVYYCQNDYSYPLTFGSGTKLEIK(SEQ ID NO:75)。
在特定的实施方案中,抗LHR结合剂包含重链和轻链,所述重链包含EVQLEQSGGGLVQPGGSRKLSCAASGFTFSSFGMHWVRQAPEKGLEWVAYISSGSSTLHYADTVKGRFTISRDNPKNTLFLQMKLPSLCYGLLGSRNLSHRLL(SEQ ID NO:76),所述轻链包含DIVLTQTPSSLSASLGDTITITCHASQNINVWLFWYQQKPGNIPKLLIYKASNLLTGVPSRFSGSGSGTGFTLTISSLQPEDIATYYCQQGQSFPWTFGGGTKLEIK(SEQ ID NO:77)。
在特定的实施方案中,抗LHR结合剂包含重链和轻链,所述重链包含QVKLQQSGPELVKPGASVKISCKASGYSFTGYYMHWVKQSHGNILDWIGYIYPYNGVSSYNQKFKGKATLTVDKSSSTAYMELRSLTSEDSAVYYCARERGLYQLRAMDYWGQGTSVTVSS(SEQ ID NO:78),所述轻链包含DIVLTQTPATLSVTPGDSVSLSCRASQSISNNLHWYQQKSHESPRLLIKNASQSISGIPSKFSGSGSGTDFTLRINSVETEDFGMYFCQQSNSWPYTFGSGTKLEIK(SEQ ID NO:79)。
在特定的实施方案中,抗LHR结合剂包含人绒毛膜促性腺激素的亚基β3(CGB3;UniProt ID P0DN86),其包含SKEPLRPRCRPINATLAVEKEGCPVCITVNTTICAGYCPTMTRVLQGVLPALPQWCNYRDVRFESIRLPGCPRGVNPVVSYAVALSCQCALCRRSTTDCGGPKDHPLTCDDPRFQDSSSSKAPPPSLPSPSRLPGPSDTPILPQ(SEQ ID NO:160)。
特定的实施方案包括使用结合芳烃受体(AHR)的靶向配体。AHR是碱性螺旋-环-螺旋转录因子家族的成员。AHR调节异生素代谢酶的功能以及几种化合物的毒性和致癌特性。AHR还在HSC的多能性和干细胞性的调节中起重要作用。已表明,StemRegenin 1(SR1)对AHR的抑制导致表达CD34的细胞增加并且保留植入免疫缺陷小鼠的能力的细胞增加。
在特定实施方案中,SR1,也称为4-(2-((2-(苯并[b]噻吩-3-基)-9-异丙基-9H-嘌呤-6-基)氨基)乙基)苯酚,具有化学式C24H23N5OS和以下结构:
Figure BDA0003153030530000541
SR1可购自诸如Cayman Chemical Company,Ann Arbor,Ml;STEMCELLTMTechnologies,Vancouver,CA;和Abcam,Cambridge,MA的供应商。
在特定的实施方案中,所选细胞靶向配体的结合结构域包括T-细胞受体基序抗体;T-细胞α链抗体;T-细胞β链抗体;T-细胞γ链抗体;T-细胞δ链抗体;CCR7抗体;CD1a抗体;CD1b抗体;CD1c抗体;CD1d抗体;CD3抗体;CD4抗体;CD5抗体;CD7抗体;CD8抗体;CD11b抗体;CD11c抗体;CD16抗体;CD19抗体;CD20抗体;CD21抗体;CD22抗体;CD25抗体;CD28抗体;CD34抗体;CD35抗体;CD39抗体;CD40抗体;CD45RA抗体;CD45RA抗体;CD46抗体;CD52抗体;CD56抗体;CD62L抗体;CD68抗体;CD80抗体;CD86抗体;CD90抗体;CD95抗体;CD101抗体;CD117抗体;CD127抗体;CD137(4-1BB)抗体;CD148抗体;CD163抗体;CD164抗体;F4/80抗体;IL-4Rα抗体;Sca-1抗体;CTLA-4抗体;GITR抗体;GARP抗体;LAP抗体;粒酶B抗体;LFA-1抗体;或转铁蛋白受体抗体。
使得NP选择性递送到T细胞的靶向配体可以包括结合来源于OKT3(描述于美国专利号5,929,212)、奥昔珠单抗、替利组单抗、维西珠单抗、20G6-F3、4B4-D7、4E7-C9、18F5-H10或TR66中的至少一种的CD3的结合结构域。在特定的实施方案中,结合结构域包含可变轻链EIVLTQSPATLSLSPGERATLSCRASQSVSSYLAWYQQKPGQAPRLLIYDASNRATGIPARFSGSGSGTDFTLTISSLEPEDFAVYYCQQRSNWPPLTFGGGTKVEIK(SEQ ID NO:161)和可变重链QVQLVESGGGVVQPGRSLRLSCAASGFKFSGYGMHWVRQAPGKGLEWVAVIWYDGSKKYYVDSVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCARQMGYWHFDLWGRGTLVTVSS(SEQ ID NO:162)。
在特定的实施方案中,结合结构域包含可变轻链EIVLTQSPATLSLSPGERATLSCRASQSVSSYLAWYQQKPGQAPRLLIYDASNRATGIPARFSGSGSGTDFTLTISSLEPEDFAVYYCQQRSNWPPLTFGGGTKVEIK(SEQ ID NO:161)和可变重链QVQLVQSGGGWQSGRSLRLSCAASGFKFSGYGMHWVRQAPGKGLEWVAVIWYDGSKKYYVDSVKGRFTISRDNSKNTLYLQMNSLRGEDTAVYYCARQMGYWHFDLWGRGTLVTVSS(SEQID NO:163)。
在特定的实施方案中,结合结构域包含可变轻链,其包含含有SASSSVSYMN(SEQ IDNO:164)的CDRL1序列、含有RWIYDTSKLAS(SEQ ID NO:165)的CDRL2序列、含有QQWSSNPFT(SEQ ID NO:166)的CDRL3序列、含有KASGYTFTRYTMH(SEQ ID NO:167)的CDRH1序列、含有INPSRGYTNYNQKFKD(SEQ ID NO:168)的CDRH2序列和含有YYDDHYCLDY(SEQ ID NO:169)的CDRH3序列。
在特定的实施方案中,结合结构域包含可变轻链,其包含含有QSLVHNNGNTY(SEQID NO:170)的CDRL1序列、含有KVS的CDRL2序列、含有GQGTQYPFT(SEQ ID NO:171)的CDRL3序列、含有GFTFTKAW(SEQ ID NO:172)的CDRH1序列、含有IKDKSNSYAT(SEQ ID NO:173)的CDRH2序列和含有RGVYYALSPFDY(SEQ ID NO:174)的CDRH3序列。
在特定的实施方案中,结合结构域包含可变轻链,其包含含有QSLVHDNGNTY(SEQID NO:175)的CDRL1序列、含有KVS的CDRL2序列、含有GQGTQYPFT(SEQ ID NO:171)的CDRL3序列、含有GFTFSNAW(SEQ ID NO:175)的CDRH1序列、含有IKARSNNYAT(SEQ ID NO:176)的CDRH2序列和含有RGTYYASKPFDY(SEQ ID NO:177)的CDRH3序列。
在特定的实施方案中,结合结构域包含可变轻链,其包含含有QSLEHNNGNTY(SEQID NO:179)的CDRL1序列、含有KVS的CDRL2序列、含有GQGTQYPFT(SEQ ID NO:171)的CDRL3序列、含有GFTFSNAW(SEQ ID NO:176)的CDRH1序列、含有IKDKSNNYAT(SEQ ID NO:180)的CDRH2序列和含有RYVHYGIGYAMDA(SEQ ID NO:181)的CDRH3序列。
在特定的实施方案中,结合结构域包含可变轻链,其包含含有QSLVHTNGNTY(SEQID NO:182)的CDRL1序列、含有KVS的CDRL2序列、含有GQGTHYPFT(SEQ ID NO:183)的CDRL3序列、含有GFTFTNAW(SEQ ID NO:184)的CDRH1序列、含有KDKSNNYAT(SEQ ID NO:185)的CDRH2序列和含有RYVHYRFAYALDA(SEQ ID NO:186)的CDRH3序列。
在特定的实施方案中,结合结构域是人的或人源化的。关于结合CD3的结合结构域的更多信息,参见美国专利号8785604、PCT/US17/42264和/或WO02051871。CD3结合结构域也可商购获得。例如,LSBio提供PathPlusTM CD3抗体单克隆IHC LS-B8669(克隆:SP7;目录号:LS-B8669-100)。
表达CD4的T细胞可以靶向选择性NP递送,其中结合CD4的结合结构域是抗体。在特定的实施方案中,结合结构域包含可变轻链DIVMTQSPDSLAVSLGERVTMNCKSSQSLLYSTNQKNYLAWYQQKPGQSPKLLIYWASTRESGVPDRFSGSGSGTDFTLTISSVQAEDVAVYYCQQYYSYRTFGGGTKLEIK(SEQID NO:187)和可变重链QVQLQQSGPEVVKPGASVKMSCKASGYTFTSYVIHWVRQKPGQGLDWIGYINPYNDGTDYDEKFKGKATLTSDTSTSTAYMELSSLRSEDTAVYYCAREKDNYATGAWFAYWGQGTLVTVSS(SEQ ID NO:188)。在特定的实施方案中,结合结构域包含可变轻链,其包含含有KSSQSLLYSTNQKNYLA(SEQ ID NO:189)的CDRL1序列、含有WASTRES(SEQ ID NO:190)的CDRL2序列、含有QQYYSYRT(SEQ ID NO:191)的CDRL3序列、含有GYTFTSYVIH(SEQ ID NO:192)的CDRH1序列、含有YINPYNDGTDYDEKFKG(SEQ ID NO∶193)的CDRH2序列和含有EKDNYATGAWFAY(SEQ ID NO:194)的CDRH3序列。在特定的实施方案中,结合结构域是人的或人源化的。关于结合CD4的结合结构域的更多信息,参见PCT申请号WO2008US05450。CD4结合结构域也可商购获得。例如,R&DSystems提供人CD4抗体(克隆:34930;目录号:MAB379)。
CD28是存在于人80%外周T细胞上的表面糖蛋白,并且存在于静息和激活的T细胞上。CD28结合B7-1(CD80)和B7-2(CD86)。在特定的实施方案中,CD28结合结构域(例如scFv)衍生自CD80、CD86或9D7抗体。结合CD28的其他抗体包括9.3、KOLT-2、15E8、248.23.2和EX5.3D10。此外,1YJD提供了与促有丝分裂抗体(5.11A1)的Fab片段复合的人CD28的晶体结构。在特定的实施方案中,选择不与9D7竞争的抗体。
在特定的实施方案中,CD28结合结构域衍生自TGN1412。在特定的实施方案中,TGN1412的可变重链包含:QVQLVQSGAEVKKPGASVKVSCKASGYTFTSYYIHWVRQAPGQGLEWIGCIYPGNVNTNYNEKFKDRATLTVDTSISTAYMELSRLRSDDTAVYFCTRSHYGLDWNFDVWGQGTTVTVSS(SEQ ID NO:195),并且TGN1412的可变轻链包含:DIQMTQSPSSLSASVGDRVTITCHASQNIYVWLNWYQQKPGKAPKLLIYKASNLHTGVPSRFSGSGSGTDFTLTISSLQPEDFATYYCQQGQTYPYTFGGGTKVEIK(SEQ ID NO:196)。
在特定的实施方案中,CD28结合结构域包含可变轻链和可变重链,所述可变轻链包含含有HASQNIYVWLN(SEQ ID NO:197)的CDRL1序列、含有KASNLHT(SEQ ID NO:198)的CDRL2序列和含有QQGQTYPYT(SEQ ID NO:199)的CDRL3序列,所述可变重链包含含有GYTFTSYYIH(SEQ ID NO:200)的CDRH1序列、含有CIYPGNVNTNYNEK(SEQ ID NO:201)的CDRH2序列和含有SHYGLDWNFDV(SEQ ID NO:202)的CDRH3序列。
在特定的实施方案中,CD28结合结构域包含可变轻链和可变重链,所述可变轻链包含含有HASQNIYVWLN(SEQ ID NO:197)的CDRL1序列、含有KASNLHT(SEQ ID NO:198)的CDRL2序列和含有QQGQTYPYT(SEQ ID NO:199)的CDRL3序列,所述可变重链包含含有SYYIH(SEQ ID NO:203)的CDRH1序列、含有CIYPGNVNTNYNEKFKD(SEQ ID NO:204)的CDRH2序列和含有SHYGLDWNFDV:(SEQ ID NO:202)的CDRH3序列。
激活的T细胞表达4-1BB(CD137)。在特定的实施方案中,4-1BB结合结构域包含可变轻链和可变重链,所述可变轻链包含含有RASQSVS(SEQ ID NO:205)的CDRL1序列、含有ASNRAT(SEQ ID NO:206)的CDRL2序列和含有QRSNWPPALT(SEQ ID NO:207)的CDRL3序列,所述可变重链包含含有YYWS(SEQ ID NO:208)的CDRH1序列、含有INH的CDRH2序列和含有YGPGNYDWYFDL(SEQ ID NO:209)的CDRH3序列。
在特定的实施方案中,4-1BB结合结构域包含可变轻链和可变重链,所述可变轻链包含含有SGDNIGDQYAH(SEQ ID NO:210)的CDRL1序列、含有QDKNRPS(SEQ ID NO:211)的CDRL2序列和含有ATYTGFGSLAV(SEQ ID NO:212)的CDRL3序列,所述可变重链包含含有GYSFSTYWIS(SEQ ID NO:213)的CDRH1序列、含有KIYPGDSYTNYSPS(SEQ ID NO:101)的CDRH2序列和含有GYGIFDY(SEQ ID NO:102)的CDRH3序列。
本文公开的特定实施方案包括结合CD8上的表位的靶向配体。在特定的实施方案中,CD8结合结构域(例如scFv)衍生自OKT8抗体。例如,在特定的实施方案中,CD8结合结构域是包含可变轻链的人或人源化结合结构域(例如scFv),所述可变轻链包含含有RTSRSISQYLA(SEQ ID NO:103)的CDRL1序列、含有SGSTLQS(SEQ ID NO:104)的CDRL2序列和含有QQHNENPLT(SEQ ID NO:105)的CDRL3序列。在特定的实施方案中,CD8结合结构域是包含可变重链的人或人源化结合结构域(例如scFv),所述可变重链包含含有GFNIKD(SEQ IDNO:106)的CDRH1序列、含有RIDPANDNT(SEQ ID NO:107)的CDRH2序列和含有GYGYYVFDH(SEQID NO:108)的CDRH3序列。这些反映了OKT8抗体的CDR序列。
具有与NK细胞受体结合的结合结构域的可商购获得的抗体的实例包括:5C6和1D11(可购自
Figure BDA0003153030530000591
San Diego,CA);结合KIR2DL4的mAb33(可购自
Figure BDA0003153030530000592
);结合NKp44的P44-8(可购自
Figure BDA0003153030530000593
);结合CD8的SK1;和结合CD16的3G8。结合KIR2DL1和KIR2DL2/3的结合结构域包含序列EIVLTQSPVTLSLSPGERATLSCRASQSVSSYLAWYQQKPGQAPRLLIYDASNRATGIPARFSGSGSGTDFTLTISSLEPEDFAVYYCQQRSNWMYTFGQGTKLEIKRT(SEQID NO:109)的可变轻链区和序列QVQLVQSGAEVKKPGSSVKVSCKASGGTFSFYAISWVRQAPGQGLEWMGGFIPIFGAANYAQKFQGRVTITADESTSTAYMELSSLRSDDTAVYYCARIPSGSYYYDYDMDVWGQGTTVTVSS(SEQ ID NO:110)的可变重链区。其他NK结合抗体描述于WO/2005/0003172和美国专利号9,415,104中。
与巨噬细胞表面上表达的蛋白质结合的可商购获得的抗体包括结合CD11b的M1/70(可购自BioLegend);结合CD68的KP1(可购自ABCAM,Cambridge,United Kingdom);和结合CD163的ab87099(可购自ABCAM)。
给定CDR或FR的精确氨基酸序列边界可使用许多熟知方案中的任一种容易地确定,所述方案包括以下描述的那些:Kabat等人(1991)“Sequences of Proteins ofImmunological Interest,”第5版Public Health Service,National Institutes ofHealth,Bethesda,Md.(Kabat编号方案);Al-Lazikani等人(1997)J Mol Biol 273:927-948(Chothia编号方案);Maccallum等人(1996)J Mol Biol 262:732-745(Contact编号方案);Martin等人(1989)Proc.Natl.Acad.Sci.,86:9268-9272(AbM编号方案;Lefranc M P等人(2003)Dev Comp Immunol 27(1):55-77(IMGT编号方案);以及Honegger和Pluckthun(2001)J Mol Biol 309(3):657-670(“Aho”编号方案)。给定CDR或FR的边界可以根据用于识别的方案而变化。例如,Kabat方案基于结构比对,而Chothia方案基于结构信息。Kabat和Chothia方案的编号基于最常见的抗体区序列长度,其中通过插入字母例如“30a”调节插入,并且在一些抗体中出现缺失。这两种方案将某些插入和缺失(“插入缺失”)置于不同的位置,得到不同的编号。Contact方案基于复合晶体结构的分析并且在许多方面类似于Chothia编号方案。在特定的实施方案中,本文公开的抗体CDR序列根据Kabat编号。
在特定的实施方案中,当期望获得功能遗传修饰时,可以通过包含将插入的构建体的表达限制于期望的/所选的细胞类型的调节元件来增强选择性递送。例如,对于HSC,可以通过使用CD45启动子、Wiskott-Aldrich综合征(WASP)启动子或干扰素(IFN)-β启动子;对于HSC或T细胞可以通过使用鼠干细胞病毒启动子或远端lck启动子;或对于B细胞可以通过使用B29启动子来增强选择性递送。
也可使用也可促进淋巴细胞内化和/或转染的其他药剂,诸如聚(乙烯亚胺)/DNA(PEI/DNA)复合物。
在特定的实施方案中,靶向配体可以例如使用具有各种PEG间隔物和/或Gly-Ser间隔物的胺-巯基或巯基-巯基交联剂连接到核酸酶。间隔物的添加允许结合同源受体或细胞表面蛋白的灵活性。在特定的实施方案中,间隔物可具有1-50;10-50;20-50;30-50;1-500;10-250;20-200;30-150;40-100;50-75;或5-75个之间的重复单元或残基。
(V)细胞群体的来源和处理。HSC、HSPC和其他淋巴细胞的来源包括来自年龄适当的供体的脐带血、胎盘血、骨髓、外周血、胚胎细胞、主动脉-性腺-中肾衍生的细胞、淋巴、肝、胸腺和脾。关于包括血液样品的生物样品的收集和处理等的方法是已知的。参见例如,Alsever等人,1941,N.Y.St.J.Med.41:126;De Gowin,等人,1940,J.Am.Med.Ass.114:850;Smith,等人,1959,J.Thorac.Cardiovasc.Surg.38:573;Rous和Turner,1916,J.Exp.Med.23:219;以及Hum,1968,Storage of Blood,Academic Press,New York,第26-160页;Kodo等人,1984,J.Clin Invest.73:1377-1384),所有收集的样品可根据当时公认的现行标准筛选不需要的组分并丢弃、处理或使用。在特定的实施方案中,生物样品包括含有目标细胞群体的任何生物流体、组织、血细胞产品和/或器官。
可以使用本领域通常已知的任何程序从受试者获得包括目标细胞群体的来源或生物样品。在特定的实施方案中,外周血中的HSC/HSPC在收集前被动员。外周血HSC/HSPC可通过任何方法动员。外周血HSC/HSPC可通过用本文所述或本领域已知的增加受试者的外周血中循环的HSC/HSPC数目的任何药剂治疗受试者来动员。例如,在特定的实施方案中,通过用一种或多种细胞因子或生长因子(例如G-CSF、kit配体(KL)、IL-1、IL-7、IL-8、IL-11、Flt3配体、SCF、血小板生成素或GM-CSF(诸如沙格司亭))治疗受试者来动员外周血。可用于外周血动员方法的不同类型的G-CSF包括非格司亭和长效G-CSF-聚乙二醇非格司亭。在特定的实施方案中,通过用一种或多种趋化因子(例如,巨噬细胞炎性蛋白-1α(MIP1a/CCL3))、趋化因子受体配体(例如,趋化因子受体2配体GROβ和GROβΔ4)、趋化因子受体类似物(例如,基质细胞衍生因子-1α(SDF-1a)蛋白类似物,诸如CTCE-0021、CTCE-0214或SDF-1α,诸如Met-SDF-1β)或趋化因子受体拮抗剂(例如,趋化因子(C-X-C基序)受体4(CXCR4)拮抗剂,诸如AMD3100)治疗受试者来动员外周血。
在特定的实施方案中,通过用一种或多种抗整联蛋白信号传导剂(例如,功能阻断抗极晚期抗原4(VLA-4)抗体或抗血管细胞粘附分子1(VCAM-1))治疗受试者来动员外周血。
可以通过用一种或多种细胞毒性药物诸如环磷酰胺、依托泊苷或紫杉醇治疗受试者来动员外周血。
在特定的实施方案中,可以通过向受试者施用一种或多种上述药剂一段时间来动员外周血。例如,在收集HSC/HSPC之前,可以通过注射(例如,皮下、静脉内或腹膜内)用一种或多种药剂(例如,G-CSF)治疗受试者,每天一次或每天两次,持续1、2、3、4、5、6、7、8、9、10、11、12、13或14天。在具体的实施方案中,HSC/HSPC在用于将HSC/HSPC动员到外周血中的最后一剂药剂之后1、2、3、4、5、6、7、8、12、14、16、18、20或24小时内收集。在特定的实施方案中,HSC/HSPC通过用两种或更多种不同类型的上述或本领域已知的药剂,诸如生长因子(例如,G-CSF)和趋化因子受体拮抗剂(例如,CXCR4受体拮抗剂,诸如AMD3100)或生长因子(例如,G-CSF或KL)和抗整联蛋白剂(例如,功能阻断VLA-4抗体)治疗受试者来动员。可以同时或依次施用不同类型的动员剂。关于外周血动员方法的其他信息,参见例如,Craddock等人,1997,Blood 90(12):4779-4788;Jin等人,2008,Journal of Translational Medicine6:39;Pelus,2008,Curr.Opin.Hematol.15(4):285-292;Papayannopoulou等人,1998,Blood 91(7):2231-2239;Tricot等人,2008,Haematologica 93(11):1739-1742;以及Weaver等人,2001,Bone Marrow Transplantation 27(2):S23-S29)。
来自外周血的HSC/HSPC可以通过插入受试者静脉的注射器或导管从血液中收集。例如,在特定的实施方案中,可以使用单采机收集外周血。血液从静脉通过导管流入单采机,单采机将包括HSC/HSPC的白细胞与剩余的血液分离,然后将剩余的血液返回到受试者体内。单采可进行数天(例如,1至5天)直到收集到足够的所选细胞类型(例如,HSC、T细胞)。
在特定的实施方案中,在将获得的样品暴露于本文公开的NP之前不需要进一步收集或分离所选细胞类型,因为NP选择性地靶向异质细胞群体内的所选细胞类型。在特定的实施方案中,获得的样品除了NP添加之外没有进行其他操作。
在一些实施方案中,洗涤从受试者收集的血细胞,例如以除去血浆部分并将细胞置于合适的缓冲液或培养基中用于随后暴露于NP。在特定的实施方案中,用磷酸盐缓冲盐水(PBS)洗涤细胞。在一些实施方案中,洗涤溶液缺乏钙和/或镁和/或许多或所有二价阳离子。洗涤可以根据制造商的说明书使用半自动“流通”离心机(例如,Cobe2991细胞处理器,Baxter)完成。也可以进行切向流过滤(TFF)。在特定的实施方案中,细胞可以在洗涤后再悬浮在各种生物相容性缓冲液中,诸如不含Ca++/Mg++的PBS。
在特定的实施方案中,在暴露于本文公开的NP之前进行一些有限的进一步细胞收集和分离可能是有益的。在特定的实施方案中,可以使用任何合适的技术从样品中收集和分离所选细胞类型。适当的收集和分离程序包括磁分离;荧光激活细胞分选(FACS;Williams等人,1985,J.Immunol.135:1004;Lu等人,1986,Blood 68(1):126-133);亲和色谱;与单克隆抗体结合或与单克隆抗体联合使用的药剂;用连接到固体基质的抗体进行“淘选”(Broxmeyer等人,1984,J.Clin.Invest.73:939-953);使用凝集素(诸如大豆)进行选择性凝集(Reisner等人,1980,Proc.Natl.Acad.Sci.U.S.A.77:1164)等。特定的实施方案可以利用有限的分离。有限分离是指例如通过除去红细胞和/或粘附的吞噬细胞的粗细胞富集。
在特定的实施方案中,可以使用例如CD34+HSPC,使用直接或间接缀合到磁性颗粒的抗体结合磁性细胞分离器,例如
Figure BDA0003153030530000641
细胞分离系统(Miltenyi Biotec,Bergisch Gladbach,德国)处理受试者样品(例如血液样品)以选择/富集关于图2概述的细胞。在进行一些有限的细胞富集的特定的实施方案中,可以基于单独的CD34;单独的CD133+;单独的CD90+;单独的CD164+;单独的CD46+;或单独的LH+富集样品内的细胞。在特定的实施方案中,可以基于CD34;CD133+;CD90+;CD164+;CD46+;AHR+;或LH+的各种组合中的一种或多种富集和/或分离细胞。在特定的实施方案中,LH+意指细胞表达LHRH受体。在特定的实施方案中,AHR+意指细胞表达芳香烃受体。
当实施减少的但不是最少的制造时,扩增HSC/HSPC可能是有用的。扩增可在一种或多种生长因子存在下发生,所述生长因子诸如:血管生成素样蛋白(Angptl,例如Angptl2、Angptl3、Angptl7、Angptl5和Mfap4);促红细胞生成素;成纤维细胞生长因子-1(FGF-1);Flt-3配体(Flt-3L);粒细胞集落刺激因子(G-CSF);粒细胞-巨噬细胞集落刺激因子(GM-CSF);胰岛素生长因子-2(IFG-2);白介素-3(IL-3);白介素-6(IL-6);白介素-7(IL-7);白介素-11(IL-11);干细胞因子(SCF;也称为c-kit配体或肥大细胞生长因子);血小板生成素(TPO);及其类似物(其中所述类似物包括具有天然存在的生长因子的生物活性的生长因子的任何结构变体;参见例如WO2007/1145227和美国专利公开号2010/0183564)。
在特定的实施方案中,适于扩增HSC/HSPC或淋巴细胞的生长因子的量或浓度是有效促进增殖的量或浓度。淋巴细胞群优选扩增直到获得足够数目的细胞以提供至少一次输注到人受试者中,通常约104个细胞/kg至109个细胞/kg。
适于扩增HSC/HSPC或淋巴细胞的生长因子的量或浓度取决于生长因子制品的活性,以及生长因子与淋巴细胞之间的物种对应等。通常,当生长因子和淋巴细胞属于同一物种时,培养基中生长因子的总量在1ng/ml至5μg/ml、5ng/ml至1μg/ml或5ng/ml至250ng/ml的范围内。在特定的实施方案中,生长因子的量可以在5-1000或50-100ng/ml的范围内。
在特定的实施方案中,生长因子以下列浓度存在于扩增培养条件中:25-300ng/mlSCF、25-300ng/ml Flt-3L、25-100ng/ml TPO、25-100ng/ml IL-6和10ng/ml IL-3。在特定的实施方案中,可使用50、100或200ng/ml SCF;50、100或200ng/ml Flt-3L;50或100ng/mlTPO;50或100ng/ml IL-6;以及10ng/ml IL-3。
HSC/HSPC或淋巴细胞可在组织培养皿中扩增,在所述组织培养皿上结合细胞外基质蛋白,诸如纤连蛋白(FN)或其片段(例如CH-296(Dao等人,1998,Blood 92(12):4612-21))或
Figure BDA0003153030530000651
(重组人纤连蛋白片段;(Clontech Laboratories,Inc.,Madison,W1)。
Notch激动剂可特别用于扩增HSC/HSPC。在特定的实施方案中,HSC/HSPC可以通过将HSC/HSPC暴露于固定化的Notch激动剂和50ng/ml或100ng/ml SCF;固定化的Notch激动剂和各50ng/ml或100ng/ml Flt-3L、IL-6、TPO和SCF;或固定化的Notch激动剂和各50ng/ml或100ng/ml Flt-3L、IL-6、TPO和SCF,以及10ng/ml IL-11或IL-3来扩增。
关于合适的培养和/或扩增条件的其他一般信息,参见美国专利号7,399,633;美国专利公开号2010/0183564;Freshney Culture of Animal Cells,Wiley-Liss,Inc.,NewYork,NY(1994));Vamum-Finney等人,1993,Blood 101:1784-1789;Ohishi等人,2002,J.Clin.Invest.110:1165-1174;Delaney等人,2010,Nature Med.16(2):232-236;WO2006/047569A2;WO 2007/095594A2;美国专利5,004,681;WO 2011/127470 A1;WO 2011/127472A1;以及参见Regenerative Medicine,Department of Health and HumanServices第2章,2006年8月,以及其中引用的参考。
当进行减少的但不是最少的操作制造时,可以通过使用基于密度的细胞分离方法和相关方法富集样品的T细胞。例如,通过裂解红细胞并通过Percoll或Ficoll梯度离心样品,可将白细胞与外周血中的其他细胞类型分离。
在特定的实施方案中,可以使用未富集特定的T细胞类型的大量T细胞群体。在特定的实施方案中,可以根据基于细胞标记物的阳性和/或阴性选择来富集和/或分离所选T细胞类型。不同T细胞亚群的细胞标记物如上所述。在特定的实施方案中,通过阳性或阴性选择技术分离T细胞的特定亚群,诸如阳性或表达高水平的一种或多种表面标记物的细胞,例如CCR7、CD45RO、CD8、CD27、CD28、CD62L、CD127、CD4和/或CD45RA T细胞。
可以使用抗CD3/抗CD28缀合的磁珠(例如
Figure BDA0003153030530000661
M-450CD3/CD28 T细胞扩增剂)阳性选择并扩增CD3+、CD28+T细胞。
在特定的实施方案中,CD8+或CD4+选择步骤用于分离CD4+辅助T细胞和CD8+细胞毒性T细胞。这种CD8+和CD4+群体可以通过阳性或阴性选择在一个或多个原初T细胞、记忆T细胞和/或效应T细胞亚群上表达或以相对较高程度表达的标记物而进一步分类成亚群。
在一些实施方案中,进行中枢记忆T(TCM)细胞的富集。在特定的实施方案中,记忆T细胞存在于CD8+外周血淋巴细胞的两个CD62L子集中。可以诸如通过使用抗CD8和抗CD62L抗体富集或耗尽PBMC的CD62L、CD8和/或CD62L+CD8+部分。
在一些实施方案中,中枢记忆T(TCM)细胞的富集基于CCR7、CD45RO、CD27、CD62L、CD28、CD3和/或CD127的阳性或高表面表达;在一些方面,它基于表达或高度表达CD45RA和/或粒酶B的细胞的阴性选择。在一些方面,通过耗尽表达CD4、CD14、CD45RA的细胞和阳性选择或富集表达CCR7、CD45RO和/或CD62L的细胞来分离富集TCM细胞的CD8+群体。在一个方面,中枢记忆T(TCM)细胞的富集从基于CD4表达选择的细胞的阴性部分开始进行,所述部分进行基于CD14和CD45RA的表达的阴性选择和基于CD62L的阳性选择。此类选择在一些方面是同时进行的,而在其他方面是以任一顺序依次进行的。在一些方面,用于制备CD8+细胞群体或亚群的相同的基于CD4表达的选择步骤也用于产生CD4+细胞群体或亚群,使得来自基于CD4的分离的阳性和阴性部分两者都任选地在一个或多个另外的阳性或阴性选择步骤之后得以保留。
在一个特定的实例中,对PBMC样品或其他白细胞样品进行CD4+细胞的选择,其中阳性和阴性部分两者都得以保留阴。然后基于CD14和CD45RA或RORI的表达对阴性部分进行阴性选择,并基于中枢记忆T细胞的标记物特征诸如CCR7、CD45RO和/或CD62L进行阳性选择,其中阳性和阴性选择以任一顺序进行。
在特定的实施方案中,细胞富集产生大量CD8+FACS分选的细胞群体。
T细胞群体可在培养起始组合物中孵育以扩增T细胞群体。孵育可以在培养容器中进行,诸如袋、细胞培养板、烧瓶、室、色谱柱、交联凝胶、交联聚合物、柱、培养皿、中空纤维、微量滴定板、二氧化硅涂覆的玻璃板、管、管组、孔、小瓶或用于培养或培育细胞的其他容器。
培养条件可以包括以下中的一个或多个:特定培养基、温度、氧含量、二氧化碳含量、时间、药剂,例如营养物、氨基酸、抗生素、离子、和/或刺激因子,例如细胞因子、趋化因子、抗原、结合配偶体、融合蛋白、重组可溶性受体和设计用于激活细胞的任何其他药剂。
在一些方面,根据诸如US 6,040,177,Klebanoff等人(2012)J Immunother.35(9):651-660,Terakura等人(2012)Blood.1:72-82,和/或Wang等人(2012)JImmunother.35(9):689-701中描述的技术进行孵育。
用于培养T细胞的示例性培养基包括(i)补充有非必需氨基酸、丙酮酸钠和青霉素/链霉素的RPMI;(ii)具有HEPES、5-15%人血清、1-3%L-谷氨酰胺、0.5-1.5%青霉素/链霉素和0.25x10-4-0.75x10-4Mβ-巯基乙醇的RPMI;(iii)补充有10%胎牛血清(FBS)、2mM L-谷氨酰胺、10mM HEPES、100U/ml青霉素和100m/mL链霉素的RPMI-1640;(iv)补充有10%FBS、2mM L-谷氨酰胺、10mM HEPES、100U/ml青霉素和100m/mL链霉素的DMEM培养基;和(v)补充有5%人AB血清(Gemcell,West Sacramento,CA)、1%HEPES(Gibco,Grand Island,NY)、1%Pen-Strep(Gibco),1%GlutaMax(Gibco)和2%N-乙酰基半胱氨酸(Sigma-Aldrich,St.Louis,MO)的X-Vivo 15培养基(Lonza,Walkersville,MD)。T细胞培养基也可从Hyclone(Logan,UT)商购获得。可以添加到此类培养基中的其他T细胞激活组分在下面更详细地描述。
在一些实施方案中,通过向培养起始组合物中添加饲养细胞诸如非分裂外周血单核细胞(PBMC)(例如,使得对于待扩增的起始群体中的每个T淋巴细胞,所得细胞群体含有至少5、10、20或40或更多个PBMC饲养细胞);以及孵育所述培养物(例如,持续足以扩增T细胞数目的时间)来扩增T细胞。在一些方面,非分裂饲养细胞可包括γ辐射的PBMC饲养细胞。在一些实施方案中,用3000至3600rads范围内的γ射线辐射PBMC以防止细胞分裂。在一些方面,在添加T细胞群体之前将饲养细胞添加培养基中。
任选地,孵育还可以包括添加非分裂的EBV转化的类淋巴母细胞(LCL)作为饲养细胞。LCL可用6000至10,000rads范围内的γ射线辐射。在一些方面,LCL饲养细胞以任何合适的量提供,诸如LCL饲养细胞与初始T淋巴细胞的比率为至少10∶1。
在一些实施方案中,刺激条件包括适于人T淋巴细胞生长的温度,例如至少25℃、至少30℃或37℃。
T细胞的激活培养条件包括培养起始组合物的T细胞增殖或扩增的条件。
(VI)细胞的配制和冷冻保存。使用最少操作制造过程遗传修饰的细胞可以在遗传修饰后直接施用给受试者。在特定的实施方案中,遗传修饰的细胞可以被配制成用于施用给受试者的基于细胞的组合物。基于细胞的组合物是指用药学上可接受的运载体制备的用于施用给受试者的细胞。
示例性运载体和细胞施用模式描述于美国专利公开号2010/0183564的第14-15页。其他药物运载体描述于Remington:The Science and Practice of Pharmacy,第21版,David B.Troy,ed.,Lippicott Williams&Wilkins(2005)中。
在特定的实施方案中,可以从培养基中收获细胞,并且洗涤并以治疗有效量浓缩到运载体中。示例性运载体包括盐水、缓冲盐水、生理盐水、水、Hanks溶液、Ringer溶液、Nonnosol-R(Abbott Labs)、Plasma-Lyte
Figure BDA0003153030530000691
(Baxter Laboratories,Inc.,MortonGrove,IL)、甘油、乙醇及其组合。
在特定的实施方案中,运载体可以补充有人血清白蛋白(HSA)或其他人血清组分或胎牛血清。在特定的实施方案中,用于输注的运载体包括具有5%HAS或右旋糖的缓冲盐水。其他等渗剂包括多元糖醇,包括三元或更高级糖醇,诸如甘油、赤藓糖醇、阿拉伯糖醇、木糖醇、山梨糖醇或甘露糖醇。
运载体可以包括缓冲剂,诸如柠檬酸盐缓冲剂、琥珀酸盐缓冲剂、酒石酸盐缓冲剂、富马酸盐缓冲剂、葡糖酸盐缓冲剂、草酸盐缓冲剂、乳酸盐缓冲剂、乙酸盐缓冲剂、磷酸盐缓冲剂、组氨酸缓冲剂和/或三甲胺盐。
稳定剂是指广泛种类的赋形剂,其功能范围可以从填充剂到有助于防止细胞粘附于容器壁的添加剂。典型的稳定剂可以包括多元糖醇;氨基酸,诸如精氨酸、赖氨酸、甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、丙氨酸、鸟氨酸、L-亮氨酸、2-苯丙氨酸、谷氨酸和苏氨酸;有机糖或糖醇,诸如乳糖、海藻糖、水苏糖、甘露糖醇、山梨糖醇、木糖醇、核糖醇、肌醇(myoinisitol)、半乳糖醇、甘油和环醇,诸如肌醇(inositol);PEG;氨基酸聚合物;含硫还原剂,诸如尿素、谷胱甘肽、硫辛酸、巯基乙酸钠、硫代甘油、α-单硫代甘油和硫代硫酸钠;低分子量多肽(即<10个残基);蛋白质,诸如HSA、牛血清白蛋白、明胶或免疫球蛋白;亲水性聚合物,诸如聚乙烯吡咯烷酮;单糖,诸如木糖、甘露糖、果糖和葡萄糖;二糖,诸如乳糖、麦芽糖和蔗糖;三糖,诸如棉子糖,和多糖,诸如葡聚糖。
必要或有益时,基于细胞的组合物可包含诸如利多卡因的局部麻醉剂以减轻注射部位的疼痛。
示例性防腐剂包括苯酚、苯甲醇、间甲酚、对羟基苯甲酸甲酯、对羟基苯甲酸丙酯、十八烷基二甲基苄基氯化铵、苯扎氯铵、氯化六甲基铵、对羟基苯甲酸烷基酯诸如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯、儿茶酚、间苯二酚、环己醇和3-戊醇。
例如,基于细胞的组合物中细胞的治疗有效量可以大于102个细胞、大于103个细胞、大于104个细胞、大于105个细胞、大于106个细胞、大于107个细胞、大于108个细胞、大于109个细胞、大于1010个细胞或大于1011个细胞。如果患者是受调节的,优选输注相当于最少2百万个CD34+细胞/kg体重的产品。在未被调节的患者中,最少1百万个CD34+细胞/kg体重是可接受的。
在本文公开的基于细胞的组合物中,细胞的体积通常为1升或更少、500mL或更少、250mL或更少或100mL或更少。因此,施用细胞的密度通常大于104个细胞/mL、107个细胞/mL或108个细胞/mL。
可以制备本文公开的细胞或基于细胞的组合物用于通过例如注射、输注、灌注或灌洗施用。可进一步配制细胞或基于细胞的组合物用于骨髓、静脉内、皮内、动脉内、结内、淋巴管内、腹膜内、病灶内、前列腺内、阴道内、直肠内、局部、鞘内、瘤内、肌内、囊内和/或皮下注射。
在特定的实施方案中,细胞或基于细胞的组合物在遗传修饰和/或制剂施用完成后尽可能快地施用给有此需要的受试者。在特定的实施方案中,冷冻保存细胞可能是必要的或有益的。术语“冷冻(frozen/freezing)”和“冷冻保存(cryopreserved/cryopreserving)”可以互换使用。冷冻包括冷冻干燥。在特定的实施方案中,冷冻保存新鲜细胞可以减少不需要的细胞群体。因此,特定的实施方案包括在向样品施用NP之前冷冻保存生物样品。在特定的实施方案中,在冷冻保存前洗涤生物样品以除去血小板。
如本领域普通技术人员所理解的,细胞的冷冻可以是破坏性的(参见Mazur,P.,1977,Cryobiology 14:251-272),但是有许多方法可用于防止这种损伤。例如,可以通过(a)使用冷冻保护剂,(b)控制冷冻速率,和/或(c)在足够低的温度下储存以使降解反应最小化来避免损伤。示例性冷冻保护剂包括二甲亚砜(DMSO)(Lovelock和Bishop,1959,Nature 183:1394-1395;Ashwood-Smith,1961,Nature 190:1204-1205)、甘油、聚乙烯吡咯烷(Rinfret,1960,Ann.N.Y.Acad.Sci.85:576)、聚乙二醇(Sloviter和Ravdin,1962,Nature 196:548)、白蛋白、葡聚糖、蔗糖、乙二醇、赤藓醇、D-核糖醇、D-甘露糖醇(Rowe等人,1962,Fed.Proc.21:157)、D-山梨糖醇、i-肌醇、D-乳糖、氯化胆碱(Bender等人,1960,J.Appl.Physiol.15:520)、氨基酸(Phan The Tran和Bender,1960,Exp.Cell Res.20:651)、甲醇、乙酰胺、甘油单乙酸酯(Lovelock,1954,Biochem.J.56:265)和无机盐(PhanThe Tran和Bender,1960,Proc.Soc.Exp.Biol.Med.104:388;Phan The Tran和Bender,1961,in Radiobiology,Proceedings of the Third Australian Conference onRadiobiology,llbery编,Butterworth,London,第59页)。在特定的实施方案中,可以使用DMSO。添加血浆(例如,至20-25%的浓度)可以增强DMSO的保护作用。添加DMSO后,细胞可保持在0℃直到冷冻,因为1%的DMSO浓度在高于4℃的温度下可能是有毒性的。
在细胞的冷冻保存中,缓慢控制的冷却速率可能是关键的,并且不同的冷冻保护剂(Rapatz等人,1968,Cryobiology 5(1):18-25)和不同细胞类型具有不同的最佳冷却速率(参见例如Rowe和Rinfret,1962,Blood 20:636;Rowe,1966,Cryobiology 3(1):12-18;Lewis,等人,1967,Transfusion 7(1):17-32;以及Mazur,1970,Science 168:939-949 foreffects of cooling velocity on survival of stem cells and on theirtransplantation potential)。水变成冰的熔化热应该是最小的。冷却过程可以通过使用例如可编程的冷冻装置或甲醇浴过程来进行。可编程的冷冻设备允许确定最佳的冷却速率并便于标准的可再现的冷却。
在特定的实施方案中,DMSO处理的细胞可以在冰上预冷却并转移到含有冷冻甲醇的托盘中,所述托盘继而置于-80℃的机械冰箱(例如Harris或Revco)中。甲醇浴和样品的热电偶测量表明1℃/分钟至3℃/分钟的冷却速率可以是优选的。在至少两小时之后,标本可以达到-80℃的温度并且可以直接置于液氮(-196℃)中。
彻底冷冻后,可将细胞快速转移到长期低温储存容器中。在特定的实施方案中,样品可以低温储存在液氮(-196℃)或蒸气(-1℃)中。高效液氮冰箱的可用性促进了这种储存。
用于细胞的操作、冷冻保存和长期储存的其他考虑和程序可以在以下示例性参考文献中找到:美国专利号4,199,022;3,753,357;和4,559,298;Gorin,1986,Clinics InHaematology 15(1):19-48;Bone-Marrow Conservation,Culture and Transplantation,Proceedings of a Panel,Moscow,July 22-26,1968,International Atomic EnergyAgency,Vienna,第107-186页;Livesey和Linner,1987,Nature 327:255;Linner等人,1986,J.Histochem.Cytochem.34(9):1123-1135;Simione,1992,J.Parenter.Sci.Technol.46(6):226-32)。
冷冻保存后,可根据本领域普通技术人员已知的方法解冻冷冻细胞以供使用。冷冻细胞优选快速解冻并在解冻后立即冷冻。在特定的实施方案中,可以将含有冷冻细胞的小瓶浸入温水浴中直到其颈部;温和旋转将确保细胞悬浮液在其解冻时混合并增加从温水到内部冰块的热传递。一旦冰完全融化,可以立即将小瓶置于冰上。
在特定的实施方案中,可以使用防止细胞在解冻过程中结块的方法。示例性方法包括:在冷冻之前和/或之后添加DNA酶(Spitzer等人,1980,Cancer 45:3075-3085)、低分子量葡聚糖和柠檬酸盐、羟乙基淀粉(Stiff等人,1983,Cryobiology 20:17-24)等。
如本领域普通技术人员所理解的,如果使用对人有毒性的冷冻保护剂,则应该在治疗性使用前将其除去。DMSO无严重毒性。
(VII)纳米颗粒制剂。本文公开的NP还可以配制用于直接施用给受试者。如图4所示,可以选择AuNP的尺寸以影响人体内的生物分布。适用于本公开的NP可以是任何形状并且尺寸范围可以是5nm-1000nm,例如5nm-10nm、5-50mm、5nm-75nm、5nm-40nm、10nm-30或20nm-30nm。NP的尺寸也可以在以下范围内:10nm-15nm、15nm-20nm、20nm-25nm、25nm-30nm、30nm-35nm、35nm-40nm、40nm-45nm或45nm-50nm、50nm-55nm、55nm-60nm、60nm-65nm、65nm-70nm、70nm-75nm、75nm-80nm、80nm-85nm、85nm-90nm、90nm-95nm、95nm-100nm、100nm-105nm、105nm-110nm、110nm-115nm、115nm-120nm、120nm-125nm、125nm-130nm、130nm-135nm、135nm-140nm、140nm-145nm、145nm-150nm、100nm-500nm、100nm-150nm、150nm-200nm、200nm-250nm、250nm-300nm、300nm-350nm、350nm-400nm、400nm-450nm或450nm-500nm。在特定的实施方案中,排除大于550nm的NP。这是因为>600nm的颗粒或聚集颗粒不适于细胞摄取。
组合物中治疗有效量的NP可以包括至少0.1%w/v或w/w颗粒;至少1%w/v或w/w颗粒;至少10%w/v或w/w颗粒;至少20%w/v或w/w颗粒;至少30%w/v或w/w颗粒;至少40%w/v或w/w颗粒;至少50%w/v或w/w颗粒;至少60%w/v或w/w颗粒;至少70%w/v或w/w颗粒;至少80%w/v或w/w颗粒;至少90%w/v或w/w颗粒;至少95%w/v或w/w颗粒;或至少99%w/v或w/w颗粒。
(VIII)试剂盒。本公开还提供了包含本文公开的元件中的任一种或多种的试剂盒。在特定的实施方案中,试剂盒可以包含如本文所述的NP,其包括指导RNA和能够切割靶序列的核酸酶。试剂盒可另外包含一种或多种HDT、靶向配体和/或聚合物(例如PEG、PEI)。元件可以单独或组合提供,并且可以提供在任何合适的容器中,例如小瓶、瓶、袋或管。在一些实施方案中,试剂盒包含一种或多种语言的说明书。
在特定的实施方案中,试剂盒包含利用本文所述的元件中得一种或多种的方法中使用的一种或多种试剂。试剂可以在任何合适的容器中提供。例如,试剂盒可提供一种或多种反应或储存缓冲液。试剂可以以可用于特定测定的形式或以在使用前需要添加一种或多种其他组分的形式(例如,以浓缩物或冻干形式)提供。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施方案中,缓冲液是碱性的。在一些实施方案中,缓冲液具有7至10的pH。在一些实施方案中,试剂盒包含指导RNA(例如cRNA)、核酸酶(例如Cpf1)、Au核心和/或同源重组模板多核苷酸。
试剂盒还可以包含一种或多种组分以收集、加工、修饰和/或配制用于施用的细胞。试剂盒可提供有进行减少或最少操作的离体细胞制造的组分。也可包含制造品和/或对临床工作人员的说明书。
(IX)示例性使用方法。如所指出的,所选细胞类型可以从受试者获得。在特定的实施方案中,将细胞以治疗有效量重新引入原始样品所来源的同一受试者。在特定的实施方案中,细胞以治疗有效量施用给不同的受试者。
本文公开的组合物和制剂可用于治疗受试者(人、兽医动物(狗、猫、爬行动物、鸟等)、家畜(马、牛、山羊、猪、鸡等)和研究动物(猴、大鼠、小鼠、鱼等)。在特定的实施方案中,受试者是人患者。
可以使用本文所述的以减少的或最少的操作制造的NP组合物或细胞制剂治疗的疾病的实例包括单基因血液病、血友病、格雷夫斯病、类风湿性关节炎、恶性贫血、多发性硬化(MS)、炎性肠病、系统性红斑狼疮(SLE)、Wiskott-A1drich综合征(WAS)、慢性肉芽肿病(CGD)、Battens病、肾上腺脑白质营养不良(ALD)或异染性脑白质营养不良(MLD)、肌营养不良、肺泡性蛋白沉积症(PAP)、丙酮酸激酶缺乏症、Shwachmann-Diamond-Blackfan贫血、先天性角化不良、囊性纤维化、帕金森病、阿尔茨海默病、肌萎缩性侧索硬化(Lou Gehrig病)、急性淋巴母细胞性白血病(ALL)、急性骨髓性白血病(AML)、原因不明的髓样化生、巨核细胞增多症/先天性血小板减少症、共济失调性毛细血管扩张症、重型地中海贫血、CLL、慢性骨髓性白血病(CML)、慢性骨髓单核细胞性白血病、常见的可变免疫缺乏症(CVID)、补体障碍、先天性(X连锁)无丙种球蛋白血症、家族性噬红细胞性淋巴组织细胞增多症、霍奇金淋巴瘤、Hurler综合征、高IgM、IgG亚类缺乏症、幼年型粒单核细胞白血病、粘多糖症、多发性骨髓瘤、脊髓发育不良、非霍奇金淋巴瘤、阵发性夜间血红蛋白尿(PNH)、原发性免疫缺陷病伴抗体缺乏、纯红细胞再生障碍、难治性贫血、选择性IgA缺乏、严重再生障碍性贫血、SCD和/或特异性抗体缺乏。
(X)示例性制造实施方案和比较。
Figure BDA0003153030530000761
示例性制造方案的比较。
Figure BDA0003153030530000762
Figure BDA0003153030530000771
Figure BDA0003153030530000781
(XI)评估纳米颗粒性能的测定。本领域已知的测定可用于评估本文所述的NP的有效性,其包括:细胞群体对NP摄取的有效性,NP摄取对细胞活力的影响,以及在最少操作的血细胞产品(包括使用本文所述的NP进行遗传修饰的细胞群体)中NP的任何残留存在。如上所述,还可以确定所选细胞群体的基因编辑的存在、水平或速率。测定也可用于确定是否选择包含本文所述的NP的治疗性制剂和/或是否选择包含使用本文所述的NP进行遗传修饰的细胞群体的最少操作的血细胞产品用于进一步开发
细胞群体对NP的摄取可通过本领域已知的多种方法评估,其包括共聚焦显微镜、荧光激活细胞分选(FACS)和电感耦合等离子体(ICP)技术,包括:ICP-质谱(ICP-MS)、ICP-原子发射光谱(ICP-AES)和ICP-光发射光谱(ICP-OES)。在特定的实施方案中,crRNA和/或供体模板可以用染料标记并使用共聚焦显微镜评估细胞摄取。在特定的实施方案中,使用识别细胞表面标记物的荧光标记抗体的FACS可以与共聚焦显微镜联合使用,以测试目标细胞群体是否已经被标记的NP所靶向。在特定的实施方案中,识别细胞表面标记物的标记抗体在小的磁化颗粒上,并且可以进行基于免疫磁珠的分选以确定细胞群体已被标记的NP所靶向。在特定的实施方案中,ICP技术允许定性和定量痕量元素检测。ICP的特定实施方案使用等离子体来雾化或激发样品用于检测。在特定的实施方案中,可以通过将射频发生器的能量引导到诸如ICP氩、氦或氮的合适气体中来产生ICP。在特定的实施方案中,ICP-MS可用于检测包含使用本文所述的NP进行遗传修饰的细胞群体的最少操作的血细胞产品中的任何残留NP。
在特定的实施方案中,50%至100%、50%至90%或50%至80%的靶细胞摄取本文所述的NP。在特定的实施方案中,50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的靶细胞摄取本文所述的NP。在特定的实施方案中,靶细胞是被本文所述的NP靶向用于遗传修饰的细胞。在特定的实施方案中,靶细胞是通过NP上的结合细胞上的细胞表面标记物的靶向配体而被NP靶向的细胞。在特定的实施方案中,非靶细胞是未被本文所述的NP靶向用于遗传修饰的细胞。在特定的实施方案中,非靶细胞是未被本文所述的NP靶向的细胞,因为它们不表达被NP上的靶向配体识别的细胞表面标记物。
用Au/CRISPR NP处理后的细胞活力可以在不同的时间点使用台盼蓝分析,台盼蓝是一种专门标记死细胞的染料,并因此可以用于区分活细胞和死细胞。台盼蓝可购自商业经销商诸如Invitrogen(Carlsbad,CA)。可以使用细胞计数器诸如ThermoFisherScientific(Waltham,MA)的Countess II FL自动细胞计数仪进行细胞计数。可以记录每个样品的细胞活力百分比并报告为平均值±SD。
还可以使用基于荧光的测定诸如来自Invitrogen(Carlsbad,CA)的
Figure BDA0003153030530000801
测定试剂盒来分析细胞活力,在
Figure BDA0003153030530000802
测定中,两种化合物可以区分活细胞和死细胞。首先,不渗透细胞的染料(例如,乙锭同型二聚体-1)仅结合活细胞的表面并产生非常微弱的荧光,而染料可穿透死细胞的细胞膜并结合内部分子,产生非常亮的荧光。第二,非荧光细胞渗透性染料(例如钙黄绿素AM)可通过活细胞中的酯酶活性转化为强荧光形式(例如钙黄绿素)。标记的细胞可以在荧光显微镜下使用适当的激发和发射值进行成像。可以使用适当的软件对活细胞和死细胞进行计数和成像。
在特定的实施方案中,70%至100%、70%至90%或70%至80%的靶细胞在用包含本文所述的NP的治疗性制剂处理后是活的。在特定的实施方案中,70%、75%、80%、85%、90%、95%或100%的靶细胞在用包含本文所述的NP的治疗性制剂处理后是活的。
在特定的实施方案中,用本文所述的NP处理的HSC/HSPC的适合度可以通过集落形成细胞(CFC)测定(也称为甲基纤维素测定)来评估。在CFC测定中,可以评估HSC/HSPC响应于细胞因子刺激而在半固体培养基中增殖并分化成集落的能力。可以将细胞铺板在含有重组人生长因子的甲基纤维素中并孵育指定的时间段。可对所得集落进行计数并在立体显微镜上对形态进行评分,以确定每个铺板细胞数(例如,100,000个铺板细胞)的集落形成细胞数。
在特定的实施方案中,用本文所述的NP处理的HSC/HSPC的适合度可以使用亚致死辐射的免疫缺陷(NOD/SCIDγ-/-;NSG)小鼠通过体内研究来评估。这些研究可以通过细胞重建骨髓抑制宿主的能力来评估HSC/HSPC的适合度。在特定的实施方案中,可以将指定数目的细胞输注到NSG小鼠中,并跟踪小鼠数周以评估HSC/HSPC的植入。
HSC/HSPC和/或其他细胞群体的植入可以通过从小鼠收集生物样品(例如血液、骨髓、脾)并使用结合细胞表面标记物的荧光标记物抗体进行FACS来评估。在特定的实施方案中,FACS可以检测表达CD45的细胞(HSC/HSPC)、表达CD20的细胞(B细胞)、表达CD14的细胞(单核细胞)、表达CD3的细胞(T细胞)、表达CD4的细胞(T细胞)、和表达CD8的细胞(T细胞)的水平。在特定的实施方案中,可以使用包含含有结合细胞表面标记物的抗体的小磁化颗粒的基于免疫磁珠的分选。
在特定的实施方案中,包含本文所述的NP的治疗性制剂可以进行释放测试以确定治疗性制剂用于体内再输注测试的适合性。在特定的实施方案中,释放测试包括革兰氏染色、3天无菌、14天无菌、支原体、内毒素和通过台盼蓝进行的细胞活力。在特定的实施方案中,如果释放测试产生:革兰氏染色、3天无菌、14天无菌和支原体的阴性结果;≤0.5EU/mL内毒素;以及通过台盼蓝的≥70%活力,则可以推进治疗性制剂用于进一步开发。
在特定的实施方案中,可以使用NSG小鼠体内评估包含使用本文所述的NP进行遗传修饰的细胞群体的最少操作的血细胞产品的性能。在特定的实施方案中,HSC/HSPC和/或其他细胞群体的植入可以如上所述进行评估。
按照Burkholder等人Health Evaluation of Experimental LaboratoryMice.Current Protocols in Mouse Biology,2012;2:145-165所述的方案,可以视觉监测用包含使用本文所述的NP进行遗传修饰的细胞群体的最少操作的血细胞产品输注的小鼠的输注对健康的任何影响(例如梳理、体重、活动水平)。在特定的实施方案中,可以通过ICP-MS评估输注的血细胞产品中NP的存在。在特定的实施方案中,可以在输注后的给定时间(例如72小时)通过ICP-MS评估小鼠的尿液和粪便中NP的存在,以确定是否所有的NP已经被清除(质量平衡)。在特定的实施方案中,72小时内的尿液/粪便中的最小阈值是0,并且最大阈值不能超过注射的总质量。如果指示生物累积,可以进行活小鼠的微计算机断层扫描(CT)成像以评估累积的位置。在特定的实施方案中,还可以进行ICP-MS和/或尸检以确定生物累积的部位。在特定的实施方案中,微CT、尸检和/或痕量元素分析(例如ICP-MS)可与组织病理学组合以评估NP在输注小鼠中的潜在毒性。在特定的实施方案中,将输注小鼠中的器官毒性与来自所有供体的未处理对照进行比较。在特定的实施方案中,对于组织病理学,最小阈值是无毒性的,并且最大阈值使用针对每个靶器官公布的不良事件标准进行分级。
(XII)示例性实施方案。
1.一种遗传修饰生物样品中的所选细胞群体的方法,所述方法已经历了减少或最少的操作,包括将本文公开的纳米颗粒(NP)添加到所述生物样品。
2.如实施方案1所述的方法,其中所述NP是金NP(AuNP)。
3.如实施方案1或2所述的方法,其中所述NP包含指导RNA(gRNA),其中所述gRNA的一个末端缀合到接头,并且所述gRNA的另一个末端缀合到核酸酶,并且其中所述接头允许所述gRNA共价连接到所述NP的表面。
4.如实施方案3所述的方法,其中所述gRNA包含成簇规则间隔短回文重复序列(CRISPR)指导RNA(crRNA)。
5.如实施方案4所述的方法,其中所述crRNA的3’末端缀合到所述接头。
6.如实施方案4所述的方法,其中所述crRNA的5’末端缀合到所述接头。
7.如实施方案4或5所述的方法,其中所述crRNA的5’末端缀合到所述核酸酶。
8.如实施方案4或6所述的方法,其中所述crRNA的3’末端缀合到所述核酸酶。
9.如实施方案3-8中任一项所述的方法,其中所述接头包含具有硫醇修饰的间隔物。
10.如实施方案9所述的方法,其中所述间隔物是寡聚乙二醇间隔物。
11.如实施方案10所述的方法,其中所述寡聚乙二醇间隔物是10-26原子寡聚乙二醇间隔物。
12.如实施方案10或11所述的方法,其中所述寡聚乙二醇间隔物是18原子寡聚乙二醇间隔物。
13.如实施方案3-12中任一项所述的方法,其中所述crRNA包含如SEQ ID NO:5;SEQ ID NO:6;SEQ ID NO:13;SEQ ID NO:14;或SEQ ID NO:225-264中所示的序列。
14.如实施方案3-13中任一项所述的方法,其中所述NP还包含比所述gRNA和所述核酸酶离所述NP的表面更远的供体模板。
15.如实施方案14所述的方法,其中所述供体模板包含治疗性基因。
16.如实施方案15所述的方法,其中所述治疗性基因包含或编码骨骼蛋白4.1、血型糖蛋白、p55、Duffy等位基因、珠蛋白家族基因;WAS;phox;抗肌萎缩蛋白;丙酮酸激酶;CLN3;ABCD1;芳基硫酸酯酶A;SFTPB;SFTPC;NLX2.1;ABCA3;GATA1;核糖体蛋白基因;TERT;TERC;DKC1;TINF2;CFTR;LRRK2;PARK2;PARK7;PINK1;SNCA;PSEN1;PSEN2;APP;SOD1;TDP43;FUS;泛素2;C9ORF72、α2β1;αvβ3;αvβ5;αvβ63;BOB/GPR15;Bonzo/STRL-33/TYMSTR;CCR2;CCR3;CCR5;CCR8;CD4;CD46;CD55;CXCR4;氨基肽酶-N;HHV-7;ICAM;ICAM-1;PRR2/HveB;HveA;α-肌营养不良蛋白聚糖;LDLR/α2MR/LRP;PVR;PRR1/HveC、层粘连蛋白受体、101F6、123F2、53BP2、abl、ABLI、ADP、aFGF、APC、ApoAl、ApoAIV、ApoE、ATM、BAI-1、BDNF、Beta*(BLU)、bFGF、BLC1、BLC6、BRCA1、BRCA2、CBFA1、CBL、C-CAM、CFTR、CNTF、COX-1、CSFIR、CTS-1、胞嘧啶脱氨酶、DBCCR-1、DCC、Dp、DPC-4、E1A、E2F、EBRB2、erb、ERBA、ERBB、ETS1、ETS2、ETV6、Fab、FancA、FancB、FancC、FancDI、FancD2、FancE、FancF、FancG、Fancl、FancJ、FancL、FancM、FancN、FancO、FancP、FancQ、FancR、FancS、FancT、FancU、FancV、和FancW、FCC、FGF、FGR、FHIT、fms、FOX、FUS1、FUS1、FYN、G-CSF、GDAIF、基因21、基因26、GM-CSF、GMF、gsp、HCR、HIC-1、HRAS、hst、IGF、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、ING1、干扰素α、干扰素β、干扰素γ、IRF-1、JUN、KRAS、LCK、LUCA-1、LUCA-2、LYN、MADH4、MADR2、MCC、mda7、MDM2、MEN-I、MEN-II、MLL、MMAC1、MYB、MYC、MYCL1、MYCN、neu、NF-1、NF-2、NGF、NOEY1、NOEY2、NRAS、NT3、NT5、OVCA1、p16、p21、p27、p53、p57、p73、p300、PGS、PIM1、PL6、PML、PTEN、raf、Rap1A、ras、Rb、RB1、RET、rks-3、ScFv、scFV ras、SEM A3、SRC、TAL1、TCL3、TFPI、血小板反应蛋白、胸苷激酶、TNF、TP53、trk、T-VEC、VEGF、VHL、WT1、WT-1、YES、zac1、艾杜糖苷酶、IDS、GNS、HGSNAT、SGSH、NAGLU、GUSB、GALNS、GLB1、ARSB、HYAL1、F8、F9、HBB、CYB5R3、γC、JAK3、IL7RA、RAG1、RAG2、DCLRE1C、PRKDC、LIG4、NHEJ1、CD3D、CD3E、CD3Z、CD3G、PTPRC、ZAP70、LCK、AK2、ADA、PNP、WHN、CHD7、ORAI1、STIM1、CORO1A、CIITA、RFXANK、RFX5、RFXAP、RMRP、DKCl、TERT、TINF2、DCLRE1B和SLC46A1。
17.如实施方案14-16中任一项所述的方法,其中所述供体模板包括同源定向修复模板(HDT),其包含与经历修饰的基因组序列具有同源性的序列。
18.如实施方案18所述的方法,其中所述HDT包含如SEQ ID NO:2;SEQ ID NO:4;SEQ ID NO:8;SEQ ID NO:15;SEQ ID NO:33-41或SEQ ID NO:44-52中所示的序列。
19.如实施方案14-18中任一项所述的方法,其中所述供体模板包含单链DNA(ssDNA)。
20.如实施方案1-19中任一项所述的方法,其中所述NP是与至少三个层缔合的AuNP,其中所述第一层包含单链DNA(ssDNA),所述第二层包含成簇规则间隔短回文重复序列(CRISPR)指导RNA(crRNA),并且所述第三层包含核酸酶,并且其中所述第一层是最接近所述AuNP核心的表面的层,所述第二层是第二接近所述AuNP核心的表面的层,并且所述第三层是第三接近所述AuNP核心的表面的层。
21.如实施方案20所述的方法,其中所述第一层还包含聚乙二醇(PEG)。
22.如实施方案1-21中任一项所述的方法,其中所述添加的量为每毫升(mL)生物样品1、2、3、4、5、8、10、12、15或20μg NP。
23.如实施方案1-22中任一项所述的方法,其中将所述生物样品和所述添加的NP孵育1-48小时。
24.如实施方案1-22中任一项所述的方法,其中将所述生物样品和所述添加的NP孵育直到测试证实所述NP摄取到细胞中。
25.如实施方案24所述的方法,其中所述测试包括共焦显微镜成像或电感耦合等离子体(ICP)技术。
26.如实施方案24或25所述的方法,其中所述测试包括ICP-质谱法(ICP-MS)、ICP-原子发射光谱法(ICP-AES)或ICP-光学发射光谱法(ICP-OES)。
27.如实施方案1-26中任一项所述的方法,其中所述NP与带正电荷的聚合物(例如聚乙烯亚胺(PEI))涂层缔合。
28.如实施方案27所述的方法,其中所述带正电荷的聚合物涂层产生所述NP的表面,其中所述表面任选地包含供体模板。
29.如实施方案1-28中任一项所述的方法,其中所述NP包含靶向配体。
30.如实施方案29所述的方法,其中所述靶向配体包括抗体或其抗原结合片段、适体、蛋白质和/或结合结构域。
31.如实施方案29或30所述的方法,其中所述靶向配体延伸超过所述NP的表面。
32.如实施方案29-31中任一项当地的方法,其中所述靶向配体是结合CD3、CD4、CD34、CD46、CD90、CD133、CD164、促黄体生成激素释放激素(LHRH)受体或芳基烃受体(AHR)的结合分子(例如,抗体克隆:581;抗体克隆:561;抗体克隆:REA1164;抗体克隆:AC136;抗体克隆:5E10;抗体克隆:DG3;抗体克隆:REA897;抗体克隆:REA820;抗体克隆:REA753;抗体克隆:REA816;抗体克隆:293C3;抗体克隆:AC141;抗体克隆:AC133;抗体克隆:7;适体A15;适体B19;HCG(蛋白质/配体);促黄体生成激素(LH蛋白质/配体);或来源于前述任一个的结合片段)。
33.如实施方案29-32中任一项所述的方法,其中所述靶向配体是抗人CD3抗体或其抗原结合片段、抗人CD4抗体或其抗原结合片段、抗人CD34抗体或其抗原结合片段、抗人CD46抗体或其抗原结合片段、抗人CD90抗体或其抗原结合片段、抗人CD133抗体或其抗原结合片段、抗人CD164抗体或其抗原结合片段、抗人CD133适体、人促黄体生成激素、人绒毛膜促性腺激素、醋酸地格瑞克或StemRegenin 1。
34.如实施方案29-33中任一项所述的方法,其中所述核酸酶和靶向配体是连接的。
35.如实施方案34所述的方法,其中所述核酸酶和靶向配体通过氨基酸接头(例如直接氨基酸接头、柔性氨基酸接头或基于标签的氨基酸接头(例如Myc标签或Strep标签))连接。
36.如实施方案34或35所述的方法,其中所述核酸酶和靶向配体通过聚乙二醇连接。
37.如实施方案34-36中任一项所述的方法,其中所述核酸酶和靶向配体通过胺-巯基交联剂连接。
38.如实施方案3-37中任一项所述的方法,其中所述核酸酶选自Cpf1、Cas9或Mega-TAL。
39.如实施方案3-38中任一项所述的方法,其中所述核酸酶是Cpf1。
40.如实施方案34-39中任一项所述的方法,其中与所述核酸酶连接的所述靶向配体比与所述NP缔合的ssDNA离所述NP的表面更远。
41.如实施方案1-40中任一项所述的方法,其中所述NP与靶向本文所述的位点的crRNA缔合。
42.如实施方案1-41中任一项所述的方法,其中所述方法靶向包括选自包含SEQID NO:1;SEQ ID NO:3;SEQ ID NO:20-32;SEQ ID NO:42;SEQ ID NO:43;SEQ ID NO:84-97;或SEQ ID NO:214-224的序列的序列的基因组位点。
43.如实施方案1-42中任一项所述的方法,其中所述方法包括用选自SEQ ID NO:5;SEQ ID NO:6;SEQ ID NO:13;SEQ ID NO:14;或SEQ ID NO:225-264的序列靶向用于遗传修饰的基因组位点。
44.如实施方案1-43中任一项所述的方法,其中所述所选细胞群体包括选自以下的血细胞:造血干细胞(HSC)、造血祖细胞(HPC)、造血干细胞和祖细胞(HSPC)、T细胞、天然杀伤(NK)细胞、B细胞、巨噬细胞、单核细胞、间充质干细胞(MSC)、白细胞(WBC)、单核细胞(MNC)、内皮细胞(EC)、基质细胞和/或骨髓成纤维细胞。
45.如实施方案44所述的方法,其中所述血细胞包括CD34+CD45RA-CD90+HSC。
46.如实施方案44或45所述的方法,其中所述血细胞包括CD34+/CD133+HSC。
47.如实施方案44-46中任一项所述的方法,其中所述血细胞包括LH+HSC。
48.如实施方案44-47中任一项所述的方法,其中所述血细胞包括CD34+CD90+HSPC。
49.如实施方案44-48中任一项所述的方法,其中所述血细胞包括CD34+CD90+CD133+HSPC。
50.如实施方案44-49中任一项所述的方法,其中所述血细胞包括AHR+HSPC。
51.如实施方案44-50中任一项所述的方法,其中所述血细胞包括CD3+T细胞。
52.如实施方案44-51中任一项所述的方法,其中所述血细胞包括CD4+T细胞。
53.如实施方案44-52中任一项所述的方法,其中所述血细胞是人血细胞。
54.如实施方案1-53中任一项所述的方法,其中所述生物样品包括外周血和/或骨髓。
55.如实施方案1-54中任一项所述的方法,其中所述生物样品包括粒细胞集落刺激因子(GCSF)动员的外周血和/或普乐沙福动员的外周血。
56.如实施方案1-55中任一项所述的方法,其中所述方法产生5%至50%的平均总基因编辑率。
57.如实施方案1-56中任一项所述的方法,其中所述方法在所选细胞群体中产生大于60%的细胞活力。
58.一种根据如实施方案1-57中任一项所述的方法进行修饰的细胞。
59.如实施方案58所述的细胞,其中所述细胞未经历电穿孔。
60.如实施方案58或59所述的细胞,其中所述细胞未暴露于病毒载体。
61.如实施方案58-60中任一项所述的细胞,其中所述细胞未暴露于编码供体模板或HDT的病毒载体。
62.如实施方案58-61中任一项所述的细胞,其中所述细胞未经历旨在从生物样品分离所述细胞的细胞分离过程。
63.如实施方案58-62中任一项所述的细胞,其中所述细胞未经历磁性细胞分离过程。
64.一种包含如实施方案58-63中任一项所述的细胞的治疗性制剂。
65.一种向有需要的受试者提供治疗性核酸序列的方法,其包括向所述受试者施用如实施方案58-63中任一项所述的细胞或如实施方案64所述的治疗性制剂,从而向所述受试者提供治疗性核酸序列
66.一种纳米颗粒(NP),其包含:
直径小于30nm的核心;
指导RNA-核酸酶核糖核蛋白(RNP)复合物,其中所述gRNA包含3’末端和5’末端,其中所述3’末端缀合到具有化学修饰的间隔物,并且所述5’末端缀合到所述核酸酶,并且其中所述化学修饰共价连接到所述核心的表面;
带正电荷的聚合物涂层,其中所述带正电荷的聚合物具有小于2500道尔顿的分子量,包围所述RNP复合物,并且接触所述核心的表面;以及
在所述带正电的聚合物涂层的表面上的供体模板(例如,任选地包括同源定向修复模板(HDT))。
67.如实施方案66所述的NP,其中所述核心包含金(Au)。
68.如实施方案66或67所述的NP,其中核心与核酸酶的重量/重量(w/w)比为0.6。
69.如实施方案66-68中任一项所述的NP,其中所述核心与HDT的w/w比为1.0。
70.如实施方案66-69中任一项所述的NP,其中所述NP的直径小于70nm。
71.如实施方案66-70中任一项所述的NP,其中所述NP具有小于0.2的多分散指数(PDI)。
72.如实施方案66-71中任一项所述的NP,其中所述gRNA包含成簇规则间隔短回文重复序列(CRISPR)crRNA。
73.如实施方案72所述的NP,其中所述crRNA包含如SEQ ID NO:5;SEQ ID NO:6;SEQ ID NO:13;SEQ ID NO:14;或SEQ ID NO:225-264中所示的序列。
74.如实施方案66-73中任一项所述的NP,其中所述核酸酶包括Cpf1或Cas9。
75.如实施方案66-74中任一项所述的NP,其中所述带正电荷的聚合物涂层包含聚乙烯亚胺(PEI)、聚酰胺基胺(PAMAM);聚赖氨酸(PLL)、聚精氨酸;纤维素、葡聚糖、精胺、亚精胺或聚(乙烯基苄基三烷基铵)。
76.如实施方案66-75中任一项所述的NP,其中所述带正电荷的聚合物具有1500-2500道尔顿的分子量。
77.如实施方案66-76中任一项所述的NP,其中所述带正电荷的聚合物具有2000道尔顿的分子量。
78.如实施方案66-77中任一项所述的NP,其中所述化学修饰包括游离硫醇、胺或羧酸酯官能团。
79.如实施方案66-78中任一项所述的NP,其中所述间隔物包括寡聚乙二醇间隔物。
80.如实施方案79所述的NP,其中所述寡聚乙二醇间隔物包含18原子寡聚乙二醇间隔物。
81.如实施方案66-80中任一项所述的NP,其中所述HDT包含与经历修饰的基因组序列具有同源性的序列。
82.如实施方案81所述的NP,其中所述HDT包含如SEQ ID NO:2;SEQ ID NO:4;SEQID NO:8;SEQ ID NO:15;SEQ ID NO:33-41;或SEQ ID NO:44-52中所示的序列。
83.如实施方案66-82中任一项所述的NP,其中所述HDT包含单链DNA(ssDNA)。
84.如实施方案66-83中任一项所述的NP,其中所述供体模板包含治疗性基因。
85.如实施方案84所述的NP,其中所述治疗性基因编码骨骼蛋白4.1、血型糖蛋白、p55、Duffy等位基因、珠蛋白家族基因;WAS;phox;抗肌萎缩蛋白;丙酮酸激酶;CLN3;ABCD1;芳基硫酸酯酶A;SFTPB;SFTPC;NLX2.1;ABCA3;GATA1;核糖体蛋白基因;TERT;TERC;DKC1;TINF2;CFTR;LRRK2;PARK2;PARK7;PINK1;SNCA;PSEN1;PSEN2;APP;SOD1;TDP43;FUS;泛素2;C9ORF72、α2β1;αvβ3;αvβ5;αvβ63;BOB/GPR15;Bonzo/STRL-33/TYMSTR;CCR2;CCR3;CCR5;CCR8;CD4;CD46;CD55;CXCR4;氨基肽酶-N;HHV-7;ICAM;ICAM-1;PRR2/HveB;HveA;α-肌营养不良蛋白聚糖;LDLR/α2MR/LRP;PVR;PRR1/HveC、层粘连蛋白受体、101F6、123F2、53BP2、abl、ABLI、ADP、aFGF、APC、ApoAl、ApoAIV、ApoE、ATM、BAI-1、BDNF、Beta*(BLU)、bFGF、BLC1、BLC6、BRCA1、BRCA2、CBFA1、CBL、C-CAM、CFTR、CNTF、COX-1、CSFIR、CTS-1、胞嘧啶脱氨酶、DBCCR-1、DCC、Dp、DPC-4、E1A、E2F、EBRB2、erb、ERBA、ERBB、ETS1、ETS2、ETV6、Fab、FancA、FancB、FancC、FancDI、FancD2、FancE、FancF、FancG、Fancl、FancJ、FancL、FancM、FancN、FancO、FancP、FancQ、FancR、FancS、FancT、FancU、FancV、和FancW、FCC、FGF、FGR、FHIT、fms、FOX、FUS l、FUS1、FYN、G-CSF、GDAIF、基因21、基因26、GM-CSF、GMF、gsp、HCR、HIC-l、HRAS、hst、IGF、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、ING1、干扰素α、干扰素β、干扰素γ、IRF-1、JUN、KRAS、LCK、LUCA-1、LUCA-2、LYN、MADH4、MADR2、MCC、mda7、MDM2、MEN-I、MEN-II、MLL、MMAC1、MYB、MYC、MYCL1、MYCN、neu、NF-1、NF-2、NGF、NOEY1、NOEY2、NRAS、NT3、NT5、OVCA1、p16、p21、p27、p53、p57、p73、p300、PGS、PIM1、PL6、PML、PTEN、raf、Rap1A、ras、Rb、RB1、RET、rks-3、ScFv、scFV ras、SEM A3、SRC、TAL1、TCL3、TFPI、血小板反应蛋白、胸苷激酶、TNF、TP53、trk、T-VEC、VEGF、VHL、WT1、WT-1、YES、zac1、艾杜糖苷酶、IDS、GNS、HGSNAT、SGSH、NAGLU、GUSB、GALNS、GLB1、ARSB、HYAL1、F8、F9、HBB、CYB5R3、γC、JAK3、IL7RA、RAG1、RAG2、DCLRE1C、PRKDC、LIG4、NHEJ1、CD3D、CD3E、CD3Z、CD3G、PTPRC、ZAP70、LCK、AK2、ADA、PNP、WHN、CHD7、ORAI1、STIM1、CORO1A、CIITA、RFXANK、RFX5、RFXAP、RMRP、DKC1、TERT、TINF2、DCLRE1B和SLC46A1。
86.如实施方案66-85中任一项所述的NP,其中所述NP还包含连接到所述核酸酶的靶向配体。
87.如实施方案86所述的NP,其中所述靶向配体包括结合CD3、CD4、CD34、CD46、CD90、CD133、CD164、促黄体生成激素释放激素(LHRH)受体或芳基烃受体(AHR)的结合分子。
88.如实施方案86或87所述的NP,其中所述靶向配体包括抗人CD3抗体或其抗原结合片段、抗人CD4抗体或其抗原结合片段、抗人CD34抗体或其抗原结合片段、抗人CD46抗体或其抗原结合片段、抗人CD90抗体或其抗原结合片段、抗人CD133抗体或其抗原结合片段、抗人CD164抗体或其抗原结合片段、抗人CD133适体、人促黄体生成激素、人绒毛膜促性腺激素、醋酸地格瑞克或StemRegenin 1。
89.如实施方案86-88所述的NP,其中所述靶向配体包括抗体克隆:581;抗体克隆:561;抗体克隆:REA1164;抗体克隆:AC136;抗体克隆:5E10;抗体克隆:DG3;抗体克隆:REA897;抗体克隆:REA820;抗体克隆:REA753;抗体克隆:REA816;抗体克隆:293C3;抗体克隆:AC141;抗体克隆:AC133;抗体克隆:7;适体A15;适体B19;HCG(蛋白质/配体);促黄体生成激素(LH蛋白质/配体);或来源于前述任一个的结合片段。
90.如实施方案86-89中任一项所述的NP,其中所述核酸酶和靶向配体是连接的。
91.如实施方案90所述的NP,其中所述核酸酶和靶向配体通过氨基酸接头(例如直接氨基酸接头、柔性氨基酸接头或基于标签的氨基酸接头)连接。
92.如实施方案86-91中任一项所述的NP,其中所述核酸酶和靶向配体通过聚乙二醇(PEG)连接。
93.如实施方案86-92中任一项所述的NP,其中所述核酸酶和靶向配体通过胺-巯基交联剂连接。
94.一种包含如权利要求66-93所述的NP和生物样品的组合物。
95.如实施方案94所述的组合物,其中所述生物样品包括所选细胞群体。
96.如实施方案95所述的组合物,其中所述所选细胞群体包括选自以下的血细胞:造血干细胞(HSC)、造血祖细胞(HPC)、造血干细胞和祖细胞(HSPC)、T细胞、天然杀伤(NK)细胞、B细胞、巨噬细胞、单核细胞、间充质干细胞(MSC)、白细胞(WBC)、单核细胞(MNC)、内皮细胞(EC)、基质细胞和/或骨髓成纤维细胞。
97.如实施方案95所述的组合物,其中所述血细胞包括CD34+CD45RA-CD90+HSC;CD34+/CD133+HSC;LH+HSC;CD34+CD90+HSPC;CD34+CD90+CD133+HSPC;和/或AHR+HSPC。
98.如实施方案95所述的组合物,其中所述血细胞包括CD3+T细胞和/或CD4+T细胞。
99.如实施方案94-98中任一项所述的组合物,其中所述生物样品包括外周血、骨髓、粒细胞集落刺激因子(GCSF)动员的外周血和/或普乐沙福动员的外周血。
100.如实施方案94-99中任一项所述的组合物,其中所述生物样品中NP的量为每毫升(mL)生物样品1、2、3、4、5、8、10、12、15或20μg NP。
101.一种试剂盒,其包含如前述实施方案中任一项所述的一种或多种组分。
(XIII)实验实施例。实施例1.合成金纳米颗粒核心。采用稍加修改的Turkevich方法合成15nm尺寸范围的金纳米颗粒(AuNP)。Turkevich等人,(1951).Discussions of theFaraday Society 11(0):55-75。使0.25mM氯金酸溶液达到沸点并通过添加3.33%柠檬酸钠溶液进行还原,并在回流系统下剧烈搅拌10分钟。将合成的NP洗涤三次并在高纯水中再分散。
Cpf1和Cas9指导RNA结构。从商业来源(Integrated DNATechnologies;IDT)订购单个Cpf1指导RNA,在3’末端具有两个定制修饰。第一修饰包括18原子寡聚乙二醇(OEG)间隔物(iSp18),并且第二修饰包括硫醇修饰。OEG间隔物(例如聚乙二醇(PEG)或六甘醇(HEG)等)的比率为每寡核苷酸1个,并用于防止寡核苷酸之间的静电排斥。虽然使用18原子间隔物,但其他长度也是合适的。硫醇修饰也以每寡核苷酸1个的比率添加,并且用作将寡核苷酸结合到AuNP表面的共价相互作用的基础。
5’-/AltR1/rUrA rArUrU rUrCrU rArCrU rCrUrU rGrUrA rGrArU rCrArCrCrCrG rArUrC rCrArC rUrGrG rGrGrA rGrCrA/iSp18//3ThioMC3-D/-3’(SEQ ID NO:5)
对于cas9,使用包含tracrRNA和crRNA的两部分指导系统。Cas9的crRNA从IDT订购,具有与上述相同的18间隔物-硫醇修饰,但在5’末端。
5’-/5ThioMC6-D//iSp18/rCrA rCrCrC rGrArU rCrCrA rCrUrG rGrGrG rArGrCrGrUrU rUrUrA rGrArG rCrUrA rUrGrC rU/AltR2/-3’(SEQ ID NO:6)
伴随的tracrRNA是未修饰的。在这些序列中,“r”代表RNA,并且提供间隔物以便于读取。
制备Au/CRISPR NP。使用具有18间隔物-硫醇修饰的crRNA。将10μg/mL浓度的AuNP以0.5的AuNP/crRNA w/w比添加到crRNA溶液中。然后,添加10mM浓度的pH为3的柠檬酸盐缓冲液并混合5分钟。将制备的AuNP/crRNA纳米缀合物离心并在PBS中再分散。然后,以0.6的AuNP/Cpf1 w/w比添加Cpf1核酸酶。以0.005%浓度添加2000MW的聚乙烯亚胺(PEI)并充分混合。在最后步骤中,以1的AuNP/ssDNA w/w比添加ssDNA模板。
实施例2.用高效基因编辑纳米颗粒在血干细胞和祖细胞中进行的靶向同源定向修复。摘要。造血干细胞和祖细胞中的离体CRISPR基因编辑纠正了遗传疾病,防止了感染性疾病,并为癌症提供了新的治疗。虽然目前用同源重组进行基因编辑、电穿孔随后是非整合病毒转导的方法,已经得到了某些遗传基因座的高水平基因编辑,但是这种复杂的操作导致了细胞毒性和受损的移植血细胞的适合度。这里,使用胶态AuNP开发了高效的基因编辑NP。为了确保在摄取单个NP时递送所有需要的机器,开发了能够被动进入细胞而不需要电穿孔或病毒的负载设计。这种小的高度单分散的NP避免了溶酶体截留,并且成功地定位于原代人造血干细胞和祖细胞中的细胞核,而没有可观察到的毒性。NP介导的基因编辑是有效的,并且在治疗目标的多个基因座用不同的基因编辑核酸酶维持。NP处理的原代细胞在人源化小鼠中的植入动力学相对于未处理的细胞更好,且在体内分化方面没有可观察到的差异。这是将整个基因编辑有效负载有效被动递送到原代人血干细胞和祖细胞中的首个证明。
引言。在造血干细胞和祖细胞(HSPC)中的逆转录病毒介导的基因校正已经证明了对各种遗传性、感染性和恶性病症的治疗结果(Hacein-Bey-Abina等人,N Engl J Med,371(15):1407-1417(2014);Cicalese等人,Blood,128(1):45-54(2016);Sessa等人,Lancet,388(10043):476-487(2016);Hacein-Bey等人,JAMA,313(15):1550-1563(2015);和Dunbar等人,Science,359(6372)(2018)),使用基因修饰的自体或“自身”HSPC消除了移植物-宿主免疫应答的风险,消除了对同种异体造血干细胞移植所需的免疫抑制药物的需要。然而,HSPC基因疗法的有效实施面临几个主要挑战。目前,可以以良好生产规范(GMP)质量生产有限数目的治疗性逆转录病毒载体,造成了此技术的广泛使用的主要瓶颈。除了制造足够数目的载体的挑战之外,还存在与使用逆转录病毒载体进行基因转移相关的遗传毒性的已知风险,这通过由于插入诱变引起的恶性肿瘤的发展来证明(Hacein-Bey-Abina等人,Science,302(5644):415-419(2003);Hacein-Bey-Abina等人,N Engl J Med,348(3):255-256(2003);Ott等人,Nat Med,12(4):401-409(2006);以及Stein等人,Nat Med,16(2):198-204(2010))。所有这些挑战都激发了用于遗传修饰的非病毒手段的发展。
最显著的是,已经提出基因编辑作为逆转录病毒介导的基因转移的更安全的替代方案,通过开发工程化的核酸酶诸如成簇规则间隔短回文重复序列(CRISPR)-Cas核酸酶而成为可能(Cornu等人,Nat Med,23(4):415-423(2017)),这些可编程核酸酶掺入一个或多个RNA分子以靶向DNA中的特异性序列用于被核酸酶蛋白组分切割。其中,Cas9核酸酶被研究得最为充分。这种核酸酶与两个RNA分子,指导RNA(crRNA)和示踪RNA(tracrRNA)复合,以识别由NGG序列组成的同源原间隔物相邻基序(PAM)位点,然后在DNA中产生平端双链断裂。这种断裂可以通过几种细胞机制修复,但两种最常见的是非同源末端连接(NHEJ)和同源定向修复(HDR)(Chang等人,Nature reviews Molecular cell biology,18(8):495-506(2017)),对于后者的发生,必须存在与切割位点同源的完整模板序列。姐妹染色单体可用作模板,但也可过量提供合成模板分子以提高HDR效率。虽然此模板的侧翼区必须显著或完全匹配切割位点的侧翼区,但当HDR发生时,新的遗传密码可以插入基因组中、允许对基因组进行精确编辑或向基因组中添加新的DNA,而对于NHEJ,插入和/或缺失(插入缺失)是最可能的结果(Chang等人,Nature reviews Molecular cell biology,18(8):495-506(2017)),最近,也已证明Cpf1(或Cas12a)在基因组编辑中的效用。这种核酸酶与Cas9的不同之处在于其识别不同的原间隔物相邻基序(PAM)位点(例如,TTTN,其中N可以是A、C、G或T),需要单个指导RNA并使得具有5’突出端的DNA的交错切割(Zetsche等人,Cell,163(3):759-771(2015)),据推测,当提供模板寡核苷酸时,Cpf1的较小尺寸和交错切割增强递送的容易性和HDR的可能性。
为了在HSPC基因疗法中的最大效用,包含设计者选择的核酸酶、具有或不具有DNA模板的递送平台将是理想的,其有效且可靠地进行而没有细胞毒性。在HSPC中这种方法的当前临床技术水平需要工程化核酸酶组分作为mRNA或核糖核蛋白(RNP)复合物的电穿孔。如果优选HDR,最有效的方法是电穿孔,然后用非整合病毒载体的转导(Dever等人,Nature,539(7629):384-389(2016)),或规定浓度的工程化核酸酶组分与化学修饰的单链寡核苷酸(ssODN)模板在指定细胞浓度下的同时电穿孔(De Ravin等人,Sci Transl Med,9(372)(2017)),已知电穿孔可诱导毒性,而且,没有手段来控制摄取有效负载的每种组分的细胞数目或通过电穿孔成功递送的每种组分的浓度(Lefesvre等人,BMC molecular biology,3:12-12(2002)),最后,当使用非整合病毒作为模板时,所述系统仍然依赖于可用的GMP级病毒颗粒。因此,基于NP的递送正积极地用于递送基因编辑组分(Li等人,Human genetherapy,26(7):452-462(2015))。
在这方面,基于脂质的、基于聚合物的和AuNP具有将基因编辑组分递送到细胞的巨大潜力(Finn等人,Cell Reports,22(9):2227-2235(2018);Lee等人,NatureBiomedical Engineering,1(11):889-901(2017);以及Lee等人,Nature BiomedicalEngineering,2(7):497-507(2018))。虽然聚合物和脂质纳米颗粒代表“封装”“截留”递送载体,但AuNP的独特表面负载促进不同分子诸如RNA、DNA和蛋白质的精确修饰和官能化(Rosi等人,Science,312(5776):1027-1030(2006)),因为表面积是已知的,所以有效负载组分的受控负载确保AuNP制品的均匀性,从而导致更可预测的递送(Ding等人,MolecularTherapy,22(6):1075-1083(2014)),最后,AuNP被认为与脂质和聚合物纳米运载体相比相对无毒性(Pan等人,Small(Weinheim an der Bergstrasse,Germany),3(11):1941-1949(2007);Alkilany等人,Journal of Nanoparticle Research,12(7):2313-2333(2010);以及Lewinski等人,Small(Weinheim an der Bergstrasse,Germany),4(1):26-49(2008)),这对于非恶性分裂体细胞诸如HSPC是关键的。事实上,Lee等人已经证明了聚合物封装的AuNP设计在将CRISPR Cas9和Cpf1递送到非分裂体细胞组织(诸如肌肉和脑)中的效用(Lee等人,Nature Biomedical Engineering,1(11):889-901(2017)和Lee等人,NatureBiomedical Engineering,2(7):497-507(2018)),但这些运载体在HSPC或伴随的寡核苷酸模板中没有表现出功效。此外,聚合物封装与Au纳米核心的组合极大地增加了总体NP尺寸并改变了NP的细胞毒性特征。
设计了简单的基于Au的基因编辑NP(例如,Au/CRISPR NP),其中在AuNP的表面上逐层缀合基因编辑组分(指导RNA和核酸酶),具有或不具有单链DNA模板以支持HDR(HDT),所述NP不需要聚合物封装(图5C和12A)。
使用柠檬酸盐还原方法合成19nm的AuNP核心(Turkevich等人,Discussionsofthe Faraday Society,11(0):55-75(1951)),合成的NP是高度单分散的,观察到的多分散指数(PDI)为0.05(图12B和12C)。不同层的制备和缀合的方法可见于图5C。在第一层中,用18核苷酸寡聚乙二醇(OEG)间隔物和末端硫醇接头(crRNA-18间隔物-SH)合成的Cpf1或Cas9的CRISPR RNA(crRNA)通过半共价Au-硫醇相互作用连接到Au的表面(序列信息可见于图34)。对这些Cas核酸酶与crRNA和/或tracrRNA和双链DNA的公开晶体结构的分析表明,向crRNA添加间隔物-硫醇接头对指导区段的识别和核酸酶活性没有任何影响(Yamano T等人,Cell,165(4):949-962(2016)和Lee等人,eLife,6:e25312(2017)),包含OEG间隔臂减少了crRNA链之间的静电排斥以增加AuNP表面上的负载能力。如图12B所示,具有crRNA的AuNP核心导致22nm的NP尺寸和0.05的PDI。然后通过核酸酶对crRNA的3D结构的天然亲和力将核酸酶蛋白连接到表面负载的crRNA的5’柄。核酸酶连接将NP的尺寸增加至40nm,其中Cpf1的PDI为0.08。这种RNP负载的AuNP用作比较不存在HDT的核酸酶活性的基础。对于HDT负载,用支化低分子量(2000)聚乙烯亚胺(PEI)进一步涂覆RNP负载的AuNP,以制备用于最外层中HDT的静电缀合的基底。这种“完全负载的”AuNP表现出64nm的尺寸并且保持高度单分散,其中观察到的PDI为0.17(图12A-12C)。从透射电子显微镜图像推断出没有任何聚集的均匀形态,并且观察在每个连接步骤后的精细局部表面等离子体共振(LSPR)位移(图12A、12D)。NP的ζ电位从-26mV变为+27mV,具有完全分层(图12E)。最终NP的这种正电荷可能防止随时间推移的沉淀和聚集,因为这些在配制后48小时的时间段内没有观察到。
这种高度稳定和单分散的结构归因于AuNP与基因编辑组分之间的重量/重量(w/w)比的调节。对AuNP与Cpf1之间的不同w/w比的分析表明,较低比率的Cpf1可以以0.6的最佳w/w比引发聚集(图13A、13B)。在此比率下,发现Cpf1的负载量为8.8μg/mL。与Cpf1相比,AuNP与HDT之间较低的w/w比导致聚集,其中最佳w/w比为1(图13C、13D)。
为了确定此NP对原代HSPC的影响,基于粒细胞集落刺激因子(G-CSF)动员的健康成年志愿者的CD34表达,从白细胞去除术产品中分离HSPC。在支持培养基中培养细胞,并将AuNP制剂以10μg/mL的浓度添加到培养物中。在用Au/CRISPR NP孵育24小时和48小时后,通过活-死染色和台盼蓝染料排除测定分析CD34+细胞中的潜在毒性(图15A-15C),Au/CRISPRNP处理的样品在两种测定中均显示出多于80%的活力,通过台盼蓝测定在处理的与未处理的细胞之间没有差异。
尽管已知HSPC非常难以转染,但在用Au/CRISPRNP处理后6小时内,共聚焦显微镜成像显示基因编辑组分在原代HSPC的核中的良好摄取和定位(图14A-14E)。在此,荧光标记的crRNA和HDT的细胞生物分布在z-系列中被追踪,并且在两种情况下均观察到清楚的核定位(图14E)。
为了测试Au/CRISPR NP用于基因编辑的效用,靶向两个不同的基因组基因座,在HSPC中显示治疗价值:(1)染色体3上的趋化因子受体5(CCR5)基因,和(2)染色体11上的γ珠蛋白(γ-珠蛋白)基因启动子。通过消除病毒通过表达的CCR5共受体的连接和进入,CCR5的破坏与对人免疫缺陷病毒(HIV)感染的抗性相关(Lopalco等人,Viruses,2(2):574-600(2010)),靶向HSPC中的这种破坏使得未来的T细胞后代对HIV感染具有抗性。可替代地,在γ-珠蛋白启动子内引入特异性缺失重现了称为遗传性持续性胎儿血红蛋白增多症(HPFH)的天然存在的现象,其已表明可用于治疗血红蛋白病诸如镰状细胞病和β-地中海贫血(Akinsheye等人,Blood,118(1):19(2011))。
通过CasOFFinder软件对CCR5靶的计算机脱靶分析证明在人类基因组中没有与Cpf1具有少于3bp错配的同源位点(图35A-35D)(Bae等人,Bioinformatics,30(10):1473-1475(2014)),选择编码单个指导RNA可接近的Cpf1和Cas9 PAM位点二者的靶位点,使得能够直接比较这两种CRISPR核酸酶(图7A、7B)。然而,在测试开始之前,针对Cpf1优化了HDT。先前的数据表明RuvC结构域对非靶链的裂解是Nuc结构域对靶链裂解的先决条件(YamanoT等人,Cell,165(4):949-962(2016)),因此,测试了为DNA靶和非靶链设计的HDT。这种HDT由侧接Cpf1切割位点(PAM下游1 7bp)的40bp同源臂组成,在每个末端中间具有8bp的Notl限制酶切割位点以破坏CCR5表达并能够进行HDR分析。使用分解追踪插入缺失(TIDE),对于非靶链观察到8.1%的总编辑率,并且对于靶链观察到7.8%的总编辑率,当使用针对非靶链设计的HDT时具有7.3%的HDR,相比之下,当使用针对靶链设计的HDT时具有5.4%的HDR(图21A),这些结果通过T7EI和Notl限制酶消化测定得到证实(图21B),并且与Yamano T等人,Cell,165(4):949-962(2016)先前公布的数据密切相关。
接着通过基于悬浮在分子级水中的AuNP核心的量制备不同浓度(5μg/mL-50μg/mL)的Au/CRISPR-HDT-NP来优化HDR在原代HSPC中的效率。10μg/mL的浓度表明了最高的总编辑和HDR率,其中增加的浓度表明了增加的细胞毒性和较低的HDR率(图21C、21D)。
通常,在用于离体基因转移的临床操作过程中,将HSPC在重组纤连蛋白片段
Figure BDA0003153030530001031
层上在含有重组人生长因子的无血清培养基中培养。用于输注到患者体内的最终制剂由悬浮在含有2%人血清白蛋白(HSA)的无热原等渗溶液诸如Plasma-Lyte中的收获的HSPC组成。为了确定这些试剂的影响,在HSA、
Figure BDA0003153030530001032
或合并的人A/B血清存在下测试Au/CRISPR-HDT NP的基因编辑。对于任何试剂均没有观察到细胞毒性的变化(图22A),但是所有试剂都降低了总编辑和HDR率(图22B、22C)。因此,对于所有后续的实验,针对非靶DNA链设计HDT(包含在制剂中),将所有制剂以在分子级水中10μg/mL的浓度添加到培养物中的HSPC中,并将HSPC在没有
Figure BDA0003153030530001033
或HSA的无血清支持性培养基中培养。
假设由Cpf1产生的具有5’突出端的交错切割比HSPC中Cas9的平端切割更有利于HDR。为了测试这种假设,制备靶向CCR5基因座的Au/CRISPRNP,具有和不具有用于Cpf1和Cas9的HDT。为了比较,用相同浓度的每种组分的电穿孔同时进行递送。值得注意的是,在任何条件下,指导RNA不包括另外的化学修饰,诸如2’O-甲基核糖核苷酸、2-脱氧-2-氟-核糖核苷酸和硫代磷酸酯(Yin等人,Nature Biotechnology,35:1179(2017))。TIDE分析表明2%至25%的总编辑范围,具有最小显著性(图23A)。然而,通过TIDE和下一代测序观察到,与电穿孔相比,在Au/CRISPRNP递送的Cpf1或Cas9处理的HSPC中指示HDR的Notl限制位点掺入增加,其中Cpf1胜过Cas9(图23A-23C)。所有样品的所有细胞活力均高于70%,但在用AuNP处理的样品中观察到更高的活力,并且特别是当通过AuNP而不是电穿孔递送Cas9时观察到显著更高的活力(图23D)。通过集落形成细胞(CFC)测定分析这些样品中的HSPC适合度,且未观察到CFC潜力或形态方面的差异(图23E、23F)。这种标准CFC测定代表更短期的血液祖细胞[Wognum B.,Yuan N.,Lai B.,Miller C.L.(2013)Colony Forming Cell Assaysfor Human Hematopoietic Progenitor Cells.In:Helgason C.,Miller C.(eds)BasicCell Culture Protocols.Methods in Molecular Biology(Methods and Protocols),第946卷.Humana Press,Totowa,NJ],因此,作为长期再增殖能力的量度,将来自原始测定的集落再铺板。相对于模拟(未处理的)对照样品,在二次CFC的数目或类型方面没有观察到显著差异,但是相对于电穿孔样品,在AuNP处理的样品中没有观察到更高CFC数目的模式(图24A、24B)。
在γ-珠蛋白启动子基因座测试了相同的假设以证实Cpf1优选用于HDR。这里同样,Cpf1和Cas9 PAM序列二者被鉴定为具有相同的靶切割位点并且没有预测的脱靶切割(图8A、8B;图35A-35D),使用在此启动子中插入与阻遏物结合位点重叠的记载的HPFH相关的13-bp缺失的HDT(Akinsheye等人,Blood,118(1):19(2011))。在原代HSPC中获得的结果表明在此基因座具有相同的趋势,其中与含有Cas9的NP相比,含有Cpf1的Au/CRISPR NP的HDR的水平更高(图25)。
下一步是确定NP离体处理在再输注后是否损害HSPC适合度。HSPC适合度的最佳量度是重建骨髓抑制宿主的能力。因此,用Au/CRISPR-HDT-NP离体处理原代人CD34+HSPC并以106个细胞/每只小鼠输注到亚致死辐射的免疫缺陷(NOD/SCID γ-/-;NSG)小鼠中。小鼠随访22周,在移植后8周观察到最大植入,并且在移植后16周左右建立稳定的植入(图27A)。小鼠体重在研究过程中监测并且随时间推移是稳定的(图28)。令人惊讶地,用Au/CRISPR-HDT-NP或单独的AuNP处理的HSPC以比模拟(未处理)细胞更高的水平植入,但具有相似的动力学(图27B)。分析不同的血细胞谱系。B细胞的重建在移植后10周达到峰值,然后在第22周开始趋平(图27C)。初始单核细胞植入是高的,但在前8周内减少并稳定(图27D)。观察到低水平的T细胞直到第16周,然后所有研究组都增加(图27E)。相对于施用的离体HSPC处理,没有观察到B细胞、单核细胞或T细胞比例方面的显著差异。
22周后处死小鼠,并取出骨髓、脾、胸腺和外周血样品。尸检样品的流式细胞术分析表明,与模拟组相比,AuNP和Au/CRISPR-HDT-NP处理组与较高水平的植入相关(图29A-29D)。重要的是,多能CD34+细胞的频率在AuNP处理的动物的骨髓、脾和外周血中较高(图29A、29B、29D),并且表达CD20的细胞的频率在脾、胸腺和外周血中较高(图29B、29C、29D)。骨髓样品的人特异性CFC测定与植入结果密切相关,并且表明与模拟处理组相比,AuNP和Au/CRISPR-HDT-NP处理组具有显著更高的集落数(图27F)。这与这些组中较高数目的多潜能祖细胞密切相关(图27G)。这些结果还与在移植之前在经处理的HSPC输注产品中观察到的CFC测定结果密切相关,这表明AuNP处理在离体培养的HSPC中的积极作用(图30A-30B),所有经处理的样品的集落形态示于图31中。
就基因编辑而言,在移植时在HSPC中通过TIDE分析观察到9.8%总编辑和9.3%HDR(图32A、33)。在外周血细胞中观察到稳定水平的总基因编辑(5%),其中在第20周观察到一个瞬时高值17%(图32B)。有趣的是,NotI限制酶掺入的水平在所有时间点始终低于1%(图32C)。分析来自不同组织的尸检样品表明血液、骨髓和脾中的HDR相当低(图32D、32E)。
基因编辑是在先天性或获得性遗传疾病中鉴定未知基因、理解基因功能和校正缺陷基因的用于遗传筛选的有前景的方法(Xiong等人,Annual Review of Genomics andHuman Genetics,17(1):131-154(2016))。基因编辑技术正快速地从基础科学发展到临床应用,然而用于在HSPC中递送基因编辑组分的目前临床技术需要电穿孔,可能需要AAV转导,这比逆转录病毒介导的基因转移复杂得多。尽管从RNA、DNA和蛋白质递送中获得了所有的经验,但还没有有效且安全的用于基因编辑组分递送的通用简单方法,这表明不同细胞类型和组织可能需要不同的递送策略。
在本研究中,Au被用于开发广泛适用的基因编辑递送系统。这种多层NP能够将具有或不具有DNA修复模板的所有需要的基因编辑组分封装在单个AuNP核心上,对NP单分散性影响很小。每个组分负载步骤的严格表征对设计是至关重要的。最佳NP保持非聚集状态并成功地渗入难以转染的CD34+造血细胞。来自其他细胞类型的数据表明,Au/CRISPRNP通过小囊泡内的胞吞作用而内化,随后所述小囊泡破裂并释放到细胞质中。PEI诱导的质子海绵效应可促进从HSPC溶酶体逃逸(Benjaminsen等人,Molecular therapy:the journal ofthe American Society of Gene Therapy,21(1):149-157(2013))。外外,PEI已表明在NP的核运输中起积极作用,其除了核酸酶蛋白上的核定位信号之外还可促进有效负载递送(Reza等人,Nanotechnology,28(2):025103(2017)),此处所靶向的CCR5和γ-珠蛋白启动子基因座是非常独特的,从而编码具有相同指导识别位点的Cpf1和Cas9的PAM位点,使得能够将这两种核酸酶平台与此NP进行无偏比较。重要的是,当NP中包含Cpf1核酸酶时,10μg/mL Au/CRISPR NP浓度在CCR5基因座产生高达17.6%的总编辑及13.4%HDR,并且在γ-珠蛋白启动子基因座产生12.1%的总编辑及8.8%HDR。总编辑和HDR结果与电穿孔介导的递送相当或更高,这表明当AuNP是递送模式时,HSPC生物学更适于CRISPR基因编辑。此外,与NP中的Cas9相比,用Cpf1观察到的更高水平的HDR,表明交错核酸酶切割至少在这些治疗相关基因座处可能有利于HDR(Zetsche等人,Cell,163(3):759-771(2015)和Nakade等人,Bioengineered,8(3):265-273(2017))。
集落测定结果和异种植入数据表明,Au/CRISPR-HDT-NP处理在离体处理后对HSPC适合度没有任何不利影响,并且表明甚至可以增加再增殖潜力。
提供的证据是Au/基因编辑NP令人惊讶地产生了基因编辑机制向HSPC的有效且安全的递送。本研究扩展了用于基因编辑组分递送的可用递送工具包。
材料。NP的合成和表征。通过略微修改的Turkevich方法合成AuNP(Turkevich等人,Discussions of the Faraday Society,11(0):55-75(1951)和Shahbazi等人,Nanomedicine(London,England),12(16):1961-1973(2017))。使0.25mM氯金酸溶液(Sigma-Aldrich,St.Louis,MO)达到沸点并通过添加3.33%柠檬酸钠溶液(Sigma-Aldrich,St.Louis,MO)进行还原,并在回流系统下剧烈搅拌10分钟。通过在17000下离心15分钟将合成的NP洗涤三次并在超纯水(Invitrogen,Carlsbad,CA)中再分散。
本研究中使用的所有寡核苷酸购自Integrated DNA Technologies(IDT,Coralville,IA)。Cas9和Cpf1酶购自Aldevron,LLC(Fargo,ND)。使用在用于AsCpf1的3’末端和用于SpCas9的5末端具有18寡聚乙二醇(OEG)间隔物-硫醇修饰的crRNA(序列信息可以在图34中找到)。用于Cas9核酸酶的crRNA和tracrRNA双链体(gRNA)通过将它们以等摩尔浓度在双链体缓冲液中混合并在95℃孵育5分钟并在工作台面上冷却来制备。将10μg/mL浓度的AuNP以0.5的AuNP/crRNAw/w比添加到crRNA或gRNA溶液中。添加柠檬酸盐缓冲液(pH3.0)至10mM,并且将所得溶液混合5分钟。将制备的AuNP/crRNA纳米缀合物离心并在154mM氯化钠(NaCl)(Sigma-Aldrich,St.Louis,MO)中再分散。然后,以0.6的AuNP/Cpf1或AuNP/Cas9w/w比添加核酸酶,并且通过上下移液并孵育15分钟进行混合。然后,将NP以16000g离心15分钟并在NaCl溶液中再分散。以0.005%的浓度添加2000MW的聚乙烯亚胺(PEI)(Polysciences,Philadelphia,PA),充分混合,并孵育10分钟后,将NP以15000g离心15分钟并在NaCl溶液中再分散。在最后步骤中,以2的AuNP/HDT w/w比添加HDT,并孵育10分钟后,将NP离心并在NaCl溶液中再分散。
通过透射电子显微镜(TEM)(JEOL JEM 1400,Akishima,Tokyo,JP)表征所制备的NP的尺寸和形状,首先使用PELCO easiGlow Glow Discharge系统(Ted Pella Inc.,Redding,CA)通过辉光放电碳涂覆格栅对样品进行负染色。将2μL体积的样品滴在格栅上,并在30秒后将其吸干,洗涤并在0.75%甲酸铀酰溶液(Polysciences,Philadelphia,PA)中染色。最后,将格栅在干燥器内干燥过夜并通过TEM成像(Booth等人,JoVE(58):3227(2011))。
通过Zetasizer Nano S装置(Malvern,UK)表征NP的流体动力学尺寸和多分散指数。一式三份进行测量,结果报告为平均值±SD。使用小体积一次性比色皿(ZEN0040)(Malvern,UK)进行测量。
通过使用Zetasizer Nano ZS(Malvern,UK)表征NP的ζ电位。使用一次性折叠毛细管ζ细胞(Malvern,UK)进行测量,并且结果报告为平均值±SD。
此外,通过使用纳米滴装置(Thermo Fisher Scientific,Waltham,MA)测量AuNP的局部表面等离子体共振(LSPR)的位移来表征CRISPR组分的逐层缀合。
CD34+细胞的分离和培养。原代人CD34+细胞分离自用粒细胞集落刺激因子(G-CSF;非格司亭,Amgen,Thousand Oaks,CA)动员的健康供体。获得全白细胞去除术产品并使用先前公开的方案(Adair等人,Nat Commun,7:13173(2016)),通过在CliniMACSTM Prodigy装置上进行基于免疫磁珠的分离来纯化表达CD34的细胞,将所得CD34+细胞在含有10%胎牛血清(FBS;Gibco,Waltham,MA)以及各100ng/mL均来自Cellgenix(Freiburg,Germany)的重组人干细胞因子(SCF)、Flt-3配体(Flt3)和血小板生成素(TPO)的StemSpan无血清扩增培养基版本II(SFEM II;Stem Cell Technologies)或Iscove改良Dulbecco培养基(IMDM;Invitrogen Life Sciences,Carlsbad,CA)中培养。培养条件为37℃,85%相对湿度,5%CO2和常氧。
体外基因编辑研究。将CD34+细胞解冻并在含有SCF、Flt3和TPO的SFEM II培养基中预刺激过夜。之后,将细胞以1x106个/mL接种在96孔板中并用Au/CRISPR NP以10μg/mL浓度的AuNP处理。所有体外实验一式三份进行。孵育48小时后,用Dulbecco磷酸盐缓冲盐水(D-PBS)(Gibco,Waltham,MA)洗涤细胞并收获用于gDNA提取和基因编辑分析。
还进行CRISPR组分的电穿孔用于比较。为此,将49pmol crRNA或gRNA与相同量的Cpf1或Cas9核酸酶(8.5pmol)混合并孵育15分钟。将细胞分散在电穿孔缓冲液中并与核糖核蛋白(RNP)复合物混合。将混合物添加到1mm电穿孔比色皿中,并使用BTX电穿孔装置(BTX,Holliston,MA),在250V和5ms脉冲持续时间下进行电穿孔。此后,将细胞置于培养物中并在24小时后洗涤,随后再孵育24小时。孵育48小时后,用D-PBS洗涤细胞并收获用于gDNA提取和基因编辑分析。
细胞活力分析。使用Countess II FL自动细胞计数器(ThermoFisherScientific,Waltham,MA)在不同时间点分析用Au/CRISPR NP和电穿孔处理后的细胞活力,将10μL台盼蓝染料(0.4%)(Invitrogen)与10μL细胞悬浮液混合,并将10μL混合物施加到一次性细胞计数室载玻片上并插入装置中。记录每个样品的细胞活力百分比并报告为平均值±SD。
为了证实结果,还使用
Figure BDA0003153030530001091
测定试剂盒(Invitrogen,Carlsbad,CA)分析细胞活力。用D-PBS洗涤细胞,并通过离心沉淀。然后,将细胞悬浮液的等分试样转移到盖玻片上。使细胞在37℃下在有盖的35mm培养皿中沉降到玻璃盖玻片的表面。制备钙黄绿素AM(2μM)和乙锭同型二聚体-1(EthD-1)(4μM)工作溶液并将150μL组合的
Figure BDA0003153030530001092
测定试剂添加到22mm正方形盖玻片的表面,使得所有细胞被溶液覆盖。在室温下将细胞在有盖的培养皿中孵育30分钟。孵育后,将10μLD-PBS添加到干净的显微镜载玻片,并将盖玻片倒置并安装在显微镜载玻片上。标记的细胞在荧光显微镜(Nikon Ti Live,Japan)下使用494/517nm(对于钙黄绿素AM)和528/617nm(对于EthD-1)的激发和发射值进行成像。使用cellomics vHSC软件(v1.6.3.0,Thermo Fisher Scientific,Waltham,MA)计数活细胞和死细胞。使用Imaged软件(V 1.5i,National Institutes of Health,Rockville,MD)处理图像。
集落形成细胞(CFC)测定。对于CFC测定,根据制造商的说明,将细胞铺板在含有重组人生长因子的甲基纤维素(H4230:Stem Cell Technologies,Vancouver,CA)中并孵育14天的时间段。在立体显微镜(ZEISS Stemi 508,Germany)上对产生的集落进行计数和形态学评分,以确定每100,000个铺板细胞中的形成集落的细胞数目。
通过T7核酸内切酶I检测基因组编辑。为了分析总基因编辑百分比,使用
Figure BDA0003153030530001101
(Thermo Fisher Scientific,Waltham,MA)基因组DNA微型试剂盒根据制造商的方案提取基因组DNA并进行PCR扩增。
对侧接CRISPR靶位点的基因组区域(755bp)进行PCR扩增(序列信息可见于图34),并按照制造商的方案使用
Figure BDA0003153030530001102
PCR纯化试剂盒纯化产物。将总共200ng纯化的PCR产物与2μL 10x NEBuffer2(New England BioLabs,Ipswich,MA)和超纯水混合至19μL的最终体积,并进行再退火过程以能够形成异源双链体:95℃持续5分钟,以-2℃/s从95℃至85℃,以-0.1℃/s从85℃至25℃,并保持4℃。再退火后,用1μL T7EI核酸酶(New EnglandBioLabs,Ipswich,MA)处理产物并在37℃下孵育15分钟。孵育后,通过
Figure BDA0003153030530001103
PCR纯化试剂盒纯化消化的产物并在2%琼脂糖凝胶上分析。凝胶用Gel Doc凝胶成像系统(Bio-Rad,Hercules,CA)成像。基于相对条带强度进行定量。通过公式确定插入缺失百分比,%基因修饰=100x(1-(1-裂解部分)1/2)。
NotI限制酶消化。对侧接CRISPR靶位点的基因组区域(755bp)进行PCR扩增,并按照制造商的方案使用
Figure BDA0003153030530001104
PCR纯化试剂盒纯化产物。将总共1000ng纯化的PCR产物与5μL
Figure BDA0003153030530001105
缓冲液(New England BioLabs,Ipswich,MA)、1μL Notl酶(New EnglandBioLabs,Ipswich,MA)和超纯水混合至最终体积为50μL。在37℃孵育15分钟后,通过
Figure BDA0003153030530001111
PCR纯化试剂盒纯化消化的产物并在2%琼脂糖凝胶上分析。凝胶用Gel Doc凝胶成像系统(Bio-Rad,Hercules,CA)成像。基于相对条带强度进行定量。通过公式确定基因插入百分比,%基因修饰=100x(1-(1-裂解部分)1/2)。
通过TIDE测定检测基因组编辑。对侧接CRISPR靶位点的基因组区域(755bp)进行PCR扩增(序列信息可见于图34),并按照制造商的方案使用
Figure BDA0003153030530001112
PCR纯化试剂盒纯化产物。通过将20ng DNA样品与4μL
Figure BDA0003153030530001113
Terminator(Thermo Fisher Scientific,Waltham,MA)和超纯水混合至终体积为10μL来进行Sanger测序。循环测序后,通过3730x1DNA分析仪(Applied Biosystems,Foster City,CA)分析样品。在TIDE软件(https://tide.nki.nl/)上运行所得的序列,并且结果报告为基因修饰百分比(Brinkman等人,Nucleic Acids Research,42(22):e168-e168(2014))。
MiSeq分析。对侧接CRISPR靶位点的基因组区域(755bp)进行第一次PCR(序列信息可见于图34)。并按照制造商的方案使用
Figure BDA0003153030530001114
PCR纯化试剂盒纯化产物。使用侧接CRISPR靶位点的基因组区域(157bp)上具有Miseq衔接子序列的引物进行第二次PCR,并使用
Figure BDA0003153030530001115
PCR纯化试剂盒纯化产物,通过在2%琼脂糖凝胶上运行5μL样品来检查特异性条带。然后,使用Nextera索引试剂盒(96种索引)(Illumina,San Diego,CA)以8个循环进行DNA的索引。使用
Figure BDA0003153030530001116
PCR纯化试剂盒纯化产物。最后,将制备的文库稀释至4nM,合并并通过Illumina HiSeq 2500(Illumina,San Diego,CA)分析。使用内部生物信息学管道分析测序读长。将配对高通量测序读长(Miseq)与PAIR[PMID 24142950]组合。然后用定制python脚本过滤组合读长。丢弃没有完全引物序列的读长。从读长中修剪引物序列,然后将相同的序列组合在一起。使用来自emboss套件的Needleman-Wunsch比对仪来将序列读长与参考扩增子比对[PMID 5420325,Kruskal,J.B,(1983)An overview of sequencecomparison In D.Sankoff and J.B.Kruskal,(编),Time warps,string edits andmacromolecules:the theory and practice of sequence comparison,第1-44页AddisonWesley]。此比对仪使用的选项为:-gapopen 10.0、-gapextend 0.5和-aformat3 sam。然后,定制python脚本从序列比对映射(SAM)输出中读取简明特异间隙比对报告(CIGAR)串,并使用此信息来鉴定并量化插入和缺失。还将每个比对的序列与参考扩增子比较以鉴定取代突变。从分析中除去仅在一个读长中发现的任何突变。然后输出含有每个突变的突变序列、读长计数和频率的表格用于进一步分析。在每个测序运行中,由来自同一动物的电穿孔细胞组成的对照样品在移植前测定突变类别(插入、缺失、取代、插入和取代等)的平均频率,并用于对来自相应突变类别的每个突变进行单尾二项式t检验。如果证明p值<0.05,则保留来自实验样品的突变。所有定制脚本均可按要求提供。
NSG小鼠的体内植入研究。根据实验动物福利办公室(OLAW)公共卫生保障(PHS)政策、美国农业部(USDA)动物福利法案和条例、实验动物护理和使用指南以及IACUC方案1864,根据管理机构指南进行涉及动物的所有实验。
NOD。Cg-Prkdcscidll2rgtm1Wjl/Szj(NOD SCIDγ-/-;NSG)小鼠获自杰克逊实验室(The Jackson Laboratory)并在无病原体的饲养条件下内部饲养。成年小鼠(8-12周龄)接受来自铯辐照器的175cGy全身辐照,3-4小时后单次肝内注射重悬在含有1%肝素(APPPharmaceuticals)的30μL磷酸盐缓冲盐水(PBS;Invitrogen Life Sciences)中的1x106个原代人CD34+造血细胞。植入后四周,通过眼眶后穿刺收集血液,以通过流式细胞术测定人血细胞的水平。在随访期间每两周收集一次血液。如先前报道的(Haworth等人,Mol TherMethods Clin Dev,6:17-30(2017)),分离白细胞并用抗人CD45抗体(克隆2D1)、抗人CD3抗体(克隆UCHT1)、抗人CD4抗体(克隆RPA-T4)、抗人CD20抗体(克隆2H7)和抗人CD14抗体(克隆M5E2)抗体(全部来自BDBiosciences,San Jose,CA)染色,在FACS Canto II(BDBiosciences,San Jose,CA)上获得染色的细胞,并使用FlowJo软件v10.1(Tree Star)进行分析。
共聚焦显微镜成像。为了追踪细胞内生物分布,分别用Alexa 488和Alexa 660荧光团在5’末端荧光标记Cpf1 crRNA和HDT(IDT,Coralville,IA),制备Au/CRISPR NP并与细胞一起孵育6小时。孵育结束时,洗涤细胞并分散在FluoroDish内的FluoroBriteTM DMEM培养基(Gibco,Waltham,MA)中。向细胞中添加两滴NucBlueTM Live ReadyProbesTM试剂(Ex/Em 360/460nm)(Invitrogen,Carlsbad,CA)并在室温下孵育30分钟。最后,在具有Airyscan显微镜(Zeiss,Germany)的Zeiss LSM 780Confocal和Multi-Photon上对细胞成像。使用ZENLite软件(Zeiss,Germany)分析图像。在背景调节后使用60x物镜进行成像。
统计分析。所有数据报告为平均值±标准差,并使用配对学生t检验和GraphPadPrism软件(Windows 7.03版)(GraphPad Software,USA)进行统计分析。p值<0.05被认为具有统计学显著性。
实施例3.体外靶向效率。本实施例的目的是表明NP可以靶向混合细胞群体(未处理的血液或骨髓产品)中的特定血细胞类型(HSPC或T细胞)。
目前血细胞中的临床基因疗法需要从其他血细胞类型中纯化靶免疫细胞(例如HSPC或T细胞)。可在不纯化的情况下将与基因编辑物特异性结合并将基因编辑物递送至免疫细胞的NP将大大简化当前的基因疗法制造过程,因为它将不需要离体纯化和培养细胞用于患者特异性细胞疗法。此外,这将加速体内递送基因编辑至血细胞的潜力,这代表整体最便携的基因疗法策略。这种高度简化的制造策略被称为“最少操作”方法。
本实施例中测试的细胞类型包括:1)原代人HSPC(CD34+细胞和/或CD34+/CD45RA-/CD90+细胞),和2)原代人T细胞(CD3+和CD4+细胞)。HSPC的临床相关来源包括骨髓、粒细胞集落刺激因子(GCSF)动员的外周血和AMD3100(普乐沙福)动员的外周血。T细胞的临床相关来源包括全外周血。
待编辑的遗传基因座包括:1)HSPC中的γ-珠蛋白启动子,其与血红蛋白病诸如镰状细胞病相关;和2)T细胞中的CCR5,其与HIV感染的情况相关。
HSPC中待测试的靶向分子包括:a)结合CD34、CD90或CD133的抗体(单独测试和以2种的组合测试);b)结合CD133的适体(单独测试和与抗体或配体组合测试);和c)配体:人绒毛膜促性腺激素(HCG)和SR1(Stem Regenin 1)。T细胞中待测试的靶向分子包括:a)结合CD3、CD4的抗体(单独和组合测试);和b)结合CD3的适体(单独测试和与抗体组合测试)。将这些分子类型中的每一种添加到现有NP中所需的化学过程将利用具有各种PEG间隔物的胺-巯基或巯基-巯基交联剂。
将来自健康供体的未操作的血细胞产品分成等分试样,一个用于每个靶向分子或其组合或集合。每个靶向分子将作为NP的表面展示物质进行测试。为了追踪摄取,用远红荧光染料标记指导RNA(最内层)。使用远红光以下的不同波长荧光团,用荧光标记的抗体追踪靶细胞和非靶细胞群体。对于上述每个血细胞来源,将对最少6个和最多10个独特供体(生物重复)重复所述实验。
共聚焦显微镜和流式细胞术将用于评估靶细胞和非靶细胞对NP的摄取。对于两种测定,选择靶向分子、细胞类型和/或血液产品用于进一步测试的指示可包括:(i)最少50%和最多100%的靶细胞显示红色荧光表型,和(ii)最少0%和最多20%的非靶细胞显示红色荧光表型。选择靶向分子、细胞类型和/或血液产品用于进一步测试的标准可包括:(i)对于一种临床相关细胞类型中的至少一个实验组,供体中观察到≥50%的靶细胞(HSPC或T细胞)红色荧光的平均值,和(ii)对于任何其他非靶细胞类型,供体中观察到≤20%的红色荧光。
从进一步测试中消除靶向分子、细胞类型和/或血液产品的标准可包括:(i)在测试的所有实验条件下观察到<50%的靶细胞摄取,或(ii)>20%的非靶细胞摄取。
本研究将确定哪个测试的靶向分子最佳地选择性地将NP与未操作的临床相关的血细胞产品中期望的细胞表型相关。
实施例4.体外最少操作的细胞产品的临床前评价。本实施例是为了证明所公开的NP是实现用于基因疗法的血细胞产品的“最少操作”的临床可行策略,从而不需要离体纯化和靶细胞培养。
对于所靶向的NP的临床转化,将证明满足当前用于再输注到人类患者中的标准(参见表3)的在临床规模上制造最少操作的血细胞产品的可行性。本公开的具有和不具有靶向分子(从实施例3鉴定)的基于AuNP的基因编辑递送系统,将在临床规模的未操作的人类供体血液产品中进行测试以证明放大的可行性。这种可行性数据对于建立不包括纯化、培养、电穿孔或工程化病毒的患者特异性细胞疗法的转化制造方法是至关重要的。
与用于进一步测试的指示或标准相关的特定血液产品和细胞类型(来自实施例3)将是本实施例的目标。当多于一种的细胞类型和血液产品满足进一步测试的标准时,将首先进一步测试表现最高(即,最高水平的基因编辑和最佳靶向潜力)的细胞类型和血液产品,之后测试表现较低的候选物。
HSPC和T细胞的临床相关来源如实施例3所述:(i)对于HSPC,骨髓、GCSF动员的外周血和AMD3100(普乐沙福)动员的外周血;和(ii)对于T细胞,全外周血。
待编辑的遗传基因座如实施例3所述:1)HSPC中的γ-珠蛋白启动子;和2)T细胞中的CCR5。
将收集来自至少三名个体供体的血液/骨髓产品。将来自每个供体的每种产品分成三个相等的等分试样:一个用于不处理(模拟对照),一个用于用本公开的(非靶向的)基于AuNP的基因编辑递送系统处理,并且一个用于用本公开的基于AuNP的基因编辑递送系统+所选靶向分子处理。
将在本实施例中使用的测定包括:荧光辅助细胞分选(FACS)或基于免疫磁珠的分选、基因编辑分析、通过电感耦合等离子体质谱法(ICP-MS)的痕量元素分析、活力测定和释放测试(即再输注测试的适合性)。对于通过FACS或免疫磁珠分选细胞,充分评估所有其他参数所需的靶细胞池的最小纯度≥90%,且最大纯度为100%。对于非靶(阴性)部分纯度没有阈值要求。对于基因编辑分析,靶细胞表型的最小阈值为20%总基因编辑,且最大为50%基因编辑;非靶细胞表型的最小阈值为0%基因编辑,且最大为20%基因编辑。产品必须符合自体基因修饰的细胞产品再输注的标准释放标准(见下表3)。将对配制用于输注的最终产品进行痕量元素分析,目的仅在于了解存在的Au量。不存在最小阈值,且最大值不能超过初始处理添加的总质量(最大值为10μg/mL起始细胞产品)。当满足下面讨论的选择标准时,此数据将用于评价实施例5中的体内生物分布和清除。
选择NP用于进一步测试的标准可包括:(i)仅在供体的靶细胞中观察到≥20%总基因编辑的平均值,和(ii)≥70%细胞活力以及满足所有其他释放标准。
本实施例可以证明所选NP适用于对人血细胞产品的最少操作方法,或哪些细胞类型或血液产品组分(血清、巨噬细胞等)是成功的最大障碍。
表3.待再输注的自体遗传修饰细胞产品的标准释放标准。
Figure BDA0003153030530001161
Figure BDA0003153030530001171
+LABSTM执行的最终释放无菌测试包括在受控洁净室中按照USP<71>指南进行14天孵育后的细菌、真菌和酵母测试。
ε根据USP<71>指南使用鲎变形细胞裂解物(LAL)测试由机构质量控制进行测试。
实施例5.体内最少操作的人细胞产品的临床前评价。本实施例证明了最少操作的人血细胞产品在免疫缺陷小鼠模型中的临床前安全性和可行性。
证明遗传修饰的人血细胞的安全性和功效的已确立的模型是异种移植。在这种模型中,将人血细胞移植到经辐射的免疫缺陷小鼠中。这种模型允许细胞从一个人供体移植到多个个体小鼠中。可以在这种模型中研究的参数包括动物中的血细胞性能、毒性、生物分布和清除。重要的是,预期一些AuNP在再输注时仍可存在于最少操作的血细胞产品中,并且本研究可有助于理解NP施用的生理影响。这种信息对于所述方法的临床转化是重要的,并且也将为直接体内施用研究提供信息。在本实施例中,将选择用于进一步研究的最少操作的人血细胞产品(来自实施例4)注射到亚致死辐射的免疫缺陷小鼠中,以监测细胞性能(植入),以及与血细胞产品一起输注的任何残留NP的生物分布和清除。这可以被认为是所公开的技术的“风险降低”的实验。
从实施例3中选择用于进一步研究的特定血液产品和细胞类型将是这些研究的目标。
HSPC和T细胞的临床相关来源如实施例3和4中所述:(i)对于HSPC,骨髓、GCSF动员的外周血和AMD3100(普乐沙福)动员的外周血;和(ii)对于T细胞,全外周血。
待编辑的遗传基因座如实施例3和4中所述:1)HSPC中的γ-珠蛋白启动子;和2)T细胞中的CCR5。
实施例4中来自三个个体供体的最少操作的血液/骨髓产品将在亚致死全身辐射后12-24小时内输注到免疫缺陷小鼠中。在移植后随时间推移监测人细胞植入,以及基因编辑细胞的植入和动物的总体健康状况。输注后可从这些小鼠获得成像、尿液和粪便,以测定输注产品中可能存在的NP的生物分布和清除
将在研究中进行的测定和实验包括:视觉监测输注小鼠的健康(梳理、体重和活动水平);移植后血液学恢复;基因编辑细胞的植入和持久性;通过ICP-MS对输注产品进行的痕量元素分析;输注后72小时通过ICP-MS分析尿液和粪便以确定是否所有NP均已清除(质量平衡)。如果指示生物累积,可以进行活小鼠的微计算机断层扫描(CT)成像以评估累积的位置。如果累积太低而不能用显微CT观察到,则可通过ICP-MS进行尸检和额外的痕量元素分析以确定生物累积的部位。显微CT、尸检和/或微量元素分析可与组织病理学结合以评估潜在毒性。在下面几个段落中描述了这些各种测定的读数阈值。
植入和持久性。流式细胞术可用于评估血液、骨髓和脾中表达人CD45的细胞的水平。最小阈值为0%,并且最大阈值为100%。
基因编辑分析。在人类细胞中最小阈值为5%,并且最大阈值为100%。预期制剂中将保留足够的NP以编辑小鼠细胞;然而,如下所述,测定将评价在小鼠表达CD45的细胞或显示生物累积的任何组织中是否检测到基因编辑。
健康监测。将在施用NP之前对每只小鼠进行疼痛和痛苦评价(最小PD1,最大PD4)和身体状况评价(最小BC1,最大BC5),然后在施用NP之后每天进行,持续3天,并且此后每周进行。评分基于Burkholder等人Health Evaluation of Experimental LaboratoryMice.Current Protocols in Mouse Biology,2012;2:145-165的发布内容。记录并总结任何不良反应。
痕量元素分析。72小时内尿液/粪便中的最小阈值为0,并且最大阈值不能超过注射的总质量。组织中的最小阈值为0,并且最大阈值不能超过注射的总质量。
显微CT成像。最小阈值是没有对比度增强,并且最大阈值待定。
组织病理学。所述测定将评估相对于来自所有供体的未处理对照的显著器官毒性。最小阈值无毒性,并且最大阈值使用针对每个靶器官公布的不良事件标准进行分级。
本实施例中描述的研究将建立最少操作的人血液产品的临床前体内安全性和有效性。
(XIV)结束段落。使用核苷酸碱基的标准字母缩写示出所公开的核酸序列,如37C.F.R.1.822定义。仅示出了每个核酸序列的一条链,但应理解为包括互补链。
也可使用本文公开的蛋白质和/或核酸序列的变体。变体包括与本文所述或公开的蛋白质和核酸序列具有至少70%序列同一性、80%序列同一性、85%序列同一性、90%序列同一性、95%序列同一性、96%序列同一性、97%序列同一性、98%序列同一性或99%序列同一性的序列,其中所述变体表现出基本上相似或改进的生物功能。
“%序列同一性”是指如通过比较序列所确定的两个或更多个序列之间的关系。在本领域中,“同一性”还意指蛋白质和核酸序列之间的序列相关程度,如通过此类序列的串之间的匹配所确定。“同一性”(经常称为“相似性”)可通过已知方法来容易地计算,所述方法包括在以下中描述的那些:Computational Molecular Biology(Lesk,A.M.,编)OxfordUniversity Press,NY(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,编)Academic Press,NY(1994);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,和Griffin,H.G.,编)Humana Press,NJ(1994);Sequence Analysis inMolecular Biology(Von Heijne,G.,编)Academic Press(1987);以及Sequence AnalysisPrimer(Gribskov,M.和Devereux,J.,编)Oxford University Press,NY(1992)。设计确定同一性的优选方法以得到所测试序列之间的最佳匹配。可公开获得的计算机程序中编纂了确定同一性和相似性的方法。序列比对和同一性百分比计算可以使用LASERGENE生物信息学计算套件(DNASTAR,Inc.,Madison,Wisconsin)的Megalign程序来执行。还可以使用Clustal比对方法(Higgins和Sharp CABIOS,5,151-153(1989)用默认参数(空位罚分=10,空位长度罚分=10)执行序列的多重比对。相关程序还包括GCG程序包(Wisconsin包版本9.0,Genetics Computer Group(GCG),Madison,Wisconsin);BLASTP、BLASTN、BLASTX(Altschul,等人,J.Mol.Biol.215:403-410(1990);DNASTAR(DNASTAR,Inc.,Madison,Wisconsin);以及结合Smith-Waterman算法的FASTA程序(Pearson,Comput.MethodsGenome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.编辑:Suhai,Sandor.出版社:Plenum,New York,N.Y。在本公开的上下文内,将理解在将序列分析软件用于分析的情况下,分析的结果是基于所引用的程序的“默认值”。“默认值”将意指任何一组值或参数,其在最初初始化时最初与软件一起加载。
在特定的实施方案中,变体蛋白质包含保守氨基酸取代。在特定的实施方案中,保守氨基酸取代不能实质上改变参考序列的结构特征(例如,替换氨基酸不应倾向于打断参考序列中出现的螺旋,或破坏表征参考序列的其他类型的二级结构)。领域公认的多肽二级及三级结构的实例描述于Proteins,Structures and Molecular Principles(Creighton编,W.H.Freeman and Company,New York(1984));Introduction to Protein Structure(C.Branden和J.Tooze编,Garland Publishing,New York,N.Y.(1991));及Thornton等,Nature,354:105(1991)中。
在特定的实施方案中,“保守取代”涉及在以下保守取代组中的一种中发现的取代:第1组:丙氨酸(Ala)、甘氨酸(Gly)、丝氨酸(Ser)、苏氨酸(Thr);第2组:天冬氨酸(Asp)、谷氨酸(Glu);第3组:天冬酰胺(Asn)、谷氨酰胺(Gin);第4组:精氨酸(Arg)、赖氨酸(Lys)、组氨酸(His);第5组:异亮氨酸(lie)、亮氨酸(Leu)、甲硫氨酸(Met)、缬氨酸(Vai);以及第6组:苯丙氨酸(Phe)、酪氨酸(Tyr)、色氨酸(Trp)。
另外,氨基酸可以通过类似的功能或化学结构或组成(例如,酸性、碱性、脂族、芳族、含硫)分组为保守取代基。例如,出于取代的目的,脂族基团可以包括Gly、Ala、Vai、Leu和Ile。含有被认为是彼此保守取代的氨基酸的其他组包括:含硫的:Met和半胱氨酸(Cys);酸性:Asp、Glu、Asn和Gin;小的脂族非极性或轻微极性的残基:Ala、Ser、Thr、Pro和Gly;极性、带负电荷的残基及其酰胺:Asp、Asn、Glu和Gin;极性、带正电的残基:His、Arg和Lys;大的脂族非极性残基:Met、Leu、lie、Vai和Cys;以及大的芳香族残基:Phe、Tyr和Trp。另外的信息见于Creighton(1984)Proteins,W.H.Freeman and Company。
在特定的实施方案中,“亲和力”是指抗体的单个结合位点与其靶标记物之间的非共价相互作用的总和的强度。除非另外指示,否则“结合亲和力”是指反映结合对的成员(即,抗体和靶标记物)之间的1∶1相互作用的内在结合亲和力。抗体对其靶标记物的亲和力可通常由解离常数(Kd)或缔合常数(KA)表示。亲和力可通过本领域中已知的常用方法来测量。
如本领域普通技术人员所理解的,有许多可商购获得的结合本文所述的细胞标记物的抗体和靶向配体。
在特定的实施方案中,结合亲和力可在相关体外条件下评估,诸如在室温或37℃下接近生理pH(7.4)的缓冲盐溶液。
在特定的实施方案中,“结合”是指抗体以10-8M或更小、在特定的实施方案中10-5M至10-13M、在特定的实施方案中10-5M至10-10M、在特定的实施方案中10-5M至10-7M、在特定的实施方案中10-8M至10-13M、或在特定的实施方案中10-9M至10-13M的解离常数(1(D)与其靶标记物缔合。所述术语可进一步用于表示抗体不与存在的其他生物分子结合(例如,它以10-4M或更高、在特定的实施方案中10-4M至1M的解离常数(KD)与其他生物分子结合)。
在特定的实施方案中,“结合”意指抗体以107M-1或更高的亲和力常数(即缔合常数,KA)、在特定的实施方案中105M-1至1013M-1、在特定的实施方案中105M-1至1010M-1、在特定的实施方案中105M-1至108M-1、在特定的实施方案中107M-1至1013M-1、或在特定的实施方案中107M-1至108M-1与其靶标记物缔合。所述术语可进一步用于表示抗体不与存在的其他生物分子结合(例如,它以104M-1或更小、在特定的实施方案中104M-1至1M-1的缔合常数(KA)与其他生物分子结合)。
如所指出的,特定的实施方案可以利用靶向配体结合结构域的变体。靶向配体结合结构域的变体可包括具有一个或多个保守氨基酸取代或一个或多个非保守取代的变体,所述取代不会不利地影响抗体与所靶向的表位的结合。
在特定的实施方案中,当与根据本文公开的方法产生和表征的抗体相比时,VL区可包括一个或多个(例如,2、3、4、5、6、7、8、9、10个)插入、一个或多个(例如,2、3、4、5、6、7、8、9、10个)缺失、一个或多个(例如,2、3、4、5、6、7、8、9、10个)氨基酸取代(例如,保守氨基酸取代)或上述改变的组合。插入、缺失或取代可以在VL区域中的任何地方,包括在此区域的氨基或羧基末端或两个末端,条件是每个CDR包括零个改变或至多一个、两个或三个改变,并且条件是包括修饰的VL区域的抗体仍可以以与参考抗体相似的亲和力特异性结合所靶向的表位。
在特定的实施方案中,当与根据本文公开的方法产生和表征的抗体相比时,VH区域可来源于或基于所公开的VH,并可包括一个或多个(例如,2、3、4、5、6、7、8、9、10个)插入、一个或多个(例如,2、3、4、5、6、7、8、9、10个)缺失、一个或多个(例如,2、3、4、5、6、7、8、9、10个)氨基酸取代(例如,保守氨基酸取代或非保守氨基酸取代)或上述改变的组合。插入、缺失或取代可以在VH区域中的任何地方,包括在此区域的氨基或羧基末端或两个末端,条件是每个CDR包括零个改变或至多一个、两个或三个改变,并且条件是包括修饰的VH区域的抗体仍可以以与参考抗体相似的亲和力特异性结合其靶表位。
本领域普通技术人员理解对CD34、CD45RA、CD90、CD117、CD123、CD133、CD164和本文所述的其他CD的提及。对于其他读者,CD(分化簇)抗原是在细胞表面表达的蛋白质,其可通过特异性抗体检测到。CD34是在1-4%的骨髓细胞上表达的高度糖基化的I型跨膜蛋白。CD45RA与III型纤连蛋白有关,分子量为205-220kDa,并且在B细胞、原初T细胞和单核细胞上表达。CD90是在人的前胸腺细胞上发现的GPI-细胞锚定分子。CD117是在1-4%的骨髓干细胞上发现的c-kit配体受体。CD123A与细胞因子受体超家族和纤连蛋白III型超家族有关,分子量为70kDa,并在骨髓干细胞粒细胞、单核细胞和巨核细胞上表达。CD133是在原始造血祖细胞和其他干细胞上表达的五跨膜糖蛋白。CD164是由人造血祖细胞和骨髓基质细胞表达的I型整合跨膜唾液酸粘蛋白。
除非另外指示,否则本公开的实践可以采用免疫学、分子生物学、微生物学、细胞生物学和重组DNA的常规技术。这些方法描述在以下出版物中。参见例如Sambrook等人Molecular Cloning:A Laboratory Manual,第2版(1989);F.M.Ausubel等人编,CurrentProtocols in Molecular Biology,(1987);the series Methods IN Enzymology(Academic Press,Inc.);M.MacPherson,等人,PCR:A Practical Approach,IRL Press atOxford University Press(1991);MacPherson等人,编PCR 2:Practical Approach,(1995);Harlow和Lane,eds.Antibodies,A Laboratory Manual,(1988);和R.I.Freshney,编Animal Cell Culture(1987)。
如本领域普通技术人员将理解的,本文所公开的每个实施方案可以包括以下项、基本上由或由以下项组成:其特别陈述的元件、步骤、成分或组分。因此,术语“包括(include)”或“包括(including)”应理解为叙述:“包括(comprise)、由...组成(consistof)或基本上由...组成(consist essentially of)”。过渡术语“包含(comprise)”或“包含(comprises)”意指包括但不限于,并且允许包括未指定的元件、步骤、成分或组分,甚至是以较大的量。过渡短语“由......组成”排除未指定的任何元件、步骤、成分或组分。过渡短语“基本上由......组成”将实施方案的范围限制为指定的元件、步骤、成分或组分以及并不实质地影响所述实施方案的那些。实质影响将引起选择性遗传修饰已经受最少操作的离体血细胞产品中的预期细胞类型的能力的统计学显著的降低。
除非另外指示,否则在说明书和权利要求中使用的表示成分的量、性质诸如分子量、反应条件等的所有数字应理解为在所有情况下均由术语“约”修饰。因此,除非指示相反情况,否则说明书和所附权利要求书中列出的数值参数是近似值,其可以根据本发明寻求获得的所需性质而变化。在最低限度并且不试图限制对权利要求书范围的等效范围的原则的应用,每个数值参数均应当至少根据报道的有效数字的数值和通过应用普通四舍五入技术来解读。当要求进一步清楚时,术语“约”当与陈述的数值或范围结合使用时具有本领域技术人员合理地归于它的含义,即将稍微大于或稍微小于陈述值或范围表示为在以下范围内:陈述值的±20%;陈述值±19%;陈述值±18%;陈述值±17%;陈述值±16%;陈述值±15%;陈述值±14%;陈述值±13%;陈述值±12%;陈述值±11%;陈述值±10%;陈述值±9%;陈述值±8%;陈述值±7%;陈述值±6%;陈述值±5%;陈述值±4%;陈述值±3%;陈述值±2%;或陈述值±1%。
尽管阐述本发明的广泛范围的数值范围和参数是近似值,但在特定实施例中所阐述的数值尽可能精确地加以报告。然而,任何数值本身都含有由其相应测试测量中所见的标准偏差必然引起的某些误差。
除非本文另外指示或者与上下文含义明显相悖,否则在描述本发明的上下文中(尤其在所附权利要求书的上下文中)使用的术语“一个/种”、“所述”以及类似的指代语应解读为涵盖单数和复数指代语。本文中所列举数值的范围仅旨在作为一种对落在所述范围内的每个单独数值单独提及的简便方法。除非本文另外指示,否则每个单独数值都并入到本说明书中,如同本文中单独列举了每个单独数值一样。可按任何适合的顺序执行本文所述的所有方法,除非本文另外指示或明显与上下文矛盾。本文提供的任何和所有实施例或示例性语言(例如,“诸如”)仅意在更好地说明本发明,而不会对以其他方式要求保护的本发明的范围构成限制。本说明书中的语言不应解读为指示任何未要求保护的元件是实践本发明所必需的。
本文所公开的本发明的替代性元件或实施方案的分组不应被解读为限制。每个组成员可单独或者以与组中的其他成员或本文发现的其他元件的任何组合被提及和要求保护。出于便利和/或可专利性的原因,预期组中的一个或多个成员可包括在组中或从组中删除。当出现任何这种包括或删除时,本说明书被认为包含所修改的组,因此满足所附权利要求书中使用的所有马库什组的书面说明。
本文描述了本发明的某些实施方案,包括为本发明人所知用于实施本发明的最佳方式。当然,本领域普通技术人员在阅读前面的说明后将会明了这些所述实施方案的变型。本发明人预期本领域的熟练技术人员会适时采用此类变型,而且本发明人预期能以除了本文具体描述的方式之外的方式来实施。因此,本发明包括在随附的适用法律允许的权利要求中叙述的主题的所有修改和等效物。此外,除非本文另外指示或与上下文明显矛盾,否则在所有可行变型中的上述元件的任何组合都涵盖在本发明内。
此外,在整个说明书中已经对专利、印刷出版物、期刊论文和其他书面文本(本文引用的材料)进行了大量参考。每个参考材料出于其参考教义而以全文引用的方式单独并入本文中。
最后,应理解,本文所公开的本发明的实施方案是对本发明原理的说明。可用的其他修改形式也在本发明的范围内。因此,例如,但不限于,可根据本文的教义利用本发明的替代性配置。因而,本发明不限于明确示出和描述的方案。
本文示出的细节是作为实施例并且仅出于对本发明的优选实施方案的说明性讨论的目的,并且之所以呈现这些细节,是为了提供认为是本发明的各种实施方案的原理和概念方面的最有用和易理解的描述的内容。在这点上,除对于本发明的基本理解所必需的之外,没有企图更详细地示出本发明的结构细节,借助于附图和/或实施例所作的描述使得本领域技术人员明了如何可以在实践中实施本发明的若干形式。
除非在以下实施例中明确并毫无疑问地修改或是当含义的应用使得任何构建无意义或基本上无意义,否则在本公开中使用的定义和解释意指并且旨在控制任何未来构建。在术语的构建将使它无意义或基本上无意义的情况下,定义应该从韦氏字典(Webster’s Dictionary),第3版或本领域普通技术人员已知的字典诸如生物化学和分子生物学牛津字典(Anthony Smith编,Oxford University Press,Oxford,2004)中取得。
序列表
<110> 弗雷德哈钦森癌症研究中心(Fred Hutchinson Cancer Research Center)
<120> 遗传修饰细胞的减少和最少的操作制造
<130> F053-0091PCT/19-049-WO-PCT
<150> US 62/775,721
<151> 2018-12-05
<160> 264
<170> PatentIn version 3.5
<210> 1
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CCR5基因上的靶基因座
<400> 1
aagctcagtt tacacccgat ccactgggga gcaggaaata tct 43
<210> 2
<211> 88
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 同源模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 在序列的5'末端的任选的Alexa660N
<400> 2
ccacttgagt ccgtgtcaca agcccacaga tatttcctgc gcggccgctc cccagtggat 60
cgggtgtaaa ctgagcttgc tcgctcgg 88
<210> 3
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白基因启动子内的靶基因座
<400> 3
tggtcaagtt tgccttgtca aggctattgg tcaaggcaag gctg 44
<210> 4
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 同源模板
<400> 4
tactctaaga ctattggtca agttcgcctt gtcaaggcaa ggctggccaa cccatgggtg 60
<210> 5
<211> 41
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> crRNA
<220>
<221> misc_feature
<222> (1)..(1)
<223> 在序列的5'末端的任选的Alexa488N
<220>
<221> misc_feature
<222> (1)..(1)
<223> 在序列的5'末端的任选的AltR1
<220>
<221> misc_feature
<222> (41)..(41)
<223> 在序列的3'末端的任选的18原子六乙二醇间隔物(iSp18)和硫醇修饰剂C3S-S(thioMC3-D)
<400> 5
uaauuucuac ucuuguagau cacccgaucc acuggggagc a 41
<210> 6
<211> 36
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 crRNA
<220>
<221> misc_feature
<222> (1)..(1)
<223> 硫醇修饰剂C6 S-S (thioMC6-D )和18原子六乙二醇间隔物(iSp18)位于序列的5'末端
<220>
<221> misc_feature
<222> (36)..(36)
<223> 在序列的3'末端的任选的AltR2
<400> 6
cacccgaucc acuggggagc guuuuagagc uaugcu 36
<210> 7
<211> 67
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9tracrRNA
<400> 7
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 8
<211> 88
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于靶链的CCR5 HDT模板
<400> 8
ccgagcgagc aagctcagtt tacacccgat ccactgggga gcggccgcgc aggaaatatc 60
tgtgggcttg tgacacggac tcaagtgg 88
<210> 9
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CCR5正向引物
<400> 9
agatagtcat cttggggctg g 21
<210> 10
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CCR5反向引物
<400> 10
ggagtgaagg gagagtttgt c 21
<210> 11
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CCR5正向引物
<400> 11
tcgtcggcag cgtcagatgt gtataagaga cagacattgc caaacgcttc tgc 53
<210> 12
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CCR5反向引物
<400> 12
gtctcgtggg ctcggagatg tgtataagag acagtgcaca actctgactg ggtc 54
<210> 13
<211> 41
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白Cpf1 crRNA
<220>
<221> misc_feature
<222> (41)..(41)
<223> 在序列的3'末端的18原子六乙二醇间隔物(iSp18)和硫醇修饰剂C3S-S(thioMC3-D )
<400> 13
uaauuucuac ucuuguagau ccuugucaag gcuauugguc a 41
<210> 14
<211> 36
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白 Cas9 crRNA
<220>
<221> misc_feature
<222> (1)..(1)
<223> 硫醇修饰剂C6 S-S (thioMC6-D )和18原子六乙二醇间隔物(iSp18)位于序列的5'末端
<400> 14
cuugucaagg cuauugguca guuuuagagc uaugcu 36
<210> 15
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于非靶链的γ-珠蛋白HDT模板
<400> 15
cacccatggg ttggccagcc ttgccttgac aaggcgaact tgaccaatag tcttagagta 60
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白正向引物
<400> 16
ccttcttgcc atgtgccttg 20
<210> 17
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白反向引物
<400> 17
tctatggtgg gagaagaaaa ctagc 25
<210> 18
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白正向引物
<400> 18
tcgtcggcag cgtcagatgt gtataagaga cagggcccct ggcctcact 49
<210> 19
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白反向引物
<400> 19
gtctcgtggg ctcggagatg tgtataagag acagtcaatg caaatatctg tctgaaacg 59
<210> 20
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CCR5 Cpf1 crRNA
<220>
<221> misc_feature
<222> (4)..(4)
<223> n为a、c、g或t
<400> 20
tttncacccg atccactggg gagca 25
<210> 21
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 21
tttacacccg atccactggg gagca 25
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CCR5 Cas9 crRNA
<220>
<221> misc_feature
<222> (21)..(21)
<223> n为 a、c、g或t
<400> 22
cacccgatcc actggggagc ngg 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CCR5 Cas9 DNA
<400> 23
cacccgatcc actggggagc agg 23
<210> 24
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白Cpf1 crRNA
<220>
<221> misc_feature
<222> (4)..(4)
<223> n为 a、c、g或t
<400> 24
tttnccttgt caaggctatt ggtca 25
<210> 25
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1指导序列
<400> 25
tttgccttgt caaggctatt ggtca 25
<210> 26
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白Cas9 crRNA
<220>
<221> misc_feature
<222> (22)..(22)
<223> n为 a、c、g或t
<400> 26
ccttgtcaag gctattggtc angg 24
<210> 27
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> γ-珠蛋白Cas9 DNA
<400> 27
ccttgtcagg gctgttggtc gagg 24
<210> 28
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 28
gtggggaagg ggcccccaag agg 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 29
attgagatag tgtggggaag ggg 23
<210> 30
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 30
cattgagata gtgtggggaa ggg 23
<210> 31
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 31
gcattgagat agtgtgggga agg 23
<210> 32
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 32
atttgcattg agatagtgtg ggg 23
<210> 33
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (23)..(23)
<223> 同源臂位于序列的3'末端
<400> 33
gtggggaagg cgcccccaag agg 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (23)..(23)
<223> 同源臂位于序列的3'末端
<400> 34
gtggagaagg ggcccccaag agg 23
<210> 35
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (23)..(23)
<223> 同源臂位于序列的3'末端
<400> 35
gtggagaagg cgcccccaag agg 23
<210> 36
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (23)..(23)
<223> 同源臂位于序列的3'末端
<400> 36
gtttgcattg agatagtgtg ggg 23
<210> 37
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (23)..(23)
<223> 同源臂位于序列的3'末端
<400> 37
gctattggtt aaggcaaggc tgg 23
<210> 38
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (23)..(23)
<223> 同源臂位于序列的3'末端
<400> 38
gctattagtc aaggcaaggc tgg 23
<210> 39
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (23)..(23)
<223> 同源臂位于序列的3'末端
<400> 39
gctattagtt aaggcaaggc tgg 23
<210> 40
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (10)..(10)
<223> 同源臂位于序列的3'末端
<400> 40
gtttgccttg 10
<210> 41
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (25)..(25)
<223> 同源臂位于序列的3'末端
<400> 41
tttgccttag ttaaggcaag gctgg 25
<210> 42
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1指导序列
<400> 42
tttgcattga gatagtgtgg ggaag 25
<210> 43
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1指导序列
<400> 43
tttagccagg gaccgtttca gacag 25
<210> 44
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (33)..(33)
<223> 同源臂位于序列的3'末端
<400> 44
tttgcattga gatagtgtgg ggaaggcgcc ccc 33
<210> 45
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (33)..(33)
<223> 同源臂位于序列的3'末端
<400> 45
tttgcattga gatagtgtgg agaaggggcc ccc 33
<210> 46
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (33)..(33)
<223> 同源臂位于序列的3'末端
<400> 46
tttgcattga gatagtgtgg agaaggcgcc ccc 33
<210> 47
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR 模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (34)..(34)
<223> 同源臂位于序列的3'末端
<400> 47
tttagccagg gaccgtttca gacagatgtt tgca 34
<210> 48
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR 模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (25)..(25)
<223> 同源臂位于序列的3'末端
<400> 48
tttgccttgt caaggctatt ggtta 25
<210> 49
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR 模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (25)..(25)
<223> 同源臂位于序列的3'末端
<400> 49
tttgccttgt caaggctatt agtca 25
<210> 50
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR 模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (25)..(25)
<223> 同源臂位于序列的3'末端
<400> 50
tttgccttgt caaggctatt agtta 25
<210> 51
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR 模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (12)..(12)
<223> 同源臂位于序列的3'末端
<400> 51
tttgccttgt ca 12
<210> 52
<211> 13
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1 HDR 模板
<220>
<221> misc_feature
<222> (1)..(1)
<223> 同源臂位于序列的5'末端
<220>
<221> misc_feature
<222> (13)..(13)
<223> 同源臂位于序列的3'末端
<400> 52
tttgccttag tta 13
<210> 53
<211> 87
<212> PRT
<213> 智人(Homo sapiens)
<400> 53
Asp Cys Pro Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro
1 5 10 15
Gly Ala Pro Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr
20 25 30
Pro Thr Pro Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val
35 40 45
Thr Ser Glu Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr
50 55 60
Val Met Gly Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser
65 70 75 80
Thr Cys Tyr Tyr His Lys Ser
85
<210> 54
<211> 87
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 54
Gly Cys Pro Glu Cys Lys Leu Lys Glu Asn Lys Tyr Phe Ser Lys Leu
1 5 10 15
Gly Ala Pro Ile Tyr Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr
20 25 30
Pro Thr Pro Ala Arg Ser Lys Lys Thr Met Leu Val Pro Lys Asn Ile
35 40 45
Thr Ser Glu Ala Thr Cys Cys Val Ala Lys Ala Phe Thr Lys Ala Thr
50 55 60
Val Met Gly Asn Ala Arg Val Glu Asn His Thr Glu Cys His Cys Ser
65 70 75 80
Thr Cys Tyr Tyr His Lys Ser
85
<210> 55
<211> 121
<212> PRT
<213> 智人(Homo sapiens)
<400> 55
Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile Asn Ala Ile Leu
1 5 10 15
Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr Val Asn Thr Thr
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Val Leu Gln Ala Val
35 40 45
Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg Asp Val Arg Phe
50 55 60
Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val Asp Pro Val Val
65 70 75 80
Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro Cys Arg Arg Ser
85 90 95
Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu Thr Cys Asp His
100 105 110
Pro Gln Leu Ser Gly Leu Leu Phe Leu
115 120
<210> 56
<211> 121
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 56
Ser Arg Gly Pro Leu Arg Pro Leu Cys Arg Pro Val Asn Ala Thr Leu
1 5 10 15
Ala Ala Glu Asn Glu Phe Cys Pro Val Cys Ile Thr Phe Thr Thr Ser
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Ser Met Val Arg Val Leu Pro Ala Ala
35 40 45
Leu Pro Pro Val Pro Gln Pro Val Cys Thr Tyr Arg Glu Leu Arg Phe
50 55 60
Ala Ser Val Arg Leu Pro Gly Cys Pro Pro Gly Val Asp Pro Ile Val
65 70 75 80
Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro Cys Arg Leu Ser
85 90 95
Ser Ser Asp Cys Gly Gly Pro Arg Thr Gln Pro Met Ala Cys Asp Leu
100 105 110
Pro His Leu Pro Gly Leu Leu Leu Leu
115 120
<210> 57
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH1抗LHR结合剂
<400> 57
Gly Tyr Ser Ile Thr Ser Gly Tyr Gly
1 5
<210> 58
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH2抗LHR结合剂
<400> 58
Ile His Tyr Ser Gly Ser Thr
1 5
<210> 59
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH3抗LHR结合剂
<400> 59
Ala Arg Ser Leu Arg Tyr
1 5
<210> 60
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRL1抗LHR结合剂
<400> 60
Ser Ser Val Asn Tyr
1 5
<210> 61
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRL3抗LHR结合剂
<400> 61
His Gln Trp Ser Ser Tyr Pro Tyr Thr
1 5
<210> 62
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH1抗LHR结合剂
<400> 62
Gly Phe Ser Leu Thr Thr Tyr Gly
1 5
<210> 63
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH2抗LHR结合剂
<400> 63
Ile Trp Gly Asp Gly Ser Thr
1 5
<210> 64
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH3抗LHR结合剂
<400> 64
Ala Glu Gly Ser Ser Leu Phe Ala Tyr
1 5
<210> 65
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRL1抗LHR结合剂
<400> 65
Gln Ser Leu Leu Asn Ser Gly Asn Gln Lys Asn Tyr
1 5 10
<210> 66
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRL3抗LHR结合剂
<400> 66
Gln Asn Asp Tyr Ser Tyr Pro Leu Thr
1 5
<210> 67
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH1抗LHR结合剂
<400> 67
Gly Tyr Ser Phe Thr Gly Tyr Tyr
1 5
<210> 68
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH2抗LHR结合剂
<400> 68
Ile Tyr Pro Tyr Asn Gly Val Ser
1 5
<210> 69
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRH3抗LHR结合剂
<400> 69
Ala Arg Glu Arg Gly Leu Tyr Gln Leu Arg Ala Met Asp Tyr
1 5 10
<210> 70
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRL1抗LHR结合剂
<400> 70
Gln Ser Ile Ser Asn Asn
1 5
<210> 71
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CDRL3抗LHR结合剂
<400> 71
Gln Gln Ser Asn Ser Trp Pro Tyr Thr
1 5
<210> 72
<211> 111
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗LHR结合剂重链
<400> 72
Glu Val Gln Leu Gln Glu Ser Gly Pro Asp Leu Val Lys Pro Ser Gln
1 5 10 15
Ser Leu Ser Leu Thr Cys Thr Val Thr Gly Tyr Ser Ile Thr Ser Gly
20 25 30
Tyr Gly Trp His Arg Gln Phe Pro Gly Asn Lys Leu Glu Trp Met Gly
35 40 45
Tyr Ile His Tyr Ser Gly Ser Thr Thr Tyr Asn Pro Ser Leu Lys Ser
50 55 60
Arg Ile Ser Ile Ser Arg Asp Thr Ser Lys Asn Gln Phe Phe Leu Gln
65 70 75 80
Leu Asn Ser Val Thr Thr Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Arg
85 90 95
Ser Leu Arg Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser
100 105 110
<210> 73
<211> 106
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗LHR结合剂轻链
<400> 73
Asp Ile Val Met Thr Gln Thr Pro Ala Ile Met Ser Ala Ser Pro Gly
1 5 10 15
Gln Lys Val Thr Ile Thr Cys Ser Ala Ser Ser Ser Val Asn Tyr Met
20 25 30
His Trp Tyr Gln Gln Lys Leu Gly Ser Ser Pro Lys Leu Trp Ile Tyr
35 40 45
Asp Thr Ser Lys Leu Ala Pro Gly Val Pro Ala Arg Phe Ser Gly Ser
50 55 60
Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Ser Ser Met Glu Ala Glu
65 70 75 80
Asp Ala Ala Ser Tyr Phe Cys His Gln Trp Ser Ser Tyr Pro Tyr Thr
85 90 95
Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys
100 105
<210> 74
<211> 115
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗LHR结合剂重链
<400> 74
Gln Val Gln Leu Lys Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln
1 5 10 15
Ser Leu Ser Arg Arg Cys Thr Val Ser Gly Phe Ser Leu Thr Thr Tyr
20 25 30
Gly Val Ser Trp Val Arg Gln Pro Pro Gly Lys Gly Leu Glu Trp Leu
35 40 45
Gly Val Ile Trp Gly Asp Gly Ser Thr Tyr Tyr His Ser Ala Leu Ile
50 55 60
Ser Arg Leu Ser Ile Ser Lys Asp Asn Ser Lys Ser Gln Val Phe Leu
65 70 75 80
Lys Leu Asn Ser Leu Gln Thr Asp Asp Thr Ala Thr Tyr Tyr Cys Ala
85 90 95
Glu Gly Ser Ser Leu Phe Ala Tyr Trp Gly Gln Gly Thr Leu Val Thr
100 105 110
Val Ser Ala
115
<210> 75
<211> 113
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗LHR结合剂轻链
<220>
<221> misc_feature
<222> (89)..(89)
<223> Xaa可以是任何天然存在的氨基酸
<400> 75
Asp Ile Val Met Thr Gln Ser Pro Ser Ser Leu Thr Val Thr Ala Gly
1 5 10 15
Glu Lys Val Thr Met Ser Cys Lys Ser Ser Gln Ser Leu Leu Asn Ser
20 25 30
Gly Asn Gln Lys Asn Tyr Leu Thr Trp Tyr Gln Gln Lys Pro Gly Gln
35 40 45
Pro Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Gln Ser Gly Val
50 55 60
Pro Asp Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr
65 70 75 80
Ile Ser Ser Val Gln Ala Glu Asp Xaa Ala Val Tyr Tyr Cys Gln Asn
85 90 95
Asp Tyr Ser Tyr Pro Leu Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile
100 105 110
Lys
<210> 76
<211> 103
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗LHR结合剂重链
<400> 76
Glu Val Gln Leu Glu Gln Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Phe
20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Glu Lys Gly Leu Glu Trp Val
35 40 45
Ala Tyr Ile Ser Ser Gly Ser Ser Thr Leu His Tyr Ala Asp Thr Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Pro Lys Asn Thr Leu Phe
65 70 75 80
Leu Gln Met Lys Leu Pro Ser Leu Cys Tyr Gly Leu Leu Gly Ser Arg
85 90 95
Asn Leu Ser His Arg Leu Leu
100
<210> 77
<211> 107
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗LHR结合剂轻链
<400> 77
Asp Ile Val Leu Thr Gln Thr Pro Ser Ser Leu Ser Ala Ser Leu Gly
1 5 10 15
Asp Thr Ile Thr Ile Thr Cys His Ala Ser Gln Asn Ile Asn Val Trp
20 25 30
Leu Phe Trp Tyr Gln Gln Lys Pro Gly Asn Ile Pro Lys Leu Leu Ile
35 40 45
Tyr Lys Ala Ser Asn Leu Leu Thr Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Gly Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Ile Ala Thr Tyr Tyr Cys Gln Gln Gly Gln Ser Phe Pro Trp
85 90 95
Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
100 105
<210> 78
<211> 121
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗LHR结合剂重链
<400> 78
Gln Val Lys Leu Gln Gln Ser Gly Pro Glu Leu Val Lys Pro Gly Ala
1 5 10 15
Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Gly Tyr
20 25 30
Tyr Met His Trp Val Lys Gln Ser His Gly Asn Ile Leu Asp Trp Ile
35 40 45
Gly Tyr Ile Tyr Pro Tyr Asn Gly Val Ser Ser Tyr Asn Gln Lys Phe
50 55 60
Lys Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr
65 70 75 80
Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Glu Arg Gly Leu Tyr Gln Leu Arg Ala Met Asp Tyr Trp Gly
100 105 110
Gln Gly Thr Ser Val Thr Val Ser Ser
115 120
<210> 79
<211> 107
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗LHR结合剂轻链
<400> 79
Asp Ile Val Leu Thr Gln Thr Pro Ala Thr Leu Ser Val Thr Pro Gly
1 5 10 15
Asp Ser Val Ser Leu Ser Cys Arg Ala Ser Gln Ser Ile Ser Asn Asn
20 25 30
Leu His Trp Tyr Gln Gln Lys Ser His Glu Ser Pro Arg Leu Leu Ile
35 40 45
Lys Asn Ala Ser Gln Ser Ile Ser Gly Ile Pro Ser Lys Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Arg Ile Asn Ser Val Glu Thr
65 70 75 80
Glu Asp Phe Gly Met Tyr Phe Cys Gln Gln Ser Asn Ser Trp Pro Tyr
85 90 95
Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys
100 105
<210> 80
<211> 41
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> crRNA
<400> 80
uaauuucuac ucuuguagau uucggacccg ugcuacaacu u 41
<210> 81
<211> 41
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> crRNA
<400> 81
uaauuucuac ucuuguagau auagaauagc cucauauuuu a 41
<210> 82
<211> 43
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> crRNA
<400> 82
uaauuucuac ucuuguagau gagcuguugg caucauguuc cug 43
<210> 83
<211> 41
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> crRNA
<400> 83
uaauuucuac ucuuguagau uccaaaccuc cuaaaugaua c 41
<210> 84
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 84
tttgtgtccc cgttttggtt ggtaaac 27
<210> 85
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 85
tttaaaaatc aataccgata ataatga 27
<210> 86
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 86
tttcttaata tgaatattaa tatcggt 27
<210> 87
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 87
tttccgtatc tggaaggggc atcttgg 27
<210> 88
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 88
tttccttagg accggaagga ttacagc 27
<210> 89
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 89
tttgcctaaa aggcactatg tcaaatg 27
<210> 90
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 90
tttggagctg ttggcatcat gttcctg 27
<210> 91
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 91
tttgattctt ttctatctca ggacaga 27
<210> 92
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 92
tttatagaca tcccacactg tagttct 27
<210> 93
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM 位点
<400> 93
tttattaatt tgagaaccaa cataagg 27
<210> 94
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM 位点
<400> 94
tttattttct ttttggtaag aaggaac 27
<210> 95
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 95
tttcacacac acacacacac acacaca 27
<210> 96
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 96
tttatccaaa cctcctaaat gatac 25
<210> 97
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶位点
<220>
<221> misc_feature
<222> (1)..(3)
<223> PAM位点
<400> 97
tttttgattc ttttctatct caggaca 27
<210> 98
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Gly Ser接头
<400> 98
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 99
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Gly Ser 接头
<400> 99
Gly Gly Gly Ser Gly Gly Gly Ser
1 5
<210> 100
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Gly Ser 接头
<400> 100
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser
1 5 10
<210> 101
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRH2
<400> 101
Lys Ile Tyr Pro Gly Asp Ser Tyr Thr Asn Tyr Ser Pro Ser
1 5 10
<210> 102
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRH3
<400> 102
Gly Tyr Gly Ile Phe Asp Tyr
1 5
<210> 103
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD8 CDRL1
<400> 103
Arg Thr Ser Arg Ser Ile Ser Gln Tyr Leu Ala
1 5 10
<210> 104
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD8 CDRL2
<400> 104
Ser Gly Ser Thr Leu Gln Ser
1 5
<210> 105
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD8 CDRL3
<400> 105
Gln Gln His Asn Glu Asn Pro Leu Thr
1 5
<210> 106
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD8 CDRH1
<400> 106
Gly Phe Asn Ile Lys Asp
1 5
<210> 107
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD8 CDRH2
<400> 107
Arg Ile Asp Pro Ala Asn Asp Asn Thr
1 5
<210> 108
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD8 CDRH3
<400> 108
Gly Tyr Gly Tyr Tyr Val Phe Asp His
1 5
<210> 109
<211> 109
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗KIR2DL1和抗KIR2DL2/3可变轻链
<400> 109
Glu Ile Val Leu Thr Gln Ser Pro Val Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile
35 40 45
Tyr Asp Ala Ser Asn Arg Ala Thr Gly Ile Pro Ala Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Glu Pro
65 70 75 80
Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Arg Ser Asn Trp Met Tyr
85 90 95
Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys Arg Thr
100 105
<210> 110
<211> 123
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗KIR2DL1 and 抗KIR2DL2/3可变重链
<400> 110
Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser
1 5 10 15
Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Thr Phe Ser Phe Tyr
20 25 30
Ala Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met
35 40 45
Gly Gly Phe Ile Pro Ile Phe Gly Ala Ala Asn Tyr Ala Gln Lys Phe
50 55 60
Gln Gly Arg Val Thr Ile Thr Ala Asp Glu Ser Thr Ser Thr Ala Tyr
65 70 75 80
Met Glu Leu Ser Ser Leu Arg Ser Asp Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Ile Pro Ser Gly Ser Tyr Tyr Tyr Asp Tyr Asp Met Asp Val
100 105 110
Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser
115 120
<210> 111
<211> 35
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 结合CD133的RNA适体共有序列
<400> 111
gcucaaccca cccuccuaca uagggaggaa cgagu 35
<210> 112
<211> 4107
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 112
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 113
<211> 3903
<212> DNA
<213> 土拉弗朗西斯菌(Francisella tularensis)
<400> 113
atgtcaattt atcaagaatt tgttaataaa tatagtttaa gtaaaactct aagatttgag 60
ttaatcccac agggtaaaac acttgaaaac ataaaagcaa gaggtttgat tttagatgat 120
gagaaaagag ctaaagacta caaaaaggct aaacaaataa ttgataaata tcatcagttt 180
tttatagagg agatattaag ttcggtttgt attagcgaag atttattaca aaactattct 240
gatgtttatt ttaaacttaa aaagagtgat gatgataatc tacaaaaaga ttttaaaagt 300
gcaaaagata cgataaagaa acaaatatct gaatatataa aggactcaga gaaatttaag 360
aatttgttta atcaaaacct tatcgatgct aaaaaagggc aagagtcaga tttaattcta 420
tggctaaagc aatctaagga taatggtata gaactattta aagccaatag tgatatcaca 480
gatatagatg aggcgttaga aataatcaaa tcttttaaag gttggacaac ttattttaag 540
ggttttcatg aaaatagaaa aaatgtttat agtagcaatg atattcctac atctattatt 600
tataggatag tagatgataa tttgcctaaa tttctagaaa ataaagctaa gtatgagagt 660
ttaaaagaca aagctccaga agctataaac tatgaacaaa ttaaaaaaga tttggcagaa 720
gagctaacct ttgatattga ctacaaaaca tctgaagtta atcaaagagt tttttcactt 780
gatgaagttt ttgagatagc aaactttaat aattatctaa atcaaagtgg tattactaaa 840
tttaatacta ttattggtgg taaatttgta aatggtgaaa atacaaagag aaaaggtata 900
aatgaatata taaatctata ctcacagcaa ataaatgata aaacactcaa aaaatataaa 960
atgagtgttt tatttaagca aattttaagt gatacagaat ctaaatcttt tgtaattgat 1020
aagttagaag atgatagtga tgtagttaca acgatgcaaa gtttttatga gcaaatagca 1080
gcttttaaaa cagtagaaga aaaatctatt aaagaaacac tatctttatt atttgatgat 1140
ttaaaagctc aaaaacttga tttgagtaaa atttatttta aaaatgataa atctcttact 1200
gatctatcac aacaagtttt tgatgattat agtgttattg gtacagcggt actagaatat 1260
ataactcaac aaatagcacc taaaaatctt gataacccta gtaagaaaga gcaagaatta 1320
atagccaaaa aaactgaaaa agcaaaatac ttatctctag aaactataaa gcttgcctta 1380
gaagaattta ataagcatag agatatagat aaacagtgta ggtttgaaga aatacttgca 1440
aactttgcgg ctattccgat gatatttgat gaaatagctc aaaacaaaga caatttggca 1500
cagatatcta tcaaatatca aaatcaaggt aaaaaagacc tacttcaagc tagtgcggaa 1560
gatgatgtta aagctatcaa ggatctttta gatcaaacta ataatctctt acataaacta 1620
aaaatatttc atattagtca gtcagaagat aaggcaaata ttttagacaa ggatgagcat 1680
ttttatctag tatttgagga gtgctacttt gagctagcga atatagtgcc tctttataac 1740
aaaattagaa actatataac tcaaaagcca tatagtgatg agaaatttaa gctcaatttt 1800
gagaactcga ctttggctaa tggttgggat aaaaataaag agcctgacaa tacggcaatt 1860
ttatttatca aagatgataa atattatctg ggtgtgatga ataagaaaaa taacaaaata 1920
tttgatgata aagctatcaa agaaaataaa ggcgagggtt ataaaaaaat tgtttataaa 1980
cttttacctg gcgcaaataa aatgttacct aaggttttct tttctgctaa atctataaaa 2040
ttttataatc ctagtgaaga tatacttaga ataagaaatc attccacaca tacaaaaaat 2100
ggtagtcctc aaaaaggata tgaaaaattt gagtttaata ttgaagattg ccgaaaattt 2160
atagattttt ataaacagtc tataagtaag catccggagt ggaaagattt tggatttaga 2220
ttttctgata ctcaaagata taattctata gatgaatttt atagagaagt tgaaaatcaa 2280
ggctacaaac taacttttga aaatatatca gagagctata ttgatagcgt agttaatcag 2340
ggtaaattgt acctattcca aatctataat aaagattttt cagcttatag caaagggcga 2400
ccaaatctac atactttata ttggaaagcg ctgtttgatg agagaaatct tcaagatgtg 2460
gtttataagc taaatggtga ggcagagctt ttttatcgta aacaatcaat acctaaaaaa 2520
atcactcacc cagctaaaga ggcaatagct aataaaaaca aagataatcc taaaaaagag 2580
agtgtttttg aatatgattt aatcaaagat aaacgcttta ctgaagataa gtttttcttt 2640
cactgtccta ttacaatcaa ttttaaatct agtggagcta ataagtttaa tgatgaaatc 2700
aatttattgc taaaagaaaa agcaaatgat gttcatatat taagtataga tagaggtgaa 2760
agacatttag cttactatac tttggtagat ggtaaaggca atatcatcaa acaagatact 2820
ttcaacatca ttggtaatga tagaatgaaa acaaactacc atgataagct tgctgcaata 2880
gagaaagata gggattcagc taggaaagac tggaaaaaga taaataacat caaagagatg 2940
aaagagggct atctatctca ggtagttcat gaaatagcta agctagttat agagtataat 3000
gctattgtgg tttttgagga tttaaatttt ggatttaaaa gagggcgttt caaggtagag 3060
aagcaggtct atcaaaagtt agaaaaaatg ctaattgaga aactaaacta tctagttttc 3120
aaagataatg agtttgataa aactggggga gtgcttagag cttatcagct aacagcacct 3180
tttgagactt ttaaaaagat gggtaaacaa acaggtatta tctactatgt accagctggt 3240
tttacttcaa aaatttgtcc tgtaactggt tttgtaaatc agttatatcc taagtatgaa 3300
agtgtcagca aatctcaaga gttctttagt aagtttgaca agatttgtta taaccttgat 3360
aagggctatt ttgagtttag ttttgattat aaaaactttg gtgacaaggc tgccaaaggc 3420
aagtggacta tagctagctt tgggagtaga ttgattaact ttagaaattc agataaaaat 3480
cataattggg atactcgaga agtttatcca actaaagagt tggagaaatt gctaaaagat 3540
tattctatcg aatatgggca tggcgaatgt atcaaagcag ctatttgcgg tgagagcgac 3600
aaaaagtttt ttgctaagct aactagtgtc ctaaatacta tcttacaaat gcgtaactca 3660
aaaacaggta ctgagttaga ttatctaatt tcaccagtag cagatgtaaa tggcaatttc 3720
tttgattcgc gacaggcgcc aaaaaatatg cctcaagatg ctgatgccaa tggtgcttat 3780
catattgggc taaaaggtct gatgctacta ggtaggatca aaaataatca agagggcaaa 3840
aaactcaatt tggttatcaa aaatgaagag tattttgagt tcgtgcagaa taggaataac 3900
taa 3903
<210> 114
<211> 3921
<212> DNA
<213> 氨基酸球菌属(Acidaminococcus sp.) BV3L6
<400> 114
atgacacagt tcgagggctt taccaacctg tatcaggtga gcaagacact gcggtttgag 60
ctgatcccac agggcaagac cctgaagcac atccaggagc agggcttcat cgaggaggac 120
aaggcccgca atgatcacta caaggagctg aagcccatca tcgatcggat ctacaagacc 180
tatgccgacc agtgcctgca gctggtgcag ctggattggg agaacctgag cgccgccatc 240
gactcctata gaaaggagaa aaccgaggag acaaggaacg ccctgatcga ggagcaggcc 300
acatatcgca atgccatcca cgactacttc atcggccgga cagacaacct gaccgatgcc 360
atcaataaga gacacgccga gatctacaag ggcctgttca aggccgagct gtttaatggc 420
aaggtgctga agcagctggg caccgtgacc acaaccgagc acgagaacgc cctgctgcgg 480
agcttcgaca agtttacaac ctacttctcc ggcttttatg agaacaggaa gaacgtgttc 540
agcgccgagg atatcagcac agccatccca caccgcatcg tgcaggacaa cttccccaag 600
tttaaggaga attgtcacat cttcacacgc ctgatcaccg ccgtgcccag cctgcgggag 660
cactttgaga acgtgaagaa ggccatcggc atcttcgtga gcacctccat cgaggaggtg 720
ttttccttcc ctttttataa ccagctgctg acacagaccc agatcgacct gtataaccag 780
ctgctgggag gaatctctcg ggaggcaggc accgagaaga tcaagggcct gaacgaggtg 840
ctgaatctgg ccatccagaa gaatgatgag acagcccaca tcatcgcctc cctgccacac 900
agattcatcc ccctgtttaa gcagatcctg tccgatagga acaccctgtc tttcatcctg 960
gaggagttta agagcgacga ggaagtgatc cagtccttct gcaagtacaa gacactgctg 1020
agaaacgaga acgtgctgga gacagccgag gccctgttta acgagctgaa cagcatcgac 1080
ctgacacaca tcttcatcag ccacaagaag ctggagacaa tcagcagcgc cctgtgcgac 1140
cactgggata cactgaggaa tgccctgtat gagcggagaa tctccgagct gacaggcaag 1200
atcaccaagt ctgccaagga gaaggtgcag cgcagcctga agcacgagga tatcaacctg 1260
caggagatca tctctgccgc aggcaaggag ctgagcgagg ccttcaagca gaaaaccagc 1320
gagatcctgt cccacgcaca cgccgccctg gatcagccac tgcctacaac cctgaagaag 1380
caggaggaga aggagatcct gaagtctcag ctggacagcc tgctgggcct gtaccacctg 1440
ctggactggt ttgccgtgga tgagtccaac gaggtggacc ccgagttctc tgcccggctg 1500
accggcatca agctggagat ggagccttct ctgagcttct acaacaaggc cagaaattat 1560
gccaccaaga agccctactc cgtggagaag ttcaagctga actttcagat gcctacactg 1620
gcctctggct gggacgtgaa taaggagaag aacaatggcg ccatcctgtt tgtgaagaac 1680
ggcctgtact atctgggcat catgccaaag cagaagggca ggtataaggc cctgagcttc 1740
gagcccacag agaaaaccag cgagggcttt gataagatgt actatgacta cttccctgat 1800
gccgccaaga tgatcccaaa gtgcagcacc cagctgaagg ccgtgacagc ccactttcag 1860
acccacacaa cccccatcct gctgtccaac aatttcatcg agcctctgga gatcacaaag 1920
gagatctacg acctgaacaa tcctgagaag gagccaaaga agtttcagac agcctacgcc 1980
aagaaaaccg gcgaccagaa gggctacaga gaggccctgt gcaagtggat cgacttcaca 2040
agggattttc tgtccaagta taccaagaca acctctatcg atctgtctag cctgcggcca 2100
tcctctcagt ataaggacct gggcgagtac tatgccgagc tgaatcccct gctgtaccac 2160
atcagcttcc agagaatcgc cgagaaggag atcatggatg ccgtggagac aggcaagctg 2220
tacctgttcc agatctataa caaggacttt gccaagggcc accacggcaa gcctaatctg 2280
cacacactgt attggaccgg cctgttttct ccagagaacc tggccaagac aagcatcaag 2340
ctgaatggcc aggccgagct gttctaccgc cctaagtcca ggatgaagag gatggcacac 2400
cggctgggag agaagatgct gaacaagaag ctgaaggatc agaaaacccc aatccccgac 2460
accctgtacc aggagctgta cgactatgtg aatcacagac tgtcccacga cctgtctgat 2520
gaggccaggg ccctgctgcc caacgtgatc accaaggagg tgtctcacga gatcatcaag 2580
gataggcgct ttaccagcga caagttcttt ttccacgtgc ctatcacact gaactatcag 2640
gccgccaatt ccccatctaa gttcaaccag agggtgaatg cctacctgaa ggagcacccc 2700
gagacaccta tcatcggcat cgatcggggc gagagaaacc tgatctatat cacagtgatc 2760
gactccaccg gcaagatcct ggagcagcgg agcctgaaca ccatccagca gtttgattac 2820
cagaagaagc tggacaacag ggagaaggag agggtggcag caaggcaggc ctggtctgtg 2880
gtgggcacaa tcaaggatct gaagcagggc tatctgagcc aggtcatcca cgagatcgtg 2940
gacctgatga tccactacca ggccgtggtg gtgctggaga acctgaattt cggctttaag 3000
agcaagagga ccggcatcgc cgagaaggcc gtgtaccagc agttcgagaa gatgctgatc 3060
gataagctga attgcctggt gctgaaggac tatccagcag agaaagtggg aggcgtgctg 3120
aacccatacc agctgacaga ccagttcacc tcctttgcca agatgggcac ccagtctggc 3180
ttcctgtttt acgtgcctgc cccatataca tctaagatcg atcccctgac cggcttcgtg 3240
gaccccttcg tgtggaaaac catcaagaat cacgagagcc gcaagcactt cctggagggc 3300
ttcgactttc tgcactacga cgtgaaaacc ggcgacttca tcctgcactt taagatgaac 3360
agaaatctgt ccttccagag gggcctgccc ggctttatgc ctgcatggga tatcgtgttc 3420
gagaagaacg agacacagtt tgacgccaag ggcacccctt tcatcgccgg caagagaatc 3480
gtgccagtga tcgagaatca cagattcacc ggcagatacc gggacctgta tcctgccaac 3540
gagctgatcg ccctgctgga ggagaagggc atcgtgttca gggatggctc caacatcctg 3600
ccaaagctgc tggagaatga cgattctcac gccatcgaca ccatggtggc cctgatccgc 3660
agcgtgctgc agatgcggaa ctccaatgcc gccacaggcg aggactatat caacagcccc 3720
gtgcgcgatc tgaatggcgt gtgcttcgac tcccggtttc agaacccaga gtggcccatg 3780
gacgccgatg ccaatggcgc ctaccacatc gccctgaagg gccagctgct gctgaatcac 3840
ctgaaggaga gcaaggatct gaagctgcag aacggcatct ccaatcagga ctggctggcc 3900
tacatccagg agctgcgcaa c 3921
<210> 115
<211> 3699
<212> DNA
<213> 毛螺菌科细菌(Lachnospiraceae bacterium)
<400> 115
atggattacg gcaacggcca gtttgagcgg agagcccccc tgaccaagac aatcaccctg 60
cgcctgaagc ctatcggcga gacacgggag acaatccgcg agcagaagct gctggagcag 120
gacgccgcct tcagaaagct ggtggagaca gtgaccccta tcgtggacga ttgtatcagg 180
aagatcgccg ataacgccct gtgccacttt ggcaccgagt atgacttcag ctgtctgggc 240
aacgccatct ctaagaatga cagcaaggcc atcaagaagg agacagagaa ggtggagaag 300
ctgctggcca aggtgctgac cgagaatctg ccagatggcc tgcgcaaggt gaacgacatc 360
aattccgccg cctttatcca ggatacactg acctctttcg tgcaggacga tgccgacaag 420
cgggtgctga tccaggagct gaagggcaag accgtgctga tgcagcggtt cctgaccaca 480
cggatcacag ccctgaccgt gtggctgccc gacagagtgt tcgagaactt taatatcttc 540
atcgagaacg ccgagaagat gagaatcctg ctggactccc ctctgaatga gaagatcatg 600
aagtttgacc cagatgccga gcagtacgcc tctctggagt tctatggcca gtgcctgtct 660
cagaaggaca tcgatagcta caacctgatc atctccggca tctatgccga cgatgaggtg 720
aagaaccctg gcatcaatga gatcgtgaag gagtacaatc agcagatccg gggcgacaag 780
gatgagtccc cactgcccaa gctgaagaag ctgcacaagc agatcctgat gccagtggag 840
aaggccttct ttgtgcgcgt gctgtctaac gacagcgatg cccggagcat cctggagaag 900
atcctgaagg acacagagat gctgccctcc aagatcatcg aggccatgaa ggaggcagat 960
gcaggcgaca tcgccgtgta cggcagccgg ctgcacgagc tgagccacgt gatctacggc 1020
gatcacggca agctgtccca gatcatctat gacaaggagt ccaagaggat ctctgagctg 1080
atggagacac tgtctccaaa ggagcgcaag gagagcaaga agcggctgga gggcctggag 1140
gagcacatca gaaagtctac atacaccttc gacgagctga acaggtatgc cgagaagaat 1200
gtgatggcag catacatcgc agcagtggag gagtcttgtg ccgagatcat gagaaaggag 1260
aaggatctga ggaccctgct gagcaaggag gacgtgaaga tccggggcaa cagacacaat 1320
acactgatcg tgaagaacta ctttaatgcc tggaccgtgt tccggaacct gatcagaatc 1380
ctgaggcgca agtccgaggc cgagatcgac tctgacttct acgatgtgct ggacgattcc 1440
gtggaggtgc tgtctctgac atacaagggc gagaatctgt gccgcagcta tatcaccaag 1500
aagatcggct ccgacctgaa gcccgagatc gccacatacg gcagcgccct gaggcctaac 1560
agccgctggt ggtccccagg agagaagttt aatgtgaagt tccacaccat cgtgcggaga 1620
gatggccggc tgtactattt catcctgccc aagggcgcca agcctgtgga gctggaggac 1680
atggatggcg acatcgagtg tctgcagatg agaaagatcc ctaacccaac aatctttctg 1740
cccaagctgg tgttcaagga ccctgaggcc ttctttaggg ataatccaga ggccgacgag 1800
ttcgtgtttc tgagcggcat gaaggccccc gtgacaatca ccagagagac atacgaggcc 1860
tacaggtata agctgtatac cgtgggcaag ctgcgcgatg gcgaggtgtc cgaagaggag 1920
tacaagcggg ccctgctgca ggtgctgacc gcctacaagg agtttctgga gaacagaatg 1980
atctatgccg acctgaattt cggctttaag gatctggagg agtataagga cagctccgag 2040
tttatcaagc aggtggagac acacaacacc ttcatgtgct gggccaaggt gtctagctcc 2100
cagctggacg atctggtgaa gtctggcaac ggcctgctgt tcgagatctg gagcgagcgc 2160
ctggagtcct actataagta cggcaatgag aaggtgctgc ggggctatga gggcgtgctg 2220
ctgagcatcc tgaaggatga gaacctggtg tccatgcgga ccctgctgaa cagccggccc 2280
atgctggtgt accggccaaa ggagtctagc aagcctatgg tggtgcaccg ggatggcagc 2340
agagtggtgg acaggtttga taaggacggc aagtacatcc cccctgaggt gcacgacgag 2400
ctgtatcgct tctttaacaa tctgctgatc aaggagaagc tgggcgagaa ggcccggaag 2460
atcctggaca acaagaaggt gaaggtgaag gtgctggaga gcgagagagt gaagtggtcc 2520
aagttctacg atgagcagtt tgccgtgacc ttcagcgtga agaagaacgc cgattgtctg 2580
gacaccacaa aggacctgaa tgccgaagtg atggagcagt atagcgagtc caacagactg 2640
atcctgatca ggaataccac agatatcctg tactatctgg tgctggacaa gaatggcaag 2700
gtgctgaagc agagatccct gaacatcatc aatgacggcg ccagggatgt ggactggaag 2760
gagaggttcc gccaggtgac aaaggataga aacgagggct acaatgagtg ggattattcc 2820
aggacctcta acgacctgaa ggaggtgtac ctgaattatg ccctgaagga gatcgccgag 2880
gccgtgatcg agtacaacgc catcctgatc atcgagaaga tgtctaatgc ctttaaggac 2940
aagtatagct tcctggacga cgtgaccttc aagggcttcg agacaaagct gctggccaag 3000
ctgagcgatc tgcactttag gggcatcaag gacggcgagc catgttcctt cacaaacccc 3060
ctgcagctgt gccagaacga ttctaataag atcctgcagg acggcgtgat ctttatggtg 3120
ccaaattcta tgacacggag cctggacccc gacaccggct tcatctttgc catcaacgac 3180
cacaatatca ggaccaagaa ggccaagctg aactttctga gcaagttcga tcagctgaag 3240
gtgtcctctg agggctgcct gatcatgaag tacagcggcg attccctgcc tacacacaac 3300
accgacaatc gcgtgtggaa ctgctgttgc aatcacccaa tcacaaacta tgaccgggag 3360
acaaagaagg tggagttcat cgaggagccc gtggaggagc tgtcccgcgt gctggaggag 3420
aatggcatcg agacagacac cgagctgaac aagctgaatg agcgggagaa cgtgcctggc 3480
aaggtggtgg atgccatcta ctctctggtg ctgaattatc tgcgcggcac agtgagcgga 3540
gtggcaggac agagggccgt gtactatagc cctgtgaccg gcaagaagta cgatatctcc 3600
tttatccagg ccatgaacct gaataggaag tgtgactact ataggatcgg ctccaaggag 3660
aggggagagt ggaccgattt cgtggcccag ctgatcaac 3699
<210> 116
<211> 3684
<212> DNA
<213> 毛螺菌科细菌(Lachnospiraceae bacterium)
<400> 116
atgagcaagc tggagaagtt tacaaactgc tactccctgt ctaagaccct gaggttcaag 60
gccatccctg tgggcaagac ccaggagaac atcgacaata agcggctgct ggtggaggac 120
gagaagagag ccgaggatta taagggcgtg aagaagctgc tggatcgcta ctatctgtct 180
tttatcaacg acgtgctgca cagcatcaag ctgaagaatc tgaacaatta catcagcctg 240
ttccggaaga aaaccagaac cgagaaggag aataaggagc tggagaacct ggagatcaat 300
ctgcggaagg agatcgccaa ggccttcaag ggcaacgagg gctacaagtc cctgtttaag 360
aaggatatca tcgagacaat cctgccagag ttcctggacg ataaggacga gatcgccctg 420
gtgaacagct tcaatggctt taccacagcc ttcaccggct tctttgataa cagagagaat 480
atgttttccg aggaggccaa gagcacatcc atcgccttca ggtgtatcaa cgagaatctg 540
acccgctaca tctctaatat ggacatcttc gagaaggtgg acgccatctt tgataagcac 600
gaggtgcagg agatcaagga gaagatcctg aacagcgact atgatgtgga ggatttcttt 660
gagggcgagt tctttaactt tgtgctgaca caggagggca tcgacgtgta taacgccatc 720
atcggcggct tcgtgaccga gagcggcgag aagatcaagg gcctgaacga gtacatcaac 780
ctgtataatc agaaaaccaa gcagaagctg cctaagttta agccactgta taagcaggtg 840
ctgagcgatc gggagtctct gagcttctac ggcgagggct atacatccga tgaggaggtg 900
ctggaggtgt ttagaaacac cctgaacaag aacagcgaga tcttcagctc catcaagaag 960
ctggagaagc tgttcaagaa ttttgacgag tactctagcg ccggcatctt tgtgaagaac 1020
ggccccgcca tcagcacaat ctccaaggat atcttcggcg agtggaacgt gatccgggac 1080
aagtggaatg ccgagtatga cgatatccac ctgaagaaga aggccgtggt gaccgagaag 1140
tacgaggacg atcggagaaa gtccttcaag aagatcggct ccttttctct ggagcagctg 1200
caggagtacg ccgacgccga tctgtctgtg gtggagaagc tgaaggagat catcatccag 1260
aaggtggatg agatctacaa ggtgtatggc tcctctgaga agctgttcga cgccgatttt 1320
gtgctggaga agagcctgaa gaagaacgac gccgtggtgg ccatcatgaa ggacctgctg 1380
gattctgtga agagcttcga gaattacatc aaggccttct ttggcgaggg caaggagaca 1440
aacagggacg agtccttcta tggcgatttt gtgctggcct acgacatcct gctgaaggtg 1500
gaccacatct acgatgccat ccgcaattat gtgacccaga agccctactc taaggataag 1560
ttcaagctgt attttcagaa ccctcagttc atgggcggct gggacaagga taaggagaca 1620
gactatcggg ccaccatcct gagatacggc tccaagtact atctggccat catggataag 1680
aagtacgcca agtgcctgca gaagatcgac aaggacgatg tgaacggcaa ttacgagaag 1740
atcaactata agctgctgcc cggccctaat aagatgctgc caaaggtgtt cttttctaag 1800
aagtggatgg cctactataa ccccagcgag gacatccaga agatctacaa gaatggcaca 1860
ttcaagaagg gcgatatgtt taacctgaat gactgtcaca agctgatcga cttctttaag 1920
gatagcatct cccggtatcc aaagtggtcc aatgcctacg atttcaactt ttctgagaca 1980
gagaagtata aggacatcgc cggcttttac agagaggtgg aggagcaggg ctataaggtg 2040
agcttcgagt ctgccagcaa gaaggaggtg gataagctgg tggaggaggg caagctgtat 2100
atgttccaga tctataacaa ggacttttcc gataagtctc acggcacacc caatctgcac 2160
accatgtact tcaagctgct gtttgacgag aacaatcacg gacagatcag gctgagcgga 2220
ggagcagagc tgttcatgag gcgcgcctcc ctgaagaagg aggagctggt ggtgcaccca 2280
gccaactccc ctatcgccaa caagaatcca gataatccca agaaaaccac aaccctgtcc 2340
tacgacgtgt ataaggataa gaggttttct gaggaccagt acgagctgca catcccaatc 2400
gccatcaata agtgccccaa gaacatcttc aagatcaata cagaggtgcg cgtgctgctg 2460
aagcacgacg ataaccccta tgtgatcggc atcgataggg gcgagcgcaa tctgctgtat 2520
atcgtggtgg tggacggcaa gggcaacatc gtggagcagt attccctgaa cgagatcatc 2580
aacaacttca acggcatcag gatcaagaca gattaccact ctctgctgga caagaaggag 2640
aaggagaggt tcgaggcccg ccagaactgg acctccatcg agaatatcaa ggagctgaag 2700
gccggctata tctctcaggt ggtgcacaag atctgcgagc tggtggagaa gtacgatgcc 2760
gtgatcgccc tggaggacct gaactctggc tttaagaata gccgcgtgaa ggtggagaag 2820
caggtgtatc agaagttcga gaagatgctg atcgataagc tgaactacat ggtggacaag 2880
aagtctaatc cttgtgcaac aggcggcgcc ctgaagggct atcagatcac caataagttc 2940
gagagcttta agtccatgtc tacccagaac ggcttcatct tttacatccc tgcctggctg 3000
acatccaaga tcgatccatc taccggcttt gtgaacctgc tgaaaaccaa gtataccagc 3060
atcgccgatt ccaagaagtt catcagctcc tttgacagga tcatgtacgt gcccgaggag 3120
gatctgttcg agtttgccct ggactataag aacttctctc gcacagacgc cgattacatc 3180
aagaagtgga agctgtactc ctacggcaac cggatcagaa tcttccggaa tcctaagaag 3240
aacaacgtgt tcgactggga ggaggtgtgc ctgaccagcg cctataagga gctgttcaac 3300
aagtacggca tcaattatca gcagggcgat atcagagccc tgctgtgcga gcagtccgac 3360
aaggccttct actctagctt tatggccctg atgagcctga tgctgcagat gcggaacagc 3420
atcacaggcc gcaccgacgt ggattttctg atcagccctg tgaagaactc cgacggcatc 3480
ttctacgata gccggaacta tgaggcccag gagaatgcca tcctgccaaa gaacgccgac 3540
gccaatggcg cctataacat cgccagaaag gtgctgtggg ccatcggcca gttcaagaag 3600
gccgaggacg agaagctgga taaggtgaag atcgccatct ctaacaagga gtggctggag 3660
tacgcccaga ccagcgtgaa gcac 3684
<210> 117
<211> 3900
<212> DNA
<213> 土拉弗朗西斯菌(Francisella tularensis)
<400> 117
atgagcatct accaggagtt cgtcaacaag tattcactga gtaagacact gcggttcgag 60
ctgatcccac agggcaagac actggagaac atcaaggccc gaggcctgat tctggacgat 120
gagaagcggg caaaagacta taagaaagcc aagcagatca ttgataaata ccaccagttc 180
tttatcgagg aaattctgag ctccgtgtgc atcagtgagg atctgctgca gaattactca 240
gacgtgtact tcaagctgaa gaagagcgac gatgacaacc tgcagaagga cttcaagtcc 300
gccaaggaca ccatcaagaa acagattagc gagtacatca aggactccga aaagtttaaa 360
aatctgttca accagaatct gatcgatgct aagaaaggcc aggagtccga cctgatcctg 420
tggctgaaac agtctaagga caatgggatt gaactgttca aggctaactc cgatatcact 480
gatattgacg aggcactgga aatcatcaag agcttcaagg gatggaccac atactttaaa 540
ggcttccacg agaaccgcaa gaacgtgtac tccagcaacg acattcctac ctccatcatc 600
taccgaatcg tcgatgacaa tctgccaaag ttcctggaga acaaggccaa atatgaatct 660
ctgaaggaca aagctcccga ggcaattaat tacgaacaga tcaagaaaga tctggctgag 720
gaactgacat tcgatatcga ctataagact agcgaggtga accagagggt cttttccctg 780
gacgaggtgt ttgaaatcgc caatttcaac aattacctga accagtccgg cattactaaa 840
ttcaatacca tcattggcgg gaagtttgtg aacggggaga ataccaagcg caagggaatt 900
aacgaataca tcaatctgta tagccagcag atcaacgaca aaactctgaa gaaatacaag 960
atgtctgtgc tgttcaaaca gatcctgagt gataccgagt ccaagtcttt tgtcattgat 1020
aaactggaag atgactcaga cgtggtcact accatgcaga gcttttatga gcagatcgcc 1080
gctttcaaga cagtggagga aaaatctatt aaggaaactc tgagtctgct gttcgatgac 1140
ctgaaagccc agaagctgga cctgagtaag atctacttca aaaacgataa gagtctgaca 1200
gacctgtcac agcaggtgtt tgatgactat tccgtgattg ggaccgccgt cctggagtac 1260
attacacagc agatcgctcc aaagaacctg gataatccct ctaagaaaga gcaggaactg 1320
atcgctaaga aaaccgagaa ggcaaaatat ctgagtctgg aaacaattaa gctggcactg 1380
gaggagttca acaagcacag ggatattgac aaacagtgcc gctttgagga aatcctggcc 1440
aacttcgcag ccatccccat gatttttgat gagatcgccc agaacaaaga caatctggct 1500
cagatcagta ttaagtacca gaaccagggc aagaaagacc tgctgcaggc ttcagcagaa 1560
gatgacgtga aagccatcaa ggatctgctg gaccagacca acaatctgct gcacaagctg 1620
aaaatcttcc atattagtca gtcagaggat aaggctaata tcctggataa agacgaacac 1680
ttctacctgg tgttcgagga atgttacttc gagctggcaa acattgtccc cctgtataac 1740
aagattagga actacatcac acagaagcct tactctgacg agaagtttaa actgaacttc 1800
gaaaatagta ccctggccaa cgggtgggat aagaacaagg agcctgacaa cacagctatc 1860
ctgttcatca aggatgacaa gtactatctg ggagtgatga ataagaaaaa caataagatc 1920
ttcgatgaca aagccattaa ggagaacaaa ggggaaggat acaagaaaat cgtgtataag 1980
ctgctgcccg gcgcaaataa gatgctgcct aaggtgttct tcagcgccaa gagtatcaaa 2040
ttctacaacc catccgagga catcctgcgg attagaaatc actcaacaca tactaagaac 2100
gggagccccc agaagggata tgagaaattt gagttcaaca tcgaggattg caggaagttt 2160
attgacttct acaagcagag catctccaaa caccctgaat ggaaggattt tggcttccgg 2220
ttttccgaca cacagagata taactctatc gacgagttct accgcgaggt ggaaaatcag 2280
gggtataagc tgacttttga gaacatttct gaaagttaca tcgacagcgt ggtcaatcag 2340
ggaaagctgt acctgttcca gatctataac aaagattttt cagcatacag caagggcaga 2400
ccaaacctgc atacactgta ctggaaggcc ctgttcgatg agaggaatct gcaggacgtg 2460
gtctataaac tgaacggaga ggccgaactg ttttaccgga agcagtctat tcctaagaaa 2520
atcactcacc cagctaagga ggccatcgct aacaagaaca aggacaatcc taagaaagag 2580
agcgtgttcg aatacgatct gattaaggac aagcggttca ccgaagataa gttctttttc 2640
cattgtccaa tcaccattaa cttcaagtca agcggcgcta acaagttcaa cgacgagatc 2700
aatctgctgc tgaaggaaaa agcaaacgat gtgcacatcc tgagcattga ccgaggagag 2760
cggcatctgg cctactatac cctggtggat ggcaaaggga atatcattaa gcaggataca 2820
ttcaacatca ttggcaatga ccggatgaaa accaactacc acgataaact ggctgcaatc 2880
gagaaggata gagactcagc taggaaggac tggaagaaaa tcaacaacat taaggagatg 2940
aaggaaggct atctgagcca ggtggtccat gagattgcaa agctggtcat cgaatacaat 3000
gccattgtgg tgttcgagga tctgaacttc ggctttaaga gggggcgctt taaggtggaa 3060
aaacaggtct atcagaagct ggagaaaatg ctgatcgaaa agctgaatta cctggtgttt 3120
aaagataacg agttcgacaa gaccggaggc gtcctgagag cctaccagct gacagctccc 3180
tttgaaactt tcaagaaaat gggaaaacag acaggcatca tctactatgt gccagccgga 3240
ttcacttcca agatctgccc cgtgaccggc tttgtcaacc agctgtaccc taaatatgag 3300
tcagtgagca agtcccagga atttttcagc aagttcgata agatctgtta taatctggac 3360
aaggggtact tcgagttttc cttcgattac aagaacttcg gcgacaaggc cgctaagggg 3420
aaatggacca ttgcctcctt cggatctcgc ctgatcaact ttcgaaattc cgataaaaac 3480
cacaattggg acactaggga ggtgtaccca accaaggagc tggaaaagct gctgaaagac 3540
tactctatcg agtatggaca tggcgaatgc atcaaggcag ccatctgtgg cgagagtgat 3600
aagaaatttt tcgccaagct gacctcagtg ctgaatacaa tcctgcagat gcggaactca 3660
aagaccggga cagaactgga ctatctgatt agccccgtgg ctgatgtcaa cggaaacttc 3720
ttcgacagca gacaggcacc caaaaatatg cctcaggatg cagacgccaa cggggcctac 3780
cacatcgggc tgaagggact gatgctgctg ggccggatca agaacaatca ggaggggaag 3840
aagctgaacc tggtcattaa gaacgaggaa tacttcgagt ttgtccagaa tagaaataac 3900
<210> 118
<211> 4431
<212> DNA
<213> 异域菌门(Peregrinibacteria)
<400> 118
atgtccaact tctttaagaa tttcaccaac ctgtatgagc tgtccaagac actgaggttt 60
gagctgaagc ccgtgggcga caccctgaca aacatgaagg accacctgga gtacgatgag 120
aagctgcaga ccttcctgaa ggatcagaat atcgacgatg cctatcaggc cctgaagcct 180
cagttcgacg agatccacga ggagtttatc acagattctc tggagagcaa gaaggccaag 240
gagatcgact tctccgagta cctggatctg tttcaggaga agaaggagct gaacgactct 300
gagaagaagc tgcgcaacaa gatcggcgag acattcaaca aggccggcga gaagtggaag 360
aaggagaagt accctcagta tgagtggaag aagggctcca agatcgccaa tggcgccgac 420
atcctgtctt gccaggatat gctgcagttt atcaagtata agaacccaga ggatgagaag 480
atcaagaatt acatcgacga tacactgaag ggcttcttta cctatttcgg cggctttaat 540
cagaacaggg ccaactacta tgagacaaag aaggaggcct ccaccgcagt ggcaacaagg 600
atcgtgcacg agaacctgcc aaagttctgt gacaatgtga tccagtttaa gcacatcatc 660
aagcggaaga aggatggcac cgtggagaaa accgagagaa agaccgagta cctgaacgcc 720
taccagtatc tgaagaacaa taacaagatc acacagatca aggacgccga gacagagaag 780
atgatcgagt ctacacccat cgccgagaag atcttcgacg tgtactactt cagcagctgc 840
ctgagccaga agcagatcga ggagtacaac cggatcatcg gccactataa tctgctgatc 900
aacctgtata accaggccaa gagatctgag ggcaagcacc tgagcgccaa cgagaagaag 960
tataaggacc tgcctaagtt caagaccctg tataagcaga tcggctgcgg caagaagaag 1020
gacctgtttt acacaatcaa gtgtgatacc gaggaggagg ccaataagtc ccggaacgag 1080
ggcaaggagt cccactctgt ggaggagatc atcaacaagg cccaggaggc catcaataag 1140
tacttcaagt ctaataacga ctgtgagaat atcaacaccg tgcccgactt catcaactat 1200
atcctgacaa aggagaatta cgagggcgtg tattggagca aggccgccat gaacaccatc 1260
tccgacaagt acttcgccaa ttatcacgac ctgcaggata gactgaagga ggccaaggtg 1320
tttcagaagg ccgataagaa gtccgaggac gatatcaaga tcccagaggc catcgagctg 1380
tctggcctgt tcggcgtgct ggacagcctg gccgattggc agaccacact gtttaagtct 1440
agcatcctga gcaacgagga caagctgaag atcatcacag attcccagac cccctctgag 1500
gccctgctga agatgatctt caatgacatc gagaagaaca tggagtcctt tctgaaggag 1560
acaaacgata tcatcaccct gaagaagtat aagggcaata aggagggcac cgagaagatc 1620
aagcagtggt tcgactatac actggccatc aaccggatgc tgaagtactt tctggtgaag 1680
gagaataaga tcaagggcaa ctccctggat accaatatct ctgaggccct gaaaaccctg 1740
atctacagcg acgatgccga gtggttcaag tggtacgacg ccctgagaaa ctatctgacc 1800
cagaagcctc aggatgaggc caaggagaat aagctgaagc tgaatttcga caacccatct 1860
ctggccggcg gctgggatgt gaacaaggag tgcagcaatt tttgcgtgat cctgaaggac 1920
aagaacgaga agaagtacct ggccatcatg aagaagggcg agaataccct gttccagaag 1980
gagtggacag agggccgggg caagaacctg acaaagaagt ctaatccact gttcgagatc 2040
aataactgcg agatcctgag caagatggag tatgactttt gggccgacgt gagcaagatg 2100
atccccaagt gtagcaccca gctgaaggcc gtggtgaacc acttcaagca gtccgacaat 2160
gagttcatct ttcctatcgg ctacaaggtg acaagcggcg agaagtttag ggaggagtgc 2220
aagatctcca agcaggactt cgagctgaat aacaaggtgt ttaataagaa cgagctgagc 2280
gtgaccgcca tgcgctacga tctgtcctct acacaggaga agcagtatat caaggccttc 2340
cagaaggagt actgggagct gctgtttaag caggagaagc gggacaccaa gctgacaaat 2400
aacgagatct tcaacgagtg gatcaatttt tgcaacaaga agtatagcga gctgctgtcc 2460
tgggagagaa agtacaagga tgccctgacc aattggatca acttctgtaa gtactttctg 2520
agcaagtatc ccaagaccac actgttcaac tactctttta aggagagcga gaattataac 2580
tccctggacg agttctaccg ggacgtggat atctgttctt acaagctgaa tatcaacacc 2640
acaatcaata agagcatcct ggatagactg gtggaggagg gcaagctgta cctgtttgag 2700
atcaagaatc aggacagcaa cgatggcaag tccatcggcc acaagaataa cctgcacacc 2760
atctactgga acgccatctt cgagaatttt gacaacaggc ctaagctgaa tggcgaggcc 2820
gagatcttct atcgcaaggc catctccaag gataagctgg gcatcgtgaa gggcaagaaa 2880
accaagaacg gcaccgagat catcaagaat tacagattca gcaaggagaa gtttatcctg 2940
cacgtgccaa tcaccctgaa cttctgctcc aataacgagt atgtgaatga catcgtgaac 3000
acaaagttct acaatttttc caacctgcac tttctgggca tcgatagggg cgagaagcac 3060
ctggcctact attctctggt gaataagaac ggcgagatcg tggaccaggg cacactgaac 3120
ctgcctttca ccgacaagga tggcaatcag cgcagcatca agaaggagaa gtacttttat 3180
aacaagcagg aggacaagtg ggaggccaag gaggtggatt gttggaatta taacgacctg 3240
ctggatgcca tggcctctaa ccgggacatg gccagaaaga attggcagag gatcggcacc 3300
atcaaggagg ccaagaacgg ctacgtgagc ctggtcatca ggaagatcgc cgatctggcc 3360
gtgaataacg agcgccccgc cttcatcgtg ctggaggacc tgaatacagg ctttaagcgg 3420
tccagacaga agatcgataa gagcgtgtac cagaagttcg agctggccct ggccaagaag 3480
ctgaactttc tggtggacaa gaatgccaag cgcgatgaga tcggctcccc tacaaaggcc 3540
ctgcagctga ccccccctgt gaataactac ggcgacattg agaacaagaa gcaggccggc 3600
atcatgctgt atacccgggc caattatacc tctcagacag atccagccac aggctggaga 3660
aagaccatct atctgaaggc cggccccgag gagacaacat acaagaagga cggcaagatc 3720
aagaacaaga gcgtgaagga ccagatcatc gagacattca ccgatatcgg ctttgacggc 3780
aaggattact atttcgagta cgacaagggc gagtttgtgg atgagaaaac cggcgagatc 3840
aagcccaaga agtggcggct gtactccggc gagaatggca agtccctgga caggttccgc 3900
ggagagaggg agaaggataa gtatgagtgg aagatcgaca agatcgatat cgtgaagatc 3960
ctggacgatc tgttcgtgaa ttttgacaag aacatcagcc tgctgaagca gctgaaggag 4020
ggcgtggagc tgacccggaa taacgagcac ggcacaggcg agtccctgag attcgccatc 4080
aacctgatcc agcagatccg gaataccggc aataacgaga gagacaacga tttcatcctg 4140
tccccagtga gggacgagaa tggcaagcac tttgactctc gcgagtactg ggataaggag 4200
acaaagggcg agaagatcag catgcccagc tccggcgatg ccaatggcgc cttcaacatc 4260
gcccggaagg gcatcatcat gaacgcccac atcctggcca atagcgactc caaggatctg 4320
tccctgttcg tgtctgacga ggagtgggat ctgcacctga ataacaagac cgagtggaag 4380
aagcagctga acatcttttc tagcaggaag gccatggcca agcgcaagaa g 4431
<210> 119
<211> 4056
<212> DNA
<213> 俭菌总门(Parcubacteria)
<400> 119
atggagaaca tcttcgacca gtttatcggc aagtacagcc tgtccaagac cctgagattc 60
gagctgaagc ccgtgggcaa gacagaggac ttcctgaaga tcaacaaggt gtttgagaag 120
gatcagacca tcgacgatag ctacaatcag gccaagttct attttgattc cctgcaccag 180
aagtttatcg acgccgccct ggcctccgat aagacatccg agctgtcttt ccagaacttt 240
gccgacgtgc tggagaagca gaataagatc atcctggata agaagagaga gatgggcgcc 300
ctgaggaagc gcgacaagaa cgccgtgggc atcgataggc tgcagaagga gatcaatgac 360
gccgaggata tcatccagaa ggagaaggag aagatctaca aggacgtgcg caccctgttc 420
gataacgagg ccgagtcttg gaaaacctac tatcaggagc gggaggtgga cggcaagaag 480
atcaccttca gcaaggccga cctgaagcag aagggcgccg attttctgac agccgccggc 540
atcctgaagg tgctgaagta tgagttcccc gaggagaagg agaaggagtt tcaggccaag 600
aaccagccct ccctgttcgt ggaggagaag gagaatcctg gccagaagag gtacatcttc 660
gactcttttg ataagttcgc cggctatctg accaagtttc agcagacaaa gaagaatctg 720
tacgcagcag acggcaccag cacagcagtg gccacccgca tcgccgataa ctttatcatc 780
ttccaccaga ataccaaggt gttccgggac aagtacaaga acaatcacac agacctgggc 840
ttcgatgagg agaacatctt tgagatcgag aggtataaga attgcctgct gcagcgcgag 900
atcgagcaca tcaagaatga gaatagctac aacaagatca tcggccggat caataagaag 960
atcaaggagt atcgggacca gaaggccaag gataccaagc tgacaaagtc cgacttccct 1020
ttctttaaga acctggataa gcagatcctg ggcgaggtgg agaaggagaa gcagctgatc 1080
gagaaaaccc gggagaaaac cgaggaggac gtgctgatcg agcggttcaa ggagttcatc 1140
gagaacaatg aggagaggtt caccgccgcc aagaagctga tgaatgcctt ctgtaacggc 1200
gagtttgagt ccgagtacga gggcatctat ctgaagaata aggccatcaa cacaatctcc 1260
cggagatggt tcgtgtctga cagagatttt gagctgaagc tgcctcagca gaagtccaag 1320
aacaagtctg agaagaatga gccaaaggtg aagaagttca tctccatcgc cgagatcaag 1380
aacgccgtgg aggagctgga cggcgatatc tttaaggccg tgttctacga caagaagatc 1440
atcgcccagg gcggctctaa gctggagcag ttcctggtca tctggaagta cgagtttgag 1500
tatctgttcc gggacatcga gagagagaac ggcgagaagc tgctgggcta tgatagctgc 1560
ctgaagatcg ccaagcagct gggcatcttc ccacaggaga aggaggcccg cgagaaggca 1620
accgccgtga tcaagaatta cgccgacgcc ggcctgggca tcttccagat gatgaagtat 1680
ttttctctgg acgataagga tcggaagaac acccccggcc agctgagcac aaatttctac 1740
gccgagtatg acggctacta caaggatttc gagtttatca agtactacaa cgagtttagg 1800
aacttcatca ccaagaagcc tttcgacgag gataagatca agctgaactt tgagaatggc 1860
gccctgctga agggctggga cgagaacaag gagtacgatt tcatgggcgt gatcctgaag 1920
aaggagggcc gcctgtatct gggcatcatg cacaagaacc accggaagct gtttcagtcc 1980
atgggcaatg ccaagggcga caacgccaat agataccaga agatgatcta taagcagatc 2040
gccgacgcct ctaaggatgt gcccaggctg ctgctgacca gcaagaaggc catggagaag 2100
ttcaagcctt cccaggagat cctgagaatc aagaaggaga aaaccttcaa gcgggagagc 2160
aagaactttt ccctgagaga tctgcacgcc ctgatcgagt actataggaa ctgcatccct 2220
cagtacagca attggtcctt ttatgacttc cagtttcagg ataccggcaa gtaccagaat 2280
atcaaggagt tcacagacga tgtgcagaag tacggctata agatctcctt tcgcgacatc 2340
gacgatgagt atatcaatca ggccctgaac gagggcaaga tgtacctgtt cgaggtggtg 2400
aacaaggata tctataacac caagaatggc tccaagaatc tgcacacact gtactttgag 2460
cacatcctgt ctgccgagaa cctgaatgac ccagtgttca agctgtctgg catggccgag 2520
atctttcagc ggcagcccag cgtgaacgaa agagagaaga tcaccacaca gaagaatcag 2580
tgtatcctgg acaagggcga tagagcctac aagtataggc gctacaccga gaagaagatc 2640
atgttccaca tgagcctggt gctgaacaca ggcaagggcg agatcaagca ggtgcagttt 2700
aataagatca tcaaccagag gatcagctcc tctgacaacg agatgagggt gaatgtgatc 2760
ggcatcgatc gcggcgagaa gaacctgctg tactatagcg tggtgaagca gaatggcgag 2820
atcatcgagc aggcctccct gaacgagatc aatggcgtga actaccggga caagctgatc 2880
gagagggaga aggagcgcct gaagaaccgg cagagctgga agcctgtggt gaagatcaag 2940
gatctgaaga agggctacat ctcccacgtg atccacaaga tctgccagct gatcgagaag 3000
tattctgcca tcgtggtgct ggaggacctg aatatgagat tcaagcagat caggggagga 3060
atcgagcgga gcgtgtacca gcagttcgag aaggccctga tcgataagct gggctatctg 3120
gtgtttaagg acaacaggga tctgagggca ccaggaggcg tgctgaatgg ctaccagctg 3180
tctgccccct ttgtgagctt cgagaagatg cgcaagcaga ccggcatcct gttctacaca 3240
caggccgagt ataccagcaa gacagaccca atcaccggct ttcggaagaa cgtgtatatc 3300
tctaatagcg cctccctgga taagatcaag gaggccgtga agaagttcga cgccatcggc 3360
tgggatggca aggagcagtc ttacttcttt aagtacaacc cttacaacct ggccgacgag 3420
aagtataaga actctaccgt gagcaaggag tgggccatct ttgccagcgc cccaagaatc 3480
cggagacaga agggcgagga cggctactgg aagtatgata gggtgaaagt gaatgaggag 3540
ttcgagaagc tgctgaaggt ctggaatttt gtgaacccaa aggccacaga tatcaagcag 3600
gagatcatca agaaggagaa ggcaggcgac ctgcagggag agaaggagct ggatggccgg 3660
ctgagaaact tttggcactc tttcatctac ctgtttaacc tggtgctgga gctgcgcaat 3720
tctttcagcc tgcagatcaa gatcaaggca ggagaagtga tcgcagtgga cgagggcgtg 3780
gacttcatcg ccagcccagt gaagcccttc tttaccacac ccaaccctta catcccctcc 3840
aacctgtgct ggctggccgt ggagaatgca gacgcaaacg gagcctataa tatcgccagg 3900
aagggcgtga tgatcctgaa gaagatccgc gagcacgcca agaaggaccc cgagttcaag 3960
aagctgccaa acctgtttat cagcaatgca gagtgggacg aggcagcccg ggattggggc 4020
aagtacgcag gcaccacagc cctgaacctg gaccac 4056
<210> 120
<211> 3618
<212> DNA
<213> 毛螺菌科细菌(Lachnospiraceae bacterium)
<400> 120
atgtactatg agtccctgac caagcagtac cccgtgtcta agacaatccg gaatgagctg 60
atccctatcg gcaagacact ggataacatc cgccagaaca atatcctgga gagcgacgtg 120
aagcggaagc agaactacga gcacgtgaag ggcatcctgg atgagtatca caagcagctg 180
atcaacgagg ccctggacaa ttgcaccctg ccatccctga agatcgccgc cgagatctac 240
ctgaagaatc agaaggaggt gtctgacaga gaggatttca acaagacaca ggacctgctg 300
aggaaggagg tggtggagaa gctgaaggcc cacgagaact ttaccaagat cggcaagaag 360
gacatcctgg atctgctgga gaagctgcct tccatctctg aggacgatta caatgccctg 420
gagagcttcc gcaactttta cacctatttc acatcctaca acaaggtgcg ggagaatctg 480
tattctgata aggagaagag ctccacagtg gcctacagac tgatcaacga gaatttccca 540
aagtttctgg acaatgtgaa gagctatagg tttgtgaaaa ccgcaggcat cctggcagat 600
ggcctgggag aggaggagca ggactccctg ttcatcgtgg agacattcaa caagaccctg 660
acacaggacg gcatcgatac ctacaattct caagtgggca agatcaactc tagcatcaat 720
ctgtataacc agaagaatca gaaggccaat ggcttcagaa agatccccaa gatgaagatg 780
ctgtataagc agatcctgtc cgatagggag gagtctttca tcgacgagtt tcagagcgat 840
gaggtgctga tcgacaacgt ggagtcttat ggcagcgtgc tgatcgagtc tctgaagtcc 900
tctaaggtga gcgccttctt tgatgccctg agagagtcta agggcaagaa cgtgtacgtg 960
aagaatgacc tggccaagac agccatgagc aacatcgtgt tcgagaattg gaggaccttt 1020
gacgatctgc tgaaccagga gtacgacctg gccaacgaga acaagaagaa ggacgataag 1080
tatttcgaga agcgccagaa ggagctgaag aagaataaga gctactccct ggagcacctg 1140
tgcaacctgt ccgaggattc ttgtaacctg atcgagaatt atatccacca gatctccgac 1200
gatatcgaga atatcatcat caacaatgag acattcctgc gcatcgtgat caatgagcac 1260
gacaggtccc gcaagctggc caagaaccgg aaggccgtga aggccatcaa ggactttctg 1320
gattctatca aggtgctgga gcgggagctg aagctgatca acagctccgg ccaggagctg 1380
gagaaggatc tgatcgtgta ctctgcccac gaggagctgc tggtggagct gaagcaggtg 1440
gacagcctgt ataacatgac cagaaattat ctgacaaaga agcctttctc taccgagaag 1500
gtgaagctga actttaatcg cagcacactg ctgaacggct gggatcggaa taaggagaca 1560
gacaacctgg gcgtgctgct gctgaaggac ggcaagtact atctgggcat catgaacaca 1620
agcgccaata aggccttcgt gaatccccct gtggccaaga ccgagaaggt gtttaagaag 1680
gtggattaca agctgctgcc agtgcccaac cagatgctgc caaaggtgtt ctttgccaag 1740
agcaatatcg acttctataa cccctctagc gagatctact ccaattataa gaagggcacc 1800
cacaagaagg gcaatatgtt ttccctggag gattgtcaca acctgatcga cttctttaag 1860
gagtctatca gcaagcacga ggactggagc aagttcggct ttaagttcag cgatacagcc 1920
tcctacaacg acatctccga gttctatcgc gaggtggaga agcagggcta caagctgacc 1980
tatacagaca tcgatgagac atacatcaat gatctgatcg agcggaacga gctgtacctg 2040
ttccagatct ataataagga ctttagcatg tactccaagg gcaagctgaa cctgcacaca 2100
ctgtatttca tgatgctgtt tgatcagcgc aatatcgacg acgtggtgta taagctgaac 2160
ggagaggcag aggtgttcta taggccagcc tccatctctg aggacgagct gatcatccac 2220
aaggccggcg aggagatcaa gaacaagaat cctaaccggg ccagaaccaa ggagacaagc 2280
accttcagct acgacatcgt gaaggataag cggtatagca aggataagtt taccctgcac 2340
atccccatca caatgaactt cggcgtggat gaggtgaagc ggttcaacga cgccgtgaac 2400
agcgccatcc ggatcgatga gaatgtgaac gtgatcggca tcgaccgggg cgagagaaat 2460
ctgctgtacg tggtggtcat cgactctaag ggcaacatcc tggagcagat ctccctgaac 2520
tctatcatca ataaggagta cgacatcgag acagattatc acgcactgct ggatgagagg 2580
gagggcggca gagataaggc ccggaaggac tggaacaccg tggagaatat cagggacctg 2640
aaggccggct acctgagcca ggtggtgaac gtggtggcca agctggtgct gaagtataat 2700
gccatcatct gcctggagga cctgaacttt ggcttcaaga ggggccgcca gaaggtggag 2760
aagcaggtgt accagaagtt cgagaagatg ctgatcgata agctgaatta cctggtcatc 2820
gacaagagcc gcgagcagac atcccctaag gagctgggag gcgccctgaa cgcactgcag 2880
ctgacctcta agttcaagag ctttaaggag ctgggcaagc agtccggcgt gatctactat 2940
gtgcctgcct acctgacctc taagatcgat ccaaccacag gcttcgccaa tctgttttat 3000
atgaagtgtg agaacgtgga gaagtccaag agattctttg acggctttga tttcatcagg 3060
ttcaacgccc tggagaacgt gttcgagttc ggctttgact accggagctt cacccagagg 3120
gcctgcggca tcaattccaa gtggaccgtg tgcaccaacg gcgagcgcat catcaagtat 3180
cggaatccag ataagaacaa tatgttcgac gagaaggtgg tggtggtgac cgatgagatg 3240
aagaacctgt ttgagcagta caagatcccc tatgaggatg gcagaaatgt gaaggacatg 3300
atcatcagca acgaggaggc cgagttctac cggagactgt ataggctgct gcagcagacc 3360
ctgcagatga gaaacagcac ctccgacggc acaagggatt acatcatctc ccctgtgaag 3420
aataagagag aggcctactt caacagcgag ctgtccgacg gctctgtgcc aaaggacgcc 3480
gatgccaacg gcgcctacaa tatcgccaga aagggcctgt gggtgctgga gcagatcagg 3540
cagaagagcg agggcgagaa gatcaatctg gccatgacca acgccgagtg gctggagtat 3600
gcccagacac acctgctg 3618
<210> 121
<211> 3714
<212> DNA
<213> Candidatus Methanoplasma termitum
<400> 121
atgaacaatt acgacgagtt caccaagctg tatcctatcc agaaaaccat ccggtttgag 60
ctgaagccac agggcagaac catggagcac ctggagacat tcaacttctt tgaggaggac 120
cgggatagag ccgagaagta taagatcctg aaggaggcca tcgacgagta ccacaagaag 180
tttatcgatg agcacctgac caatatgtcc ctggattgga actctctgaa gcagatcagc 240
gagaagtact ataagagcag ggaggagaag gacaagaagg tgttcctgtc cgagcagaag 300
aggatgcgcc aggagatcgt gtctgagttt aagaaggacg atcgcttcaa ggacctgttt 360
tccaagaagc tgttctctga gctgctgaag gaggagatct acaagaaggg caaccaccag 420
gagatcgacg ccctgaagag cttcgataag ttttccggct atttcatcgg cctgcacgag 480
aataggaaga acatgtactc cgacggcgat gagatcaccg ccatctccaa tcgcatcgtg 540
aatgagaact tccccaagtt tctggataac ctgcagaagt accaggaggc caggaagaag 600
tatcctgagt ggatcatcaa ggccgagagc gccctggtgg cccacaatat caagatggac 660
gaggtgttct ccctggagta ctttaataag gtgctgaacc aggagggcat ccagcggtac 720
aacctggccc tgggcggcta tgtgaccaag agcggcgaga agatgatggg cctgaatgat 780
gccctgaacc tggcccacca gtccgagaag agctccaagg gcagaatcca catgaccccc 840
ctgttcaagc agatcctgtc cgagaaggag tccttctctt acatccccga cgtgtttaca 900
gaggattctc agctgctgcc tagcatcggc ggcttctttg cccagatcga gaatgacaag 960
gatggcaaca tcttcgaccg ggccctggag ctgatctcta gctacgccga gtatgatacc 1020
gagcggatct atatcagaca ggccgacatc aatagagtgt ccaacgtgat ctttggagag 1080
tggggcaccc tgggaggcct gatgagggag tacaaggccg actctatcaa tgatatcaac 1140
ctggagcgca catgcaagaa ggtggacaag tggctggatt ctaaggagtt tgccctgagc 1200
gatgtgctgg aggccatcaa gaggaccggc aacaatgacg ccttcaacga gtatatctcc 1260
aagatgcgga cagccagaga gaagatcgat gccgcccgca aggagatgaa gttcatcagc 1320
gagaagatct ccggcgatga ggagtctatc cacatcatca agaccctgct ggacagcgtg 1380
cagcagttcc tgcacttctt taatctgttt aaggcaaggc aggacatccc actggatgga 1440
gccttctacg ccgagtttga cgaggtgcac agcaagctgt ttgccatcgt gcccctgtat 1500
aacaaggtgc ggaactatct gaccaagaac aatctgaaca caaagaagat caagctgaat 1560
ttcaagaacc ctacactggc caatggctgg gaccagaaca aggtgtacga ttatgcctcc 1620
ctgatctttc tgcgggacgg caattactat ctgggcatca tcaatcctaa gagaaagaag 1680
aacatcaagt tcgagcaggg ctctggcaac ggccccttct accggaagat ggtgtataag 1740
cagatccccg gccctaataa gaacctgcca agagtgttcc tgacctccac aaagggcaag 1800
aaggagtata agccctctaa ggagatcatc gagggctacg aggccgacaa gcacatcagg 1860
ggcgataagt tcgacctgga tttttgtcac aagctgatcg atttctttaa ggagtccatc 1920
gagaagcaca aggactggtc taagttcaac ttctacttca gcccaaccga gagctatggc 1980
gacatctctg agttctacct ggatgtggag aagcagggct atcgcatgca ctttgagaat 2040
atcagcgccg agacaatcga cgagtatgtg gagaagggcg atctgtttct gttccagatc 2100
tacaacaagg attttgtgaa ggccgccacc ggcaagaagg acatgcacac aatctactgg 2160
aatgccgcct tcagccccga gaacctgcag gacgtggtgg tgaagctgaa cggcgaggcc 2220
gagctgtttt atagggacaa gtccgatatc aaggagatcg tgcaccgcga gggcgagatc 2280
ctggtgaata ggacctacaa cggccgcaca ccagtgcccg acaagatcca caagaagctg 2340
accgattatc acaatggccg gacaaaggac ctgggcgagg ccaaggagta cctggataag 2400
gtgagatact tcaaggccca ctatgacatc accaaggatc ggagatacct gaacgacaag 2460
atctatttcc acgtgcctct gaccctgaac ttcaaggcca acggcaagaa gaatctgaac 2520
aagatggtca tcgagaagtt cctgtccgat gagaaggccc acatcatcgg catcgacagg 2580
ggcgagcgca atctgctgta ctattccatc atcgacaggt ctggcaagat catcgatcag 2640
cagagcctga atgtgatcga cggctttgat tatcgggaga agctgaacca gagagagatc 2700
gagatgaagg atgcccgcca gtcttggaac gccatcggca agatcaagga cctgaaggag 2760
ggctacctga gcaaggccgt gcacgagatc accaagatgg ccatccagta taatgccatc 2820
gtggtcatgg aggagctgaa ctacggcttc aagcggggcc ggttcaaggt ggagaagcag 2880
atctatcaga agttcgagaa tatgctgatc gataagatga actacctggt gtttaaggac 2940
gcacctgatg agtccccagg aggcgtgctg aatgcctacc agctgacaaa cccactggag 3000
tctttcgcca agctgggcaa gcagaccggc atcctgtttt acgtgccagc cgcctataca 3060
tccaagatcg accccaccac aggcttcgtg aatctgttta acacctcctc taagacaaac 3120
gcccaggagc ggaaggagtt cctgcagaag tttgagagca tctcctattc tgccaaggat 3180
ggcggcatct ttgccttcgc ctttgactac agaaagttcg gcaccagcaa gacagatcac 3240
aagaacgtgt ggaccgccta tacaaacggc gagaggatgc gctacatcaa ggagaagaag 3300
cggaatgagc tgtttgaccc ttctaaggag atcaaggagg ccctgaccag ctccggcatc 3360
aagtacgatg gcggccagaa catcctgcca gacatcctga ggagcaacaa taacggcctg 3420
atctacacaa tgtattctag cttcatcgcc gccatccaga tgcgcgtgta cgacggcaag 3480
gaggattata tcatcagccc catcaagaac tccaagggcg agttctttag gaccgacccc 3540
aagaggcgcg agctgcctat cgacgccgat gccaatggcg cctacaacat cgccctgagg 3600
ggagagctga caatgagggc aatcgcagag aagttcgacc ctgatagcga gaagatggcc 3660
aagctggagc tgaagcacaa ggattggttc gagtttatgc agaccagagg cgac 3714
<210> 122
<211> 3846
<212> DNA
<213> 挑剔真杆菌(Eubacterium eligens)
<400> 122
atgaacggca ataggtccat cgtgtaccgc gagttcgtgg gcgtgatccc cgtggccaag 60
accctgagga atgagctgcg ccctgtgggc cacacacagg agcacatcat ccagaacggc 120
ctgatccagg aggacgagct gcggcaggag aagagcaccg agctgaagaa catcatggac 180
gattactata gagagtacat cgataagtct ctgagcggcg tgaccgacct ggacttcacc 240
ctgctgttcg agctgatgaa cctggtgcag agctccccct ccaaggacaa taagaaggcc 300
ctggagaagg agcagtctaa gatgagggag cagatctgca cccacctgca gtccgactct 360
aactacaaga atatctttaa cgccaagctg ctgaaggaga tcctgcctga tttcatcaag 420
aactacaatc agtatgacgt gaaggataag gccggcaagc tggagacact ggccctgttt 480
aatggcttca gcacatactt taccgacttc tttgagaaga ggaagaacgt gttcaccaag 540
gaggccgtga gcacatccat cgcctaccgc atcgtgcacg agaactccct gatcttcctg 600
gccaatatga cctcttataa gaagatcagc gagaaggccc tggatgagat cgaagtgatc 660
gagaagaaca atcaggacaa gatgggcgat tgggagctga atcagatctt taaccctgac 720
ttctacaata tggtgctgat ccagtccggc atcgacttct acaacgagat ctgcggcgtg 780
gtgaatgccc acatgaacct gtactgtcag cagaccaaga acaattataa cctgttcaag 840
atgcggaagc tgcacaagca gatcctggcc tacaccagca ccagcttcga ggtgcccaag 900
atgttcgagg acgatatgag cgtgtataac gccgtgaacg ccttcatcga cgagacagag 960
aagggcaaca tcatcggcaa gctgaaggat atcgtgaata agtacgacga gctggatgag 1020
aagagaatct atatcagcaa ggacttttac gagacactga gctgcttcat gtccggcaac 1080
tggaatctga tcacaggctg cgtggagaac ttctacgatg agaacatcca cgccaagggc 1140
aagtccaagg aggagaaggt gaagaaggcc gtgaaggagg acaagtacaa gtctatcaat 1200
gacgtgaacg atctggtgga gaagtatatc gatgagaagg agaggaatga gttcaagaac 1260
agcaatgcca agcagtacat ccgcgagatc tccaacatca tcaccgacac agagacagcc 1320
cacctggagt atgacgatca catctctctg atcgagagcg aggagaaggc cgacgagatg 1380
aagaagcggc tggatatgta tatgaacatg taccactggg ccaaggcctt tatcgtggac 1440
gaggtgctgg acagagatga gatgttctac agcgatatcg acgatatcta taatatcctg 1500
gagaacatcg tgccactgta taatcgggtg agaaactacg tgacccagaa gccctacaac 1560
tctaagaaga tcaagctgaa tttccagagc cctacactgg ccaatggctg gtcccagtct 1620
aaggagttcg acaacaatgc catcatcctg atcagagata acaagtacta tctggccatc 1680
ttcaatgcca agaacaagcc agacaagaag atcatccagg gcaactccga taagaagaac 1740
gacaacgatt acaagaagat ggtgtataac ctgctgccag gcgccaacaa gatgctgccc 1800
aaggtgtttc tgtctaagaa gggcatcgag acattcaagc cctccgacta tatcatctct 1860
ggctacaacg cccacaagca catcaagaca agcgagaatt ttgatatctc cttctgtcgg 1920
gacctgatcg attacttcaa gaacagcatc gagaagcacg ccgagtggag aaagtatgag 1980
ttcaagtttt ccgccaccga cagctactcc gatatctctg agttctatcg ggaggtggag 2040
atgcagggct acagaatcga ctggacatat atcagcgagg ccgacatcaa caagctggat 2100
gaggagggca agatctatct gtttcagatc tacaataagg atttcgccga gaacagcacc 2160
ggcaaggaga atctgcacac aatgtacttt aagaacatct tctccgagga gaatctgaag 2220
gacatcatca tcaagctgaa cggccaggcc gagctgtttt atcggagagc ctctgtgaag 2280
aatcccgtga agcacaagaa ggatagcgtg ctggtgaaca agacctacaa gaatcagctg 2340
gacaacggcg acgtggtgag aatccccatc cctgacgata tctataacga gatctacaag 2400
atgtataatg gctacatcaa ggagtccgac ctgtctgagg ccgccaagga gtacctggat 2460
aaggtggagg tgaggaccgc ccagaaggac atcgtgaagg attaccgcta tacagtggac 2520
aagtacttca tccacacacc tatcaccatc aactataagg tgaccgcccg caacaatgtg 2580
aatgatatgg tggtgaagta catcgcccag aacgacgata tccacgtgat cggcatcgac 2640
cggggcgaga gaaacctgat ctacatctcc gtgatcgatt ctcacggcaa catcgtgaag 2700
cagaaatcct acaacatcct gaacaactac gactacaaga agaagctggt ggagaaggag 2760
aaaacccggg agtacgccag aaagaactgg aagagcatcg gcaatatcaa ggagctgaag 2820
gagggctata tctccggcgt ggtgcacgag atcgccatgc tgatcgtgga gtacaacgcc 2880
atcatcgcca tggaggacct gaattatggc tttaagaggg gccgcttcaa ggtggagcgg 2940
caggtgtacc agaagtttga gagcatgctg atcaataagc tgaactattt cgccagcaag 3000
gagaagtccg tggacgagcc aggaggcctg ctgaagggct atcagctgac ctacgtgccc 3060
gataatatca agaacctggg caagcagtgc ggcgtgatct tttacgtgcc tgccgccttc 3120
accagcaaga tcgacccatc cacaggcttt atctctgcct tcaactttaa gtctatcagc 3180
acaaatgcct ctcggaagca gttctttatg cagtttgacg agatcagata ctgtgccgag 3240
aaggatatgt tcagctttgg cttcgactac aacaacttcg atacctacaa catcacaatg 3300
ggcaagacac agtggaccgt gtatacaaac ggcgagagac tgcagtctga gttcaacaat 3360
gccaggcgca ccggcaagac aaagagcatc aatctgacag agacaatcaa gctgctgctg 3420
gaggacaatg agatcaacta cgccgacggc cacgatatca ggatcgatat ggagaagatg 3480
gacgaggata agaagagcga gttctttgcc cagctgctga gcctgtataa gctgaccgtg 3540
cagatgcgca attcctatac agaggccgag gagcaggaga acggcatctc ttacgacaag 3600
atcatcagcc ctgtgatcaa tgatgagggc gagttctttg actccgataa ctataaggag 3660
tctgacgata aggagtgcaa gatgccaaag gacgccgatg ccaacggcgc ctactgtatc 3720
gccctgaagg gcctgtatga ggtgctgaag atcaagagcg agtggaccga ggacggcttt 3780
gataggaatt gcctgaagct gccacacgca gagtggctgg acttcatcca gaacaagcgg 3840
tacgag 3846
<210> 123
<211> 4119
<212> DNA
<213> Moraxella bovoculi
<400> 123
atgctgttcc aggactttac ccacctgtat ccactgtcca agacagtgag atttgagctg 60
aagcccatcg ataggaccct ggagcacatc cacgccaaga acttcctgtc tcaggacgag 120
acaatggccg atatgcacca gaaggtgaaa gtgatcctgg acgattacca ccgcgacttc 180
atcgccgata tgatgggcga ggtgaagctg accaagctgg ccgagttcta tgacgtgtac 240
ctgaagtttc ggaagaaccc aaaggacgat gagctgcaga agcagctgaa ggatctgcag 300
gccgtgctga gaaaggagat cgtgaagccc atcggcaatg gcggcaagta taaggccggc 360
tacgacaggc tgttcggcgc caagctgttt aaggacggca aggagctggg cgatctggcc 420
aagttcgtga tcgcacagga gggagagagc tccccaaagc tggcccacct ggcccacttc 480
gagaagtttt ccacctattt cacaggcttt cacgataacc ggaagaatat gtattctgac 540
gaggataagc acaccgccat cgcctaccgc ctgatccacg agaacctgcc ccggtttatc 600
gacaatctgc agatcctgac cacaatcaag cagaagcact ctgccctgta cgatcagatc 660
atcaacgagc tgaccgccag cggcctggac gtgtctctgg ccagccacct ggatggctat 720
cacaagctgc tgacacagga gggcatcacc gcctacaata cactgctggg aggaatctcc 780
ggagaggcag gctctcctaa gatccagggc atcaacgagc tgatcaattc tcaccacaac 840
cagcactgcc acaagagcga gagaatcgcc aagctgaggc cactgcacaa gcagatcctg 900
tccgacggca tgagcgtgtc cttcctgccc tctaagtttg ccgacgatag cgagatgtgc 960
caggccgtga acgagttcta tcgccactac gccgacgtgt tcgccaaggt gcagagcctg 1020
ttcgacggct ttgacgatca ccagaaggat ggcatctacg tggagcacaa gaacctgaat 1080
gagctgtcca agcaggcctt cggcgacttt gcactgctgg gacgcgtgct ggacggatac 1140
tatgtggatg tggtgaatcc agagttcaac gagcggtttg ccaaggccaa gaccgacaat 1200
gccaaggcca agctgacaaa ggagaaggat aagttcatca agggcgtgca ctccctggcc 1260
tctctggagc aggccatcga gcactatacc gcaaggcacg acgatgagag cgtgcaggca 1320
ggcaagctgg gacagtactt caagcacggc ctggccggag tggacaaccc catccagaag 1380
atccacaaca atcacagcac catcaagggc tttctggaga gggagcgccc tgcaggagag 1440
agagccctgc caaagatcaa gtccggcaag aatcctgaga tgacacagct gaggcagctg 1500
aaggagctgc tggataacgc cctgaatgtg gcccacttcg ccaagctgct gaccacaaag 1560
accacactgg acaatcagga tggcaacttc tatggcgagt ttggcgtgct gtacgacgag 1620
ctggccaaga tccccaccct gtataacaag gtgagagatt acctgagcca gaagcctttc 1680
tccaccgaga agtacaagct gaactttggc aatccaacac tgctgaatgg ctgggacctg 1740
aacaaggaga aggataattt cggcgtgatc ctgcagaagg acggctgcta ctatctggcc 1800
ctgctggaca aggcccacaa gaaggtgttt gataacgccc ctaatacagg caagagcatc 1860
tatcagaaga tgatctataa gtacctggag gtgaggaagc agttccccaa ggtgttcttt 1920
tccaaggagg ccatcgccat caactaccac ccttctaagg agctggtgga gatcaaggac 1980
aagggccggc agagatccga cgatgagcgc ctgaagctgt atcggtttat cctggagtgt 2040
ctgaagatcc accctaagta cgataagaag ttcgagggcg ccatcggcga catccagctg 2100
tttaagaagg ataagaaggg cagagaggtg ccaatcagcg agaaggacct gttcgataag 2160
atcaacggca tcttttctag caagcctaag ctggagatgg aggacttctt tatcggcgag 2220
ttcaagaggt ataacccaag ccaggacctg gtggatcagt ataatatcta caagaagatc 2280
gactccaacg ataatcgcaa gaaggagaat ttctacaaca atcaccccaa gtttaagaag 2340
gatctggtgc ggtactatta cgagtctatg tgcaagcacg aggagtggga ggagagcttc 2400
gagttttcca agaagctgca ggacatcggc tgttacgtgg atgtgaacga gctgtttacc 2460
gagatcgaga cacggagact gaattataag atctccttct gcaacatcaa tgccgactac 2520
atcgatgagc tggtggagca gggccagctg tatctgttcc agatctacaa caaggacttt 2580
tccccaaagg cccacggcaa gcccaatctg cacaccctgt acttcaaggc cctgttttct 2640
gaggacaacc tggccgatcc tatctataag ctgaatggcg aggcccagat cttctacaga 2700
aaggcctccc tggacatgaa cgagacaaca atccacaggg ccggcgaggt gctggagaac 2760
aagaatcccg ataatcctaa gaagagacag ttcgtgtacg acatcatcaa ggataagagg 2820
tacacacagg acaagttcat gctgcacgtg ccaatcacca tgaactttgg cgtgcagggc 2880
atgacaatca aggagttcaa taagaaggtg aaccagtcta tccagcagta tgacgaggtg 2940
aacgtgatcg gcatcgatcg gggcgagaga cacctgctgt acctgaccgt gatcaatagc 3000
aagggcgaga tcctggagca gtgttccctg aacgacatca ccacagcctc tgccaatggc 3060
acacagatga ccacacctta ccacaagatc ctggataaga gggagatcga gcgcctgaac 3120
gcccgggtgg gatggggcga gatcgagaca atcaaggagc tgaagtctgg ctatctgagc 3180
cacgtggtgc accagatcag ccagctgatg ctgaagtaca acgccatcgt ggtgctggag 3240
gacctgaatt tcggctttaa gaggggccgc tttaaggtgg agaagcagat ctatcagaac 3300
ttcgagaatg ccctgatcaa gaagctgaac cacctggtgc tgaaggacaa ggccgacgat 3360
gagatcggct cttacaagaa tgccctgcag ctgaccaaca atttcacaga tctgaagagc 3420
atcggcaagc agaccggctt cctgttttat gtgcccgcct ggaacacctc taagatcgac 3480
cctgagacag gctttgtgga tctgctgaag ccaagatacg agaacatcgc ccagagccag 3540
gccttctttg gcaagttcga caagatctgc tataatgccg acaaggatta cttcgagttt 3600
cacatcgact acgccaagtt taccgataag gccaagaata gccgccagat ctggacaatc 3660
tgttcccacg gcgacaagcg gtacgtgtac gataagacag ccaaccagaa taagggcgcc 3720
gccaagggca tcaacgtgaa tgatgagctg aagtccctgt tcgcccgcca ccacatcaac 3780
gagaagcagc ccaacctggt catggacatc tgccagaaca atgataagga gtttcacaag 3840
tctctgatgt acctgctgaa aaccctgctg gccctgcggt acagcaacgc ctcctctgac 3900
gaggatttca tcctgtcccc cgtggcaaac gacgagggcg tgttctttaa tagcgccctg 3960
gccgacgata cacagcctca gaatgccgat gccaacggcg cctaccacat cgccctgaag 4020
ggcctgtggc tgctgaatga gctgaagaac tccgacgatc tgaacaaggt gaagctggcc 4080
atcgacaatc agacctggct gaatttcgcc cagaacagg 4119
<210> 124
<211> 3969
<212> DNA
<213> 解糖胨普雷沃菌(Prevotella disiens)
<400> 124
atggagaact atcaggagtt caccaacctg tttcagctga ataagacact gagattcgag 60
ctgaagccca tcggcaagac ctgcgagctg ctggaggagg gcaagatctt cgccagcggc 120
tcctttctgg agaaggacaa ggtgagggcc gataacgtga gctacgtgaa gaaggagatc 180
gacaagaagc acaagatctt tatcgaggag acactgagct ccttctctat cagcaacgat 240
ctgctgaagc agtactttga ctgctataat gagctgaagg ccttcaagaa ggactgtaag 300
agcgatgagg aggaggtgaa gaaaaccgcc ctgcgcaaca agtgtacctc catccagagg 360
gccatgcgcg aggccatctc tcaggccttt ctgaagagcc cccagaagaa gctgctggcc 420
atcaagaacc tgatcgagaa cgtgttcaag gccgacgaga atgtgcagca cttctccgag 480
tttaccagct atttctccgg ctttgagaca aacagagaga atttctactc tgacgaggag 540
aagtccacat ctatcgccta taggctggtg cacgataacc tgcctatctt catcaagaac 600
atctacatct tcgagaagct gaaggagcag ttcgacgcca agaccctgag cgagatcttc 660
gagaactaca agctgtatgt ggccggctct agcctggatg aggtgttctc cctggagtac 720
tttaacaata ccctgacaca gaagggcatc gacaactata atgccgtgat cggcaagatc 780
gtgaaggagg ataagcagga gatccagggc ctgaacgagc acatcaacct gtataatcag 840
aagcacaagg accggagact gcccttcttt atctccctga agaagcagat cctgtccgat 900
cgggaggccc tgtcttggct gcctgacatg ttcaagaatg attctgaagt gatcaaggcc 960
ctgaagggct tctacatcga ggacggcttt gagaacaatg tgctgacacc tctggccacc 1020
ctgctgtcct ctctggataa gtacaacctg aatggcatct ttatccgcaa caatgaggcc 1080
ctgagctccc tgtcccagaa cgtgtatcgg aatttttcta tcgacgaggc catcgatgcc 1140
aacgccgagc tgcagacctt caacaattac gagctgatcg ccaatgccct gcgcgccaag 1200
atcaagaagg agacaaagca gggccggaag tctttcgaga agtacgagga gtatatcgat 1260
aagaaggtga aggccatcga cagcctgtcc atccaggaga tcaacgagct ggtggagaat 1320
tacgtgagcg agtttaactc taatagcggc aacatgccaa gaaaggtgga ggactacttc 1380
agcctgatga ggaagggcga cttcggctcc aacgatctga tcgaaaatat caagaccaag 1440
ctgagcgccg cagagaagct gctgggcaca aagtaccagg agacagccaa ggacatcttc 1500
aagaaggatg agaactccaa gctgatcaag gagctgctgg acgccaccaa gcagttccag 1560
cactttatca agccactgct gggcacaggc gaggaggcag atcgggacct ggtgttctac 1620
ggcgattttc tgcccctgta tgagaagttt gaggagctga ccctgctgta taacaaggtg 1680
cggaatagac tgacacagaa gccctattcc aaggacaaga tccgcctgtg cttcaacaag 1740
cctaagctga tgacaggctg ggtggattcc aagaccgaga agtctgacaa cggcacacag 1800
tacggcggct atctgtttcg gaagaagaat gagatcggcg agtacgatta ttttctgggc 1860
atctctagca aggcccagct gttcagaaag aacgaggccg tgatcggcga ctacgagagg 1920
ctggattact atcagccaaa ggccaatacc atctacggct ctgcctatga gggcgagaac 1980
agctacaagg aggacaagaa gcggctgaac aaagtgatca tcgcctatat cgagcagatc 2040
aagcagacaa acatcaagaa gtctatcatc gagtccatct ctaagtatcc taatatcagc 2100
gacgatgaca aggtgacccc atcctctctg ctggagaaga tcaagaaggt gtctatcgac 2160
agctacaacg gcatcctgtc cttcaagtct tttcagagcg tgaacaagga agtgatcgat 2220
aacctgctga aaaccatcag ccccctgaag aacaaggccg agtttctgga cctgatcaat 2280
aaggattatc agatcttcac cgaggtgcag gccgtgatcg acgagatctg caagcagaaa 2340
accttcatct actttccaat ctccaacgtg gagctggaga aggagatggg cgataaggac 2400
aagcccctgt gcctgttcca gatcagcaat aaggatctgt ccttcgccaa gacctttagc 2460
gccaacctgc ggaagaagag aggcgccgag aatctgcaca caatgctgtt taaggccctg 2520
atggagggca accaggataa tctggacctg ggctctggcg ccatcttcta cagagccaag 2580
agcctggacg gcaacaagcc cacacaccct gccaatgagg ccatcaagtg taggaacgtg 2640
gccaataagg ataaggtgtc cctgttcacc tacgacatct ataagaacag gcgctacatg 2700
gagaataagt tcctgtttca cctgagcatc gtgcagaact ataaggccgc caatgactcc 2760
gcccagctga acagctccgc caccgagtat atcagaaagg ccgatgacct gcacatcatc 2820
ggcatcgata ggggcgagcg caatctgctg tactattccg tgatcgatat gaagggcaac 2880
atcgtggagc aggactctct gaatatcatc aggaacaatg acctggagac agattaccac 2940
gacctgctgg ataagaggga gaaggagcgc aaggccaacc ggcagaattg ggaggccgtg 3000
gagggcatca aggacctgaa gaagggctac ctgagccagg ccgtgcacca gatcgcccag 3060
ctgatgctga agtataacgc catcatcgcc ctggaggatc tgggccagat gtttgtgacc 3120
cgcggccaga agatcgagaa ggccgtgtac cagcagttcg agaagagcct ggtggataag 3180
ctgtcctacc tggtggacaa gaagcggcct tataatgagc tgggcggcat cctgaaggcc 3240
taccagctgg cctctagcat caccaagaac aattctgaca agcagaacgg cttcctgttt 3300
tatgtgccag cctggaatac aagcaagatc gatcccgtga ccggctttac agacctgctg 3360
cggcccaagg ccatgaccat caaggaggcc caggacttct ttggcgcctt cgataacatc 3420
tcttacaatg acaagggcta tttcgagttt gagacaaact acgacaagtt taagatcaga 3480
atgaagagcg cccagaccag gtggacaatc tgcaccttcg gcaatcggat caagagaaag 3540
aaggataaga actactggaa ttatgaggag gtggagctga ccgaggagtt caagaagctg 3600
tttaaggaca gcaacatcga ttacgagaac tgtaatctga aggaggagat ccagaacaag 3660
gacaatcgca agttctttga tgacctgatc aagctgctgc agctgacact gcagatgcgg 3720
aactccgatg acaagggcaa tgattatatc atctctcctg tggccaacgc cgagggccag 3780
ttctttgact cccgcaatgg cgataagaag ctgccactgg atgcagacgc aaacggagcc 3840
tacaatatcg cccgcaaggg cctgtggaac atccggcaga tcaagcagac caagaacgac 3900
aagaagctga atctgagcat ctcctctaca gagtggctgg atttcgtgcg ggagaagcct 3960
tacctgaag 3969
<210> 125
<211> 1368
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 125
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 126
<211> 1300
<212> PRT
<213> 土拉弗朗西斯菌(Francisella tularensis)
<400> 126
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 127
<211> 1307
<212> PRT
<213> 氨基酸球菌属(Acidaminococcus sp.) BV3L6
<400> 127
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 128
<211> 1233
<212> PRT
<213> 毛螺菌科细菌(Lachnospiraceae bacterium)
<400> 128
Met Asp Tyr Gly Asn Gly Gln Phe Glu Arg Arg Ala Pro Leu Thr Lys
1 5 10 15
Thr Ile Thr Leu Arg Leu Lys Pro Ile Gly Glu Thr Arg Glu Thr Ile
20 25 30
Arg Glu Gln Lys Leu Leu Glu Gln Asp Ala Ala Phe Arg Lys Leu Val
35 40 45
Glu Thr Val Thr Pro Ile Val Asp Asp Cys Ile Arg Lys Ile Ala Asp
50 55 60
Asn Ala Leu Cys His Phe Gly Thr Glu Tyr Asp Phe Ser Cys Leu Gly
65 70 75 80
Asn Ala Ile Ser Lys Asn Asp Ser Lys Ala Ile Lys Lys Glu Thr Glu
85 90 95
Lys Val Glu Lys Leu Leu Ala Lys Val Leu Thr Glu Asn Leu Pro Asp
100 105 110
Gly Leu Arg Lys Val Asn Asp Ile Asn Ser Ala Ala Phe Ile Gln Asp
115 120 125
Thr Leu Thr Ser Phe Val Gln Asp Asp Ala Asp Lys Arg Val Leu Ile
130 135 140
Gln Glu Leu Lys Gly Lys Thr Val Leu Met Gln Arg Phe Leu Thr Thr
145 150 155 160
Arg Ile Thr Ala Leu Thr Val Trp Leu Pro Asp Arg Val Phe Glu Asn
165 170 175
Phe Asn Ile Phe Ile Glu Asn Ala Glu Lys Met Arg Ile Leu Leu Asp
180 185 190
Ser Pro Leu Asn Glu Lys Ile Met Lys Phe Asp Pro Asp Ala Glu Gln
195 200 205
Tyr Ala Ser Leu Glu Phe Tyr Gly Gln Cys Leu Ser Gln Lys Asp Ile
210 215 220
Asp Ser Tyr Asn Leu Ile Ile Ser Gly Ile Tyr Ala Asp Asp Glu Val
225 230 235 240
Lys Asn Pro Gly Ile Asn Glu Ile Val Lys Glu Tyr Asn Gln Gln Ile
245 250 255
Arg Gly Asp Lys Asp Glu Ser Pro Leu Pro Lys Leu Lys Lys Leu His
260 265 270
Lys Gln Ile Leu Met Pro Val Glu Lys Ala Phe Phe Val Arg Val Leu
275 280 285
Ser Asn Asp Ser Asp Ala Arg Ser Ile Leu Glu Lys Ile Leu Lys Asp
290 295 300
Thr Glu Met Leu Pro Ser Lys Ile Ile Glu Ala Met Lys Glu Ala Asp
305 310 315 320
Ala Gly Asp Ile Ala Val Tyr Gly Ser Arg Leu His Glu Leu Ser His
325 330 335
Val Ile Tyr Gly Asp His Gly Lys Leu Ser Gln Ile Ile Tyr Asp Lys
340 345 350
Glu Ser Lys Arg Ile Ser Glu Leu Met Glu Thr Leu Ser Pro Lys Glu
355 360 365
Arg Lys Glu Ser Lys Lys Arg Leu Glu Gly Leu Glu Glu His Ile Arg
370 375 380
Lys Ser Thr Tyr Thr Phe Asp Glu Leu Asn Arg Tyr Ala Glu Lys Asn
385 390 395 400
Val Met Ala Ala Tyr Ile Ala Ala Val Glu Glu Ser Cys Ala Glu Ile
405 410 415
Met Arg Lys Glu Lys Asp Leu Arg Thr Leu Leu Ser Lys Glu Asp Val
420 425 430
Lys Ile Arg Gly Asn Arg His Asn Thr Leu Ile Val Lys Asn Tyr Phe
435 440 445
Asn Ala Trp Thr Val Phe Arg Asn Leu Ile Arg Ile Leu Arg Arg Lys
450 455 460
Ser Glu Ala Glu Ile Asp Ser Asp Phe Tyr Asp Val Leu Asp Asp Ser
465 470 475 480
Val Glu Val Leu Ser Leu Thr Tyr Lys Gly Glu Asn Leu Cys Arg Ser
485 490 495
Tyr Ile Thr Lys Lys Ile Gly Ser Asp Leu Lys Pro Glu Ile Ala Thr
500 505 510
Tyr Gly Ser Ala Leu Arg Pro Asn Ser Arg Trp Trp Ser Pro Gly Glu
515 520 525
Lys Phe Asn Val Lys Phe His Thr Ile Val Arg Arg Asp Gly Arg Leu
530 535 540
Tyr Tyr Phe Ile Leu Pro Lys Gly Ala Lys Pro Val Glu Leu Glu Asp
545 550 555 560
Met Asp Gly Asp Ile Glu Cys Leu Gln Met Arg Lys Ile Pro Asn Pro
565 570 575
Thr Ile Phe Leu Pro Lys Leu Val Phe Lys Asp Pro Glu Ala Phe Phe
580 585 590
Arg Asp Asn Pro Glu Ala Asp Glu Phe Val Phe Leu Ser Gly Met Lys
595 600 605
Ala Pro Val Thr Ile Thr Arg Glu Thr Tyr Glu Ala Tyr Arg Tyr Lys
610 615 620
Leu Tyr Thr Val Gly Lys Leu Arg Asp Gly Glu Val Ser Glu Glu Glu
625 630 635 640
Tyr Lys Arg Ala Leu Leu Gln Val Leu Thr Ala Tyr Lys Glu Phe Leu
645 650 655
Glu Asn Arg Met Ile Tyr Ala Asp Leu Asn Phe Gly Phe Lys Asp Leu
660 665 670
Glu Glu Tyr Lys Asp Ser Ser Glu Phe Ile Lys Gln Val Glu Thr His
675 680 685
Asn Thr Phe Met Cys Trp Ala Lys Val Ser Ser Ser Gln Leu Asp Asp
690 695 700
Leu Val Lys Ser Gly Asn Gly Leu Leu Phe Glu Ile Trp Ser Glu Arg
705 710 715 720
Leu Glu Ser Tyr Tyr Lys Tyr Gly Asn Glu Lys Val Leu Arg Gly Tyr
725 730 735
Glu Gly Val Leu Leu Ser Ile Leu Lys Asp Glu Asn Leu Val Ser Met
740 745 750
Arg Thr Leu Leu Asn Ser Arg Pro Met Leu Val Tyr Arg Pro Lys Glu
755 760 765
Ser Ser Lys Pro Met Val Val His Arg Asp Gly Ser Arg Val Val Asp
770 775 780
Arg Phe Asp Lys Asp Gly Lys Tyr Ile Pro Pro Glu Val His Asp Glu
785 790 795 800
Leu Tyr Arg Phe Phe Asn Asn Leu Leu Ile Lys Glu Lys Leu Gly Glu
805 810 815
Lys Ala Arg Lys Ile Leu Asp Asn Lys Lys Val Lys Val Lys Val Leu
820 825 830
Glu Ser Glu Arg Val Lys Trp Ser Lys Phe Tyr Asp Glu Gln Phe Ala
835 840 845
Val Thr Phe Ser Val Lys Lys Asn Ala Asp Cys Leu Asp Thr Thr Lys
850 855 860
Asp Leu Asn Ala Glu Val Met Glu Gln Tyr Ser Glu Ser Asn Arg Leu
865 870 875 880
Ile Leu Ile Arg Asn Thr Thr Asp Ile Leu Tyr Tyr Leu Val Leu Asp
885 890 895
Lys Asn Gly Lys Val Leu Lys Gln Arg Ser Leu Asn Ile Ile Asn Asp
900 905 910
Gly Ala Arg Asp Val Asp Trp Lys Glu Arg Phe Arg Gln Val Thr Lys
915 920 925
Asp Arg Asn Glu Gly Tyr Asn Glu Trp Asp Tyr Ser Arg Thr Ser Asn
930 935 940
Asp Leu Lys Glu Val Tyr Leu Asn Tyr Ala Leu Lys Glu Ile Ala Glu
945 950 955 960
Ala Val Ile Glu Tyr Asn Ala Ile Leu Ile Ile Glu Lys Met Ser Asn
965 970 975
Ala Phe Lys Asp Lys Tyr Ser Phe Leu Asp Asp Val Thr Phe Lys Gly
980 985 990
Phe Glu Thr Lys Leu Leu Ala Lys Leu Ser Asp Leu His Phe Arg Gly
995 1000 1005
Ile Lys Asp Gly Glu Pro Cys Ser Phe Thr Asn Pro Leu Gln Leu
1010 1015 1020
Cys Gln Asn Asp Ser Asn Lys Ile Leu Gln Asp Gly Val Ile Phe
1025 1030 1035
Met Val Pro Asn Ser Met Thr Arg Ser Leu Asp Pro Asp Thr Gly
1040 1045 1050
Phe Ile Phe Ala Ile Asn Asp His Asn Ile Arg Thr Lys Lys Ala
1055 1060 1065
Lys Leu Asn Phe Leu Ser Lys Phe Asp Gln Leu Lys Val Ser Ser
1070 1075 1080
Glu Gly Cys Leu Ile Met Lys Tyr Ser Gly Asp Ser Leu Pro Thr
1085 1090 1095
His Asn Thr Asp Asn Arg Val Trp Asn Cys Cys Cys Asn His Pro
1100 1105 1110
Ile Thr Asn Tyr Asp Arg Glu Thr Lys Lys Val Glu Phe Ile Glu
1115 1120 1125
Glu Pro Val Glu Glu Leu Ser Arg Val Leu Glu Glu Asn Gly Ile
1130 1135 1140
Glu Thr Asp Thr Glu Leu Asn Lys Leu Asn Glu Arg Glu Asn Val
1145 1150 1155
Pro Gly Lys Val Val Asp Ala Ile Tyr Ser Leu Val Leu Asn Tyr
1160 1165 1170
Leu Arg Gly Thr Val Ser Gly Val Ala Gly Gln Arg Ala Val Tyr
1175 1180 1185
Tyr Ser Pro Val Thr Gly Lys Lys Tyr Asp Ile Ser Phe Ile Gln
1190 1195 1200
Ala Met Asn Leu Asn Arg Lys Cys Asp Tyr Tyr Arg Ile Gly Ser
1205 1210 1215
Lys Glu Arg Gly Glu Trp Thr Asp Phe Val Ala Gln Leu Ile Asn
1220 1225 1230
<210> 129
<211> 1246
<212> PRT
<213> 毛螺菌科细菌(Lachnospiraceae bacterium)
<400> 129
Met Leu Lys Asn Val Gly Ile Asp Arg Leu Asp Val Glu Lys Gly Arg
1 5 10 15
Lys Asn Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser
20 25 30
Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn
35 40 45
Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp
50 55 60
Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile
65 70 75 80
Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile
85 90 95
Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu
100 105 110
Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys
115 120 125
Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr
130 135 140
Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn
145 150 155 160
Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg
165 170 175
Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg
180 185 190
Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe
195 200 205
Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys
210 215 220
Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly
225 230 235 240
Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn
245 250 255
Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly
260 265 270
Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu
275 280 285
Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser
290 295 300
Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu
305 310 315 320
Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile
325 330 335
Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala
340 345 350
Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp
355 360 365
Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr
370 375 380
Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu
385 390 395 400
Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu
405 410 415
Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu
420 425 430
Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly
435 440 445
Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu
450 455 460
Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser
465 470 475 480
Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys
485 490 495
Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr
500 505 510
Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr
515 520 525
Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln
530 535 540
Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr
545 550 555 560
Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met
565 570 575
Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val
580 585 590
Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn
595 600 605
Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr
610 615 620
Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys
625 630 635 640
Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe
645 650 655
Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp
660 665 670
Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr
675 680 685
Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser
690 695 700
Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe
705 710 715 720
Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn
725 730 735
Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly
740 745 750
Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser
755 760 765
Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala
770 775 780
Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp
785 790 795 800
Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile
805 810 815
Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr
820 825 830
Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly
835 840 845
Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly
850 855 860
Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn
865 870 875 880
Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys
885 890 895
Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu
900 905 910
Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys
915 920 925
Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp
930 935 940
Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val
945 950 955 960
Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val
965 970 975
Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr
980 985 990
Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn
995 1000 1005
Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp
1010 1015 1020
Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser
1025 1030 1035
Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met
1040 1045 1050
Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys
1055 1060 1065
Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu
1070 1075 1080
Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys
1085 1090 1095
Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr
1100 1105 1110
Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp
1115 1120 1125
Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser
1130 1135 1140
Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser
1145 1150 1155
Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys
1160 1165 1170
Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln
1175 1180 1185
Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr
1190 1195 1200
Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys
1205 1210 1215
Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn
1220 1225 1230
Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1235 1240 1245
<210> 130
<211> 1228
<212> PRT
<213> 毛螺菌科细菌(Lachnospiraceae bacterium)
<400> 130
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly
1130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 131
<211> 1300
<212> PRT
<213> 土拉弗朗西斯菌(Francisella tularensis)
<400> 131
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 132
<211> 1477
<212> PRT
<213> 异域菌门(Peregrinibacteria)
<400> 132
Met Ser Asn Phe Phe Lys Asn Phe Thr Asn Leu Tyr Glu Leu Ser Lys
1 5 10 15
Thr Leu Arg Phe Glu Leu Lys Pro Val Gly Asp Thr Leu Thr Asn Met
20 25 30
Lys Asp His Leu Glu Tyr Asp Glu Lys Leu Gln Thr Phe Leu Lys Asp
35 40 45
Gln Asn Ile Asp Asp Ala Tyr Gln Ala Leu Lys Pro Gln Phe Asp Glu
50 55 60
Ile His Glu Glu Phe Ile Thr Asp Ser Leu Glu Ser Lys Lys Ala Lys
65 70 75 80
Glu Ile Asp Phe Ser Glu Tyr Leu Asp Leu Phe Gln Glu Lys Lys Glu
85 90 95
Leu Asn Asp Ser Glu Lys Lys Leu Arg Asn Lys Ile Gly Glu Thr Phe
100 105 110
Asn Lys Ala Gly Glu Lys Trp Lys Lys Glu Lys Tyr Pro Gln Tyr Glu
115 120 125
Trp Lys Lys Gly Ser Lys Ile Ala Asn Gly Ala Asp Ile Leu Ser Cys
130 135 140
Gln Asp Met Leu Gln Phe Ile Lys Tyr Lys Asn Pro Glu Asp Glu Lys
145 150 155 160
Ile Lys Asn Tyr Ile Asp Asp Thr Leu Lys Gly Phe Phe Thr Tyr Phe
165 170 175
Gly Gly Phe Asn Gln Asn Arg Ala Asn Tyr Tyr Glu Thr Lys Lys Glu
180 185 190
Ala Ser Thr Ala Val Ala Thr Arg Ile Val His Glu Asn Leu Pro Lys
195 200 205
Phe Cys Asp Asn Val Ile Gln Phe Lys His Ile Ile Lys Arg Lys Lys
210 215 220
Asp Gly Thr Val Glu Lys Thr Glu Arg Lys Thr Glu Tyr Leu Asn Ala
225 230 235 240
Tyr Gln Tyr Leu Lys Asn Asn Asn Lys Ile Thr Gln Ile Lys Asp Ala
245 250 255
Glu Thr Glu Lys Met Ile Glu Ser Thr Pro Ile Ala Glu Lys Ile Phe
260 265 270
Asp Val Tyr Tyr Phe Ser Ser Cys Leu Ser Gln Lys Gln Ile Glu Glu
275 280 285
Tyr Asn Arg Ile Ile Gly His Tyr Asn Leu Leu Ile Asn Leu Tyr Asn
290 295 300
Gln Ala Lys Arg Ser Glu Gly Lys His Leu Ser Ala Asn Glu Lys Lys
305 310 315 320
Tyr Lys Asp Leu Pro Lys Phe Lys Thr Leu Tyr Lys Gln Ile Gly Cys
325 330 335
Gly Lys Lys Lys Asp Leu Phe Tyr Thr Ile Lys Cys Asp Thr Glu Glu
340 345 350
Glu Ala Asn Lys Ser Arg Asn Glu Gly Lys Glu Ser His Ser Val Glu
355 360 365
Glu Ile Ile Asn Lys Ala Gln Glu Ala Ile Asn Lys Tyr Phe Lys Ser
370 375 380
Asn Asn Asp Cys Glu Asn Ile Asn Thr Val Pro Asp Phe Ile Asn Tyr
385 390 395 400
Ile Leu Thr Lys Glu Asn Tyr Glu Gly Val Tyr Trp Ser Lys Ala Ala
405 410 415
Met Asn Thr Ile Ser Asp Lys Tyr Phe Ala Asn Tyr His Asp Leu Gln
420 425 430
Asp Arg Leu Lys Glu Ala Lys Val Phe Gln Lys Ala Asp Lys Lys Ser
435 440 445
Glu Asp Asp Ile Lys Ile Pro Glu Ala Ile Glu Leu Ser Gly Leu Phe
450 455 460
Gly Val Leu Asp Ser Leu Ala Asp Trp Gln Thr Thr Leu Phe Lys Ser
465 470 475 480
Ser Ile Leu Ser Asn Glu Asp Lys Leu Lys Ile Ile Thr Asp Ser Gln
485 490 495
Thr Pro Ser Glu Ala Leu Leu Lys Met Ile Phe Asn Asp Ile Glu Lys
500 505 510
Asn Met Glu Ser Phe Leu Lys Glu Thr Asn Asp Ile Ile Thr Leu Lys
515 520 525
Lys Tyr Lys Gly Asn Lys Glu Gly Thr Glu Lys Ile Lys Gln Trp Phe
530 535 540
Asp Tyr Thr Leu Ala Ile Asn Arg Met Leu Lys Tyr Phe Leu Val Lys
545 550 555 560
Glu Asn Lys Ile Lys Gly Asn Ser Leu Asp Thr Asn Ile Ser Glu Ala
565 570 575
Leu Lys Thr Leu Ile Tyr Ser Asp Asp Ala Glu Trp Phe Lys Trp Tyr
580 585 590
Asp Ala Leu Arg Asn Tyr Leu Thr Gln Lys Pro Gln Asp Glu Ala Lys
595 600 605
Glu Asn Lys Leu Lys Leu Asn Phe Asp Asn Pro Ser Leu Ala Gly Gly
610 615 620
Trp Asp Val Asn Lys Glu Cys Ser Asn Phe Cys Val Ile Leu Lys Asp
625 630 635 640
Lys Asn Glu Lys Lys Tyr Leu Ala Ile Met Lys Lys Gly Glu Asn Thr
645 650 655
Leu Phe Gln Lys Glu Trp Thr Glu Gly Arg Gly Lys Asn Leu Thr Lys
660 665 670
Lys Ser Asn Pro Leu Phe Glu Ile Asn Asn Cys Glu Ile Leu Ser Lys
675 680 685
Met Glu Tyr Asp Phe Trp Ala Asp Val Ser Lys Met Ile Pro Lys Cys
690 695 700
Ser Thr Gln Leu Lys Ala Val Val Asn His Phe Lys Gln Ser Asp Asn
705 710 715 720
Glu Phe Ile Phe Pro Ile Gly Tyr Lys Val Thr Ser Gly Glu Lys Phe
725 730 735
Arg Glu Glu Cys Lys Ile Ser Lys Gln Asp Phe Glu Leu Asn Asn Lys
740 745 750
Val Phe Asn Lys Asn Glu Leu Ser Val Thr Ala Met Arg Tyr Asp Leu
755 760 765
Ser Ser Thr Gln Glu Lys Gln Tyr Ile Lys Ala Phe Gln Lys Glu Tyr
770 775 780
Trp Glu Leu Leu Phe Lys Gln Glu Lys Arg Asp Thr Lys Leu Thr Asn
785 790 795 800
Asn Glu Ile Phe Asn Glu Trp Ile Asn Phe Cys Asn Lys Lys Tyr Ser
805 810 815
Glu Leu Leu Ser Trp Glu Arg Lys Tyr Lys Asp Ala Leu Thr Asn Trp
820 825 830
Ile Asn Phe Cys Lys Tyr Phe Leu Ser Lys Tyr Pro Lys Thr Thr Leu
835 840 845
Phe Asn Tyr Ser Phe Lys Glu Ser Glu Asn Tyr Asn Ser Leu Asp Glu
850 855 860
Phe Tyr Arg Asp Val Asp Ile Cys Ser Tyr Lys Leu Asn Ile Asn Thr
865 870 875 880
Thr Ile Asn Lys Ser Ile Leu Asp Arg Leu Val Glu Glu Gly Lys Leu
885 890 895
Tyr Leu Phe Glu Ile Lys Asn Gln Asp Ser Asn Asp Gly Lys Ser Ile
900 905 910
Gly His Lys Asn Asn Leu His Thr Ile Tyr Trp Asn Ala Ile Phe Glu
915 920 925
Asn Phe Asp Asn Arg Pro Lys Leu Asn Gly Glu Ala Glu Ile Phe Tyr
930 935 940
Arg Lys Ala Ile Ser Lys Asp Lys Leu Gly Ile Val Lys Gly Lys Lys
945 950 955 960
Thr Lys Asn Gly Thr Glu Ile Ile Lys Asn Tyr Arg Phe Ser Lys Glu
965 970 975
Lys Phe Ile Leu His Val Pro Ile Thr Leu Asn Phe Cys Ser Asn Asn
980 985 990
Glu Tyr Val Asn Asp Ile Val Asn Thr Lys Phe Tyr Asn Phe Ser Asn
995 1000 1005
Leu His Phe Leu Gly Ile Asp Arg Gly Glu Lys His Leu Ala Tyr
1010 1015 1020
Tyr Ser Leu Val Asn Lys Asn Gly Glu Ile Val Asp Gln Gly Thr
1025 1030 1035
Leu Asn Leu Pro Phe Thr Asp Lys Asp Gly Asn Gln Arg Ser Ile
1040 1045 1050
Lys Lys Glu Lys Tyr Phe Tyr Asn Lys Gln Glu Asp Lys Trp Glu
1055 1060 1065
Ala Lys Glu Val Asp Cys Trp Asn Tyr Asn Asp Leu Leu Asp Ala
1070 1075 1080
Met Ala Ser Asn Arg Asp Met Ala Arg Lys Asn Trp Gln Arg Ile
1085 1090 1095
Gly Thr Ile Lys Glu Ala Lys Asn Gly Tyr Val Ser Leu Val Ile
1100 1105 1110
Arg Lys Ile Ala Asp Leu Ala Val Asn Asn Glu Arg Pro Ala Phe
1115 1120 1125
Ile Val Leu Glu Asp Leu Asn Thr Gly Phe Lys Arg Ser Arg Gln
1130 1135 1140
Lys Ile Asp Lys Ser Val Tyr Gln Lys Phe Glu Leu Ala Leu Ala
1145 1150 1155
Lys Lys Leu Asn Phe Leu Val Asp Lys Asn Ala Lys Arg Asp Glu
1160 1165 1170
Ile Gly Ser Pro Thr Lys Ala Leu Gln Leu Thr Pro Pro Val Asn
1175 1180 1185
Asn Tyr Gly Asp Ile Glu Asn Lys Lys Gln Ala Gly Ile Met Leu
1190 1195 1200
Tyr Thr Arg Ala Asn Tyr Thr Ser Gln Thr Asp Pro Ala Thr Gly
1205 1210 1215
Trp Arg Lys Thr Ile Tyr Leu Lys Ala Gly Pro Glu Glu Thr Thr
1220 1225 1230
Tyr Lys Lys Asp Gly Lys Ile Lys Asn Lys Ser Val Lys Asp Gln
1235 1240 1245
Ile Ile Glu Thr Phe Thr Asp Ile Gly Phe Asp Gly Lys Asp Tyr
1250 1255 1260
Tyr Phe Glu Tyr Asp Lys Gly Glu Phe Val Asp Glu Lys Thr Gly
1265 1270 1275
Glu Ile Lys Pro Lys Lys Trp Arg Leu Tyr Ser Gly Glu Asn Gly
1280 1285 1290
Lys Ser Leu Asp Arg Phe Arg Gly Glu Arg Glu Lys Asp Lys Tyr
1295 1300 1305
Glu Trp Lys Ile Asp Lys Ile Asp Ile Val Lys Ile Leu Asp Asp
1310 1315 1320
Leu Phe Val Asn Phe Asp Lys Asn Ile Ser Leu Leu Lys Gln Leu
1325 1330 1335
Lys Glu Gly Val Glu Leu Thr Arg Asn Asn Glu His Gly Thr Gly
1340 1345 1350
Glu Ser Leu Arg Phe Ala Ile Asn Leu Ile Gln Gln Ile Arg Asn
1355 1360 1365
Thr Gly Asn Asn Glu Arg Asp Asn Asp Phe Ile Leu Ser Pro Val
1370 1375 1380
Arg Asp Glu Asn Gly Lys His Phe Asp Ser Arg Glu Tyr Trp Asp
1385 1390 1395
Lys Glu Thr Lys Gly Glu Lys Ile Ser Met Pro Ser Ser Gly Asp
1400 1405 1410
Ala Asn Gly Ala Phe Asn Ile Ala Arg Lys Gly Ile Ile Met Asn
1415 1420 1425
Ala His Ile Leu Ala Asn Ser Asp Ser Lys Asp Leu Ser Leu Phe
1430 1435 1440
Val Ser Asp Glu Glu Trp Asp Leu His Leu Asn Asn Lys Thr Glu
1445 1450 1455
Trp Lys Lys Gln Leu Asn Ile Phe Ser Ser Arg Lys Ala Met Ala
1460 1465 1470
Lys Arg Lys Lys
1475
<210> 133
<211> 1352
<212> PRT
<213> 俭菌总门(Parcubacteria)
<400> 133
Met Glu Asn Ile Phe Asp Gln Phe Ile Gly Lys Tyr Ser Leu Ser Lys
1 5 10 15
Thr Leu Arg Phe Glu Leu Lys Pro Val Gly Lys Thr Glu Asp Phe Leu
20 25 30
Lys Ile Asn Lys Val Phe Glu Lys Asp Gln Thr Ile Asp Asp Ser Tyr
35 40 45
Asn Gln Ala Lys Phe Tyr Phe Asp Ser Leu His Gln Lys Phe Ile Asp
50 55 60
Ala Ala Leu Ala Ser Asp Lys Thr Ser Glu Leu Ser Phe Gln Asn Phe
65 70 75 80
Ala Asp Val Leu Glu Lys Gln Asn Lys Ile Ile Leu Asp Lys Lys Arg
85 90 95
Glu Met Gly Ala Leu Arg Lys Arg Asp Lys Asn Ala Val Gly Ile Asp
100 105 110
Arg Leu Gln Lys Glu Ile Asn Asp Ala Glu Asp Ile Ile Gln Lys Glu
115 120 125
Lys Glu Lys Ile Tyr Lys Asp Val Arg Thr Leu Phe Asp Asn Glu Ala
130 135 140
Glu Ser Trp Lys Thr Tyr Tyr Gln Glu Arg Glu Val Asp Gly Lys Lys
145 150 155 160
Ile Thr Phe Ser Lys Ala Asp Leu Lys Gln Lys Gly Ala Asp Phe Leu
165 170 175
Thr Ala Ala Gly Ile Leu Lys Val Leu Lys Tyr Glu Phe Pro Glu Glu
180 185 190
Lys Glu Lys Glu Phe Gln Ala Lys Asn Gln Pro Ser Leu Phe Val Glu
195 200 205
Glu Lys Glu Asn Pro Gly Gln Lys Arg Tyr Ile Phe Asp Ser Phe Asp
210 215 220
Lys Phe Ala Gly Tyr Leu Thr Lys Phe Gln Gln Thr Lys Lys Asn Leu
225 230 235 240
Tyr Ala Ala Asp Gly Thr Ser Thr Ala Val Ala Thr Arg Ile Ala Asp
245 250 255
Asn Phe Ile Ile Phe His Gln Asn Thr Lys Val Phe Arg Asp Lys Tyr
260 265 270
Lys Asn Asn His Thr Asp Leu Gly Phe Asp Glu Glu Asn Ile Phe Glu
275 280 285
Ile Glu Arg Tyr Lys Asn Cys Leu Leu Gln Arg Glu Ile Glu His Ile
290 295 300
Lys Asn Glu Asn Ser Tyr Asn Lys Ile Ile Gly Arg Ile Asn Lys Lys
305 310 315 320
Ile Lys Glu Tyr Arg Asp Gln Lys Ala Lys Asp Thr Lys Leu Thr Lys
325 330 335
Ser Asp Phe Pro Phe Phe Lys Asn Leu Asp Lys Gln Ile Leu Gly Glu
340 345 350
Val Glu Lys Glu Lys Gln Leu Ile Glu Lys Thr Arg Glu Lys Thr Glu
355 360 365
Glu Asp Val Leu Ile Glu Arg Phe Lys Glu Phe Ile Glu Asn Asn Glu
370 375 380
Glu Arg Phe Thr Ala Ala Lys Lys Leu Met Asn Ala Phe Cys Asn Gly
385 390 395 400
Glu Phe Glu Ser Glu Tyr Glu Gly Ile Tyr Leu Lys Asn Lys Ala Ile
405 410 415
Asn Thr Ile Ser Arg Arg Trp Phe Val Ser Asp Arg Asp Phe Glu Leu
420 425 430
Lys Leu Pro Gln Gln Lys Ser Lys Asn Lys Ser Glu Lys Asn Glu Pro
435 440 445
Lys Val Lys Lys Phe Ile Ser Ile Ala Glu Ile Lys Asn Ala Val Glu
450 455 460
Glu Leu Asp Gly Asp Ile Phe Lys Ala Val Phe Tyr Asp Lys Lys Ile
465 470 475 480
Ile Ala Gln Gly Gly Ser Lys Leu Glu Gln Phe Leu Val Ile Trp Lys
485 490 495
Tyr Glu Phe Glu Tyr Leu Phe Arg Asp Ile Glu Arg Glu Asn Gly Glu
500 505 510
Lys Leu Leu Gly Tyr Asp Ser Cys Leu Lys Ile Ala Lys Gln Leu Gly
515 520 525
Ile Phe Pro Gln Glu Lys Glu Ala Arg Glu Lys Ala Thr Ala Val Ile
530 535 540
Lys Asn Tyr Ala Asp Ala Gly Leu Gly Ile Phe Gln Met Met Lys Tyr
545 550 555 560
Phe Ser Leu Asp Asp Lys Asp Arg Lys Asn Thr Pro Gly Gln Leu Ser
565 570 575
Thr Asn Phe Tyr Ala Glu Tyr Asp Gly Tyr Tyr Lys Asp Phe Glu Phe
580 585 590
Ile Lys Tyr Tyr Asn Glu Phe Arg Asn Phe Ile Thr Lys Lys Pro Phe
595 600 605
Asp Glu Asp Lys Ile Lys Leu Asn Phe Glu Asn Gly Ala Leu Leu Lys
610 615 620
Gly Trp Asp Glu Asn Lys Glu Tyr Asp Phe Met Gly Val Ile Leu Lys
625 630 635 640
Lys Glu Gly Arg Leu Tyr Leu Gly Ile Met His Lys Asn His Arg Lys
645 650 655
Leu Phe Gln Ser Met Gly Asn Ala Lys Gly Asp Asn Ala Asn Arg Tyr
660 665 670
Gln Lys Met Ile Tyr Lys Gln Ile Ala Asp Ala Ser Lys Asp Val Pro
675 680 685
Arg Leu Leu Leu Thr Ser Lys Lys Ala Met Glu Lys Phe Lys Pro Ser
690 695 700
Gln Glu Ile Leu Arg Ile Lys Lys Glu Lys Thr Phe Lys Arg Glu Ser
705 710 715 720
Lys Asn Phe Ser Leu Arg Asp Leu His Ala Leu Ile Glu Tyr Tyr Arg
725 730 735
Asn Cys Ile Pro Gln Tyr Ser Asn Trp Ser Phe Tyr Asp Phe Gln Phe
740 745 750
Gln Asp Thr Gly Lys Tyr Gln Asn Ile Lys Glu Phe Thr Asp Asp Val
755 760 765
Gln Lys Tyr Gly Tyr Lys Ile Ser Phe Arg Asp Ile Asp Asp Glu Tyr
770 775 780
Ile Asn Gln Ala Leu Asn Glu Gly Lys Met Tyr Leu Phe Glu Val Val
785 790 795 800
Asn Lys Asp Ile Tyr Asn Thr Lys Asn Gly Ser Lys Asn Leu His Thr
805 810 815
Leu Tyr Phe Glu His Ile Leu Ser Ala Glu Asn Leu Asn Asp Pro Val
820 825 830
Phe Lys Leu Ser Gly Met Ala Glu Ile Phe Gln Arg Gln Pro Ser Val
835 840 845
Asn Glu Arg Glu Lys Ile Thr Thr Gln Lys Asn Gln Cys Ile Leu Asp
850 855 860
Lys Gly Asp Arg Ala Tyr Lys Tyr Arg Arg Tyr Thr Glu Lys Lys Ile
865 870 875 880
Met Phe His Met Ser Leu Val Leu Asn Thr Gly Lys Gly Glu Ile Lys
885 890 895
Gln Val Gln Phe Asn Lys Ile Ile Asn Gln Arg Ile Ser Ser Ser Asp
900 905 910
Asn Glu Met Arg Val Asn Val Ile Gly Ile Asp Arg Gly Glu Lys Asn
915 920 925
Leu Leu Tyr Tyr Ser Val Val Lys Gln Asn Gly Glu Ile Ile Glu Gln
930 935 940
Ala Ser Leu Asn Glu Ile Asn Gly Val Asn Tyr Arg Asp Lys Leu Ile
945 950 955 960
Glu Arg Glu Lys Glu Arg Leu Lys Asn Arg Gln Ser Trp Lys Pro Val
965 970 975
Val Lys Ile Lys Asp Leu Lys Lys Gly Tyr Ile Ser His Val Ile His
980 985 990
Lys Ile Cys Gln Leu Ile Glu Lys Tyr Ser Ala Ile Val Val Leu Glu
995 1000 1005
Asp Leu Asn Met Arg Phe Lys Gln Ile Arg Gly Gly Ile Glu Arg
1010 1015 1020
Ser Val Tyr Gln Gln Phe Glu Lys Ala Leu Ile Asp Lys Leu Gly
1025 1030 1035
Tyr Leu Val Phe Lys Asp Asn Arg Asp Leu Arg Ala Pro Gly Gly
1040 1045 1050
Val Leu Asn Gly Tyr Gln Leu Ser Ala Pro Phe Val Ser Phe Glu
1055 1060 1065
Lys Met Arg Lys Gln Thr Gly Ile Leu Phe Tyr Thr Gln Ala Glu
1070 1075 1080
Tyr Thr Ser Lys Thr Asp Pro Ile Thr Gly Phe Arg Lys Asn Val
1085 1090 1095
Tyr Ile Ser Asn Ser Ala Ser Leu Asp Lys Ile Lys Glu Ala Val
1100 1105 1110
Lys Lys Phe Asp Ala Ile Gly Trp Asp Gly Lys Glu Gln Ser Tyr
1115 1120 1125
Phe Phe Lys Tyr Asn Pro Tyr Asn Leu Ala Asp Glu Lys Tyr Lys
1130 1135 1140
Asn Ser Thr Val Ser Lys Glu Trp Ala Ile Phe Ala Ser Ala Pro
1145 1150 1155
Arg Ile Arg Arg Gln Lys Gly Glu Asp Gly Tyr Trp Lys Tyr Asp
1160 1165 1170
Arg Val Lys Val Asn Glu Glu Phe Glu Lys Leu Leu Lys Val Trp
1175 1180 1185
Asn Phe Val Asn Pro Lys Ala Thr Asp Ile Lys Gln Glu Ile Ile
1190 1195 1200
Lys Lys Glu Lys Ala Gly Asp Leu Gln Gly Glu Lys Glu Leu Asp
1205 1210 1215
Gly Arg Leu Arg Asn Phe Trp His Ser Phe Ile Tyr Leu Phe Asn
1220 1225 1230
Leu Val Leu Glu Leu Arg Asn Ser Phe Ser Leu Gln Ile Lys Ile
1235 1240 1245
Lys Ala Gly Glu Val Ile Ala Val Asp Glu Gly Val Asp Phe Ile
1250 1255 1260
Ala Ser Pro Val Lys Pro Phe Phe Thr Thr Pro Asn Pro Tyr Ile
1265 1270 1275
Pro Ser Asn Leu Cys Trp Leu Ala Val Glu Asn Ala Asp Ala Asn
1280 1285 1290
Gly Ala Tyr Asn Ile Ala Arg Lys Gly Val Met Ile Leu Lys Lys
1295 1300 1305
Ile Arg Glu His Ala Lys Lys Asp Pro Glu Phe Lys Lys Leu Pro
1310 1315 1320
Asn Leu Phe Ile Ser Asn Ala Glu Trp Asp Glu Ala Ala Arg Asp
1325 1330 1335
Trp Gly Lys Tyr Ala Gly Thr Thr Ala Leu Asn Leu Asp His
1340 1345 1350
<210> 134
<211> 1206
<212> PRT
<213> 毛螺菌科细菌(Lachnospiraceae bacterium)
<400> 134
Met Tyr Tyr Glu Ser Leu Thr Lys Gln Tyr Pro Val Ser Lys Thr Ile
1 5 10 15
Arg Asn Glu Leu Ile Pro Ile Gly Lys Thr Leu Asp Asn Ile Arg Gln
20 25 30
Asn Asn Ile Leu Glu Ser Asp Val Lys Arg Lys Gln Asn Tyr Glu His
35 40 45
Val Lys Gly Ile Leu Asp Glu Tyr His Lys Gln Leu Ile Asn Glu Ala
50 55 60
Leu Asp Asn Cys Thr Leu Pro Ser Leu Lys Ile Ala Ala Glu Ile Tyr
65 70 75 80
Leu Lys Asn Gln Lys Glu Val Ser Asp Arg Glu Asp Phe Asn Lys Thr
85 90 95
Gln Asp Leu Leu Arg Lys Glu Val Val Glu Lys Leu Lys Ala His Glu
100 105 110
Asn Phe Thr Lys Ile Gly Lys Lys Asp Ile Leu Asp Leu Leu Glu Lys
115 120 125
Leu Pro Ser Ile Ser Glu Asp Asp Tyr Asn Ala Leu Glu Ser Phe Arg
130 135 140
Asn Phe Tyr Thr Tyr Phe Thr Ser Tyr Asn Lys Val Arg Glu Asn Leu
145 150 155 160
Tyr Ser Asp Lys Glu Lys Ser Ser Thr Val Ala Tyr Arg Leu Ile Asn
165 170 175
Glu Asn Phe Pro Lys Phe Leu Asp Asn Val Lys Ser Tyr Arg Phe Val
180 185 190
Lys Thr Ala Gly Ile Leu Ala Asp Gly Leu Gly Glu Glu Glu Gln Asp
195 200 205
Ser Leu Phe Ile Val Glu Thr Phe Asn Lys Thr Leu Thr Gln Asp Gly
210 215 220
Ile Asp Thr Tyr Asn Ser Gln Val Gly Lys Ile Asn Ser Ser Ile Asn
225 230 235 240
Leu Tyr Asn Gln Lys Asn Gln Lys Ala Asn Gly Phe Arg Lys Ile Pro
245 250 255
Lys Met Lys Met Leu Tyr Lys Gln Ile Leu Ser Asp Arg Glu Glu Ser
260 265 270
Phe Ile Asp Glu Phe Gln Ser Asp Glu Val Leu Ile Asp Asn Val Glu
275 280 285
Ser Tyr Gly Ser Val Leu Ile Glu Ser Leu Lys Ser Ser Lys Val Ser
290 295 300
Ala Phe Phe Asp Ala Leu Arg Glu Ser Lys Gly Lys Asn Val Tyr Val
305 310 315 320
Lys Asn Asp Leu Ala Lys Thr Ala Met Ser Asn Ile Val Phe Glu Asn
325 330 335
Trp Arg Thr Phe Asp Asp Leu Leu Asn Gln Glu Tyr Asp Leu Ala Asn
340 345 350
Glu Asn Lys Lys Lys Asp Asp Lys Tyr Phe Glu Lys Arg Gln Lys Glu
355 360 365
Leu Lys Lys Asn Lys Ser Tyr Ser Leu Glu His Leu Cys Asn Leu Ser
370 375 380
Glu Asp Ser Cys Asn Leu Ile Glu Asn Tyr Ile His Gln Ile Ser Asp
385 390 395 400
Asp Ile Glu Asn Ile Ile Ile Asn Asn Glu Thr Phe Leu Arg Ile Val
405 410 415
Ile Asn Glu His Asp Arg Ser Arg Lys Leu Ala Lys Asn Arg Lys Ala
420 425 430
Val Lys Ala Ile Lys Asp Phe Leu Asp Ser Ile Lys Val Leu Glu Arg
435 440 445
Glu Leu Lys Leu Ile Asn Ser Ser Gly Gln Glu Leu Glu Lys Asp Leu
450 455 460
Ile Val Tyr Ser Ala His Glu Glu Leu Leu Val Glu Leu Lys Gln Val
465 470 475 480
Asp Ser Leu Tyr Asn Met Thr Arg Asn Tyr Leu Thr Lys Lys Pro Phe
485 490 495
Ser Thr Glu Lys Val Lys Leu Asn Phe Asn Arg Ser Thr Leu Leu Asn
500 505 510
Gly Trp Asp Arg Asn Lys Glu Thr Asp Asn Leu Gly Val Leu Leu Leu
515 520 525
Lys Asp Gly Lys Tyr Tyr Leu Gly Ile Met Asn Thr Ser Ala Asn Lys
530 535 540
Ala Phe Val Asn Pro Pro Val Ala Lys Thr Glu Lys Val Phe Lys Lys
545 550 555 560
Val Asp Tyr Lys Leu Leu Pro Val Pro Asn Gln Met Leu Pro Lys Val
565 570 575
Phe Phe Ala Lys Ser Asn Ile Asp Phe Tyr Asn Pro Ser Ser Glu Ile
580 585 590
Tyr Ser Asn Tyr Lys Lys Gly Thr His Lys Lys Gly Asn Met Phe Ser
595 600 605
Leu Glu Asp Cys His Asn Leu Ile Asp Phe Phe Lys Glu Ser Ile Ser
610 615 620
Lys His Glu Asp Trp Ser Lys Phe Gly Phe Lys Phe Ser Asp Thr Ala
625 630 635 640
Ser Tyr Asn Asp Ile Ser Glu Phe Tyr Arg Glu Val Glu Lys Gln Gly
645 650 655
Tyr Lys Leu Thr Tyr Thr Asp Ile Asp Glu Thr Tyr Ile Asn Asp Leu
660 665 670
Ile Glu Arg Asn Glu Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe
675 680 685
Ser Met Tyr Ser Lys Gly Lys Leu Asn Leu His Thr Leu Tyr Phe Met
690 695 700
Met Leu Phe Asp Gln Arg Asn Ile Asp Asp Val Val Tyr Lys Leu Asn
705 710 715 720
Gly Glu Ala Glu Val Phe Tyr Arg Pro Ala Ser Ile Ser Glu Asp Glu
725 730 735
Leu Ile Ile His Lys Ala Gly Glu Glu Ile Lys Asn Lys Asn Pro Asn
740 745 750
Arg Ala Arg Thr Lys Glu Thr Ser Thr Phe Ser Tyr Asp Ile Val Lys
755 760 765
Asp Lys Arg Tyr Ser Lys Asp Lys Phe Thr Leu His Ile Pro Ile Thr
770 775 780
Met Asn Phe Gly Val Asp Glu Val Lys Arg Phe Asn Asp Ala Val Asn
785 790 795 800
Ser Ala Ile Arg Ile Asp Glu Asn Val Asn Val Ile Gly Ile Asp Arg
805 810 815
Gly Glu Arg Asn Leu Leu Tyr Val Val Val Ile Asp Ser Lys Gly Asn
820 825 830
Ile Leu Glu Gln Ile Ser Leu Asn Ser Ile Ile Asn Lys Glu Tyr Asp
835 840 845
Ile Glu Thr Asp Tyr His Ala Leu Leu Asp Glu Arg Glu Gly Gly Arg
850 855 860
Asp Lys Ala Arg Lys Asp Trp Asn Thr Val Glu Asn Ile Arg Asp Leu
865 870 875 880
Lys Ala Gly Tyr Leu Ser Gln Val Val Asn Val Val Ala Lys Leu Val
885 890 895
Leu Lys Tyr Asn Ala Ile Ile Cys Leu Glu Asp Leu Asn Phe Gly Phe
900 905 910
Lys Arg Gly Arg Gln Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu
915 920 925
Lys Met Leu Ile Asp Lys Leu Asn Tyr Leu Val Ile Asp Lys Ser Arg
930 935 940
Glu Gln Thr Ser Pro Lys Glu Leu Gly Gly Ala Leu Asn Ala Leu Gln
945 950 955 960
Leu Thr Ser Lys Phe Lys Ser Phe Lys Glu Leu Gly Lys Gln Ser Gly
965 970 975
Val Ile Tyr Tyr Val Pro Ala Tyr Leu Thr Ser Lys Ile Asp Pro Thr
980 985 990
Thr Gly Phe Ala Asn Leu Phe Tyr Met Lys Cys Glu Asn Val Glu Lys
995 1000 1005
Ser Lys Arg Phe Phe Asp Gly Phe Asp Phe Ile Arg Phe Asn Ala
1010 1015 1020
Leu Glu Asn Val Phe Glu Phe Gly Phe Asp Tyr Arg Ser Phe Thr
1025 1030 1035
Gln Arg Ala Cys Gly Ile Asn Ser Lys Trp Thr Val Cys Thr Asn
1040 1045 1050
Gly Glu Arg Ile Ile Lys Tyr Arg Asn Pro Asp Lys Asn Asn Met
1055 1060 1065
Phe Asp Glu Lys Val Val Val Val Thr Asp Glu Met Lys Asn Leu
1070 1075 1080
Phe Glu Gln Tyr Lys Ile Pro Tyr Glu Asp Gly Arg Asn Val Lys
1085 1090 1095
Asp Met Ile Ile Ser Asn Glu Glu Ala Glu Phe Tyr Arg Arg Leu
1100 1105 1110
Tyr Arg Leu Leu Gln Gln Thr Leu Gln Met Arg Asn Ser Thr Ser
1115 1120 1125
Asp Gly Thr Arg Asp Tyr Ile Ile Ser Pro Val Lys Asn Lys Arg
1130 1135 1140
Glu Ala Tyr Phe Asn Ser Glu Leu Ser Asp Gly Ser Val Pro Lys
1145 1150 1155
Asp Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Gly Leu
1160 1165 1170
Trp Val Leu Glu Gln Ile Arg Gln Lys Ser Glu Gly Glu Lys Ile
1175 1180 1185
Asn Leu Ala Met Thr Asn Ala Glu Trp Leu Glu Tyr Ala Gln Thr
1190 1195 1200
His Leu Leu
1205
<210> 135
<211> 1238
<212> PRT
<213> Candidatus Methanoplasma termitum
<400> 135
Met Asn Asn Tyr Asp Glu Phe Thr Lys Leu Tyr Pro Ile Gln Lys Thr
1 5 10 15
Ile Arg Phe Glu Leu Lys Pro Gln Gly Arg Thr Met Glu His Leu Glu
20 25 30
Thr Phe Asn Phe Phe Glu Glu Asp Arg Asp Arg Ala Glu Lys Tyr Lys
35 40 45
Ile Leu Lys Glu Ala Ile Asp Glu Tyr His Lys Lys Phe Ile Asp Glu
50 55 60
His Leu Thr Asn Met Ser Leu Asp Trp Asn Ser Leu Lys Gln Ile Ser
65 70 75 80
Glu Lys Tyr Tyr Lys Ser Arg Glu Glu Lys Asp Lys Lys Val Phe Leu
85 90 95
Ser Glu Gln Lys Arg Met Arg Gln Glu Ile Val Ser Glu Phe Lys Lys
100 105 110
Asp Asp Arg Phe Lys Asp Leu Phe Ser Lys Lys Leu Phe Ser Glu Leu
115 120 125
Leu Lys Glu Glu Ile Tyr Lys Lys Gly Asn His Gln Glu Ile Asp Ala
130 135 140
Leu Lys Ser Phe Asp Lys Phe Ser Gly Tyr Phe Ile Gly Leu His Glu
145 150 155 160
Asn Arg Lys Asn Met Tyr Ser Asp Gly Asp Glu Ile Thr Ala Ile Ser
165 170 175
Asn Arg Ile Val Asn Glu Asn Phe Pro Lys Phe Leu Asp Asn Leu Gln
180 185 190
Lys Tyr Gln Glu Ala Arg Lys Lys Tyr Pro Glu Trp Ile Ile Lys Ala
195 200 205
Glu Ser Ala Leu Val Ala His Asn Ile Lys Met Asp Glu Val Phe Ser
210 215 220
Leu Glu Tyr Phe Asn Lys Val Leu Asn Gln Glu Gly Ile Gln Arg Tyr
225 230 235 240
Asn Leu Ala Leu Gly Gly Tyr Val Thr Lys Ser Gly Glu Lys Met Met
245 250 255
Gly Leu Asn Asp Ala Leu Asn Leu Ala His Gln Ser Glu Lys Ser Ser
260 265 270
Lys Gly Arg Ile His Met Thr Pro Leu Phe Lys Gln Ile Leu Ser Glu
275 280 285
Lys Glu Ser Phe Ser Tyr Ile Pro Asp Val Phe Thr Glu Asp Ser Gln
290 295 300
Leu Leu Pro Ser Ile Gly Gly Phe Phe Ala Gln Ile Glu Asn Asp Lys
305 310 315 320
Asp Gly Asn Ile Phe Asp Arg Ala Leu Glu Leu Ile Ser Ser Tyr Ala
325 330 335
Glu Tyr Asp Thr Glu Arg Ile Tyr Ile Arg Gln Ala Asp Ile Asn Arg
340 345 350
Val Ser Asn Val Ile Phe Gly Glu Trp Gly Thr Leu Gly Gly Leu Met
355 360 365
Arg Glu Tyr Lys Ala Asp Ser Ile Asn Asp Ile Asn Leu Glu Arg Thr
370 375 380
Cys Lys Lys Val Asp Lys Trp Leu Asp Ser Lys Glu Phe Ala Leu Ser
385 390 395 400
Asp Val Leu Glu Ala Ile Lys Arg Thr Gly Asn Asn Asp Ala Phe Asn
405 410 415
Glu Tyr Ile Ser Lys Met Arg Thr Ala Arg Glu Lys Ile Asp Ala Ala
420 425 430
Arg Lys Glu Met Lys Phe Ile Ser Glu Lys Ile Ser Gly Asp Glu Glu
435 440 445
Ser Ile His Ile Ile Lys Thr Leu Leu Asp Ser Val Gln Gln Phe Leu
450 455 460
His Phe Phe Asn Leu Phe Lys Ala Arg Gln Asp Ile Pro Leu Asp Gly
465 470 475 480
Ala Phe Tyr Ala Glu Phe Asp Glu Val His Ser Lys Leu Phe Ala Ile
485 490 495
Val Pro Leu Tyr Asn Lys Val Arg Asn Tyr Leu Thr Lys Asn Asn Leu
500 505 510
Asn Thr Lys Lys Ile Lys Leu Asn Phe Lys Asn Pro Thr Leu Ala Asn
515 520 525
Gly Trp Asp Gln Asn Lys Val Tyr Asp Tyr Ala Ser Leu Ile Phe Leu
530 535 540
Arg Asp Gly Asn Tyr Tyr Leu Gly Ile Ile Asn Pro Lys Arg Lys Lys
545 550 555 560
Asn Ile Lys Phe Glu Gln Gly Ser Gly Asn Gly Pro Phe Tyr Arg Lys
565 570 575
Met Val Tyr Lys Gln Ile Pro Gly Pro Asn Lys Asn Leu Pro Arg Val
580 585 590
Phe Leu Thr Ser Thr Lys Gly Lys Lys Glu Tyr Lys Pro Ser Lys Glu
595 600 605
Ile Ile Glu Gly Tyr Glu Ala Asp Lys His Ile Arg Gly Asp Lys Phe
610 615 620
Asp Leu Asp Phe Cys His Lys Leu Ile Asp Phe Phe Lys Glu Ser Ile
625 630 635 640
Glu Lys His Lys Asp Trp Ser Lys Phe Asn Phe Tyr Phe Ser Pro Thr
645 650 655
Glu Ser Tyr Gly Asp Ile Ser Glu Phe Tyr Leu Asp Val Glu Lys Gln
660 665 670
Gly Tyr Arg Met His Phe Glu Asn Ile Ser Ala Glu Thr Ile Asp Glu
675 680 685
Tyr Val Glu Lys Gly Asp Leu Phe Leu Phe Gln Ile Tyr Asn Lys Asp
690 695 700
Phe Val Lys Ala Ala Thr Gly Lys Lys Asp Met His Thr Ile Tyr Trp
705 710 715 720
Asn Ala Ala Phe Ser Pro Glu Asn Leu Gln Asp Val Val Val Lys Leu
725 730 735
Asn Gly Glu Ala Glu Leu Phe Tyr Arg Asp Lys Ser Asp Ile Lys Glu
740 745 750
Ile Val His Arg Glu Gly Glu Ile Leu Val Asn Arg Thr Tyr Asn Gly
755 760 765
Arg Thr Pro Val Pro Asp Lys Ile His Lys Lys Leu Thr Asp Tyr His
770 775 780
Asn Gly Arg Thr Lys Asp Leu Gly Glu Ala Lys Glu Tyr Leu Asp Lys
785 790 795 800
Val Arg Tyr Phe Lys Ala His Tyr Asp Ile Thr Lys Asp Arg Arg Tyr
805 810 815
Leu Asn Asp Lys Ile Tyr Phe His Val Pro Leu Thr Leu Asn Phe Lys
820 825 830
Ala Asn Gly Lys Lys Asn Leu Asn Lys Met Val Ile Glu Lys Phe Leu
835 840 845
Ser Asp Glu Lys Ala His Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn
850 855 860
Leu Leu Tyr Tyr Ser Ile Ile Asp Arg Ser Gly Lys Ile Ile Asp Gln
865 870 875 880
Gln Ser Leu Asn Val Ile Asp Gly Phe Asp Tyr Arg Glu Lys Leu Asn
885 890 895
Gln Arg Glu Ile Glu Met Lys Asp Ala Arg Gln Ser Trp Asn Ala Ile
900 905 910
Gly Lys Ile Lys Asp Leu Lys Glu Gly Tyr Leu Ser Lys Ala Val His
915 920 925
Glu Ile Thr Lys Met Ala Ile Gln Tyr Asn Ala Ile Val Val Met Glu
930 935 940
Glu Leu Asn Tyr Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln
945 950 955 960
Ile Tyr Gln Lys Phe Glu Asn Met Leu Ile Asp Lys Met Asn Tyr Leu
965 970 975
Val Phe Lys Asp Ala Pro Asp Glu Ser Pro Gly Gly Val Leu Asn Ala
980 985 990
Tyr Gln Leu Thr Asn Pro Leu Glu Ser Phe Ala Lys Leu Gly Lys Gln
995 1000 1005
Thr Gly Ile Leu Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys Ile
1010 1015 1020
Asp Pro Thr Thr Gly Phe Val Asn Leu Phe Asn Thr Ser Ser Lys
1025 1030 1035
Thr Asn Ala Gln Glu Arg Lys Glu Phe Leu Gln Lys Phe Glu Ser
1040 1045 1050
Ile Ser Tyr Ser Ala Lys Asp Gly Gly Ile Phe Ala Phe Ala Phe
1055 1060 1065
Asp Tyr Arg Lys Phe Gly Thr Ser Lys Thr Asp His Lys Asn Val
1070 1075 1080
Trp Thr Ala Tyr Thr Asn Gly Glu Arg Met Arg Tyr Ile Lys Glu
1085 1090 1095
Lys Lys Arg Asn Glu Leu Phe Asp Pro Ser Lys Glu Ile Lys Glu
1100 1105 1110
Ala Leu Thr Ser Ser Gly Ile Lys Tyr Asp Gly Gly Gln Asn Ile
1115 1120 1125
Leu Pro Asp Ile Leu Arg Ser Asn Asn Asn Gly Leu Ile Tyr Thr
1130 1135 1140
Met Tyr Ser Ser Phe Ile Ala Ala Ile Gln Met Arg Val Tyr Asp
1145 1150 1155
Gly Lys Glu Asp Tyr Ile Ile Ser Pro Ile Lys Asn Ser Lys Gly
1160 1165 1170
Glu Phe Phe Arg Thr Asp Pro Lys Arg Arg Glu Leu Pro Ile Asp
1175 1180 1185
Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Leu Arg Gly Glu Leu
1190 1195 1200
Thr Met Arg Ala Ile Ala Glu Lys Phe Asp Pro Asp Ser Glu Lys
1205 1210 1215
Met Ala Lys Leu Glu Leu Lys His Lys Asp Trp Phe Glu Phe Met
1220 1225 1230
Gln Thr Arg Gly Asp
1235
<210> 136
<211> 1282
<212> PRT
<213> 挑剔真杆菌(Eubacterium eligens)
<400> 136
Met Asn Gly Asn Arg Ser Ile Val Tyr Arg Glu Phe Val Gly Val Ile
1 5 10 15
Pro Val Ala Lys Thr Leu Arg Asn Glu Leu Arg Pro Val Gly His Thr
20 25 30
Gln Glu His Ile Ile Gln Asn Gly Leu Ile Gln Glu Asp Glu Leu Arg
35 40 45
Gln Glu Lys Ser Thr Glu Leu Lys Asn Ile Met Asp Asp Tyr Tyr Arg
50 55 60
Glu Tyr Ile Asp Lys Ser Leu Ser Gly Val Thr Asp Leu Asp Phe Thr
65 70 75 80
Leu Leu Phe Glu Leu Met Asn Leu Val Gln Ser Ser Pro Ser Lys Asp
85 90 95
Asn Lys Lys Ala Leu Glu Lys Glu Gln Ser Lys Met Arg Glu Gln Ile
100 105 110
Cys Thr His Leu Gln Ser Asp Ser Asn Tyr Lys Asn Ile Phe Asn Ala
115 120 125
Lys Leu Leu Lys Glu Ile Leu Pro Asp Phe Ile Lys Asn Tyr Asn Gln
130 135 140
Tyr Asp Val Lys Asp Lys Ala Gly Lys Leu Glu Thr Leu Ala Leu Phe
145 150 155 160
Asn Gly Phe Ser Thr Tyr Phe Thr Asp Phe Phe Glu Lys Arg Lys Asn
165 170 175
Val Phe Thr Lys Glu Ala Val Ser Thr Ser Ile Ala Tyr Arg Ile Val
180 185 190
His Glu Asn Ser Leu Ile Phe Leu Ala Asn Met Thr Ser Tyr Lys Lys
195 200 205
Ile Ser Glu Lys Ala Leu Asp Glu Ile Glu Val Ile Glu Lys Asn Asn
210 215 220
Gln Asp Lys Met Gly Asp Trp Glu Leu Asn Gln Ile Phe Asn Pro Asp
225 230 235 240
Phe Tyr Asn Met Val Leu Ile Gln Ser Gly Ile Asp Phe Tyr Asn Glu
245 250 255
Ile Cys Gly Val Val Asn Ala His Met Asn Leu Tyr Cys Gln Gln Thr
260 265 270
Lys Asn Asn Tyr Asn Leu Phe Lys Met Arg Lys Leu His Lys Gln Ile
275 280 285
Leu Ala Tyr Thr Ser Thr Ser Phe Glu Val Pro Lys Met Phe Glu Asp
290 295 300
Asp Met Ser Val Tyr Asn Ala Val Asn Ala Phe Ile Asp Glu Thr Glu
305 310 315 320
Lys Gly Asn Ile Ile Gly Lys Leu Lys Asp Ile Val Asn Lys Tyr Asp
325 330 335
Glu Leu Asp Glu Lys Arg Ile Tyr Ile Ser Lys Asp Phe Tyr Glu Thr
340 345 350
Leu Ser Cys Phe Met Ser Gly Asn Trp Asn Leu Ile Thr Gly Cys Val
355 360 365
Glu Asn Phe Tyr Asp Glu Asn Ile His Ala Lys Gly Lys Ser Lys Glu
370 375 380
Glu Lys Val Lys Lys Ala Val Lys Glu Asp Lys Tyr Lys Ser Ile Asn
385 390 395 400
Asp Val Asn Asp Leu Val Glu Lys Tyr Ile Asp Glu Lys Glu Arg Asn
405 410 415
Glu Phe Lys Asn Ser Asn Ala Lys Gln Tyr Ile Arg Glu Ile Ser Asn
420 425 430
Ile Ile Thr Asp Thr Glu Thr Ala His Leu Glu Tyr Asp Asp His Ile
435 440 445
Ser Leu Ile Glu Ser Glu Glu Lys Ala Asp Glu Met Lys Lys Arg Leu
450 455 460
Asp Met Tyr Met Asn Met Tyr His Trp Ala Lys Ala Phe Ile Val Asp
465 470 475 480
Glu Val Leu Asp Arg Asp Glu Met Phe Tyr Ser Asp Ile Asp Asp Ile
485 490 495
Tyr Asn Ile Leu Glu Asn Ile Val Pro Leu Tyr Asn Arg Val Arg Asn
500 505 510
Tyr Val Thr Gln Lys Pro Tyr Asn Ser Lys Lys Ile Lys Leu Asn Phe
515 520 525
Gln Ser Pro Thr Leu Ala Asn Gly Trp Ser Gln Ser Lys Glu Phe Asp
530 535 540
Asn Asn Ala Ile Ile Leu Ile Arg Asp Asn Lys Tyr Tyr Leu Ala Ile
545 550 555 560
Phe Asn Ala Lys Asn Lys Pro Asp Lys Lys Ile Ile Gln Gly Asn Ser
565 570 575
Asp Lys Lys Asn Asp Asn Asp Tyr Lys Lys Met Val Tyr Asn Leu Leu
580 585 590
Pro Gly Ala Asn Lys Met Leu Pro Lys Val Phe Leu Ser Lys Lys Gly
595 600 605
Ile Glu Thr Phe Lys Pro Ser Asp Tyr Ile Ile Ser Gly Tyr Asn Ala
610 615 620
His Lys His Ile Lys Thr Ser Glu Asn Phe Asp Ile Ser Phe Cys Arg
625 630 635 640
Asp Leu Ile Asp Tyr Phe Lys Asn Ser Ile Glu Lys His Ala Glu Trp
645 650 655
Arg Lys Tyr Glu Phe Lys Phe Ser Ala Thr Asp Ser Tyr Ser Asp Ile
660 665 670
Ser Glu Phe Tyr Arg Glu Val Glu Met Gln Gly Tyr Arg Ile Asp Trp
675 680 685
Thr Tyr Ile Ser Glu Ala Asp Ile Asn Lys Leu Asp Glu Glu Gly Lys
690 695 700
Ile Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Glu Asn Ser Thr
705 710 715 720
Gly Lys Glu Asn Leu His Thr Met Tyr Phe Lys Asn Ile Phe Ser Glu
725 730 735
Glu Asn Leu Lys Asp Ile Ile Ile Lys Leu Asn Gly Gln Ala Glu Leu
740 745 750
Phe Tyr Arg Arg Ala Ser Val Lys Asn Pro Val Lys His Lys Lys Asp
755 760 765
Ser Val Leu Val Asn Lys Thr Tyr Lys Asn Gln Leu Asp Asn Gly Asp
770 775 780
Val Val Arg Ile Pro Ile Pro Asp Asp Ile Tyr Asn Glu Ile Tyr Lys
785 790 795 800
Met Tyr Asn Gly Tyr Ile Lys Glu Ser Asp Leu Ser Glu Ala Ala Lys
805 810 815
Glu Tyr Leu Asp Lys Val Glu Val Arg Thr Ala Gln Lys Asp Ile Val
820 825 830
Lys Asp Tyr Arg Tyr Thr Val Asp Lys Tyr Phe Ile His Thr Pro Ile
835 840 845
Thr Ile Asn Tyr Lys Val Thr Ala Arg Asn Asn Val Asn Asp Met Val
850 855 860
Val Lys Tyr Ile Ala Gln Asn Asp Asp Ile His Val Ile Gly Ile Asp
865 870 875 880
Arg Gly Glu Arg Asn Leu Ile Tyr Ile Ser Val Ile Asp Ser His Gly
885 890 895
Asn Ile Val Lys Gln Lys Ser Tyr Asn Ile Leu Asn Asn Tyr Asp Tyr
900 905 910
Lys Lys Lys Leu Val Glu Lys Glu Lys Thr Arg Glu Tyr Ala Arg Lys
915 920 925
Asn Trp Lys Ser Ile Gly Asn Ile Lys Glu Leu Lys Glu Gly Tyr Ile
930 935 940
Ser Gly Val Val His Glu Ile Ala Met Leu Ile Val Glu Tyr Asn Ala
945 950 955 960
Ile Ile Ala Met Glu Asp Leu Asn Tyr Gly Phe Lys Arg Gly Arg Phe
965 970 975
Lys Val Glu Arg Gln Val Tyr Gln Lys Phe Glu Ser Met Leu Ile Asn
980 985 990
Lys Leu Asn Tyr Phe Ala Ser Lys Glu Lys Ser Val Asp Glu Pro Gly
995 1000 1005
Gly Leu Leu Lys Gly Tyr Gln Leu Thr Tyr Val Pro Asp Asn Ile
1010 1015 1020
Lys Asn Leu Gly Lys Gln Cys Gly Val Ile Phe Tyr Val Pro Ala
1025 1030 1035
Ala Phe Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Ile Ser Ala
1040 1045 1050
Phe Asn Phe Lys Ser Ile Ser Thr Asn Ala Ser Arg Lys Gln Phe
1055 1060 1065
Phe Met Gln Phe Asp Glu Ile Arg Tyr Cys Ala Glu Lys Asp Met
1070 1075 1080
Phe Ser Phe Gly Phe Asp Tyr Asn Asn Phe Asp Thr Tyr Asn Ile
1085 1090 1095
Thr Met Gly Lys Thr Gln Trp Thr Val Tyr Thr Asn Gly Glu Arg
1100 1105 1110
Leu Gln Ser Glu Phe Asn Asn Ala Arg Arg Thr Gly Lys Thr Lys
1115 1120 1125
Ser Ile Asn Leu Thr Glu Thr Ile Lys Leu Leu Leu Glu Asp Asn
1130 1135 1140
Glu Ile Asn Tyr Ala Asp Gly His Asp Ile Arg Ile Asp Met Glu
1145 1150 1155
Lys Met Asp Glu Asp Lys Lys Ser Glu Phe Phe Ala Gln Leu Leu
1160 1165 1170
Ser Leu Tyr Lys Leu Thr Val Gln Met Arg Asn Ser Tyr Thr Glu
1175 1180 1185
Ala Glu Glu Gln Glu Asn Gly Ile Ser Tyr Asp Lys Ile Ile Ser
1190 1195 1200
Pro Val Ile Asn Asp Glu Gly Glu Phe Phe Asp Ser Asp Asn Tyr
1205 1210 1215
Lys Glu Ser Asp Asp Lys Glu Cys Lys Met Pro Lys Asp Ala Asp
1220 1225 1230
Ala Asn Gly Ala Tyr Cys Ile Ala Leu Lys Gly Leu Tyr Glu Val
1235 1240 1245
Leu Lys Ile Lys Ser Glu Trp Thr Glu Asp Gly Phe Asp Arg Asn
1250 1255 1260
Cys Leu Lys Leu Pro His Ala Glu Trp Leu Asp Phe Ile Gln Asn
1265 1270 1275
Lys Arg Tyr Glu
1280
<210> 137
<211> 1373
<212> PRT
<213> Moraxella bovoculi
<400> 137
Met Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val
1 5 10 15
Arg Phe Glu Leu Lys Pro Ile Asp Arg Thr Leu Glu His Ile His Ala
20 25 30
Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met His Gln Lys
35 40 45
Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met
50 55 60
Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr
65 70 75 80
Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Glu Leu Gln Lys Gln Leu
85 90 95
Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ile Val Lys Pro Ile Gly
100 105 110
Asn Gly Gly Lys Tyr Lys Ala Gly Tyr Asp Arg Leu Phe Gly Ala Lys
115 120 125
Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile
130 135 140
Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe
145 150 155 160
Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn
165 170 175
Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile
180 185 190
His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr
195 200 205
Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu
210 215 220
Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr
225 230 235 240
His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Thr Leu Leu
245 250 255
Gly Gly Ile Ser Gly Glu Ala Gly Ser Pro Lys Ile Gln Gly Ile Asn
260 265 270
Glu Leu Ile Asn Ser His His Asn Gln His Cys His Lys Ser Glu Arg
275 280 285
Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser Asp Gly Met
290 295 300
Ser Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser Glu Met Cys
305 310 315 320
Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Ala Asp Val Phe Ala Lys
325 330 335
Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys Asp Gly Ile
340 345 350
Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln Ala Phe Gly
355 360 365
Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr Val Asp Val
370 375 380
Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys Thr Asp Asn
385 390 395 400
Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile Lys Gly Val
405 410 415
His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His Tyr Thr Ala Arg
420 425 430
His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln Tyr Phe Lys
435 440 445
His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile His Asn Asn
450 455 460
His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro Ala Gly Glu
465 470 475 480
Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu Met Thr Gln
485 490 495
Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn Val Ala His
500 505 510
Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn Gln Asp Gly
515 520 525
Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu Ala Lys Ile
530 535 540
Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln Lys Pro Phe
545 550 555 560
Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr Leu Leu Asn
565 570 575
Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val Ile Leu Gln
580 585 590
Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala His Lys Lys
595 600 605
Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Ser Ile Tyr Gln Lys Met
610 615 620
Ile Tyr Lys Tyr Leu Glu Val Arg Lys Gln Phe Pro Lys Val Phe Phe
625 630 635 640
Ser Lys Glu Ala Ile Ala Ile Asn Tyr His Pro Ser Lys Glu Leu Val
645 650 655
Glu Ile Lys Asp Lys Gly Arg Gln Arg Ser Asp Asp Glu Arg Leu Lys
660 665 670
Leu Tyr Arg Phe Ile Leu Glu Cys Leu Lys Ile His Pro Lys Tyr Asp
675 680 685
Lys Lys Phe Glu Gly Ala Ile Gly Asp Ile Gln Leu Phe Lys Lys Asp
690 695 700
Lys Lys Gly Arg Glu Val Pro Ile Ser Glu Lys Asp Leu Phe Asp Lys
705 710 715 720
Ile Asn Gly Ile Phe Ser Ser Lys Pro Lys Leu Glu Met Glu Asp Phe
725 730 735
Phe Ile Gly Glu Phe Lys Arg Tyr Asn Pro Ser Gln Asp Leu Val Asp
740 745 750
Gln Tyr Asn Ile Tyr Lys Lys Ile Asp Ser Asn Asp Asn Arg Lys Lys
755 760 765
Glu Asn Phe Tyr Asn Asn His Pro Lys Phe Lys Lys Asp Leu Val Arg
770 775 780
Tyr Tyr Tyr Glu Ser Met Cys Lys His Glu Glu Trp Glu Glu Ser Phe
785 790 795 800
Glu Phe Ser Lys Lys Leu Gln Asp Ile Gly Cys Tyr Val Asp Val Asn
805 810 815
Glu Leu Phe Thr Glu Ile Glu Thr Arg Arg Leu Asn Tyr Lys Ile Ser
820 825 830
Phe Cys Asn Ile Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly
835 840 845
Gln Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys Ala
850 855 860
His Gly Lys Pro Asn Leu His Thr Leu Tyr Phe Lys Ala Leu Phe Ser
865 870 875 880
Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys Leu Asn Gly Glu Ala Gln
885 890 895
Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met Asn Glu Thr Thr Ile His
900 905 910
Arg Ala Gly Glu Val Leu Glu Asn Lys Asn Pro Asp Asn Pro Lys Lys
915 920 925
Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp
930 935 940
Lys Phe Met Leu His Val Pro Ile Thr Met Asn Phe Gly Val Gln Gly
945 950 955 960
Met Thr Ile Lys Glu Phe Asn Lys Lys Val Asn Gln Ser Ile Gln Gln
965 970 975
Tyr Asp Glu Val Asn Val Ile Gly Ile Asp Arg Gly Glu Arg His Leu
980 985 990
Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly Glu Ile Leu Glu Gln Cys
995 1000 1005
Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala Asn Gly Thr Gln Met
1010 1015 1020
Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg
1025 1030 1035
Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr Ile Lys Glu
1040 1045 1050
Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile Ser Gln
1055 1060 1065
Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu Asn
1070 1075 1080
Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr
1085 1090 1095
Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val
1100 1105 1110
Leu Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala
1115 1120 1125
Leu Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys
1130 1135 1140
Gln Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys
1145 1150 1155
Ile Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr
1160 1165 1170
Glu Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys
1175 1180 1185
Ile Cys Tyr Asn Ala Asp Lys Asp Tyr Phe Glu Phe His Ile Asp
1190 1195 1200
Tyr Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Ile Trp
1205 1210 1215
Thr Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr
1220 1225 1230
Ala Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp
1235 1240 1245
Glu Leu Lys Ser Leu Phe Ala Arg His His Ile Asn Glu Lys Gln
1250 1255 1260
Pro Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe
1265 1270 1275
His Lys Ser Leu Met Tyr Leu Leu Lys Thr Leu Leu Ala Leu Arg
1280 1285 1290
Tyr Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val
1295 1300 1305
Ala Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp
1310 1315 1320
Thr Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala
1325 1330 1335
Leu Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp
1340 1345 1350
Leu Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn
1355 1360 1365
Phe Ala Gln Asn Arg
1370
<210> 138
<211> 1323
<212> PRT
<213> 解糖胨普雷沃菌(Prevotella disiens)
<400> 138
Met Glu Asn Tyr Gln Glu Phe Thr Asn Leu Phe Gln Leu Asn Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Lys Pro Ile Gly Lys Thr Cys Glu Leu Leu Glu
20 25 30
Glu Gly Lys Ile Phe Ala Ser Gly Ser Phe Leu Glu Lys Asp Lys Val
35 40 45
Arg Ala Asp Asn Val Ser Tyr Val Lys Lys Glu Ile Asp Lys Lys His
50 55 60
Lys Ile Phe Ile Glu Glu Thr Leu Ser Ser Phe Ser Ile Ser Asn Asp
65 70 75 80
Leu Leu Lys Gln Tyr Phe Asp Cys Tyr Asn Glu Leu Lys Ala Phe Lys
85 90 95
Lys Asp Cys Lys Ser Asp Glu Glu Glu Val Lys Lys Thr Ala Leu Arg
100 105 110
Asn Lys Cys Thr Ser Ile Gln Arg Ala Met Arg Glu Ala Ile Ser Gln
115 120 125
Ala Phe Leu Lys Ser Pro Gln Lys Lys Leu Leu Ala Ile Lys Asn Leu
130 135 140
Ile Glu Asn Val Phe Lys Ala Asp Glu Asn Val Gln His Phe Ser Glu
145 150 155 160
Phe Thr Ser Tyr Phe Ser Gly Phe Glu Thr Asn Arg Glu Asn Phe Tyr
165 170 175
Ser Asp Glu Glu Lys Ser Thr Ser Ile Ala Tyr Arg Leu Val His Asp
180 185 190
Asn Leu Pro Ile Phe Ile Lys Asn Ile Tyr Ile Phe Glu Lys Leu Lys
195 200 205
Glu Gln Phe Asp Ala Lys Thr Leu Ser Glu Ile Phe Glu Asn Tyr Lys
210 215 220
Leu Tyr Val Ala Gly Ser Ser Leu Asp Glu Val Phe Ser Leu Glu Tyr
225 230 235 240
Phe Asn Asn Thr Leu Thr Gln Lys Gly Ile Asp Asn Tyr Asn Ala Val
245 250 255
Ile Gly Lys Ile Val Lys Glu Asp Lys Gln Glu Ile Gln Gly Leu Asn
260 265 270
Glu His Ile Asn Leu Tyr Asn Gln Lys His Lys Asp Arg Arg Leu Pro
275 280 285
Phe Phe Ile Ser Leu Lys Lys Gln Ile Leu Ser Asp Arg Glu Ala Leu
290 295 300
Ser Trp Leu Pro Asp Met Phe Lys Asn Asp Ser Glu Val Ile Lys Ala
305 310 315 320
Leu Lys Gly Phe Tyr Ile Glu Asp Gly Phe Glu Asn Asn Val Leu Thr
325 330 335
Pro Leu Ala Thr Leu Leu Ser Ser Leu Asp Lys Tyr Asn Leu Asn Gly
340 345 350
Ile Phe Ile Arg Asn Asn Glu Ala Leu Ser Ser Leu Ser Gln Asn Val
355 360 365
Tyr Arg Asn Phe Ser Ile Asp Glu Ala Ile Asp Ala Asn Ala Glu Leu
370 375 380
Gln Thr Phe Asn Asn Tyr Glu Leu Ile Ala Asn Ala Leu Arg Ala Lys
385 390 395 400
Ile Lys Lys Glu Thr Lys Gln Gly Arg Lys Ser Phe Glu Lys Tyr Glu
405 410 415
Glu Tyr Ile Asp Lys Lys Val Lys Ala Ile Asp Ser Leu Ser Ile Gln
420 425 430
Glu Ile Asn Glu Leu Val Glu Asn Tyr Val Ser Glu Phe Asn Ser Asn
435 440 445
Ser Gly Asn Met Pro Arg Lys Val Glu Asp Tyr Phe Ser Leu Met Arg
450 455 460
Lys Gly Asp Phe Gly Ser Asn Asp Leu Ile Glu Asn Ile Lys Thr Lys
465 470 475 480
Leu Ser Ala Ala Glu Lys Leu Leu Gly Thr Lys Tyr Gln Glu Thr Ala
485 490 495
Lys Asp Ile Phe Lys Lys Asp Glu Asn Ser Lys Leu Ile Lys Glu Leu
500 505 510
Leu Asp Ala Thr Lys Gln Phe Gln His Phe Ile Lys Pro Leu Leu Gly
515 520 525
Thr Gly Glu Glu Ala Asp Arg Asp Leu Val Phe Tyr Gly Asp Phe Leu
530 535 540
Pro Leu Tyr Glu Lys Phe Glu Glu Leu Thr Leu Leu Tyr Asn Lys Val
545 550 555 560
Arg Asn Arg Leu Thr Gln Lys Pro Tyr Ser Lys Asp Lys Ile Arg Leu
565 570 575
Cys Phe Asn Lys Pro Lys Leu Met Thr Gly Trp Val Asp Ser Lys Thr
580 585 590
Glu Lys Ser Asp Asn Gly Thr Gln Tyr Gly Gly Tyr Leu Phe Arg Lys
595 600 605
Lys Asn Glu Ile Gly Glu Tyr Asp Tyr Phe Leu Gly Ile Ser Ser Lys
610 615 620
Ala Gln Leu Phe Arg Lys Asn Glu Ala Val Ile Gly Asp Tyr Glu Arg
625 630 635 640
Leu Asp Tyr Tyr Gln Pro Lys Ala Asn Thr Ile Tyr Gly Ser Ala Tyr
645 650 655
Glu Gly Glu Asn Ser Tyr Lys Glu Asp Lys Lys Arg Leu Asn Lys Val
660 665 670
Ile Ile Ala Tyr Ile Glu Gln Ile Lys Gln Thr Asn Ile Lys Lys Ser
675 680 685
Ile Ile Glu Ser Ile Ser Lys Tyr Pro Asn Ile Ser Asp Asp Asp Lys
690 695 700
Val Thr Pro Ser Ser Leu Leu Glu Lys Ile Lys Lys Val Ser Ile Asp
705 710 715 720
Ser Tyr Asn Gly Ile Leu Ser Phe Lys Ser Phe Gln Ser Val Asn Lys
725 730 735
Glu Val Ile Asp Asn Leu Leu Lys Thr Ile Ser Pro Leu Lys Asn Lys
740 745 750
Ala Glu Phe Leu Asp Leu Ile Asn Lys Asp Tyr Gln Ile Phe Thr Glu
755 760 765
Val Gln Ala Val Ile Asp Glu Ile Cys Lys Gln Lys Thr Phe Ile Tyr
770 775 780
Phe Pro Ile Ser Asn Val Glu Leu Glu Lys Glu Met Gly Asp Lys Asp
785 790 795 800
Lys Pro Leu Cys Leu Phe Gln Ile Ser Asn Lys Asp Leu Ser Phe Ala
805 810 815
Lys Thr Phe Ser Ala Asn Leu Arg Lys Lys Arg Gly Ala Glu Asn Leu
820 825 830
His Thr Met Leu Phe Lys Ala Leu Met Glu Gly Asn Gln Asp Asn Leu
835 840 845
Asp Leu Gly Ser Gly Ala Ile Phe Tyr Arg Ala Lys Ser Leu Asp Gly
850 855 860
Asn Lys Pro Thr His Pro Ala Asn Glu Ala Ile Lys Cys Arg Asn Val
865 870 875 880
Ala Asn Lys Asp Lys Val Ser Leu Phe Thr Tyr Asp Ile Tyr Lys Asn
885 890 895
Arg Arg Tyr Met Glu Asn Lys Phe Leu Phe His Leu Ser Ile Val Gln
900 905 910
Asn Tyr Lys Ala Ala Asn Asp Ser Ala Gln Leu Asn Ser Ser Ala Thr
915 920 925
Glu Tyr Ile Arg Lys Ala Asp Asp Leu His Ile Ile Gly Ile Asp Arg
930 935 940
Gly Glu Arg Asn Leu Leu Tyr Tyr Ser Val Ile Asp Met Lys Gly Asn
945 950 955 960
Ile Val Glu Gln Asp Ser Leu Asn Ile Ile Arg Asn Asn Asp Leu Glu
965 970 975
Thr Asp Tyr His Asp Leu Leu Asp Lys Arg Glu Lys Glu Arg Lys Ala
980 985 990
Asn Arg Gln Asn Trp Glu Ala Val Glu Gly Ile Lys Asp Leu Lys Lys
995 1000 1005
Gly Tyr Leu Ser Gln Ala Val His Gln Ile Ala Gln Leu Met Leu
1010 1015 1020
Lys Tyr Asn Ala Ile Ile Ala Leu Glu Asp Leu Gly Gln Met Phe
1025 1030 1035
Val Thr Arg Gly Gln Lys Ile Glu Lys Ala Val Tyr Gln Gln Phe
1040 1045 1050
Glu Lys Ser Leu Val Asp Lys Leu Ser Tyr Leu Val Asp Lys Lys
1055 1060 1065
Arg Pro Tyr Asn Glu Leu Gly Gly Ile Leu Lys Ala Tyr Gln Leu
1070 1075 1080
Ala Ser Ser Ile Thr Lys Asn Asn Ser Asp Lys Gln Asn Gly Phe
1085 1090 1095
Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp Pro Val
1100 1105 1110
Thr Gly Phe Thr Asp Leu Leu Arg Pro Lys Ala Met Thr Ile Lys
1115 1120 1125
Glu Ala Gln Asp Phe Phe Gly Ala Phe Asp Asn Ile Ser Tyr Asn
1130 1135 1140
Asp Lys Gly Tyr Phe Glu Phe Glu Thr Asn Tyr Asp Lys Phe Lys
1145 1150 1155
Ile Arg Met Lys Ser Ala Gln Thr Arg Trp Thr Ile Cys Thr Phe
1160 1165 1170
Gly Asn Arg Ile Lys Arg Lys Lys Asp Lys Asn Tyr Trp Asn Tyr
1175 1180 1185
Glu Glu Val Glu Leu Thr Glu Glu Phe Lys Lys Leu Phe Lys Asp
1190 1195 1200
Ser Asn Ile Asp Tyr Glu Asn Cys Asn Leu Lys Glu Glu Ile Gln
1205 1210 1215
Asn Lys Asp Asn Arg Lys Phe Phe Asp Asp Leu Ile Lys Leu Leu
1220 1225 1230
Gln Leu Thr Leu Gln Met Arg Asn Ser Asp Asp Lys Gly Asn Asp
1235 1240 1245
Tyr Ile Ile Ser Pro Val Ala Asn Ala Glu Gly Gln Phe Phe Asp
1250 1255 1260
Ser Arg Asn Gly Asp Lys Lys Leu Pro Leu Asp Ala Asp Ala Asn
1265 1270 1275
Gly Ala Tyr Asn Ile Ala Arg Lys Gly Leu Trp Asn Ile Arg Gln
1280 1285 1290
Ile Lys Gln Thr Lys Asn Asp Lys Lys Leu Asn Leu Ser Ile Ser
1295 1300 1305
Ser Thr Glu Trp Leu Asp Phe Val Arg Glu Lys Pro Tyr Leu Lys
1310 1315 1320
<210> 139
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD34 CDRL1
<400> 139
Arg Ser Ser Gln Thr Ile Val His Ser Asn Gly Asn Thr Tyr Leu Glu
1 5 10 15
<210> 140
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD34 CDRL2
<400> 140
Gln Val Ser Asn Arg Phe Ser
1 5
<210> 141
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD34 CDRL3
<400> 141
Phe Gln Gly Ser His Val Pro Arg Thr
1 5
<210> 142
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD34 CDRH1
<400> 142
Gly Tyr Thr Phe Thr Asn Tyr Gly Met Asn
1 5 10
<210> 143
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD34 CDRH2
<400> 143
Trp Ile Asn Thr Asn Thr Gly Glu Pro Lys Tyr Ala Glu Glu Phe Lys
1 5 10 15
Gly
<210> 144
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD34 CDRH3
<400> 144
Gly Tyr Gly Asn Tyr Ala Arg Gly Ala Trp Leu Ala Tyr
1 5 10
<210> 145
<211> 260
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗cD90 scFv
<400> 145
Cys Met Ala Ser Ala Ser Gln Val Gln Leu Val Gln Ser Gly Ala Glu
1 5 10 15
Val Lys Lys Pro Gly Ala Ser Val Lys Val Ser Cys Lys Ala Ser Gly
20 25 30
Tyr Thr Phe Thr Gly Tyr Tyr Val His Trp Val Arg Gln Ala Pro Gly
35 40 45
Gln Gly Leu Glu Trp Met Gly Trp Val Asn Pro Asn Ser Gly Asp Thr
50 55 60
Asn Tyr Ala Gln Lys Phe Gln Gly Arg Val Thr Met Thr Arg Asp Thr
65 70 75 80
Ser Ile Ser Thr Ala Tyr Met Glu Leu Ser Gly Leu Arg Ser Asp Asp
85 90 95
Thr Ala Val Tyr Tyr Cys Ala Arg Asp Gly Asp Glu Asp Trp Tyr Phe
100 105 110
Asp Leu Trp Gly Arg Gly Thr Pro Val Thr Val Ser Ser Gly Ile Leu
115 120 125
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
130 135 140
Ser Asp Ile Arg Leu Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Ile
145 150 155 160
Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Arg
165 170 175
Ser Leu Val Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Arg Leu Leu
180 185 190
Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser
195 200 205
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln
210 215 220
Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln His Asn Thr Tyr Pro
225 230 235 240
Phe Thr Phe Gly Pro Gly Thr Lys Val Asp Ile Lys Ser Gly Ile Pro
245 250 255
Glu Gln Lys Leu
260
<210> 146
<211> 108
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD133可变轻链
<400> 146
Asn Ile Val Met Thr Gln Ser Pro Lys Ser Met Ser Met Ser Leu Gly
1 5 10 15
Glu Arg Val Thr Leu Ser Cys Lys Ala Ser Glu Asn Val Asp Thr Tyr
20 25 30
Val Ser Trp Tyr Gln Gln Lys Pro Glu Gln Ser Pro Lys Val Leu Ile
35 40 45
Tyr Gly Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe Thr Gly
50 55 60
Ser Gly Ser Ala Thr Asp Phe Ser Leu Thr Ile Ser Asn Val Gln Ala
65 70 75 80
Glu Asp Leu Ala Asp Tyr His Cys Gly Gln Ser Tyr Arg Tyr Pro Leu
85 90 95
Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys Arg
100 105
<210> 147
<211> 120
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD133可变重链
<400> 147
Glu Ile Gln Leu Gln Gln Ser Gly Pro Asp Leu Met Lys Pro Gly Ala
1 5 10 15
Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Asn Tyr
20 25 30
Tyr Val His Trp Val Lys Gln Ser Leu Asp Lys Ser Leu Glu Trp Ile
35 40 45
Gly Tyr Val Asp Pro Phe Asn Gly Asp Phe Asn Tyr Asn Gln Lys Phe
50 55 60
Lys Asp Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr
65 70 75 80
Met His Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Gly Gly Leu Asp Trp Tyr Asp Thr Ser Tyr Trp Tyr Phe Asp
100 105 110
Val Trp Gly Ala Gly Thr Ala Val
115 120
<210> 148
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD133 CDRL1
<400> 148
Gln Ser Ser Gln Ser Val Tyr Asn Asn Asn Tyr Leu Ala
1 5 10
<210> 149
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD133 CDRL2
<400> 149
Arg Ala Ser Thr Leu Ala Ser
1 5
<210> 150
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD133 CDRL3
<400> 150
Gln Gly Glu Phe Ser Cys Asp Ser Ala Asp Cys Ala Ala
1 5 10
<210> 151
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD133 CDRH1
<400> 151
Gly Ile Asp Leu Asn Asn Tyr
1 5
<210> 152
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD133 CDRH2
<400> 152
Phe Gly Ser Asp Ser
1 5
<210> 153
<211> 15
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 结合CD133的RNA适体共有序列
<400> 153
cccuccuaca uaggg 15
<210> 154
<211> 81
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 结合CD133的RNA适体共有序列
<400> 154
gagacaagaa uaaacgcuca acccacccuc cuacauaggg aggaacgagu uacuauagag 60
cuucgacagg aggcucacaa c 81
<210> 155
<211> 58
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 结合CD133的RNA适体共有序列
<400> 155
gagacaagaa uaaacgcuca acccacccuc cuacauaggg aggaacgagu uacuauag 58
<210> 156
<211> 21
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 结合CD133的RNA适体共有序列
<400> 156
ccacccuccu acauagggug g 21
<210> 157
<211> 19
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 结合CD133的RNA适体共有序列
<400> 157
cagaacguau acuauucug 19
<210> 158
<211> 15
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 结合CD133的RNA适体共有序列
<400> 158
agaacguaua cuauu 15
<210> 159
<211> 85
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 结合CD133的RNA适体共有序列
<400> 159
gagacaagaa uaaacgcuca aggaaagcgc uuauuguuug cuauguuaga acguauacua 60
uuucgacagg aggcucacaa caggc 85
<210> 160
<211> 145
<212> PRT
<213> 智人(Homo sapiens)
<400> 160
Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile Asn Ala Thr Leu
1 5 10 15
Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr Val Asn Thr Thr
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val Leu Gln Gly Val
35 40 45
Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg Asp Val Arg Phe
50 55 60
Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val Asn Pro Val Val
65 70 75 80
Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu Cys Arg Arg Ser
85 90 95
Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu Thr Cys Asp Asp
100 105 110
Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu
115 120 125
Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro
130 135 140
Gln
145
<210> 161
<211> 108
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3可变轻链
<400> 161
Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile
35 40 45
Tyr Asp Ala Ser Asn Arg Ala Thr Gly Ile Pro Ala Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Glu Pro
65 70 75 80
Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Arg Ser Asn Trp Pro Pro
85 90 95
Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys
100 105
<210> 162
<211> 118
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3可变重链
<400> 162
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Lys Phe Ser Gly Tyr
20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Val Ile Trp Tyr Asp Gly Ser Lys Lys Tyr Tyr Val Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Gln Met Gly Tyr Trp His Phe Asp Leu Trp Gly Arg Gly Thr
100 105 110
Leu Val Thr Val Ser Ser
115
<210> 163
<211> 118
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3可变重链
<400> 163
Gln Val Gln Leu Val Gln Ser Gly Gly Gly Val Val Gln Ser Gly Arg
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Lys Phe Ser Gly Tyr
20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Val Ile Trp Tyr Asp Gly Ser Lys Lys Tyr Tyr Val Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Gly Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Gln Met Gly Tyr Trp His Phe Asp Leu Trp Gly Arg Gly Thr
100 105 110
Leu Val Thr Val Ser Ser
115
<210> 164
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL1
<400> 164
Ser Ala Ser Ser Ser Val Ser Tyr Met Asn
1 5 10
<210> 165
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL2
<400> 165
Arg Trp Ile Tyr Asp Thr Ser Lys Leu Ala Ser
1 5 10
<210> 166
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL3
<400> 166
Gln Gln Trp Ser Ser Asn Pro Phe Thr
1 5
<210> 167
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH1
<400> 167
Lys Ala Ser Gly Tyr Thr Phe Thr Arg Tyr Thr Met His
1 5 10
<210> 168
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH2
<400> 168
Ile Asn Pro Ser Arg Gly Tyr Thr Asn Tyr Asn Gln Lys Phe Lys Asp
1 5 10 15
<210> 169
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH3
<400> 169
Tyr Tyr Asp Asp His Tyr Cys Leu Asp Tyr
1 5 10
<210> 170
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL1
<400> 170
Gln Ser Leu Val His Asn Asn Gly Asn Thr Tyr
1 5 10
<210> 171
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL3
<400> 171
Gly Gln Gly Thr Gln Tyr Pro Phe Thr
1 5
<210> 172
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH1
<400> 172
Gly Phe Thr Phe Thr Lys Ala Trp
1 5
<210> 173
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH2
<400> 173
Ile Lys Asp Lys Ser Asn Ser Tyr Ala Thr
1 5 10
<210> 174
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH3
<400> 174
Arg Gly Val Tyr Tyr Ala Leu Ser Pro Phe Asp Tyr
1 5 10
<210> 175
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL1
<400> 175
Gln Ser Leu Val His Asp Asn Gly Asn Thr Tyr
1 5 10
<210> 176
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH1
<400> 176
Gly Phe Thr Phe Ser Asn Ala Trp
1 5
<210> 177
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH2
<400> 177
Ile Lys Ala Arg Ser Asn Asn Tyr Ala Thr
1 5 10
<210> 178
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH3
<400> 178
Arg Gly Thr Tyr Tyr Ala Ser Lys Pro Phe Asp Tyr
1 5 10
<210> 179
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL1
<400> 179
Gln Ser Leu Glu His Asn Asn Gly Asn Thr Tyr
1 5 10
<210> 180
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH2
<400> 180
Ile Lys Asp Lys Ser Asn Asn Tyr Ala Thr
1 5 10
<210> 181
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH3
<400> 181
Arg Tyr Val His Tyr Gly Ile Gly Tyr Ala Met Asp Ala
1 5 10
<210> 182
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL1
<400> 182
Gln Ser Leu Val His Thr Asn Gly Asn Thr Tyr
1 5 10
<210> 183
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRL3
<400> 183
Gly Gln Gly Thr His Tyr Pro Phe Thr
1 5
<210> 184
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH1
<400> 184
Gly Phe Thr Phe Thr Asn Ala Trp
1 5
<210> 185
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH2
<400> 185
Lys Asp Lys Ser Asn Asn Tyr Ala Thr
1 5
<210> 186
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD3 CDRH3
<400> 186
Arg Tyr Val His Tyr Arg Phe Ala Tyr Ala Leu Asp Ala
1 5 10
<210> 187
<211> 112
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD4可变轻链
<400> 187
Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly
1 5 10 15
Glu Arg Val Thr Met Asn Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser
20 25 30
Thr Asn Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln
35 40 45
Ser Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val
50 55 60
Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr
65 70 75 80
Ile Ser Ser Val Gln Ala Glu Asp Val Ala Val Tyr Tyr Cys Gln Gln
85 90 95
Tyr Tyr Ser Tyr Arg Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
100 105 110
<210> 188
<211> 122
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD4可变重链
<400> 188
Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Val Val Lys Pro Gly Ala
1 5 10 15
Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr
20 25 30
Val Ile His Trp Val Arg Gln Lys Pro Gly Gln Gly Leu Asp Trp Ile
35 40 45
Gly Tyr Ile Asn Pro Tyr Asn Asp Gly Thr Asp Tyr Asp Glu Lys Phe
50 55 60
Lys Gly Lys Ala Thr Leu Thr Ser Asp Thr Ser Thr Ser Thr Ala Tyr
65 70 75 80
Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Glu Lys Asp Asn Tyr Ala Thr Gly Ala Trp Phe Ala Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser
115 120
<210> 189
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD4 CDRL1
<400> 189
Lys Ser Ser Gln Ser Leu Leu Tyr Ser Thr Asn Gln Lys Asn Tyr Leu
1 5 10 15
Ala
<210> 190
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD4 CDRL2
<400> 190
Trp Ala Ser Thr Arg Glu Ser
1 5
<210> 191
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD4 CDRL3
<400> 191
Gln Gln Tyr Tyr Ser Tyr Arg Thr
1 5
<210> 192
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD4 CDRH1
<400> 192
Gly Tyr Thr Phe Thr Ser Tyr Val Ile His
1 5 10
<210> 193
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD4 CDRH2
<400> 193
Tyr Ile Asn Pro Tyr Asn Asp Gly Thr Asp Tyr Asp Glu Lys Phe Lys
1 5 10 15
Gly
<210> 194
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD4 CDRH3
<400> 194
Glu Lys Asp Asn Tyr Ala Thr Gly Ala Trp Phe Ala Tyr
1 5 10
<210> 195
<211> 120
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28可变重链
<400> 195
Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala
1 5 10 15
Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr
20 25 30
Tyr Ile His Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Ile
35 40 45
Gly Cys Ile Tyr Pro Gly Asn Val Asn Thr Asn Tyr Asn Glu Lys Phe
50 55 60
Lys Asp Arg Ala Thr Leu Thr Val Asp Thr Ser Ile Ser Thr Ala Tyr
65 70 75 80
Met Glu Leu Ser Arg Leu Arg Ser Asp Asp Thr Ala Val Tyr Phe Cys
85 90 95
Thr Arg Ser His Tyr Gly Leu Asp Trp Asn Phe Asp Val Trp Gly Gln
100 105 110
Gly Thr Thr Val Thr Val Ser Ser
115 120
<210> 196
<211> 107
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28可变轻链
<400> 196
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys His Ala Ser Gln Asn Ile Tyr Val Trp
20 25 30
Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Lys Ala Ser Asn Leu His Thr Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Gly Gln Thr Tyr Pro Tyr
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys
100 105
<210> 197
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28 CDRL1
<400> 197
His Ala Ser Gln Asn Ile Tyr Val Trp Leu Asn
1 5 10
<210> 198
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28 CDRL2
<400> 198
Lys Ala Ser Asn Leu His Thr
1 5
<210> 199
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28 CDRL3
<400> 199
Gln Gln Gly Gln Thr Tyr Pro Tyr Thr
1 5
<210> 200
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28 CDRH1
<400> 200
Gly Tyr Thr Phe Thr Ser Tyr Tyr Ile His
1 5 10
<210> 201
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28 CDRH2
<400> 201
Cys Ile Tyr Pro Gly Asn Val Asn Thr Asn Tyr Asn Glu Lys
1 5 10
<210> 202
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28 CDRH3
<400> 202
Ser His Tyr Gly Leu Asp Trp Asn Phe Asp Val
1 5 10
<210> 203
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28 CDRH1
<400> 203
Ser Tyr Tyr Ile His
1 5
<210> 204
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗CD28 CDRH2
<400> 204
Cys Ile Tyr Pro Gly Asn Val Asn Thr Asn Tyr Asn Glu Lys Phe Lys
1 5 10 15
Asp
<210> 205
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRL1
<400> 205
Arg Ala Ser Gln Ser Val Ser
1 5
<210> 206
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRL2
<400> 206
Ala Ser Asn Arg Ala Thr
1 5
<210> 207
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRL3
<400> 207
Gln Arg Ser Asn Trp Pro Pro Ala Leu Thr
1 5 10
<210> 208
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRH1
<400> 208
Tyr Tyr Trp Ser
1
<210> 209
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRH3
<400> 209
Tyr Gly Pro Gly Asn Tyr Asp Trp Tyr Phe Asp Leu
1 5 10
<210> 210
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRL1
<400> 210
Ser Gly Asp Asn Ile Gly Asp Gln Tyr Ala His
1 5 10
<210> 211
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRL2
<400> 211
Gln Asp Lys Asn Arg Pro Ser
1 5
<210> 212
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRL3
<400> 212
Ala Thr Tyr Thr Gly Phe Gly Ser Leu Ala Val
1 5 10
<210> 213
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 抗4-1BB CDRH1
<400> 213
Gly Tyr Ser Phe Ser Thr Tyr Trp Ile Ser
1 5 10
<210> 214
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 214
tatttgcatt gagatagtgt ggg 23
<210> 215
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 215
atatttgcat tgagatagtg tgg 23
<210> 216
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 216
atgcaaatat ctgtctgaaa cgg 23
<210> 217
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 217
tatctgtctg aaacggtccc tgg 23
<210> 218
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 218
gctattggtc aaggcaaggc tgg 23
<210> 219
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 219
caaggctatt ggtcaaggca agg 23
<210> 220
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 220
cttgtcaagg ctattggtca agg 23
<210> 221
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 221
cttgaccaat agccttgaca agg 23
<210> 222
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 222
gtttgccttg tcaaggctat tgg 23
<210> 223
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9指导序列
<400> 223
tggtcaagtt tgccttgtca agg 23
<210> 224
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpf1指导序列
<400> 224
tttcagacag atatttgcat tgaga 25
<210> 225
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 225
guguccccgu uuugguuggu aaac 24
<210> 226
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 226
aaaaaucaau accgauaaua auga 24
<210> 227
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 227
cuuaauauga auauuaauau cggu 24
<210> 228
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 228
ccguaucugg aaggggcauc uugg 24
<210> 229
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 229
ccuuaggacc ggaaggauua cagc 24
<210> 230
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 230
gccuaaaagg cacuauguca aaug 24
<210> 231
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 231
ggagcuguug gcaucauguu ccug 24
<210> 232
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 232
gauucuuuuc uaucucagga caga 24
<210> 233
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 233
auagacaucc cacacuguag uucu 24
<210> 234
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 234
auuaauuuga gaaccaacau aagg 24
<210> 235
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 235
auuuucuuuu ugguaagaag gaac 24
<210> 236
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 236
cacacacaca cacacacaca caca 24
<210> 237
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 237
auccaaaccu ccuaaaugau ac 22
<210> 238
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 238
acacccgauc cacuggggag ca 22
<210> 239
<211> 24
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 239
uugauucuuu ucuaucucag gaca 24
<210> 240
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a, c, g, 或u
<400> 240
ncacccgauc cacuggggag ca 22
<210> 241
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 241
cacccgaucc acuggggagc 20
<210> 242
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或u
<400> 242
nccuugucaa ggcuauuggu ca 22
<210> 243
<211> 21
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 243
ccuugucaag gcuauugguc a 21
<210> 244
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 244
guggggaagg ggcccccaag 20
<210> 245
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 245
auugagauag uguggggaag 20
<210> 246
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 246
cauugagaua guguggggaa 20
<210> 247
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 247
gcauugagau agugugggga 20
<210> 248
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 248
auuugcauug agauagugug 20
<210> 249
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 249
uauuugcauu gagauagugu 20
<210> 250
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 250
auauuugcau ugagauagug 20
<210> 251
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 251
augcaaauau cugucugaaa 20
<210> 252
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 252
uaucugucug aaacgguccc 20
<210> 253
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 253
gcuauugguc aaggcaaggc 20
<210> 254
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 254
caaggcuauu ggucaaggca 20
<210> 255
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 255
cuugucaagg cuauugguca 20
<210> 256
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 256
cuugaccaau agccuugaca 20
<210> 257
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 257
guuugccuug ucaaggcuau 20
<210> 258
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 258
uggucaaguu ugccuuguca 20
<210> 259
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 259
gcauugagau agugugggga ag 22
<210> 260
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 260
cagacagaua uuugcauuga ga 22
<210> 261
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 261
agccagggac cguuucagac ag 22
<210> 262
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA靶位点的转录
<400> 262
gccuugucaa ggcuauuggu ca 22
<210> 263
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 从DNA靶位点转录的RNA
<400> 263
cacccgaucc acuggggagc 20
<210> 264
<211> 21
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 从DNA靶位点转录的RNA
<400> 264
ccuugucagg gcuguugguc g 21

Claims (83)

1.一种遗传修饰生物样品中的造血干细胞和祖细胞(HSPC)群体的方法,其包括向所述生物样品添加金纳米颗粒(AuNP),其中所述AuNP包含
直径小于20nm的金(Au)核心;
成簇规则间隔短回文重复序列(CRISPR)指导RNA(crRNA)-核酸酶核糖核蛋白(RNP)复合物,其中所述crRNA包含3’末端和5’末端,其中所述3’末端缀合到具有硫醇修饰的间隔物,并且所述5’末端缀合到所述核酸酶,并且其中所述硫醇修饰共价连接到所述Au核心的表面,并且其中所述crRNA具有如SEQ ID NO:262;SEQ ID NO:13;SEQ ID NO:14;或SEQ IDNO:241-261中所示的序列;
带正电荷的聚乙烯亚胺聚合物涂层,其中所述带正电荷的聚乙烯亚胺聚合物具有小于2500道尔顿的分子量,包围所述RNP复合物,并且接触所述Au核心的表面;以及
供体模板,其在所述带正电荷的聚合物涂层的表面上包含同源定向修复模板(HDT),其中所述HDT模板包含如SEQ ID NO:48;SEQ ID NO:4;SEQ ID NO:15;SEQ ID NO:33-41;SEQID NO:44-47;或SEQ ID NO:49-51中所示的序列;以及
包含抗体克隆REA820、REA753、REA816、293C3、AC141、AC133或7的结合结构域的CD133靶向配体
其中所述靶向配体通过胺-巯基交联剂或巯基-巯基交联剂与所述核酸酶连接并且
其中所述HSPC群体未暴露于电穿孔、编码HDT的病毒载体或磁性细胞分离过程,并且其中所述方法导致不多于30%的HSPC细胞毒性并且在所述HSPC群体内提供至少10%的基因编辑效率。
2.如权利要求1所述的方法,其中所述crRNA靶向如SEQ ID NO:25;SEQ ID NO:3;SEQID NO:24;SEQ ID NO:26-32;SEQ ID NO:42;SEQ ID NO:43;或SEQ ID NO:214-224中所示的序列。
3.如权利要求1所述的方法,其中所述crRNA具有如SEQ ID NO:262、SEQ ID NO:261或SEQ ID NO:259中所示的序列。
4.如权利要求1所述的方法,其中所述核酸酶包括Cpf1或Cas9。
5.如权利要求1所述的方法,其中所述带正电荷的聚合物涂层包含
分子量为2000道尔顿的聚乙烯亚胺。
6.如权利要求1所述的方法,其中Au核心与核酸酶的重量/重量(w/w)比为0.6。
7.如权利要求1所述的方法,其中Au核心与HDT的w/w比为1.0。
8.一种遗传修饰生物样品中所选细胞群体的方法,其包括向所述生物样品添加金纳米颗粒(AuNP),其中所述AuNP包含
直径小于30nm的金(Au)核心;
指导RNA(gRNA)-核酸酶核糖核蛋白(RNP)复合物,其中所述gRNA包含3’末端和5’末端,其中所述3’末端缀合到具有化学修饰的间隔物,并且所述5’末端缀合到所述核酸酶,并且其中所述化学修饰共价连接到所述Au核心的表面;
带正电荷的聚合物涂层,其中所述带正电荷的聚合物具有小于2500道尔顿的分子量,包围所述RNP复合物,并且接触所述Au核心的表面;以及
供体模板,其在所述带正电荷的聚合物涂层的表面上包含同源定向修复模板(HDT)
其中所述所选细胞群体未暴露于电穿孔或编码的病毒载体,并且其中所述方法导致不多于30%的所述所选细胞群体的细胞毒性并且在所述所选细胞群体内提供至少10%的基因编辑效率。
9.如权利要求8所述的方法,其中Au核心与核酸酶的重量/重量(w/w)比为0.6。
10.如权利要求8所述的方法,其中Au核心与HDT的w/w比为1.0。
11.如权利要求8所述的方法,其中所述AuNP的直径小于70nm。
12.如权利要求8所述的方法,其中所述AuNP具有小于0.2的多分散指数(PDI)。
13.如权利要求8所述的方法,其中所述gRNA包含成簇规则间隔短回文重复序列(CRISPR)crRNA。
14.如权利要求13所述的方法,其中所述crRNA靶向如SEQ ID NO:1;SEQ ID NO:3;SEQID NO:20-32;SEQ ID NO:42;SEQ ID NO:43;SEQ ID NO:84-97;或SEQ ID NO:214-224中所示的序列。
15.如权利要求13所述的方法,其中所述crRNA包含如SEQ ID NO:5;SEQ ID NO:6;SEQID NO:13;SEQ ID NO:14;或SEQ ID NO:225-264中所示的序列。
16.如权利要求8所述的方法,其中所述核酸酶包括Cpf1或Cas9。
17.如权利要求8所述的方法,其中所述带正电荷的聚合物涂层包含聚乙烯亚胺(PEI)、聚酰胺基胺(PAMAM);聚赖氨酸(PLL)、聚精氨酸;纤维素、葡聚糖、精胺、亚精胺或聚(乙烯基苄基三烷基铵)。
18.如权利要求8所述的方法,其中所述带正电荷的聚合物具有1500-2500道尔顿的分子量。
19.如权利要求8所述的方法,其中所述带正电荷的聚合物具有2000道尔顿的分子量。
20.如权利要求8所述的方法,其中所述化学修饰包括游离硫醇、胺或羧酸酯官能团。
21.如权利要求8所述的方法,其中所述间隔物包含寡聚乙二醇间隔物。
22.如权利要求21所述的方法,其中所述寡聚乙二醇间隔物包含18原子寡聚乙二醇间隔物。
23.如权利要求8所述的方法,其中所述HDT包含与经历修饰的基因组序列具有同源性的序列。
24.如权利要求23所述的方法,其中所述HDT包含如SEQ ID NO:2;SEQ ID NO:4;SEQ IDNO:8;SEQ ID NO:15;SEQ ID NO:33-41;或SEQ ID NO:44-52中所示的序列。
25.如权利要求8所述的方法,其中所述HDT包含单链DNA(ssDNA)。
26.如权利要求8所述的方法,其中所述供体模板包含治疗性基因。
27.如权利要求26所述的方法,其中所述治疗性基因包含或编码骨骼蛋白4.1、血型糖蛋白、p55、Duffy等位基因、珠蛋白家族基因;WAS;phox;抗肌萎缩蛋白;丙酮酸激酶;CLN3;ABCD1;芳基硫酸酯酶A;SFTPB;SFTPC;NLX2.1;ABCA3;GATA1;核糖体蛋白基因;TERT;TERC;DKC1;TINF2;CFTR;LRRK2;PARK2;PARK7;PINK1;SNCA;PSEN1;PSEN2;APP;SOD1;TDP43;FUS;泛素2;C9ORF72、α2β1;αvβ3;αvβ5;αvβ63;BOB/GPR15;Bonzo/STRL-33/TYMSTR;CCR2;CCR3;CCR5;CCR8;CD4;CD46;CD55;CXCR4;氨基肽酶-N;HHV-7;ICAM;ICAM-1;PRR2/HveB;HveA;α-肌营养不良蛋白聚糖;LDLR/α2MR/LRP;PVR;PRR1/HveC、层粘连蛋白受体、101F6、123F2、53BP2、ab1、ABLI、ADP、aFGF、APC、ApoA1、ApoAIV、ApoE、ATM、BAI-1、BDNF、Beta*(BLU)、bFGF、BLC1、BLC6、BRCA1、BRCA2、CBFA1、CBL、C-CAM、CFTR、CNTF、COX-1、CSFIR、CTS-1、胞嘧啶脱氨酶、DBCCR-1、DCC、Dp、DPC-4、E1A、E2F、EBRB2、erb、ERBA、ERBB、ETS1、ETS2、ETV6、Fab、FancA、FancB、FancC、FancDI、FancD2、FancE、FancF、FancG、Fanc1、FancJ、FancL、FancM、FancN、FancO、FancP、FancQ、FancR、FancS、FancT、FancU、FancV、和FancW、FCC、FGF、FGR、FHIT、fms、FOX、FUS1、FUS1、FYN、G-CSF、GDAIF、基因21、基因26、GM-CSF、GMF、gsp、HCR、HIC-1、HRAS、hst、IGF、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、ING1、干扰素α、干扰素β、干扰素γ、IRF-1、JUN、KRAS、LCK、LUCA-1、LUCA-2、LYN、MADH4、MADR2、MCC、mda7、MDM2、MEN-I、MEN-II、MLL、MMAC1、MYB、MYC、MYCL1、MYCN、neu、NF-1、NF-2、NGF、NOEY1、NOEY2、NRAS、NT3、NT5、OVCA1、p16、p21、p27、p53、p57、p73、p300、PGS、PIM1、PL6、PML、PTEN、raf、Rap1A、ras、Rb、RB1、RET、rks-3、ScFv、scFV ras、SEM A3、SRC、TAL1、TCL3、TFPI、血小板反应蛋白、胸苷激酶、TNF、TP53、trk、T-VEC、VEGF、VHL、WT1、WT-1、YES、zac1、艾杜糖苷酶、IDS、GNS、HGSNAT、SGSH、NAGLU、GUSB、GALNS、GLB1、ARSB、HYAL1、F8、F9、HBB、CYB5R3、γC、JAK3、IL7RA、RAG1、RAG2、DCLRE1C、PRKDC、LIG4、NHEJ1、CD3D、CD3E、CD3Z、CD3G、PTPRC、ZAP70、LCK、AK2、ADA、PNP、WHN、CHD7、ORAI1、STIM1、CORO1A、CIITA、RFXANK、RFX5、RFXAP、RMRP、DKC1、TERT、TINF2、DCLRE1B和SLC46A1。
28.如权利要求8所述的方法,其中所述AuNP还包含连接到所述核酸酶的靶向配体。
29.如权利要求28所述的方法,其中所述具有连接的靶向配体的AuNP的直径为60-150nm。
30.如权利要求28所述的方法,其中所述靶向配体包括结合CD3、CD4、CD34、CD46、CD90、CD133、CD164、促黄体生成激素释放激素(LHRH)受体或芳基烃受体(AHR)的结合分子。
31.如权利要求28所述的方法,其中所述靶向配体包括抗人CD3抗体或其抗原结合片段、抗人CD4抗体或其抗原结合片段、抗人CD34抗体或其抗原结合片段、抗人CD46抗体或其抗原结合片段、抗人CD90抗体或其抗原结合片段、抗人CD133抗体或其抗原结合片段、抗人CD164抗体或其抗原结合片段、抗人CD133适体、人促黄体生成激素、人绒毛膜促性腺激素、醋酸地格瑞克或StemRegenin 1。
32.如权利要求28所述的方法,其中所述靶向配体包括抗体克隆:581;抗体克隆:561;抗体克隆:REA1164;抗体克隆:AC136;抗体克隆:5E10;抗体克隆:DG3;抗体克隆:REA897;抗体克隆:REA820;抗体克隆:REA753;抗体克隆:REA816;抗体克隆:293C3;抗体克隆:AC141;抗体克隆:AC133;抗体克隆:7;适体A15;适体B19;HCG(蛋白质/配体);或促黄体生成激素(LH蛋白质/配体)。
33.如权利要求28所述的方法,其中所述核酸酶和靶向配体通过氨基酸接头连接。
34.如权利要求33所述的方法,其中所述氨基酸接头包括直接氨基酸接头、柔性氨基酸接头或基于标签的氨基酸接头。
35.如权利要求28所述的方法,其中所述核酸酶和靶向配体通过聚乙二醇(PEG)连接。
36.如权利要求28所述的方法,其中所述核酸酶和靶向配体通过胺-巯基交联剂或巯基-巯基交联剂连接。
37.如权利要求28所述的方法,其中所述核酸酶和靶向配体通过PEG和胺-巯基交联剂连接或通过PEG和巯基-巯基交联剂连接。
38.如权利要求28所述的方法,其中所选细胞群体没有经历磁性分离过程以从所述生物样品中除去所述所选细胞。
39.如权利要求8所述的方法,其中所述所选细胞群体包括选自以下的血细胞:造血干细胞(HSC)、造血祖细胞(HPC)、造血干细胞和祖细胞(HSPC)、T细胞、天然杀伤(NK)细胞、B细胞、巨噬细胞、单核细胞、间充质干细胞(MSC)、白细胞(WBC)、单核细胞(MNC)、内皮细胞(EC)、基质细胞和/或骨髓成纤维细胞。
40.如权利要求39所述的方法,其中所述血细胞包括CD34+CD45RA-CD90+HSC;CD34+/CD133+HSC;LH+HSC;CD34+CD90+HSPC;CD34+CD90+CD133+HSPC;和/或AHR+HSPC。
41.如权利要求39所述的方法,其中所述血细胞包括CD3+T细胞和/或CD4+T细胞。
42.如权利要求8所述的方法,其中所述生物样品包括外周血、骨髓、粒细胞集落刺激因子(GCSF)动员的外周血和/或普乐沙福动员的外周血。
43.如权利要求8所述的方法,其中所述添加的量为每毫升(mL)生物样品1、2、3、4、5、8、10、12、15或20μg AuNP。
44.如权利要求42所述的方法,其中将所述生物样品和所述添加的AuNP孵育1-48小时。
45.如权利要求42所述的方法,其中将所述生物样品和所述添加的AuNP孵育直到测试证实所述AuNP被细胞摄取。
46.如权利要求45所述的方法,其中所述测试包括共聚焦显微镜成像、电感耦合等离子体(ICP)-质谱(ICP-MS)、ICP-原子发射光谱(ICP-AES)或ICP-光发射光谱(ICP-OES)。
47.一种根据如权利要求8所述的方法进行修饰的细胞。
48.一种包含如权利要求47所述的细胞的治疗性制剂。
49.一种向有需要的受试者提供治疗性核酸序列的方法,其包括向所述受试者施用如权利要求47所述的细胞或如权利要求48所述的治疗性制剂,从而向所述受试者提供治疗性核酸序列。
50.一种金纳米颗粒(AuNP),其包含:
直径小于30nm的金(Au)核心;
指导RNA-核酸酶核糖核蛋白(RNP)复合物,其中所述gRNA包含3’末端和5’末端,其中所述3’末端缀合到具有化学修饰的间隔物,并且所述5’末端缀合到所述核酸酶,并且其中所述化学修饰共价连接到所述Au核心的表面;
带正电荷的聚合物涂层,其中所述带正电荷的聚合物具有小于2500道尔顿的分子量,包围所述RNP复合物,并且接触所述Au核心的表面;以及
供体模板,其在所述带正电荷的聚合物涂层的表面上包含同源定向修复模板(HDT)。
51.如权利要求50所述的AuNP,其中Au核心与核酸酶的重量/重量(w/w)为0.6。
52.如权利要求50所述的AuNP,其中Au核心与HDT的w/w比为1.0。
53.如权利要求50所述的AuNP,其中所述AuNP的直径小于70nm。
54.如权利要求50所述的AuNP,其中所述AuNP具有小于0.2的多分散指数(PDI)。
55.如权利要求50所述的AuNP,其中所述gRNA包含成簇规则间隔短回文重复序列(CRISPR)crRNA。
56.如权利要求55所述的AuNP,其中所述crRNA靶向如SEQ ID NO:1;SEQ ID NO:3;SEQID NO:20-32;SEQ ID NO:42;SEQ ID NO:43;SEQ ID NO:84-97;或SEQ ID NO:214-224中所示的序列。
57.如权利要求55所述的AuNP,其中所述crRNA包含如SEQ ID NO:5;SEQ ID NO:6;SEQID NO:13;SEQ ID NO:14;或SEQ ID NO:225-264中所示的序列。
58.如权利要求50所述的AuNP,其中所述核酸酶包括Cpf1或Cas9。
59.如权利要求50所述的AuNP,其中所述带正电荷的聚合物涂层包含聚乙烯亚胺(PEI)、聚酰胺基胺(PAMAM);聚赖氨酸(PLL)、聚精氨酸;纤维素、葡聚糖、精胺、亚精胺或聚(乙烯基苄基三烷基铵)。
60.如权利要求50所述的AuNP,其中所述带正电荷的聚合物具有1500-2500道尔顿的分子量。
61.如权利要求50所述的AuNP,其中所述带正电荷的聚合物具有2000道尔顿的分子量。
62.如权利要求50所述的AuNP,其中所述化学修饰包括游离硫醇、胺或羧酸酯官能团。
63.如权利要求50所述的AuNP,其中所述间隔物包含寡聚乙二醇间隔物。
64.如权利要求63所述的AuNP,其中所述寡聚乙二醇间隔物包含18原子寡聚乙二醇间隔物。
65.如权利要求50所述的AuNP,其中所述HDT包含与经历修饰的基因组序列具有同源性的序列。
66.如权利要求65所述的AuNP,其中所述HDT包含如SEQ ID NO:2;SEQ ID NO:4;SEQ IDNO:8;SEQ ID NO:15;SEQ ID NO:33-41;或SEQ ID NO:44-52中所示的序列。
67.如权利要求50所述的AuNP,其中所述HDT包含单链DNA(ssDNA)。
68.如权利要求50所述的AuNP,其中所述供体模板包含治疗性基因。
69.如权利要求68所述的AuNP,其中所述治疗性基因编码骨骼蛋白4.1、血型糖蛋白、p55、Duffy等位基因、珠蛋白家族基因;WAS;phox;抗肌萎缩蛋白;丙酮酸激酶;CLN3;ABCD1;芳基硫酸酯酶A;SFTPB;SFTPC;NLX2.1;ABCA3;GATA1;核糖体蛋白基因;TERT;TERC;DKC1;TINF2;CFTR;LRRK2;PARK2;PARK7;PINK1;SNCA;PSEN1;PSEN2;APP;SOD1;TDP43;FUS;泛素2;C9ORF72、α2β1;αvβ3;αvβ5;αvβ63;BOB/GPR15;Bonzo/STRL-33/TYMSTR;CCR2;CCR3;CCR5;CCR8;CD4;CD46;CD55;CXCR4;氨基肽酶-N;HHV-7;ICAM;ICAM-1;PRR2/HveB;HveA;α-肌营养不良蛋白聚糖;LDLR/α2MR/LRP;PVR;PRR1/HveC、层粘连蛋白受体、101F6、123F2、53BP2、ab1、ABLI、ADP、aFGF、APC、ApoA1、ApoAIV、ApoE、ATM、BAI-1、BDNF、Beta*(BLU)、bFGF、BLC1、BLC6、BRCA1、BRCA2、CBFA1、CBL、C-CAM、CFTR、CNTF、COX-1、CSFIR、CTS-1、胞嘧啶脱氨酶、DBCCR-1、DCC、Dp、DPC-4、E1A、E2F、EBRB2、erb、ERBA、ERBB、ETS1、ETS2、ETV6、Fab、FancA、FancB、FancC、FancDI、FancD2、FancE、FancF、FancG、Fanc1、FancJ、FancL、FancM、FancN、FancO、FancP、FancQ、FancR、FancS、FancT、FancU、FancV、和FancW、FCC、FGF、FGR、FHIT、fms、FOX、FUS 1、FUS1、FYN、G-CSF、GDAIF、基因21、基因26、GM-CSF、GMF、gsp、HCR、HIC-1、HRAS、hst、IGF、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、ING1、干扰素α、干扰素β、干扰素γ、IRF-1、JUN、KRAS、LCK、LUCA-1、LUCA-2、LYN、MADH4、MADR2、MCC、mda7、MDM2、MEN-I、MEN-II、MLL、MMAC1、MYB、MYC、MYCL1、MYCN、neu、NF-1、NF-2、NGF、NOEY1、NOEY2、NRAS、NT3、NT5、OVCA1、p16、p21、p27、p53、p57、p73、p300、PGS、PIM1、PL6、PML、PTEN、raf、Rap1A、ras、Rb、RB1、RET、rks-3、ScFv、scFV ras、SEM A3、SRC、TAL1、TCL3、TFPI、血小板反应蛋白、胸苷激酶、TNF、TP53、trk、T-VEC、VEGF、VHL、WT1、WT-1、YES、zac1、艾杜糖苷酶、IDS、GNS、HGSNAT、SGSH、NAGLU、GUSB、GALNS、GLB1、ARSB、HYAL1、F8、F9、HBB、CYB5R3、γC、JAK3、IL7RA、RAG1、RAG2、DCLRE1C、PRKDC、LIG4、NHEJ1、CD3D、CD3E、CD3Z、CD3G、PTPRC、ZAP70、LCK、AK2、ADA、PNP、WHN、CHD7、ORAI1、STIM1、CORO1A、CIITA、RFXANK、RFX5、RFXAP、RMRP、DKC1、TERT、TINF2、DCLRE1B和SLC46A1。
70.如权利要求50所述的AuNP,其中所述AuNP还包含连接到所述核酸酶的靶向配体。
71.如权利要求70所述的AuNP,其中所述靶向配体包括结合CD3、CD4、CD34、CD46、CD90、CD133、CD164、促黄体生成激素释放激素(LHRH)受体或芳基烃受体(AHR)的结合分子。
72.如权利要求70所述的AuNP,其中所述靶向配体包括抗人CD3抗体或其抗原结合片段、抗人CD4抗体或其抗原结合片段、抗人CD34抗体或其抗原结合片段、抗人CD46抗体或其抗原结合片段、抗人CD90抗体或其抗原结合片段、抗人CD133抗体或其抗原结合片段、抗人CD164抗体或其抗原结合片段、抗人CD133适体、人促黄体生成激素、人绒毛膜促性腺激素、醋酸地格瑞克或StemRegenin 1。
73.如权利要求70所述的AuNP,其中所述靶向配体包括抗体克隆:581;抗体克隆:561;抗体克隆:REA1164;抗体克隆:AC136;抗体克隆:5E10;抗体克隆:DG3;抗体克隆:REA897;抗体克隆:REA820;抗体克隆:REA753;抗体克隆:REA816;抗体克隆:293C3;抗体克隆:AC141;抗体克隆:AC133;抗体克隆:7;适体A15;适体B19;HCG(蛋白质/配体);促黄体生成激素(LH蛋白质/配体);或来源于前述任一个的结合片段。
74.如权利要求70所述的AuNP,其中所述核酸酶和靶向配体通过氨基酸接头连接。
75.如权利要求74所述的AuNP,其中所述氨基酸接头包括直接氨基酸接头、柔性氨基酸接头或基于标签的氨基酸接头。
76.如权利要求70所述的AuNP,其中所述核酸酶和靶向配体通过聚乙二醇(PEG)连接。
77.如权利要求70所述的AuNP,其中所述核酸酶和靶向配体通过胺-巯基交联剂连接。
78.一种包含如权利要求8所述的AuNP和包含所选细胞群体的生物样品的组合物。
79.如权利要求78所述的组合物,其中所述生物样品包含所选细胞群体,所述所选细胞群体包括选自以下的血细胞:造血干细胞(HSC)、造血祖细胞(HPC)、造血干细胞和祖细胞(HSPC)、T细胞、天然杀伤(NK)细胞、B细胞、巨噬细胞、单核细胞、间充质干细胞(MSC)、白细胞(WBC)、单核细胞(MNC)、内皮细胞(EC)、基质细胞和/或骨髓成纤维细胞。
80.如权利要求79所述的组合物,其中所述血细胞包括CD34+CD45RA-CD90+HSC;CD34+/CD133+HSC;LH+HSC;CD34+CD90+HSPC;CD34+CD90+CD133+HSPC;和/或AHR+HSPC。
81.如权利要求79所述的组合物,其中所述血细胞包括CD3+T细胞和/或CD4+T细胞。
82.如权利要求78所述的组合物,其中所述生物样品包括外周血、骨髓、粒细胞集落刺激因子(GCSF)动员的外周血和/或普乐沙福动员的外周血。
83.如权利要求78所述的组合物,其中所述生物样品中AuNP的量为每毫升(mL)生物样品1、2、3、4、5、8、10、12、15或20μg AuNP。
CN201980088336.9A 2018-12-05 2019-12-05 遗传修饰细胞的减少和最少的操作制造 Pending CN113302292A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862775721P 2018-12-05 2018-12-05
US62/775,721 2018-12-05
PCT/US2019/064780 WO2020118110A1 (en) 2018-12-05 2019-12-05 Reduced and minimal manipulation manufacturing of genetically-modified cells

Publications (1)

Publication Number Publication Date
CN113302292A true CN113302292A (zh) 2021-08-24

Family

ID=70975543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980088336.9A Pending CN113302292A (zh) 2018-12-05 2019-12-05 遗传修饰细胞的减少和最少的操作制造

Country Status (9)

Country Link
US (1) US20220025403A1 (zh)
EP (1) EP3891276A4 (zh)
JP (2) JP7428712B2 (zh)
KR (1) KR20210102309A (zh)
CN (1) CN113302292A (zh)
AU (1) AU2019392748A1 (zh)
CA (1) CA3121800A1 (zh)
IL (1) IL283705A (zh)
WO (1) WO2020118110A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110029161A (zh) * 2019-05-16 2019-07-19 中国人民解放军第四军医大学 Charge综合征致病基因chd7突变检测试剂盒

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3964585A1 (en) * 2020-09-03 2022-03-09 Miltenyi Biotec B.V. & Co. KG Cd62l specific lentiviral vector particle for targeted transduction of t cell subsets
WO2022150369A1 (en) * 2021-01-06 2022-07-14 Exicure Operating Company Compounds for the treatment of batten disease
WO2022155458A1 (en) * 2021-01-15 2022-07-21 St. Jude Children's Research Hospital, Inc. Systems and methods for base editing of hbg1/2 gene promoter and fetal hemoglobin induction
WO2023034925A1 (en) * 2021-09-01 2023-03-09 The Board Of Trustees Of The Leland Stanford Junior University Rna-guided genome recombineering at kilobase scale
WO2023164636A1 (en) * 2022-02-25 2023-08-31 Vor Biopharma Inc. Compositions and methods for homology-directed repair gene modification

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105164264A (zh) * 2012-12-12 2015-12-16 布罗德研究所有限公司 用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化
US20180155720A1 (en) * 2016-12-06 2018-06-07 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
US20180237800A1 (en) * 2015-09-21 2018-08-23 The Regents Of The University Of California Compositions and methods for target nucleic acid modification
CN108498460A (zh) * 2017-02-24 2018-09-07 国家纳米科学中心 金纳米簇-脂质体复合颗粒及其制备方法和应用
US20180334697A1 (en) * 2017-05-16 2018-11-22 Sensor Kinesis Corporation Method for isothermal dna detection using a modified crispr/cas system and the apparatus for detection by surface acoustic waves for gene editing

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6475994B2 (en) 1998-01-07 2002-11-05 Donald A. Tomalia Method and articles for transfection of genetic material
JP2005255582A (ja) 2004-03-10 2005-09-22 Japan Science & Technology Agency 光照射を用いた遺伝子または薬物導入発現方法
US7358223B2 (en) * 2004-10-04 2008-04-15 Nitto Denko Corporation Biodegradable cationic polymers
US9816074B2 (en) * 2014-07-25 2017-11-14 Sangamo Therapeutics, Inc. Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells
WO2016154623A2 (en) * 2015-03-26 2016-09-29 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Anti-cd133 monoclonal antibodies and related compositions and methods
EP3334776A4 (en) * 2015-08-13 2019-03-27 The Johns Hopkins University METHOD FOR PRODUCING POLYELECTROLYTE COMPLEX NANOPARTICLES
KR20210035022A (ko) * 2016-12-14 2021-03-31 리간달 인코포레이티드 핵산 및/또는 단백질 적재물 전달을 위한 조성물 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105164264A (zh) * 2012-12-12 2015-12-16 布罗德研究所有限公司 用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化
US20180237800A1 (en) * 2015-09-21 2018-08-23 The Regents Of The University Of California Compositions and methods for target nucleic acid modification
US20180155720A1 (en) * 2016-12-06 2018-06-07 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
CN108498460A (zh) * 2017-02-24 2018-09-07 国家纳米科学中心 金纳米簇-脂质体复合颗粒及其制备方法和应用
US20180334697A1 (en) * 2017-05-16 2018-11-22 Sensor Kinesis Corporation Method for isothermal dna detection using a modified crispr/cas system and the apparatus for detection by surface acoustic waves for gene editing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KUNWOO LEE ET AL.: "Nanoparticle delivery of Cas9 ribonucleoprotein and donor DNA in vivo induces homology-directed DNA repair", NAT BIOMED ENG, vol. 1, pages 889, XP055767411, DOI: 10.1038/s41551-017-0137-2 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110029161A (zh) * 2019-05-16 2019-07-19 中国人民解放军第四军医大学 Charge综合征致病基因chd7突变检测试剂盒

Also Published As

Publication number Publication date
JP2024045297A (ja) 2024-04-02
AU2019392748A1 (en) 2021-06-10
KR20210102309A (ko) 2021-08-19
US20220025403A1 (en) 2022-01-27
CA3121800A1 (en) 2020-06-11
EP3891276A4 (en) 2022-07-27
JP7428712B2 (ja) 2024-02-06
EP3891276A1 (en) 2021-10-13
WO2020118110A1 (en) 2020-06-11
IL283705A (en) 2021-07-29
JP2022513720A (ja) 2022-02-09

Similar Documents

Publication Publication Date Title
US11634732B2 (en) Pharmaceutical compositions comprising gene-corrected primary cells
JP7197363B2 (ja) ヌクレアーゼを使用するヒト神経幹細胞のゲノム編集
CA3036926C (en) Modified stem cell memory t cells, methods of making and methods of using same
CN113302292A (zh) 遗传修饰细胞的减少和最少的操作制造
JP2021106611A (ja) ヌクレアーゼ介在性遺伝子発現調節
US20230022146A1 (en) Compositions and methods for editing beta-globin for treatment of hemaglobinopathies
CN106795488A (zh) 用于造血干细胞中核酸酶介导的基因组工程化和校正的方法和组合物
CA3091688A1 (en) Expression of foxp3 in edited cd34+ cells
US20230279441A1 (en) Genomic safe harbors for genetic therapies in human stem cells and engineered nanoparticles to provide targeted genetic therapies
AU2018264636A1 (en) Artificially manipulated immune cell
KR20230036059A (ko) 표적 핵산을 변형시키는 조성물 및 방법
US20220228142A1 (en) Compositions and methods for editing beta-globin for treatment of hemaglobinopathies
WO2022232839A1 (en) Methods for improved production of primary cd34+ cells
WO2024003786A1 (en) Chimeric antigen receptor targeting gpc-3 and immune cells expressing such for therapeutic uses

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230303

Address after: Washington State

Applicant after: Fred Hutchinson Cancer Center

Address before: Washington State

Applicant before: FRED HUTCHINSON CANCER RESEARCH CENTER

TA01 Transfer of patent application right